207 100 1MB
Spanish Pages [172] Year 2003
MUESTREO Y TAMAÑO DE MUESTRA Una guía práctica para personal de salud que realiza investigación
Víctor M. Velasco Rodríguez Verónica A. Martínez Ordaz José Roiz Hernández Francisco Huazano García Armando Nieves Rentería
Muestreo y tamaño de muestra Una guía práctica para personal de salud que realiza investigación
ERRNVPHGLFRVRUJ
Sobre los autores MC. VÍCTOR MANUEL VELASCO RODRÍGUEZ
Coordinador de Investigación en Salud Delegación Coahuila Instituto Mexicano del Seguro Social MC. VERÓNICA ARACELI MARTÍNEZ ORDAZ
Investigador. Unidad de Investigación en Epidemiología Clínica Hospital de Especialidades Nº 71, Torreón, Coahuila Instituto Mexicano del Seguro Social MC. JOSÉ ROIZ HERNÁNDEZ
Investigador. Unidad de Investigación en Epidemiología Clínica Hospital de Especialidades Nº 71, Torreón, Coahuila Instituto Mexicano del Seguro Social MC. FRANCISCO HUAZANO GARCÍA
Especialista en Anestesiología. Hospital General de Zona Nº 16, Torreón, Coahuila Instituto Mexicano del Seguro Social MC. ARMANDO NIEVES RENTERÍA
Especialista en Dermatología. Hospital de Especialidades Nº 71, Torreón, Coahuila Instituto Mexicano del Seguro Social
Víctor Manuel Velasco R. (ed.), Verónica Araceli Martínez O., José Roiz Hernández, Francisco Huazano G., Armando Nieves R.
Muestreo y tamaño de muestra
Una guía práctica para personal de salud que realiza investigación
e-libro.net
Primera edición en papel, 2002, Torreón, Coahuila, México
Esta obra también está disponible en soporte papel, bajo la modalidad de “libro a pedido”.
© 2002, por Víctor Manuel Velasco Rodríguez (ed.) © Primera edición virtual y en papel, e-libro.net, Buenos Aires, enero de 2003. ISBN 987-9499-36-0
Todos los triunfos nacen cuando nos atrevemos a comenzar. EUGENE WARE
A todos nuestros alumnos y a la gente inquieta que labora en áreas de la salud y que desean contribuir al conocimiento científico, porque ellos son nuestra motivación diaria y la esperanza de brindar una mejor atención a nuestros enfermos
PRÓLOGO
DURANTE el tiempo en que hemos tenido la gran experiencia de participar en la enseñanza de la metodología de la investigación científica con personal de salud, nos hemos percatado de la dificultad que implica la incorporación e integración mental de los procesos matemáticos y estadísticos al quehacer de la investigación clínica, lo que motiva sentimientos de miedo y rechazo ante el uso de esta herramienta, que es necesaria para darle valor a las experiencias y observaciones médicas. Mención especial merecen los aspectos de muestreo y cálculo del tamaño de muestra, que requieren de la compresión de aspectos matemáticos con los que estamos poco familiarizados, y cuya ausencia disminuye la validez del estudio y dificulta su difusión en revistas de impacto, lo que puede bloquear nuestra innata capacidad inquisitiva y hacernos desistir de las inquietudes científicas. Es por ello que nos dimos a la tarea de elaborar un manual práctico que aborde estos temas y permita a los estudiantes y trabajadores de la salud, solventar estos puntos críticos en la elaboración y desarrollo de un proyecto de investigación sin tener que profundizar en procesos estadísticos complicados. Este documento no se realizó con el anhelo de que fuera una revisión exhaustiva y seguramente no será suficiente para el que
desee profundizar en el tema, solamente se pretende presentar una guía práctica y accesible, que permita a los estudiantes y médicos que realizan investigación, conocer los principios básicos para obtener una muestra que sea representantiva de la población estudiada, y adquirir los conocimientos y habilidades necesarios para calcular el tamaño que se requiere para que la muestra sea adecuada, de acuerdo con el diseño del estudio que se proponga. Estamos conscientes de que no se abarcan todos los procesos inferenciales que se requieren para llegar a las fórmulas y que incluso, en el afán de simplificar la explicación y manejo de las mismas puede subestimarse en algunas ocasiones el cálculo del tamaño de muestra, sin embargo, esperamos que las aproximaciones aquí presentadas contribuyan a hacer un poco más amigable y aplicativa esta labor.
9
ÍNDICE
KWWSERRNVPHGLFRVRUJ Prólogo ..............................................................................
8
1. MUESTREO ...................................................................... 1.1. Terminología y conceptos ........................................ 1.2. Aspectos generales del muestreo ............................ 1.3. Tipos de muestreo .................................................... 1.3.1. Muestreo no probabilístico ............................. 1.3.2. Muestreo probabilístico .................................. 1.4. Sesgo en el muestreo ...............................................
14 15 16 17 18 19 22
2. TAMAÑO DE MUESTRA ....................................................... 2.1. Algunos conceptos teóricos ..................................... 2.1.1. Relación con teoría de probabilidades y conceptos de hipótesis alterna y nula .......... 2.1.2. Error tipo I y error tipo II ............................... 2.2. Requerimientos para el cálculo del tamaño de muestra ............................................................... 2.2.1. Tipo de estudio ............................................... 2.2.2. Relación de los grupos a comparar ................ 2.2.3. El sentido de la hipótesis que se desea poner a prueba .........................................................
25 27 27 27 30 30 30 31
2.2.4. Características y número de variables que se desea medir ......................................... 2.2.5. La magnitud de la diferencia que se considere de importancia o significativa (∆) ................... 2.2.6. La variabilidad de la población de la cual se extraerá la muestra .................................... 2.2.7. La confiabilidad que se espera del estudio ..... 2.2.8. Estadística empleada para probar la validez de la hipótesis ................................................. 2.3. Tamaño de muestra y significación ......................... 3. CÁLCULO DEL TAMAÑO DE MUESTRA ................................. 3.1. Estudios descriptivos ................................................ 3.1.1. Estudios cuyo objetivo es la estimación de una proporción ........................................... 3.1.2. Estudios cuyo objetivo es la estimación de una media .................................................. 3.2. Estudios comparativos ............................................. 3.2.1. Estudios cuyo objetivo es comparar dos proporciones ............................................ 3.2.2. Estudios cuyo objetivo es comparar dos medias ...................................................... 3.3. Estudios de equivalencia .......................................... 3.3.1. Estudios de equivalencia de proporciones ...... 3.3.2. Estudios de equivalencia de medias ............... 3.4. Estudios donde se busca correlación ....................... 3.4.1. Correlación simple en un grupo ...................... 3.4.2. Comparación de dos correlaciones ................ 3.5. Estudios de casos y controles .................................. 3.5.1. Estudios de casos y controles no pareado ...... 3.5.2. Estudios de casos y controles pareado ........... 3.5.3. Estudios de casos y controles analizados mediante regresión logística ........................... 11
31 32 32 33 34 35 38 39 39 44 46 46 49 51 52 54 56 57 58 59 60 62 65
3.6. Ensayos clínicos ....................................................... 3.6.1. Ensayo clínico individual y no pareado ........... 3.6.2. Ensayo clínico fase II ..................................... 3.6.3. Ensayos clínicos con variable de salida ordinal ............................................................. 3.6.4. Ensayo clínico en grupos relacionados ........... 3.6.5. Ensayos clínicos en grupos ............................. 3.7. Estudios de cohorte ................................................. 3.7.1. Estudio para búsqueda de reacciones adversas con antecedente conocido ............... 3.7.2. Estudio para búsqueda de reacciones adversas sin antecedente conocido ................ 3.7.3. Estudios para el análisis de sobrevida en un grupo ..................................................... 3.7.4. Estudios para comparar dos curvas de sobrevida ................................................... 3.8. Estudios para pruebas diagnósticas ......................... 3.8.1. Estudio de una prueba diagnóstica ................. 3.8.2. Estudios para comparar dos pruebas diagnósticas .................................................... 3.9. Estudios de concordancia ........................................
68 68 69
4. EJERCICIOS ...................................................................... Estudios descriptivos para determinar una proporción ........ Estudios descriptivos para determinar una media ............... Estudios comparativos de dos proporciones ....................... Estudios comparativos de dos medias ................................. Estudios de equivalencia de proporciones ........................... Estudios de equivalencia de medias .................................... Estudios que buscan correlación de variables ..................... Estudios de casos y controles ............................................. Ensayos clínicos ..................................................................
87 87 89 91 92 93 94 95 95 97
12
70 72 73 74 74 76 78 79 82 82 84 85
Estudios de cohorte. Determinación de reacciones adversas ......................................................................... Estudios de cohorte. Análisis de sobrevida ......................... Estudios de prueba diagnóstica ........................................... Estudios de concordancia ...................................................
99 100 101 102
APÉNDICE A. TABLAS ........................................................... 104 APÉNDICE B. RESPUESTA A LOS EJERCICIOS .......................... 129 APÉNDICE C. CUADROS Y FÓRMULAS .................................... 155 APÉNDICE D. GLOSARIO ....................................................... 162
Referencias bibliográficas ............................................... 169
13
1. MUESTREO
SE DESARROLLARÁN primero algunos conceptos teóricos, se presentan los diferentes tipos de muestreo, sus características y algunos problemas relacionados con el mismo que pueden producir sesgo. Posteriormente se presentan conceptos acerca del tamaño de la muestra, los principios y elementos que se necesitan para el cálculo de la misma, las fórmulas empleadas para los diferentes diseños, acompañado de algunos ejemplos y luego algunas tablas para consulta directa de la muestra requerida. Uno de los propósitos importantes para desarrollar cualquier investigación, es poder generalizar los resultados de una muestra a una población más grande. Este proceso de inferencia se efectúa basado en cálculos matemáticos que tienen como fundamento la ley de las probabilidades, sin embargo, su aplicación práctica en la selección de la muestra tiene que ver más con aspectos de lógica, de criterio y de factibilidad.
1.1. TERMINOLOGÍA
Y CONCEPTOS
Para hablar de muestreo, es necesario definir algunos términos: Población. Es todo conjunto de objetos, situaciones o sujetos con un rasgo común. Es un conjunto global de casos que satisface una serie predeterminada de criterios. No siempre se refiere a humanos ya que pudiera referirse al total de expedientes clínicos archivados en un determinado hospital. Sea cual fuere la unidad fundamental, la población siempre abarca el total de elementos que interesan al investigador y se debe partir de los criterios específicos que se desean incluir. Puede diferenciarse en dos niveles: La población blanco o diana que es el gran conjunto de unidades en todo el mundo a los que se generalizarán los resultados del estudio, y están definidas por las condiciones clínicas y demográficas; y la población accesible que es el subconjunto de la población diana que se encuentra disponible para el estudio y está determinada por las características geográficas y temporales. Es el sitio donde supuestamente se podrá localizar a todas las unidades que integrarán la muestra y también se conoce como marco muestral. Elementos o unidades muestrales. Es la unidad básica alrededor de la cual se recaba la información. Es el elemento que da origen al valor de las variables (un expediente, una radiografía, un paciente, un animal de laboratorio, etc.). Muestra. Es el subconjunto de la población integrado por las unidades muestrales seleccionadas, la cual también tiene dos niveles, aquella que se plantea obtener en el proyecto, y aquella que realmente fue estudiada (figura 1). Muestreo es la selección de un número de unidades de estudio a partir de una población definida. Es una parte importante del diseño y metodología de una investigación, ya que se encuentra fuertemente relacionado con el grado de generalización que se pueda efectuar de los resultados obtenidos de un estudio específico. 15
Verdad en el Universo Pregunta a investigar Población diana
Población accesible
Fenómenos de interés
Verdad en el Estudio
Hallazgos en el Estudio
Plan de estudio
Estudio Real
Muestra que se pretende obtener
Individuos estudiados en la realidad
Variables que se pretenden medir
Mediciones reales
Figura 1. Relaciones de la población y la muestra con el fenómeno a estudiar.
1.2. ASPECTOS GENERALES DEL MUESTREO Al efectuar una investigación existen varias razones para muestrear: a) Rapidez. b) Costo. c) Factibilidad. d) Exactitud. En cuanto a las tres primeras razones, es obvio que existe mayor rapidez y menor costo en estudiar cien personas que mil o más y es más posible hacerlo por situaciones de recursos humanos, físicos y apoyos logísticos. En cuanto a exactitud, se refiere al hecho de que a menor volumen de trabajo, es posible emplear personal mejor capacitado que garantice una medición del fenómeno de interés con mayor precisión y poder supervisar mejor para producir resultados más exactos. Para efectuar un muestreo tenemos que responder a tres preguntas: 1. ¿Cuál es la población en estudio? 2. ¿Cuántas personas se requieren en la muestra? 3. ¿Cómo seleccionar la muestra? Para responder a la primera pregunta, la población en estudio debemos definirla de acuerdo con el problema que se quiere investigar. Recordar que la población está conformada por 16
unidades de estudio que pueden ser personas, comunidades, instituciones, expedientes, muestras de laboratorio, especimenes de biopsia, etc. Una muestra debe ser: • Representativa: Que implica tener todas las características importantes de la población de la que se tomó, en proporciones similares. Esto es para que el investigador pueda hacer inferencias válidas respecto a toda la población de donde obtuvo su muestra, es decir, que pueda cubrir uno de los requisitos para transpolar los resultados de su muestra hacia la población de donde la obtuvo. • Adecuada: Se refiere a su tamaño y viene a responder a la segunda pregunta. Se calcula con diversas fórmulas establecidas de acuerdo a si el estudio busca una proporción existente en una población (por ejemplo un estudio de prevalencia), diferencias entre las medias o las proporciones de dos poblaciones, correlación entre dos o más factores, factores de riesgo (estudios de riesgos relativos o razones de momios), pruebas diagnósticas (estudios de sensibilidad, especificidad y valores predictivos), etc. Los capítulos 2 y 3 abordan este tema. Para responder la tercera pregunta, hay que conocer los diferentes métodos de muestreo, que es el objetivo de este primer capítulo.
1.3. TIPOS DE MUESTREO A) No Probabilístico: si la muestra es escogida por medio de un proceso subjetivo o arbitrario de modo que la probabilidad de selección de cada unidad de la población no es conocida (se utiliza con frecuencia cuando no se conoce el marco muestral). B) Probabilístico: cuando el método de selección de la muestra permite que todos los elementos de la población tengan la misma probabilidad de ser seleccionados en la muestra. Utiliza 17
procedimientos de selección aleatoria para asegurar que cada unidad de la muestra se seleccione por probabilidad (es factible si se conoce el marco muestral, es decir, se cuenta con un listado completo de todas las unidades que componen la población). El siguiente esquema nos presenta en forma global los tipos de muestreo:
NO PROBABILÍSTICO
Por conveniencia (a criterio) Por casos consecutivos Por cuota
PROBABILÍSTICO
Aleatorio simple Sistemático Estratificado Por conglomerados Multietápico
1.3.1. Muestreo no probabilístico Es aquel muestreo en el que la probabilidad de selección de cada unidad muestral no es igual ni conocida. 1.3.1.1. Por conveniencia. Se seleccionan a las unidades de estudio que se encuentren disponibles al momento de la recolección de datos. Su ventaja es que es más fácil, económico y accesible y puede dar una visión inicial buena. Se usa en estudios exploratorios. Su desventaja es que puede ser poco representativo, algunas unidades estarán subrepresentadas y otras sobrerrepresentadas. Una variación de éste es el llamado muestreo a criterio, donde además de encontrarse disponibles, se elige a los que se suponen más apropiados para participar en el estudio 1.3.1.2. Por casos consecutivos. Consiste en elegir a cada paciente que cumpla con los criterios de selección dentro de un intervalo de tiempo específico o hasta alcanzar un número definido de pacientes. Es el mejor y el más fácil de los muestreos no 18
probabilísticos ya que su limitante solamente es la duración del estudio. Su problema es precisamente cuando la duración es demasiado corta para representar adecuadamente todos los factores estacionales o cambios que puedan producirse con el tiempo y que sean importantes para la pregunta que se investiga (por ejemplo, prevalencia de infecciones respiratorias en un estudio que abarque dos meses e inicie en abril). 1.3.1.3. Por cuotas. Se seleccionan unidades de estudio de cada uno de los subgrupos que componen la población en una cuota predeterminada, por ejemplo, si hablamos de edades, seleccionar un porcentaje de cada uno de los grupos de edad. Asegura que un determinado número de unidades de muestreo de diferentes categorías aparezcan en la muestra de modo que todos queden representados. Es útil para balancear las unidades de estudio pero no se obtiene la representatividad de la población. 1.3.2. Muestreo probabilístico Es aquel donde el método de selección de la muestra permite que todos los elementos de la población tengan la misma probabilidad de ser seleccionados en la muestra. 1.3.2.1. Aleatorio simple. Cada individuo tiene la misma probabilidad de ser seleccionado para el estudio. Requiere tener una lista numerada de todas las unidades del marco muestral, decidir el tamaño de la muestra, seleccionar la muestra al azar mediante tablas de números aleatorios, calculadora o computadora. Generalmente la selección se hace “sin remplazo” esto es, que el individuo seleccionado no vuelve a ser tomado en cuenta para el sorteo. 1.3.2.2. Sistemático. Todos los individuos se seleccionan a intervalos regulares, cada K elemento (el tercero, quinto, décimo). Se selecciona dividiendo el total de población entre el número de elementos deseados lo que nos dará el intervalo de cada cuán19
tos se eligen (por ejemplo, en una población de 300 elementos y un tamaño de muestra requerido de 60, 300/60 = 5, se escogerá cada quinto elemento). Puede tomarse el elemento inicial de cada grupo o el medio, aunque esto se comporta erráticamente, por lo que es preferible tomar el primer elemento de manera aleatoria y los demás de acuerdo con la sistematización que se haya determinado (por ejemplo, si el primer elemento elegido aleatoriamente fue el Nº 4, el siguiente será 4 + 5 = 9, el que le sigue será el 14, etc.). No debe utilizarse cuando existe repetición cíclica inherente al marco de muestreo (por ejemplo los días de la semana). Ventajas sobre el aleatorio simple: Es más fácil sacar una muestra sin errores y ahorra tiempo. Desventajas sobre el aleatorio simple: El riesgo de sesgo es mayor. 1.3.2.3. Estratificado. Se divide primero a la población en estratos pertinentes (subgrupos) y luego de cada estrato se selecciona la muestra aleatoria, es decir, las extracciones de la muestra deben hacerse independientemente en los diferentes estratos (es una muestra aleatoria simple en cada estrato). Es posible sólo cuando se conoce la proporción de la población en estudio que pertenece a cada grupo de interés. Las subpoblaciones no deben traspolarse (deben ser mutuamente excluyentes) y en su conjunto corresponden a toda la población (n1 + n2 + n3 + ni = N). El muestreo estratificado se utiliza en algunas situaciones como: a) Cuando se requiere tener una precisión conocida en algunas subdivisiones de la población; b) Por conveniencia administrativa; c) Por dificultades específicas en algunas partes de la población, y d) Para favorecer el análisis de grupos más homogéneos dentro de la heterogeneidad de la población. En el muestreo estratificado puede mejorarse la precisión de la medición sobre el aleatorio simple si se cumplen tres requisitos que son: a) La población consta de subconjuntos que varían mucho en tamaño; b) Las principales variables a medir están ínti20
mamente relacionadas con los tamaños de las instituciones, y c) Si se cuenta con una buena medida del tamaño para establecer los estratos. El problema que se presenta es que la mejor asignación para una característica no necesariamente es la mejor para otra, por lo que se sugiere reducir las características consideradas en la asignación a un número relativamente pequeño (es decir, estratificar de acuerdo con el menor número de variables en estudio posible), y calcular la asignación óptima para cada característica por separado y verificar hasta que punto existe desacuerdo. La diferencia del muestreo aleatorio estratificado con el sistemático es que el sistemático estratifica la población en n estratos que consisten en las primeras k unidades, las segundas k unidades, etc. y las unidades ocurren en la misma posición relativa del estrato, mientras que en el aleatorio estratificado, la posición dentro del estrato se determina separadamente por aleatorización dentro de cada estrato. 1.3.2.4. Por conglomerados. Es la selección de grupos de unidades de estudio, en lugar de unidades de estudio individuales (generalmente son unidades geográficas u organizacionales). Su principal ventaja es que no se necesita el marco muestral de las unidades de estudio individuales. Su desventaja es que si no se incluyen en el estudio a todos los individuos de cada conglomerado se puede generar sesgo. Es un método menos preciso y requiere muestras de mayor tamaño. Su principal uso es en estudios epidemiológicos. 1.3.2.5. Multietápico. Se efectúa en pasos o fases (etapas) y habitualmente involucra más de un método de muestreo. Sus principales ventajas son que no se requiere un listado de las unidades de estudio, inicialmente el listado de los conglomerados es suficiente y luego sólo se requiere la lista de los conglomerados seleccionados y de la muestra de las unidades. Además, la muestra es más fácil de seleccionar ya que las unidades están 21
físicamente unidas en grupos en vez de diseminadas en toda la población de estudio. Su desventaja es que hay más probabilidad que la muestra final no sea representativa de la población y depende del número de conglomerados seleccionados en la primera etapa; a más conglomerados seleccionados existe mayor representatividad. Los métodos probabilísticos de muestreo son los que mejor se acercan a lograr la representatividad de la muestra, sin embargo no la garantizan en forma absoluta, ya que siempre estará presente la probabilidad de que el azar determine diferencias entre la muestra y la población, lo cual se puede medir mediante métodos estadísticos. Además, el no trabajar con toda la población, puede dar lugar a que los resultados de la muestra no necesariamente correspondan a los de la población. Lo anterior se debe a errores metodológicos por mala aplicación de la técnica de muestreo, lo cual recibe el nombre de sesgo en el muestreo, que es un error sistemático en los procedimientos de muestreo que lleva a la distorsión de los resultados del estudio.
1.4. SESGO EN EL MUESTREO Es importante reconocer la posibilidad de tener sesgos de muestreo en nuestros estudios ya que ello merma su validez externa (capacidad de transpolar resultados a la población). Las principales fuentes de sesgo en el muestreo son: a) No respuesta, que es la no participación de personas que originalmente se encontraban incluidas en el estudio, por no haberse presentado, por negarse a responder o participar, o por cualquier otra causa. La razón por la cual produce sesgo es porque rompe o anula el beneficio que la selección aleatoria había logrado. Es la causa de sesgo más frecuente y para evitarlo se sugiere: 22
• Probar y reestructurar los instrumentos de captación de datos para asegurar la cooperación de las personas incluidas. • Si no se encuentra a los sujetos seleccionados en la primera visita, buscarlos. • Si a pesar de encontrarlos, no quieren ser entrevistados, averiguar si existen diferencias con los que si participan y en que son diferentes. • Planear las pérdidas, para considerar un número extra de entrevistas. Es importante mencionar la tasa de no respuesta en cada estudio y discutir honestamente como puede esto influir en los resultados. b) Estudio solamente de voluntarios. El estudiar voluntarios no garantiza la representatividad ni es un muestreo aleatorio, ya que existen diferencias en las características de este grupo en relación con el resto de la población, que los llevan a participar como voluntarios (puede haber más enfermos, o grupos de edad más representados, o diferencias de género, etc.). c) Muestreo sólo de los registrados. El utilizar solamente los que se encuentran en un registro puede sesgar la muestra, a menos que el registro sea completo y universal, sin embargo, esto pocas veces ocurre. Por ejemplo, tomar como punto de partida para el muestreo solamente los que vengan en el directorio telefónico, produciría sesgo ya que no toda la población tiene teléfono y los que no lo tienen, pueden compartir características comunes (como estado social y económico o área geográfica de vivienda) que no se encontrarán representadas en la muestra. d) Pérdida de casos de corta duración. Por la misma razón que la no respuesta. e) Sesgo estacional. Esto es válido cuando el fenómeno que se está estudiando tiene un patrón estacional. Por ejemplo, si se muestrea en Verano solamente en busca de infecciones respiratorias, no encontraremos los mismos datos que si se muestrea en
23
invierno, o bien en poblaciones donde existe migración de habitantes de manera estacional (por ejemplo para pizcas, trabajos específicos, etc.); si el muestreo se realiza en esas épocas, esa parte de la población no estará representada en la muestra. f) Accesibilidad de áreas seleccionadas. Si el muestreo se hace solamente de las áreas accesibles porque existen los medios de comunicación adecuados, el grupo de población que vive en áreas no accesibles no estará representado en la muestra.
24
2. TAMAÑO DE MUESTRA
UNA VEZ determinada la forma en que seleccionaremos nuestra muestra, es necesario conocer cuántos elementos requerimos estudiar en ella. Este conocimiento es importante, ya que si la muestra es muy pequeña, se corre el riesgo de no detectar resultados válidos y dar por negativo un resultado por estimación inadecuada de su tamaño, como lo demostró Freiman en 1978, y si es demasiado grande, puede exponer a los sujetos de estudio a un riesgo innecesario y a desperdicio de recursos. Si bien es cierto que de acuerdo con principios matemáticos conocidos como teorema del límite central, la muestra tenderá a semejarse más a la población mientras mayor sea su tamaño, la creencia de que mientras mayor sea la muestra mejor será el estudio no es necesariamente cierta, además de que no siempre es posible. Al calcular un tamaño de muestra, debe lograrse un equilibrio entre lo deseable y lo factible, dependiendo de la disponibilidad de tiempo, personal, accesibilidad, presupuesto, etc. ¿Cuántos elementos debe contener mi muestra?, es una pregunta a la que con frecuencia buscamos responder de manera simplista, así, hay personas que dicen que con estudiar al 10% de la población es suficiente, pero el tamaño de la muestra no puede reflejarse en función de un porcentaje de la población, como
se aprecia en la siguiente tabla calculada en base a estudios de prevalencia en poblaciones de diversos tamaños. Cuadro 1. Porciento de la población estudiada con base en el tamaño de la misma Tamaño de la población
Tamaño de la muestra
Porcentaje
50
48
96.0
100
94
94.0
200
177
88.5
500
377
75.4
1000
606
60.6
3000
1016
33.8
5000
1175
23.5
10,000
1332
13.3
30,000
1462
4.87
50,000
1491
2.98
100,000
1513
1.50
500,000
1532
0.31
1.000,000
1534
0.15
En la tabla se observa que a menor tamaño de la población, el tamaño de muestra es pequeño, pero constituye un porcentaje alto de la población, mientras que a mayor tamaño de la población, el tamaño de la muestra es mayor, pero el porcentaje de la misma necesario para que la muestra sea adecuada, es menor. El cálculo se realizó en programa Epi Info 2000, considerando una frecuencia esperada del fenómeno en estudio entre 18% y 20% con una confianza del 95% para la estimación (cuadro 1).
26
2.1. ALGUNOS
CONCEPTOS TEÓRICOS
Antes de pasar a los aspectos prácticos del cálculo del tamaño de muestra, consideramos conveniente recordar algunos conceptos teóricos entre los que se encuentran: la relación de la muestra con la teoría de probabilidades, los conceptos de hipótesis alterna y nula, error tipo I y error tipo II, significación, confianza y poder de un estudio. 2.1.1. Relación con teoría de probabilidades y conceptos de hipótesis alterna y nula El cálculo del tamaño de la muestra se encuentra sustentado en la Teoría de la probabilidad y en las pruebas de hipótesis, de manera que la estimación de la realidad a partir de la medición de una muestra se encuentra sujeta a cierta imprecisión. De acuerdo con la teoría de la probabilidad, es prácticamente imposible asegurar que un hallazgo es verdadero con un 100% de probabilidad, por lo que se acepta de antemano que la hipótesis de trabajo (Ha o hipótesis alterna) no se puede probar. Para solucionar esto, se plantea una hipótesis contraria (Ho o hipótesis nula) y el investigador orienta sus esfuerzos para probar que esta es falsa, y si lo logra, es decir la rechaza, entonces implícitamente acepta la hipótesis alterna. A este juicio se le asigna un nivel de probabilidad, que en forma convencional se ha aceptado como significativo a niveles mayores de 95%. 2.1.2. Error tipo I y error tipo II Dependiendo del tipo de estudio que realicemos, la hipótesis nula puede afirmar que no existe asociación entre las variables predictoras y de desenlace, o que no existen diferencias entre la muestra de estudio y la población, o que no existen diferencias 27
entre las muestras de estudio, o que no existe correlación. Al efectuar la prueba de hipótesis, es decir, someter nuestra hipótesis nula a prueba para verificar si es posible rechazarla o no, tenemos cuatro posibles resultados: a) El primero es que rechacemos la hipótesis nula cuando no debimos rechazarla, es decir, que afirmemos que sí existe asociación o diferencias cuando en realidad no existen, y esto se conoce como error tipo I, que no es otra cosa que la probabilidad de que la asociación o diferencia entre los grupos no sea verdadera, sino debida al azar. b) Segundo, que no rechacemos la hipótesis nula cuando debimos rechazarla, es decir, que en el estudio no se encuentre asociación o diferencia, cuando en realidad si la hay y esto se conoce como error tipo II. c) Tercero, no rechazar la hipótesis nula porque verdaderamente no se puede rechazar, es decir, verdaderamente no existe diferencia o asociación. d) Por último, lo que más desea el investigador, que es rechazar la hipótesis nula cuando realmente debemos rechazarla, es decir, comprobar que nuestra hipótesis de trabajo es cierta cuando realmente lo es (cuadro 2). Cuadro 2. Esquema de los cuatro posibles resultados de una prueba de hipótesis La Hipótesis nula realmente es Mi estudio dice que la hipótesis nula es: (o bien, qué decisión tomo sobre la hipótesis nula)
Falsa
Verdadera
Falsa (Rechazo Ho)
Correcto
Error Tipo I
Verdadera (No rechazo Ho)
Error Tipo II
Correcto
Cuando probamos una hipótesis, la confiabilidad del estudio depende de la probabilidad que tenga de afirmar que no se pue28
de rechazar la hipótesis nula porque verdaderamente no se puede rechazar (es decir, que la hipótesis nula es verdadera) y a esto lo denominamos confianza, y la probabilidad de afirmar que rechazamos la hipótesis nula cuando realmente debimos rechazarla (es decir, afirmar que existe asociación o diferencia cuando realmente la hay) y a esto lo denominamos poder del estudio. La probabilidad de cometer un error tipo I (la probabilidad de señalar que si existe una diferencia cuando en realidad no la hay, o de rechazar Ho cuando no debimos rechazarla) es igual a la significación del estudio y generalmente se simboliza con la letra griega α y se aceptan como significativos valores de 5% o menores. Su contraparte es la confianza del estudio (1-α) y se aceptan valores de 95% o mayores. La probabilidad de cometer error tipo II (la probabilidad de afirmar que no hay diferencia, cuando en realidad si la hay o de no rechazar la hipótesis nula cuando debimos rechazarla) se simboliza por la letra griega β y generalmente se aceptan valores del 20% o menores. El poder o potencia del estudio, que es la probabilidad de que los resultados de mi estudio representen la realidad, o dicho de otra manera, la capacidad del estudio de detectar verdaderas asociaciones o diferencias entre grupos, como se mencionó, corresponde a 1-β y se aceptan valores de 80% o mayores. Lo anterior se ejemplifica en el cuadro 3. Cuadro 3. Relación de α, β, Poder y confianza, con la prueba de hipótesis La Hipótesis nula realmente es Mi estudio dice que la hipótesis nula es: (o bien, la decisión que se tomó sobre la hipótesis nula es)
Falsa
Verdadera
Falsa (Rechazo Ho)
Correcto Poder (1-β)
Error Tipo I (α = 0.05)
Verdadera (No rechazo Ho)
Error Tipo II (β = 0.20)
Correcto Confianza(1-α)
29
2.2. REQUERIMIENTOS PARA EL CÁLCULO DEL TAMAÑO DE MUESTRA
Para calcular el tamaño de la muestra se requiere conocer previamente algunas situaciones que se enlistan a continuación: a) El tipo de estudio. b) La relación entre los grupos a comparar. c) El sentido de la hipótesis que se desea poner a prueba. d) Número y características de la variable que se desean medir. e) La magnitud de la diferencia que se considere de importancia o significativa (∆). f) La variabilidad de la población de la cual se extraerá la muestra. g) La confiabilidad que se espera del estudio. h) Estadística empleada para probar la validez de la hipótesis. 2.2.1. Tipo de estudio En forma general podemos decir que se requiere calcular tamaño de muestra en aquellos estudios que quieran conocer la frecuencia de un fenómeno (prevalencia), probar hipótesis de causalidad, los que busquen relación entre un factor de riesgo y una enfermedad, que busquen correlación entre variables, o que busquen precisar que un tratamiento sea mejor que otro. Las series de casos por lo general no requieren del cálculo de tamaño de muestra ya que son reportes descriptivos que solamente presentan resultados en un número de casos existentes. 2.2.2. Relación de los grupos a comparar Esto se refiere a si los grupos son independientes, es decir, diferentes entre sí; o son relacionados, es decir, son grupos que 30
se parearon por alguna característica específica, o son comparaciones de antes y después en un grupo. En los grupos independientes, la variabilidad obviamente es mayor, por lo que el tamaño de muestra se incrementará. En grupos relacionados, principalmente en mediciones de antes y después, la variabilidad dentro del grupo es menor, ya que son los mismos sujetos, por lo que generalmente el tamaño de la muestra disminuye. 2.2.3. El sentido de la hipótesis que se desea poner a prueba La hipótesis de trabajo debe tener una dirección (una o dos colas). Se habla de una hipótesis de una cola cuando nos interesa evaluar el efecto de la intervención en un sentido, por ejemplo la mejoría de un evento; dicho de otra manera, estamos convencidos que una intervención es mejor que otra. Se habla de una hipótesis de dos colas cuando desconocemos o no estamos seguros de la dirección del efecto, entonces no hablamos de un mejor o peor efecto, sino solamente diferente. El tamaño de la muestra para probar hipótesis de una sola cola es menor que para probar hipótesis de dos colas. 2.2.4. Características y número de variables que se desea medir En necesario tener en claro si la variable se medirá en forma numérica (medias, varianzas, etc.) o en forma de proporciones (tasas) y si se desea medir una sola variable, estimar una media o una proporción con cierta precisión, por ejemplo en estudios de prevalencia, para lo cual se requiere especificar la frecuencia esperada del fenómeno en estudio y la precisión o margen de error (intervalos de confianza) que se espera de dicha estimación; o si se busca comparar dos medias o dos proporciones, para lo cual 31
hay que especificar el tamaño de la diferencia que se espera entre ambas. 2.2.5. La magnitud de la diferencia que se considere de importancia o significativa (∆ ) Ya sea desde el punto de vista clínico o de salud pública, la magnitud de la diferencia que se considere de importancia o significativa la debe fijar el investigador, basado en el conocimiento que tenga del evento que estudia, o bien, de lo que se acepte como importante entre los expertos del tema o los especialistas del área. Corresponde a la diferencia que estamos dispuestos a aceptar entre el valor real y el que obtengamos en el estudio. Algunas preguntas que pueden orientar para determinarla pueden ser: ¿qué diferencia en el resultado será importante para los clínicos, en el tratamiento de este tipo de pacientes? o bien, ¿qué diferencia sería significativa para un paciente quien pudiera sufrir las consecuencias de una enfermedad? o ¿qué diferencia en el resultado justificaría el uso de un tratamiento más efectivo a pesar de ser de mayor costo o con mayores efectos indeseables? 2.2.6. La variabilidad de la población de la cual se extraerá la muestra Mientras más homogénea sea la constitución de la población de la cual se extraerá la muestra, menor tamaño de la misma se requiere, y a la inversa, en una población más heterogénea (con mayor variabilidad del fenómeno en estudio) se requerirá mayor tamaño de muestra. La medida de variabilidad que se utiliza para calcular el tamaño de muestra es la desviación estándar (σ) que puede tomarse de la reportada en estudios previos, o calcularse a partir de una muestra actual. 32
2.2.7. La confiabilidad que se espera del estudio Este aspecto se refiere fundamentalmente a dos medidas: • Qué tanta seguridad quiero tener de que si se repite mi estudio, los resultados que obtengan sean similares en un nivel de probabilidad aceptado (generalmente 95%, aunque esto dependerá de que tan estricto requiero ser con dicha probabilidad). Este valor está dado por Zα. • Qué poder estoy dispuesto a aceptar en mi estudio, es decir, que tanta seguridad quiero tener de que los resultados de mi estudio representen la realidad. Generalmente se ubica en 80% (a veces se requiere 90%) y está dado por Z1-β. El valor Z no es otra cosa que la transformación de un valor cualquiera, independientemente de sus unidades de medida, en un valor cuya unidad de medida es la cantidad de desviaciones estándar que dicho valor se aleja de la media de la muestra estudiada. Así, el valor Zα corresponde a la distancia de su media que tendrá el valor de probabilidad asignado a la confianza, por ejemplo un alfa de 0.05, de acuerdo con las tablas de Z de la distribución normal, se encuentra a 1.96 desviaciones estándar del valor de la media en dicha distribución, en hipótesis de dos colas y a 1.64 desviaciones estándar en hipótesis de una cola. De la misma manera, el valor Z1-β corresponde a la distancia de la media, del valor asignado al poder del estudio, así, un valor beta de 0.2 (poder 80%), se encuentra a 0.84 desviaciones estándar de su media. El cuadro 4 de la página siguiente presenta lo valores Zα y Z1-β más frecuentemente utilizados.
33
Cuadro 4. Valores Z α y Z β más frecuentemente utilizados Poder (1-β β) % 99.0 97.5 95.0 90.0 85.0 80.0 75.0 70.0 60.0
Nivel de significancia (α α) Valor Z 2.33 1.96 1.64 1.28 1.04 0.84 0.67 0.52 0.25
Una cola
Dos colas
0.01 0.025 0.05 0.1 0.15 0.2 0.25 0.3 0.4
0.02 0.05 0.1 0.2 0.3 0.4 0.5 0.6 0.8
2.2.8. Estadística empleada para probar la validez de la hipótesis El tipo de estadístico con el cual se probará la hipótesis (estadístico Z, t de Student, X2, r de Pearson, etc.) depende principalmente del tipo de estudio y del tipo de hipótesis a probar. La forma como influyen algunas de las características mencionadas sobre el tamaño de muestra se observa en el cuadro 5. Cuadro 5. Factores que influyen en el tamaño de la muestra Efecto sobre el tamaño de la muestra
Factor ↓ del error tipo I que aceptamos ↓ del error tipo II que aceptamos
↑
↓ variabilidad de las mediciones de los resultados ↓ magnitud de las diferencias esperadas entre los resultados entre los grupos ↑ número de grupos en estudio
↓
↑ número de variables en estudio Dirección de la Hipótesis, Una cola
↑
34
↑
↑ ↑ ↓
2.3. TAMAÑO DE MUESTRA Y SIGNIFICACIÓN El tamaño de la muestra estudiada juega un papel importante en la posibilidad de encontrar una diferencia estadísticamente significativa entre grupos. En una muestra pequeña se puede no encontrar diferencias significativas por estadística, aunque esta diferencia verdaderamente exista (incrementa probabilidad de error tipo II). El cuadro 6 nos muestra diferencia entre dos tratamientos de un 15% que pudiera considerarse importante, pero que no es estadísticamente significativa. Cuadro 6. Diferencia grande entre dos tratamientos en una muestra pequeña Éxito Fracaso Total
Tratamiento A 30 7 37
% 81
Tratamiento B 30 15 45
% 66
p = 0.14.
Por otra parte, en una muestra de gran tamaño, pudiera encontrarse diferencia estadísticamente significativa aún con diferencias numéricas mínimas como se observa en el cuadro 7, en donde la diferencia en los efectos entre ambos tratamientos de 1.4%, tiene significación estadística menor de 0.05. Cuadro 7. Diferencia pequeña entre dos tratamientos en una muestra grande Éxito Fracaso Total
Tratamiento A 6000 1400 7400
% 81
P < 0.05.
35
Tratamiento B 8000 2050 10050
% 79.6
Con los dos ejemplos anteriores, se aprecia claramente la influencia del tamaño de la muestra sobre el nivel de significación estadística, sin embargo, existe otro concepto que no hay que olvidar y es el de la significación clínica de un evento. Existen diferencias entre tratamientos, así como asociaciones o correlaciones que pueden tener significación estadística y no tener ninguna importancia en la clínica, y también existen situaciones en la que no se podrá demostrar significación estadística, pero que tengan importancia para una decisión clínica. La importancia de un hallazgo es una situación de criterio, y debe fundamentarse en aspectos como la plausibilidad de una asociación encontrada, la simplicidad de un método que facilite un diagnóstico, el costo de un tratamiento o de un método diagnóstico que lo haga accesible a grupos grandes de población, el impacto que una medida de salud pueda tener sobre la sociedad, la trascendencia de un buen control o de la curación en un paciente con una enfermedad de impacto social, laboral o personal elevado, etc. Por lo anterior, hay que darle su justo lugar al procedimiento del cálculo de tamaño de muestra, como una herramienta más que nos facilite dicho juicio crítico y no que lo interfiera o lo que es peor, lo impida. A manera de conclusión afirmamos tres comentarios: a) El cálculo del tamaño de la muestra es una aproximación a lo deseable y se tendrá que ajustar a la factibilidad (tiempo, costo, etc.). Es preferible realizar un estudio aún con el conocimiento de las limitaciones que pueden existir para determinar la presencia de una diferencia o una asociación, que no realizarlo por no poder cumplir con el tamaño muestra requerido. Además, en algunos casos que requieren de tamaños de muestra muy grandes, siempre se podrán recurrir a estrategias como son: incrementar el número de controles por caso, efectuar estudios multicéntricos, efectuar un estudio piloto con la muestra que se encuentra accesible y recalcular el tamaño de muestra con los resultados. 36
b) Una muestra demasiado grande podrá alargar inútilmente un estudio y causar que diferencias sin importancia clínica, resulten estadísticamente significativas. c) Es siempre preferible incrementar la confiabilidad de la recolección de los datos que el tamaño de la muestra. Esto tiene que ver con los aspectos del diseño que le confieren validez interna al estudio y los procedimientos para incrementar y medir la consistencia y validez de las mediciones.
37
3. CÁLCULO DEL TAMAÑO DE MUESTRA
HASTA el momento, se han presentado los conceptos y fundamentos teóricos para el cálculo del tamaño de muestra y se ha hecho referencia a los elementos necesarios para ello. Existen al menos tres maneras para poder conocer cuántos elementos se requieren en la muestra, aunque los tres caminos tienen los mismos principios. El primero, es someter los datos de mi estudio a fórmulas preestablecidas y mediante el desarrollo de las mismas, obtener dicho número. El segundo consiste en consultar tablas precalculadas, en donde, mediante la ubicación de los datos de mi estudio en las hileras y columnas correspondientes, localice el número buscado. Y por último, incluir los datos en algún paquete estadístico dedicado a esta tarea para obtener el resultado mediante un cálculo electrónico. En este apartado, se pretende abordar de una manera lo más sencilla posible, las fórmulas comunes para el cálculo del tamaño de muestra y algunos ejemplos que permitan clarificar su aplicación. Se dividirá la presentación por tipos de estudio, iniciando con los estudios descriptivos de una muestra, estudios comparativos tanto con variables numéricas como categóricas, estudios de equivalencia, estudios de correlación, analíticos y experimentales, diseños de factores de riesgo, de tratamientos y de pruebas diagnósticas.
3.1. ESTUDIOS DESCRIPTIVOS Este tipo de estudios se realizan en un solo grupo y habitualmente pretenden estimar un parámetro de la población a partir de una muestra de la misma 3.1.1. Estudios cuyo objetivo es la estimación de una proporción Son estudios que intentan responder preguntas como ¿cuál es la prevalencia, proporción o porcentaje del fenómeno en estudio? Son estudios en los que a partir de los valores observados en una muestra y utilizando la inferencia estadística, se busca estimar el valor de dicho parámetro en la población. Al tomar una muestra para estimar lo que sucede en la realidad, es necesario aceptar que la medición realizada en la muestra nos dará una apreciación de la población de la cual se tomó, pero con cierto grado de variabilidad (o error). La variabilidad que estamos dispuestos a aceptar en dicha estimación es lo que llamamos precisión y puede manejare a través de los intervalos de confianza (es decir, los límites superior e inferior dentro de los cuales se encontrará el verdadero valor del parámetro estimado). Como se mencionó en la sección anterior, se requiere conocer algunos datos para el cálculo del tamaño de muestra requerido, entre los que destacan: a) La proporción que se desea poder detectar, por ejemplo, si el estudio busca detectar la prevalencia de diabetes mellitus tipo 2 en una población y por estudios previos sabemos que la proporción mundialmente reportada fluctúa entre 8 y 12%, utilizamos esta cifra como referencia para anotarla en nuestra fórmula en términos de fracciones de la unidad (esto es, 0.08 a 0.12). Cuando se desconoce la proporción buscada, se utiliza p = 0.5 en la fórmula, que es la que proporciona el máximo valor de n. 39
b) El nivel de confianza deseado: Usualmente 95%, que corresponde a un valor α = 0.05. Este valor indica el grado de confianza que se tendrá de que el verdadero valor del parámetro en la población caiga dentro del intervalo obtenido. Cuanta más confianza se desee, menor será el valor de α, mayor el valor de Zα y más elevado el número de sujetos necesarios. c) La precisión (δ) con que se desea obtener la estimación, es decir, la amplitud que se acepte del intervalo de confianza. Cuanta más precisión se desee, más estrecho deberá ser este intervalo y más sujetos deberán ser estudiados. Con los datos anteriores, podemos despejar la siguiente fórmula para variables cualitativas (una proporción):
N=
( Zα ) 2 ( p)(q ) δ2
Fórmula 1. Tamaño de muestra para una proporción. Población infinita.
En donde: N = Tamaño de la muestra que se requiere. p = Proporción de sujetos portadores del fenómeno en estudio. q = 1 – p (complementario, sujetos que no tienen la variable en estudio). δ = Precisión o magnitud del error que estamos dispuestos a aceptar. Zα = Distancia de la media del valor de significación propuesto. Se obtiene de tablas de distribución normal de probabilidades y habitualmente se utiliza un valor α de 0.05, al que le corresponde un valor Z de 1.96 (cuadro 4). Por ejemplo, deseamos conocer el porcentaje de pacientes de una población que reaccionen a la prueba de coccidioidina. Existen estimaciones nacionales previas que sugieren que dicho valor se encuentra alrededor de 40% (p = 0.40). Se acepta una precisión de ±3% (δ = 0.03) (o sea que el valor de la proporción 40
que buscamos pueda estar entre 37 y 43%) y una confianza del 95%(α = 0.05, Zα = 1.96). Se sustituyen estos valores en la fórmula para obtener 1024 sujetos, como se aprecia a continuación: Literatura: Sujetos reactores = 40% (p = 0.40), (q = 1 – p = 0.60). Precisión de la estimación = ±3% (δ = 0.03). Nivel de confianza = 95% (α = 0.05, Zα = 1.96). N=
( Zα ) 2 ( p )(q) (1.96) 2 (0.4)(0.6) 3.84(0.24) 0.92 = = = =1024 δ2 0.032 0.0009 0.0009
Este mismo ejemplo podemos resolverlo sin necesidad de efectuar operaciones matemáticas, consultando las tablas existentes para ello. Por ejemplo, en la tabla I del anexo A, buscamos en la columna de la izquierda la proporción esperada del fenómeno (40%). En la segunda columna se aprecia el nivel de confianza deseado (95%) y en la sexta columna ubicamos la precisión de la estimación marcada en la primera hilera como ±3%. Cruzamos los datos y apreciamos que el número marcado por tablas son 1022 sujetos. Si se desea una precisión más alta (variación ±1%, δ = 0.01) se requerirán un mayor número de sujetos: Literatura: Sujetos reactores = 40% (p = 0.40), (q = 1 – p = 0.60). Precisión de la estimación = ±1% (δ = 0.01). Nivel de confianza = 95% (α = 0.05, Zα = 1.96). N=
( Zα ) 2 ( p )(q) (1.96) 2 (0.4)(0.6) 3.84(0.24) 0.92 = = = = 9229 δ2 0.012 0.0001 0.0001
En la tabla I buscamos en la columna de la izquierda la proporción esperada del fenómeno (40%). En la segunda columna el nivel de confianza deseado (95%) y en la tercer columna ubi41
camos la precisión de la estimación marcada en la primera hilera como ±1%. Al cruzar los datos se aprecia el número marcado en 9053 sujetos. De la misma manera, con una precisión baja (δ = 0.1) se requieren 92 sujetos: N=
( Zα ) 2 ( p )(q) (1.96) 2 (0.4)(0.6) 3.84(0.24) 0.92 = = = = 92 δ2 0.10 2 0.01 0.01
mismo valor observado en la tabla I. Cuando el tamaño total de la población es menor de 5,000 (población finita), se requiere efectuar un ajuste en la fórmula:
N=
n1 1+ (n1 / población)
Fórmula 2. Tamaño de muestra para una proporción. Población finita ( B, Ho: A = B. 2. Error α = 5% (0.05) y Error β 10% (0.10), poder (1 – β) = 90% (0.90), para una hipótesis unilateral, buscamos K (Zα + Zβ)2 en el cuadro 8 = 8.6. 3. Magnitud mínima importante de la diferencia (µ1 – µ2) (diferencia mínima considerada clínicamente importante) = 10 mm Hg. 4. Desviación estándar en cada grupo (σ) = 20 mm Hg. 2
n=
2
K (σ 1 +σ 2 ) 8.6(202 + 202 ) 8.6(400 + 400) 8.6(800) = = = = 68 = ( µ1 − µ 2 ) 2 10 2 100 100
= 68 sujetos por grupo Si en este mismo ejemplo, se quiere tener la capacidad de detectar una diferencia más pequeña de medias, por ejemplo 2 50
mm Hg (µ1 – µ2 = 2), tendríamos un incremento del tamaño de la muestra de la siguiente manera: 2
2
K (σ 1 +σ 2 ) 8.6(20 2 + 20 2 ) 8.6(400 + 400) 8.6(800) n= = = = = ( µ1 − µ 2 ) 2 22 4 4
= 1720 sujetos por grupo Y si se fuera menos exigente en el poder del estudio, por ejemplo 80%, la muestra se disminuiría a: 2
n=
2
K (σ 1 +σ 2 ) 6.2(202 + 202 ) 6.2(400 + 400) 6.2(800) = = = = ( µ1 − µ 2 ) 2 22 4 4
= 1240 sujetos por grupo Si analizamos la tabla IV, encontramos que en la primera columna se encuentra la diferencia esperada entre las medias, dividida entre la desviación estándar, que en el caso del primer ejemplo sería 10/20 = 0.5, y al cruzar los valores a un nivel de confianza de 95% (alfa de 0.05) en estudio unilateral con un poder de 90% se observa que se requieren 70 sujetos por grupo. En el segundo ejemplo, la diferencia de medias entre la desviación estándar es de 2/20 = 0.1 y al cruzar con la hilera del nivel de confianza de 95% y la columna de poder 90% se aprecia que el valor de sujetos requeridos es 1715 y en la columna de poder de 80% es de 1237. Valores bastante cercanos a los obtenidos mediante la fórmula. Esta tabla presupone que las desviaciones estándar de ambos grupos en comparación son iguales.
3.3. ESTUDIOS DE EQUIVALENCIA En los ensayos comparativos el interés está centrado en decidir si dos tratamientos son diferentes, y los análisis utilizan prue51
bas de significación para determinar que tanto la hipótesis nula de no diferencia puede rechazarse, sin embargo, en ocasiones nos interesa demostrar que dos tratamientos son similares, de manera que la hipótesis nula refiere que no existe equivalencia entre los grupos de estudio mientras que la hipótesis alterna refiere que la equivalencia si existe. En estos estudios, las pruebas convencionales de significación tienen poca relevancia, ya que por una parte, la falla en detectar una diferencia no necesariamente implica que exista equivalencia y por otra, una diferencia que se detecta puede no tener ninguna importancia clínica y corresponder a una equivalencia práctica. Lo anterior pone de manifiesto que la medida en la cual se fundamenta el cálculo de la muestra son los intervalos de confianza, es decir, el rango de equivalencia o la amplitud de la diferencia máxima permisible más allá de la cual no podemos sustentar dicha equivalencia. 3.3.1. Estudios de equivalencia de proporciones Si partimos de la fórmula 4 utilizada para diferencia de proporciones, solamente tendríamos que restarle el tamaño de la máxima diferencia permitida (ε) como se aprecia en la fórmula:
n=
( p1q1 + p2 q2 )( K ) ( p1− p 2 −ε ) 2
Y si consideramos que ambos tratamientos son igualmente efectivos, entonces p1 = p2 por lo que la fórmula se simplifica de la siguiente manera:
n=
2 pq ( K ) ε2
Fórmula 6. Tamaño de muestra para equivalencia de proporciones.
52
Por ejemplo, si sabemos que el antibiótico A negativiza los cultivos de Escherichia coli en un 80% a las setenta y dos horas y se quiere probar que el antibiótico B tiene efectos equivalentes, ¿de qué tamaño tiene que ser la muestra en estudio para aseverar la equivalencia de ambos con un nivel de significación de 0.05 y poder del 80%? 1. Primero determinamos P = 0.8, y q = 0.2 (q = 1 – p). 2. Buscamos en el cuadro 8 el valor de K (Zα + Zβ)2 para un alfa 0.05 y poder (1 – β) de 0.8 y en un estudio a dos colas corresponde a 7.9. 3. Definimos que amplitud de intervalo es aceptable para considerar equivalencia en ambos tratamientos y consideramos que si el antibiótico B negativiza los cultivos en un 80 ± 2.5%, podemos considerarlo equivalente. Como 2.5% equivale a una probabilidad de 0.025 y es hacia ambos lados, entonces ε = 0.05. 4. Sustituimos en la fórmula y tenemos que
n=
2 pq ( K ) [(2)(0.8)(0.2)]7.9 = = ε2 0.05 2
= 1011.2 sujetos por grupo En el mismo ejemplo, vamos a suponer que se considerará equivalente al antibiótico B si negativiza al menos el 80% de los cultivos a las 72 horas. En este caso el cálculo es similar, solamente que estamos proponiendo una hipótesis unilateral, por lo cual cambia el valor de K a 6.2 de acuerdo con el cuadro 8, de manera que: 1. El valor de p continúa siendo 0.8 y el de q de 0.2. 2. El valor de K (Zα + Zβ)2 para un alfa 0.05 y poder (1 – β) de 0.8 en un estudio a una cola corresponde a 6.2. 3. La amplitud de intervalo aceptable para considerar equivalencia (ε) continúa siendo 5% (0.05).
53
4. Y al sustituir en la fórmula se aprecia que se requieren
n=
2 pq ( K ) [(2)(0.8)(0.2)]6.2 = = ε2 0.05 2 = 793.6 sujetos por grupo
En la tabla V se pueden encontrar estos valores, de manera que se ubica el valor p de 0.8 (el 80% de los cultivos negativizados por el antimicrobiano), se localiza el valor ε en 0.05 y en la columna correspondiente a alfa 0.05 bilateral con poder 80% se encuentra el valor de 1011 sujetos requeridos por grupo para el primer ejemplo. Similar al segundo, solamente que nos ubicamos en la columna de hipótesis unilateral a alfa 0.05 y poder 80% y el valor es de 794 sujetos por grupo. 3.3.2. Estudios de equivalencia de medias De la misma manera, para evaluar la equivalencia de medias entre grupos, partimos de la fórmula para evaluar diferencias de medias y le restamos la amplitud del intervalo aceptable para considerar equivalencia (ε): 2
n=
2
K (σ 1 +σ 2 ) ( µ1− µ 2 − ε ) 2
Y como estamos considerando que los resultados en ambos grupos sean iguales, entonces las medias y desviaciones estándar tendrán que ser similares, de tal manera que (σ12 + σ22) es = 2σ2, y µ1 – µ2 = 0 por lo que la fórmula se simplifica de la siguiente manera: 2σ 2 K n= 2
ε
Fórmula 7. Tamaño de muestra para equivalencia de medias.
54
De esta forma, si un médico sabe que la presión sistólica media (± su desviación estándar) de un grupo que recibe un determinado medicamento antihipertensivo, es de 130 ± 7 mm Hg, y desea probar que otro medicamento alternativo es equivalente, aceptando como criterio de equivalencia el hecho de que la presión media se encuentre entre 129 y 131 (el estudio es a dos colas porque acepta un intervalo ±1 por lo que ε = 2), con un nivel de significación de 0.05 y un poder del estudio del 90%, sustituimos en la fórmula con los siguientes datos: 1. σ = 7, 2σ2 = 2(7)2 = 2(49) = 98. 2. K, para alfa de 0.05 y poder de 90% en hipótesis bilateral, = 10.5 (cuadro 8). 3. ε = 2. 4.
n=
[
]
2σ 2 K (2)(7) 2 10.5 98(10.5) 1029 = = = = 257.25 ε2 22 4 4
sujetos por grupo.
De la misma manera, si sabemos que el valor medio de colesterol de un grupo tratado con un medicamento determinado es de 180 ± 10 mg y deseamos probar que otro medicamento alterno es equivalente, aceptando como equivalencia que mantenga los valores en una media por abajo de 183 mg (el estudio es a una cola porque aceptamos como equivalencia ser menor que 183) con una significación de 5% y poder del estudio de 80%, tenemos lo siguiente: 1. σ = 10. 2. K, para un alfa de 0.05 y poder de 0.8 en hipótesis unilateral es de 6.2 (cuadro 8). 3. ε = 3. 4.
n=
[
]
2σ 2 K (2)(10) 2 6.2 200(6.2) 1240 = = = =138 ε2 32 9 9
sujetos por grupo.
Si queremos ser más estrictos en el criterio, de manera de aceptar la equivalencia solamente si el valor de la media del tratamiento alterno se encuentra por abajo de 182 mg, requerimos 4. n = 2σ 2 K = [(2)(102) 2
ε
2
2
]6.2 = 200(6.2) =1240 = 310 sujetos por grupo. 4
55
4
En la Tabla VI podemos localizar la columna de la desviación estándar (σ de 7), la diferencia máxima aceptada para considerar equivalencia (ε de 2) y cruzar con la columna de alfa 0.05 bilateral con poder de 90% y encontramos que se requieren 257 sujetos por grupo en el primer ejemplo. En el segundo ejemplo se localiza σ de 10 en la cuarta hilera de valores, y en el nivel ε de 3, se cruza con la columna de alfa 0.05 unilateral a un poder de 80% obteniendo 138 sujetos por grupo. En el tercer ejemplo se cruza la línea σ de 10 con la columna de alfa 0.05 unilateral a un poder de 80% con ε de 2 y observamos que se requieren 310 sujetos por grupo. Igual que con la fórmula.
3.4. ESTUDIOS
DONDE SE BUSCA
CORRELACIÓN
Existen estudios donde al investigador le interesa conocer si dos variables se encuentran relacionadas, en el sentido que los cambios de una variable influyen en los cambios de la otra en cualquier sentido. Esto se logra obteniendo el coeficiente de correlación de Pearson. La hipótesis nula se plantea como la no existencia de dicha asociación, es decir que r = 0, y la hipótesis alterna es que la asociación si existe, por lo que r ≠, > o < 0, y la prueba de significación nos ayuda a determinar que tanto la magnitud de la correlación encontrada se encuentra dada por el azar o que tanto es verdadera. El supuesto que se requiere para este cálculo es que se trabaja con variables continuas y que existe una distribución normal.
56
3.4.1. Correlación simple en un grupo Para una correlación simple, la fórmula usada es la siguiente:
n = 3+
K C2
Fórmula 8. Tamaño de muestra para una correlación simple.
En donde: K = (Zα + Zβ)2. (1+ r ) . C = 0.5ln (1− r ) r = coeficiente de correlación esperado. Por ejemplo, existen reportes en la literatura que sugieren asociación entre las cifras de linfocitos totales y los niveles de albúmina en una relación directa, es decir, a niveles más bajos de albúmina, niveles más bajos de linfocitos totales y viceversa, y deseamos probar dicha sugerencia, por lo que planteamos un estudio donde se presupone podemos encontrar una correlación alrededor de 0.6, con nivel de significación de 0.05 y poder del 80%, ¿cuántos sujetos o unidades de estudio requerimos para demostrarlo? 1. Con los valores α de 0.05 y 1 – β de 0.8, calculamos K (Zα + Zβ)2 consultando el cuadro 8 observamos que corresponde a 6.2 (se maneja a una cola ya que la hipótesis alterna es unilateral por mencionar que r > 0). 2. Se calcula C que es igual a 0.5 que multiplica al logaritmo natural de (1 + r)/(1 – r) = (0.5) ln(1+0.6/1 – 0.6) = (0.5) ln(1.6/ 0.4) = (0.5)(ln 4) = (0.5)(1.386) = 0.693. 3. Se sustituye en la fórmula:
n = 3+
6.2 6.2 K = 3+ = 3+ = 3 +12.9 =15.9 0.6932 0.480 C2
o sea, se requieren 16 sujetos para el estudio.
57
Si el nivel de la correlación esperada es menor, el tamaño de la muestra requerido es mayor, de tal manera que si esperamos una correlación de 0.4, a un alfa de 0.05 y beta de 0.20 (1 – β = 0.8), obtendremos un valor de K de 6.2, C = (0.5) ln(1 + 0.4/1 – 0.4) = (0.5) ln(1.4 / 0.6) = (0.5)(ln 2.333) = (0.5)(0.847) = 0.424 y con estos valores, n = 3+ K2 = 3+ 6.2 2 = 3+ 6.2 = 3+ 34.5 = 37.5 = incremento C 0.179 0.424 a 38 sujetos. Estos valores se encuentran en la tabla VII en la cual solamente tenemos que localizar el valor r de 0.6 y 0.4 de los ejemplos y cruzarlo con la columna de alfa unilateral de 0.05 y poder 80% obteniendo el mismo resultado. 3.4.2. Comparación de dos correlaciones Si el estudio pretende comparar dos correlaciones, entonces la fórmula se reestructura de la siguiente manera de acuerdo con Cohen:
n = 3+
K (C1 − C2 ) 2
Fórmula 9. Tamaño de muestra para la comparación de dos correlaciones.
En donde: K = (Zα + Zβ)2 (cuadro 8). C1 = 0.5 × ln (1+r1)/(1-r1). C2 = 0.5 × ln (1+r2)/(1-r2). r1 = coeficiente de correlación esperado en el primer grupo. r2 = coeficiente de correlación esperado en el segundo grupo. De manera que si sabemos que la correlación entre el índice de masa corporal y los niveles de insulina sérica en un grupo es de 0.20 y en otro grupo de 0.30, y queremos saber si la diferencia entre ambos es solamente por azar o verdaderamente corresponden a dos poblaciones diferentes, para poder rechazar la hipótesis nula de no diferencia entre ambas correlaciones, con un nivel de 58
significación de 0.05 y poder de 80%, se diseña un estudio comparativo en el cual se necesitan los siguientes elementos para calcular el tamaño de muestra: 1. K = 7.9 de acuerdo con el cuadro 8 (estamos planteando una hipótesis bilateral). 2. C1 = (0.5) ln(1 + .20/1-.20) = (0.5) ln(1.20/0.80) = (0.5) (ln 1.500) = (0.5)0.40546 = 0.203. 3. C2 = (0.5) ln(1 +.30/1 – .30) = (0.5) ln(1.30/0.70) = (0.5) (ln 1.857) = (0.5)0.61904 = 0.310. 4. r1 = 0.20. 5. r2 = 0.30. Y sustituyendo en la fórmula: n = 3+
K 7.9 7.9 = 3+ = 3+ = 3 + 692.7 = 695.7 2 2 (C1 − C2 ) (0.203− 0.310) 0.1062
sujetos para el estudio en cada grupo. En la tabla VIII se encuentran en las primeras dos columnas los valores de la relación conocida o supuesta en cada grupo, y localizando en la columna con el valor alfa y poder deseados en el estudio encontramos que se requieren 696 sujetos en cada grupo.
3.5. ESTUDIOS
DE CASOS Y CONTROLES
Cuando se pretende calcular el tamaño de muestra en diseños de casos y controles, recordemos que la comparación que se efectúa es que tanto más expuesto al factor de riesgo ha estado el grupo de enfermos que el grupo de no enfermos, relación que denominamos razón de momios u odd ratio, que finalmente es una proporción.
59
3.5.1. Estudios de casos y controles no pareado En los estudios donde se busca la asociación de un factor específico, el uso de la fórmula 4 para el cálculo de diferencia de proporciones puede ser adecuado, asignando el valor p1 a la frecuencia de exposición en los casos y p2 a la frecuencia de exposición en los controles.
n=
( p1q1 + p2 q2 )( K ) ( p1 − p2 ) 2
Fórmula 4. Tamaño de muestra para dos proporciones.
En donde: n = número de casos y número de controles que se necesitan. p1 = proporción esperada del factor en estudio en el grupo de casos. q1 = 1- p1. p2 = proporción del factor en estudio en el grupo de controles. q2 = 1 – p2. K = (Zα + Zβ)2 (cuadro 8). De manera que si por reportes previos sabemos que hasta un 30% de los pacientes con cardiopatía isquémica de una población tienen diabetes mellitus 2, y solamente 15% de pacientes sin cardiopatía isquémica la padecen, y deseamos efectuar un estudio en otra población para determinar el peso de la asociación de diabetes con cardiopatía isquémica, con un 95% de confianza y poder de 80% con hipótesis bilateral de diferencia, nuestro tamaño de muestra deberá calcularse de la siguiente manera: n=
[(0.3)(0.7) + (0.15)(0.85)](7.9) = [(0.21) + (0.1275)](7.9) = (0.3375)(7.9)= (0.3 − 0.15) 2
0.152
= 2.666/ 0.0225 = 118.5 60
0.0225
Es decir, se requieren al menos 119 casos y 119 controles para tener un 95% de certeza que la asociación que encontremos no sea debida al azar. En la tabla IX localizamos en las primeras dos columnas el valor de la proporción de ambos grupos a comparar, en una tercer columna se encuentra la razón de momios que se quiere detectar y se localiza la columna correspondiente en este caso a un poder de 80%, confianza 95% (alfa 0.05) en una relación 1 caso por 1 control y observamos que se necesitan 133 pacientes por grupo. El tamaño de la muestra puede variar discretamente cuando se calcula con base en tablas, programas de cómputo o en las fórmulas aquí presentadas ya que de estas últimas se ha elegido la versión más simplificada para facilitar el cálculo. La tabla está elaborada con base en el programa Epi Info 2000 de acuerdo con la fórmula de Fleiss. Cuando el número de controles es mayor al de los casos, se utiliza la siguiente fórmula:
n=
(1+1/ c)( pq )( K ) ( p 1 − p2 ) 2
Fórmula 10. Tamaño de muestra para grupos desiguales.
En donde: c = número de controles por caso. p = p1 + p2/2. q = 1 – p. o bien n =
N (1+ c) 2c
Si en el ejemplo previo se considera conveniente efectuar el estudio con dos controles por caso, la fórmula se calcularía de la siguiente manera: p = (0.3 + 0.15) / 2 = 0225. q = (0.7 + 0.85) / 2 = 0.775. 61
pq = .174. K = 7.9 (cuadro 8). p1 – p2 = 0.15. (1 + 1/c) = (1 + 1/2) = 1.5. n=
(1+1/ c)( pq)( K ) 1.5(0.174)(7.9) 1.5(1.3746) 2.0619 = = = = 91.64 ( p 1 − p2 ) 2 0.152 0.0225 0.0225
Es decir, se requieren 92 casos y 184 controles. Con la fórmula simplificada sería: n = 119(1+2) / 2(2) = 119(3) / 4 = 357/4 = 89.25 = 90 sujetos, es decir 90 casos y 180 controles, que como se observa, es una buena aproximación. Al verificar estos valores en la tabla IX, en la columna donde se anota la relación control: caso 2:1, se encuentra que se requieren 194 controles para 97 casos, lo cual es un valor semejante al obtenido por fórmulas. 3.5.2. Estudios de casos y controles pareado Cuando se decide efectuar apareamiento, las unidades de estudio se analizan por pares, y el grado de asociación entre las variables se mide mediante razón de momios (odss ratio), que corresponde solamente al análisis de los pares discordantes (casillas b y c del cuadro tetracórico). El cálculo del tamaño de muestra se basa en la prueba de McNemar bajo la siguiente fórmula:
{Zα (RM +1) + Zβ n=
( RM +1) 2 − ( RM −1) 2 P 2 disc ( RM −1) 2 Pdisc
}
2
Fórmula 11. Tamaño de muestra para estudios de casos y controles pareados.
62
En donde: RM = razón de momios que se espera encontrar. pdisc = proporción o porcentaje de discordancia entre los casos y los controles y corresponde al cálculo de b + c / n pares. Zα = distancia de la media que tendrán los valores de probabilidad de α. Zβ = distancia de la media que tendrán los valores de probabilidad asignados a β. Ambos valores se pueden consultar en el cuadro 4. Así, un investigador desea determinar si el tabaquismo materno es un factor de riesgo para que los hijos desarrollen asma bronquial durante la infancia. Se propone un diseño de casos y controles y se decide efectuar apareamiento por sexo y edad dada la posible influencia de estos factores en la enfermedad. El investigador se propone encontrar una RM de 2 o mayor. Como desconoce la proporción discordante, efectúa un estudio piloto de 80 pares que muestra lo siguiente:
Madre fuma Casos Madre no fuma
Controles Madre Madre fuma no fuma 10 25 a b c d 8 37 18
62
35
45 80
En donde se aprecia que p discordante = b + c / N = 25 + 8 / 80 = 0.4125. Para sustituir la fórmula, requerimos los siguientes datos: Zα = 1.96. Zβ = 0.84. RM = 2. p discordante = 0.41. 63
De modo que
{1.96(2+1) + 0.84 n=
}
2
(2 +1) 2 − (2 −1) 2 0.412 =171.13 ( 2 −1) 2 0.41
que corresponden a 171 pares de casos y controles. Si no es posible efectuar un estudio piloto, se puede inferir el valor de p discordante a través de la estimación de las proporciones esperadas, así, el investigador estima que aproximadamente un 20% de las madres de los controles son fumadoras, tomando en cuenta la prevalencia del tabaquismo en la mujer reportada en estudios previos en su localidad, y considera que esta proporción es mayor en las madres de los niños con asma bronquial, alrededor de un 40%, por lo que al sustituir en la fórmula πA(1 – πB) = b/n pares, y πB(1 – πA) = c/n pares, tendríamos que b/n pares = (0.20)(0.8) = 0.16 y c/n pares = (0.4)(0.6) = 0.24, de donde, si p discordante es = b + c/n pares, esto sería 0.16 + 0.24 = 0.40 que es muy similar a la proporción discordante encontrada en la prueba piloto. Como se aprecia, conocer el valor de la proporción discordante es una situación que puede resultar laboriosa, por lo que es más fácil consultar en la tabla X que muestra dos niveles de confianza (α) de 0.05 y 0.01, y dos niveles de poder estadístico (1 – β) de 80 y 90%, que son los valores más utilizados. Seleccionamos α de 0.05 en el sentido horizontal de la tabla, se busca el 20% de proporción de exposición en los controles, se ubica el poder estadístico en 80% y cruzamos la tabla en la columna de la RM que queremos detectar que en el ejemplo es 2. La tabla nos da un valor de 173 pares (173 casos y 173 controles).
64
3.5.3. Estudios de casos y controles analizados mediante regresión logística En estudios de casos y controles es frecuente analizar la fuerza de asociación de varios posibles factores de riesgo y la enfermedad en forma simultánea, para lo cual se utilizan análisis de regresión logística. En esta forma de análisis se asume que la variable dependiente es dicotómica, ya que la enfermedad está o no presente. Cuando las variables independientes (los factores de riesgo) se encuentran en escala nominal dicotómica, el tamaño de muestra se puede calcular con base en la fórmula 4 y tablas para la comparación de dos proporciones. Cuando las variables independientes son expresadas en escala continua (numérica) y tienen una distribución normal, se puede utilizar la siguiente fórmula de acuerdo con Whittemore:
[Zα + exp(ln RM n=
/ 4) Zβ ] (1+ 2 P) 2 ln RM ( P ) 2
2
Fórmula 12. Tamaño de muestra para regresión logística.
En donde: Zα = distancia de la media que tendrán los valores de probabilidad de α (o dicho de otra manera, es la desviación estandarizada del valor de significación). Zβ = distancia de la media que tendrán los valores de probabilidad asignados a β (o desviación estandarizada del valor del poder asignado al estudio) ambos valores se pueden consultar en el cuadro 4. ln RM = logaritmo natural de la Razón de Momios de la covariable (factor de riesgo) en estudio. exp = función exponencial. 65
P = proporción o probabilidad de ocurrencia del evento (la enfermedad) al valor medio de la covariable. Esta fórmula permite calcular el tamaño de muestra cuando se estudia solamente una covariable en el modelo, ajustando para el resto. Cuando son más de una covariable incluidas en el modelo, el resultado obtenido se divide entre 1 menos el coeficiente de correlación múltiple que relaciona la covariable de interés con las restantes. De tal manera que si una persona estudia la fuerza de asociación de los niveles de glucosa con el desarrollo de complicaciones vasculares periféricas en el individuo con diabetes mellitus, y por estudios previos o mediante un estudio piloto sabe que la probabilidad de desarrollo de complicaciones en un seguimiento a cinco años en individuos con niveles medios de glucosa en sangre es de 16%, para detectar una razón de momios de 1.8 a un nivel de significación del 5% y poder del 80% en una prueba a una cola requerimos:
n= = =
[Zα + exp(ln RM
/ 4) Zβ ] (1+ 2 P) = 2 ln RM ( P ) 2
2
[1.64 + exp(ln1.8 / 4)(0.84)] [1+ (2)(0.16)] = 2
2
ln1.82 (0.16)
[1.64 + exp(0.588 / 4)(0.84)] [1+ (2)(0.16)] = 2
2
ln1.82 (0.16)
[1.64 + exp(0.588 / 4)(0.84)] [1+ 0.32] = = 2
2
0.5882 (0.16)
[1.64 + exp(0.3457/ 4)(0.84)] [1.32] = 2
=
0.3457(0.16) 66
[1.64 + exp(0.0864)(0.84)] [1.32] = 2
=
0.0553
[1.64 + exp(1.09)(0.84)] [1.32] = 2
=
0.0553
=
2.55562 (1.32) = 0.0553 =
6.53(1.32) = 0.0553
=
8.6196 = 0.0553
= 155.8 = 156 sujetos En la tabla XI podemos localizar en la primera columna la prevalencia o proporción de la enfermedad o del fenómeno al valor medio del factor en estudio, y cruzando con la columna donde se encuentra el valor de razón de momios supuesto al nivel de significación deseado, se encuentra el valor de 156 sujetos requeridos. Si además de esa covariable, se desea estudiar la influencia de los niveles de colesterol, y sabemos que el coeficiente de correlación múltiple de los niveles de glucosa sanguínea con la cifra media de colesterol es de 0.21, entonces necesitaremos 156 / 1 – 0.21 = 197 pacientes para el estudio.
67
3.6. ENSAYOS
CLÍNICOS
Un ensayo clínico, por definición es un estudio en el cual un grupo recibe una intervención y otro no, para valorar las diferencias imputables a su efecto. La asignación a grupos es aleatoria y existen diversos mecanismos de control de variables de confusión, como la ceguedad de maniobras o el cruzamiento, entre otras. 3.6.1. Ensayo clínico individual y no pareado En estos estudios se tiene un grupo asignado aleatoriamente a recibir un tratamiento o intervención y otro que no lo recibirá y lo que se pretende es comparar las diferencias entre las tasas o proporciones encontradas entre ambos grupos o las diferencias entre las medias si la variable de salida se mide en escala numérica. En estos casos, el tamaño de la muestra puede ser calculado mediante la fórmula 4 para diferencias de proporciones y la 5 para diferencias de medias ya analizadas.
n=
( p1q1 + p2 q2 )( K ) ( p1 − p2 ) 2
Fórmula 4. Tamaño de muestra para dos proporciones. 2
n=
2
K (σ 1 +σ 2 ) ( µ1 − µ 2 ) 2
Fórmula 5. Tamaño de muestra para dos medias.
68
3.6.2. Ensayo clínico fase II En ensayos clínicos donde se conoce una de las proporciones, en los que no se ubica a los sujetos en un tratamiento establecido y no existe simetría en cuanto a p1 y p2, como es el caso de los ensayos clínicos fase II, se puede utilizar la siguiente fórmula:
n=
( Zα p1q1 + Zβ p2 q2 ) 2 ( p1 − p2 ) 2
Fórmula 13. Tamaño de muestra para ensayos clínicos fase II.
Por ejemplo, si conocemos que la inhibición del crecimiento bacteriano con un medicamento se presenta en un 40% y suponemos que otro medicamento tendrá al menos un 50% de efectividad, queremos trabajar con un alfa de 0.05 y poder del 80%, consultamos la tabla 4 y vemos que Zα 0.05 es = 1.96 y Zβ 80% =
0.84, de manera que requeriremos n = [(1.96 (0.4)(0.6) + 0.842 (0.5)(0.5) ] (0.4 − 0.5) = 158 sujetos por grupos. Si deseamos incrementar el nivel de significación a 0.01, requerimos de 244 sujetos por grupo de acuerdo con la fórmula: 2
[(2.33 n=
]
2
(0.4)(0.6) + 0.84 (0.5)(0.5) = 243.8 (0.4 − 0.5) 2
En la tabla XII localizamos en la primera columna el valor de la proporción menor, en este caso 0.4, ubicamos el nivel de confianza deseado y buscamos en la hilera superior la diferencia de proporciones entre ambos grupos, en este caso 0.1, de tal manera que al cruzar los datos se encuentran los mismos valores que con la fórmula.
69
3.6.3. Ensayos clínicos con variable de salida ordinal Si la variable de salida se encuentra medida en escala ordinal, se utiliza la siguiente fórmula, basada en la prueba U de Mann Whitney: 6 K /(log RM ) 2 n= k 1− ∑πi 3 i =1
Fórmula 14. Tamaño de muestra para variables ordinales.
Donde: K = (Zα+ Zβ)2 cuyos valores encontramos en el cuadro 8. πi = proporción esperada de sujetos en cada categoría (πA + πB/2). RM = razón de momios de cada categoría, que se calcula pAqB / pBqA donde pA es el número de elementos del tratamiento A en esa categoría entre el número total sometido al tratamiento A y qA es = 1– p. El cálculo es igual para el tratamiento B. En un ejemplo hipotético, deseamos comparar la respuesta de dos tratamientos y la catalogamos como excelente, buena, regular y mala, y con base en reportes previos o mediante un pequeño ensayo inicial de prueba suponemos resultados como los de la siguiente tabla: Resultado Tx A pA Tx B pB Excelente 18 18/40 = .45 10 10/40 = .25 π exc = .45+.25/2 = .35 Bueno 10 10/40 = .25 12 12/40 = .30 π bueno = .25+.30/2 = .275 Regular 9 9/40 = .225 8 8/40 = .20 π reg = .225+.20/2 = .213 Malo 3 3/40 = .075 10 10/40 = .25 π malo = .075+.25/2 = .163 40 40
Se calculan las RM en cada categoría, de manera que RM excelente = pAqB / pBqA de dicha categoría, es decir que si pA = 0.45, 70
pB = 0.25, qA = 1 – 0.45 = 0.55 y qB = 1 – 0.25 = 0.75, entonces RM de Excelente = 0.45(0.75) / 0.25(0.55) = 2.45. RM Bueno = 0.25(0.7) / 0.30(0.75) = 0.77. RM Regular = 0.225(0.80) / 0.20(0.775) = 1.176. RM Malo = 0.075(0.75) / 0.25(0.925) = 0.243. k
1 – ∑ πi3 = 1 – (.353 + .2753 + .2133 + .1633) = i=1
= 1 – (0.043 + 0.021 + 0.0097 + 0.014) = = 1 – 0.879 = 0.912. K = (Zα+ Zβ)2 , con α = 0.05 y poder de 0.8 = 7.9. Sustituyendo en la fórmula, se calcula el tamaño de muestra para cada categoría:
nExcelente =
6 K /(log RM ) 2 6(7.9) (log 2.45) 2 = = k 3 0 . 912 1− ∑πi i =1
= 65 sujetos en cada tratamiento
nBueno =
6 K /(log RM ) 2 6(7.9) (log 0.77 ) 2 = = k 0.912 1− ∑πi 3 i =1
= 771 sujetos en cada tratamiento
n Re gular =
6 K /(log RM ) 2 6(7.9) (log1.176) 2 = = k 0.912 1− ∑πi 3 i=1
= 1977 sujetos en cada tratamiento
nExcelente =
6 K /(log RM ) 2 6(7.9) (log 0.243) 2 = = k 0.912 1− ∑πi 3 i =1
= 26 sujetos en cada tratamiento Total: 2830 individuos por grupo. 71
Como se aprecia, el cálculo es laborioso, por lo que un buen apoyo es efectuarlo mediante los paquetes computacionales que existen para ello, o bien, consultando la tabla XIII que nos da los valores del numerador de la fórmula y son bastante aproximados al tamaño de muestra requerido. La manera de buscar dichos valores es ubicar en la primera columna la razón de momios esperada para cada nivel de respuesta, y en la hilera superior el poder deseado en el estudio. El ajuste se efectúa al dividir el número de la tabla entre el denominador de la fórmula. En el ejemplo que se presenta, en el nivel de bueno se busca una RM de 2.45 que a un poder de 80% ubica a 56 sujetos para dicho nivel (ya ajustado con la fórmula se requieren 65). En el nivel de malo se busca una RM de 0.243 que corresponde igual a 1/RM o sea 1/.243 = 4.11. La hilera de RM de 4 en la tabla nos marca la necesidad de 25 sujetos (ajustado con la fórmula son 26). 3.6.4. Ensayo clínico en grupos relacionados Si los grupos que estamos estudiando se encuentran relacionados, es decir, no existe independencia entre ellos, como sucede en los ensayos pre y postprueba y ensayos cruzados, y medimos la variable de salida en escala nominal, se utiliza la misma fórmula 11 que vimos en el diseño de casos y controles pareado. Si la medición se efectúa en escala ordinal, la fórmula se fundamenta en la prueba del rango con signo de Wilcoxon y es necesario calcular la discordancia de la desviación estándar entre las categorías.
n=
K 2 Zα 2 + ∆2 2
Fórmula 15. Tamaño de muestra para grupos relacionados, medición ordinal y/o numérica continua.
72
En donde: K = (Zα+ Zβ)2 (que se localizan en el cuadro 8). ∆ = n / σ discordante. Si la medición se efectúa en escala numérica continua, el cálculo del tamaño de muestra se fundamenta en la prueba t de Student pareada. La fórmula es prácticamente la misma (fórmula 17) pero ∆ = μ1 – μ2 / σ, y es necesario calcular la variabilidad al interior de los grupos (σintra) que es igual a (media)(coeficiente de variación)/100, y la variabilidad entre ellos (σentre) mediante la correlación r de Pearson. σentre = v2σ2 intra (1-r). Como dichos cálculos se encuentran más allá del propósito de este libro, solamente presentamos un ejemplo a resolver mediante la tabla XIV. Si en el mismo ejemplo previo, los grupos en lugar de ser independientes, fueran relacionados (por ejemplo un ensayo cruzado con tratamiento A y tratamiento B en el mismo sujeto), requerimos, además de conocer las proporciones esperadas o aproximadas de la prueba piloto, conocer el valor de ∆ = n / σ discordante que en el caso del nivel excelente sería 0.65, por lo que buscando en la primera columna el valor 0.65, a un alfa 0.05 bilateral y poder del 80%, requerimos 21 sujetos en este nivel de respuesta. Resultado Tx A pA Tx B pB Excelente 18 18/40 = .45 10 10/40 = .25 Bueno 10 10/40 = .25 12 12/40 = .30 Regular 9 9/40 =.225 8 8/40 = .20 Malo 3 3/40 = .075 10 10/40 = .25 40 40
π exc = .45 +.25/2 = .35 π bueno = .25 +.30/2 = .275 π reg = .225 +.20/2 = .213 π malo = .075 +.25/2 = .163
3.6.5. Ensayos clínicos en grupos Cuando el estudio lo estamos efectuando en grupos y no en individuos, nos interesa saber cuántos grupos requerimos para tal 73
fin, de manera que el cálculo del tamaño de muestra se efectúa mediante las siguientes fórmulas:
{
}
1+ K p1q1 + p2 q2 + Cv 2 ( p1 + p2 ) n n C= ( p1 − p2 ) 2
2
Fórmula 16. Tamaño de muestra para ensayos clínicos en grupos. Proporciones.
{
}
1+ K σ 1 +σ 2 + Cv 2 ( µ1 + µ 2 ) n C= ( µ1 − µ 2 ) 2
2
Fórmula 17. Tamaño de muestra para ensayos clínicos en grupos. Medias.
Como se observa, el cálculo se fundamenta en la variabilidad de las proporciones o de las medias entre los grupos, simbolizado por Cv, y la variabilidad intragrupo que la obtenemos a través de la desviación estándar (pq/n para proporciones, y σ para medias).
3.7. ESTUDIOS DE COHORTE Los estudios de cohorte característicamente implican el seguimiento de uno o más grupos de pacientes para evaluar principalmente dos cosas: La frecuencia de presentación del fenómeno en estudio y el tiempo en el cual se presenta. 3.7.1. Estudio para búsqueda de reacciones adversas con antecedente conocido Un buen ejemplo para hablar de la frecuencia de presentación de un fenómeno, en un estudio de cohorte, es la determina74
ción de la incidencia de reacciones adversas en estudios de eficacia y seguridad de un medicamento (post-marketing surveillance). La fórmula es:
N=
( Z α p + Zβ p + δ ) 2 δ2
Fórmula 18. Tamaño de muestra para determinar incidencia de reacciones adversas. Antecedentes conocidos.
En donde: Zα y Zβ = valores que se consultan en el cuadro 4 (es conveniente unilateral). p = frecuencia conocida del evento en estudio. δ = corresponde a la incidencia adicional del evento provocado por el medicamento. Por ejemplo, sabemos que un efecto secundario de algunas drogas hipolipemiantes es la producción de miopatía. Supongamos que la incidencia reportada por año de miopatía sea de 1/1000 y consideraremos inaceptable el nuevo hipolipemiante si la incidencia de miopatía se incrementa a 1/500. ¿Cuántos pacientes requerimos estudiar si deseamos un nivel de confianza de 95% (α = 0.05) y un poder del estudio de 90%? Zα = 1.64 (cuadro 4, estudio unilateral). Zβ = 1.28 (cuadro 4). p = 1/1000 (0.001). δ = 1/500 - 1/1000 = 0.002– 0.001 = .001. Sustituyendo: N=
( Zα p + Zβ p + δ ) 2 (1.64 0.001 +1.28 0.001+ 0.001) 2 = = δ2 0.0012 {1.64(0.0316) +1.28(0.0447)}2 = (0.0518+ 0.0572) 2 = = 0.000001 0.000001 2 (0.0109) = =11,881 0.000001
75
Es decir, se requiere estudiar 12,000 sujetos. Consultando la tabla XV se observa el mismo resultado ubicando en la primera columna el valor de p de 0.001, en la penúltima hilera el valor de δ de 0.001 y a un alfa unilateral de 0.05 y poder del 90% en la quinta columna. Si la frecuencia conocida del efecto colateral de un medicamento, digamos nausea y vómito, es de 5% y se espera que el medicamento no incremente dicho efecto colateral arriba de 1% adicional, y se desea un alfa 0.01 unilateral y poder 90%, se requieren: Zα = 2.33 (cuadro 4, estudio unilateral). Zβ = 1.28 (cuadro 4). p = 5/100 = 0.05. δ = 1/100 = 0.01.
{
( Zα p + Zβ p + δ ) 2 2.33 0.05 +1.28 (0.05 + 0.01) N= = δ2 (0.01) 2
=
{2.33(0.2236) +1.28(0.245)}2
0 . 834 = 0 . 0001
0.0001
2
=
}
2
=
(0.521+ 0.314) 2 = 0.0001
= 6 , 964 individuos.
En la tabla XV en la última columna se observa que el tamaño de muestra requerido son 7,000 sujetos. 3.7.2. Estudio para búsqueda de reacciones adversas sin antecedente conocido Si la frecuencia del fenómeno no es conocida, es necesario entonces anticiparla y efectuar el estudio contra un grupo control sin medicamento. En cuyo caso, presuponiendo una relación de un control por caso, la fórmula se ajustaría de la siguiente forma:
76
n=
K (2 p +δ ) δ2
Fórmula 19. Tamaño de muestra para determinar incidencia de reacciones adversas. Frecuencia no conocida.
En donde: K = (Zα + Zβ)2. p = frecuencia esperada de reacciones adversas. δ = incidencia adicional de reacciones adversas provocadas por la nueva droga en estudio. De manera que en el mismo ejemplo anterior, si el investigador no conoce la frecuencia real, pero supone o anticipa que puede ser de 1/1000 y que con el medicamento pudiera incrementarse hasta 1/500, el tamaño de muestra que requiere para un nivel de confianza del 95% y un poder del 90% se modificaría de la siguiente manera: K = (Zα+ Zβ)2 = 8.6 (estudio unilateral, cuadro 8). p = 1/1000 (0.001). δ = 1/500 - 1/1000 = 0.002– 0.001 = .001. K (2 p +δ ) 8.6(2(0.001) + 0.001) n= = = 25,800 sujetos por grupo. 2 2 δ
(0.001)
Como se observa, el tamaño de la muestra incrementa considerablemente. La tabla XVI nos muestra resultados similares ubicados como en el caso anterior, en la penúltima hilera en la quinta columna en los valores alfa 0.05 unilateral y poder 90% (26,000 sujetos). Si la frecuencia esperada del efecto adverso se supone sea de 5% y se espera que el medicamento incremente un 1% adicional, de acuerdo con la tabla XVI, para un poder de 80% y alfa unilateral de 0.05 se aprecia que se requieren 6,500 sujetos.
77
3.7.3. Estudios para el análisis de sobrevida en un grupo Para determinar el tiempo de aparición de un fenómeno, generalmente se emplean los análisis de curvas de sobrevida, y puede efectuarse comparando la frecuencia de aparición de dicho fenómeno (sobrevida) de un grupo de sujetos bajo un tratamiento determinado vs. la frecuencia reportada sin dicho manejo (por ejemplo, la referida en la historia natural del padecimiento) o bien, comparando las curvas de supervivencia con dos manejos diferentes. En estos estudios, el número de eventos observados es más importante que el número de sujetos reclutados en el estudio. Para determinar el número de eventos necesarios a ser observados, se utiliza la siguiente fórmula:
E=
2K (lnTR ) 2
Fórmula 20. Número de eventos que se requiere observar para un análisis de sobrevida.
En donde: E = Número de eventos que se requiere observar. K = (Zα + Zβ)2 cuyos valores más comunes se encuentran en el cuadro 8. ln TR = logaritmo natural de la tasa de riesgo. La tasa de riesgo es la relación existente entre el riesgo de un grupo y el riesgo conocido en la población y se calcula como TR = Sm1/Sm2 en donde Sm1 es el tiempo medio de aparición del evento (supervivencia) en la población y Sm2 el que esperamos en el grupo. Por ejemplo, un investigador desea demostrar si un esquema de quimioterapia puede prolongar el periodo de remisión de la 78
Leucemia Linfoblástica Aguda (LLA). Supongamos que es conocido que las recaídas se observan al primer año post tratamiento de inducción y mantenimiento de remisión y que consideramos que el nuevo esquema prolongará este periodo hasta el año y medio. ¿Cuántos eventos de recaídas necesita observar para tener una confianza de 95% y un poder de 80% en su estudio? K = 7.9 (cuadro 8). TR = Sm1 / Sm2, = 1 / 1.5 = 0.666. e = 2(K) 2 = 4(7.9) 2 = 15.8 2 = 95 eventos a observar. (ln TR) ln 0.666 0.406 En la tabla XVII se encuentra la primera columna con la tasa de riesgo, que en este ejemplo es 0.666 (como no existen valores menores de 1 en la tabla, hay que recordar que el valor es el mismo que 1/TR, 1/0.666 = 1.5 ) y en la columna de α de 0.05 y poder de 80% en estudio bilateral se encuentra que son necesarios 96 eventos a observar. Ahora bien, es necesario saber por cuanto tiempo se efectuará el seguimiento (T), lo cual dependerá de la tasa de reclutamiento de la que se disponga (tc), de acuerdo con la fórmula T = e/tc. Supongamos que podemos ingresar al estudio 40 pacientes anuales, entonces, para poder tener los 95 eventos a observar, requerimos al menos 95/40 = 2.4 años de seguimiento (generalmente es un poco mayor, pero la fórmula nos da el valor mínimo). 3.7.4. Estudios para comparar dos curvas de sobrevida Si vamos a comparar dos curvas de supervivencia mediante prueba de logrank, entonces, el número de eventos a observar se calcula de la siguiente manera:
79
E=
(CTR +1) 2 ( K ) C (TR −1) 2
Fórmula 21. Número de eventos que se requiere observar para comparar dos análisis de sobrevida.
En donde: E = número de eventos que se requiere observar en ambos grupos. K = (Zα + Zβ)2 cuyos valores más comunes se encuentran en el cuadro 8. TR = tasa de riesgo = Sm1/Sm2 (frecuencia media de aparición del evento a un tiempo dado en cada grupo.), aunque aquí, la TR = lnπ2/lnπ1, donde π es la proporción del evento que se presenta en un tiempo determinado y ln es el logaritmo natural de cada una de las proporciones. C = relación del número de casos en un grupo y en otro. Supongamos que un médico conoce que en los pacientes con hemoptisis masiva, la recurrencia de la hemoptisis a los seis meses de la embolización de arterias bronquiales con gelfoam es de un 50%, y piensa que utilizando alcohol polivinil puede disminuir dicha recurrencia a un 30%. ¿Cuántos eventos debe observar para tener una confianza del 95% y un poder de su estudio de 80%? K = (Zα + Zβ)2 = 7.9 para un α de 0.05 y poder del 80% en estudio bilateral (cuadro 8). π1 = 0.5, π2 = 0.3 TR = ln π2 / ln π1 = ln 0.30 / ln 0.50 = –1.204 / –0.693 = 1.737. C = relación de sujetos en ambos grupos = 1 (1:1). (CTR + 1)2(K) = (1 x 1.737 +1)2(7.9) (7.491)(7.9) E= = = 1(1.737 – 1)2 0.7372 C(TR – 1)2 59.18 = = 108.9. 0 .543 80
Es decir, se requieren 109 observaciones de eventos, pero como esto es en los dos grupos, es necesario determinar cuántos sujetos por grupo se requieren, para lo cual se utiliza la fórmula 22.
n=
E 2 − (π 1 −π 2 )
Fórmula 22. Número de sujetos a estudiar por grupo en comparación de análisis de sobrevida. Grupos de igual tamaño.
En donde: E = número de eventos a observar, obtenidos con la fórmula previa y π1 - π2 es la diferencia existente entre la proporción de eventos que se presentan del grupo 1 y grupo 2. De manera, que si se planea estudiar ambos grupos del mismo tamaño, entonces tendremos que n = 109 / 2 – (0.5 – 0.3) = 109 / 2 – 0.2 = 109 / 1.8 = 60.6 (61 pacientes por grupo). En la tabla XVIII Se obtienen los valores del tamaño de muestra en forma directa, identificando los valores de π1 y π2 en las primeras dos columnas, en este caso 0.3 y 0.5 y en la columna de alfa 0.05 y poder 80% se encuentran los 60 sujetos necesarios por grupo de estudio. Si se propone que los grupos sean de diferente tamaño, se ajusta la fórmula CE n= {(1−π 1 ) + C (1−π 2 )}2 Fórmula 23. Número de sujetos a estudiar por grupo en comparación de análisis de sobrevida. Grupos de diferente tamaño.
De forma que si se desea una relación 3:1, C = 3. n=
CE
=
(3)(109)
{(1−π 1 ) + C (1−π 2 )}2 {(1− 0.5) + 3(1− 0.3)}2 y 144 en el otro. 81
= 48
sujetos en un grupo
3.8. ESTUDIOS PARA PRUEBAS DIAGNÓSTICAS
En un estudio de prueba diagnóstica, el cálculo del número de sujetos de una muestra deberá hacerse en forma similar a como se calcula una variable dicotómica, en donde los valores de sensibilidad y especificidad se consideran como las proporciones correspondientes de los individuos que tienen la prueba positiva o bien negativa. 3.8.1. Estudio de una prueba diagnóstica Cuando se estudia una prueba diagnóstica para determinar sus valores de sensibilidad y especificidad, el cálculo puede efectuarse mediante la fórmula:
N=
4( Zα ) 2 ( pq) IC 2
Fórmula 24. Tamaño de muestra para estudio de una prueba diagnóstica.
En donde: N = total de sujetos a estudiar. Zα = es la desviación normal estandarizada para el nivel de significación establecido (sus valores pueden encontrarse en el cuadro 4). p = es la proporción esperada, son los valores de sensibilidad o especificidad que se esperan encontrar. q = 1 – p. IC2 = es la amplitud máxima permitida del intervalo de confianza alrededor del cual consideramos que está el verdadero valor de la sensibilidad o especificidad. 82
Por ejemplo, si un investigador desea determinar la sensibilidad de una nueva prueba diagnóstica para cáncer de colon, y basado en un estudio piloto espera que sea al menos de 80%, ¿cuántos sujetos requiere estudiar para estimar la verdadera sensibilidad con un intervalo de confianza de ±5%, o sea, quiere ser capaz de encontrar valores de sensibilidad entre el 75% y 85% (recordar que los valores de sensibilidad y especificidad pueden expresarse como fracciones de la unidad, de manera que en este ejemplo el valor de sensibilidad será 0.8 y el intervalo de confianza será de 0.1 ya que es un 5% hacia cada lado, es decir, 0.05 + 0.05) a un nivel de confianza de 95% (α = 0-05)? N=
4( Zα ) 2 ( pq) 4(1.96) 2 (0.8)(0.2) 4(3.84)(0.8)(0.2) 15.37(0.16) = = = = 245.9 = 246 0.12 0.01 0.01 IC 2
sujetos de estudio. De la misma manera, si se desea determinar la especificidad de otra prueba que se espera sea al menos de un 75% (0.75), a un nivel de confianza del 95% y se acepta una amplitud del intervalo de confianza de ±3% (0.06), es decir, se desea probar que la especificidad de la prueba es 0.75 ± 0.03): N = 4(1.96) =
(15.37)(0.75)(0.25) 2.88 = = 800 0.0036 0.0036
sujetos.
2
(0.75)(0.25) = 0.06 2
Al analizar la tabla XIX ubicamos en la primera columna el nivel de sensibilidad de 0.8 del primer ejemplo y a un alfa 0.05 y poder de 0.8, se coloca en la columna de amplitud aceptada de ±5% (es la columna de ± 0.05) y se localiza el valor de 246 sujetos necesarios. De la misma manera, en el segundo ejemplo se ubica el valor de 0.75 al alfa y poder establecidos, y en la tercer columna de amplitud ±3% (±0.03) se localiza la cantidad requerida de 800 individuos.
83
3.8.2. Estudios para comparar dos pruebas diagnósticas Lo más común es que el investigador compare los resultados de sensibilidad y especificidad de una prueba contra otra, con lo cual requiere de dos grupos de comparación y se utiliza la siguiente fórmula, que además de considerar la amplitud máxima permitida del intervalo de confianza alrededor del cual esperamos que está el verdadero valor de la sensibilidad o especificidad, considera la diferencia entre ambos grupos y la relación de la cantidad de sujetos en ambos grupos como sigue:
{Zα n=
(1+ C )Π (1− Π ) + Zβ (Cp1q1 + p2 q2 ) (C ) IC 2
}
2
Fórmula 25. Tamaño de muestra para un estudio de prueba diagnóstica en dos grupos.
En donde: Zα = desviación normal estandarizada para el nivel de significación establecido. Zβ = desviación normal estandarizada para el nivel de poder establecido (sus valores pueden encontrarse en el cuadro 4). C = relación entre los componentes de ambos grupos (1:1, 1:2, etc.). Π = p1 + p2 /2. p1 = valor de la sensibilidad o especificidad del grupo 1, q1 = 1 – p1 . p2 = valor de la sensibilidad o especificidad del grupo 2, q2 = 1 – p2 . IC = Amplitud del intervalo de confianza aceptado De esta manera, si la sensibilidad de la prueba conocida es de 0.80, y se espera que la sensibilidad de la nueva prueba sea 84
de 0.90, con IC95% 0.85 a 0.95, a un nivel de confianza de 95% y poder de 80%, y tenemos grupos iguales (relación 1:1), tenemos que: Zα = 1.64 (a una cola), Zβ = 0.84 (cuadro 4). Π = 0.80 + 0.90 / 2 = 0.85. p1 = 0.80, q1 = 1 – 0.80 = 0.20. p2 = 0.90, q2 = 1 – 0.90 = 0.10. IC = 0.1.
{Zα n=
n=
{1.64
}
2
(1+ C )Π (1− Π ) + Zβ (Cp1q1 + p2 q2 ) = (C ) IC 2
}
2
(1+1)0.85(0.15) + 0.84 (1)(0.80)(0.20) + (0.90)(0.10) = (1)0.12
= 155.7 sujetos por grupo. En la tabla XX se ubica el valor de la proporción de ambos grupos en las primeras columnas, y la amplitud deseada del intervalo de confianza a dos niveles de significación (0.05 y 0.01) en la hilera superior, y para encontrar el número necesario de sujetos a estudiar por grupo solamente se cruzan los valores deseados, obteniéndose valores iguales a los de la fórmula. Se calculó la tabla para estudios de una cola y poder 80%.
3.9. ESTUDIOS
DE CONCORDANCIA
Los estudios de concordancia son estudios donde lo que se desea estimar es la probabilidad de desacuerdo entre los observadores. El desacuerdo tiene un fuerte componente de variabilidad intra e interobservador, por lo que el cálculo de tamaño de muestra, más que en prueba de hipótesis, se encuentra basado en la precisión de la estimación. Si la probabilidad de desacuerdo entre dos observadores no es muy pequeña, podemos calcular el tamaño de muestra con una fórmula sustentada en el intervalo de confianza que aceptemos como válido de la siguiente manera: 85
N=
4 pd (1− pd )(Zα ) 2 IC 2 d
Fórmula 26. Tamaño de muestra para grado de desacuerdo entre dos observadores.
En donde: Zα = desviación estandarizada del nivel de significación. pd = probabilidad estimada de desacuerdo entre observadores (d/N). ICd = intervalo de confianza que se aceptará del grado de desacuerdo. Se puede observar que la fórmula es sustancialmente la misma que utilizamos para el cálculo de una proporción. Así, si estimamos que el grado de desacuerdo entre dos radiólogos para interpretar placas simples de tórax de pacientes con tuberculosis pulmonar es de aproximadamente 30% y deseamos conocer el dato con una precisión de ±2.5% (esto es un ICd de 0.05), en un estudio a dos colas, con un nivel de significación de 5%, 4 pd (1− pd )(Zα )2 = ¿cuántas observaciones debemos efectuar? N = 2 =
IC d 4(0.3)(0.7)(1.96)2 0.84(3.84) 3.2256 observaciones. = = = 1290 0.052 0.0025 0.0025
Pero si no requerimos ser tan estrictos en nuestra precisión de la estimación y aceptamos un intervalo de confianza de ±5, entonces necesitaríamos sólo 323 observaciones. N=
4 pd (1 − pd )( Z α ) 2 4 ( 0 . 3 )( 0 . 7 )(1 . 96 ) 2 0 . 84 ( 3 . 84 ) 3 . 2256 = = = = IC 2 d 0 .12 0 . 01 0 . 01
= 322.56 = 323 observaciones. En la tabla XXI podemos ubicar en la primera columna el valor de la proporción de discordancia que se estima o se desea poder detectar, y en la hilera superior la amplitud del intervalo de confianza que se acepta y se cruzan los valores al nivel de significación deseado y obtenemos los mismos valores. 86
4. EJERCICIOS
ESTUDIOS DESCRIPTIVOS PARA DETERMINAR UNA PROPORCIÓN
Ejercicio 1. Un investigador desea conocer la proporción de pacientes hipertensos controlados en el postoperatorio inmediato. Determinar el tamaño de muestra necesario para dicho estudio, si de acuerdo con la literatura se conoce que la proporción pudiera encontrarse alrededor de 40%. Si recordamos, en la página 40 encontramos la fórmula para el cálculo de una proporción, que es:
N=
( Zα ) 2 ( p)(q ) δ2
En donde: N = tamaño de la muestra que se requiere. p = proporción de sujetos portadores del fenómeno en estudio. q = 1 – p (complementario, sujetos que no tienen la variable en estudio). δ = precisión o magnitud del error que estamos dispuestos a aceptar.
Zα = distancia de la media del valor de significación propuesto. En este ejemplo, requerimos conocer primero los valores a sustituir en la fórmula: Pacientes controlados (literatura) = 40%, p = 0.4, q = 1 – p = 1 – 0.4 = 0.6. Precisión de la estimación = ±4% (δ = 0.04). Nivel de confianza = 95% (α = 0.05, y de acuerdo con el cuadro 4, Zα a dos colas es = 1.96). De tal forma, N=
( Zα ) 2 ( p )(q ) (1.96) 2 (0.4)(0.6) 3.84(0.24) 0.92 = = = = 575 δ2 0.04 2 0.0016 0.0016
Si buscamos en la tabla I, encontramos: Proporción Nivel de esperada confianza 40%
90% 95% 99%
Variación aceptada de la proporción esperada del fenómeno ±1% ±1.5% ±2% ±3% ±4% 6410 2869 1618 720 406 9053 4064 2294 1022 576 15432 6978 3949 1763 993
Se observa en la penúltima hilera el valor de proporción esperada en 40%, en la quinta columna el valor de variación aceptada en ±4 y cruzando ambos valores en el nivel de confianza de 95% encontramos la cifra de 576 sujetos requeridos. Ejercicio 2. Desde 1990 se describió la asociación entre pielectasias fetales y cromosomopatía por Benacerraf y colaboradores, determinando que el 3.3% (7 de 210) de los fetos con este hallazgo sonográfico portan la trisomía 21 (Benacerraf BR, Mandell J, Estroff JA, Harlow BL, Figoletto FD. Fetal pyelectasis: a posible association with Down syndrome. Obst Gynecol 1990;76:58-60). Desde entonces ha habido estudios con resultados discordantes, sin embargo han sido de muestras muy pequeñas. ¿Cuál número de pacientes sería suficiente para demostrar 88
esta proporción? Establezca β = 0.20 α = 0.05 y una variación esperada del ±4. Ejercicio 3. La obesidad ha llegado a ser una epidemia global, y está en aumento tanto en países industrializados como en los países en desarrollo. En EU, la prevalencia de obesidad y sobrepeso en los niños se ha duplicado en las dos últimas décadas y se estima que cerca de una cuarta parte de los niños tienen alguno de los dos trastornos. Se ha observado que la obesidad en la infancia tiene gran repercusión en la vida adulta, por lo que ya se le reconoce como una prioridad de salud pública (Wang Y. Cross-national comparison of childhood obesity: the epidemic and the relationship between obesity and socioeconomic status. Int J Epidemiol 2001; 30(5):1129-1136). Si se desea realizar un estudio para determinar la proporción de obesidad en la niñez ¿qué tamaño de muestra se requiere si empleamos los datos colectados de encuestas nacionales en los 90’s en EU si queremos un poder del estudio de 80% y un α = 0.05 con una variación esperada de ± 2?
ESTUDIOS DESCRIPTIVOS PARA DETERMINAR UNA MEDIA
Ejercicio 4. Un investigador necesita determinar el valor promedio de la presión sistólica en los pacientes hipertensos mayores de 65 años de edad. Existen reportes que sugieren que el valor promedio es de 155 mm Hg ± 15 mm Hg, ¿qué tamaño de muestra necesita si quiere trabajar con un nivel de confianza de 95% y acepta una precisión en la estimación de ±3 mm Hg? En la página 44 se encuentra la fórmula, que es:
( Zα ) 2 (σ ) 2 N= δ2 89
En donde: N = tamaño de la muestra que se requiere. σ = desviación estándar de la población = 15 mm Hg. δ = precisión o magnitud del error que estamos dispuestos a aceptar = ± 3. Zα = distancia de la media del valor de significación propuesto = 1.96. ( Zα ) 2 (σ ) 2 (1.96) 2 (15) 2 3.84(225) 864 = = = = De tal manera que N = δ2 32 9 9 96 sujetos. Lo anterior se puede corroborar en la tabla 2 en la hilera de la desviación estándar 15 cruzando con la columna de variabilidad aceptada de ±3 a un nivel de confianza de 95%. Desviación estándar Nivel de poblacional confianza 15
90% 95% 99%
±1 609 865 1492
Variación aceptada (amplitud del intervalo) ±1.5 ±2 ±3 271 153 68 385 217 97 664 374 166
±4 39 55 94
Ejercicio 5. Se propone conocer el valor medio de colesterol sérico en una población mayor de 20 años para determinar si es necesario establecer un programa prioritario encaminado a disminuir los niveles de colesterol. Como no existen antecedentes, se efectuó una prueba piloto con 30 sujetos, y se encontró una media de colesterol de 205 ± 10 mg. ¿Cuántos sujetos se requiere estudiar si deseamos tener una precisión de ±1 y un nivel de confianza de 99%? Ejercicio 6. El director de un hospital necesita conocer con una confianza de 95% y precisión de ±2 minutos, el tiempo medio de espera para la atención en el departamento de urgencias. Se estima que el mismo es de 30 ± 15 minutos. ¿Cuántos sujetos de estudio requiere?
90
ESTUDIOS
COMPARATIVOS DE DOS
PROPORCIONES
Ejercicio 7. Se desea comparar la efectividad de dos enfoques terapéuticos para el control metabólico de los pacientes con diabetes mellitus tipo 2. Si se conoce que uno de los esquemas puede mantener control en alrededor de 40% de los pacientes y se estima que el otro pudiera hacerlo en un 50%, ¿cuántos sujetos requiero estudiar para afirmar esta diferencia con una confianza del 95% y un poder del estudio del 80%? Datos: 1. Ha: A > B, Ho: A = B. 2. α = 0.05, Zα = 1.64. 3. β = 0.20 (20%), Poder = 80%, Zβ = 0.842. 4. (Zα + Zβ)2 = 6.2. 5. Porcentaje de éxitos (control metabólico) con un esquema = 40%, P1 = 0.4. 6. Diferencia que se desea detectar. ¿A partir de qué porcentaje de éxitos con el segundo esquema se considera que éste es mejor? = 50%, P2 = 0.5. Ejercicio 8. Es conocido que el embarazo gemelar es un factor de riesgo para parto pretérmino (>40% de los gemelos nacen antes de las 37 semanas de gestación). En estos casos, los corticoesteroides aplicados prenatalmente reducen la tasa de mortalidad, la tasa de Síndrome de dificultad respiratoria (SDR), y la de hemorragia interventricular de los recién nacidos pretérmino (Murphy, DJ. Caukwell S. Joels LA. Wardle P. Cohort study of the neonatal outcome of twin pregnancies that were treated with prophylactic or rescue antenatal corticosteroids. Am J Obstet Gynecol 2002;187:483-8.). Se quiere comparar un esquema de aplicación profiláctico de corticoesteroides (cada 2 semanas a partir de la 27 a la 34 semana de embarazo) contra un esquema de rescate (sólo cuando existe amenaza de parto pretérmino). Si 91
se conoce que se reporta SDR en el 20% de los embarazos gemelares sin tratamiento profiláctico y se espera una diferencia de 15% con el manejo profiláctico, ¿cuál es el tamaño de muestra necesario para un nivel de confianza del 95% (α = 0.05) y poder de 80% (β = 0.20)? Ejercicio 9. El tabaquismo es un factor de riesgo conocido para presentar un evento vascular cerebral (EVC) y para enfermedad isquémica cardiaca. Dejar de fumar es muy recomendable después de sufrir un hemorragia cerebral para reducir el riesgo de infarto al miocardio y una hemorragia cerebral recurrente, pero poco es conocido acerca de como los pacientes modifican sus hábitos de fumar después de un EVC. Estudios basados en la comunidad indican un riesgo acumulado de EVC recurrente del 13% en el primer año. Además, entre los supervivientes al primer año después del primer EVC41% de todas las muertes son debidas a enfermedad cardiovascular (Bak S, Sindrup SH, Alslev T, Kristensen O, Christensen K, Gaist D. Cessation of Smoking After First-Ever Stroke: A Follow-Up Study. Stroke 2002; 33(9): 2263-2269). Se desea analizar la diferencia en la mortalidad en los pacientes que dejan de fumar y los que no lo hacen posterior a un EVC, suponiendo una proporción de muertes al primer año de los que no dejan de fumar de 40% y de 10% en los que dejan de fumar. ¿Qué tamaño de muestra se requiere si deseamos un nivel de confianza del 95% y poder del estudio del 80%?
ESTUDIOS
COMPARATIVOS
DE DOS MEDIAS
Ejercicio 10. Es conocido que los betabloqueadores y calcioantagonistas disminuyen la frecuencia cardiaca de los pacientes con hipertensión arterial. Un médico desea conocer las diferen92
cias de dicha disminución con metoprolol y nifedipina ya que por observación piensa que la primera produce mayor disminución de la frecuencia cardiaca que la nifedipina en pacientes con hipertensión arterial. Los reportes en la literatura no son consistentes, pero indican disminución con metoprolol de 20 latidos por minuto ± 10 y se espera que con la nifedipina la disminución sea al menos 10 latidos menor. ¿Cuántos sujetos requiere estudiar si desea una confianza de 95% y poder del estudio del 90%? Datos: 1. Hipótesis: Unilateral: Ha A>B, Ho A≤B. 2. Confianza 95%, Error α = 5% (0.05) y Zα = 1.645. 3. Error β 10% (0.10), poder = 90% (0.90) y Zβ = 1.282. 4. Magnitud mínima importante de la diferencia (μ1 – μ2) = 10 mm Hg. 5. Variabilidad: σ = 25 latidos / min. 6. K = (Zα + Zβ)2 = (1.645 + 1.282)2 = 8.6. Ejercicio 11. Se ha mencionado que los niveles de triglicéridos en sangre en pacientes con síndrome dismetabólico en tratamiento a base de dieta y ejercicio se mantienen en promedio en cifras de 250 ± 25. Si consideramos que al agregar un hipolipemiante podemos reducir estos valores a 225, ¿qué tamaño de muestra se requiere estudiar para tener una confianza de 95% y poder 80%? Ejercicio 12. En el mismo ejemplo anterior, si quisiéramos ser más estrictos en la determinación y buscamos una confianza de 99% y poder de 90%, ¿cuántos sujetos de estudios requerimos?
ESTUDIOS DE EQUIVALENCIA DE PROPORCIONES
Ejercicio 13. Un médico piensa que el uso de una cefalosporina de segunda generación en el manejo de la erisipela 93
de miembros inferiores, tiene una proporción de curaciones similar a la que tiene la dicloxacilina. Para comprobar esto, planea un estudio con una proporción conocida de éxitos de dicloxacilina de 90%. Aceptará como equivalente a la cefalosporina de segunda generación si esta produce el mismo porcentaje de curación ±2.5%. ¿Cuántos sujetos requiere estudiar para tener una confianza de 95% y poder de 80%? Ejercicio 14. 70% de los pacientes con artritis reumatoide tienen mejoría ostensible de la rigidez matutina con el uso de un antiinflamatorio no esteroideo. Si suponemos que un inhibidor de ciclooxigenasa 2 tiene efectos similares con un margen de ±5, que número de pacientes requerimos estudiar si queremos afirmar que ambos medicamentos son equivalentes con una confianza del 98% y poder de 90%?
ESTUDIOS DE EQUIVALENCIA DE MEDIAS
Ejercicio 15. La disminución de peso lograda con un régimen dietético en un grupo de pacientes con obesidad se encuentra en 15 Kg ± 5 Kg. Suponemos que un nuevo régimen dietético puede lograr resultados similares y aceptaremos una variabilidad de 1 Kg para considerarlos equivalentes. ¿Cuántos sujetos tengo que estudiar si deseo una confianza del 95% y poder de 80%? Ejercicio 16. La aplicación de un tipo de insulina regular en pacientes con descontrol metabólico en salas de urgencias produce una disminución de las cifras de la glucosa sanguínea en 120 ± 25 mg/dl. Se menciona que otro tipo de insulina puede producir una disminución similar con menores efectos de rebote, por lo que deseamos probar su equivalencia, aceptando una variabilidad de hasta ± 4 mg/dl. ¿Cuántos sujetos se requieren para una confianza en estudio bilateral de 98% y poder 90%? 94
ESTUDIOS
QUE BUSCAN CORRELACIÓN
DE VARIABLES
Ejercicio 17. Un investigador desea saber si los niveles de hemoglobina glucosilada correlacionan con las cifras de colesterol sérico en los pacientes con diabetes mellitus tipo 2. Reportes previos han referido niveles de correlación variables, por lo que diseña un estudio en el que quiere ser capaz de detectar dicha correlación en niveles al menos de 0.35 con una confianza de 99% y poder de 90%. ¿Cuántos sujetos requiere estudiar? Ejercicio 18. En el ejemplo anterior, el investigador detectó una correlación de 0.30, pero duda que sus datos puedan tener diferencia de acuerdo con el tiempo de evolución de la enfermedad, así que decide efectuar la diferenciación en dos grupos, aquellos con evolución menor a 5 años y los que tienen evolución mayor, con la idea que este último grupo tiene una mayor correlación de hemoglobina glucosilada con cifras de colesterol sérico. Quiere ser capaz de detectar una diferencia al menos de 0.1 en el coeficiente de correlación, con una confianza de 95% y poder de 80%. ¿Cuántos sujetos requiere estudiar por grupo?
ESTUDIOS
DE CASOS Y CONTROLES
Ejercicio 19. Los niños con pesos menores a 1,500 Kg al nacimiento y que sobreviven tienen cientos de veces más probabilidades de padecer una discapacitante parálisis cerebral (PC) que los niños del grupo de 3,000 a 3,500 Kg de peso al nacer. Con la supervivencia que se logra actualmente, los recién nacidos de muy bajo peso al nacer contribuyen con más niños discapacitados que en épocas anteriores, tanto en porcentaje del total de PC como en la probabilidad en números absolutos (Grether JK. Nelson K B. Emery ES. Cummins SK. Prenatal and perina95
tal factors and cerebral palsy in very low birth weight infants The Journal of Pediatrics 1996;128(3): 407-414). Se desea efectuar un estudio de casos y controles, enfocado principalmente a identificar los marcadores tempranos del proceso patogénico que contribuye al riesgo de PC entre los recién nacidos de muy bajo peso al nacer (menos de 1,500 kg). Dado que en el tiempo a estudiar sólo se presentaron 42 casos de PC, ¿qué podría hacer el autor para incrementar el poder de su estudio? Ejercicio 20. Para el enunciado anterior, si se sabe que la prevalencia de muy bajo peso al nacer (menos de 1,500 Kg) en la población general es de 5% y existe una razón de momios de 6.3 de padecer PC si el bebé nació de muy bajo peso en un primer nivel de atención, ¿qué tamaño de muestra se requiere si deseamos un poder de 80% y una confianza de 95% (α = 0.05)? Ejercicio 21. Los estudios previos de encefalopatía hipóxica isquémica se han centrado casi exclusivamente en las causas intraparto, aunque estas permanecen no aclaradas. La ruptura prematura de membranas es una de estas condiciones. Se conoce que la proporción de casos de ruptura de membranas >12 Hrs. se presenta en el 20% de los niños que presentan este tipo de encefalopatía y en 11% de los controles (Badawi N. Kurinczuk JJ. Keogh JM. Alessandri LM. O’Sullivan F. Burton PR. Pemberton PJ. Stanley FJ. Intrapartum risk factors for newborn encephalopathy: the Western Australian case-control study. British Medical Journal 1998;317(7172):1554-1558). Se desea realizar un estudio casos y controles no apareado con un poder de 80% y un nivel de significación de 5%. ¿Cuántos casos y cuántos controles se requiere estudiar? Ejercicio 22. Para el ejemplo anterior, si se tuvieran solamente 170 casos colectados, ¿qué opciones tiene el investigador? Ejercicio 23. En el caso del ejemplo 21, si el investigador tiene la necesidad de aparear los controles por edad gestacional, 96
para eliminar loa influencia de esta variable, ¿cómo se modifica su tamaño de la muestra? Ejercicio 24. Se conoce que la presencia de defectos cardiacos fetales en los recién nacidos de madres que han utilizado estrógenos (anticonceptivos periconcepcionales) es mayor que en quienes no los han utilizado y se desea demostrar esta asociación. Se estima que el 30% de las mujeres en edad reproductiva se encuentran expuestas a estos compuestos por lo que se planea un estudio de casos y controles apareándolo por edad materna, que se piensa puede ser un factor de confusión, y se quiere ser capaz de demostrar una razón de momios de 3, con una confianza de 95% y poder de 80%. ¿Cuántos sujetos se necesitan estudiar? Ejercicio 25. Si en el ejemplo anterior, en lugar de parear por edad materna, se analiza mediante regresión logística con ajuste por edad y número de hijos, ¿cuántos sujetos de estudio se requieren? Ejercicio 26. y si además de estudiar la asociación del uso de estrógenos, se quiere evaluar el efecto de la edad y número de hijos, no como factores de confusión a controlar, sino como posibles factores causales, y se estima que el coeficiente de correlación entre estos es de aproximadamente 0.3, ¿cuántos sujetos de estudios se requieren?
ENSAYOS
CLÍNICOS
Ejercicio 27. En recientes trabajos de investigación se ha examinado la asociación entre el uso combinado de estrógenos y progesterona en la terapia de reemplazo hormonal (TRH) y el riesgo de cáncer de mama (ACOG Committee Opinion No.262. Risk of Breast Cancer with Estrogen-progestin replacement therapy. Dec 2001). Se estima que el 80% de las mujeres usuarias 97
de TRH seleccionan el régimen combinado y continuo. Basados en los resultados del estudio de Schairer (JAMA 2000) el riesgo de cáncer de mama en el período de vida de una mujer es del 10% y con el uso de estrógenos incrementa, después de 5 años de uso, del 10 al 15%. Si se desea demostrar la existencia de este incremento en el riesgo, en un estudio experimental (ensayo clínico aleatorio) ¿qué tamaño de muestra se requiere, estableciendo un nivel de significación (α) de 0.01 y poder del 80%? En este ejemplo se plantea la Ho: P1 = P2 y la Ha: P1 < P2, se propone un α de 0.01, β = 0.20, la p1 = 0.10, y p2 = 0.15. Ejercicio 28. Un investigador propone que el uso de un nuevo fibrato permite el control de un 20% más de pacientes que con las medidas convencionales, las que obtienen un 60% de pacientes controlados, por lo que aleatoriamente forma dos grupos, uno que recibirá el nuevo medicamento y otro que recibirá el manejo convencional. La maniobra terapéutica será cegada tanto al paciente como al investigador. ¿Cuántos sujetos requiere estudiar para tener una confianza de 99% de que la diferencia propuesta es real y un poder de 80% en su estudio? Ejercicio 29. Si el mismo estudio se propone tomando en cuenta que el colesterol medio con el manejo habitual se encuentra en 210 ± 33 mg/100 ml y con el nuevo tratamiento puede mantenerse en una media de 190 ± 33 mg. ¿Cuántos sujetos requiere estudiar para lograr un nivel de confianza de 99% y poder de 90%? Ejercicio 30. En un ensayo clínico fase II se espera que los sujetos que utilizan un nuevo inhibidor de la calcineurina desde el primer día post trasplante renal, presenten una proporción de rechazo al injerto renal al año del 10%, siendo que el manejo convencional tiene una proporción de rechazos al año de 20%. ¿Cuántos sujetos requiero por grupo para probar la hipótesis de que el nuevo inhibidor de calcineurina permite un porcentaje menor de rechazos, con una significación de 1% y poder de 80%? 98
Ejercicio 31. Es conocido el valor de las estrategias educativas encaminadas a lograr un mejor control metabólico de los pacientes con diabetes mellitus. Un investigador propone que las técnicas de automonitoreo con glucometría digital además del uso de información adecuada en el marco de estrategias participativas y de motivación específicas, permitirá incrementar sustancialmente la proporción de pacientes controlados. Si se toma un grupo de pacientes con diabetes mellitus tipo 2 de los que el 30% se encuentran controlados, y se espera que la estrategia incremente esta proporción a un 60%, con una beneficio relativo de 3, ¿cuántos sujetos se requiere estudiar para lograr una confianza de 95% y poder de 80%?
ESTUDIOS DE COHORTE. DETERMINACIÓN DE REACCIONES ADVERSAS
Ejercicio 32. Se conoce que la cefalea es un efecto secundario que se presenta hasta en un 10% de los sujetos que utilizan vasodilatadores para el manejo crónico de la cardiopatía isquémica. Si se desea efectuar un estudio de eficacia y seguridad con un nuevo vasodilatador, con el cual se reporta cefalea como efecto secundario solamente en el 5% de los sujetos que lo utilizan, ¿cuántos sujetos requerimos estudiar para tener una confianza del 95% y poder de 80% en nuestro estudio? Ejercicio 33. Se conoce que el uso de algunos antimicrobianos produce colitis seudomembranosa en uno de cada 1,000 sujetos. ¿Cuántos sujetos se deberán estudiar para poder afirmar que un nuevo antimicrobiano no incrementa el número de sujetos con esta complicación arriba de esta proporción de 1 × 1,000, con una confianza del 95% y poder del estudio de 80%? Ejercicio 34. Si en el ejemplo anterior, desconocemos la verdadera frecuencia, pero suponemos que puede ser alrededor 99
de 5 casos de cada 1,000 usuarios de antimicrobianos, ¿cuántos sujetos se requiere estudiar si se aceptará el nuevo antimicrobiano sólo si la proporción adicional de la incidencia de colitis seudomembranosa no sobrepasa 1 de cada 1,000 casos?
ESTUDIOS DE COHORTE. ANÁLISIS DE SOBREVIDA
Ejercicio 35. Muchas mujeres ancianas residentes de casahogar tienen osteoporosis y se pueden beneficiar de una intervención para incrementar la densidad ósea. Se realizo un estudio para probar la eficacia y seguridad del aleandronato para el tratamiento de la osteoporosis en ancianas de casa-hogar. Se realizó un seguimiento por 2 años, doble ciego, aleatorizado y multicéntrico y placebo controlado. Al final del período se midió densidad ósea de columna y cadera así como marcadores de formación de hueso. Los autores comentan que no calcularon el tamaño de muestra para el número de fracturas. Se encontraron 10% de fracturas del grupo de aleandronato y 20% de fracturas en el grupo de placebo. ¿Si los autores captaron en su estudio 327 pacientes, distribuidos en dos grupos iguales, el tamaño de muestra fue adecuado para analizar su hipótesis a una significación de 0.05 y poder del estudio a 90%? Ejercicio 36. Se piensa que el uso de un nuevo sistema cerrado para efectuar diálisis peritoneal ambulatoria continua permitirá disminuir el número y frecuencia de presentación de eventos de peritonitis, por lo cual se propone un estudio que permita demostrarlo. Para ello, se sugiere tomar una cohorte abierta de pacientes a los cuales se seguirán por un período de dos años para determinar el número de eventos de peritonitis con el sistema propuesto, comparándolo contra un grupo testigo que llevará el método tradicional. Si sabemos que con el método habi100
tual la frecuencia de presentación de cuadros de peritonitis es de 30% por año. ¿Cuántos sujetos se requiere estudiar para tener una confianza de 95% y poder del estudio de 80% para poder detectar una diferencia con el método tradicional al menos de 10%? Ejercicio 37. En un estudio de una cohorte, se pretende determinar el tiempo de presentación de neuropatía visceral en un grupo de pacientes con diabetes mellitus 2 sometidos a una estrategia especial de control metabólico. Se piensa que los sujetos con diabetes mellitus presentan esta complicación a los 5 años de tener la enfermedad. ¿Cuántos sujetos requerimos estudiar, si consideramos que en el grupo que lleva la estrategia de control metabólico, la presencia de la complicación en estudio (neuropatía visceral) pudiera prolongarse hasta 8 años? Calcular con un poder del estudio de 80% y nivel de significación de 0.05.
ESTUDIOS DE PRUEBA DIAGNÓSTICA Ejercicio 38. Un investigador desea determinar si la verdadera sensibilidad de una prueba sanguínea rápida por punción capilar para determinación de colesterol es de 85% ± 5% con una amplitud máxima de variación permitida de 5%. ¿Cuántos sujetos requiere para probarlo? Ejercicio 39. Se desea conocer si el verdadero valor de la especificidad de la prueba del aliento para determinar el estado de portador de Helicobacter pilory, es de 91 ± 5. ¿Cuántos sujetos se requiere estudiar para determinarlo con una confianza del 95%. Ejercicio 40. La sensibilidad de un marcador convencional para detectar recurrencias por cáncer de mama es de 85%. Se ha desarrollado un nuevo marcador y de acuerdo con resultados de un estudio piloto, se considera que la sensibilidad de este nue101
vo marcador es de 92%. Con una confianza del 95% se desea probar que el verdadero valor de esta nueva prueba se encuentre entre 87 y 97%. El poder se establece en 80%. Ejercicio 41. Se sabe que la sensibilidad de una prueba convencional para diagnosticar hepatitis C es de un 80%. Se desea determinar con un 95% de confianza si la sensibilidad de una nueva prueba para el diagnóstico de esta enfermedad es de al menos 85 ± 0.02. Se establece un poder de 80. ¿Cuál es el tamaño de la muestra requerida para probar lo anterior?
ESTUDIOS
DE CONCORDANCIA
Ejercicio 42. Un director de hospital se encuentra con interés de conocer el verdadero grado de desacuerdo entre dos patólogos de su unidad, ya que se comenta que difieren en sus diagnósticos hasta en un 30% de los casos. ¿Cuántos pares de observaciones se tienen que estudiar, si desea tener una precisión de ±2.5% en su estimación con una confianza de 95%? Ejercicio 43. Es conocido que el grado de acuerdo entre los cardiólogos de mayor experiencia en el hospital en la interpretación de los resultados de las pruebas de esfuerzo es de 90% y se considera que los cardiólogos con menor tiempo de ejercicio de su especialidad pudieran tener un grado de acuerdo menor, probablemente 80%, por lo que se diseña un estudio para conocer el grado de concordancia de los cardiólogos nuevos. ¿Cuántas observaciones requerimos estudiar si queremos una precisión de la estimación de ±5% con un nivel de significación del 5%? Ejercicio 44. Se ha estudiado que el acuerdo entre médicos intensivistas en la interpretación de radiografías para el diagnóstico de síndrome de insuficiencia respiratoria progresiva del adulto es cercana al 90% cuando estos tienen un entrenamiento formal y disminuye hasta cercano al 70% cuando al menos uno 102
de los elementos estudiados no lo tiene (Am J Resp Crit Care Med 2000;161(1):85). Si el jefe de la Unidad de Cuidados Intensivos de un Hospital General, quiere repetir el estudio para precisar el grado de acuerdo entre ellos, ¿cuántos observaciones requiere estudiar si tomamos en cuenta que sus médicos son internistas que no tienen entrenamiento previo en terapia intensiva y desea efectuar la estimación con precisión del 10% y confianza del 95%? Ejercicio 45. Para determinar el grado de acuerdo entre médicos pediatras de un departamento de urgencias y radiólogos, en el diagnóstico de normalidad o anormalidad en placas de tórax de niños que acuden a dicho departamento, un investigador desarrolló un estudio con 324 radiografías, encontrando un grado de desacuerdo cercano al 10%. Si se deseaba una precisión de 5% y confianza de 99%, ¿el número estudiado fue suficiente? De no ser así, ¿cuántas placas se hubieran requerido observar?
103
Apéndice A
TABLAS
Tabla I. Tamaño de la muestra para un estudio que busca encontrar una proporción en la población Proporción esperada
Nivel de confianza
5%
90% 95% 99% 90% 95% 99% 90% 95% 99% 90% 95% 99% 90% 95% 99% 90% 95% 99% 90% 95% 99% 90% 95% 99% 90% 95% 99%
10%
15%
20%
25%
30%
35%
40%
50%
±1%
1282 1818 3132 2423 3434 5901 3426 4850 8319 4292 6072 10395 5022 7100 12138 5618 7939 13556 6080 8589 14652 6410 9053 15432 6674 9423 16055
±1.5% 571 810 1397 1080 1572 2640 1528 2167 3732 1917 2717 4674 2244 3181 5469 2512 3560 6117 2721 3854 6620 2869 4064 6978 2988 4232 7265
Variación aceptada de la proporción esperada del fenómeno ±3% ±4% ±5% ±6% ±8% ±10% ±2%
321 456 787 608 863 1488 861 1221 2106 1080 1532 2640 1265 1794 3091 1416 2009 3459 1534 2175 3745 1618 2294 3949 1685 2389 4113
143 203 350 270 384 663 383 544 938 481 682 1177 563 799 1378 630 895 1543 683 969 1672 720 1022 1763 750 1065 1836
80 114 196 152 216 373 216 306 528 270 384 663 317 450 776 355 504 869 384 546 942 406 576 993 422 600 1035
51 73 126 97 138 239 138 196 338 173 246 424 203 288 497 227 322 557 246 349 603 260 369 636 270 384 663
------68 96 166 96 136 235 120 171 295 141 200 345 158 224 387 171 243 416 180 256 442 188 267 460
------38 54 93 54 77 132 68 96 166 79 113 194 89 126 218 96 137 236 101 144 249 106 150 259
------24 35 60 34 49 85 43 61 106 51 72 124 57 81 139 62 87 151 65 92 159 68 96 166
±12% ------------24 34 59 30 43 74 35 50 86 39 56 97 43 61 105 45 64 111 47 67 115
±15% ------------15 22 38 19 27 47 23 32 55 25 36 62 27 39 67 29 41 71 30 43 74
Para encontrar el tamaño de la muestra, se cruza el valor de la proporción que se espera encontrar de la variable de interés en la población, con la variación que se acepta de dicha proporción, en el renglón del nivel de confianza deseado. La tabla se encuentra calculada a dos colas con poder de 80%.
Tabla II. Tamaño de la muestra para un estudio que busca encontrar una media en la población Desviación Nivel de estándar poblacional confianza 2
5
7
10
15
20
30
40
50
90% 95% 99% 90% 95% 99% 90% 95% 99% 90% 95% 99% 90% 95% 99% 90% 95% 99% 90% 95% 99% 90% 95% 99% 90% 95% 99%
±1
11 16 27 68 97 166 133 189 325 271 385 664 609 865 1492 1082 1537 2652 2432 3453 5959 4317 6130 10579 6734 9561 16501
±1.5
5 7 12 31 43 74 59 85 145 121 171 295 271 385 664 482 683 1179 1082 1537 2652 1923 2730 4711 3001 4261 7354
±2
3 4 7 17 25 42 34 48 82 68 97 166 153 217 374 271 385 664 609 865 1492 1082 1537 2652 1690 2399 4141
Variación aceptada (amplitud del intervalo) ±3 ±4 ±5 ±6 ±8
2 2 3 8 11 19 15 21 37 31 43 74 68 97 166 121 171 295 271 385 664 482 683 1179 752 1067 1842
1 1 2 5 7 11 9 12 21 17 25 42 39 55 94 68 97 166 153 217 374 271 385 664 423 691 1037
1 1 2 3 4 7 6 8 14 11 16 27 25 35 60 44 62 107 98 139 239 174 246 425 271 385 664
------2 3 5 4 6 10 8 11 19 8 11 19 31 43 74 69 97 166 125 171 295 188 267 461
------2 2 3 3 3 6 5 7 11 10 14 24 17 25 42 39 55 94 68 97 166 106 151 260
±10
------1 1 2 2 2 4 3 4 7 7 9 15 11 16 27 25 35 60 42 62 107 68 97 166
±12
------------1 2 3 2 3 5 5 7 11 8 11 19 17 25 42 31 43 74 47 67 116
±15 ------------1 1 2 2 2 3 3 4 7 5 7 12 11 16 27 20 28 48 31 43 74
Para encontrar el tamaño de la muestra, se cruza el valor de la desviación estándar de la población, con la variación que se acepta, en el renglón del nivel de confianza deseado. La tabla se encuentra calculada a dos colas con poder de 80%.
Tabla III. Tamaño de la muestra para un estudio que busca comparar dos proporciones Proporción menor (p1 o p2) 0.05
0.10
0.15
0.20
0.30
0.40
0.50
0.60
0.70
Nivel de confianza Una Dos cola colas 95% 90% 97.5% 95% 99.5% 99% 95% 90% 97.5% 95% 99.5% 99% 95% 90% 97.5% 95% 99.5% 99% 95% 90% 97.5% 95% 99.5% 99% 95% 90% 97.5% 95% 99.5% 99% 95% 90% 97.5% 95% 99.5% 99% 95% 90% 97.5% 95% 99.5% 99% 95% 90% 97.5% 95% 99.5% 99% 95% 90% 97.5% 95% 99.5% 99%
Diferencia esperada entre p1 y p2 0.05 342 434 646 539 685 1021 712 904 1346 860 1092 1628 1083 1376 2048 1206 1533 2281 1232 1564 2328 1158 1470 2188 985 1250 1862
0.10 110 140 208 156 198 297 197 249 372 231 293 436 280 356 530 305 387 576 305 387 576 280 355 530 231 293 437
0.15 59 75 112 78 100 148 95 120 180 108 137 206 128 162 242 136 173 257 133 170 253 119 152 227 95 120 180
0.20 38 48 72 48 61 92 57 73 108 64 81 121 74 93 139 76 96 145 73 93 138 64 81 122 48 62 92
0.25 27 36 52 33 42 63 39 48 74 42 54 80 47 61 90 48 61 92 45 58 86 38 49 74 27 36 53
0.30 21 27 40 24 31 48 28 36 54 30 39 58 33 42 63 33 42 62 30 39 58 25 31 48 -------
0.35 17 22 32 19 24 37 22 27 41 23 29 44 24 31 47 24 30 46 21 27 41 17 21 33 -------
0.40 13 18 26 16 19 29 16 22 32 17 23 34 18 24 36 17 23 34 16 19 30 -------------
0.45 11 16 22 12 16 24 14 17 26 14 18 26 14 19 28 13 17 25 11 15 22 -------------
0.50 9 12 19 10 14 20 11 14 21 11 15 22 12 14 22 10 14 20 -------------------
0.55 8 10 16 9 11 16 9 12 18 10 13 18 9 11 18 7 11 16 -------------------
Para encontrar el tamaño de la muestra, ubicar en la tabla el valor de p menor (p1 o p2) y cruzar contra el valor de la diferencia de proporción esperada entre ambas. La tabla se encuentra calculada a dos colas con poder de 80%.
Tabla IV. Tamaño de la muestra para un estudio que busca comparar dos medias μ1 – μ2 /σ 0.05
0.10
0.15
0.20
0.30
0.40
0.50
Nivel de confianza Bilateral Unilateral 80% 90% 95% 98% 80% 90% 95% 98% 80% 90% 95% 98% 80% 90% 95% 98% 80% 90% 95% 98% 80% 90% 95% 98% 80% 90% 95% 98%
90% 95% 97.5% 99% 90% 95% 97.5% 99% 90% 95% 97.5% 99% 90% 95% 97.5% 99% 90% 95% 97.5% 99% 90% 95% 97.5% 99% 90% 95% 97.5% 99%
Poder del estudio 70% 80% 90% 2612 3766 4938 6504 652 942 1237 1628 292 419 551 724 163 237 310 409 73 106 139 182 42 60 79 103 27 39 51 67
36078 4948 6282 8031 903 1237 1572 2009 403 553 699 895 227 311 394 506 101 139 176 225 57 78 100 127 37 52 65 82
5258 6851 8408 10416 1317 1715 2104 2607 587 763 937 1159 329 428 527 654 149 192 236 292 84 109 133 166 54 70 87 108
μ1 – μ2 /σ 0.60
0.70
0.80
0.90
1.00
1.10
1.20
Nivel de confianza Bilateral Unilateral 80% 90% 95% 98% 80% 90% 95% 98% 80% 90% 95% 98% 80% 90% 95% 98% 80% 90% 95% 98% 80% 90% 95% 98% 80% 90% 95% 98%
90% 95% 97.5% 99% 90% 95% 97.5% 99% 90% 95% 97.5% 99% 90% 95% 97.5% 99% 90% 95% 97.5% 99% 90% 95% 97.5% 99% 90% 95% 97.5% 99%
Poder del estudio 70% 80% 90% 20 28 37 48 15 20 28 36 12 17 22 27 9 14 18 23 7 9 12 18 7 9 12 16 5 8 10 14
27 37 46 59 19 27 34 43 16 21 26 34 13 17 22 27 9 13 16 21 9 12 15 18 8 11 13 16
37 49 61 74 28 37 45 56 22 28 35 44 18 22 28 34 13 17 19 25 12 15 19 24 11 13 16 21
Para encontrar el tamaño de la muestra, ubicar en la tabla el valor de la diferencia de medias que se espera entre la desviación estándar (σ) y cruzar contra el valor del poder del estudio que se desea. La tabla presupone desviación estándar igual en ambos grupos.
Tabla V. Tamaño de muestra en estudios de equivalencia de proporciones α Unilateral α Bilateral Poder p ε 0.10 0.20 0.30 0.40 0.50 0.60 0.70 0.80 0.90
0.05 0.10 0.05 0.10 0.05 0.10 0.05 0.10 0.05 0.10 0.05 0.10 0.05 0.10 0.05 0.10 0.05 0.10
0.01 0.02
0.025 0.05
0.05 0.10
0.10 0.20
70
80
90
70
80
90
70
80
90
70
80
90
584 146 1036 259 1360 340 1555 389 1623 404 1555 389 1360 340 1036 259 584 146
720 180 1280 320 1680 420 1920 480 2004 499 1920 480 1680 420 1280 320 720 180
936 234 1664 416 2184 546 2496 624 2600 647 2496 624 2184 546 1664 416 936 234
446 111 794 198 1041 260 1190 298 1232 307 1190 298 1041 260 794 198 446 111
568 142 1011 255 1327 332 1516 379 1568 390 1516 379 1327 332 1011 255 568 142
756 189 1344 336 1764 441 2016 504 2099 523 2016 504 1764 441 1344 336 756 189
338 85 601 150 790 197 902 226 940 234 902 226 790 197 601 150 338 85
446 111 794 198 1041 260 1190 298 1235 308 1190 298 1041 260 794 198 446 111
619 155 1100 275 1445 361 1651 412 1711 426 1651 412 1445 361 1100 275 619 155
230 56 409 102 538 134 615 154 652 162 615 154 538 134 409 102 230 56
324 81 576 144 756 189 864 216 901 225 864 216 756 189 576 144 324 81
475 120 845 211 1109 277 1267 317 1313 327 1267 317 1109 277 845 211 475 120
Para encontrar el tamaño de muestra, buscar en la columna del nivel de significación y poder deseados en el estudio, cruzando con la fila que contenga el valor de la proporción del fenómeno en estudio (p) y la diferencia máxima permitida entre ambos grupos para considerarlos equivalentes (ε). La tabla proporciona el número de sujetos que se requieren en cada grupo.
Tabla VI. Tamaño de muestra en estudios de equivalencia de medias α Unilateral α Bilateral Poder σ ε 3 5 7
10
15
20
25
30
1 1 2 1 2 3 1 2 3 1 3 5 1 3 5 7 1 3 5 8 2 5 7 10
0.01 0.02
0.025 0.05
0.05 0.10
0.10 0.20
70
80
90
70
80
90
70
80
90
70
80
90
145 405 101 794 199 88 1620 405 180 3645 405 146 6480 720 359 132 10125 1125 405 158 3645 583 298 146
180 500 125 980 245 109 2000 500 222 4500 500 180 8000 889 320 163 12500 1389 500 195 4500 720 367 180
234 650 163 1274 318 142 2600 650 289 5850 650 234 10400 1156 416 212 16250 1806 650 254 5850 936 478 234
112 310 78 608 152 68 1240 310 138 2790 310 112 4960 551 198 101 7750 861 310 121 2790 446 228 112
142 395 99 774 194 86 1580 395 176 3555 395 142 6320 702 253 129 9875 1097 395 154 3555 569 290 142
189 525 131 1029 257 114 2100 525 233 4725 525 189 8400 933 336 171 13125 1458 526 205 4725 756 386 189
85 235 59 460 115 51 940 235 104 2115 235 85 3760 418 150 77 5875 653 235 92 2115 338 173 85
112 310 78 608 152 68 1240 310 138 2790 310 112 4960 551 198 101 7750 861 310 121 2790 446 228 112
155 430 108 843 211 94 1720 430 191 3870 430 155 6880 764 275 140 10750 1194 430 168 3870 619 316 155
58 160 40 314 78 35 640 160 71 1440 160 58 2560 284 102 52 4000 444 160 63 1440 230 118 58
81 225 56 441 110 49 900 225 100 2025 225 81 3600 400 144 73 5635 625 225 88 2025 324 165 81
119 330 83 647 162 72 1320 330 147 2970 330 119 5280 587 211 108 8250 917 330 129 2970 475 242 119
Para encontrar el tamaño de muestra, buscar en la columna del nivel de significación y poder deseados en el estudio, cruzando con la fila que contenga el valor de la desviación estándar del fenómeno en estudio (σ) y la diferencia máxima permitida entre ambos grupos para considerarlos equivalentes (ε). La tabla proporciona el número de sujetos que se requieren en cada grupo.
Tabla VII. Tamaño de muestra para estudios de correlación simple α Unilateral α Bilateral Poder r 0.05 0.10 0.15 0.20 0.25 0.30 0.35 0.40 0.45 0.50 0.55 0.60 0.65 0.70 0.75 0.80 0.85 0.90 0.95
0.01 0.02
0.025 0.05
0.05 0.10
70
80
90
70
80
90
70
80
90
3248 810 358 200 127 88 64 48 37 30 24 20 16 14 12 10 8 7 5
4010 990 442 246 156 107 78 59 46 36 29 24 20 16 14 11 9 8 6
5201 1296 572 319 202 139 120 75 58 46 37 30 25 20 17 14 11 9 7
2467 616 273 154 98 68 49 38 29 24 19 16 13 11 10 8 7 6 5
3137 782 348 195 124 85 62 47 37 29 24 19 16 14 11 10 8 7 5
4198 1046 462 258 164 113 82 62 48 38 30 25 20 17 14 12 10 8 6
1882 470 209 117 75 52 38 29 23 19 15 13 11 9 8 7 6 5 4
2471 617 273 154 98 68 49 38 29 24 19 16 13 11 10 8 7 6 5
3422 853 377 212 135 93 67 53 40 32 25 21 17 14 12 10 8 7 6
Para determinar el tamaño de muestra, es necesario ubicar en las columnas el nivel de significación y poder del estudio que requiere y cruzar con la fila donde se encuentre el valor de la correlación que se espera encontrar en el estudio.
Tabla VIII. Tamaño de muestra para comparación de dos correlaciones α Unilateral α Bilateral Poder r1 r2 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 0.2
0.3
0.01 0.02
0.025 0.050
0.05 0.10
80
90
80
90
80
90
956 232 99 53 31 20 13 8
1242 300 127 67 40 25 16 10
756 183 79 42 25 16 13 7
1004 243 103 55 33 21 14 9
594 145 62 34 21 13 9 6
823 700 85 46 27 18 12 8
0.3 0.4 0.5 0.6 0.7 0.8 0.9
880 208 86 45 18 15 9
1143 269 111 57 23 19 11
696 165 69 36 15 13 8
923 218 90 47 19 16 10
547 130 55 29 12 11 7
757 179 75 39 16 14 8
0.4 0.5 0.6 0.7 0.8 0.9
771 177 71 35 19 10
1001 229 91 45 24 13
610 140 57 28 16 9
809 186 74 37 20 11
479 111 42 23 13 8
663 153 58 31 17 9
α Unilateral α Bilateral Poder r1 r2 0.4 0.5 0.6 0.7 0.8 0.9
0.01 0.02
0.025 0.050
0.05 0.10
80
90
80
90
80
90
636 141 54 25 12
826 182 69 32 15
503 112 43 20 10
668 148 56 26 13
396 88 34 17 9
548 121 47 22 11
0.5
0.6 0.7 0.8 0.9
486 102 36 15
631 132 46 18
385 81 29 12
510 107 38 15
303 64 24 10
419 88 32 13
0.6
0.7 0.8 0.9
343 64 19
432 82 24
263 51 16
349 67 20
207 41 13
286 55 17
0.7
0.8 0.9
190 30
246 39
151 25
199 32
119 20
164 27
0.8
0.9
75
96
60
78
47
65
Para determinar el tamaño de muestra, ubique la columna con el nivel de significación y poder deseados para su estudio y cruce con la fila en donde se encuentre la correlación esperada en cada uno de los grupos.
Tabla IX. Tamaño de muestra para estudios de casos y controles no pareados
Proporción de Proporción expuestos en de expuestos controles en casos
5%
10%
15%
20%
10% 12% 15% 20% 25% 30% 40% 50% 15% 20% 25% 30% 35% 40% 50% 20% 25% 30% 35% 40% 50% 60% 25% 30% 35% 40% 50% 60% 70%
Razón de momios (odds ratio) a detectarse
2.11 2.59 3.35 4.75 6.33 8.14 12.67 19.00 1.59 2.25 3.00 3.86 4.85 6.00 9.00 1.42 1.89 2.43 3.05 3.78 5.67 8.50 1.33 1.71 2.15 2.67 4.00 6.00 9.33
Relación control/caso 1:1 Confianza 90% Poder (1-β β) 80 90
381 223 129 72 48 35 22 15 579 176 91 58 41 31 20 753 216 108 67 46 26 17 901 250 121 74 37 22 15
620 298 172 94 62 45 28 19 787 236 121 76 54 40 25 1027 292 144 88 60 34 22 1232 339 163 98 48 29 19
Relación control/ caso 1:1 Confianza 95% Poder (1-β β) 80 90
Relación control /caso 1:1 Confianza 99% Poder (1-β β) 80 90
474 276 159 88 58 43 27 18 725 219 112 71 50 38 24 945 270 133 82 57 32 21 1133 313 151 91 45 37 18
686 606 228 125 83 88 53 26 1060 316 161 102 71 54 34 1387 392 193 118 81 46 30 1668 456 219 131 64 38 25
620 359 207 113 75 54 33 23 957 286 146 92 64 48 30 1251 354 174 106 73 41 26 1503 412 197 118 57 34 22
863 498 285 155 102 74 45 31 1339 397 202 126 88 66 41 1756 493 241 147 100 56 36 2113 575 274 164 79 47 31
Relación Relación Relación control/caso 2:1 control/caso 3:1 control/caso 4:1 Confianza 95% Confianza 95% Confianza 95% Poder (1-β β ) 80% Poder (1-β β ) 80% Poder (1-β β ) 80% Control Caso Control Caso Control Caso
682 394 226 124 82 60 36 26 1062 316 162 102 72 54 34 1396 394 194 118 82 46 30 1682 460 222 132 66 40 26
341 197 113 62 41 30 18 13 531 158 81 51 36 27 17 698 197 97 59 41 23 15 841 230 111 66 33 20 13
888 510 291 156 102 75 45 33 1401 411 210 132 93 69 45 1848 519 252 156 105 60 39 2229 609 291 174 84 51 33
296 170 97 52 34 25 15 11 467 137 70 44 31 23 15 616 173 84 52 35 20 13 743 203 970 58 28 17 11
1092 624 352 192 124 88 56 40 1736 508 256 160 112 84 52 2296 640 312 192 128 72 48 2780 756 360 216 104 64 40
273 156 88 48 31 22 14 10 434 127 64 40 28 21 13 574 160 78 48 32 18 12 695 189 90 54 26 16 10
Para encontrar el tamaño de muestra requerido, ubique las columnas con la proporción de la exposición en los casos y en los controles (o la proporción de exposición en los controles y la razón de momios a detectarse) y cruce con la columna de poder y nivel de significación que se haya propuesto.
Tabla IX. Tamaño de muestra para estudios de casos y controles no pareados (continuación)
Proporción de expuestos en controles
Proporción de expuestos en casos
Razón de momios (odds ratio) a detectarse
25%
30% 35% 40% 45% 55% 65% 75% 35% 40% 45% 50% 60% 70% 80% 40% 45% 50% 55% 65% 75% 85% 45% 50% 55% 60% 70% 80% 90%
1.29 1.62 2.00 2.45 3.67 5.57 9.00 1.26 1.56 1.91 2.33 3.50 5.44 9.33 1.24 1.52 1.86 2.27 3.45 5.57 10.52 1.23 1.50 1.83 2.25 3.50 6.00 13.50
30%
35%
40%
Relación control/caso 1:1 Confianza 90% Poder (1-β β) 80 90
Relación control/caso 1:1 Confianza 95% Poder (1-β β) 80 90
Relación control/caso 1:1 Confianza 99% Poder (1-β β) 80 90
1025 278 133 79 38 23 15 1124 300 141 83 39 23 15 1198 315 146 85 40 23 14 1247 325 149 86 39 22 14
1290 348 165 98 47 28 18 1416 376 175 103 48 28 18 1510 395 182 106 49 28 18 1573 407 186 107 48 27 17
1901 509 239 141 67 39 26 2088 550 255 149 69 40 25 2228 579 265 153 70 39 22 2322 597 271 154 69 38 24
1404 378 178 105 50 29 19 1541 408 190 111 52 30 19 1644 429 197 114 52 29 18 1712 442 201 115 52 29 17
1714 459 216 127 60 35 23 1882 496 230 134 62 36 22 2008 522 239 138 63 35 22 2092 538 244 139 62 34 21
2411 642 301 177 83 48 31 2649 694 321 186 86 49 31 2827 732 334 192 87 48 30 2946 754 341 193 86 47 28
Relación Relación Relación control/caso 2:1 control/caso 3:1 control/caso 4:1 Confianza 95% Confianza 95% Confianza 95% Poder (1-β β ) 80% Poder (1-β β ) 80% Poder (1-β β ) 80% Control Caso Control Caso Control Caso
1920 516 244 144 70 40 26 2112 558 260 152 72 42 26 2258 590 272 158 72 42 26 2354 608 278 160 72 40 26
960 258 122 72 35 20 13 1056 279 130 76 36 21 13 1129 295 136 76 36 21 13 1177 304 139 80 36 20 13
2550 681 321 189 90 54 36 2808 741 345 201 93 54 36 3003 783 360 207 96 54 36 3135 810 369 213 96 54 33
850 227 107 63 30 18 12 936 247 115 67 31 18 12 1001 261 120 69 32 18 12 1045 270 123 71 32 18 11
3180 848 400 236 112 68 44 3504 924 428 248 116 68 44 3748 976 448 260 120 68 44 3916 1012 460 264 120 68 40
795 212 100 59 28 17 11 876 341 107 62 29 17 11 937 244 112 65 30 17 11 979 253 115 66 30 17 10
Para encontrar el tamaño de muestra requerido, ubique las columnas con la proporción de la exposición en los casos y en los controles (o la proporción de exposición en los controles y la razón de momios a detectarse) y cruce con la columna de poder y nivel de significación que se haya propuesto.
Tabla IX. Tamaño de muestra para estudios de casos y controles no pareados (continuación)
Proporción de expuestos en controles
Proporción de expuestos en casos
Razón de momios (odds ratio) a detectarse
45%
50% 55% 60% 65% 75% 85% 95% 55% 60% 65% 70% 80% 90% 95% 60% 65% 70% 75% 80% 90% 95% 65% 70% 75% 80% 85% 90% 95%
1.22 1.49 1.83 2.27 3.67 6.93 11.00 1.22 1.50 1.86 2.33 4.00 9.00 19.00 1.23 1.52 1.91 2.45 3.27 7.36 15.55 1.24 1.56 2.00 2.67 3.78 6.00 12.67
50%
55%
60%
Relación control/caso 1:1 Confianza 90% Poder (1-β β) 80 90
Relación control/caso 1:1 Confianza 95% Poder (1-β β) 80 90
Relación control/caso 1:1 Confianza 99% Poder (1-β β) 80 90
1272 328 149 85 38 21 16 1272 325 146 83 37 20 15 1247 315 141 79 50 24 18 1198 300 133 74 46 31 22
1604 411 186 106 47 26 20 1604 407 182 103 45 24 18 1573 395 175 98 62 40 22 1510 376 165 91 57 38 27
2368 602 271 153 67 37 28 2368 597 265 149 64 34 26 2322 579 255 141 88 42 31 2238 550 239 131 81 54 37
1746 446 201 114 50 27 16 1746 442 197 111 48 25 19 1712 429 190 105 66 31 23 1644 408 178 98 60 46 28
2134 543 244 138 60 33 25 2134 538 239 134 57 30 23 2092 522 230 127 79 38 27 2008 496 216 118 73 48 33
3006 761 341 192 83 45 26 3006 754 334 186 79 41 31 2946 732 321 177 110 51 37 2527 694 301 164 100 66 45
Relación Relación Relación control/caso 2:1 control/caso 3:1 control/caso 4:1 Confianza 95% Confianza 95% Confianza 95% Poder (1-β β ) 80% Poder (1-β β) 80% Poder (1-β β ) 80% Control Caso Control Caso Control Caso
2404 616 278 158 72 40 30 2408 612 274 156 68 38 28 2364 596 266 148 94 46 34 2272 568 250 138 88 58 42
1202 308 139 79 36 20 15 1204 306 137 78 34 19 14 1182 298 133 74 47 23 17 1136 284 125 69 44 29 21
3204 422 372 213 96 51 42 3210 816 366 207 90 48 39 3153 795 354 198 126 63 45 3036 759 336 186 117 78 54
1068 274 124 71 32 17 14 1070 272 122 69 30 16 13 1051 265 110 66 42 21 15 1012 253 112 62 39 26 18
4004 1024 464 264 120 64 52 4012 1020 460 260 116 60 48 3944 996 444 248 156 76 56 3796 952 420 232 148 100 68
1001 256 126 66 30 16 13 1003 255 115 65 29 15 12 986 249 111 62 39 19 14 949 238 105 58 37 25 17
Para encontrar el tamaño de muestra requerido, ubique las columnas con la proporción de la exposición en los casos y en los controles (o la proporción de exposición en los controles y la razón de momios a detectarse) y cruce con la columna de poder y nivel de significación que se haya propuesto.
Tabla X. Tamaño de muestra para estudios de casos y controles pareados Proporción Significación α de controles 1.25 expuestos Poder (1-β β) 0.01 0.05 8934 6007 5% 80% 11378 8025 90% 4774 3210 10% 80% 6080 4288 90% 3411 2293 15% 80% 4344 3064 90% 2751 1850 20% 80% 3503 2471 90% 2146 1443 30% 80% 2733 1928 90% 1921 1292 40% 80% 2447 1726 90% 1886 1268 50% 80% 2402 1694 90% 2009 1351 60% 80% 2558 1804 90% 2346 1577 70% 80% 2987 2107 90% 3144 2114 80% 80% 4004 2824 90% 5705 3836 90% 80% 7266 5124 90%
1.5 0.01 2504 3168 1354 1713 979 1238 798 1010 636 804 580 734 580 734 629 796 746 941 1016 1285 1869 1251
0.05 1675 2236 906 1209 655 874 534 713 425 568 388 518 388 518 421 562 499 666 680 907 2366 1670
Razón de momios (Odds Ratio) que quiere detectarse 1.75 2 2.25 0.01 0.05 0.01 0.05 0.01 0.05 1232 827 759 509 524 352 1459 1097 951 671 661 462 674 452 420 282 293 197 847 600 526 371 370 258 492 330 310 208 218 147 619 438 388 274 276 193 406 272 258 173 183 123 510 361 323 228 231 162 329 221 213 143 154 103 414 293 267 188 194 135 306 205 201 135 147 99 385 272 251 177 185 129 310 208 206 138 152 102 390 276 258 182 192 134 341 229 229 154 171 115 429 304 287 203 216 151 410 275 278 187 209 141 515 365 349 246 264 185 564 379 387 259 293 197 710 502 484 342 370 258 1049 704 725 486 553 371 1320 934 908 641 698 487
2.5 0.01 395 492 223 278 168 209 142 177 121 150 117 145 122 152 138 172 171 212 240 299 456 567
2.75 0.05 266 343 150 194 113 146 96 124 81 105 79 101 82 106 93 120 115 148 162 209 306 396
0.01 312 391 178 223 135 169 115 144 99 124 97 121 102 128 117 146 145 181 204 256 390 489
0.05 208 269 119 154 90 117 77 99 66 86 65 84 68 88 78 101 97 125 136 144 260 336
Para ubicar el tamaño de muestra, cruzar la columna con la proporción de controles expuestos en el nivel de poder deseado y en la fila de significación y razón de momios que se espera poder detectar.
Tabla X. Tamaño de muestra para estudios de casos y controles pareados (continuación)
117
Proporción Significación de α controles Poder (1-β β) expuestos 5% 80% 90% 10% 80% 90% 15% 80% 90% 20% 80% 90% 30% 80% 90% 40% 80% 90% 50% 80% 90% 60% 80% 90% 70% 80% 90% 80% 80% 90% 90% 80% 90%
3
Razón de momios (Odds Ratio) que quiere detectarse 4 4.5 5
3.5
6
8
0.01
0.05
0.01
0.05
0.01
0.05
0.01
0.05
0.01
0.05
0.01
0.05
0.01
0.05
255 319 147 184 113 141 97 121 84 105 83 104 88 110 101 127 126 158 179 224 343 428
168 220 97 127 74 97 64 84 56 73 55 72 58 76 67 88 83 109 118 155 226 296
185 227 109 133 84 104 73 90 65 80 65 80 70 86 82 100 102 126 146 96 281 346
122 158 71 93 56 72 48 63 43 56 43 56 46 60 54 70 67 88 180 126 185 241
146 180 87 107 69 85 60 74 55 67 55 68 60 74 70 87 89 110 128 158 247 305
97 122 58 73 46 57 40 50 37 46 37 46 40 50 47 59 60 74 86 107 165 206
117 144 71 88 57 70 51 62 47 57 48 59 52 64 62 76 78 96 113 139 218 269
77 99 47 60 37 48 33 43 31 40 31 40 34 44 40 52 57 66 74 96 143 185
102 123 63 76 51 61 45 55 42 51 44 53 48 58 57 69 73 88 106 127 205 248
68 85 42 52 34 42 30 38 28 35 29 37 32 40 38 48 49 61 71 88 137 171
76 91 48 58 40 48 36 43 35 41 36 43 40 48 48 58 62 74 90 108 175 210
49 61 31 39 26 32 24 29 23 28 24 29 26 32 31 39 40 49 59 72 114 140
51 60 34 40 29 34 27 32 27 32 29 34 32 38 39 46 50 60 74 88 145 172
35 42 24 20 20 24 19 22 19 22 20 23 22 26 27 32 35 41 51 60 100 118
Para ubicar el tamaño de muestra, cruzar la columna con la proporción de controles expuestos en el nivel de poder deseado y en la fila de significación y razón de momios que se espera poder detectar.
Tabla XI. Tamaño de muestra para regresión logística
0.05
0.01
0.05
Razón de momios que se desea detectar 1.4 1.5 1.8 0.01 0.05 0.01 0.05 0.01 0.05 0.01
18978 9675 5024 3473 2697 2232 1922 1701 1535 1405 1302 992 837 744
30961 15784 8196 5666 4401 3642 3136 2775 2504 2293 2124 1619 1365 1214
9237 4706 2444 1689 1312 1086 935 827 747 684 633 483 407 362
15173 7660 3977 2750 2135 1767 1522 1346 1215 1112 1031 785 662 589
1.1 α p 0.01 0.02 0.04 0.06 0.08 0.10 0.12 0.14 0.16 0.18 0.20 0.30 0.40 0.50
0.05 69167 35261 18309 12658 9832 8137 7007 6199 5594 5123 4746 3616 3051 2712
1.2 0.01 112958 57586 29900 20672 16058 13289 11443 10125 9136 8367 7752 5906 4983 4429
1.3
5648 2879 1495 1033 803 664 572 506 457 418 388 295 249 221
9189 4685 2432 1681 1306 1081 931 824 743 680 630 480 405 392
3890 2002 1039 718 558 462 398 352 317 290 269 205 173 154
6371 3248 1686 1166 905 749 645 571 515 472 437 333 281 249
1927 982 510 353 274 227 195 173 156 143 136 101 85 76
3111 1586 824 569 442 366 315 278 252 230 213 163 137 122
2
2.5
3
0.05
0.01
0.05
0.01
0.05
0.01
1420 724 375 260 201 167 144 127 115 105 97 78 63 56
2280 1162 603 417 324 268 231 204 184 169 156 119 100 89
1304 443 230 159 124 102 88 78 70 64 60 45 38 34
1376 701 364 252 196 162 139 123 111 102 94 72 61 54
651 332 172 119 93 77 66 58 53 48 45 34 29 26
1014 517 268 186 144 119 103 91 82 75 70 53 45 39
Ubicar en la tabla el valor de la frecuencia esperada del fenómeno (p) al valor medio conocido de la covariable en estudio y cruzar con la columna que contenga el valor de la razón de momios que se desea detectar al nivel de significación α que se desea. La tabla se encuentra calculada a una cola.
Tabla XII. Tamaño de la muestra para ensayos clínicos de fase II Proporción menor (p1 o p2) 0.05
0.10
0.15
0.20
0.30
0.40
0.50
0.60
0.70
Nivel de confianza 90% 95% 99% 90% 95% 99% 90% 95% 99% 90% 95% 99% 90% 95% 99% 90% 95% 99% 90% 95% 99% 90% 95% 99% 90% 95% 99%
Diferencia esperada entre p1 y p2 0.05 114 150 231 188 253 399 253 342 430 308 419 671 392 534 862 439 600 972 449 483 1001 424 583 950 363 501 819
0.10 33 44 66 53 69 108 68 91 143 81 109 174 100 136 219 110 151 244 111 153 249 103 142 233 86 119 197
0.15 17 22 32 25 33 51 32 43 66 38 50 79 45 62 98 49 67 108 49 67 109 44 61 101 36 50 84
0.20 11 14 19 15 20 30 19 25 38 22 29 46 26 35 56 28 38 61 27 37 60 24 33 55 18 26 44
0.25 8 9 13 10 13 20 13 16 25 14 19 30 17 22 36 17 24 37 17 23 38 14 20 34 10 15 25
0.30 6 7 10 8 10 14 9 12 18 10 13 21 12 16 25 12 16 26 11 15 25 9 13 22 -------
0.35 4 5 7 6 7 11 7 9 13 8 10 15 8 11 18 8 12 15 8 11 18 6 8 15 -------
0.40 4 4 5 5 6 8 5 7 10 6 8 12 6 9 14 6 9 14 5 8 13 -------------
0.45 3 3 5 4 5 7 4 5 8 5 6 9 5 7 11 5 7 11 4 5 9 -------------
0.50 2 3 3 3 4 5 3 4 7 4 5 7 4 5 8 4 5 8 -------------------
0.55 2 2 3 3 3 4 3 4 5 3 4 6 3 4 7 3 4 6 -------------------
Para encontrar el tamaño de la muestra, ubicar en la tabla el valor de p menor (p1 o p2) y cruzar contra el valor de la diferencia de proporción esperada entre ambas. La tabla se encuentra calculada a dos colas con poder de 80%.
Tabla XIII. Tamaño de muestra para estudios cuya medición se efectúa en escala ordinal Razón de momios 1.25 1.50 1.75 2.00 2.50 3.00 3-50 4.00 5.00 10.00
0.50 458 139 73 47 27 19 15 12 9 4
0.60 589 403 94 61 35 24 19 15 11 6
0.65 663 201 105 69 39 27 21 17 12 6
0.70 744 225 118 77 44 31 24 19 14 7
Poder (1 – β) 0.75 0.80 837 952 254 288 133 151 87 98 49 56 35 39 26 30 22 25 16 18 8 9
0.85 1082 328 172 112 64 45 34 28 21 12
0.90 1265 383 201 131 75 52 40 33 24 12
0.95 1566 474 249 162 93 65 50 41 30 15
Los valores de la tabla corresponden al cálculo de 6K/(log RM)2 y es bastante aproximado al tamaño de muestra requerido. El ajuste se efectúa al dividir el número de la tabla entre el denominador de la fórmula. Valores de RM < 1 se calculan buscando en la tabla el valor 1/RM. 6 K /(log RM ) 2 Recordar que la fórmula para calcular el tamaño de muestra es: n = k 1− ∑πi 3 i =1 En donde: K = (Zα+ Zβ)2 cuyos valores encontramos en el cuadro 8. log RM = logaritmo natural de la razón de momios. k
1-∑ ∑ πi3 = 1 menos la sumatoria de las proporciones de cada casilla elevado al cubo.
i=1
Tabla XIV. Tamaño de muestra para ensayos clínicos con grupos pareados en escala de medición ordinal o continua α Unilateral α Bilateral Poder ? 0.05 0.10 0.15 0.20 0.25 0.30 0.35 0.40 0.45 0.50 0.55 0.60 0.65 0.70 0.75 0.80 0.85 0.90 0.95 1.00
70
0.01 0.02 80
90
70
3243 813 363 205 132 93 69 53 43 35 29 25 22 19 17 15 14 13 12 11
4003 1003 449 253 163 114 84 65 52 43 36 30 26 23 20 18 17 15 14 13
5203 1303 580 328 211 147 109 84 67 55 46 39 33 29 26 23 21 19 17 16
2482 622 277 157 101 71 53 41 33 27 22 19 17 15 13 12 11 10 9 8
0.025 0.050 80 3162 792 353 199 128 90 66 51 41 34 28 24 21 18 16 14 13 12 11 10
90
70
0.05 0.10 80
4202 1052 468 264 170 119 88 68 54 44 37 31 27 23 21 18 16 15 14 12
1881 471 210 118 77 54 40 31 25 20 17 14 12 11 10 9 8 7 7 6
2481 621 276 156 101 70 52 40 32 26 22 19 16 14 12 11 10 9 8 8
90 3441 861 383 216 139 97 72 55 44 36 30 25 22 19 17 15 13 12 11 10
Para determinar el tamaño de muestra, es necesario ubicar en las columnas el nivel de significación y poder del estudio que requiere y cruzar con la fila donde se encuentre el valor de la diferencia (∆) que se espera encontrar entre ambos grupos.
Tabla XV. Tamaño de muestra para búsqueda de reacciones adversas con antecedente conocido α Unilateral
.05
.025
.01
α Bilateral
.10
.05
.02
Poder p 0.1
δ 0.1
70
80
90
70
80
90
70
80
90
60
90
120
80
100
150
100
130
180
0.05 0.01
210 4900
290 6400
420 9000
250 6300
360 8100
500 11000
360 8300
460 11000
610 14000
0.005 0.001 0.05
20000 330000 120
26000 630000 170
36000 850000 240
25000 480000 150
32000 790000 200
42000 1060000 290
33000 620000 190
38000 1020000 250
52000 1300000 350
0.01 0.005
2500 9700
3300 13000
4700 18000
3300 13000
4200 17000
5700 22000
4300 17000
5300 210000
7000 27000
0.001 0.0005
24000 95000
320000 1250000
440000 1730000
310000 1240000
400000 1580000
53000 2110000
410000 1630000
510000 2020000
650000 2620000
0.01
570
810
1200
730
1000
1500
950
1100
1800
0.005 0.001
2100 49000
2900 64000
4200 90000
2800 63000
3600 81000
5000 110000
3600 83000
4600 110000
6100 140000
0.005
0.0005 0.005 0.001
200000 1200 25000
260000 1700 33000
360000 2400 47000
250000 1500 33000
320000 2000 42000
430000 2900 58000
330000 1900 43000
410000 2500 53000
530000 3500 70000
0.001
0.0005 0.001 0.0005
97000 5700 21000
130000 8100 29000
180000 12000 42000
130000 7300 28000
170000 10000 36000
220000 15000 50000
170000 9500 36000
210000 13000 46000
270000 18000 61000
0.05
0.01
Buscar en la columna p, la frecuencia conocida del fenómeno en estudio, en la columna δ la proporción adicional de incidencia del evento producido por el fármaco y localizar en la columna correspondiente al nivel de significación y poder deseados, el tamaño de muestra requerido.
Tabla XVI. Tamaño de muestra para búsqueda de reacciones adversas sin antecedente de incidencia conocido α Unilateral α Bilateral
.05 .10
Poder p 0.1
δ 0.1 0.05
70
80
.025 .05 90
70
80
.01 .02 90
70
80
90
120
260
220
160
200
270
210
260
330
420
540
750
540
690
920
720
880
1200
0.01
8900
12000
17000
12000
15000
20000
16000
19000
25000
0.005 0.001 0.05
35000 860000 270
46000 1120000 350
64000 1550000 480
46666 1120000 350
58000 1420000 440
78888 1900000 590
60000 1470000 460
74000 1820000 560
96000 2360000 750
0.01 0.005
4900 19000
6500 25000
9000 35000
6500 25000
8200 32000
11000 42000
8500 33000
11000 40000
14000 52000
0.001 0.0005 0.01
460000 1800000 1400
600000 2370000 1900
830000 3270000 2600
600000 2360000 900
760000 3000000 240
1010000 4120000 3200
780000 3110000 2500
970000 3840000 3000
1250000 4970000 3900
0.005 0.001
4700 98000
6200 130000
85000 180000
61000 130000
7800 170000
11000 220000
8100 170000
10000 210000
13000 280000
0.005
0.0005 0.005 0.001
390000 2900 52000
510000 3700 68000
700000 5100 94000
510000 3700 68000
640000 4700 86000
860000 6300 120000
660000 4900 89000
820000 6000 110000
1060000 7800 150000
0.001
0.0005 0.001 0.0005
200000 15000 47000
260000 19000 62000
360000 26000 86000
260000 19000 62000
330000 24000 79000
440000 32000 110000
340000 25000 82000
420000 31000 110000
550000 39000 140000
0.05
0.01
Buscar en la columna p, la frecuencia supuesta del fenómeno en estudio, en la columna δ la proporción adicional de incidencia del evento producido por el fármaco y localizar en la columna correspondiente al nivel de significación y poder deseados, el tamaño de muestra requerido.
Tabla XVII. Número de eventos a observar en un análisis de sobrevida α Unilateral α Bilateral Poder Tasa de riesgo 1.10 1.15 1.20
.01 .02
.025 .05
.05 .10
70
80
90
70
80
90
70
80
90
1783 829 487
2201 1023 602
2862 1331 782
1365 635 373
1739 809 475
2311 1075 632
1034 481 283
1365 635 373
1893 880 520
1.25 1.30
325 235
402 291
522 378
249 180
317 230
422 305
189 137
249 180
345 250
1.35
180
222
289
138
175
233
104
138
191
1.40
143
177
230
110
136
185
83
110
152
1.45 1.50
117 98
145 121
188 157
90 75
114 96
152 127
68 57
90 75
124 104
1.60 1.70
73 58
91 71
118 92
56 44
72 56
95 75
43 33
56 44
78 61
1.80 1.90
47 39
58 49
75 63
36 30
46 38
61 51
27 23
36 30
50 42
2.00
34
42
54
26
33
44
20
26
36
Localizar la tasa de riesgo esperada y cruzar contra la columna donde se encuentre en nivel de significación y poder deseados del estudio. La tasa de riesgo es la relación existente entre el tiempo medio de aparición del evento (supervivencia) reportado o conocido en la población (Sm1) y el tiempo medio de aparición del evento (supervivencia) que esperamos en nuestro grupo de estudio (Sm2). Cuando el valor obtenido es menor que la unidad (en el ejemplo del libro se obtiene una tasa de 0.666), dividir 1 / la TR obtenida para buscar en tablas (en el ejemplo será 1 / 0.666 = 1.5).
Tabla XVIII. Tamaño de muestra para comparación de dos curvas de supervivencia α Unilateral α Bilateral Poder π1 π2 0.05 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 0.1
0.2
0.01 0.02
0.025 0.050
0.05 0.10
80
90
80
90
80
90
295 59 31 21 17 14 12 11 10
383 78 41 28 22 16 16 14 12
236 47 25 17 13 11 9 9 8
310 62 33 22 17 14 13 11 10
183 37 19 13 10 9 7 7 6
254 51 27 18 14 12 10 9 8
0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9
167 57 32 22 16 13 11 10
217 74 63 28 21 17 15 13
132 45 25 17 13 11 9 8
176 59 33 23 17 14 12 10
104 35 20 13 10 8 7 6
145 63 27 19 14 11 10 8
0.3 0.4 0.5 0.6 0.7 0.8 0.9
253 74 37 23 16 12 10
329 96 48 30 21 16 13
200 58 29 18 13 10 8
266 77 39 24 17 13 10
157 46 23 14 10 8 6
218 63 32 20 14 11 9
α Unilateral α Bilateral Poder π1 π2 0.3 0.4 0.5 0.6 0.7 0.8 0.9
0.01 0.02
0.025 0.050
0.05 0.10
80
90
80
90
80
90
286 77 36 21 14 10
371 100 47 28 18 13
226 60 28 17 11 8
300 80 38 22 15 11
177 48 22 13 9 6
246 66 31 18 12 8
0.4
0.5 0.6 0.7 0.8 0.9
274 69 30 17 11
356 89 40 22 14
210 54 24 13 8
287 72 32 18 11
170 43 19 10 7
235 59 26 15 9
0.5
0.6 0.7 0.8 0.9
230 54 22 12
298 70 29 15
181 43 18 9
241 57 23 12
142 34 14 7
197 47 19 10
0.6
0.7 0.8 0.9
167 36 15
217 47 18
132 29 11
175 38 14
103 22 8
143 31 12
0.7
0.8 0.9
99 19
129 24
78 15
104 20
62 12
85 16
0.8
0.9
41
53
32
43
25
35
Para determinar el tamaño de muestra, ubique en la columna el nivel de significación y poder deseados para su estudio y cruce con la fila en donde se encuentre la frecuencia de presentación del evento en estudio a un tiempo dado en ambos grupos.
Tabla XIX . Tamaño de muestra para estudios de prueba diagnóstica Nivel de Sensibilidad o especificidad confianza (1-α) Una Dos cola colas 95 90 0.5 97.5 95 95 90 0.55 97.5 95 95 90 0.60 97.5 95 95 90 0.65 97.5 95 95 90 0.70 97.5 95 95 90 0.75 97.5 95 95 90 0.80 97.5 95 95 90 0.85 97.5 95 95 90 0.90 97.5 95 95 90 0.95 97.5 95
Variación aceptada de la proporción esperada del fenómeno ±0.01
±0.02
±0.03
±0.04
±0.05
±0.06
±0.07
±0.08
±0.09
±0.10
±0.15
6724 9604 6590 9412 6450 9220 6117 8740 5647 8067 5043 7202 4302 6147 3430 4897 2420 3457 1277 1825
1681 2401 1647 2353 1612 2305 1529 2185 1412 2017 1260 1800 1075 1536 857 1224 605 864 319 456
747 1067 732 1045 717 1024 680 971 627 896 560 800 478 683 381 544 269 384 142 202
420 600 411 588 403 576 382 546 353 504 315 451 269 384 214 306 151 216 80 114
269 384 263 376 258 369 244 350 226 323 202 288 172 246 137 196 97 138 51 73
187 267 183 261 179 256 170 243 157 224 140 200 119 171 95 136 67 96 35 51
137 196 134 192 131 188 125 178 115 165 103 147 88 125 70 100 49 70 26 37
105 150 102 147 101 144 95 136 88 126 79 112 67 96 53 76 38 54 20 28
83 119 81 116 80 114 75 108 70 99 62 89 53 76 42 60 30 43 16 22
67 96 66 94 64 92 61 87 56 80 50 72 43 61 34 49 24 34 13 18
30 43 29 42 28 41 27 39 25 36 22 32 19 27 15 22 12 15 6 8
Para determinar el tamaño de muestra, buscar el nivel de sensibilidad o especificidad que se espera obtener con la prueba y cruzar con la variación aceptada del intervalo de confianza en el nivel de confianza correspondiente.
Tabla XX. Tamaño de muestra para comparación de dos pruebas diagnósticas
1-α
0.02 0.05 0.01
S1 S2 0.50 0.55 0.60 0.65 0.70 0.75 0.80 0.85 0.90 0.95
7762 7585 7456 7275 7042 6757 6419 6026 5578
11743 11631 11443 11179 10840 10425 9932 9360 8708
0.55 0.60 0.65 0.70 0.75 0.80 0.85 0.90 0.95
7508 7354 7148 6891 6581 6219 5803 5332
11507 11277 10971 10590 10133 9600 8988 8297
0.60 0.65 0.70 0.75 0.80 0.85 0.90 0.95
7200 11036 6969 10688 6687 10265 6352 9766 5966 9190 5526 8538 5033 7808
Amplitud del intervalo de confianza aceptado 0.04 0.06 0.08 0.10 0.02 0.05 0.01 0.05 0.01 0.05 0.01 0.05 0.01 0.05 0.01 S1 S2 1915 2935 851 1304 478 733 306 469 0.65 0.70 6739 10329 1896 2907 842 1292 474 726 303 465 0.75 6431 9863 1864 2860 828 1271 466 715 298 457 0.80 6072 9322 1818 2794 808 1242 454 698 291 447 0.85 5660 8705 1760 2710 782 1204 440 677 281 433 0.90 5197 8012 1689 2606 750 1158 422 651 270 417 0.95 4680 7241 1604 2483 713 1103 401 620 256 397 1506 2340 669 1040 376 585 241 374 0.70 0.75 6124 9387 1394 2177 619 967 348 544 223 348 0.80 5739 8803 0.85 5303 8144 1877 2876 834 1278 469 719 300 460 0.90 4815 7409 1838 2819 817 1253 459 704 294 451 0.95 4273 6597 1787 2742 794 1219 446 685 285 438 1722 2647 765 1176 430 661 275 423 0.75 0.80 5355 8209 1645 2533 731 1125 411 633 263 405 0.85 4894 7507 1554 2400 691 1066 388 600 248 384 0.90 4380 6730 1450 2247 644 998 362 561 232 359 0.95 3815 5877 1333 2074 592 921 333 518 213 331 0.80 0.85 4433 6795 1800 2759 800 1226 450 689 288 441 0.90 3894 5976 1742 2672 774 1187 435 668 278 427 0.95 3304 5081 1671 2566 743 1140 417 641 267 410 1588 2441 705 1085 397 610 254 390 0.85 0.90 3356 5146 1491 2297 662 1021 372 574 238 367 0.95 2741 4208 1381 2134 614 948 345 533 221 341 1258 2952 559 867 314 488 201 312 0.90 0.95 2126 3261
0.04 0.06 0.08 0.10 0.05 0.01 0.05 0.01 0.05 0.01 0.05 0.01 1684 1607 1518 1415 1299 1170
2582 2465 2330 2176 2003 1810
748 1147 421 645 714 1095 401 616 674 1035 379 582 628 967 353 544 577 890 324 500 520 804 292 452
269 257 242 226 207 187
413 394 372 348 320 289
1531 1434 1325 1203 1068
2346 2200 2036 1852 1649
680 1043 382 586 637 978 358 550 589 904 331 509 535 823 300 463 474 733 267 412
244 229 212 192 170
375 352 325 296 263
1338 1223 1095 953
2052 1876 1682 1469
595 543 486 423
912 834 747 654
214 195 175 152
328 300 269 235
1108 1698 973 1494 826 1270
492 432 367
755 277 424 664 243 373 564 206 317
192 240 155 209 109 168
839 1286 685 1052
372 304
571 209 321 467 171 263
134 205 98 165
531
236
362 132 203
85 130
815
334 305 273 238
513 469 420 367
Encontrar el valor de sensibilidad (o especificidad) supuesto de las pruebas que se están comparando (S1 y S2) y cruzar contra el valor de la amplitud del intervalo de confianza aceptado en el nivel de confianza que se desea. La tabla está calculada a una cola y poder de 80%.
Tabla XXI. Tamaño de muestra para estudios de concordancia
0.01
0.05
Amplitud del intervalo de confianza aceptado 0.1 0.15 0.20 0.01 0.05 0.01 0.05 0.01 0.05
413 781 1107 1389 1628 1824 1976 2085 2150 2171
292 553 783 983 1152 1290 1398 1475 1521 1537
103 195 276 347 401 456 494 521 537 543
0.05 α pd 0.05 0.10 0.15 0.20 0.25 0.30 0.35 0.40 0.45 0.50
73 138 196 246 288 323 349 369 380 384
46 86 123 154 181 203 220 232 239 241
32 61 87 109 128 143 155 164 169 170
26 49 69 87 102 114 124 130 134 136
18 35 49 61 72 81 87 92 95 96
0.25
0.30
0.01
0.05
0.01
0.05
16 31 44 56 65 73 79 83 86 87
12 22 31 39 46 52 56 59 61 62
11 22 31 39 45 51 55 58 60 61
8 15 22 27 32 36 39 41 42 43
Buscar en la primera columna la proporción de discordancia que se desea poder detectar (pd) y cruzar contra los valores de la amplitud del intervalo de confianza que se acepte en el nivel de significación deseado. La tabla se encuentra calculada a dos colas.
Apéndice B
RESPUESTA A LOS EJERCICIOS
Ejercicio 1. 576 sujetos. Ver desarrollo en el capítulo 4 y en tablas. Ejercicio 2. Se requieren 77 sujetos de estudio de acuerdo con la fórmula:
N=
( Zα ) 2 ( p )(q ) δ2
En donde: N = tamaño de la muestra que se requiere. p = proporción de sujetos portadores del fenómeno en estudio. q = 1 – p (complementario, sujetos que no tienen la variable en estudio). δ = precisión o magnitud del error que estamos dispuestos a aceptar. Zα = distancia de la media del valor de significación propuesto. En este ejemplo, requerimos conocer primero los valores a sustituir en la fórmula. Proporción conocida (literatura) = 3.3%, p = 0.033. q = 1 – p = 1 – 0.033 = 0.967. Precisión de la estimación = ±4% (δ = 0.04).
Nivel de confianza = 95% (α = 0.05, y de acuerdo con el cuadro 4, Zα a dos colas es = 1.96) 2 2 Así, N = (Zα ) (2p)(q) = (1.96) (0.0332)(0.967) = 3.84(0.0319) = 0.123 = 76.58 = 77 δ 0.04 0.0016 0.0016 sujetos. En la tabla para una proporción se encuentra el valor de proporción más cercano que es 5%, que en el nivel de confianza del 95% (alfa = 0.05) y variabilidad de ±4% nos ubica en un valor de 114 sujetos de estudio. Proporción esperada
Nivel de confianza
Variación aceptada de la proporción esperada del fenómeno ±1%
±1.5%
±2%
±3%
±4%
±5%
5%
90%
1282
571
321
143
80
51
95%
1818
810
456
203
114
73
99%
3132
1397
787
350
196
126
Ejercicio 3. Se requieren 1794 sujetos ya que la prevalencia esperada es de 25% (en el ejemplo se menciona que se estima que cerca de la cuarta parte de la población infantil tiene obesidad). Se emplea la tabla de una proporción en la población. Proporción esperada
Nivel de confianza
Variación aceptada de la proporción esperada del fenómeno ±1%
±1.5%
±2%
±3%
25%
90%
5022
2244
1265
563
95%
7100
3181
1794
799
99%
12138
5469
3091
1378
2
2
2
2
Ejercicio 4. N = ( Zα ) 2(σ ) = (1.96) 2 (15) = 3.84(225) = 96 sujetos. δ 3 9 Ver desarrollo en capítulo 4 y en tabla 2. Ejercicio 5. Se requieren 664 sujetos, de acuerdo con la tabla 2. Desviación estándar poblacional
Nivel de confianza ±1
±1.5
±2
±3
±4
10
90%
271
121
68
31
17
95%
385
171
97
43
25
99%
664
295
166
74
42
Variación aceptada (Amplitud del intervalo)
131
Ejercicio 6. Se requieren 217 sujetos, de acuerdo con la tabla 2. Desviación estándar poblacional
Nivel de confianza
15
90%
Variación aceptada (Amplitud del intervalo) ±1 609
±1.5 271
±2 153
95%
865
385
99%
1492
664
±3 68
±4 39
217
97
55
374
166
94
Ejercicio 7. Se requieren 304 sujetos por grupo de acuerdo con la fórmula
n=
( p1q1 + p2 q2 )( K ) [(0.4)(0.6) + (0.5)(0.5)]6.2 = = ( p1 − p2 ) 2 (0.4 − 0.5) 2 (0.24)(0.25)6.2 (0.49)6.2 = = 0.01 (0.1) 2 3.038 = = 303.8 = 304 sujetos por grupo 0.01 =
Si analizamos la tabla III, se aprecia el mismo resultado al localizar la proporción menor (0.4) y la columna con la diferencia de proporciones (0.5 – 0.4 = 0.1) al nivel de confianza deseado. El estudio es de una cola porque estamos suponiendo una proporción mayor de pacientes controlados con el segundo esquema terapéutico. Proporción menor (p1 o p2) 0.40
Nivel de confianza
Diferencia esperada entre p1 y p2
Una cola
Dos colas
0.05
0.10
0.15
0.20
95%
90%
1206
305
136
76
97.5%
95%
1533
387
173
96
99.5%
99%
2281
576
257
145
132
Ejercicio 8. Se necesita estudiar a 108 pacientes por grupo de acuerdo con la tabla III de comparación de 2 proporciones. Ubicamos la proporción conocida de 20% (0.20), la columna con la diferencia de proporciones esperada de 15% (0.15) a una confianza del 95% a una cola (ya que se espera que los resultados sean mejores con el manejo profiláctico). Proporción menor (p1 o p2)
Nivel de confianza
0.20
Diferencia esperada entre p1 y p2
Dos colas
0.05
0.10
0.15
0.20
95%
90%
860
231
108
64
97.5%
95%
1092
293
137
81
99.5%
99%
1628
436
206
121
Una cola
Ejercicio 9. Se requieren 24 pacientes por grupo de acuerdo con la tabla III para comparación de proporciones. Se ubica la proporción menor de 10% (0.1), la diferencia esperada de 40% – 10% = 30% (0.3) a un nivel de confianza del 95% a una cola. Proporción menor (p1 o p2)
Nivel de confianza
Diferencia esperada entre p1 y p2 0.10
0.15
0.20
0.25
0.30
0.35
95%
90%
539
156
78
48
33
24
19
97.5%
95%
685
198
100
61
42
31
24
Una cola Dos colas 0.05 0.10
Ejercicio 10. Se requieren 108 pacientes por grupo, de acuerdo con la fórmula: 2
n=
2
K (σ 1 +σ 2 ) 8.6(242 + 252 ) 8.6(625 + 625) 10750 = = =107.5 = ( µ1 − µ 2 ) 2 100 100 (10) 2
En la tabla 4 ubicamos el valor de µ1 – µ2 / σ = 10 / 25 = 0.4 en la primera columna, y en la hilera del nivel de confianza unilateral de 95% cruzamos con la columna del poder de 90% y se obtienen 109 sujetos por grupo. 133
Nivel de confianza Bilateral Unilateral 80% 90% 90% 95% 95% 97.5% 98% 99%
μ1 – μ2 /σ 0.40
70% 42 60 79 103
Poder del estudio 80% 57 78 100 127
90% 84 109 133 166
Ejercicio 11. Se requieren 13 sujetos por grupo. Si tomamos en cuenta que el estudio es unilateral, seleccionamos el valor de µ1 – µ2 / σ (250 – 225 / 25 = 1) en 1.0 y en la columna de estudio unilateral al 95% cruzamos con la columna de poder a 80%. μ1 – μ2 /σ 1.00
Nivel de confianza
Poder del estudio
Bilateral
Unilateral
70%
80%
90%
80%
90%
7
9
13
90%
95%
9
13
17
95%
97.5%
12
16
19
98%
99%
18
21
25
Ejercicio 12. Se requieren 25 sujetos por grupo. μ1 – μ2 /σ
Nivel de confianza Bilateral
1.00
Poder del estudio
Unilateral
70%
80%
90%
80%
90%
7
9
13
90%
95%
9
13
17
95%
97.5%
12
16
19
98%
99%
18
21
25
Ejercicio 13. Se requieren 569 pacientes por grupo, de acuerdo con la fórmula
n=
2 pq ( K ) ε2
Ya que p = 0.9, q = 1 – p = 1 – 0.9 = 0.1. 134
K = 7.9 (alfa 0.05 y poder 80% a dos colas. cuadro 8). ε = ± 2.5% = 0.05. n=
2 pq ( K ) 2(0.9)(0.1)(7.9) 2(0.09)(7.9) 0.18(7.9) 1.42 = = = = = 568.8 ε2 0.05 2 0.0025 0.0025 0.0025
Este valor se corrobora en la Tabla V cruzando la hilera p 0.9 en el valor ε de 0.05, con la columna donde se encuentra el valor alfa bilateral 0.05 a un poder del 80%. 0.01
α Unilateral α Bilateral Poder
0.025
0.02
0.05
70
80
90
70
80
90
p
ε
0.90
0.05
584
720
936
446
568
756
0.10
146
180
234
111
142
189
Ejercicio 14. Se requieren 546 sujetos por grupo de acuerdo con la tabla V al cruzar la hilera de valor p de 0.7 en el valor ε de 0.1, con la columna donde se encuentra el valor alfa bilateral 0.02 a un poder de 90%. 0.01
α Unilateral α Bilateral Poder p 0.70
0.025
0.02
0.05
70
80
90
70
80
90
0.05
1360
1680
2184
1041
1327
1764
0.10
340
420
546
260
332
441
ε
Ejercicio 15. Se requieren 99 sujetos de estudio de acuerdo con la fórmula
n=
2σ 2 K ε2
En donde: σ = 5. K = 7.9 ya que es un estudio a dos colas (cuadro 8). 135
ε = 2 (se aceptó una variación de ± 1 Kg) y al sustituir en la fórmula,
n=
2σ 2 K 2(5) 2 (7.9) 50(7.9) = = = 98.75 22 4 ε2
La tabla VI proporciona resultados similares al ubicar el valor σ de 5 en la columna de la izquierda, con variabilidad 2 y alfa 0.05 bilateral con poder 80%. 0.01
α Unilateral α Bilateral Poder σ 5
0.025 0.05
0.02 70
80
90
70
80
90
ε 1
405
500
650
310
395
525
2
101
125
163
78
99
131
Ejercicio 16. Se requieren 254 sujetos de estudios, de acuerdo con la tabla VI al ubicar en la columna el valor de desviación estándar de 25, una variabilidad aceptada como equivalencia de 8, a una confianza bilateral del 98% y poder del 90%. 0.01
α Unilateral α Bilateral Poder σ 25
0.025
0.02
0.05
70
80
90
70
80
90
ε 1
10125
12500
16250
7750
9875
13125
3
1125
1389
1806
861
1097
1458
5
405
500
650
310
395
526
8
158
195
254
121
154
205
Ejercicio 17. Requiere 120 sujetos para estudio de acuerdo con la fórmula
N = 3+
K C2
136
En donde: N = tamaño total de la muestra. K = 13 de acuerdo con la tabla 8, con alfa 0.01 y poder 90% en estudio unilateral (es unilateral por que desea detectar “al menos” una correlación 0.35. C = (0.5) ln [(1+ 0.35) / (1- 0.35)] = (0.5) ln 2.07 = 0.5 (0.73) = 0.365. K 13 =119.8 , y de acuerdo De manera que N = 3 + 2 = 3 + C 0.365 con la tabla VII sólo es cuestión de ubicar el valor de correlación y cruzarlo contra el valor de alfa y poder deseados. 0.01
α Unilateral α Bilateral
0.02
Poder r
70
80
90
0.30
88
107
139
0.35
64
78
120
0.40
48
59
75
Ejercicio 18. Requiere estudiar 479 sujetos por grupo de acuerdo con la tabla VIII. Se ubica el valor de correlación del grupo menor (0.3) y la línea de la correlación que espera en el otro grupo (o la diferencia que quiere ser capaz de detectar). En este caso, refiere que desea detectar una diferencia de al menos de 0.1 (se ubica en la línea de r2 de 0.4). Se busca la columna de alfa unilateral (ya que espera que la correlación en el segundo grupo sea mayor) de 0.05 y poder 80% α Unilateral α Bilateral Poder r1 r2 0.3 0.4 0.5 0.6 0.7 0.8 0.9
0.01 0.02
0.025 0.050
0.05 0.10
80
90
80
90
80
90
771 177 71 35 19 10
1001 229 91 45 24 13
610 140 57 28 16 9
809 186 74 37 20 11
479 111 42 23 13 8
663 153 58 31 17 9
137
Ejercicio 19. Incrementar el número de controles, por ejemplo, 2:1. Ejercicio 20. Se requieren 41 casos y 82 controles, de acuerdo con la tabla IX. Se ubica la proporción de exposición en los controles en 5% y se busca la razón de momios más cercana a detectar en la tercer columna (o en su defecto, la proporción de exposición en los controles si es que se conoce el dato. En este caso, para una RM de 6.33, la proporción de exposición en casos corresponde a 25%). Si se quisieran 3 controles por casos pudieran usarse 34 casos y 102 controles.
Proporción Proporción Razón de de de momios expuestos expuestos (odds ratio) en controles en casos a detectarse 5%
Relación Relación Relación control /caso 1:1 control/caso 2:1 control/caso 3:1 Confianza 99% Confianza 95% Confianza 95% Poder (1-β Poder (1-β β) β) 80% Poder (1-β β) 80% 80
90
Control
Caso
Control
Caso
10%
2.11
686
863
682
341
888
296
12%
2.59
606
498
394
197
510
170
15%
3.35
228
285
226
113
291
97
20%
4.75
125
155
124
62
156
52
25%
6.33
83
102
82
41
102
34
30%
8.14
88
74
60
30
75
25
40%
12.67
53
45
36
18
45
15
Si la relación caso control fuera 1:1, la fórmula a utilizar será ( p1q1 + p2 q2 )( K ) n= ( p1 − p2 ) 2 En donde: p1 = 0.05, q1 = 0.95. p2 = 0.25, q2 = 0.75. K = 7.9. ( p1q1 + p2 q2 )( K ) [(0.05)(0.95) + (0.25)(0.75)](7.9) = = n= ( p1 − p2 ) 2 (0.05 − 0.25) 2 (0.0475+ 0.1875)(7.9) 1.8565 = = = 46 casos y 46 controles, lo 0.2 2 0.04 cual es un poco menor al valor de tablas como se mencionó en el capítulo correspondiente. 138
Si por fórmulas despejamos para grupos desiguales, utilizamos la fórmula 11 de la siguiente manera:
n=
(1+1/ c)( pq )( K ) ( p 1 − p2 ) 2
En donde: c = número de controles por caso (2:1, c = 2). p = p1 + p2/2 = (0.05 + 0.25) / 2 = .255/2 = 0.1275. q = 1 – p = 1 – 0.1275 = 0.8725. K = 7.9 (cuadro 8). (1+1 2)(0.1275)(0.8725)(7.9) = 33 casos y 66 De manera que n = (0.05 − (0.25) 2 controles, valor también un poco menor al de tablas. Ejercicio 21. Se requieren de 219 pacientes y 219 controles sanos para una relación de casos: controles 1:1. Se emplea la tabla de casos y controles no apareados Nº IX en donde se ubica el valor de la proporción de la exposición en los sanos (como no hay valor de 11% en la tabla, se toma el valor más cercano que es 10%) y la proporción de exposición en los casos (los niños con encefalopatía) que es un 20%, y se cruzan los valores en la columna de la relación control/caso 1:1, confianza 95% y poder 80%. Relación Relación Proporción Razón de control/caso 1:1 control/caso 1:1 Proporción de momios Confianza 95% Confianza 99% de expuestos (odds ratio) Poder (1-β β) Poder (1-β β) en expuestos a controles en casos detectarse 80 90 80 90 10%
Relación control/caso 2:1 Confianza 95% Poder (1-β β ) 80% Control
Caso
15%
1.59
725
957
1060
1339
1062
531
20%
2.25
219
286
316
397
316
158
25%
3.00
112
146
161
202
162
81
30%
3.86
71
92
102
126
102
51
35%
4.85
50
64
71
88
72
36
40%
6.00
38
48
54
66
54
27
139
Ejercicio 22. Si solamente se tuvieran 170 casos, se puede optar por establecer una relación control: caso 2:1, con lo cual se aprecia en la misma tabla que se requieren 158 casos y 316 controles. Relación Relación Proporción Razón de control/caso 1:1 control/caso 1:1 Proporción de momios Confianza 95% Confianza 99% de expuestos (odds ratio) Poder (1-β β) Poder (1-β β) en expuestos a controles en casos detectarse 80 90 80 90 10%
Relación control/caso 2:1 Confianza 95% Poder (1-β β ) 80% Control
Caso
15%
1.59
725
957
1060
1339
1062
531
20%
2.25
219
286
316
397
316
158
25%
3.00
112
146
161
202
162
81
30%
3.86
71
92
102
126
102
51
35%
4.85
50
64
71
88
72
36
40%
6.00
38
48
54
66
54
27
Ejercicio 23. El aparear la muestra por una variable que se quiere controlar, disminuye la variabilidad existente entre ellas, por lo cual teóricamente, la muestra requerida deberá ser menor (punto 2.2.6, página 32). Si consultamos la tabla X, se observa en la primera columna la proporción de exposición en los controles, que en el ejemplo se refiere del 11% (valor más cercano 10%). En el renglón superior de esta hilera se encuentra el valor del poder a 80%. En la primera hilera se observa el valor de la razón de momios a detectar, que aunque no se menciona en el ejercicio, se puede consultar en la tabla IX del ejercicio anterior que corresponde a 2.25. Con estos datos, cruzamos en la columna de la razón de momios 2.25 a un nivel de significación de 0.05 y encontramos la cifra de 197 sujetos de estudio por grupo (197 casos y 197 controles), resultado que es congruente con los aspectos teóricos mencionados al inicio, ya que en el estudio no apareado, en relación 1:1 requeríamos 219 sujetos por grupo.
140
Proporción de controles expuestos Significación α
Razón de momios (Odds Ratio) que quiere detectarse 1.75
2
2.25
0.01
0.05
0.01
0.05
0.01
0.05
80%
674
452
420
282
293
197
90%
847
600
526
371
370
258
Poder (1-β β) 10%
Este ejercicio se resuelve mediante la fórmula
{Zα (RM +1) + Zβ n=
( RM +1) 2 − ( RM −1) 2 P 2 disc ( RM −1) 2 Pdisc
}
2
En donde: RM = razón de momios que se espera encontrar. pdisc = proporción o porcentaje de discordancia entre los casos y los controles y corresponde al cálculo de b + c/n pares. Zα = distancia de la media que tendrán los valores de probabilidad de α. Zβ = distancia de la media que tendrán los valores de probabilidad asignados a β. ambos valores se pueden consultar en el cuadro 4. Así, tenemos que RM = 2.25. p1 = 0.1, q1 = (1 – p1) = 0.9. p2 = 0.2, q2 = (1– p2) = 0.8. Pdisc = se puede inferir a través de la estimación de las proporciones esperadas, así, el investigador estima que aproximadamente un 10% de las madres de los controles tienen ruptura de membranas y alrededor de un 20% de las madres de los casos, por lo que al sustituir en la fórmula πA(1 – πB) = b/n pares, y πB(1 – πA) = c/n pares, tendríamos que b/n pares = (0.10) (0.8) = 0.08 y c/n pares = (0.2)(0.9) = 0.18, de donde, si p discordante es = b + c/n pares, esto sería 0.08 + 0.18 = 0.26. Zα = 1.96. 141
Zβ = 0.84
{1.96(2.25+1) + 0.84 n= {6.37 + 0.84 = {6.37 + 0.84 =
( 2.25 +1) 2 − (2.25 −1) 2 0.26 2 (2.25 −1) 2 (0.26)
}= 2
}
2
(10.56) − (1.5625)(0.0676) = (1.56)(0.26)
}
2
10.56 − 0.105625 {6.37 + 0.84(3.234)} = = 0.406 0.406
{6.37 + 0.84(3.234)}2
2
82.56 = 203 pares de casos y con0.406 0.406 troles, lo cual es una cifra muy aproximada a los 197 localizados en la tabla. Ejercicio 24. Se requieren 56 pares (56 casos y 56 controles de acuerdo con la tabla X, en donde se busca en la primera columna la proporción estimada de exposición en controles (30% y se cruza contra la columna de la razón de momios a detectar (3) en el nivel de significación (0.05) y poder del estudio (80%) que se hayan propuesto. =
Proporción de controles expuestos
=
Razón de momios (Odds Ratio) que quiere detectarse 3 Significación α
3.5
0.01
0.05
0.01
0.05
80%
84
56
65
43
90%
105
73
80
56
Poder (1-β β) 30%
Ejercicio 25. Se necesitan 34 sujetos por grupo (34 casos y 34 controles) de acuerdo con la tabla XI, en la cual se ubica primero el valor de la proporción estimada o conocida en el grupo de controles (en el caso del ejemplo es de 30% o 0.3) y se busca en las columnas el valor de la razón de momios a detectar, en este ejemplo de 3 al nivel de significación que se desea.
142
1.8 α
2
2.5
3
0.05
0.01
0.05
0.01
0.05
0.01
0.05
0.01
101
163
78
119
45
72
34
53
p 0.30
Y si se desea resolverlo mediante la fórmula sería: n=
[Zα + exp(ln RM
[
]
/ 4) Zβ ] (1+ 2 P ) 1.64 + exp(ln32 / 4)(0.84) [1+ ( 2)(0.3)] = = ln RM ( P ) ln 32 (0.3) 2
2
2
2
=
[1.64 + exp(1.0986
]
=
[1.64 + exp(.3017)(0.84)]2 [1.6)]= [1.64 + (1.352)(0.84)]2 (1.6) = 2.7758 2 (1.6) =
=
7.71(1.6) 12.33 = = 34.04 = 34 sujetos 0.3621 0.3621
/ 4)(0.84) [1+ 0.6)] [1.64 + exp(1.207 / 4)(0.84) ] (1.6) = = 1.0986 2 (0.3) 1.207 (0.3) 2
2
2
0.3621
0.3621
0.3621
Ejercicio 26. Se requieren 49 sujetos de acuerdo con el ajuste mencionado en la página 66 que es n /1 – el coeficiente de correlación = 34 / 1 – 0.3 = 34 / 0.7 = 48.57 = 49 sujetos por grupo. Ejercicio 27. Se requieren 1021 sujetos de estudio por grupo, de acuerdo con la tabla tres, ya que estamos analizando un ensayo clínico aleatorio simple vs. placebo, y la variable de salida o de respuesta es una proporción (15% con el uso de hormonales combinados vs. 10% poblacional). Proporción menor (p1 o p2) 0.10
Diferencia esperada entre p1 y p2
Nivel de confianza Una cola
Dos colas
0.05
0.10
0.15
95%
90%
539
156
78
48
97.5%
95%
685
100
61
99.5%
99%
1021
148
92
143
198 297
0.20
Desarrollado mediante la fórmula 4 tenemos: p1 = 0.1. p2 = 0.15. K = 11.7 (cuadro 8). De manera que: n=
( p1q1 + p2 q2 )( K ) (0.1)(0.9) + (0.15)(0.85)(11.7) 0.217(11.7) 25447 = = = = ( p1 − p2 ) 2 (0.05) 2 0.0025 0.0025
= 1017.9 = 1018
Ejercicio 28. Se requieren 122 sujetos por grupos, de acuerdo con la tabla III. Proporción menor (p1 o p2)
Diferencia esperada entre p1 y p2
Nivel de confianza Una cola
Dos colas
0.05
0.10
0.15
0.20
0.25
0.30
95%
90%
1158
280
119
64
38
25
97.5%
95%
1470
355
152
81
49
31
99.5%
99%
2188
530
227
122
74
48
0.60
Ejercicio 29. En este caso estamos partiendo de una diferencia de medias por lo que se utiliza la tabla IV que nos indica que se requieren 74 sujetos de estudio por grupo. El cálculo de μ1 – μ2 /σ es 210-190 / 33 = 0.60, de manera que se busca la columna que tenga dicho valor y se cruza con la columna de poder del estudio de 90% en la hilera del nivel de confianza deseado. μ1 – μ2 /σ 0.60
Nivel de confianza
Poder del estudio
Bilateral
Unilateral
70%
80%
90%
95%
97.5%
37
46
61
98%
99%
48
59
74
Si lo calculamos mediante la fórmula, requerimos conocer el valor de K el cual lo tomamos del cuadro 8 y para un estudio a una cola, alfa 0.01 y poder 90% es de 13 de manera que: 144
2
n=
2
K (σ 1 +σ 2 ) 13(332 + 332 ) 13(2178) 28314 = = = = 70.78 = 71 ( µ1 − µ 2 ) 2 (210 −190) 2 20 2 400
Ejercicio 30. Se requieren 108 sujetos por grupo de estudio de acuerdo con la fórmula Nº 13.
n=
( Zα p1q1 + Zβ p2 q2 ) 2 ( 2.33 (0.1)(0.9) + 0.84 (0.2)(0.8) ) 2 = = ( p1 − p2 ) 2 (0.1− 0.2) 2
2 [ ( 2.33)(0.3) + (0.84)(0.4)] (0.699 + 0.336) 2 1.0712 = = = =107.2
(0.1) 2
0.01
0.01
Este mismo valor se encuentra al buscar en la tabla 12 cruzando el valor de la proporción menor que es 0.10, con la diferencia esperada entre ambas proporciones (0.20 – 0.10 = 0.10) en el nivel deseado de confianza del 99% Diferencia esperada entre p1 y p2
Proporción menor (p1 o p2)
Nivel de confianza
0.05
0.10
0.15
0.20
0.10
90%
188
53
25
15
95%
253
69
33
20
99%
399
108
51
30
Ejercicio 31. En este caso, aunque el estudio sea un ensayo clínico, se utiliza la misma fórmula y la misma tabla X que se usa para estudios de casos y controles pareados, donde la variable de respuesta es nominal. Proporción de controles expuestos 30%
Razón de momios (Odds Ratio) que quiere detectarse 3 Significación α
3.5
0.01
0.05
0.01
0.05
80%
84
56
65
43
90%
105
73
80
56
Poder (1-β β)
145
Se ubica la proporción de sujetos “controles” que tienen el resultado en estudio (en este ejemplo la proporción de sujetos que se encontraban controlados en la primera medición, que es un 30%), en la misma columna que dice “proporción de controles expuestos” y cruzando el valor con la columna que contenga la razón de momios (en este caso el beneficio relativo de 3 que se espera de la intervención) al nivel de significación establecido (0.05), con lo cual se obtienen 56 pacientes por grupo Ejercicio 32. Se requieren 290 sujetos de acuerdo con la tabla XV, en la cual se localiza la proporción que se conoce del 10% (P = 0.1), la diferencia que se supone o se desea encontrar de 5% (δ = 0.05) y se cruzan los valores en la columna que contiene el valor alfa y poder deseados. α Unilateral α Bilateral Poder p
.05 .10 70
80
90 120
δ
0.1
0.1
60
90
0.05
210
290
420
0.01
4900
6400
9000
0.005
20000
26000
36000
0.001
330000
630000
850000
Ejercicio 33. Se requieren 8,100 sujetos de estudio de, acuerdo con la tabla XV. α Unilateral
.05
α Bilateral
.10
Poder p 0.001
70
80
90
δ 0.001
5700
8100
12000
0.0005
21000
29000
42000
146
Ejercicio 34. Se necesitan 68,000 sujetos, de acuerdo con la tabla XVI. α Unilateral α Bilateral
.05 .10
Poder p
70
80
90
δ
0.005
0.005
2900
3700
5100
0.001
52000
68000
94000
0.0005
200000
260000
360000
Ejercicio 35. En este estudio, si tomamos en cuenta que α = 0.05, β = 0.10, p1 = 10, p2 = 20, Ho: A = B, Ha: A≠B, se requieren 147 sujetos por grupo de acuerdo con la fórmula 21.
E=
(CTR +1) 2 ( K ) C (TR −1) 2
En donde: C = 1 (ya que se menciona que son dos grupos iguales). TR = ln π2 / ln π1 = ln 0.2 / ln 0.1 = –1.61/–2.3 = 0.699. K = 8.6, de acuerdo con el cuadro 8 a un alfa unilateral de 0.05 y poder 0.9. E=
(CTR +1) 2 ( K ) (1)(0.699 +1) 2 (8.9) (1.699) 2 (8.9) 2.8(8.9) 25.42 = = = = 279 C (TR −1) 2 1(0.699 −1) 2 1(−0.301) 2 0.091 0.091
Es decir, se requiere observar 279 eventos y para calcular el 279
E
279
= = =147 sujetos por número de sujetos, n = 2 − (π 1 −π 2 ) 2 − (0.2 − 0.1) 1.9 grupo. Al analizar la tabla XVIII se encuentra un resultado similar. α Unilateral
0.01
0.025
α Bilateral
0.02
0.050
Poder
0.05 0.10
80
90
80
90
80
90
π1
π2
0.1
0.2
167
217
132
176
104
145
0.3
57
74
45
59
35
63
147
Ejercicio 36. En este estudio, si tomamos en cuenta que α = 0.05, β = 0.20, p1 = 20, p2 = 30, Ho: A = B, Ha: A≠B, se requieren 153 sujetos por grupo, de acuerdo con la fórmula
E=
(CTR +1) 2 ( K ) C (TR −1) 2
En donde: C = 1 (ya que se menciona que son dos grupos iguales). TR = ln π2 / ln π1 = ln 03 / ln 0.2 = -1.2/-1.61 = 0.745. K = 6.2, de acuerdo con el cuadro 8 a un alfa unilateral de 0.05 y poder 0.8. E=
(CTR+1) 2 ( K ) (1)(0.745+1) 2 (6.2) (1.745) 2 (8.9) 3.045(6.2) 18.88 = = = = = 290 1(0.745−1)2 1(−0.255) 2 0.065 0.065 C (TR −1) 2
Es decir, se requiere observar 290 eventos y para calcular el número de sujetos, grupo.
n=
290 290 E = = =153 2 − (π 1 −π 2 ) 2 − (0.3− 0.2) 1.9
sujetos por
Y de acuerdo con las tablas 157 sujetos por grupo. α Unilateral
0.01
0.025
α Bilateral
0.02
0.050
Poder π1 0.2
0.05 0.10
80
90
80
90
80
90
0.3
253
329
200
266
157
218
0.4
74
96
58
77
46
63
π2
Ejercicio 37. Se requieren 56 sujetos de estudio de acuerdo con la fórmula: E = 2(K) / (ln TR)2 En donde, si tomamos en cuenta que α = 0.05, β = 0.20, entonces K = 6.2, de acuerdo con el cuadro 8 en estudio unilateral y TR = sm1/sm2 = tiempo de aparición de la neuropatía visceral 148
en la población (5 años)/tiempo de aparición de neuropatía en el grupo estudiado (8 años) = 5/8 = 0.625 y ln 0.625 = –0.470.
E=
2K (2)(6.2) 12.4 = = = 56 2 2 (lnTR ) ln(−0.470) 0.221
Lo mismo se aprecia en la tabla XVII al localizar la tasa de riesgo en la primera columna. Como la tasa de riesgo es 0.625, valor que no se encuentra en la tabla, se divide 1/0.625 con lo cual obtenemos 1.6 que es el valor que se ubica en esa primera columna, y al cruzar con un alfa de 0.05 unilateral a un poder de 80% se obtienen los mismos 56 eventos a observar. α Unilateral α Bilateral Poder
.025 .05 70
.05 .10
80
90
70
80
90
Tasa de riesgo 1.50
75
96
127
57
75
104
1.60
56
72
95
43
56
78
Ejercicio 38. Requiere 196 sujetos, de acuerdo con la fórmula
N=
4( Zα ) 2 ( pq) IC 2
En donde: Zα = 1.96. p (sensibilidad) = 85% (o bien, expresado en fracción de la unidad = 0.85). Amplitud del intervalo aceptado = ± 5% (o expresado en fracción de la unidad = ± 0.05). De manera que: N=
4( Zα ) 2 ( pq ) 4(1.96) 2 (0.85)(0.15) 15.37(0.1275) 1.959 = = = =196 IC 2 0.12 0.01 0.01
149
Al localizar en la tabla Nº XIX el valor de sensibilidad 0.85 a una variación de ±0.05 se aprecia el mismo resultado. Sensibilidad o especificidad
Nivel de confianza (1-α) Dos colas
±0.01
±0.02
±0.03
±0.04
±0.05
95
90
4302
1075
478
269
172
97.5
95
6147
1536
683
384
246
95
90
3430
857
381
214
137
97.5
95
4897
1224
544
306
196
Una cola 0.80 0.85
Variación aceptada de la proporción esperada del fenómeno
Ejercicio 39. Se requieren 125 sujetos, de acuerdo con la fórmula:
N=
4( Zα ) 2 ( pq) IC 2
En donde: Zα = 1.96. p (sensibilidad) = 91% (expresado en fracción de la unidad = 0.91). Amplitud del intervalo aceptado = ±5% (expresado en fracción de la unidad = ±0.05). N=
4( Zα ) 2 ( pq ) 4(1.96) 2 (0.91)(0.09) 15.37(0.0819) 1.26 = = = =126 IC 2 0.12 0.01 0.01
Este resultado no lo encontramos en la tabla XIX, ya que el valor de sensibilidad no se encuentra representado, sin embargo, una aproximación válida es buscar el valor de sensibilidad de 90% (0.9) con lo cual se requieren 138 sujetos. Sensibilidad o especificidad 0.90
Nivel de confianza (1-α)
Variación aceptada de la proporción esperada del fenómeno
Una cola
Dos colas
95
90
±0.01 2420
±0.02 605
±0.03 269
±0.04 151
±0.05 97
±0.06 67
97.5
95
3457
864
384
216
138
96
150
Ejercicio 40. Se requieren 128 sujetos, de acuerdo con la fórmula 25.
{Zα n=
(1+ C )Π (1− Π ) + Zβ (Cp1q1 + p2 q2 ) (C ) IC 2
En donde C = 1 : 1. Π = p1 + p2/2 = 0.85 + 0.92 / 2 = 0.88. p1 = 0.85 q1 = 1 – 0.85 = 0.15. p2 = 0.92 q2 = 1 – 0.92 = 0.08. IC = 0.1. Zα = 1.64 (estudio de una cola). Zβ = 0.84 (poder de 80%). n=
{1.64
}
2
}
2
(1+1)0.88(1− 0.88) + 0.84 1(0.85)(0.15) + (0.92)(0.08) = (1)(0.1) 2
=
{1.64
}
=
{1.64
=
{1.64(0.4595) + 0.84(0.4484)}2 = {0.7538+ 0.3766}2 = (1.130) 2 =1.277 =128
2
(2)(0.88)(0.12) + 0.84 1(0.85)(0.15) + (0.92)(0.08) = 0.01
} {
}
2
2
(0.2112) + 0.84 (0.1275) + (0.0736) 1.64 0.2112 + 0.84 2011 = = 0.01 0.01
0.01
0.01
0.01
0.01
En la tabla XX se aprecia un valor aproximado, ya que no se encuentra la proporción de 0.92, pero si comparamos la sensibilidad de 0.85 vs. 0.90, ubicado en el penúltimo renglón en la columna correspondiente al intervalo de confianza deseado de 0.1, y nivel de significación de 0.05 planteado, encontramos que se requieren 134 sujetos en cada grupo (el incremento del número es entendible, por que la diferencia buscada es menor). Amplitud del intervalo de confianza aceptado 0.02 S1
S2
0.85
0.90 0.95 0.95
0.90
0.04
0.06
0.08
0.10
0.05
0.01
0.05
0.01
0.05
0.01
0.05
0.01
0.05
0.01
3356 2741 2126
5146 4208 3261
839 685 531
1286 1052 815
372 304 236
571 467 362
209 171 132
321 263 203
134 98 85
205 165 130
151
Ejercicio 41. Se requieren 1118 sujetos por grupo, de acuerdo con la fórmula 25.
{Zα n=
(1+ C )Π (1− Π ) + Zβ (Cp1q1 + p2 q2 ) (C ) IC 2
En donde: C = 1 : 1. Π = p1 + p2/2 = 0.80 + 0.85/2 = 0.82. p1 = 0.80 q1 = 1 – 0.80 = 0.20. p2 = 0.85 q2 = 1 – 0.85 = 0.15. IC = 0.04. Zα = 1.64 (estudio de una cola). Zβ = 0.84 (poder de 80%). = =
{1.64
{1.64 {1.64
(1+1)0.82(1− 0.82) + 0.84 1(0.80)(0.20) + (0.85)(0.15) (1)(0.02) 2 (2)(0.82)(0.18) + 0.84 1(0.80)(0.20) + (0.85)(0.15) 0.0016
}
}
2
2
=
}= 2
} { 2
(0.2952) + 0.84 (0.16) + (0.1275) 1.64 0.2952 + 0.84 0.2875 = 0.0016 0.0016 2 2 { 1.64(0.5433) + 0.84(0.5361)} {0.8910 + 0.4503} 1.179 = = = =1118 0.0016 0.0016 0.0016
=
}= 2
Mismo resultado obtenido mediante la tabla XX.
S1 0.80
S2 0.85 0.90
Amplitud del intervalo de confianza aceptado 0.02 0.04 0.06 0.08 0.05 0.01 0.05 0.01 0.05 0.01 0.05 0.01
0.10 0.05 0.01
4433 3894
192 155
6795 5976
1118 973
1698 1494
492 432
755 664
277 243
424 373
240 209
Ejercicio 42. Se requieren 1290 observaciones de acuerdo con la tabla XXI, en la cual, se cruza el sitio donde se encuentra la proporción de discordancia (0.3) con el de la amplitud del in152
tervalo de confianza deseado, que en este caso es 0.05 (±2.5%) a una confianza del 95% (alfa 0.05). Amplitud del intervalo de confianza Aceptado 0.05 α
0.1
0.01
0.05
0.01
0.05
0.25
1628
1152
401
288
0.30
1824
1290
456
323
pd
El mismo resultado se obtiene al aplicar la fórmula 26.
N=
4 pd (1− pd )(Zα ) 2 IC 2 d
En donde: pd = 0.3. ICd = 0.05. Zα = 1.96 ya que es un estudio de 2 colas con alfa 0.05 2
(cuadro 4), de manera que N = 4(0.3)(0.7)(21.96) = 4(0.21)(3.84) = 3.23 = 0.05 0.0025 0.0025 1290 observaciones. Ejercicio 43. Son 246 observaciones de acuerdo con la fórmula 26, en donde: pd = 0.20. ICd = 10%. Zα = 1.96, ya que es un estudio de 2 colas con alfa 0.05, de 4(0.2)(0.8)(1.96) 2 4(0.16)(3.84) 2.46 = = = 246 , mismo resulforma que: N = 2 0.10
0.01
0.01
tado que en la tabla XXI. Amplitud del intervalo de confianza Aceptado 0.05 α
0.01
pd 0.20 0.25
0.1 0.05
0.01
0.05
1389
983
347
246
1628
1152
401
288
153
Ejercicio 44. Se requieren 323 observaciones, de acuerdo con la tabla XXI. Amplitud del intervalo de confianza Aceptado 0.05 α
0.01
0.1 0.05
0.01
0.05
pd 0.25
1628
1152
401
288
0.30
1824
1290
456
323
Ejercicio 45. No fue suficiente por que requiere 781 placas para observar, de acuerdo con la tabla, ya que se deseaba una precisión del 5% (amplitud del intervalo de confianza de 0.05) y confianza de 99% (nivel de alfa de 0.01). Amplitud del intervalo de confianza Aceptado 0.05 α
0.1
0.01
0.05
0.01
0.05
0.05
413
292
103
73
0.10
781
553
195
138
0.15
1107
783
276
196
pd
154
Apéndice C
CUADROS Y FÓRMULAS
Cuadro 4. Valores Z α y Z β más frecuentemente utilizados Poder (1-β β) %
Valor Z
99.0
Nivel de significación (α α) Una cola
Dos colas
2.33
0.01
0.02
97.5
1.96
0.025
0.05
95.0
1.64
0.05
0.1
90.0
1.28
0.1
0.2
85.0
1.04
0.15
0.3
80.0
0.84
0.2
0.4
75.0
0.67
0.25
0.5
70.0
0.52
0.3
0.6
60.0
0.25
0.4
0.8
α + Zβ β)2. Valores más comunes Cuadro 8. Tabla de K (Zα Poder Nivel significación dos colas 0.1 0.05 0.025 0.01
50% 2.7 3.8 5.4 6.6
80% 6.2 7.9 10.0 11.7
90% 8.6 10.5 13.0 14.9
95% 10.8 13.0 15.8 17.8
Nivel significación una cola 0.05 0.025 0.01 0.005
N=
( Zα ) 2 ( p)(q ) δ2
Fórmula 1. Tamaño de muestra para una proporción. Población infinita.
N=
n1 1+ (n1 / población)
Fórmula 2. Tamaño de muestra para una proporción. Población finita (