1 Unidad de Atención Infantil Temprana. CS Colonia Santa Inés. Málaga. España.
2 Unidad de Atención Infantil Temprana. CS Colonia Santa Inés. Málaga. España.
Los estudios transversales o de prevalencia son estudios observacionales, donde se recogen datos de una muestra en un tiempo determinado. Miden la frecuencia de una determinada circunstancia. No permiten sacar conclusiones sobre asociaciones causales. No se realiza ningún tipo de intervención sobre los individuos, son descriptivos.
La prevalencia es una medida de frecuencia y es la proporción de individuos que presenta el factor de estudio en un momento dado.
La elección de la muestra debe ser adecuada y lo más parecida posible a la población de estudio. Hay que definir cuál es la población, el lugar geográfico y el periodo de observación. Para el cálculo del tamaño muestral hay que establecer los niveles de confianza y de precisión deseados.
En los estudios de prevalencia el muestreo debe ser probabilístico.
El análisis de datos depende de los objetivos propuestos, y permite una estadística descriptiva (proporciones, razones), que informa de la variable estudiada y de los factores asociados.
Los estudios transversales, verticales o de prevalencia, son estudios observacionales en los que se recogen datos de una muestra en un tiempo determinado. Se denominan transversales porque no hay continuidad en el tiempo, no hay seguimiento; y de prevalencia porque permiten medir la frecuencia de una determinada circunstancia. Se trata de hacer una foto fija que se asemeje lo más posible a la realidad, sin permitir sacar conclusiones sobre asociaciones causales (no son analíticos), además, el investigador no realiza ningún tipo de intervención sobre los individuos, solo describe. Son estudios por tanto descriptivos.
Responden a la pregunta: ¿cómo es mi población?, ¿cuántos X tengo?, ¿aquellos con la patología X se relacionan con más frecuencia con la característica Y?
Si la elección de la muestra es adecuada en cuanto a tamaño y composición, la frecuencia medida en la muestra permitirá estimar la frecuencia en la población.
Por ello, un requisito imprescindible será elegir una muestra adecuada, que sea realmente representativa (lo más parecida posible) de la población que queremos estudiar.
Cuando pretendemos describir un problema de salud, o una situación determinada, intentaremos conocer cuantitativa y cualitativamente cómo se presenta, y en la medida de lo posible, relacionar dicho fenómeno con variables básicas de los individuos a los que afecta. Con ello podremos describir en qué tipo de sujetos se presenta con más probabilidad, establecer relaciones entre presencia del fenómeno y características de los sujetos, aunque sin poder establecer relaciones causales.
Para empezar, contaríamos cuántos de nuestros individuos tienen una determinada enfermedad. Por ejemplo, en una población pediátrica de 1200 niños, contamos cuántos padecen asma; si son 100, por ejemplo, ese número absoluto es poco útil. ¿Son muchos? ¿Pocos? Sería más interesante conocer qué proporción del total de pacientes tiene asma. Una proporción es un cociente en el que el numerador está incluido en el denominador; la prevalencia es una proporción1 (y no una tasa, como a veces se denomina) y se define como el número de individuos de una población que presenta una enfermedad en un momento dado.
Por otra parte, una razón es un cociente en el que el numerador no está incluido en el denominador. Por ejemplo, asmáticos con buen cumplimiento terapéutico en relación con los asmáticos no cumplidores. Si la razón tiene en el numerador la probabilidad de que ocurra un fenómeno, y en el denominador la probabilidad de que no ocurra, hablamos de odd o razón de probabilidad2.
Supongamos que de nuestra población medimos, además del número de asmáticos, el número de padres fumadores. En el grupo de los asmáticos vemos los expuestos al humo del tabaco y los no expuestos, y hacemos lo mismo con los no asmáticos (Tabla 1). Cuando un estudio transversal se diseña para estudiar la relación entre dos o más variables en una población en un momento dado se denominan estudios de asociación cruzada.
Tabla 1. Ejemplo de medición de número de asmáticos y padres fumadores. Mostrar/ocultar
Tras relacionar los cocientes de prevalencias, la fórmula quedará al final ad/bc, dándonos una cifra que se refiere a cuánto más frecuente es el asma si los padres son fumadores en relación con cuando no lo son, en nuestra población. No define si el ambiente tabáquico domiciliario es causa o no del asma infantil, pero sí el grado de asociación de las dos variables que hemos cruzado.
Es obvio que en los estudios transversales no podemos calcular incidencias ni tasas puesto que no hay seguimiento en el tiempo.
En este tipo de estudio, aparte de definir con precisión los criterios diagnósticos de la enfermedad o condición de interés (¿qué requisitos tienen que cumplir los niños para ser considerados asmáticos/padres fumadores?, ¿los dos?, ¿solo uno?, ¿independientemente de que refieran o no fumar dentro de casa?), el elemento más importante es la elección de la muestra con objeto de que realmente represente a la población estudiada.
Debe describirse además cuál es la población (edad de los niños, pacientes hospitalizados o de Atención Primaria) el lugar geográfico y el periodo de observación. Una vez que se ha descrito la población objeto de estudio, se elegirá qué sujetos de esa población se va a estudiar.
Los estudios transversales, como hemos visto, sirven para calcular proporciones o prevalencias. El primer dato que tengo que conocer para calcular el tamaño de la muestra es cuál es la proporción esperada en función de lo encontrado en la literatura médica3.
Supongamos que encontramos que la prevalencia de asma infantil en otros estudios es 10%. El investigador deberá entonces definir una serie de valores:
Fórmula:
$$\ n = \frac {Z_{a}^2 \space x \space p \space x \space q }{d^2} $$
n = tamaño de la muestra.
Z = valor de la desviación normal estándar, que, para un intervalo de confianza del 95%, sería 1,96.
p = la prevalencia que hemos obtenido de la literatura médica.
q = 1 – p.
d = precisión deseada.
En nuestro ejemplo, necesitaríamos estudiar 216 niños; si quisiéramos ser más precisos aceptando una variabilidad máxima del 2% (precisión) deberemos tomar una muestra mayor: 864.
En el caso de no encontrar en la literatura datos previos de prevalencia, se asumen para p y q valores de 0,5 (prevalencia del 50%).
La forma más sencilla sería un muestreo de conveniencia o no probabilístico, obteniendo los datos por ejemplo de los pacientes que acuden a la consulta. El problema es que los que acuden a la consulta pueden no ser representativos de la población a estudiar, con lo cual el diseño no sería válido.
En los estudios de prevalencia el muestreo debe ser siempre probabilístico4, en el cual todos los sujetos de la población tienen una probabilidad distinta de 0 de ser incluidos en la muestra.
Tipos de muestreo probabilístico:
Dependerá de los objetivos propuestos en el protocolo de investigación, pero fundamentalmente permitirá una estadística descriptiva (proporciones, razones) que informarán acerca de la variable estudiada y de factores relacionados si existiesen.
También puede calcularse la proporción de atributos entre subgrupos y generalmente utilizar una prueba de χ2 o exacta de Fisher para comparar si hay o no diferencia entre grupos.
Todo estudio, en mayor o menor medida, está sujeto a una serie de errores (nos movemos en la incertidumbre, e intentamos acercarnos a la realidad mediante probabilidades). Estos errores pueden aparecer de forma aleatoria (por azar) o de forma sistemática. A estos últimos se les denomina sesgos5, afectan a la validez interna del estudio y no son corregibles aumentando el tamaño muestral. Por ello, es importante planear cada una de las etapas de un estudio para, en la medida de lo posible, minimizar los errores sistemáticos. La etapa más crítica es la del diseño, ya que los sesgos no contemplados en ese momento difícilmente serán posteriormente subsanables.
Es importante seleccionar la muestra con muestreo probabilístico y de la población a la que queremos inferir los resultados (los pacientes ingresados en el hospital no son representativos de la población general).
En el caso de enfermedades de alta letalidad cercana al diagnóstico inicial, los estudios de prevalencia tienden a sobreestimar los casos con cursos más benignos de enfermedad. Si, además, hacemos asociación cruzada y la variable estudiada como posible factor de riesgo estuviese relacionada con la letalidad, los resultados serán erróneos, dado que los casos en estudio corresponden a sobrevivientes de la enfermedad, por lo que representarán desproporcionadamente a los casos no expuestos.
Errores en la medición de las variables. Dichos errores pueden ser debidos al observador, al instrumento de medida o a la información ofrecida por los sujetos de estudio (memoria, fatiga).
Pueden ser diferenciales o no diferenciales. Dicha distinción se basa en si el error en la medición de la variable considerada factor de riesgo se produce en todos los sujetos, independientemente de que presenten o no la enfermedad, lo que puede subestimar la asociación entre variables. Si por el contrario el error de medición es diferente en los casos enfermos con respecto a los no enfermos, se podría introducir un error en cualquier dirección, condicionando una sobre o subestimación de la asociación real.
El fenómeno de confusión6 aparece cuando la asociación observada entre el factor de estudio y el efecto (enfermedad) puede ser total o parcialmente explicada por otra variable (factor de confusión) o, por el contrario, cuando una asociación real queda enmascarada por este factor.
Para ser considerado factor de confusión, tiene que estar relacionado con la enfermedad, relacionado con el factor en estudio y no ser un paso intermedio en la asociación entre enfermedad y exposición.
Para prevenir la confusión, se pueden emplear distintos procedimientos (aleatorización, estratificación), todos ellos encaminados a que los grupos sean comparables, de forma que se intente que la única diferencia sea la presencia o ausencia del factor en estudio.
Son muy útiles en planificación sanitaria ya que permiten describir la distribución de la enfermedad y sus factores asociados, sugiriendo hipótesis que pueden comprobarse en estudios analíticos.
Fáciles de ejecutar, poco costosos y fácilmente repetibles. Permiten además explorar múltiples asociaciones.
No sirven para realizar una investigación causal por carecer de direccionalidad.
La medición de prevalencia se puede afectar por varios factores, como el periodo definido para el análisis o la evolución de la enfermedad. Pueden sobrerrepresentar a los casos con larga duración de la enfermedad y a subestimar a los de corta duración.
Están sujetos a múltiples sesgos, sobre todo de selección, por lo que es fundamental que la muestra sea representativa.
No permite estimar incidencias ni riesgos ni sirven para estudiar enfermedades raras.
Artículo de fácil lectura, con descripción de estudios transversales, técnicas de muestreo y sesgos.
Artículo que describe de forma clara los sesgos y su importancia en los estudios transversales.
Descripción de aspectos prácticos del diseño de estudios de prevalencia.
Gallego Iborra A, del Castillo Aguas G. Estudios transversales o de prevalencia. FAPap Monogr. 2021;6:33-7