La estadística es una asignatura que para muchos aparece en la carrera casi sin previo aviso y sin disponer de conocimientos previos. Antes de entrar en la universidad es común no haber visto nada o casi nada sobre esta disciplina de las matemáticas.
Sin embargo, la estadística se da en muchas carreras (tanto de letras como de ciencias) y cuenta con una gran cantidad de conceptos y fórmulas bastante complejos que pueden confundir. Para quienes se encuentran perdidos, en este artículo vamos a explicar de forma sencilla la diferencia entre la prevalencia y la incidencia, así como sus tipos.
Antes de comenzar con la definición de prevalencia e incidencia, tenemos que entender el campo al que pertenecen estos dos conceptos.
La palabra estadística proviene del italiano que significa originalmente “hombre de Estado”. Esto es porque los primeros usos que se dió a esta rama de las matemáticas fueron para administrar determinados elementos como el dinero, los bienes de consumo, etc, de un estado.
Así pues, la persona que estudia o está formada en estadística no es un estadista (que es alguien que trabaja para el estado, sin más) sino un estadístico/a.
La estadística utiliza datos que provienen de una muestra (o conjunto de datos representativos de un grupo más grande) para realizar cálculos y estimaciones que permiten describir y predecir acontecimientos presentes y futuros.
Por último, para no desviarnos demasiado del tema central del artículo, añadir que forma parte de la estadística los procesos tanto de recolección y recopilación de datos, como de análisis e interpretación de los mismos.
En primer lugar tenemos el concepto de prevalencia. Es probablemente uno de los conceptos más usados en estadística básica y aporta una información muy útil sobre los datos que disponemos.
La prevalencia al igual que la incidencia, son herramientas estadísticas muy usadas en epidemiología; esta área, de manera simplificada: es el área de la biología que se encarga de estudiar cómo se propagan y contagian las enfermedades en la población.
La prevalencia es la proporción de casos que hay en una muestra. Al ser una proporción, se suele expresar en forma de porcentajes o en valores que oscilan entre 0 y 1. Pero lo veremos más claro con un ejemplo:
En este caso, la muestra sería los habitantes de Valencia. En cambio, decir que 200.000 personas van a resfriarse el próximo invierno no sería una prevalencia, ya que se desconoce la proporción total.
Como su nombre indica, la prevalencia puntual es la cantidad de casos que hay en un momento determinado. Este momento puede ser de un día o una vida. Varios ejemplos (hipotéticos):
Para calcular esto simplemente se dividen la cantidad de casos “positivos” (cancer, cristianos, hombres…) entre la muestra total (población mundial, hispanohablantes, compañeros…).
Mientras que la prevalencia puntual se toman los datos y se calcula la proporción de casos “positivos”, en la prevalencia de periodo se calcula qué probabilidades tiene una persona de convertirse en un periodo de tiempo en un “caso positivo”. Quizás con algunos ejemplos se vea mejor:
En este caso, se hace una estimación de cuántas personas (o casos) van a convertirse en positivos durante el periodo que se establece.
Es por eso que la fórmula es igual que en la prevalencia puntual (“casos positivos” dividido entre casos totales), solo que en vez de “casos positivos” sin más, ahora son “casos positivos” que aparecen en cualquier momento del tiempo que hemos determinado.
Es fácil no entender la diferencia entre prevalencia e incidencia porque muchas veces no solo se utilizan mal, sino que se utilizan con objetivos aparentemente similares.
La incidencia en realidad nos enseña la cantidad de nuevos casos que hay en una muestra determinada y en un periodo determinado.
Por eso, como ejemplo, si calculamos la incidencia del 2018 de cáncer, no tendremos en cuenta las personas que ya tenían cáncer en el 2017. Solo contaremos aquellas que han sido diagnosticadas en el 2018.
Por tanto, la diferencia entre la prevalencia de periodo y la incidencia, es que esta última no tiene en cuenta los casos que habían sido detectados antes del periodo de tiempo establecido.
En primer lugar, tenemos la incidenia acumulada. Es básicamente la descripción general de incidencia que hemos dado. Viéndolo con varios ejemplos:
Su fórmula por tanto es sencilla, ya que consiste en dividir la cantidad de nuevos casos entre todos los candidatos (población mundial, personas con idioma materno español, compañeros de clase de esos 2 años…).
Densidad, también conocida como tasa de incidencia se diferencia de la incidencia acumulada en que consigue resolver un problema que sucede en estadística que es la pérdida de casos o individuos.
Básicamente, esto consiste en que cuando tienes un grupo de personas a las que estás estudiando; como por ejemplo, 20 personas a las que estás haciendo un seguimiento mientras se toman un fármaco experimental, es posible que algunas de ellas dejen la investigación.
Si en este caso utilizásemos la incidencia acumulada, no se tendría en cuenta que dependiendo del momento, los participantes no siempre serán 20, sino que tal vez bajen a 19 o menos. Para ello, la fórmula se modifica y se convierte en: número de nuevos casos (como antes) dividido entre la suma de todos los momentos en los que se recogen los datos.