Revista OACTIVA UC Cuenca. Vol. 8, No 2, Mayo - Agosto, 2023
¿Cómo escoger la prueba estadística?
¿CÓMO ESCOGER LA PRUEBA ESTADÍSTICA?
MANEJO DE DATOS PARTE 2
How to choose the statistical test?
Data management part 2
Villavicencio Caparó Ebingen *1 - https://orcid.org/0000-0003-4411-4221
Lima Illescas Miriam 1 - https://orcid.org/0000-0001-6844-3826
Cuenca León Katherine 1 - https://orcid.org/0000-0002-7816-0114
Patiño Ramón Estefanía 1 - https://orcid.org/0009-0008-6134-0793
Pacheco Quito Edisson 1 - https://orcid.org/0000-0002-6168-3218
1 Carrera de Odontología, Universidad Católica de Cuenca, 010101 Cuenca, Ecuador
* evillavicencioc@ucacue.edu.ec
RESUMEN
Objetivo: El objetivo del presente artículo es poner a disposición del personal de salud, un listado de pruebas estadís-
ticas aplicables a investigaciones en el campo de la medicina basada en evidencia. Materiales y métodos: Las fuentes
consultadas para este trabajo fueron libros de la estadística, artículos de revistas cientícas indexadas, con ejemplos
de investigaciones en ciencias de la salud. Resultados: Se encontraron 24 pruebas estadísticas con sus respectivas
explicaciones de cuándo aplicar, cómo aplicar e interpretar los resultados; las que se agruparon en cuatro grandes
grupos de familias de pruebas estadísticas y un grupo de pruebas emergentes, en base a la dirección de la naturaleza de
la hipótesis planteada. Conclusión: Existen diversos métodos estadísticos que se pueden agrupar en cinco categorías.
Palabras clave: Análisis Multivariante, Estadística, Análisis de Datos.
ABSTRACT
Aim: The objective of this article is to make available to health personnel a list of statistical tests applicable to research
in the eld of evidence-based medicine. Materials and methods: The sources consulted for this work were statistical
books, articles from indexed scientic journals, with examples of research in health sciences. Results: 24 statistical
tests were found with their respective explanations of when to apply, how to apply and how to interpret the results;
these were grouped into four large groups of families of statistical tests and a group of emerging tests, based on the
direction of the nature of the hypothesis posed. Conclusion: There are several statistical methods that can be grouped
into ve categories.
Key words: Multivariate Analysis, Statistics, Data Analysis.
Artículo Contribución Didáctica. Revista OACTIVA UC Cuenca. Vol. 8, No 2., pp. 53-66, Mayo-Agosto,2023
ISSN 2588-0624. ISSN Elect. 258802624. Universidad Católica de Cuenca
Revista OACTIVA UC Cuenca. Vol. 8, No 2, Mayo - Agosto, 2023
Villavicencio Caparó Ebingen y cols.
54
INTRODUCCIÓN
La estadística es una disciplina de la matemática que
se encarga de la toma adecuada de los datos, la siste-
matización de estos, el reporte, el análisis y la inter-
pretación de los mismos.
Existen 3 niveles de análisis estadístico, el primero es
el análisis univariad1, en el que el objetivo es reportar
los estadísticos de las variables de manera individual
con tablas de frecuencias y porcentajes si es una va-
riable cualitativa y con estadísticos tipo medidas de
centralización, dispersión, posición y forma en caso
sea una variable cuantitativa.2
En el segundo nivel de análisis estadístico llamado
bivariado, se analiza las asociaciones, relaciones y
comparaciones entre variables, para realizar esto el
investigador se vale de tablas de doble entrada llama-
das también tablas de contingencia. En este nivel de
análisis se utilizan las pruebas estadísticas de compa-
ración de proporciones, comparación de promedios
y/o correlación de variables, que se presentan en este
artículo.3
En el tercer nivel de análisis estadístico llamado mul-
tivariante3, se tiene una variable dependiente y dos o
más variables independientes. Este nivel de análisis
en las investigaciones de salud basada en evidencia,
tiene tres ventajas la primera, es que permite analizar
el efecto de una variable independiente sobre la va-
riable dependiente, controlando o ajustando el efecto
de las covariables que no se pudieron controlar en
el diseño del estudio; la segunda ventaja es que este
nivel de análisis permite hacer pruebas estadísticas
de varias variables a la vez, manteniendo al mis-
mo tiempo la probabilidad de cometer error tipo I
(p<0,05).3 Y la tercera ventaja es la posibilidad de
comparar por separado la capacidad de dos o más
variables independientes para predecir los valores de
la variable dependiente. Al respecto existen muchos
textos de consulta, sin embargo, la forma de agrupar
las pruebas estadísticas, desde la visión del usuario,
es el aporte que pretendemos dar a la academia, con
la nalidad de hacer más fácil la identicación de la
estrategia estadística que debe usar el profesional de
la salud al momento de realizar un estudio clínico.
Finalmente aparece un grupo de pruebas estadísticas
emergentes, actualmente muy poco utilizadas en me-
dicina basada en evidencia, que se llaman SEM-Mo-
delo de ecuaciones estructurales, son técnicas estadís-
ticas multivariadas, que integran ecuaciones lineales
para estimar las relaciones complejas de dependencia
entre variables de diferentes grupos y para determi-
nar el error de medida en la estimación. Se diferen-
cian seis fases para el modelo SEM: especicación,
identicación, estimación de parámetros, evaluación
de ajuste, reespecicación y la interpretación.1,3
El objetivo del presente estudio es presentar un lista-
do de las pruebas estadísticas y métodos más utiliza-
dos, que sean de utilidad para el personal de salud al
momento de planicar un estudio clínico.
ESTADO DEL ARTE
1. Intervalo de conanza
El intervalo de conanza (IC) es la prueba estadística in-
ferencial que se aplica en estudios descriptivos, se utili-
zan con el n de inferir los resultados desde una muestra
hacia una población total. Los estadísticos calculados en
la muestra se llaman estimadores y los estadísticos de la
población se llaman parámetros; toda muestra tiene un
margen de error, entre el valor de los estimadores y el
de los parámetros, los IC describen esta variación de la
dimensión obtenida en una muestra y la dimensión real
de una población. Por esta razón es necesario conocer
junto al estadístico muestral una medida del grado de
conanza que esta tiene, usualmente es de 95%.4
La interpretación de los Niveles de Conanza se haría
de la siguiente manera; la prevalencia de la muestra
es 80%; se estima que en la población total la preva-
lencia uctúa entre 79% a 81%, esto se puede armar
con un 95% de conanza. (Figura 1)
Figura 1. Esquema del diseño descriptivo con
intervalos de conanza.
2. Comparación de proporciones
Antes de realizar cualquier prueba estadística es impor-
tante tener en cuenta en el diseño del estudio, que el
tamaño de la muestra está estrechamente relacionado
Revista OACTIVA UC Cuenca. Vol. 8, No 2, Mayo - Agosto, 2023
¿Cómo escoger la prueba estadística? 55
con la posibilidad de detectar el tamaño del efecto de la
variable estímulo y por consiguiente con la potencia del
estudio. En ese sentido para poder utilizar una prueba
estadística de manera adecuada y que el resultado de la
prueba de hipótesis sea válido, se debe tener en cuenta
tanto la conabilidad (error tipo I) y la potencia del es-
tudio (error tipo II).5
2.1 Chi cuadrado X2
Las variables cualitativas, dan como resultado estadísti-
co la categorización de las unidades de estudio en sub-
grupos. Por ejemplo: varones y mujeres; sanos y enfer-
mos; éxitos y fracasos; pacientes de alta y pacientes en
tratamiento. (Figura 2) La proporción de cada subgrupo
se puede expresar en porcentaje. La prueba chi cuadrado
(conocida también como Ji cuadrado) permite saber si la
diferencia entre estas proporciones es estadísticamente
signicativa, cuando se usa de esta forma se le conoce
como Prueba X2 de homogeneidad de frecuencias.4
- En primera instancia se deberá plantear el sistema
de hipótesis.
Ho: El acceso a los servicios de salud es inde-
pendiente al tipo de procedencia de los usuarios
(La hipótesis nula siempre indicará la indepen-
dencia de las variables).
Ha El acceso a los servicios de salud es depen-
diente al tipo de procedencia de los usuarios (La
hipótesis alternativa o del investigador).
- Como segundo paso se debe aplicar la prueba esta-
dística a los datos.
- Finalmente se interpreta el resultado en función del
valor de signicancia (valor p), si el valor es igual
o mayor a 0,05 aceptamos la Ho (las variables son
independientes) si por el contrario el valor es menor
a 0,05 rechazamos la hipótesis nula Ho y aceptamos
provisionalmente la hipótesis del investigador (Ha),
por lo que decidimos concluir que el acceso a servi-
cios de salud depende del tipo de procedencia de los
usuarios.
En esta familia de pruebas estadísticas tenemos:
- La prueba X2 de Pearson es la prueba estándar que
se usa cuando se utilizan unidades de estudio mayo-
res a 5 en la tabla de contingencia.4
- La prueba X2 de Yates se usa cuando al menos 1 ca-
silla de la tabla de contingencia tiene menos de 5
unidades de estudio.4
- La prueba X2 de Fisher se emplea cuando la muestra
es demasiado pequeña, es decir el 80% de celdas de
una tabla de contingencia contiene unidades de es-
tudio inferiores a 5.4
- La prueba X2 de Mac Nemar se emplea cuando la
tabla de contingencia contiene los datos del mismo
grupo, pero con mediciones de dos tiempos distintos
por ejemplo antes del tratamiento y después del tra-
tamiento (Figura 3).4
Figura 2. Grupos con proporciones.
Figura 3. Sub grupos de enfermos y sanos dentro de
los grupos de expuestos y no expuestos
Otra aplicación de la prueba X2 es cuando se desea com-
probar la asociación entre dos variables cualitativas, es
decir si la variable que divide a la población en grupos
(expuestos y no expuestos) es una característica, un há-
bito o una determinante de la salud, que se sospecha que
está asociada con la mayor probabilidad de desarrollar
la enfermedad, realmente genera una mayor proporción
de enfermos y si esta es estadísticamente signicativa.6
El Ji cuadrado (X2) como se mencionó antes, sirve para
asociar dos variables cualitativas e incluso más varia-
bles con tablas complejas, mientras se cumplan los su-
puestos necesarios para su aplicación; de tal modo que
para ejemplicar vamos a trabajar con dos variables:
acceso a servicios de salud (si - no) y procedencia (ur-
bano - rural).6
En donde vamos a determinar si: ¿El acceso a los servi-
cios de salud está asociado a la procedencia de los usua-
rios? con un nivel de conanza del 95% y por lo tanto
una probabilidad de error del 5% que es equivalente a
p = 0,05.7
Revista OACTIVA UC Cuenca. Vol. 8, No 2, Mayo - Agosto, 2023
Villavicencio Caparó Ebingen y cols.
56
2.2 Medidas epidemiológicas de asociación de va-
riables
Cuando se está realizando un estudio con diseño de ca-
sos-controles3,8 el objetivo es comparar las proporcio-
nes de expuestos y no expuestos dentro de los grupos
de los casos (enfermos) y de los controles (sanos), la
medida estadística que se usa es el Odds Ratio (O.R.)
o Razón de momios, que se expresa en una escala que
va desde cero hasta innito. (Figura 4) Cuando el valor
es mayor a 1 se trataría de una asociación de variables
donde la variable independiente es un factor de riesgo;
si el valor del resultado es igual a 1; se interpreta que
no hay asociación entre las variables; en el caso de que
el resultado sea menos de 1; se interpreta que la varia-
ble de exposición es un factor de protección. Cuando se
realiza un estudio epidemiológico de cohortes la medida
estadística que se usa es el Riesgo Relativo (R.R.) y se
interpreta de la misma forma que el OR. (Figura. 4) Por
ejemplo, un OR de 17 signica que el grupo de expues-
tos tiene 17 veces más probabilidad de enfermar que los
no expuestos.
una herramienta que sirve para saber mediante una
prueba de hipótesis, si la media de un único grupo di-
ere de un valor determinado.9 (Figura 5) Toda prueba
t de Student parte del supuesto de que los datos tienen
distribución normal y un mínimo de 30 unidades de es-
tudio por grupo; en este caso si no se cumple con alguno
de los supuestos es recomendable usar la prueba de los
signos de Wilcoxon.9
3.3 Prueba t para muestras relacionadas
Esta prueba se utiliza para comprobar si hay una dife-
rencia signicativa en medidas relacionadas. Es decir,
busca determinar si la diferencia entre medidas de antes
Figura 5. Comparación de un promedio con valor determinado.
Figura 4. Escala de interpretación OR y RR.
Figura 6. Comparación de promedios. Grupos independientes.
A estos estadísticos se les aplica el concepto de interva-
lo de conanza, en el ejemplo de la gura 4; un resul-
tado de OR=2 que tiene un intervalo de conanza que
va desde 1 hasta 3, se interpreta que no hay asociación
porque basta que el intervalo de conanza toque la zona
del 1 para que la asociación se interprete como nula.
3. Comparación de promedios
De igual forma en el caso de las pruebas para compara-
ción de promedios, la diferencia del promedio 1 y pro-
medio2; es la magnitud de o tamaño de efecto a tener en
cuenta para el cálculo de la muestra; si el tamaño de los
grupos no se determina mediante una fórmula de mues-
treo, es imposible saber con qué conabilidad se acepta
o rechaza la hipótesis y por consiguiente también queda
en duda con qué potencia se realiza esta armación, en
tal sentido es necesario utilizar esta estrategia de deter-
minación del tamaño muestral para lograr conclusiones
con validez cientíca.5
3.1 Prueba t para una muestra
La prueba t (también llamada prueba t de Student) es
3.2 Prueba t para muestras independientes
Es una prueba paramétrica utilizada para la compara-
ción de medias entre dos grupos independientes del
mismo tamaño. Los grupos independientes son aquellos
que están bien diferenciados, es decir, al desarrollar una
investigación, es necesario conocer si hay diferencias
entre los grupos de una muestra; por ejemplo: si estás
midiendo la estatura en una población nos interesaría
conocer las diferencias entre el grupo de hombres y el
grupo de mujeres, lo que representan grupos indepen-
dientes, cada uno con sus características bien diferen-
ciadas. (Figura 6) Por lo tanto, la prueba t busca com-
parar las medias entre dos grupos independientes con
muestras inferiores a 30 sujetos.9 Si no se cumple el su-
puesto de normalidad entonces se debe utilizar la prue-
ba no paramétrica U de Mann Whitney. Las pruebas de
normalidad que se utilizan usualmente son:
- Kolmogorov Smirnov (de 31 a más muestras)
- Shapiro Wilk (de 30 a menos muestras)
Revista OACTIVA UC Cuenca. Vol. 8, No 2, Mayo - Agosto, 2023
¿Cómo escoger la prueba estadística? 57
y después en las mismas unidades de estudio ha variado
de manera estadísticamente signicativa.9 (Figura 7)
Figura 7. Comparación de promedios. Grupos asociados. Un solo
grupo en dos momentos distintos.
Si no se cumple el supuesto de normalidad entonces
se debe utilizar la prueba no paramétrica Wilcoxon
en reemplazo de esta técnica.
3.4 ANOVA de un factor
La prueba ANOVA se emplea cuando se desea com-
parar más de dos grupos (una variable cualitativa
“factor” divide a la muestra en categorías) y la varia-
ble dependiente es un dato cuantitativo. Se parte de
la hipótesis nula que indica que los promedios de los
grupos son todos iguales; la hipótesis del investiga-
dor es que al menos un grupo es diferente.3
Son requisitos para emplear esta prueba: que la va-
riable dependiente cuantitativa debe cumplir con el
supuesto de normalidad en cada uno de los grupos
y además debe existir homogeneidad de la varianza
entre los grupos (homocedasticidad). Si no se cumple
con los supuestos, se deben utilizar pruebas estadísti-
cas no paramétricas en el reemplazo de ANOVA, las
cuales son Kruskal Wallis (para grupos independien-
tes) o Friedman (para grupos asociados).3, 4
En el ejemplo, se tiene la variable grupo de edad, que
divide a la población en tres grupos simétricos y se
desea evaluar si la presión arterial tiene igual prome-
dio en estos tres grupos de edad. (Figura 8)
3.4.1 Pruebas de Post Hoc
En la prueba ANOVA, existe un contraste de hipó-
tesis de medias y que se hace a priori y luego si se
encuentra que hay diferencia signicativa, se deben
emplear las pruebas post hoc.9 Los contrastes a priori
se plantean antes de realizar el experimento y permite
determinar la existencia de diferencias entre las me-
dias y posteriormente se ejecuta una prueba post hoc
que permite identicar qué medias dieren o cual es
el grupo que rompe la igualdad.9 Las pruebas de post
hoc se dividen en dos grandes grupos:
Cuando se asume igual varianza entre los grupos:
HSD Tukey; Bonferroni, GT2 de Hochberg, Si-
dak, Gabriel, Hochberg, Dunnett, Scheffé y DMS.
Cuando no se asume igualdad de varianza entre
los grupos: T2 de Tamhane, T3 de Dunnett, Ga-
mes-Howell y C de Dunnett.
Para saber si hay igualdad de varianza entre los gru-
pos se aplica el test de Levene.
4. Correlación de variables
Se entiende como correlación, a una medida en la que
dos o más variables encuentran relaciones de interde-
pendencia entre sí.10
Para conocer la correlación entre dos variables cuan-
titativas y su tendencia que generalmente es una rela-
ción lineal especíca (recta de regresión lineal según
la nube de puntos se condense en torno a una línea rec-
ta) se usan estadísticos como el coeciente de correla-
ción y que pueden ser de manera paramétrica y de otra
no paramétrica.11 La regresión puede ser lineal simple,
múltiple (varias variables) y regresión logística.11
Las relaciones que pueden existir entre las variables
de interés pueden expresarse a través de una relación
directa o de una relación negativa entre las variables.
Por consiguiente, la correlación es la co-variación
entre las variables de estudio, por lo tanto, la palabra
correlación y covarianza se entiende por el mismo
signicado, así se comprenden al análisis de la varia-
ción de las variables de estudio.10
Si ambas variables cuantitativas dependiente (respuesta
o criterio) e independiente (predictora) se encuentran
con distribución normal se utiliza la correlación de Pear-
son y cuando al menos una de las variables cuantitativas
(dependientes e independientes) presentan distribución
no normal, se usa la correlación de Spearman y cuando
Figura 8. ANOVA de un factor.
Revista OACTIVA UC Cuenca. Vol. 8, No 2, Mayo - Agosto, 2023
Villavicencio Caparó Ebingen y cols.
58
la correlación involucra variables cualitativas ordinales
se usa Tau B de Kendall.12
La prueba de Kendall se utiliza cuando la variable inde-
pendiente es cuantitativa (distribución normal o no nor-
mal) y la variable dependiente es una cualitativa ordinal,
o ambas variables son ordinales. Se calculan en base a
una serie de rangos asignados por lo que no se afectan
por valores atípicos y son apropiados para relaciones
asimétricas, no lineales.13
4.1. Interpretación de la correlación
Las pruebas estadísticas de correlación (R de Pearson,
Rho de Spearman y Tau de B de Kendall) pueden tomar
valores de -1 a +1, por lo tanto, -1 representa una rela-
ción lineal negativa perfecta, el valor de 0 determina la
ausencia de relación entre las variables y +1 establece
una relación lineal positiva perfecta.10
La interpretación de un coeciente de correlación se es-
tablece como una tendencia de la intensidad de la rela-
ción lineal entre dos variables y constituye una medida
puramente matemática, por lo tanto, no puede establecer
la implicación de causa-efecto, ya que pueden estar in-
uidas por otras variables.14
Dentro de un ejemplo al analizar los resultados de la
correlación, encontramos un coeciente de correlación
de 0,191, con un valor de p < 0,001, nos indica que la
fuerza de correlación es muy débil, pero se observa una
correlación signicativa. (Tabla 1) Además al analizar
los resultados de la correlación, en el gráco de disper-
sión, se ve la tendencia positiva de la correlación, el R2
nos muestra que el 3,6% del ángulo interincisivo expli-
ca la variabilidad del ángulo nasolabial (protrusión del
labio superior).14 (Figura 9)
Tabla 1. Correlación del ángulo interincisivo y el nasolabial.
Figura 9. Gráco de dispersión de la correlación del ángulo interincisivo y el nasolabial.
En este tipo de pruebas también se calcula el coe-
ciente de determinación que se obtiene sacando la
raíz cuadrada al valor del coeciente de correlación
(R2) e indica el porcentaje de la variabilidad de la va-
riable dependiente que se explica por la correlación
entre las dos variables.14 Visualmente para la correla-
ción se usa un diagrama de dispersión. En el ejemplo
se desea hallar la correlación entre el ángulo interin-
Revista OACTIVA UC Cuenca. Vol. 8, No 2, Mayo - Agosto, 2023
¿Cómo escoger la prueba estadística? 59
cisivo y el ángulo naso labial, cada uno de los puntos
representa la intersección de un par de observaciones
(X, Y) para observar la fuerza y dirección de la rela-
ción entre las dos variables.14 (Figura 9)
5. Análisis multivariante
Este es un tipo de técnicas estadísticas que permiten
analizar la inuencia de varias variables independien-
tes sobre una variable dependiente; estas variables se
pueden medir en la misma o en diferentes escalas.3
5.1. ANOVA de múltiples factores
Modelo en el cual se presentan dos o más factores
(variables independientes) actúan sobre la variable
respuesta (variable dependiente), donde se pretende
analizar si las variables independientes (factores) in-
uyen en función de los niveles de las otras variables
dependientes.3
5.1.1 ANOVA de múltiples factores equilibrado
Es un modelo que estudia la inuencia de varios fac-
tores sobre otros, cuando el número de observacio-
nes para cada nivel de factor es el mismo siempre.3
(Figura 10)
5.1.2. ANOVA de múltiples factores no equilibrado
A diferencia del modelo multifactorial equilibrado en
este el número de observaciones para cada nivel de
factor no es igual.3 (Figura 11)
Figura 10. ANOVA bifactorial equilibrado de efectos jos.
Figura 11. ANOVA bifactorial no equilibrado de efectos jos.
5.1.3 ANOVA de efecto jo, ANOVA de efecto va-
riado y ANOVA de efecto mixto
Cuando una de las variables es ordinal como el caso
de la variable edad, está determina que el modelo sea
de efecto jo; por el contrario, si la variable edad se
maneja como una variable cuantitativa esta determi-
nará una cantidad tan grande de sub grupos que el
modelo se denomina ANOVA de efecto variado o
aleatorio, si el modelo utiliza los dos tipos se llama
de efecto mixto.3
5.2. Análisis de Varianza (ANCOVA)
Es una prueba que permite examinar datos con una
variable dependiente continua y otras variables inde-
pendientes continuas y nominales. Se establece una
relación de variables independientes y dependientes
similar a la regresión múltiple y del modelo ANOVA.
Adicionalmente, elimina el impacto de una o más va-
riables indeseables. El estudio de la estimación de una
variable dependiente continua a partir de una variable
independiente nominal, controlando el efecto de la
segunda, es el empleo más frecuente del ANCOVA
.3
5.3. Análisis Multivariante de Varianza (MANOVA)
Es una prueba de dependencia que brinda un análisis
de regresión y un análisis de varianza para variables
dependientes múltiples por una o más covariables.
Estima las diferencias entre promedios de varias ca-
tegorías a través del cotejo de variables dependientes
observadas. Tiene una variación unidireccional y bi-
direccional, así como un ANOVA.3
5.4. Análisis Multivariante de Covarianza (MAN-
COVA)
Prueba paramétrica que analiza la relación entre las
variables dependientes e independientes al mismo
tiempo en el que se controlan los efectos de las cova-
riables en una sola variable dependiente, esto permite
observar el efecto real de las variables independientes
sobre las variables dependientes sin interferencias.3
5.5. Modelo Lineal General (MLG)
Es el modelo clásico y más general de regresión li-
neal, incluye el modelo de regresión lineal múltiple
con variables cuantitativas y los modelos de regre-
sión múltiple con variables cuantitativas y cualitati-
vas a la vez, por lo tanto, incluye todos los modelos
de la varianza (ANOVA) y de la covarianza.3
Revista OACTIVA UC Cuenca. Vol. 8, No 2, Mayo - Agosto, 2023
Villavicencio Caparó Ebingen y cols.
60
5.5.1 MLG univariado
Se aplica para un estudio con una variable depen-
diente cuantitativa y con uno o más factores (variable
independiente cualitativa en azul) y/o con una o más
covariables (independiente cuantitativa en rojo) se
utiliza para contrastar la hipótesis de que las varia-
bles independientes tienen efecto sobre las medias de
varias agrupaciones de una única variable indepen-
diente.13 (Figura 12)
5.5.4. Modelo lineal mixto
Es una extensión del modelo lineal general y que
se utiliza el análisis de componentes de la varianza
que permite estimar la contribución de cada efecto
aleatorio a la varianza de la variable dependiente,
usualmente es usado en diseño split-plot, diseños de
medidas repetidas univariada y diseños de bloques
aleatorios.15
5.6. Regresión logística
La Regresión logística constituye el modelo más
frecuente para analizar variables que no dependen
del tiempo. Éste método para determinar factores
de riesgo permite predecir la presencia o no de una
característica o resultado y a diferencia del modelo
lineal, la regresión logística adaptada para variables
dicotómicas se puede aplicar a un rango más amplio
a diferencia del análisis discriminante.3, 15
Es un modelo de análisis multivariado que permite
conocer la relación de dependencia de una variable
respecto a otra, la regresión logística puede ser bino-
mial y multinomial cuando incluye más de 2 catego-
rías.15 (Figura 15)
Figura 12. MLG Univariado.
Figura 14. MLG para medidas repetidas.
Figura 13. MLG Multivariado.
5.5.2 MLG multivariado
Es un análisis de regresión y ANOVA para dos o más
variables dependientes cuantitativas con una o más
covariables (independiente cuantitativa) o factores
(independiente cualitativa), además debe cumplir
con los mismos supuestos preconizados en el MLG
univariado. En el ejemplo se ve cómo 3 variables de-
pendientes se correlacionan con un modelo de inte-
racción matemática que involucra el sexo, lugar de
procedencia, edad y el índice de higiene oral simpli-
cado.13 (Figura 13)
5.5.3 MLG para medidas repetidas
Es un modelo matemático con una variable depen-
diente cuantitativa (medida en distintos tiempos) con
una o más covariables (independiente cuantitativa) o
factores (independiente cualitativa). En el ejemplo
vemos como el nivel de inserción clínica de la encía
(NIC) se mide en el tiempo 1 (Yt1); tiempo 2 (Yt2)
y tiempo 3 (Yt3) y estas mediciones se correlacionan
con la interacción de las variables sexo, bruxismo,
Nivel de Higiene Oral y las veces que el paciente se
cepilla al día.13 (Figura 14)
Figura 15. Regresión Logística
En esta prueba estadística se utiliza comúnmente el
concepto de variable dummy que en español es va-
riable cticia.
Revista OACTIVA UC Cuenca. Vol. 8, No 2, Mayo - Agosto, 2023
¿Cómo escoger la prueba estadística? 61
5.7. Análisis de supervivencia
Un análisis de supervivencia es un método estadísti-
co que sirve para comparar el tiempo promedio que
transcurre desde el inicio del estudio hasta que apare-
ce una enfermedad o condición en el paciente.16
5.7.1 Kaplan Meier
Este modelo de análisis de supervivencia permite cal-
cular la probabilidad condicionada en cada momento
de tiempo (punto temporal) cuando se da el evento,
incluyendo los casos censurados (que son aquellos
que no presentan enfermedad, hasta el nal del estu-
dio). La variable de tiempo debe ser cuantitativa, la
variable evento puede ser cuantitativa (con un punto
de corte) o cualitativa y se pueden adicionar variables
como factor que dividirá a la población en dos grupos
de estudio (Grupo experimental versus control) y se
puede adicionar subgrupos dentro de cada factor tales
como sexo u otros. Se graca en un diagrama de una
función escalonada.16 (Figura 16)
de enfermedad bucal (caries, enfermedad periodon-
tal, índice de higiene oral) y separamos estos pacien-
tes en dos grupos, los más graves y los menos graves,
al determinar este punto de clasicación basado en 3
variables, podemos a futuro asignar los próximos pa-
cientes a un determinado grupo (más grave o menos
grave) en función de la probabilidad que nos informa
el software estadístico.17
5.9 Análisis de clúster
Son algoritmos que sirven para buscar grupos de in-
dividuos similares dentro de una base de datos. Su-
pongamos el mismo ejemplo del párrafo anterior. El
software estadístico clasica a los individuos en gru-
pos homogéneos, no conocidos por el investigador,
pero en función de los datos de las variables (caries,
enfermedad periodontal, índice de higiene oral) de la
base de datos.18
5.9.1 Clúster jerárquicos
Organiza los individuos de estudio en varios niveles
de agrupación y utiliza variables cuantitativas y cua-
litativas. El software asigna la cantidad de grupos de
manera automática. Expresa los resultados de manera
gráca mediante un Dendograma.18 (Figura 17)
5.9.2 Clúster no jerárquicos
Organiza los individuos en función de la cantidad de
grupos que el investigador dene de antemano. Uti-
liza solamente variables cuantitativas, por esa razón
emplea la dispersión (desviación estándar o varian-
za) como criterio para generar grupos similares entre
ellos.18
Figura 16. Estimador Kaplan Meier
Figura 17. Dendrograma
5.7.2 Regresión de COX
Este análisis de supervivencia se basa en el cálculo
de riesgo proporcional, que es una medida de la po-
sibilidad de que el evento aparezca en un momento
o tiempo determinado, pero se enfoca además en la
proporción de los efectos que imprimen las covaria-
bles a esta función de riesgo.16
5.8 Análisis discriminante
Permite asignar o clasicar sujetos de estudio dentro
de grupos previamente reconocidos o denidos por el
investigador. Por ejemplo, si tenemos un grupo de pa-
cientes a los cuales se les ha medido varias variables
Revista OACTIVA UC Cuenca. Vol. 8, No 2, Mayo - Agosto, 2023
Villavicencio Caparó Ebingen y cols.
62
5.10 Análisis de interdependencia de variables
Este tipo de pruebas estadísticas multivariadas anali-
zan la relación mutua entre un conjunto de variables.
No se enfocan en la relación causal entre variables,
sino más bien en el supuesto de que las variables
comparten variabilidad (esto es que si una variable
aumenta la otra aumenta junto a esta).19
5.10.1 Análisis de componentes principales
Es un método estadístico de reducción de la cantidad
de variables independientes que están correlaciona-
das con una variable dependiente. Se busca dentro
de un conjunto de variables de una base de datos, eli-
minar las variables que no estén correlacionadas con
la variable dependiente, para quedarnos solamente
con un conjunto de variables que puedan explicar la
variabilidad de la variable principal. Todas las va-
riables en cuestión deben ser cuantitativas. Se utili-
za un gráco denominado gráco de sedimentación
(Scree plot) para identicar la cantidad de factores
(variables agrupadas) que deben ser retenidas en el
estudio.19
5.10.2 Análisis factorial
Es un análisis que permite reducir la cantidad de va-
riables de una base de datos analizando la interde-
pendencia entre ellas y proporciona conocimiento de
la estructura subyacente entre ellas (grupos de varia-
bles que están correlacionadas entre sí). Este análisis
se realiza partiendo de la suposición de que existen
variables no medidas (que surgen de la interacción
entre variables que se pueden agrupar entre ellas) lla-
madas variables latentes sintéticas e inobservables. 20
(Figura 18)
Figura 18. Análisis factorial
Cantidad grande de variables en la base de datos,
dispuestas de la manera en la que aparecieron al
momento de la medición. Las mismas variables or-
denadas y agrupadas (como factores) de acuerdo a
la interrelación que presentan entre ellas y con la
variable dependiente. Estas nuevas variables (fac-
tores) halladas por análisis factorial permiten colo-
carles nombres y luego hacer la interpretación de lo
que signican conceptualmente. De tal manera que
esas variables agrupadas conformar una dimensión
y el conjunto de dimensiones conforman el total del
constructo (Figura 18).21
5.11 Análisis de reducción de variables
5.11.1 Análisis de correspondencias simple
Llamado también análisis factorial de corresponden-
cias, es un método multivariante factorial que tiene
como objeto la reducción de la dimensión de una ta-
bla de contingencia (la cantidad de columnas), este
análisis se aplica cuando hay dos variables cualitati-
vas. La idea es agrupar variables y tener un modelo
más simple que permitirá un estudio más simple del
problema. Este análisis se entiende mejor partiendo
del ejemplo de la tabla bivariada en la que se aplica
una prueba Chi cuadrado y este test solo determina si
hay o no asociación entre variables, pero no se sabe
qué categorías estaban implicadas en esta asociación,
por lo que el análisis de correspondencias múltiples
extrae relaciones entre categorías y dene similari-
dades entre ellas, lo que permite agrupar o colapsar
categorías si se detecta que se corresponden.22, 23
5.11.2 Análisis de correspondencias múltiples
Es la ampliación del análisis de correspondencias
simple a una situación en la que se tiene más de dos
variables. Por lo tanto, ya no se usa una tabla de con-
tingencia, al contrario, una tabla de Burt. 22
5.12 Análisis de series temporales
Estos análisis pretenden hacer una predicción del
Revista OACTIVA UC Cuenca. Vol. 8, No 2, Mayo - Agosto, 2023
¿Cómo escoger la prueba estadística? 63
comportamiento de una variable a futuro, existen
predicciones condicionales (mediante modelos cau-
sales) e incondicionales (mediante métodos autopro-
yectivos). Las series temporales son una sucesión de
observaciones cuantitativas de un fenómeno, ordena-
das en el tiempo.24
5.12.1 Análisis de la tendencia
Una serie de tiempo está formada por cuatro compo-
nentes teóricas.25
- Tendencia (T): Dirección predominante de la se-
rie a largo plazo.
- Variaciones estacionales (E): Oscilaciones que se
producen en períodos menores a un año.
- Variaciones cíclicas (C): Oscilaciones que se pro-
ducen con un período superior al año.
- Variaciones residuales (R): Son movimientos en
la serie que son originados por circunstancias ac-
cidentales o aleatorias.
Un primer método de análisis es el gráco, que direc-
tamente se llevan los datos a un gráco de dispersión
con coordenadas. Un segundo método es el denomi-
nado Medias móviles que consiste en promediar cada
valor de la serie con algunas observaciones anteriores
y posteriores con la nalidad de eliminar variaciones
accidentales, a esto se le denomina una serie sua-
vizada. El tercer método es de mínimos cuadrados,
que ajusta los datos en una función lineal mediante
el método de mínimos cuadrados en la cual la varia-
ble tiempo entra como variable explicativa (indepen-
diente).25
DISCUSIÓN
Existen diversas formas de organizar o categorizar
las prueba estadísticas, algunos textos priorizan la
división entre pruebas paramétricas y no paramétri-
cas, otros textos realizan la clasicación de las prue-
bas y técnicas estadísticas de acuerdo a la naturale-
za estadística de la variable independiente (ordinal,
nominal, discreta, continua) y otros textos lo hacen
en función de la aparición en la plataforma de cierto
programa estadístico,2,3 sea cual sea la forma de hacer
la clasicación u organización de estas pruebas, lo
importante es que el lector tenga la herramienta que
está buscando, en función de su diseño de estudio,
el presente trabajo es un esfuerzo por presentar un
listado de pruebas estadísticas desde la clasicación
de la lógica que subyace para la ejecución de las
mismas, con lo que esperamos el lector pueda tener
una herramienta adicional al momento de escoger la
prueba estadística que empleará en su proyecto de in-
vestigación.3,8
Tal como sucede en el Vademecum médico, que es un
conjunto de capítulos de listados de medicamentos
con los aspectos más sucintos de los fármacos, el pre-
sente texto pretende ser el Vademecum estadístico,
para los investigadores en ciencias de la salud, moti-
vo por el cual este trabajo no ahonda en los modelos
matemáticos, ni en los procedimientos de los paque-
tes estadísticos, para llegar a realizar un ejercicio de
los tema tratados, por el contrario pretende ser una
lista de prescripciones estadísticas que se tengan en
un solo documento a n de servir de guía para el lec-
tor y que luego este pueda profundizar en la prueba
estadística que escoge, en libros de texto o en tutoria-
les de internet que son abundantes.2
Una limitación del presente artículo de contribución
didáctica docente, es que, dada la naturaleza del tipo
de publicación, se ha tenido que reducir las explica-
ciones a lo mínimo indispensable que permita iden-
ticar la prueba estadística y para qué sirve, motivo
por el cual en la mayoría de temas tratados no se ha
desarrollado los resultados que entregan los paquetes
estadísticos.
CONCLUSIONES
Se pueden agrupar las pruebas estadísticas univa-
riadas, bivariadas y multivariadas; desde el enfoque
de la visión del usuario, con la nalidad de brindar
una alternativa de explicación y agrupación didáctica
para quienes los textos regulares resultan de difícil
comprensión.
Referencias Bibliográcas
1. Troya A. Técnicas estadísticas en el análisis
cuantitativo de datos. RSIGMA. [Internet].
2019; 15(1): 28-44. Disponible en: https://re-
vistas.udenar.edu.co/index.php/rsigma/article/
download/4905/5671
2. Villavicencio-Caparó E. Auditoría de la Inves-
Revista OACTIVA UC Cuenca. Vol. 8, No 2, Mayo - Agosto, 2023
Villavicencio Caparó Ebingen y cols.
64
tigación Cientíca Biomédica. Editor A, editor.
2016.
3. Riegelman R, Hirsch R. Cómo estudiar un estu-
dio y probar una prueba: lectura crítica de la lite-
ratura médica. OPS [Internet]. 1992. Disponible
en: https://iris.paho.org/handle/10665.2/3309
4. Spiegel MR. Estadística. Avaraca, Madrid: Mc-
graw Hill/interamericana de España. S. A. U.;
1991.
5. Caparó EV. El tamaño muestral para la tesis.
¿cuántas personas debo encuestar? Odontol Act.
[Internet]. 2017; 2(1): 59-62. Disponible en: ht-
tps://oactiva.ucacue.edu.ec/index.php/oactiva/
article/view/175
6. Mendivelso F, Rodríguez M. Prueba Chi-Cua-
drado de independencia aplicada a tablas
2xN. Rev Medica Sanitas. [Internet]. 2018;
21(2): 92-5. Disponible en: http://dx.doi.
org/10.26852/01234250.6
7. Gómez OT. Una aplicación de la prueba chi
cuadrado con SPSS. Industrial Data. [Internet].
2008; 11(1): 73-7. Disponible en: https://www.
redalyc.org/articulo.oa?id=81611211011
8. Caparó EV, Cordero MCA, Leon KC, Curipo-
ma MC, Vivar DP, Cordero AA. Diseños de
estudios clínicos en odontología. Odontol Act.
[Internet]. 2016; 1(2): 81-4. Disponible en: ht-
tps://oactiva.ucacue.edu.ec/index.php/oactiva/
article/view/163
9. Calderón MC, Altamirano IV. Prueba T de
Student para una investigación odontológica.
Odontol Act. [Internet]. 2022; 7(1): 49-54. Dis-
ponible en: https://oactiva.ucacue.edu.ec/index.
php/oactiva/article/view/562
10. Bustamante C, Mendoza Quispe C. Estudios de
Correlación. Revista de Actualización Clínica.
[Internet]. 2013; (33): 1691-1693. Disponi-
ble en: https://docplayer.es/39252129-Revis-
ta-de-actualizacion-clinica-volumen.html
11. Martínez-Curbelo G, Cortés-Cortés ME, -
rez-Fernández A. Metodología para el análisis
de correlación y concordancia en equipos de
mediciones similares. Universidad y Sociedad.
[Internet]. 2016; 8(4): 65-70. Disponible en:
http://scielo.sld.cu/scielo.php?script=sci_abs-
tract&pid=S2218-36202016000400008&ln-
g=es&nrm=iso&tlng=es
12. Roy-García I, Rivas-Ruiz R, Pérez-Rodríguez
M, Palacios-Cruz L. Correlación: no toda co-
rrelación implica causalidad. Rev Alerg. [Inter-
net]. 2019; 66(3): 354-60. Disponible en: http://
www.scielo.org.mx/scielo.php?script=sci_abs-
tract&pid=S2448-91902019000300354&ln-
g=es&nrm=iso&tlng=es
13. del Campo N, Matamoros L. Técnicas estadís-
ticas para identicar posibles relaciones biva-
riadas. Rev Cubana Hig Epidemiol. [Internet].
2020; 19(2): 1-23. Disponible en: https://www.
medigraphic.com/pdfs/revcubanerea/rca-2020/
rca202h.pdf
14. Martínez-Ortega R, Tuya-Pendás L, Martí-
nez-Ortega M, Pérez-Abreu A, Cánovas A. El
coeciente de correlacion de los rangos de Spe-
arman caracterización. Rev haban cienc méd.
[Internet]. 2009; 8(2): 1-19. Disponible en:
http://scielo.sld.cu/scielo.php?script=sci_abs-
tract&pid=S1729-519X2009000200017&ln-
g=es&nrm=iso&tlng=es
15. López CP. Técnicas estadísticas con SPSS 12:
Aplicaciones al análisis de datos. [Internet].
Pearson Educación. 2005. 824 p. Disponible en:
https://www.worldcat.org/es/title/tecnicas-es-
tadisticas-con-spss-12-aplicaciones-al-anali-
sis-de-datos/oclc/60556857
16. José B, Pérez E, Madero R. Métodos esta-
dísticos en estudios de supervivencia. An
Pediatr Contin. [Internet]. 2009; 7(1): 55-9.
Disponible en: https://www.elsevier.es/es-re-
vista-anales-pediatria-continuada-51-articu-
lo-metodos-estadisticos-estudios-superviven-
cia-S1696281809704536
17. Torrado-Fonseca M, Berlanga-Silvente V. Aná-
lisis discriminante mediante SPSS. REIRE [In-
ternet]. 2013; (2), 150-166. Disponible en:
http://www.ub.edu/ice/reire.htm
18. Santana OF. El análisis de cluster: aplicación,
interpretación y validación. Papers: revista de
sociologia. [Internet]. 1991; 65-76. Disponible
en: https://www.raco.cat/index.php/Papers/arti-
cle/download/25102/58448
19. Navarro-Céspedes JM, Casas-Cardoso GM,
Rodríguez EG. Análisis de componentes prin-
cipales y análisis de regresión para datos cate-
góricos. Aplicación en la hipertensión arterial.
RMTA. [Internet]. 2010; 17(2): 199-230. Dis-
ponible en: https://revistas.ucr.ac.cr/index.php/
matematica/article/download/2128/2091
20. IBM SPSS Statistics. Análisis factorial. [In-
ternet]. 2022 Disponible en: https://www.ibm.
com/docs/es/spss-statistics/29.0.0?topic=featu-
res-factor-analysis
21. Villavicencio-Caparó E. Validación de cues-
tionarios. Odontol Act Rev Cient. [Internet].
2018; 1(3): 71-6. Disponible en: https://prue-
bas3.ucacue.edu.ec/index.php/oactiva/article/
view/200
Revista OACTIVA UC Cuenca. Vol. 8, No 2, Mayo - Agosto, 2023
¿Cómo escoger la prueba estadística? 65
22. Rodríguez-Jaume M, Mora-Catalá R. Análisis
de regresión múltiple. Capítulo 3 [Internet].
2001. Disponible en: https://rua.ua.es/dspace/
bitstream/10045/12073/1/Capitulo3.pdf
23. Tovar A, Paternina L, Morinson M. Análisis de
correspondencia aplicado al estado nutricional
de las mujeres entre 15 a 49 años en departa-
mentos de Colombia. Vicerectora administra-
tivo y nanciero. [Internet]. 2017; 2(2): 1-7.
Disponible en: https://www.uniatlantico.edu.
co/wp-content/uploads/2021/11/MEMORIAS_
EIEM_3-12-SEPTIEMBRE-No-2-compressed.
pdf#page=7
24. Series Temporales. Análisis de la Tendencia [In-
ternet]. 2021. Disponible en: https://www.you-
tube.com/watch?v=td6Yn3f--IQ
25. Corres G, Esteban A, García J, Zárate C. Aná-
lisis de series temporales. RII [Internet]. 2009;
8(1): 21-23. Disponible en: https://revistas.ubio-
bio.cl/index.php/RI/article/view/80
Recibido: 14 marzo 2023
Aceptado: 22 abril 2023
Revista OACTIVA UC Cuenca. Vol. 8, No 2, Mayo - Agosto, 2023
Villavicencio Caparó Ebingen y cols.
14