Revista OACTIVA UC Cuenca. Vol. 8, No 2, Mayo - Agosto, 2023

¿Cómo escoger la prueba estadística?

¿CÓMO ESCOGER LA PRUEBA ESTADÍSTICA?

MANEJO DE DATOS PARTE 2

How to choose the statistical test?

Data management part 2

Villavicencio Caparó Ebingen *1 - https://orcid.org/0000-0003-4411-4221

Lima Illescas Miriam 1 - https://orcid.org/0000-0001-6844-3826

Cuenca León Katherine 1 - https://orcid.org/0000-0002-7816-0114

Patiño Ramón Estefanía 1 - https://orcid.org/0009-0008-6134-0793

Pacheco Quito Edisson 1 - https://orcid.org/0000-0002-6168-3218

1 Carrera de Odontología, Universidad Católica de Cuenca, 010101 Cuenca, Ecuador

* evillavicencioc@ucacue.edu.ec

RESUMEN

Objetivo: El objetivo del presente artículo es poner a disposición del personal de salud, un listado de pruebas estadís-

ticas aplicables a investigaciones en el campo de la medicina basada en evidencia. Materiales y métodos: Las fuentes

consultadas para este trabajo fueron libros de la estadística, artículos de revistas cientícas indexadas, con ejemplos

de investigaciones en ciencias de la salud. Resultados: Se encontraron 24 pruebas estadísticas con sus respectivas

explicaciones de cuándo aplicar, cómo aplicar e interpretar los resultados; las que se agruparon en cuatro grandes

grupos de familias de pruebas estadísticas y un grupo de pruebas emergentes, en base a la dirección de la naturaleza de

la hipótesis planteada. Conclusión: Existen diversos métodos estadísticos que se pueden agrupar en cinco categorías.

Palabras clave: Análisis Multivariante, Estadística, Análisis de Datos.

ABSTRACT

Aim: The objective of this article is to make available to health personnel a list of statistical tests applicable to research

in the eld of evidence-based medicine. Materials and methods: The sources consulted for this work were statistical

books, articles from indexed scientic journals, with examples of research in health sciences. Results: 24 statistical

tests were found with their respective explanations of when to apply, how to apply and how to interpret the results;

these were grouped into four large groups of families of statistical tests and a group of emerging tests, based on the

direction of the nature of the hypothesis posed. Conclusion: There are several statistical methods that can be grouped

into ve categories.

Key words: Multivariate Analysis, Statistics, Data Analysis.

Artículo Contribución Didáctica. Revista OACTIVA UC Cuenca. Vol. 8, No 2., pp. 53-66, Mayo-Agosto,2023

ISSN 2588-0624. ISSN Elect. 258802624. Universidad Católica de Cuenca

Revista OACTIVA UC Cuenca. Vol. 8, No 2, Mayo - Agosto, 2023

Villavicencio Caparó Ebingen y cols.

INTRODUCCIÓN

La estadística es una disciplina de la matemática que

se encarga de la toma adecuada de los datos, la siste-

matización de estos, el reporte, el análisis y la inter-

pretación de los mismos.

Existen 3 niveles de análisis estadístico, el primero es

el análisis univariad1, en el que el objetivo es reportar

los estadísticos de las variables de manera individual

con tablas de frecuencias y porcentajes si es una va-

riable cualitativa y con estadísticos tipo medidas de

centralización, dispersión, posición y forma en caso

sea una variable cuantitativa.2

En el segundo nivel de análisis estadístico llamado

bivariado, se analiza las asociaciones, relaciones y

comparaciones entre variables, para realizar esto el

investigador se vale de tablas de doble entrada llama-

das también tablas de contingencia. En este nivel de

análisis se utilizan las pruebas estadísticas de compa-

ración de proporciones, comparación de promedios

y/o correlación de variables, que se presentan en este

artículo.3

En el tercer nivel de análisis estadístico llamado mul-

tivariante3, se tiene una variable dependiente y dos o

más variables independientes. Este nivel de análisis

en las investigaciones de salud basada en evidencia,

tiene tres ventajas la primera, es que permite analizar

el efecto de una variable independiente sobre la va-

riable dependiente, controlando o ajustando el efecto

de las covariables que no se pudieron controlar en

el diseño del estudio; la segunda ventaja es que este

nivel de análisis permite hacer pruebas estadísticas

de varias variables a la vez, manteniendo al mis-

mo tiempo la probabilidad de cometer error tipo I

(p<0,05).3 Y la tercera ventaja es la posibilidad de

comparar por separado la capacidad de dos o más

variables independientes para predecir los valores de

la variable dependiente. Al respecto existen muchos

textos de consulta, sin embargo, la forma de agrupar

las pruebas estadísticas, desde la visión del usuario,

es el aporte que pretendemos dar a la academia, con

la nalidad de hacer más fácil la identicación de la

estrategia estadística que debe usar el profesional de

la salud al momento de realizar un estudio clínico.

Finalmente aparece un grupo de pruebas estadísticas

emergentes, actualmente muy poco utilizadas en me-

dicina basada en evidencia, que se llaman SEM-Mo-

delo de ecuaciones estructurales, son técnicas estadís-

ticas multivariadas, que integran ecuaciones lineales

para estimar las relaciones complejas de dependencia

entre variables de diferentes grupos y para determi-

nar el error de medida en la estimación. Se diferen-

cian seis fases para el modelo SEM: especicación,

identicación, estimación de parámetros, evaluación

de ajuste, reespecicación y la interpretación.1,3

El objetivo del presente estudio es presentar un lista-

do de las pruebas estadísticas y métodos más utiliza-

dos, que sean de utilidad para el personal de salud al

momento de planicar un estudio clínico.

ESTADO DEL ARTE

1. Intervalo de conanza

El intervalo de conanza (IC) es la prueba estadística in-

ferencial que se aplica en estudios descriptivos, se utili-

zan con el n de inferir los resultados desde una muestra

hacia una población total. Los estadísticos calculados en

la muestra se llaman estimadores y los estadísticos de la

población se llaman parámetros; toda muestra tiene un

margen de error, entre el valor de los estimadores y el

de los parámetros, los IC describen esta variación de la

dimensión obtenida en una muestra y la dimensión real

de una población. Por esta razón es necesario conocer

junto al estadístico muestral una medida del grado de

conanza que esta tiene, usualmente es de 95%.4

La interpretación de los Niveles de Conanza se haría

de la siguiente manera; la prevalencia de la muestra

es 80%; se estima que en la población total la preva-

lencia uctúa entre 79% a 81%, esto se puede armar

con un 95% de conanza. (Figura 1)

Figura 1. Esquema del diseño descriptivo con

intervalos de conanza.

2. Comparación de proporciones

Antes de realizar cualquier prueba estadística es impor-

tante tener en cuenta en el diseño del estudio, que el

tamaño de la muestra está estrechamente relacionado

Revista OACTIVA UC Cuenca. Vol. 8, No 2, Mayo - Agosto, 2023

¿Cómo escoger la prueba estadística? 55

con la posibilidad de detectar el tamaño del efecto de la

variable estímulo y por consiguiente con la potencia del

estudio. En ese sentido para poder utilizar una prueba

estadística de manera adecuada y que el resultado de la

prueba de hipótesis sea válido, se debe tener en cuenta

tanto la conabilidad (error tipo I) y la potencia del es-

tudio (error tipo II).5

2.1 Chi cuadrado X2

Las variables cualitativas, dan como resultado estadísti-

co la categorización de las unidades de estudio en sub-

grupos. Por ejemplo: varones y mujeres; sanos y enfer-

mos; éxitos y fracasos; pacientes de alta y pacientes en

tratamiento. (Figura 2) La proporción de cada subgrupo

se puede expresar en porcentaje. La prueba chi cuadrado

(conocida también como Ji cuadrado) permite saber si la

diferencia entre estas proporciones es estadísticamente

signicativa, cuando se usa de esta forma se le conoce

como Prueba X2 de homogeneidad de frecuencias.4

- En primera instancia se deberá plantear el sistema

de hipótesis.

• Ho: El acceso a los servicios de salud es inde-

pendiente al tipo de procedencia de los usuarios

(La hipótesis nula siempre indicará la indepen-

dencia de las variables).

• Ha El acceso a los servicios de salud es depen-

diente al tipo de procedencia de los usuarios (La

hipótesis alternativa o del investigador).

- Como segundo paso se debe aplicar la prueba esta-

dística a los datos.

- Finalmente se interpreta el resultado en función del

valor de signicancia (valor p), si el valor es igual

o mayor a 0,05 aceptamos la Ho (las variables son

independientes) si por el contrario el valor es menor

a 0,05 rechazamos la hipótesis nula Ho y aceptamos

provisionalmente la hipótesis del investigador (Ha),

por lo que decidimos concluir que el acceso a servi-

cios de salud depende del tipo de procedencia de los

usuarios.

En esta familia de pruebas estadísticas tenemos:

- La prueba X2 de Pearson es la prueba estándar que

se usa cuando se utilizan unidades de estudio mayo-

res a 5 en la tabla de contingencia.4

- La prueba X2 de Yates se usa cuando al menos 1 ca-

silla de la tabla de contingencia tiene menos de 5

unidades de estudio.4

- La prueba X2 de Fisher se emplea cuando la muestra

es demasiado pequeña, es decir el 80% de celdas de

una tabla de contingencia contiene unidades de es-

tudio inferiores a 5.4

- La prueba X2 de Mac Nemar se emplea cuando la

tabla de contingencia contiene los datos del mismo

grupo, pero con mediciones de dos tiempos distintos

por ejemplo antes del tratamiento y después del tra-

tamiento (Figura 3).4

Figura 2. Grupos con proporciones.

Figura 3. Sub grupos de enfermos y sanos dentro de

los grupos de expuestos y no expuestos

Otra aplicación de la prueba X2 es cuando se desea com-

probar la asociación entre dos variables cualitativas, es

decir si la variable que divide a la población en grupos

(expuestos y no expuestos) es una característica, un há-

bito o una determinante de la salud, que se sospecha que

está asociada con la mayor probabilidad de desarrollar

la enfermedad, realmente genera una mayor proporción

de enfermos y si esta es estadísticamente signicativa.6

El Ji cuadrado (X2) como se mencionó antes, sirve para

asociar dos variables cualitativas e incluso más varia-

bles con tablas complejas, mientras se cumplan los su-

puestos necesarios para su aplicación; de tal modo que

para ejemplicar vamos a trabajar con dos variables:

acceso a servicios de salud (si - no) y procedencia (ur-

bano - rural).6

En donde vamos a determinar si: ¿El acceso a los servi-

cios de salud está asociado a la procedencia de los usua-

rios? con un nivel de conanza del 95% y por lo tanto

una probabilidad de error del 5% que es equivalente a

p = 0,05.7

Revista OACTIVA UC Cuenca. Vol. 8, No 2, Mayo - Agosto, 2023

Villavicencio Caparó Ebingen y cols.

2.2 Medidas epidemiológicas de asociación de va-

riables

Cuando se está realizando un estudio con diseño de ca-

sos-controles3,8 el objetivo es comparar las proporcio-

nes de expuestos y no expuestos dentro de los grupos

de los casos (enfermos) y de los controles (sanos), la

medida estadística que se usa es el Odds Ratio (O.R.)

o Razón de momios, que se expresa en una escala que

va desde cero hasta innito. (Figura 4) Cuando el valor

es mayor a 1 se trataría de una asociación de variables

donde la variable independiente es un factor de riesgo;

si el valor del resultado es igual a 1; se interpreta que

no hay asociación entre las variables; en el caso de que

el resultado sea menos de 1; se interpreta que la varia-

ble de exposición es un factor de protección. Cuando se

realiza un estudio epidemiológico de cohortes la medida

estadística que se usa es el Riesgo Relativo (R.R.) y se

interpreta de la misma forma que el OR. (Figura. 4) Por

ejemplo, un OR de 17 signica que el grupo de expues-

tos tiene 17 veces más probabilidad de enfermar que los

no expuestos.

una herramienta que sirve para saber mediante una

prueba de hipótesis, si la media de un único grupo di-

ere de un valor determinado.9 (Figura 5) Toda prueba

t de Student parte del supuesto de que los datos tienen

distribución normal y un mínimo de 30 unidades de es-

tudio por grupo; en este caso si no se cumple con alguno

de los supuestos es recomendable usar la prueba de los

signos de Wilcoxon.9

3.3 Prueba t para muestras relacionadas

Esta prueba se utiliza para comprobar si hay una dife-

rencia signicativa en medidas relacionadas. Es decir,

busca determinar si la diferencia entre medidas de antes

Figura 5. Comparación de un promedio con valor determinado.

Figura 4. Escala de interpretación OR y RR.

Figura 6. Comparación de promedios. Grupos independientes.

A estos estadísticos se les aplica el concepto de interva-

lo de conanza, en el ejemplo de la gura 4; un resul-

tado de OR=2 que tiene un intervalo de conanza que

va desde 1 hasta 3, se interpreta que no hay asociación

porque basta que el intervalo de conanza toque la zona

del 1 para que la asociación se interprete como nula.

3. Comparación de promedios

De igual forma en el caso de las pruebas para compara-

ción de promedios, la diferencia del promedio 1 y pro-

medio2; es la magnitud de o tamaño de efecto a tener en

cuenta para el cálculo de la muestra; si el tamaño de los

grupos no se determina mediante una fórmula de mues-

treo, es imposible saber con qué conabilidad se acepta

o rechaza la hipótesis y por consiguiente también queda

en duda con qué potencia se realiza esta armación, en

tal sentido es necesario utilizar esta estrategia de deter-

minación del tamaño muestral para lograr conclusiones

con validez cientíca.5

3.1 Prueba t para una muestra

La prueba t (también llamada prueba t de Student) es

3.2 Prueba t para muestras independientes

Es una prueba paramétrica utilizada para la compara-

ción de medias entre dos grupos independientes del

mismo tamaño. Los grupos independientes son aquellos

que están bien diferenciados, es decir, al desarrollar una

investigación, es necesario conocer si hay diferencias

entre los grupos de una muestra; por ejemplo: si estás

midiendo la estatura en una población nos interesaría

conocer las diferencias entre el grupo de hombres y el

grupo de mujeres, lo que representan grupos indepen-

dientes, cada uno con sus características bien diferen-

ciadas. (Figura 6) Por lo tanto, la prueba t busca com-

parar las medias entre dos grupos independientes con

muestras inferiores a 30 sujetos.9 Si no se cumple el su-

puesto de normalidad entonces se debe utilizar la prue-

ba no paramétrica U de Mann Whitney. Las pruebas de

normalidad que se utilizan usualmente son:

- Kolmogorov Smirnov (de 31 a más muestras)

- Shapiro Wilk (de 30 a menos muestras)

Revista OACTIVA UC Cuenca. Vol. 8, No 2, Mayo - Agosto, 2023

¿Cómo escoger la prueba estadística? 57

y después en las mismas unidades de estudio ha variado

de manera estadísticamente signicativa.9 (Figura 7)

Figura 7. Comparación de promedios. Grupos asociados. Un solo

grupo en dos momentos distintos.

Si no se cumple el supuesto de normalidad entonces

se debe utilizar la prueba no paramétrica Wilcoxon

en reemplazo de esta técnica.

3.4 ANOVA de un factor

La prueba ANOVA se emplea cuando se desea com-

parar más de dos grupos (una variable cualitativa

“factor” divide a la muestra en categorías) y la varia-

ble dependiente es un dato cuantitativo. Se parte de

la hipótesis nula que indica que los promedios de los

grupos son todos iguales; la hipótesis del investiga-

dor es que al menos un grupo es diferente.3

Son requisitos para emplear esta prueba: que la va-

riable dependiente cuantitativa debe cumplir con el

supuesto de normalidad en cada uno de los grupos

y además debe existir homogeneidad de la varianza

entre los grupos (homocedasticidad). Si no se cumple

con los supuestos, se deben utilizar pruebas estadísti-

cas no paramétricas en el reemplazo de ANOVA, las

cuales son Kruskal Wallis (para grupos independien-

tes) o Friedman (para grupos asociados).3, 4

En el ejemplo, se tiene la variable grupo de edad, que

divide a la población en tres grupos simétricos y se

desea evaluar si la presión arterial tiene igual prome-

dio en estos tres grupos de edad. (Figura 8)

3.4.1 Pruebas de Post Hoc

En la prueba ANOVA, existe un contraste de hipó-

tesis de medias y que se hace a priori y luego si se

encuentra que hay diferencia signicativa, se deben

emplear las pruebas post hoc.9 Los contrastes a priori

se plantean antes de realizar el experimento y permite

determinar la existencia de diferencias entre las me-

dias y posteriormente se ejecuta una prueba post hoc

que permite identicar qué medias dieren o cual es

el grupo que rompe la igualdad.9 Las pruebas de post

hoc se dividen en dos grandes grupos:

• Cuando se asume igual varianza entre los grupos:

HSD Tukey; Bonferroni, GT2 de Hochberg, Si-

dak, Gabriel, Hochberg, Dunnett, Scheffé y DMS.

• Cuando no se asume igualdad de varianza entre

los grupos: T2 de Tamhane, T3 de Dunnett, Ga-

mes-Howell y C de Dunnett.

Para saber si hay igualdad de varianza entre los gru-

pos se aplica el test de Levene.

4. Correlación de variables

Se entiende como correlación, a una medida en la que

dos o más variables encuentran relaciones de interde-

pendencia entre sí.10

Para conocer la correlación entre dos variables cuan-

titativas y su tendencia que generalmente es una rela-

ción lineal especíca (recta de regresión lineal según

la nube de puntos se condense en torno a una línea rec-

ta) se usan estadísticos como el coeciente de correla-

ción y que pueden ser de manera paramétrica y de otra

no paramétrica.11 La regresión puede ser lineal simple,

múltiple (varias variables) y regresión logística.11

Las relaciones que pueden existir entre las variables

de interés pueden expresarse a través de una relación

directa o de una relación negativa entre las variables.

Por consiguiente, la correlación es la co-variación

entre las variables de estudio, por lo tanto, la palabra

correlación y covarianza se entiende por el mismo

signicado, así se comprenden al análisis de la varia-

ción de las variables de estudio.10

Si ambas variables cuantitativas dependiente (respuesta

o criterio) e independiente (predictora) se encuentran

con distribución normal se utiliza la correlación de Pear-

son y cuando al menos una de las variables cuantitativas

(dependientes e independientes) presentan distribución

no normal, se usa la correlación de Spearman y cuando

Figura 8. ANOVA de un factor.

Revista OACTIVA UC Cuenca. Vol. 8, No 2, Mayo - Agosto, 2023

Villavicencio Caparó Ebingen y cols.

la correlación involucra variables cualitativas ordinales

se usa Tau B de Kendall.12

La prueba de Kendall se utiliza cuando la variable inde-

pendiente es cuantitativa (distribución normal o no nor-

mal) y la variable dependiente es una cualitativa ordinal,

o ambas variables son ordinales. Se calculan en base a

una serie de rangos asignados por lo que no se afectan

por valores atípicos y son apropiados para relaciones

asimétricas, no lineales.13

4.1. Interpretación de la correlación

Las pruebas estadísticas de correlación (R de Pearson,

Rho de Spearman y Tau de B de Kendall) pueden tomar

valores de -1 a +1, por lo tanto, -1 representa una rela-

ción lineal negativa perfecta, el valor de 0 determina la

ausencia de relación entre las variables y +1 establece

una relación lineal positiva perfecta.10

La interpretación de un coeciente de correlación se es-

tablece como una tendencia de la intensidad de la rela-

ción lineal entre dos variables y constituye una medida

puramente matemática, por lo tanto, no puede establecer

la implicación de causa-efecto, ya que pueden estar in-

uidas por otras variables.14

Dentro de un ejemplo al analizar los resultados de la

correlación, encontramos un coeciente de correlación

de 0,191, con un valor de p < 0,001, nos indica que la

fuerza de correlación es muy débil, pero se observa una

correlación signicativa. (Tabla 1) Además al analizar

los resultados de la correlación, en el gráco de disper-

sión, se ve la tendencia positiva de la correlación, el R2

nos muestra que el 3,6% del ángulo interincisivo expli-

ca la variabilidad del ángulo nasolabial (protrusión del

labio superior).14 (Figura 9)

Tabla 1. Correlación del ángulo interincisivo y el nasolabial.

Figura 9. Gráco de dispersión de la correlación del ángulo interincisivo y el nasolabial.

En este tipo de pruebas también se calcula el coe-

ciente de determinación que se obtiene sacando la

raíz cuadrada al valor del coeciente de correlación

(R2) e indica el porcentaje de la variabilidad de la va-

riable dependiente que se explica por la correlación

entre las dos variables.14 Visualmente para la correla-

ción se usa un diagrama de dispersión. En el ejemplo

se desea hallar la correlación entre el ángulo interin-

Revista OACTIVA UC Cuenca. Vol. 8, No 2, Mayo - Agosto, 2023

¿Cómo escoger la prueba estadística? 59

cisivo y el ángulo naso labial, cada uno de los puntos

representa la intersección de un par de observaciones

(X, Y) para observar la fuerza y dirección de la rela-

ción entre las dos variables.14 (Figura 9)

5. Análisis multivariante

Este es un tipo de técnicas estadísticas que permiten

analizar la inuencia de varias variables independien-

tes sobre una variable dependiente; estas variables se

pueden medir en la misma o en diferentes escalas.3

5.1. ANOVA de múltiples factores

Modelo en el cual se presentan dos o más factores

(variables independientes) actúan sobre la variable

respuesta (variable dependiente), donde se pretende

analizar si las variables independientes (factores) in-

uyen en función de los niveles de las otras variables

dependientes.3

5.1.1 ANOVA de múltiples factores equilibrado

Es un modelo que estudia la inuencia de varios fac-

tores sobre otros, cuando el número de observacio-

nes para cada nivel de factor es el mismo siempre.3

(Figura 10)

5.1.2. ANOVA de múltiples factores no equilibrado

A diferencia del modelo multifactorial equilibrado en

este el número de observaciones para cada nivel de

factor no es igual.3 (Figura 11)

Figura 10. ANOVA bifactorial equilibrado de efectos jos.

Figura 11. ANOVA bifactorial no equilibrado de efectos jos.

5.1.3 ANOVA de efecto jo, ANOVA de efecto va-

riado y ANOVA de efecto mixto

Cuando una de las variables es ordinal como el caso

de la variable edad, está determina que el modelo sea

de efecto jo; por el contrario, si la variable edad se

maneja como una variable cuantitativa esta determi-

nará una cantidad tan grande de sub grupos que el

modelo se denomina ANOVA de efecto variado o

aleatorio, si el modelo utiliza los dos tipos se llama

de efecto mixto.3

5.2. Análisis de Varianza (ANCOVA)

Es una prueba que permite examinar datos con una

variable dependiente continua y otras variables inde-

pendientes continuas y nominales. Se establece una

relación de variables independientes y dependientes

similar a la regresión múltiple y del modelo ANOVA.

Adicionalmente, elimina el impacto de una o más va-

riables indeseables. El estudio de la estimación de una

variable dependiente continua a partir de una variable

independiente nominal, controlando el efecto de la

segunda, es el empleo más frecuente del ANCOVA

5.3. Análisis Multivariante de Varianza (MANOVA)

Es una prueba de dependencia que brinda un análisis

de regresión y un análisis de varianza para variables

dependientes múltiples por una o más covariables.

Estima las diferencias entre promedios de varias ca-

tegorías a través del cotejo de variables dependientes

observadas. Tiene una variación unidireccional y bi-

direccional, así como un ANOVA.3

5.4. Análisis Multivariante de Covarianza (MAN-

COVA)

Prueba paramétrica que analiza la relación entre las

variables dependientes e independientes al mismo

tiempo en el que se controlan los efectos de las cova-

riables en una sola variable dependiente, esto permite

observar el efecto real de las variables independientes

sobre las variables dependientes sin interferencias.3

5.5. Modelo Lineal General (MLG)

Es el modelo clásico y más general de regresión li-

neal, incluye el modelo de regresión lineal múltiple

con variables cuantitativas y los modelos de regre-

sión múltiple con variables cuantitativas y cualitati-

vas a la vez, por lo tanto, incluye todos los modelos

de la varianza (ANOVA) y de la covarianza.3

Revista OACTIVA UC Cuenca. Vol. 8, No 2, Mayo - Agosto, 2023

Villavicencio Caparó Ebingen y cols.

5.5.1 MLG univariado

Se aplica para un estudio con una variable depen-

diente cuantitativa y con uno o más factores (variable

independiente cualitativa en azul) y/o con una o más

covariables (independiente cuantitativa en rojo) se

utiliza para contrastar la hipótesis de que las varia-

bles independientes tienen efecto sobre las medias de

varias agrupaciones de una única variable indepen-

diente.13 (Figura 12)

5.5.4. Modelo lineal mixto

Es una extensión del modelo lineal general y que

se utiliza el análisis de componentes de la varianza

que permite estimar la contribución de cada efecto

aleatorio a la varianza de la variable dependiente,

usualmente es usado en diseño split-plot, diseños de

medidas repetidas univariada y diseños de bloques

aleatorios.15

5.6. Regresión logística

La Regresión logística constituye el modelo más

frecuente para analizar variables que no dependen

del tiempo. Éste método para determinar factores

de riesgo permite predecir la presencia o no de una

característica o resultado y a diferencia del modelo

lineal, la regresión logística adaptada para variables

dicotómicas se puede aplicar a un rango más amplio

a diferencia del análisis discriminante.3, 15

Es un modelo de análisis multivariado que permite

conocer la relación de dependencia de una variable

respecto a otra, la regresión logística puede ser bino-

mial y multinomial cuando incluye más de 2 catego-

rías.15 (Figura 15)

Figura 12. MLG Univariado.

Figura 14. MLG para medidas repetidas.

Figura 13. MLG Multivariado.

5.5.2 MLG multivariado

Es un análisis de regresión y ANOVA para dos o más

variables dependientes cuantitativas con una o más

covariables (independiente cuantitativa) o factores

(independiente cualitativa), además debe cumplir

con los mismos supuestos preconizados en el MLG

univariado. En el ejemplo se ve cómo 3 variables de-

pendientes se correlacionan con un modelo de inte-

racción matemática que involucra el sexo, lugar de

procedencia, edad y el índice de higiene oral simpli-

cado.13 (Figura 13)

5.5.3 MLG para medidas repetidas

Es un modelo matemático con una variable depen-

diente cuantitativa (medida en distintos tiempos) con

una o más covariables (independiente cuantitativa) o

factores (independiente cualitativa). En el ejemplo

vemos como el nivel de inserción clínica de la encía

(NIC) se mide en el tiempo 1 (Yt1); tiempo 2 (Yt2)

y tiempo 3 (Yt3) y estas mediciones se correlacionan

con la interacción de las variables sexo, bruxismo,

Nivel de Higiene Oral y las veces que el paciente se

cepilla al día.13 (Figura 14)

Figura 15. Regresión Logística

En esta prueba estadística se utiliza comúnmente el

concepto de variable dummy que en español es va-

riable cticia.

Revista OACTIVA UC Cuenca. Vol. 8, No 2, Mayo - Agosto, 2023

¿Cómo escoger la prueba estadística? 61

5.7. Análisis de supervivencia

Un análisis de supervivencia es un método estadísti-

co que sirve para comparar el tiempo promedio que

transcurre desde el inicio del estudio hasta que apare-

ce una enfermedad o condición en el paciente.16

5.7.1 Kaplan Meier

Este modelo de análisis de supervivencia permite cal-

cular la probabilidad condicionada en cada momento

de tiempo (punto temporal) cuando se da el evento,

incluyendo los casos censurados (que son aquellos

que no presentan enfermedad, hasta el nal del estu-

dio). La variable de tiempo debe ser cuantitativa, la

variable evento puede ser cuantitativa (con un punto

de corte) o cualitativa y se pueden adicionar variables

como factor que dividirá a la población en dos grupos

de estudio (Grupo experimental versus control) y se

puede adicionar subgrupos dentro de cada factor tales

como sexo u otros. Se graca en un diagrama de una

función escalonada.16 (Figura 16)

de enfermedad bucal (caries, enfermedad periodon-

tal, índice de higiene oral) y separamos estos pacien-

tes en dos grupos, los más graves y los menos graves,

al determinar este punto de clasicación basado en 3

variables, podemos a futuro asignar los próximos pa-

cientes a un determinado grupo (más grave o menos

grave) en función de la probabilidad que nos informa

el software estadístico.17

5.9 Análisis de clúster

Son algoritmos que sirven para buscar grupos de in-

dividuos similares dentro de una base de datos. Su-

pongamos el mismo ejemplo del párrafo anterior. El

software estadístico clasica a los individuos en gru-

pos homogéneos, no conocidos por el investigador,

pero en función de los datos de las variables (caries,

enfermedad periodontal, índice de higiene oral) de la

base de datos.18

5.9.1 Clúster jerárquicos

Organiza los individuos de estudio en varios niveles

de agrupación y utiliza variables cuantitativas y cua-

litativas. El software asigna la cantidad de grupos de

manera automática. Expresa los resultados de manera

gráca mediante un Dendograma.18 (Figura 17)

5.9.2 Clúster no jerárquicos

Organiza los individuos en función de la cantidad de

grupos que el investigador dene de antemano. Uti-

liza solamente variables cuantitativas, por esa razón

emplea la dispersión (desviación estándar o varian-

za) como criterio para generar grupos similares entre

ellos.18

Figura 16. Estimador Kaplan Meier

Figura 17. Dendrograma

5.7.2 Regresión de COX

Este análisis de supervivencia se basa en el cálculo

de riesgo proporcional, que es una medida de la po-

sibilidad de que el evento aparezca en un momento

o tiempo determinado, pero se enfoca además en la

proporción de los efectos que imprimen las covaria-

bles a esta función de riesgo.16

5.8 Análisis discriminante

Permite asignar o clasicar sujetos de estudio dentro

de grupos previamente reconocidos o denidos por el

investigador. Por ejemplo, si tenemos un grupo de pa-

cientes a los cuales se les ha medido varias variables

Revista OACTIVA UC Cuenca. Vol. 8, No 2, Mayo - Agosto, 2023

Villavicencio Caparó Ebingen y cols.

5.10 Análisis de interdependencia de variables

Este tipo de pruebas estadísticas multivariadas anali-

zan la relación mutua entre un conjunto de variables.

No se enfocan en la relación causal entre variables,

sino más bien en el supuesto de que las variables

comparten variabilidad (esto es que si una variable

aumenta la otra aumenta junto a esta).19

5.10.1 Análisis de componentes principales

Es un método estadístico de reducción de la cantidad

de variables independientes que están correlaciona-

das con una variable dependiente. Se busca dentro

de un conjunto de variables de una base de datos, eli-

minar las variables que no estén correlacionadas con

la variable dependiente, para quedarnos solamente

con un conjunto de variables que puedan explicar la

variabilidad de la variable principal. Todas las va-

riables en cuestión deben ser cuantitativas. Se utili-

za un gráco denominado gráco de sedimentación

(Scree plot) para identicar la cantidad de factores

(variables agrupadas) que deben ser retenidas en el

estudio.19

5.10.2 Análisis factorial

Es un análisis que permite reducir la cantidad de va-

riables de una base de datos analizando la interde-

pendencia entre ellas y proporciona conocimiento de

la estructura subyacente entre ellas (grupos de varia-

bles que están correlacionadas entre sí). Este análisis

se realiza partiendo de la suposición de que existen

variables no medidas (que surgen de la interacción

entre variables que se pueden agrupar entre ellas) lla-

madas variables latentes sintéticas e inobservables. 20

(Figura 18)

Figura 18. Análisis factorial

Cantidad grande de variables en la base de datos,

dispuestas de la manera en la que aparecieron al

momento de la medición. Las mismas variables or-

denadas y agrupadas (como factores) de acuerdo a

la interrelación que presentan entre ellas y con la

variable dependiente. Estas nuevas variables (fac-

tores) halladas por análisis factorial permiten colo-

carles nombres y luego hacer la interpretación de lo

que signican conceptualmente. De tal manera que

esas variables agrupadas conformar una dimensión

y el conjunto de dimensiones conforman el total del

constructo (Figura 18).21

5.11 Análisis de reducción de variables

5.11.1 Análisis de correspondencias simple

Llamado también análisis factorial de corresponden-

cias, es un método multivariante factorial que tiene

como objeto la reducción de la dimensión de una ta-

bla de contingencia (la cantidad de columnas), este

análisis se aplica cuando hay dos variables cualitati-

vas. La idea es agrupar variables y tener un modelo

más simple que permitirá un estudio más simple del

problema. Este análisis se entiende mejor partiendo

del ejemplo de la tabla bivariada en la que se aplica

una prueba Chi cuadrado y este test solo determina si

hay o no asociación entre variables, pero no se sabe

qué categorías estaban implicadas en esta asociación,

por lo que el análisis de correspondencias múltiples

extrae relaciones entre categorías y dene similari-

dades entre ellas, lo que permite agrupar o colapsar

categorías si se detecta que se corresponden.22, 23

5.11.2 Análisis de correspondencias múltiples

Es la ampliación del análisis de correspondencias

simple a una situación en la que se tiene más de dos

variables. Por lo tanto, ya no se usa una tabla de con-

tingencia, al contrario, una tabla de Burt. 22

5.12 Análisis de series temporales

Estos análisis pretenden hacer una predicción del

Revista OACTIVA UC Cuenca. Vol. 8, No 2, Mayo - Agosto, 2023

¿Cómo escoger la prueba estadística? 63

comportamiento de una variable a futuro, existen

predicciones condicionales (mediante modelos cau-

sales) e incondicionales (mediante métodos autopro-

yectivos). Las series temporales son una sucesión de

observaciones cuantitativas de un fenómeno, ordena-

das en el tiempo.24

5.12.1 Análisis de la tendencia

Una serie de tiempo está formada por cuatro compo-

nentes teóricas.25

- Tendencia (T): Dirección predominante de la se-

rie a largo plazo.

- Variaciones estacionales (E): Oscilaciones que se

producen en períodos menores a un año.

- Variaciones cíclicas (C): Oscilaciones que se pro-

ducen con un período superior al año.

- Variaciones residuales (R): Son movimientos en

la serie que son originados por circunstancias ac-

cidentales o aleatorias.

Un primer método de análisis es el gráco, que direc-

tamente se llevan los datos a un gráco de dispersión

con coordenadas. Un segundo método es el denomi-

nado Medias móviles que consiste en promediar cada

valor de la serie con algunas observaciones anteriores

y posteriores con la nalidad de eliminar variaciones

accidentales, a esto se le denomina una serie sua-

vizada. El tercer método es de mínimos cuadrados,

que ajusta los datos en una función lineal mediante

el método de mínimos cuadrados en la cual la varia-

ble tiempo entra como variable explicativa (indepen-

diente).25

DISCUSIÓN

Existen diversas formas de organizar o categorizar

las prueba estadísticas, algunos textos priorizan la

división entre pruebas paramétricas y no paramétri-

cas, otros textos realizan la clasicación de las prue-

bas y técnicas estadísticas de acuerdo a la naturale-

za estadística de la variable independiente (ordinal,

nominal, discreta, continua) y otros textos lo hacen

en función de la aparición en la plataforma de cierto

programa estadístico,2,3 sea cual sea la forma de hacer

la clasicación u organización de estas pruebas, lo

importante es que el lector tenga la herramienta que

está buscando, en función de su diseño de estudio,

el presente trabajo es un esfuerzo por presentar un

listado de pruebas estadísticas desde la clasicación

de la lógica que subyace para la ejecución de las

mismas, con lo que esperamos el lector pueda tener

una herramienta adicional al momento de escoger la

prueba estadística que empleará en su proyecto de in-

vestigación.3,8

Tal como sucede en el Vademecum médico, que es un

conjunto de capítulos de listados de medicamentos

con los aspectos más sucintos de los fármacos, el pre-

sente texto pretende ser el Vademecum estadístico,

para los investigadores en ciencias de la salud, moti-

vo por el cual este trabajo no ahonda en los modelos

matemáticos, ni en los procedimientos de los paque-

tes estadísticos, para llegar a realizar un ejercicio de

los tema tratados, por el contrario pretende ser una

lista de prescripciones estadísticas que se tengan en

un solo documento a n de servir de guía para el lec-

tor y que luego este pueda profundizar en la prueba

estadística que escoge, en libros de texto o en tutoria-

les de internet que son abundantes.2

Una limitación del presente artículo de contribución

didáctica docente, es que, dada la naturaleza del tipo

de publicación, se ha tenido que reducir las explica-

ciones a lo mínimo indispensable que permita iden-

ticar la prueba estadística y para qué sirve, motivo

por el cual en la mayoría de temas tratados no se ha

desarrollado los resultados que entregan los paquetes

estadísticos.

CONCLUSIONES

Se pueden agrupar las pruebas estadísticas univa-

riadas, bivariadas y multivariadas; desde el enfoque

de la visión del usuario, con la nalidad de brindar

una alternativa de explicación y agrupación didáctica

para quienes los textos regulares resultan de difícil

comprensión.

Referencias Bibliográcas

1. Troya A. Técnicas estadísticas en el análisis

cuantitativo de datos. RSIGMA. [Internet].

2019; 15(1): 28-44. Disponible en: https://re-

vistas.udenar.edu.co/index.php/rsigma/article/

download/4905/5671

2. Villavicencio-Caparó E. Auditoría de la Inves-

Revista OACTIVA UC Cuenca. Vol. 8, No 2, Mayo - Agosto, 2023

Villavicencio Caparó Ebingen y cols.

tigación Cientíca Biomédica. Editor A, editor.

2016.

3. Riegelman R, Hirsch R. Cómo estudiar un estu-

dio y probar una prueba: lectura crítica de la lite-

ratura médica. OPS [Internet]. 1992. Disponible

en: https://iris.paho.org/handle/10665.2/3309

4. Spiegel MR. Estadística. Avaraca, Madrid: Mc-

graw Hill/interamericana de España. S. A. U.;

1991.

5. Caparó EV. El tamaño muestral para la tesis.

¿cuántas personas debo encuestar? Odontol Act.

[Internet]. 2017; 2(1): 59-62. Disponible en: ht-

tps://oactiva.ucacue.edu.ec/index.php/oactiva/

article/view/175

6. Mendivelso F, Rodríguez M. Prueba Chi-Cua-

drado de independencia aplicada a tablas

2xN. Rev Medica Sanitas. [Internet]. 2018;

21(2): 92-5. Disponible en: http://dx.doi.

org/10.26852/01234250.6

7. Gómez OT. Una aplicación de la prueba chi

cuadrado con SPSS. Industrial Data. [Internet].

2008; 11(1): 73-7. Disponible en: https://www.

redalyc.org/articulo.oa?id=81611211011

8. Caparó EV, Cordero MCA, Leon KC, Curipo-

ma MC, Vivar DP, Cordero AA. Diseños de

estudios clínicos en odontología. Odontol Act.

[Internet]. 2016; 1(2): 81-4. Disponible en: ht-

tps://oactiva.ucacue.edu.ec/index.php/oactiva/

article/view/163

9. Calderón MC, Altamirano IV. Prueba T de

Student para una investigación odontológica.

Odontol Act. [Internet]. 2022; 7(1): 49-54. Dis-

ponible en: https://oactiva.ucacue.edu.ec/index.

php/oactiva/article/view/562

10. Bustamante C, Mendoza Quispe C. Estudios de

Correlación. Revista de Actualización Clínica.

[Internet]. 2013; (33): 1691-1693. Disponi-

ble en: https://docplayer.es/39252129-Revis-

ta-de-actualizacion-clinica-volumen.html

11. Martínez-Curbelo G, Cortés-Cortés ME, Pé-

rez-Fernández A. Metodología para el análisis

de correlación y concordancia en equipos de

mediciones similares. Universidad y Sociedad.

[Internet]. 2016; 8(4): 65-70. Disponible en:

http://scielo.sld.cu/scielo.php?script=sci_abs-

tract&pid=S2218-36202016000400008&ln-

g=es&nrm=iso&tlng=es

12. Roy-García I, Rivas-Ruiz R, Pérez-Rodríguez

M, Palacios-Cruz L. Correlación: no toda co-

rrelación implica causalidad. Rev Alerg. [Inter-

net]. 2019; 66(3): 354-60. Disponible en: http://

www.scielo.org.mx/scielo.php?script=sci_abs-

tract&pid=S2448-91902019000300354&ln-

g=es&nrm=iso&tlng=es

13. del Campo N, Matamoros L. Técnicas estadís-

ticas para identicar posibles relaciones biva-

riadas. Rev Cubana Hig Epidemiol. [Internet].

2020; 19(2): 1-23. Disponible en: https://www.

medigraphic.com/pdfs/revcubanerea/rca-2020/

rca202h.pdf

14. Martínez-Ortega R, Tuya-Pendás L, Martí-

nez-Ortega M, Pérez-Abreu A, Cánovas A. El

coeciente de correlacion de los rangos de Spe-

arman caracterización. Rev haban cienc méd.

[Internet]. 2009; 8(2): 1-19. Disponible en:

http://scielo.sld.cu/scielo.php?script=sci_abs-

tract&pid=S1729-519X2009000200017&ln-

g=es&nrm=iso&tlng=es

15. López CP. Técnicas estadísticas con SPSS 12:

Aplicaciones al análisis de datos. [Internet].

Pearson Educación. 2005. 824 p. Disponible en:

https://www.worldcat.org/es/title/tecnicas-es-

tadisticas-con-spss-12-aplicaciones-al-anali-

sis-de-datos/oclc/60556857

16. José B, Pérez E, Madero R. Métodos esta-

dísticos en estudios de supervivencia. An

Pediatr Contin. [Internet]. 2009; 7(1): 55-9.

Disponible en: https://www.elsevier.es/es-re-

vista-anales-pediatria-continuada-51-articu-

lo-metodos-estadisticos-estudios-superviven-

cia-S1696281809704536

17. Torrado-Fonseca M, Berlanga-Silvente V. Aná-

lisis discriminante mediante SPSS. REIRE [In-

ternet]. 2013; (2), 150-166. Disponible en:

http://www.ub.edu/ice/reire.htm

18. Santana OF. El análisis de cluster: aplicación,

interpretación y validación. Papers: revista de

sociologia. [Internet]. 1991; 65-76. Disponible

en: https://www.raco.cat/index.php/Papers/arti-

cle/download/25102/58448

19. Navarro-Céspedes JM, Casas-Cardoso GM,

Rodríguez EG. Análisis de componentes prin-

cipales y análisis de regresión para datos cate-

góricos. Aplicación en la hipertensión arterial.

RMTA. [Internet]. 2010; 17(2): 199-230. Dis-

ponible en: https://revistas.ucr.ac.cr/index.php/

matematica/article/download/2128/2091

20. IBM SPSS Statistics. Análisis factorial. [In-

ternet]. 2022 Disponible en: https://www.ibm.

com/docs/es/spss-statistics/29.0.0?topic=featu-

res-factor-analysis

21. Villavicencio-Caparó E. Validación de cues-

tionarios. Odontol Act Rev Cient. [Internet].

2018; 1(3): 71-6. Disponible en: https://prue-

bas3.ucacue.edu.ec/index.php/oactiva/article/

view/200

Revista OACTIVA UC Cuenca. Vol. 8, No 2, Mayo - Agosto, 2023

¿Cómo escoger la prueba estadística? 65

22. Rodríguez-Jaume M, Mora-Catalá R. Análisis

de regresión múltiple. Capítulo 3 [Internet].

2001. Disponible en: https://rua.ua.es/dspace/

bitstream/10045/12073/1/Capitulo3.pdf

23. Tovar A, Paternina L, Morinson M. Análisis de

correspondencia aplicado al estado nutricional

de las mujeres entre 15 a 49 años en departa-

mentos de Colombia. Vicerectora administra-

tivo y nanciero. [Internet]. 2017; 2(2): 1-7.

Disponible en: https://www.uniatlantico.edu.

co/wp-content/uploads/2021/11/MEMORIAS_

EIEM_3-12-SEPTIEMBRE-No-2-compressed.

pdf#page=7

24. Series Temporales. Análisis de la Tendencia [In-

ternet]. 2021. Disponible en: https://www.you-

tube.com/watch?v=td6Yn3f--IQ

25. Corres G, Esteban A, García J, Zárate C. Aná-

lisis de series temporales. RII [Internet]. 2009;

8(1): 21-23. Disponible en: https://revistas.ubio-

bio.cl/index.php/RI/article/view/80

Recibido: 14 marzo 2023

Aceptado: 22 abril 2023

Revista OACTIVA UC Cuenca. Vol. 8, No 2, Mayo - Agosto, 2023

Villavicencio Caparó Ebingen y cols.