Monografias | Pruebas de hipótesis no paramétricas de Kolmogorov-Smirnov para una y dos muestrasPruebas de hipótesis no paramétricas de Kolmogorov-Smirnov para una y dos muestrasResumen: Dócima de una muestra de Kolmogorov-Smirnov. Dócima de Kolmogorov-Smirnov para dos muestras independientes. El uso de la Estadística es de gran importancia en la investigación científica. Casi todas las investigaciones aplicadas requieren algún tipo de análisis estadístico para que sea posible evaluar sus resultados. En algunos casos, para resolver un problema de carácter empírico, es preciso llevar a cabo un análisis bastante complejo; otras veces, basta con efectuar un análisis muy simple y directo. INTRODUCCIÓN
El uso de la Estadística es de gran importancia en la
investigación científica. Casi todas las investigaciones aplicadas requieren
algún tipo de análisis estadístico para que sea posible evaluar sus
resultados. En algunos casos, para resolver un problema de carácter empírico,
es preciso llevar a cabo un análisis bastante complejo; otras veces, basta con
efectuar un análisis muy simple y directo. La elección de uno u otro tipo de
análisis estadístico depende del problema que se plantee en el estudio así
como de la naturaleza de los datos. Desde este punto de vista, la Estadística
constituye un instrumento de investigación y no un producto final de
esta última.
El trabajo coherente, las acciones integradas, la no
extrapolación de elementos de un lugar a otro, el verdadero diagnóstico de la
realidad han de ser prácticas permanentes en el accionar del investigador y el
estadístico aplicado.
Dentro de la estadística se aplican en la investigación los
tests o dócimas paramétricos y no paramétricos, el presente trabajo esta
dedicado al estudio de dos pruebas no paramétricas que por su importancia
merecen ser tratadas de forma independiente, ellas son las pruebas de
Kolmogorov-Smirnov para una y dos muestras.
Entre los tests no paramétricos que comúnmente se utilizan
para verificar si una distribución se ajusta o no a una distribución esperada,
en particular a la distribución normal se encuentran el test de
Kolmogorov-Smirnov. El test de Kolmogorov-Smirnov es bastante potente con
muestras grandes. El nivel de medición de la variable y su distribución son
elementos que intervienen en la selección del test que se utilizará en el
procesamiento posterior. De hecho, si la variable es continua con distribución
normal, se podrán aplicar técnicas paramétricas. Si es una variable discreta
o continua no normal, solo son aplicables técnicas no paramétricas pues
aplicar las primeras arrojaría resultados de dudosa validez.
Desarrollo
DÓCIMA DE UNA MUESTRA DE KOLMOGOROV-SMIRNOV.
Premisas
La única premisa que se necesita es que las mediciones se
encuentren al menos en una escala de intervalo. Se necesita que la medición
considerada sea básicamente continua. Además dicha prueba es aplicable
cualquiera sea el tamaño de la muestra.
Potencia-Eficiencia
La prueba de una muestra de K-S puede en todos los casos en
que se aplique ser más poderosa que su prueba alternativa, la prueba de c 2
( ji-cuadrado.
Características de la dócima
La prueba de K-S de una muestra es una dócima de bondad de
ajuste. Esto es, se interesa en el grado de acuerdo entre la distribución de un
conjunto de valores de la muestra y alguna distribución teórica específica.
Determina si razonablemente puede pensarse que las mediciones muéstrales
provengan de una población que tenga esa distribución teórica. En la prueba
se compara la distribución de frecuencia acumulativa de la distribución teórica
con la distribución de frecuencia acumulativa observada. Se determina el punto
en el que estas dos distribuciones muestran la mayor divergencia.
Hipótesis
Ho: La distribución observada se ajusta a la distribución
teórica.
F(x) = Ft(x) para todo x.
H1: La distribución observada no se ajusta a la
distribución teórica.
También:
F(x) ¹
Ft(x) para algún x
F(x): es función desconocida
Ft(x): es la función teórica. Esta puede ser por
ejemplo la función normal con cierta media y varianzas conocidas.
Estadígrafo y distribución muestral
D = máxima
Sn(x): es la función de distribución empírica.
Ejemplo
El entrenador de salto de un grupo de atletas, desea conocer
con vistas al procesamiento de los datos por el obtenidos sobre salto de una
muestra aleatoria de atletas de esa especialidad en un CVD, si las mediciones
realizadas por él están distribuidas normalmente. Los datos son los
siguientes:
Salto_Largo
1 1.60
2 1.65 Ho: Los datos están distribuidos normalmente
3 1 .55 H1: Los datos no están distribuidos
normalmente.
4 1.62
5 1.64
6 1.70
7 1.71
8 1.68
9 1.66
10 1.67
11 1.65
12 1.68
13 1.69
14 1.70
Salidas de la dócima
Conclusiones:
No se rechaza a Ho, por tanto la distribución de los datos
es normal.
Técnicas adicionales a la dócima
Tabla de frecuencias
Histograma.
Estadígrafos que deben acompañar a los estadígrafos de la
dócima
1-Tabla de frecuencias.
Técnicas auxiliares para respaldar los resultados obtenidos
en la conclusión.
1-Histogramas.
Dócima de Kolmogorov-Smirnov para dos muestras
independientes.
Estructura de la base de datos
Normalmente la estructura que tiene la base de datos es la de
utilizar una variable para entrar los resultados de la medición y la otra donde
se particione a estos resultados en los dos grupos.
Premisas
La única premisa que se necesita es que las mediciones se
encuentren al menos en una escala ordinal. Adicionalmente se necesita que la
medición considerada sea básicamente continua.
Potencia-Eficiencia
Comparada ante la alternativa paramétrica de la t de student
para dos muestras independientes (o el modelo de Análisis de Varianza
clasificación simple para dos muestras), cuando las premisas paramétricas se
cumplen, tiene una potencia eficiencia de cerca del 96%, que tiende a decrecer
ligeramente a medida que se aumentan los tamaños de muestra.
Existen autores que plantean1 "que la dócima
de Kolmogorov-Smirnov, para muestras muy pequeñas es más potente que la dócima
de la U de Mann-Whitney, pero que para muestras de tamaño grande ocurre lo
contrario.
Características de la dócima
La dócima de Kolmogorov-Smirnov está construida, teniendo
como base detectar las discrepancias existentes entre las frecuencias relativas
acumuladas de las dos muestras objeto de estudio. Lo anterior propicia que esta
dócima pueda advertir diferencias no tan solo entre los promedios, sino que éstas
sean debidas a la dispersión, o la simetría o la oblicuidad. Esta característica
la hace distintiva de aquellas en que solamente se ocupan de analizar las
diferencias entre los promedios.
La dócima admite que los tamaños de las muestras no sean
iguales.
Hipótesis
Las hipótesis de esta dócima, expresadas en palabras son:
Ho: Las distribuciones poblacionales son iguales.
H1: Las distribuciones poblacionales son
distintas.
Ahora bien se recomienda en general hacer el enunciado de las
hipótesis de forma tal que indique en un mayor grado la característica que va
a ser docimada.
Estadígrafo y distribución muestral.
Designemos por T1 y por T2 las tablas
de distribución de frecuencias relativas acumuladas, particionadas en k categorías.
Donde el primer subíndice corresponde al número de la muestra y el segundo al
orden de la clase.
TABLA1
TABLA2
DIFERENCIAS
Clase
Frecuencia relativa
acumulada
Frecuencia relativa
acumulada
Diferencia de las
Frecuencias
1
p11
p21
p11-p21
2
p12
p22
p12-p21
...
...
...
...
I
p1i
p2i
p1i-p2i
...
...
...
...
k
p1k
p2k
p1k-p2k
Se analiza entonces en la columna de las diferencias de las
frecuencias, en qué clases se obtiene el valor máximo. Se tendrá entonces en
símbolos:
Salidas de la dócima
Las salidas usuales de la dócima son tres:
Es necesario señalar que las dos primeras opciones
suministran información en los casos en que sea conveniente realizar una dócima
unilateral, además de reflejar información acerca de lo que está ocurriendo
en la dócima.
Técnicas adicionales a la dócima
Existe un grupo de técnicas adicionales a la dócima, las
que hemos dividido en los siguientes grupos.
Estadígrafos que deben acompañar a los estadígrafos de la
dócima.
Entre ellos se encuentran:
Técnicas auxiliares para respaldar los resultados obtenidos
en la conclusión
Ejemplo
Se muestran las pérdidas en peso (medidos en kilogramos), de
dos grupos de personas que han sido sometidas a dos tipos diferentes de
medicamentos, designado por Grupo1 y Grupo2. Los resultados obtenidos se
muestran en la siguiente tabla:
GRUPO1 (n1=10)
GRUPO2 (n2=12
5.49
3.76
3.08
4.22
4.13
4.17
5.03
5.03
7
4.85
6.03
2.09
4.45
4.45
5.13
3.58
4.26
3.86
4.62
4.13
4.4
2.81
Salida de la dócima
La salida básica de la dócima muestra los valores máximos
positivos, máximos negativos y el valor de probabilidad, los que se muestran a
continuación.
medición
máxima diferencia
negativa
máxima diferencia
positiva
valor de probabilidad
perdida de peso
0
0.4666667
p > .10
Según podemos observar, no existen diferencias
significativas entre los resultados de la medición realizada a los dos grupos.
Estadígrafos que deben acompañar a los estadígrafos de la
dócima.
Resulta conveniente incluir también, además de los
mencionados en la tabla anterior, el tamaño en cada una de las muestras, así
como la media aritmética de cada una de ellas y su desviación estándar. Las
que se muestran en la siguiente tabla.
Tamaños de muestra
Media aritmética
Desviación. Estándar
GRUPO 1
10
4.73900
.8235661
GRUPO 2
12
3.945834
.8235661
Técnicas auxiliares para respaldar los resultados obtenidos
en la conclusión
Las técnicas que ha continuación se mencionan es
conveniente su utilización:
Diagramas de Caja y Bigotes.
El siguiente diagrama muestra los resultados obtenidos
tomando como promedio la mediana, el rango intercuartílico para la caja y el máximo-mínimo
para los bigotes.
En este diagrama observamos que aunque en la segunda muestra
ha existido una disminución en el valor mediano, las diferencias no son
significativas. Obsérvese que en la segunda muestra se ha producido una
disminución en la dispersión y los máximos y mínimos han sido reducidos.
Histogramas
A continuación se muestran los histogramas de las dos
muestras. Los que pueden proporcionar una mayor idea del proceso ocurrido.
BIBLIOGRAFÍA
Autor:
Ms.C: Arsenio Celorrio Sánchez
Publicación enviada por Ms.C: Arsenio Celorrio Sánchez Contactar mailto:celorriosanchez@yahoo.es Código ISPN de la Publicación EpyAVkuZVkTBkoEjEU Publicado Saturday 22 de November de 2003 Ultimas Publicaciones en ilustrados.com
ilustrados.com nace con el fin difundir el conocimiento publicando trabajos de investigación, monografias, tesis, presentaciones powerpoint y afines. Publicar trabajos en ilustrados.com ha alcanzado prestigio y reconocimiento internacional siendo cada vez más el número de académicos, empresas, investigadores, científicos que consultan las publicaciones de nuestro portal. | |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||