|
Categorias
|
Análisis de Datos
INTRODUCCIÓN La
estadística es la disciplina que nos proporciona una metodología para recoger,
organizar, resumir, analizar datos y hacer inferencias a partir de ellas. Puede deducirse de la definición que hay dos
ramas claramente diferenciadas dentro de la estadística: La Estadística
Descriptiva y La Inferencia Estadística que es el punto a tratar en el presente
trabajo. La inferencia Estadística tiene como función
inferir las características de un colectivo a partir de un subconjunto de éste. Referente al contraste de hipótesis, sabemos que
un problema es investigable cuando existen dos o más soluciones alternativas y
tenemos dudas acerca de cual de ellas es la mejor. Esta situación permite
formular una o más hipótesis de trabajo, ya que cada una de ellas destaca la
conveniencia de una de las soluciones sobre las demás. Si nuestro propósito es
comprobar una teoría ella misma será la hipótesis del trabajo, pero es
importante destacar que al formular dicha o dichas hipótesis no significa que
ya esté resuelto el problema, al contrario, que nuestra duda nos impulsa a
comprobar la verdad o falsedad de cada una de ellas. La decisión final partirá de las decisiones
previas de aceptar o rechazar las hipótesis de trabajo. CAPITULO I Contraste
de Hipótesis Etapas
Básicas en Pruebas de Hipótesis. Al
realizar pruebas de hipótesis, se parte de un valor supuesto (hipotético) en
parámetro poblacional. Después de recolectar una muestra aleatoria, se compara
la estadística muestral, así como la media (x), con el parámetro hipotético,
se compara con una supuesta media poblacional (
Etapa
1.-
Planear la hipótesis nula y la hipótesis alternativa. La hipótesis nula (H0)
es el valor hipotético del parámetro que se compra con el resultado muestral
resulta muy poco probable cuando la hipótesis es cierta. Etapa
2.-
Especificar el nivel de significancia que se va a utilizar. El nivel de
significancia del 5%, entonces se rechaza la hipótesis nula solamente si el
resultado muestral es tan diferente del valor hipotético que una diferencia de
esa magnitud o mayor, pudiera ocurrir aleatoriamente con una probabilidad de
1.05 o menos. Etapa
3.-
Elegir la estadística de prueba. La estadística de prueba puede ser la estadística
muestral (el estimador no segado del parámetro que se prueba) o una versión
transformada de esa estadística muestral. Por ejemplo, para probar el valor
hipotético de una media poblacional, se toma la media de una muestra aleatoria
de esa distribución normal, entonces es común que se transforme la media en un
valor z el cual, a su vez, sirve como estadística de prueba. Tabla 10.1. Consecuencias de las Decisiones en
Pruebas de Hipótesis.
Etapa 5.- Determinar el valor real de la estadística de
prueba. Por ejemplo, al probar un valor hipotético de la media poblacional, se
toma una muestra aleatoria y se determina el valor de la media muestral. Si el
valor crítico que se establece es un valor de z, entonces se transforma la
media muestral en un valor de z. Etapa 6.- Tomar la decisión. Se compara el valor
observado de la estadística muestral con el valor (o valores) críticos de la
estadística de prueba. Después se acepta o se rechaza la hipótesis nula. Si
se rechaza ésta, se acepta la alternativa; a su vez, esta decisión tendrá
efecto sobre otras decisiones de los administradores operativos, como por
ejemplo, mantener o no un estándar de desempeño o cuál de dos estrategias de
mercadotecnia utilizar. Conceptos
Básicos para el Procedimiento de Pruebas de Hipótesis. Hipótesis Estadística: Al intentar alcanzar una decisión, es útil
hacer hipótesis (o conjeturas) sobre la población aplicada. Tales hipótesis, que pueden ser o no ciertas, se
llaman hipótesis estadísticas. Son, en general, enunciados acerca de las
distribuciones de probabilidad de las poblaciones. Hipótesis Nula: En muchos casos formulamos una hipótesis estadística
con el único propósito de rechazarla o invalidarla. Así, si queremos decidir
si una moneda está trucada, formulamos la hipótesis de que la moneda es buena
( o sea p = 0,5, donde p es la probabilidad de cara). Analógicamente, si deseamos decidir si un
procedimiento es mejor que otro, formulamos la hipótesis de que no hay
diferencia entre ellos (o sea. Que cualquier diferencia observada se debe
simplemente a fluctuaciones en el muestreo de la misma población). Tales hipótesis
se suelen llamar hipótesis nula y se denotan por Ho. Hipótesis
Alternativa. Toda hipótesis que difiere de una dada se llamará
una hipótesis alternativa. Por ejemplo: Si una hipótesis es p = 0,5, hipótesis
alternativa podrían ser p = 0,7, p " 0,5 ó p > 0,5. Una hipótesis alternativa a la hipótesis nula
se denotará por H1. Errores de tipo I y de tipo II. Si rechazamos una hipótesis cuando debiera ser
aceptada, diremos que se ha cometido un error de tipo I. Por otra parte, si aceptamos una hipótesis que
debiera ser rechazada, diremos que se cometió un error de tipo II. En ambos casos, se ha producido un juicio erróneo. Para
que las reglas de decisión (o no contraste de hipótesis) sean buenas, deben
diseñarse de modo que minimicen los errores de la decisión; y no es una cuestión
sencilla, porque para cualquier tamaño de la muestra, un intento de disminuir
un tipo de error suele ir acompañado de un crecimiento del otro tipo. En la
practica, un tipo de error puede ser más grave que el otro, y debe alcanzarse
un compromiso que disminuya el error más grave. La única forma de disminuir ambos a la vez es
aumentar el tamaño de la muestra que no siempre es posible. Niveles de Significación. Al contrastar una cierta hipótesis, la máxima
probabilidad con la que estamos dispuesto a correr el riesgo de cometerán error
de tipo I, se llama nivel de significación. Esta probabilidad,
denota a menudo por
En la practica, es frecuente un nivel de
significación de 0,05 ó 0,01, si bien se une otros valores. Si por ejemplo se
escoge el nivel de significación 0,05 (ó 5%) al diseñar una regla de decisión,
entonces hay unas cinco (05) oportunidades entre 100 de rechazar la hipótesis
cuando debiera haberse aceptado; Es decir, tenemos un 95% de confianza de que
hemos adoptado la decisión correcta. En tal caso decimos que la hipótesis ha
sido rechazada al nivel de significación 0,05, lo cual quiere decir que tal hipótesis
tiene una probabilidad 0,05 de ser falsa. Prueba de Uno y Dos Extremos. Cuando estudiamos ambos valores estadísticos es
decir, ambos lados de la media lo llamamos prueba de uno y dos extremos o
contraste de una y dos colas. Con frecuencia no obstante, estaremos interesados
tan sólo en valores extremos a un lado de la media (o sea, en uno de los
extremos de la distribución), tal como sucede cuando se contrasta la hipótesis
de que un proceso es mejor que otro (lo cual no es lo mismo que contrastar si un
proceso es mejor o peor que el otro) tales contrastes se llaman unilaterales, o
de un extremo. En tales situaciones, la región critica es una región situada a
un lado de la distribución, con área igual al nivel de significación. La siguiente tabla de valores críticos de
“z” para contraste de unos o dos extremos en varios niveles de significación. Nivel
de significación
0.10 0.05 0.01 0.005 0.02 Valores
críticos de “z” para Test Unilaterales -1.28
o 1.28 -1.645
o 1.645 -2.33
o 2.33 -2.58
o 2.58 -2.88
o 2.88 Valores
Críticos de “z” para Test Bilaterales -
1.645 y 1.645 -
1.96 y 1.96 -2.58
y 2.58 -2.81
y 2.81 -3.08
y 3.08
Hemos visto como limitar el error de tipo I
eligiendo adecuadamente el nivel de significación. Es posible evitar el riesgo de cometer error de
tipo II simplemente no aceptado nunca hipótesis, pero en muchas aplicaciones prácticas
esto es inviable. En tales casos se suele recurrir a curvas de
operación características o curvas de “OC”, que son gráficos que muestran
las probabilidades de error de tipo II bajo diversas hipótesis. Proporcionan indicadores de hasta que punto un
test dado nos permitirá evitar un error de tipo II; es decir, nos indicará la
potencia de un test a la hora de prevenir decisiones erróneas. Son útiles en
el diseño de experimentos porque sugieren entre otras cosas al tamaño de
muestra a manejar. Grados de Libertad. Para el cálculo de un estadístico, es necesario
emplear tanto observaciones de muestra como propiedades de ciertos parámetros
de la población. Si estos parámetros son desconocidos, hay que estimarlos a
partir de la muestra el número de grados de libertad de un estadístico,
generalmente denotado por “v” se define como el número “N” de
observaciones independientes en la muestra (o sea, el tamaño de la muestra)
menos el número K de parámetros de la población, que debe ser estimado a
partir de observaciones muéstrales. En símbolos, v = N - k. Capitulo II Contraste de hipótesis referentes a la
diferencia entre: Una media muestra y
una media población; utilizando la distribución (z) El
uso de la distribución normal z se busca en las mismas condiciones que en el
caso de una muestra excepto que ahora se tienen dos muestras independientes.
La formula general para determinar el valor de z para probar la diferencia
entre dos medidas, dependiendo de sí se conocen los valores para las
dos poblaciones
Articulos relacionados:
|
|||||||||||||||||||||||||||||||||||||||||||||
