Resumen: Resumen del libro de estadísticas de Berenson y Levine. Aplicaciones estadísticas en administración de la calidad y productividad. Estadística descriptiva e inferencial. Recolección de datos. Diseño de un experimento. Diseño de un cuestionario. Elección del tamaño de la muestra. Organización y Resumen de Datos. Frecuencia.
Publicación enviada por Hernan Torino
Índice
Índice
1.
Resumen Capítulo 1 del Libro
2.
Resumen Capítulo 2 del Libro
3.
Resumen Capítulo 3 del Libro
4.
Resumen Capítulo 4 del Libro
5.
Resumen Capítulo 5 del Libro
6.
Capitulo 6 del libro
7.
Capítulo 7 del libro
8.
Capítulo 8 del libro
9.
Capitulo 9 del libro
10.
Capitulo 10 del libro
11.
Hipótesis nula y alternativa
12.
Capitulo 12 del libro
13.
Capítulo 13 del libro
14.
Capitulo 14 del libro
15.
Capítulo 15 del libro
16.
Aplicaciones estadísticas en administración de la calidad y productividad
1.
Resumen Capítulo 1 del Libro
- Estadística
Inferencial: Puede definirse como aquellos métodos que hacen posible la
estimación de una característica de una población o la toma de una decisión
referente a una población basándose sólo en los resultados de una
muestra.
Para
aclara este concepto se necesitan de las siguientes definiciones:
- Población: es la
totalidad de elementos o cosas bajo consideración.
- Muestra: Es la porción
de la población que se selecciona para su análisis.
- Parámetro: Es una
medida de resumen que se calcula para describir una característica de toda
una población.
- Estadística: Es una
medida que se calcula para describir una característica de una sola muestra
de la población.
Podemos
encontrar dos tipos de estudios estadísticos que se emprenden: losestudios
enumerativos y los estudios analíticos.
Los
estudios enumerativos involucran la toma de decisiones respecto a unapoblación
y/o sus características.
Los estudios analíticos involucran realizar alguna actividad sobre un
procesopara mejorar el desempeño en el futuro. La atención de un estudio analíticoestá
puesta sobre la predicción del comportamiento futuro de un proceso ysobre la
comprensión y perfeccionamiento de ese proceso. En un estudio analíticono
existe un universo identificable, como sucede en un estudio enumerativo y
enconsecuencia tampoco hay un marco.
2.
Resumen Capítulo 2 del Libro
Recolección
de Datos
La
necesidad de datos: los datos se necesitan para:
- Proporcionar la
introducción imprescindible para un estudio de investigación.
- Medir el desempeño
en un servicio o proceso de producción en curso.
- Ayudar en la
formulación de cursos alternativos de acción en un proceso de toma de
decisiones.
- Satisfacer nuestra
curiosidad.
¿Que
es un dato?
Los datos pueden concebirse como información numérica necesaria para
ayudarnosa tomar una decisión con más bases en una situación particular.
¿Cómo
obtenemos los datos?
Existen muchos métodos mediante los cuales podemos obtener los datosnecesarios.
Primero, podemos buscar datos ya publicados por fuentesgubernamentales,
industriales o individuales. Segundo, podemos diseñar unexperimento. En tercer
lugar, podemos conducir un estudio. Cuarto, podemos hacerobservaciones del
comportamiento, actitudes u opiniones de los individuos en losque estamos
interesados.
Utilización
de fuentes de datos publicadas
Sin
importar la fuente utilizada, se hace una distinción entre el
recolectororiginal de los datos y la organización o individuos que compilan éstos
entablas y diagramas. El recolector de datos es la fuente primaria; el
compiladorde los datos es la fuente secundaria.
Diseño
de un experimento
En un experimento se ejerce control sobre el tratamiento de los dado a
losparticipantes.
Conducción
de una encuesta
Aquí no se ejerce ningún control sobre el comportamiento de la
genteencuestada. Simplemente se formulan preguntas respecto a sus
opiniones,actitudes, comportamiento y otras características.
Realización
de un estudio observacional
El investigador observa el comportamiento de interés directamente, por lo comúnen
su entorno natural.
La importancia de obtener buenos datos: GIGO
GIGO: Entra Basura, sale basura. No importa el método utilizado para obtenerlos
datos, si un estudio ha de ser útil, si el desempeño debe
controlarseapropiadamente o si el proceso de la toma de decisiones debe
ampliarse, losdatos recabados deben ser válidos: es decir, las respuestas
correctas debenvalorarse de manera que se obtengan mediciones significativas.
Obtención
de datos mediante investigación de encuesta
Tipos de datos
Existen básicamente dos tipos de variables aleatorias que producen dos tipos
dedatos: categóricas y numéricas. Las variables aleatorias categóricas
producenrespuestas categóricas, mientras que las variables numéricas
producenrespuestas numéricas. Las variables numéricas pueden considerarse
comodiscretas o continuas. Los datos discretos son respuestas numéricas que
surgende un proceso de conteo, mientras que los datos continuos son respuestas
numéricasque surgen de un proceso de medición.
La necesidad de definiciones operacionales. Una definición
operacionalproporciona un significado a un concepto o variable que puede
comunicarse aotros individuos. Es algo que tiene el mismo significado ayer, hoy
y mañanapara todos los individuos.
Diseño
del cuestionario
El objetivo de un cuestionario es permitirnos recabar información
significativaque nos ayude en el proceso de toma de decisiones.
- Selección de temas
amplios - Longitud del cuestionario
Los
amplios temas de los cuestionarios deben enumerarse. Mientras más largosea el
cuestionario, menor será el cociente de respuesta. Por tanto, se debenevaluar
cuidadosamente las preguntas. Las preguntas deben ser lo más cortosposibles.
Existen
tres modos mediante los cuales se realiza el trabajo de encuesta: laentrevista
persona, telefónica y por medio del correo. La personal es la quetiene una tasa
de respuesta mayor, pero es más costosa.
Cada
pregunta debe presentarse claramente en el menor número de palabras ycada
pregunta debe considerarse esencial para la encuesta. Además, deben serlibres
de ambigüedades.
Una
vez analizadas los pros y contras de cada pregunta se debe realizar unaprueba
piloto de manera que puedan examinarse en cuanto a claridad y longitud.
Elección
del tamaño de muestra para la encuesta
Existen tres razones para extraer una muestra. Antes que todo, por lo
generallleva demasiado tiempo realizar un censo completo. En segundo lugar,
esdemasiado costoso hacer un censo completo. Tercero, es demasiado molesto
eineficiente obtener un conteo completo de la población objeto
Selección
de los sujetos respondientes: tipos de muestras
Existen básicamente dos tipos de muestras: las muestra no probabilística y
lamuestra de probabilidad.
Una muestra de probabilidad es aquella en la que los sujetos de la muestra
seeligen sobre la base de probabilidades conocidas.
En una muestra aleatoria simple cada individuo o elemento tiene la
mismaoportunidad de selección que cualquier otro, y la selección de un
individuo oelemento particular no afecta la probabilidad de que se elija
cualquier otro.
Extracción
de la muestra aleatoria simple
La clave de la selección de muestras apropiada es obtener y mantener una
listaactualizada de todos los individuos o elementos de los cuales se extraerá
lamuestra. Tal lista se conoce como el marco de la población. Este listado
depoblación servirá como la población objetivo, de tal manera que si
seextrajeran muchas muestrasde probabilidades diferentes de tal lista, en el
mejorde los casos cada muestra sería una representación de la población.
-
Muestreo con o sin reemplazo de poblaciones finitas
Para seleccionar la muestra pueden usarse dos métodos básicos: con reemplazo
osin reemplazo. Digamos que N representa la población y n la muestra. Al
extraercon reemplazo la probabilidad de cualquier miembro de la población de
serseleccionado en la primera extracción es 1/N. La probabilidad de
serseleccionado en otra extracción sigue siendo 1/N debido a que una
vezregistrado el dato, el individuo seguirá formando parte de la población.
Sin embargo, al muestrear poblaciones humanas generalmente se considera másapropiado
tener una muestra de persona diferentes que permitir medicionesrepetidas de la
misma persona. La probabilidad en este caso es 1/N en la primeraextracción. La
probabilidad de que cualquier individuo no seleccionadopreviamente sea
seleccionado en la segunda extracción es 1/N-1.
La
encuesta de la muestra
El primer pasa para evaluar una encuesta es determinar si se basó en unamuestra
de probabilidad o en una no probabilístico.
Aun cuando las encuestas emplean métodos de muestreo de probabilidadaleatorios,
están sujetas a errores potenciales. Existen cuatro tipo de erroresde encuesta:
1 - Error de cobertura o sesgo de selección. Este error resulta de la exclusiónde
ciertos sujetos del listado de población, de tal manera que no
tienenoportunidad de ser seleccionados en la muestra. El error de cobertura
provoca elsesgo de selección.
2- Error de no-respuesta o sesgo de no-respuesta. El error de
no-respuestaresulta del fracaso de recolectar datos sobre todos los sujetos de
la muestra. Yel error de no-respuesta da como resultado el sesgo de
no-respuesta.
3- Error de Muestreo. Este error refleja la heterogeneidad o las diferencias
deoportunidad de muestra a muestra basándose en la probabilidad de los
sujetosque están siendo seleccionados en las muestras particulares. El error
demuestreo puede reducirse tomando tamaños de muestra mayores, aunque
estoincrementará el costo de aplicación de la encuesta.
4- Error de Medición. Este error se refiere a inexactitudes en las
respuestasregistradas que ocurren debido a una mala formulación de las
preguntas, elefecto de un entrevistados sobre el encuestado o el esfuerzo hecho
por elencuestado.
Organización
y Resumen de Datos
Organizacion, Resumen Y Presentacion De Datos Estadisticos
Conceptos que deben reforzarse
POBLACION:
es el conjunto formado por todas las unidades elementales queproporcionarán las
mediciones de interés. Pueden ser personas, cosas, objetosabstractos.
CENSO: Cuando se estudia la totalidad de las unidades elementales que componenla
población.
Desventaja: errores de observación. Ej.: omisiones, duplicaciones, no-ubicación(no
medibles) del encuestado, volumen de información
MUESTRA: se estudia una parte representativa de la población
Desventaja: errores de observación (no medibles) errores de estimación(medible,
cuantificable)
LOS DATOS ESTADISTICOS SON VARIABLES, SU RESULTADO VARIA DE UNA MEDICION A OTRA.
Debido a ello a los datos estadísticos los denominamos VARIABLES.
Según se vio, las Variables se clasifican en:
Categóricas Ordinales o Nominales Y Numéricas Discretas o Contínuas.
Caso Sr. Juárez
- Problema: "
Aumento en el índice de rotación de cobranzas".
- Población: Todos los
clientes que compran a crédito al señor Juárez en el local A o B.
- Supuestos: - Dos
Locales A y B.
- Datos del último
mes.
- Muestra Local A: 60
clientes; Local B: 78 clientes.
- Hipótesis de
Trabajo:
- Deudores del local A
necesitan menos tiempo para pagar.
- Situación económica
de los clientes peor
- Locales poseen
precios > competencia.
- Mal sistema de cobros
en cuenta corriente.
Para
Cada hipótesis se debe tomar una variable a analizar.
- Variable a Utilizar
en nuestro Caso: " Cantidad de días transcurridos entre la confección
de la factura y el efectivo cobro de la misma.
- Definiciones
operacionales:
N=
Tamaño de la población.
n= Tamaño de la muestra.
Yi = Variable a analizar
El
tamaño de muestra es independiente del tamaño de la población.
- Distribución de
frecuencia:
fi:
frecuencia absoluta.
Fi: frecuencia absoluta acumulada.
hi: frecuencia relativa ( cociente entre frecuencia absoluta y lamuestra/población
).
Hi: frecuencia relativa acumulada.
El 21,7 % de los clientes del local A pagan el día 20. En el local minoristahay
pocos que pagan los primeros días y pocos los que pagan el último día.
Para
comparar se trabaja con frecuencias relativas (cuando los tamaños demuestra son
distintos).
23/03/01
Práctico
Ejercicio 2.35 - Página 49
n = 1425
Objetivo: " Medir el grado de satisfacción de los clientes que
compraronuna videograbadora en los últimos 12 meses.
- Población: Todos los
clientes que compraron una videograbadora en los últimos 12 meses.
- Preguntas
cualitativas:
- ¿Qué le pareció el
producto?
-
Excelente.
-
Muy Bueno.
-
Bueno.
-
Malo.
- Recomendaría el
Producto.
-
Si.
-
No.
- Compraría nuestra
marca o producto.
Preguntas
Cuantitativas.
- ¿ Cuantas veces usó
el servicio técnico?
- Ninguna.
- Una.
- Dos.
- Más de dos.
- Diseño y
funcionamiento. Califique de uno a diez
- ¿ Cuántas marcas
analizó antes de decidir por Xenith?
- ¿Cuántos productos
Xenith posee Ud.?
Ejercicio
3.8 - Pagina 61
Estadística
Descriptiva: Puededefinirse como aquellos métodos que incluyen la recolección,
presentación ycaraterización de un conjunto de datos con el fin de describir
apropiadamentelas diversas características de ese conjunto.þ nosotros >
plazo de financiación.
b)
Diagrama de Tallo y Hoja SPSS lo hace en forma automática.
Yi=
Segundos que tarda un automóvil de llegar de 0 a 60 Mph.
Autos
Alemanes
|
Tallo
|
Hoja
|
|
4
|
9
|
|
5
|
5
|
4
|
1
|
|
6
|
4
|
9
|
4
|
7
|
0
|
9
|
|
7
|
9
|
1
|
5
|
|
8
|
6
|
7
|
3
|
5
|
5
|
8
|
9
|
|
9
|
|
|
10
|
0
|
9
|
27/03/01
Construcción
de Gráficos
- Nombrar los ejes.
- Título del gráfico.
- Fuente de datos.
Ejercicio
3.70 - Pagina 95
|
Yi
|
fi
|
hi
|
Fi
|
Hi
|
|
|
|
|
|
|
|
1,00
|
1
|
0,03
|
1
|
0,03
|
|
1,50
|
2
|
0,07
|
3
|
0,10
|
|
2,00
|
3
|
0,10
|
6
|
0,20
|
|
2,50
|
2
|
0,07
|
8
|
0,27
|
|
3,00
|
6
|
0,20
|
14
|
0,47
|
|
3,50
|
5
|
0,17
|
19
|
0,63
|
|
4,00
|
2
|
0,07
|
21
|
0,70
|
|
4,50
|
2
|
0,07
|
23
|
0,77
|
|
5,00
|
3
|
0,10
|
26
|
0,87
|
|
5,50
|
1
|
0,03
|
27
|
0,90
|
|
6,00
|
1
|
0,03
|
28
|
0,93
|
|
6,50
|
1
|
0,03
|
29
|
0,97
|
|
7,00
|
1
|
0,03
|
30
|
1,00
|
|
|
30
|
1,00
|
|
|
Yi
= $ de cada manómetro.
fi
= cantidad de veces que se repite la variable.
En
este caso se supone que la variable es discreta.
Construcción de Intervalos
Intervalos
sirve en especial para variables continuas
Ry = Y max - Y min = Recorrido = Amplitud = Rango
Ry = 7.5 - 1 = 6.5
Cantidad
de intervalos 4
C= Amplitud del intervalo = Ry / Cantidad de intervalos = 6.5/4 = 1.625
C = Valor entero = 2
Ry* = c x cantidad de intervalos = 2 x 4 = 8
|
Yi-1 - Yi
|
Yi
|
fi
|
hi
|
|
|
|
|
|
|
1
- 3
|
2
|
8
|
0.27
|
|
3
- 5
|
4
|
15
|
0.50
|
|
5
- 7
|
6
|
6
|
0.20
|
|
7
-9
|
8
|
1
|
0.03
|
|
|
|
30
|
1
|
Construcción
del intervalo del Caso Juárez.
R = 38 - 14 = 24
Cantidad de Intervalos = 7
Amplitud = Ry / c = 3.43 = 4
3.
Resumen Capítulo 3 del Libro
Presentación
de datos numéricos en tablas y diagramas
Una distribución de frecuencia es una tabla de resumen en la que los datos
sedisponen en agrupamientos o categorías convenientemente establecidas de
clasesordenadas numéricamente.
En esta forma las características más importantes de los datos se aproximanmuy
fácilmente, compensando así el hecho de que cuando los datos se agrupan deese
modo, la información inicial referente a las observaciones individuales deque
antes se disponía se pierde a través del proceso de agrupamiento ocondensación.
Al
construir la tabla de frecuencia-distribución, debe ponerse atención a:
- Seleccionar el número
apropiado de agrupamientos de clase para la tabla.
- Obtener un intervalo
o ancho de clase de cada agrupamiento de clase.
- Establecer los límites
de cada agrupamiento de clase para evitar los traslapes.
Selección
del Número de Clases
La distribución de frecuencia debe tener al menos cinco agrupamiento de
clase,pero no más de 15. Si no hay suficientes agrupamientos de clase o si
haydemasiados, se obtendrá poca información.
Obtención
de los intervalos de clase
Ancho del intervalo Rango
número
de agrupamientos de clase deseado
La
principal ventaja de usar una de estas tablas de resumen es que lasprincipales
características de los datos se hacen evidentes inmediatamente parael lector.
La principal desventaja de tal tabla de resumen es que no podemos saber como
sedistribuyen los valores individuales dentro de un intervalo de clase
particularsin tener acceso a los datos originales. El punto medio de la clase,
sinembargo, es el valor usado para representar todos los datos resumidos en
unintervalo particular.
El punto medio de una clase (o marca de clase) es el punto a la mitad de los límitesde
cada clase y es representativo de los datos de esa clase.
Tabulación
de datos numéricos: la distribución de frecuencia relativa ydistribución de
porcentaje
La distribución relativa de frecuencia se forma dividiendo las frecuencias
decada clase de distribución de frecuencia entre el número total
deobservaciones. Entonces puede formarse una distribución de
porcentajemultiplicando cada frecuencia relativa o proporción entre 100.
La distribución de frecuencia relativa o la distribución de porcentaje
sevuelve esencial siempre que una serie de datos se compara con otra seria
dedatos, especialmente si difiere el número de observaciones en cada serie
dedatos.
Graficación
de datos numéricos: el histograma y el polígono
Histogramas
Los histogramas son diagramas de barras verticales en los que se
construyenbarras rectangulares en los límites de cada clase. La variable
aleatoria o fenómenode interés se despliega a lo largo del eje horizontal; el
eje verticalrepresenta el número, proporción o porcentaje de observaciones por
intervalode clase, dependiendo de si el histograma particular, es un histograma
defrecuencia, un histograma de frecuencia relativa o histograma de porcentaje
Al
comparar dos o más series de datos, ni los diagramas de tallo y hoja nilos
histogramas pueden construirse en la misma gráfica. Con respecto a estos últimos,la
sobreposición de barras verticales de uno en el otro ocasionaríadificultades
de interpretación; en estos casos se usan los polígonos.
Polígonos
El polígono de porcentaje se forma permitiendo que el punto medio de cada
claserepresente los datos de esa clase y luego conectando la sucesión de
puntosmedios con sus respectivos porcentajes de clase.
Distribuciones
acumulativas y polígonos acumulativos
Una tabla de distribución de porcentaje acumulativo se construye
registrandoprimero los límites inferiores de cada clase a partir de la
distribución deporcentaje y luego insertando un límite extra al final.
Polígono
de porcentaje acumulativo
Para construir un polígono de porcentaje acumulativo (también llamado
ojiva),el fenómeno se grafica en el eje horizontal, mientras que los
porcentajesacumulativos se grafican en el eje vertical.
4.
Resumen Capítulo 4 del Libro
Resumen
y descripción de los datos numéricos
Propiedades de los datos numéricos.
Las tres mejores propiedades que describe una serie numérica de datos son:
- Tendencia central
- Variación
- Forma
Si
estas mediciones se calculan a partir de una muestra, se denominan estadísticas,si
se calculan a partir de los datos de una población se denominan parámetros.
Mediciones
de tendencia Central
- La media aritmética,
es el promedio. Se calcula sumando todas las observaciones y luego
dividiendo el total entre el número de elementos involucrados.
La
media actúa como punto de equilibrio de tal forma que las observacionesmenores
compensan a las observaciones que son mayores.
La
media aritmética se ve afectada en gran medida por valores extremos.
- La mediana. Es el
valor medio de una secuencia ordenada de datos. Si no hay empates, la mitad
de las observaciones serán menores y la otra mitad serán mayores. La
mediana no se ve afectada por valores extremos. Para calcular la mediana,
primero se deben poner los datos en orden. Después usamos la fórmula del
punto de posicionamiento.
El
cálculo del valor de la media se ve afectado por el número deobservaciones, no
por la magnitud de cualquier extremo.
- La moda. Es el valor
de una serie de datos que aparece con más frecuencia. La moda no se ve
afectada por la ocurrencia de cualquier valor extremo.
- Cuartiles. Los
cuartiles sonmediciones descriptivas que dividen los datos ordenados en
cuatro cuartos.
Mediciones
de la Variación
La variación es la cantidad de dispersión o propagación en los datos.
- El rango: es la
diferencia entre la mayor y la menor observación en una serie de datos. El
rango mide la propagación total en la serie de datos. La debilidad del
rango es que no logra tomar en cuenta la forma en que los datos se
distribuyen realmente entre el mayor y el menor valor. Sería impropio usar
el rango como una medición cuando uno de o ambos componentes son
observaciones extremas.
- El rango
intercuartil: es la diferencia entre el tercer y primer cuartil. No se ve
influida por valores extremos.
- La varianza y la
desviación estándar: a diferencia de las mediciones anteriores la varianza
y la desviación estándar toman en cuenta como se distribuyen las
observaciones. La Varianza de muestra es el promedio de las diferencias
cuadradas entre cada una de las observaciones de una serie de datos y la
media. La desviación estándar es simplemente la raíz cuadrada de la
varianza. La varianza y la desviación miden la dispersión promedio
alrededor de la media, es decir, como las observaciones mayores fluctúan
por encima de ésta y como las observaciones menores se distribuyen por
debajo de ésta.
- El Coeficiente de
Variación: es una medida relativa de variación. Se expresa como porcentaje
antes que en términos de las unidades de los datos particulares. Mide la
dispersión en los datos relativa a la media.
El
coeficiente de variación es útil al comparar la variabilidad de dos o másseries
de datos que se expresan en distintas unidades de medición.
Forma
Para describir la forma sólo necesitamos comparar la media y la mediana.
Siestas dos mediciones son iguales, por lo general podemos considerar que
losdatos son simétricos. Si la media excede a la mediana, los datos
puedendescribirse de sesgo positivo o sesgadas a la derecha. Si la media es
excedidapor la mediana, estos datos pueden llamarse de sesgo negativo o sesgadas
a laizquierda. El sesgo positivo surge cuando la media se incrementa en
algunosvalores inusualmente altos, el sesgo negativo ocurre cuando la media se
reduceen algunos valores extremadamente bajos.
Cálculo
de mediciones descriptivas de resumen de una población
Las mediciones de tendencia central para una población se calculan igual que
enla muestra simplemente reemplazamos n por N.
El rango y el rango intercuartil para una población de tamaño N se
obtienencomo si fuera una muestra reemplazando n por N. La varianza se
calculareemplazando el ( n - 1 ) del denominador por N.
Uso
de la Desviación Estándar: La regla Empírica
En series de datos simétricos, donde la mediana y la media son iguales,
lasobservaciones tienden a distribuirse igualmente alrededor de estas mediciones
detendencia central. Cuando el sesgado extremo no se presenta y tal
agrupamientose observa en una serie de datos, podemos usar la denominada regla
empíricapara examinar la propiedad de variabilidad de datos y obtener una mejor
idea delo que la desviación estándar está midiendo.
La
regla empírica establece que en la mayoría de las series de datosencontraremos
que aproximadamente dos de cada tres observaciones (es decir, el67%), están
contenidas en una distancia de una desviación estándar alrededorde la media y
aproximadamente 90% a 95% de las observaciones están contenidas auna distancia
de 2 desviaciones estándar alrededor de la media.
Uso
de la desviación estándar: La regla de Bienaymé Chebyshev
No
importa como se distribuyen los datos. el porcentaje de las distribucionesestán
contenidas dentro de las dsitancias de k desviaciones estándar alrededorde la
media debe ser al menos
1
- 1 / k2
Al
menos 75% de las observaciones deben estar contenidas dentro de distanciasde
+/-2 desviaciones estándar alrededor de la media. Al menos 88,89% de
lasobservaciones deben estar contenidas dentro de una distancia de
+/-3desviaciones estándar alrededor de la media. Al menos 93.75% de
lasobservaciones deben estar contenidas dentro de distancias de +/-4
desviacionesestándar alrededor de la media.
5.
Resumen Capítulo 5 del Libro
Presentación
de datos categóricos en tablas y diagramas
Graficación
de datos categóricos: de barras, de pastel y de punto
En
la gráfica de barras, cada categoría se describe mediante una barra,cuya
longitud representa la frecuencia o porcentaje de observaciones que caen enuna
categoría. Para construir una gráfica de barras se hacen las
siguientessugerencias:
- Las barras deben
construirse horizontalmente.
- Todas las barras
deben tener el mismo ancho.
- Los espacios entre
las barras deben variar entre la mitad
- del ancho de una
barra hasta el ancho de una barra.
- Las escalas y guías
son auxiliares útiles en la lectura
- de una gráfica y
deben incluirse. El punto cero u origen debe indicarse.
- Los ejes deben
etiquetarse.
- Gráfica de Pastel
- Gráfica de Puntos
Graficación
de datos categóricos: el Diagrama de Pareto.
El diagrama de Pareto es un tipo especial de gráfica de barras verticales en
laque las respuestas categórizadas se grafican en el orden de rango
descendientede sus frecuencias y se combinan con un polígono acumulativo en la
mismaescala. El principio básico detrás de este dispositivo gráfico es
sucapacidad de distinguir los "pocos vitales" de los
"muchostriviales".
Tabulación
de datos categóricos: Tabla de contingencias y supertablas.
Las tablas de contingencia se usan para examinar las respuestas a dos
variablescategóricas simultáneamente.
Supertablas. Una supertabla es esencialmente una colección de tablas
decontingencia, cada una con las mismas variables y categorías de columna.
Sinembargo, se incluyen tantas variables de fila como se deseen para
comparacionesfrente a la variable de columna.
Tipos
de Gráficos
Medidas Estadísticas.
Medidas Estadísticas descriptivas.
- Variables Numéricas:
- Medidas de posición.
- Media.
- Mediana.
- Moda.
- Cuartiles.
- Medidas de Variación.
- Rango.
- Rango Medio.
- Varianza.
- Desvío Estándar.
- Coeficiente de
variación.
6.
Capitulo 6 del libro
Probabilidad
Básica
La probabilidad es la posibilidad u oportunidad de que suceda un
eventoparticular. La probabilidad involucrada es una porción o fracción cuyo
valorvaría entre cero y uno exclusivamente. Observamos un evento que no
tieneposibilidad de ocurrir (es decir, el evento nulo), tiene una probabilidad
decero, mientras que un evento que seguramente ocurrirá (es decir, el
eventocierto), tiene una probabilidad de uno. Ejemplo:
- La posibilidad de
sacar una carta con figura negra de una baraja.
- La posibilidad de que
un individuo seleccionado aleatoriamente de una encuesta este de acuerdo con
X tema.
- La posibilidad que
tenga éxito un nuevo producto en el mercado.
Cada
uno de los ejemplos anteriores se refiere a uno de los tresplanteamientos del
tema de la probabilidad. El primero a menudo se denominacomel planteamiento de
la probabilidad clásica a priori. Aquí la probabilidad deéxito se basa en el
conocimiento nterior del proceso involucrado. En el caso mássimple, cuando cada
resultado es igualmente posible. Esta posibilidad puededefinirse de la siguiente
manera:
En el segundo ejemplo; llamado probabilidad clásica empírica, aunque
laprobabilidad se sigue definiendo como la proporción entre el número
deresultados favorables y el número total de resultados, estos resultados
sebasan en datos observados, no en el conocimiento anterior a un proceso.
El
tercer planteamiento de probabilidad se denomina el enfoque deprobabilidad
subjetiva. Mientras que en los dos anteriores enfoques laprobabilidad de un
evento favorable se calculaba objetivamente, ya fuera de unconocimiento previo o
de datos reales, la probabilidad subjetiva se refiere a laposibilidad de
ocurrencia asignada a un evento por un individuo particular. Laprobabilidad
subjetiva es especialmetne útil para la toma de decisiones enaquellas
situaciones en que la probabilidad de diversos eventos no puededeterminarse empíricamente.
Conceptos
de probabilidad básica
Espacios de muestra y eventos
Los elementos básicos de la teoría de probabilidades son los resultados
delproceso o fenómeno bajo estudio. Cada tipo posible de ocurrencia se denomina
unevento.
Un
evento simple puede puede describirse mediante una característicasencilla. la
compilación de todos los eventos posibles se llama el espaciomuestral.
La manera en que se subdivide el espacioi muestral depende de los tipos
deprobabilidades que se han de determinar. Tomando esto en cuenta, resulta
deinterés definir tanto el complemento de un evento como un evento conjunto de
lasiguiente manera:
La complemento del evento A incluye todos los elementos que no son parte
delevento A. Esta dado por el símbolo A´.
Un evento conjunto es un evento que tiene dos o más características.
Tablas
de Contingencias y diagramas de Venn
Existen
varias formas en las que puede verse un espacio muestral particular.El primer método
implica asignar los eventos apropiados a una tabla declasificaciones cruzadas.
Tal tabla también se denomina tabla de contingencia.
|
|
Roja
|
Negro
|
Totales
|
|
As
|
2
|
2
|
4
|
|
No As
|
24
|
24
|
48
|
|
Totales
|
26
|
26
|
52
|
La
segunda forma de presentar el espacio muestral es usando un diagrama deVenn.
Este diagrama se representa gráficamente los diversos eventos
como"uniones" e "intersecciones" de círculos.
El
área contenida dentro del círculo A y de círculo B (área central) esla
intersección de de Ay B (y se escribe A
Probabilidad
( marginal ) simple
La
regla mas evidente para las probabilidades es que deben variar en valor de0 a 1.
Un evento imposible tiene una probabilidad cero de ocurrir, y un eventocierto
tiene una probabilidad uno de ocurrir. La probabilidad simple se refierea la
probabilidad de ocurrencia de un evento simple.
Ejemplo:
- la probabilidad de
seleccionar una carta negra;
- la probabilidad de
seleccionar un As
La
probabilidad simple se denomina probabilidad marginal puesto que el númerototal
de éxitos puede obtenerse del márgen apropiado de la table decontingencias.
Probabilidad
Conjunta
La
probabilidad conjunta se refiere a fenómenos que contienen dos o maseventos,
como la probabilidad de un as negro, una reina roja o un empleado queeste
satisfecho con el trabajo y haya progresado dentro de la organización.
P
(A)= P ( A y B1 ) + P ( A y B2 ) + .....+ P ( A y Bk )
donde
B1, B2, ... Bk son eventos mutuamente excluyentes y colectivamenteexhaustivos.
Dos
eventos son mutuamente excluyentes si ambos eventos no pueden ocurrir almismo
tiempo.
Dos
eventos son colectivamente exhaustivos si uno de los eventos debeocurrir.
Por
ejemplo, ser hombre y ser mujer son eventos mutuamente excluyentes
ycolectivamente exhaustivos. Nadie es ambos ( son mutuamente excluyentes )
ytodos son uno u otro ( son colectivamente exhaustivos ).
Regla
de la adición
La
regla de la adición se usa para encontrar la probabilidad del evento A oB. Esta
regla para obtener la probabilidad de la unión de A y B considera laocurrencia
del evento A o del evento B o de ambos, A y B.
El
cálculo de P ( A
P
( A
Eventos
mutuamente excluyentes
En
ciertas circunstancias, sin embargo, la probabilidad conjunta no
necesitarestarse porque es igual a cero. Tales circunstancias cuando no
existenresultados para un evento particular. Por ejemplo, suponga que deseamos
saber laprobabilidad de escoger un corazon o una espada si estuviéramos
seleccionando sólouna carta de una baraja estándar de 52 cartas de juego.
Usando la regla de laadición, tenemos lo siguiente:
P
( corazón o espada ) = P ( corazón ) + P ( espada ) – P ( corazón yespada )
P
= 13/52 + 13/52 – 0/52 = 26/52
La
intersección en este caso no existe ( llamado el conjunto nulo ) porqueno
contiene resultados, puesto que una carta no puede ser corazón y espadasimultáneamente.
Siempre
que la probabilidad conjunta no contenga ningún resultado, loseventos
involucrados se consideran mutuamente excluyentes. Asi la regla generalpara
eventos mutuamente excluyentes se reduce a:
P
( A o B ) = P ( A ) + P ( B )
Eventos
colectivamente exhaustivos
Consideremos
la probabilidad de seleccionar una carta negra o rojo. Puestoque son mutuamente
excluyentes al usar la ecuación: 26/52 + 26/52 = 1
La
probabilidad de rojo o negro suma uno. Dado que uno de los eventos debeocurrir
se consideran mutuamente excluyentes.
Probabilidad
Condicional.
Cuando
estamos calculando la probabilidad de un evento particular A, dadainformación
sobre la ocurrencia de otro evento B, esta probabilidad se denominaprobabilidad
condicional, P ( A \ B ). La probabilidad condicional P ( A \ B )puede definirse
de la siguiente manera:
P
( A \ B ) = P ( A y B )
P
( B )
- Independencia estadística
Se dice que dos eventos independientes si el conocimiento previo de la
probabilidad de ocurrencia de uno de ellos no afecta la probabilidad del
otro. Puede definirse de la siguiente manera:
P ( A \ B ) = P ( A )
Regla
de multiplicación
La
fórmula para la probabilidad condicional puede manipularsealgebraicamente de
forma tal que la probabilidad conjunta P ( A y B ) puededeterminarse a partir de
la probabilidad condicional de un evento.
La
regla de multiplicación para eventos independientes puede expresarse dela
siguiente manera sustituyendo P ( A ) por P ( A \ B ):
P
( A y B ) = P ( A ) * P ( B )
Si
esta regla se cumple para dos eventos, A y B entonces A y B son estadísticamenteindependientes.
Por tanto, hay dos formas de determinar la independencia estadística:.
- Los eventos A y B son
estadísiticamente independientes si y sólo si P ( A \ B )=P (A)
- Los eventos A y B son
estadísticamente independientes si y sólo si P ( A y B ) = P ( A ) * P ( B
).
Teorema
de Bayes
La probabilidad condicional toma en cuenta información respecto a la
ocurrenciade un evento para encontrar la probabilidad de otro evento. Este
concepto puedeampliarse para revisar probabilidaddes basadas en nueva información
y, asídeterminar la probabilidad que un efecto particular se deba a una causa
específica.El procedimiento para revisar estas probabilidades se conoce como
teorema deBayes.
El
teorema de Bayes puede definirse a partir de las definiciones deprobabilidad
condicional y probabilidad marginal, asi el teorema de Bayes es:
P ( Bi \ A ) = P ( A \ Bi ) P ( Bi )
P ( A \ B1 ) P ( B1 ) + P ( A \ B2 ) P ( B2 )
7.
Capítulo 7 del libro
Algunas
distribuciones importantes de probabilidad discreta
Una
distribución de probabilidad para una variable aleatoria discreta es unlistado
mutuamente excluyente de todos los resultadosposibles para esa
variablealeatoria, tal que una probabilidad particular de ocurrencia esté
asociada concada resultado.
Esperanza
Matemática
La media de una distribución de probabilidad es el valor esperado de suvariable
aleatoria.
El valor esperado de una variable aleatoria discreta puede considerarse como
supromedio pesadoo sobre todos los resultados posibles, siendo los pesos
laprobabilidad asociada con cada uno de los resultados.
Esta
medición de resumen puede puede obtenerse multiplicando cada resultadoposible
Xi, por su probabilidad correspondiente P (Xi) y luego sumando losproductos
resultantes. Por tanto, el valor esperado de la variable aleatoriadiscreta X,
simbolizado como E (X), puede expresarse de la siguiente manera:
E(X)= ∑ Xi * P ( Xi)
Varianza
y desviación estándar de una variable aleatoria discreta
La varianza de una variable aleatoria discreta puede definirse como el
promediopesado de las diferencias cuadradas entre cada resultado posible y su
media,siendo los pesos las probabilidades de cada uno de los resultados
respectivos.
Esta
medición de resumen puede obtenerse multiplicando cada diferenciacuadrada
posible ( Xi – μ )2 por su probabilidad correspondiente P (Xi) yluego
sumando los productos restantes. Por lo tanto la varianza de la
variablealeatoria discreta X puede expresarse de la siguiente manera:
( Xi – μ
)2 * P (Xi)
Funciones
de distribución de probabilidad discreta
La distribución de probabilidad para una variable aleatoria discreta puede ser:
- Un listado teórico
de resultados y probabilidades que pueden obtenerse de un modelo matemático
que represente algún fenómeno de interés.
- Un listado empírico
de resultados y sus frecuencias relativas observadas.
- Un listado subjetivo
de resultados asociados con sus probabilidades subjetivas que representan el
grado de convicción del tomador de decisiones respecto a la probabilidad de
los resultados posibles.
Un
modelo se considera una representación en miniatura de algún fenómenosubyacente.
En particular, un modelo matemático es una expresión matemáticaque representa
cierto fenómeno subyacente. Para variables aleatorias discretas,esta expresión
matemática se conoce como función de distribución deprobabilidad.
La
característica escencial de la distribución uniforme es que esigualmente
posible que ocurran todos los resultados de la variable aleatoria.
Distribución
Binomial
La
distribución binomial es una distribución de probabilidad discreta quees
extremadamente útil para describir muchos fenómenos.
La
distribución binomial posee cuatro propiedades esenciales:
- Las observaciones
posibles pueden obtenerse mediante dos métodos de muestreo distintos. Cada
observación puede considerarse como seleccionada de una población infinita
sin reemplazo o de una población finita con reemplazo.
- Cada observación
puede clasificarse en dos categorías mutuamente excluyentes y
colectivamente exhaustivas, usualmente denominadas éxito y fracaso.
- La probabilidad de
que una observación se clasifique como éxito, p, es constante de observación
a observación.
- El resultado de
cualquier observación es independiente del resultado de cualquier observación.
Modelo
matemático
ÇB)
, puesto que esta área es parte de A y tambien parte de B. El área total delos
dos círculos es la unión de A y B (y se escribe A ÈB ) y contiene todos los
resultados que son parte del evento A, parte del eventoB o parte de ambos A y B.
El área fuera del diagrama fuera de A ÈB contiene aquelloos resultados que no
sonparte de A ni son parte de B.ÈB ), la probabilidad del evento A o B, puede
expresarse en la siguiente regla dela adición general:ÈB ) = P ( A o B ) = P (
A ) + P ( B ) – P ( A y B )
P(
X= x \ n, p ) = n ! px ( 1 – p ) n-x
X
! ( n –