Monografias | Resumen del libro de estadísticas de Berenson y Levine

Resumen del libro de estadísticas de Berenson y Levine

Resumen: Resumen del libro de estadísticas de Berenson y Levine. Aplicaciones estadísticas en administración de la calidad y productividad. Estadística descriptiva e inferencial. Recolección de datos. Diseño de un experimento. Diseño de un cuestionario. Elección del tamaño de la muestra. Organización y Resumen de Datos. Frecuencia.

Publicación enviada por Hernan Torino


 

Índice

Índice

1. Resumen Capítulo 1 del Libro

2. Resumen Capítulo 2 del Libro

3. Resumen Capítulo 3 del Libro

4. Resumen Capítulo 4 del Libro

5. Resumen Capítulo 5 del Libro

6. Capitulo 6 del libro

7. Capítulo 7 del libro

8. Capítulo 8 del libro

9. Capitulo 9 del libro

10. Capitulo 10 del libro

11. Hipótesis nula y alternativa

12. Capitulo 12 del libro

13. Capítulo 13 del libro

14. Capitulo 14 del libro

15. Capítulo 15 del libro

16. Aplicaciones estadísticas en administración de la calidad y productividad

 

1. Resumen Capítulo 1 del Libro

  • Estadística Inferencial: Puede definirse como aquellos métodos que hacen posible la estimación de una característica de una población o la toma de una decisión referente a una población basándose sólo en los resultados de una muestra.

Para aclara este concepto se necesitan de las siguientes definiciones:

  • Población: es la totalidad de elementos o cosas bajo consideración.
  • Muestra: Es la porción de la población que se selecciona para su análisis.
  • Parámetro: Es una medida de resumen que se calcula para describir una característica de toda una población.
  • Estadística: Es una medida que se calcula para describir una característica de una sola muestra de la población.

Podemos encontrar dos tipos de estudios estadísticos que se emprenden: losestudios enumerativos y los estudios analíticos.

Los estudios enumerativos involucran la toma de decisiones respecto a unapoblación y/o sus características.
Los estudios analíticos involucran realizar alguna actividad sobre un procesopara mejorar el desempeño en el futuro. La atención de un estudio analíticoestá puesta sobre la predicción del comportamiento futuro de un proceso ysobre la comprensión y perfeccionamiento de ese proceso. En un estudio analíticono existe un universo identificable, como sucede en un estudio enumerativo y enconsecuencia tampoco hay un marco.

2. Resumen Capítulo 2 del Libro

Recolección de Datos

La necesidad de datos: los datos se necesitan para:

  1. Proporcionar la introducción imprescindible para un estudio de investigación.
  2. Medir el desempeño en un servicio o proceso de producción en curso.
  3. Ayudar en la formulación de cursos alternativos de acción en un proceso de toma de decisiones.
  4. Satisfacer nuestra curiosidad.

¿Que es un dato?
Los datos pueden concebirse como información numérica necesaria para ayudarnosa tomar una decisión con más bases en una situación particular.

¿Cómo obtenemos los datos?
Existen muchos métodos mediante los cuales podemos obtener los datosnecesarios. Primero, podemos buscar datos ya publicados por fuentesgubernamentales, industriales o individuales. Segundo, podemos diseñar unexperimento. En tercer lugar, podemos conducir un estudio. Cuarto, podemos hacerobservaciones del comportamiento, actitudes u opiniones de los individuos en losque estamos interesados.

Utilización de fuentes de datos publicadas

Sin importar la fuente utilizada, se hace una distinción entre el recolectororiginal de los datos y la organización o individuos que compilan éstos entablas y diagramas. El recolector de datos es la fuente primaria; el compiladorde los datos es la fuente secundaria.

Diseño de un experimento
En un experimento se ejerce control sobre el tratamiento de los dado a losparticipantes.

Conducción de una encuesta
Aquí no se ejerce ningún control sobre el comportamiento de la genteencuestada. Simplemente se formulan preguntas respecto a sus opiniones,actitudes, comportamiento y otras características.

Realización de un estudio observacional
El investigador observa el comportamiento de interés directamente, por lo comúnen su entorno natural.
La importancia de obtener buenos datos: GIGO
GIGO: Entra Basura, sale basura. No importa el método utilizado para obtenerlos datos, si un estudio ha de ser útil, si el desempeño debe controlarseapropiadamente o si el proceso de la toma de decisiones debe ampliarse, losdatos recabados deben ser válidos: es decir, las respuestas correctas debenvalorarse de manera que se obtengan mediciones significativas.

Obtención de datos mediante investigación de encuesta
Tipos de datos
Existen básicamente dos tipos de variables aleatorias que producen dos tipos dedatos: categóricas y numéricas. Las variables aleatorias categóricas producenrespuestas categóricas, mientras que las variables numéricas producenrespuestas numéricas. Las variables numéricas pueden considerarse comodiscretas o continuas. Los datos discretos son respuestas numéricas que surgende un proceso de conteo, mientras que los datos continuos son respuestas numéricasque surgen de un proceso de medición.
La necesidad de definiciones operacionales. Una definición operacionalproporciona un significado a un concepto o variable que puede comunicarse aotros individuos. Es algo que tiene el mismo significado ayer, hoy y mañanapara todos los individuos.

Diseño del cuestionario
El objetivo de un cuestionario es permitirnos recabar información significativaque nos ayude en el proceso de toma de decisiones.

  • Selección de temas amplios - Longitud del cuestionario

Los amplios temas de los cuestionarios deben enumerarse. Mientras más largosea el cuestionario, menor será el cociente de respuesta. Por tanto, se debenevaluar cuidadosamente las preguntas. Las preguntas deben ser lo más cortosposibles.

  • Modo de Respuesta

Existen tres modos mediante los cuales se realiza el trabajo de encuesta: laentrevista persona, telefónica y por medio del correo. La personal es la quetiene una tasa de respuesta mayor, pero es más costosa.

  • Formulación de preguntas

Cada pregunta debe presentarse claramente en el menor número de palabras ycada pregunta debe considerarse esencial para la encuesta. Además, deben serlibres de ambigüedades.

  • Prueba del cuestionario

Una vez analizadas los pros y contras de cada pregunta se debe realizar unaprueba piloto de manera que puedan examinarse en cuanto a claridad y longitud.

Elección del tamaño de muestra para la encuesta
Existen tres razones para extraer una muestra. Antes que todo, por lo generallleva demasiado tiempo realizar un censo completo. En segundo lugar, esdemasiado costoso hacer un censo completo. Tercero, es demasiado molesto eineficiente obtener un conteo completo de la población objeto

Selección de los sujetos respondientes: tipos de muestras
Existen básicamente dos tipos de muestras: las muestra no probabilística y lamuestra de probabilidad.
Una muestra de probabilidad es aquella en la que los sujetos de la muestra seeligen sobre la base de probabilidades conocidas.
En una muestra aleatoria simple cada individuo o elemento tiene la mismaoportunidad de selección que cualquier otro, y la selección de un individuo oelemento particular no afecta la probabilidad de que se elija cualquier otro.

Extracción de la muestra aleatoria simple
La clave de la selección de muestras apropiada es obtener y mantener una listaactualizada de todos los individuos o elementos de los cuales se extraerá lamuestra. Tal lista se conoce como el marco de la población. Este listado depoblación servirá como la población objetivo, de tal manera que si seextrajeran muchas muestrasde probabilidades diferentes de tal lista, en el mejorde los casos cada muestra sería una representación de la población.

- Muestreo con o sin reemplazo de poblaciones finitas
Para seleccionar la muestra pueden usarse dos métodos básicos: con reemplazo osin reemplazo. Digamos que N representa la población y n la muestra. Al extraercon reemplazo la probabilidad de cualquier miembro de la población de serseleccionado en la primera extracción es 1/N. La probabilidad de serseleccionado en otra extracción sigue siendo 1/N debido a que una vezregistrado el dato, el individuo seguirá formando parte de la población.
Sin embargo, al muestrear poblaciones humanas generalmente se considera másapropiado tener una muestra de persona diferentes que permitir medicionesrepetidas de la misma persona. La probabilidad en este caso es 1/N en la primeraextracción. La probabilidad de que cualquier individuo no seleccionadopreviamente sea seleccionado en la segunda extracción es 1/N-1.

La encuesta de la muestra
El primer pasa para evaluar una encuesta es determinar si se basó en unamuestra de probabilidad o en una no probabilístico.
Aun cuando las encuestas emplean métodos de muestreo de probabilidadaleatorios, están sujetas a errores potenciales. Existen cuatro tipo de erroresde encuesta:
1 - Error de cobertura o sesgo de selección. Este error resulta de la exclusiónde ciertos sujetos del listado de población, de tal manera que no tienenoportunidad de ser seleccionados en la muestra. El error de cobertura provoca elsesgo de selección.
2- Error de no-respuesta o sesgo de no-respuesta. El error de no-respuestaresulta del fracaso de recolectar datos sobre todos los sujetos de la muestra. Yel error de no-respuesta da como resultado el sesgo de no-respuesta.
3- Error de Muestreo. Este error refleja la heterogeneidad o las diferencias deoportunidad de muestra a muestra basándose en la probabilidad de los sujetosque están siendo seleccionados en las muestras particulares. El error demuestreo puede reducirse tomando tamaños de muestra mayores, aunque estoincrementará el costo de aplicación de la encuesta.
4- Error de Medición. Este error se refiere a inexactitudes en las respuestasregistradas que ocurren debido a una mala formulación de las preguntas, elefecto de un entrevistados sobre el encuestado o el esfuerzo hecho por elencuestado.

Organización y Resumen de Datos
Organizacion, Resumen Y Presentacion De Datos Estadisticos
Conceptos que deben reforzarse

POBLACION: es el conjunto formado por todas las unidades elementales queproporcionarán las mediciones de interés. Pueden ser personas, cosas, objetosabstractos.
CENSO: Cuando se estudia la totalidad de las unidades elementales que componenla población.
Desventaja: errores de observación. Ej.: omisiones, duplicaciones, no-ubicación(no medibles) del encuestado, volumen de información
MUESTRA: se estudia una parte representativa de la población
Desventaja: errores de observación (no medibles) errores de estimación(medible, cuantificable)
LOS DATOS ESTADISTICOS SON VARIABLES, SU RESULTADO VARIA DE UNA MEDICION A OTRA.
Debido a ello a los datos estadísticos los denominamos VARIABLES.
Según se vio, las Variables se clasifican en:
Categóricas Ordinales o Nominales Y Numéricas Discretas o Contínuas.
Caso Sr. Juárez

  • Problema: " Aumento en el índice de rotación de cobranzas".
  • Población: Todos los clientes que compran a crédito al señor Juárez en el local A o B.
  • Supuestos: - Dos Locales A y B.
  • Datos del último mes.
  • Muestra Local A: 60 clientes; Local B: 78 clientes.
  • Hipótesis de Trabajo:
  • Deudores del local A necesitan menos tiempo para pagar.
  • Situación económica de los clientes peor
  • Locales poseen precios > competencia.
  • Mal sistema de cobros en cuenta corriente.

Para Cada hipótesis se debe tomar una variable a analizar.

  • Variable a Utilizar en nuestro Caso: " Cantidad de días transcurridos entre la confección de la factura y el efectivo cobro de la misma.
  • Definiciones operacionales:

N= Tamaño de la población.
n= Tamaño de la muestra.
Yi = Variable a analizar

El tamaño de muestra es independiente del tamaño de la población.

  • Distribución de frecuencia:

fi: frecuencia absoluta.
Fi: frecuencia absoluta acumulada.
hi: frecuencia relativa ( cociente entre frecuencia absoluta y lamuestra/población ).
Hi: frecuencia relativa acumulada.
El 21,7 % de los clientes del local A pagan el día 20. En el local minoristahay pocos que pagan los primeros días y pocos los que pagan el último día.

Para comparar se trabaja con frecuencias relativas (cuando los tamaños demuestra son distintos).
23/03/01
Práctico
Ejercicio 2.35 - Página 49
n = 1425
Objetivo: " Medir el grado de satisfacción de los clientes que compraronuna videograbadora en los últimos 12 meses.

  1. Población: Todos los clientes que compraron una videograbadora en los últimos 12 meses.
  2. Preguntas cualitativas:
  1. ¿Qué le pareció el producto?

- Excelente.

- Muy Bueno.

- Bueno.

- Malo.

  1. Recomendaría el Producto.

- Si.

- No.

  1. Compraría nuestra marca o producto.
  • Si.
  • No.

Preguntas Cuantitativas.

  1. ¿ Cuantas veces usó el servicio técnico?
  • Ninguna.
  • Una.
  • Dos.
  • Más de dos.
  1. Diseño y funcionamiento. Califique de uno a diez
  2. ¿ Cuántas marcas analizó antes de decidir por Xenith?
  3. ¿Cuántos productos Xenith posee Ud.?

Ejercicio 3.8 - Pagina 61

Estadística Descriptiva: Puededefinirse como aquellos métodos que incluyen la recolección, presentación ycaraterización de un conjunto de datos con el fin de describir apropiadamentelas diversas características de ese conjunto.þ nosotros > plazo de financiación.

 

b) Diagrama de Tallo y Hoja SPSS lo hace en forma automática.

Yi= Segundos que tarda un automóvil de llegar de 0 a 60 Mph.

Autos Alemanes

Tallo

Hoja

4

9

5

5

4

1

6

4

9

4

7

0

9

7

9

1

5

8

6

7

3

5

5

8

9

9

 

10

0

9

27/03/01

Construcción de Gráficos

  • Nombrar los ejes.
  • Título del gráfico.
  • Fuente de datos.

Ejercicio 3.70 - Pagina 95

Yi

fi

hi

Fi

Hi

 

 

 

 

 

1,00

1

0,03

1

0,03

1,50

2

0,07

3

0,10

2,00

3

0,10

6

0,20

2,50

2

0,07

8

0,27

3,00

6

0,20

14

0,47

3,50

5

0,17

19

0,63

4,00

2

0,07

21

0,70

4,50

2

0,07

23

0,77

5,00

3

0,10

26

0,87

5,50

1

0,03

27

0,90

6,00

1

0,03

28

0,93

6,50

1

0,03

29

0,97

7,00

1

0,03

30

1,00

 

30

1,00

 

 

Yi = $ de cada manómetro.

fi = cantidad de veces que se repite la variable.

En este caso se supone que la variable es discreta.
Construcción de Intervalos

Intervalos sirve en especial para variables continuas
Ry = Y max - Y min = Recorrido = Amplitud = Rango
Ry = 7.5 - 1 = 6.5

Cantidad de intervalos 4
C= Amplitud del intervalo = Ry / Cantidad de intervalos = 6.5/4 = 1.625
C = Valor entero = 2
Ry* = c x cantidad de intervalos = 2 x 4 = 8

Yi-1 - Yi

Yi

fi

hi

 

 

 

 

1 - 3

2

8

0.27

3 - 5

4

15

0.50

5 - 7

6

6

0.20

7 -9

8

1

0.03

 

 

30

1

Construcción del intervalo del Caso Juárez.
R = 38 - 14 = 24
Cantidad de Intervalos = 7
Amplitud = Ry / c = 3.43 = 4

3. Resumen Capítulo 3 del Libro

Presentación de datos numéricos en tablas y diagramas
Una distribución de frecuencia es una tabla de resumen en la que los datos sedisponen en agrupamientos o categorías convenientemente establecidas de clasesordenadas numéricamente.
En esta forma las características más importantes de los datos se aproximanmuy fácilmente, compensando así el hecho de que cuando los datos se agrupan deese modo, la información inicial referente a las observaciones individuales deque antes se disponía se pierde a través del proceso de agrupamiento ocondensación.

Al construir la tabla de frecuencia-distribución, debe ponerse atención a:

  1. Seleccionar el número apropiado de agrupamientos de clase para la tabla.
  2. Obtener un intervalo o ancho de clase de cada agrupamiento de clase.
  3. Establecer los límites de cada agrupamiento de clase para evitar los traslapes.

Selección del Número de Clases
La distribución de frecuencia debe tener al menos cinco agrupamiento de clase,pero no más de 15. Si no hay suficientes agrupamientos de clase o si haydemasiados, se obtendrá poca información.

Obtención de los intervalos de clase
Ancho del intervalo Rango

número de agrupamientos de clase deseado

La principal ventaja de usar una de estas tablas de resumen es que lasprincipales características de los datos se hacen evidentes inmediatamente parael lector.
La principal desventaja de tal tabla de resumen es que no podemos saber como sedistribuyen los valores individuales dentro de un intervalo de clase particularsin tener acceso a los datos originales. El punto medio de la clase, sinembargo, es el valor usado para representar todos los datos resumidos en unintervalo particular.
El punto medio de una clase (o marca de clase) es el punto a la mitad de los límitesde cada clase y es representativo de los datos de esa clase.

Tabulación de datos numéricos: la distribución de frecuencia relativa ydistribución de porcentaje
La distribución relativa de frecuencia se forma dividiendo las frecuencias decada clase de distribución de frecuencia entre el número total deobservaciones. Entonces puede formarse una distribución de porcentajemultiplicando cada frecuencia relativa o proporción entre 100.
La distribución de frecuencia relativa o la distribución de porcentaje sevuelve esencial siempre que una serie de datos se compara con otra seria dedatos, especialmente si difiere el número de observaciones en cada serie dedatos.

Graficación de datos numéricos: el histograma y el polígono
Histogramas
Los histogramas son diagramas de barras verticales en los que se construyenbarras rectangulares en los límites de cada clase. La variable aleatoria o fenómenode interés se despliega a lo largo del eje horizontal; el eje verticalrepresenta el número, proporción o porcentaje de observaciones por intervalode clase, dependiendo de si el histograma particular, es un histograma defrecuencia, un histograma de frecuencia relativa o histograma de porcentaje

Al comparar dos o más series de datos, ni los diagramas de tallo y hoja nilos histogramas pueden construirse en la misma gráfica. Con respecto a estos últimos,la sobreposición de barras verticales de uno en el otro ocasionaríadificultades de interpretación; en estos casos se usan los polígonos.

Polígonos
El polígono de porcentaje se forma permitiendo que el punto medio de cada claserepresente los datos de esa clase y luego conectando la sucesión de puntosmedios con sus respectivos porcentajes de clase.

Distribuciones acumulativas y polígonos acumulativos
Una tabla de distribución de porcentaje acumulativo se construye registrandoprimero los límites inferiores de cada clase a partir de la distribución deporcentaje y luego insertando un límite extra al final.

Polígono de porcentaje acumulativo
Para construir un polígono de porcentaje acumulativo (también llamado ojiva),el fenómeno se grafica en el eje horizontal, mientras que los porcentajesacumulativos se grafican en el eje vertical.

4. Resumen Capítulo 4 del Libro

Resumen y descripción de los datos numéricos
Propiedades de los datos numéricos.
Las tres mejores propiedades que describe una serie numérica de datos son:

  1. Tendencia central
  2. Variación
  3. Forma

Si estas mediciones se calculan a partir de una muestra, se denominan estadísticas,si se calculan a partir de los datos de una población se denominan parámetros.

Mediciones de tendencia Central

  • La media aritmética, es el promedio. Se calcula sumando todas las observaciones y luego dividiendo el total entre el número de elementos involucrados.

La media actúa como punto de equilibrio de tal forma que las observacionesmenores compensan a las observaciones que son mayores.

La media aritmética se ve afectada en gran medida por valores extremos.

  • La mediana. Es el valor medio de una secuencia ordenada de datos. Si no hay empates, la mitad de las observaciones serán menores y la otra mitad serán mayores. La mediana no se ve afectada por valores extremos. Para calcular la mediana, primero se deben poner los datos en orden. Después usamos la fórmula del punto de posicionamiento.

El cálculo del valor de la media se ve afectado por el número deobservaciones, no por la magnitud de cualquier extremo.

  • La moda. Es el valor de una serie de datos que aparece con más frecuencia. La moda no se ve afectada por la ocurrencia de cualquier valor extremo.
  • Cuartiles. Los cuartiles sonmediciones descriptivas que dividen los datos ordenados en cuatro cuartos.

Mediciones de la Variación
La variación es la cantidad de dispersión o propagación en los datos.

  • El rango: es la diferencia entre la mayor y la menor observación en una serie de datos. El rango mide la propagación total en la serie de datos. La debilidad del rango es que no logra tomar en cuenta la forma en que los datos se distribuyen realmente entre el mayor y el menor valor. Sería impropio usar el rango como una medición cuando uno de o ambos componentes son observaciones extremas.
  • El rango intercuartil: es la diferencia entre el tercer y primer cuartil. No se ve influida por valores extremos.
  • La varianza y la desviación estándar: a diferencia de las mediciones anteriores la varianza y la desviación estándar toman en cuenta como se distribuyen las observaciones. La Varianza de muestra es el promedio de las diferencias cuadradas entre cada una de las observaciones de una serie de datos y la media. La desviación estándar es simplemente la raíz cuadrada de la varianza. La varianza y la desviación miden la dispersión promedio alrededor de la media, es decir, como las observaciones mayores fluctúan por encima de ésta y como las observaciones menores se distribuyen por debajo de ésta.
  • El Coeficiente de Variación: es una medida relativa de variación. Se expresa como porcentaje antes que en términos de las unidades de los datos particulares. Mide la dispersión en los datos relativa a la media.

El coeficiente de variación es útil al comparar la variabilidad de dos o másseries de datos que se expresan en distintas unidades de medición.

Forma
Para describir la forma sólo necesitamos comparar la media y la mediana. Siestas dos mediciones son iguales, por lo general podemos considerar que losdatos son simétricos. Si la media excede a la mediana, los datos puedendescribirse de sesgo positivo o sesgadas a la derecha. Si la media es excedidapor la mediana, estos datos pueden llamarse de sesgo negativo o sesgadas a laizquierda. El sesgo positivo surge cuando la media se incrementa en algunosvalores inusualmente altos, el sesgo negativo ocurre cuando la media se reduceen algunos valores extremadamente bajos.

Cálculo de mediciones descriptivas de resumen de una población
Las mediciones de tendencia central para una población se calculan igual que enla muestra simplemente reemplazamos n por N.
El rango y el rango intercuartil para una población de tamaño N se obtienencomo si fuera una muestra reemplazando n por N. La varianza se calculareemplazando el ( n - 1 ) del denominador por N.

Uso de la Desviación Estándar: La regla Empírica
En series de datos simétricos, donde la mediana y la media son iguales, lasobservaciones tienden a distribuirse igualmente alrededor de estas mediciones detendencia central. Cuando el sesgado extremo no se presenta y tal agrupamientose observa en una serie de datos, podemos usar la denominada regla empíricapara examinar la propiedad de variabilidad de datos y obtener una mejor idea delo que la desviación estándar está midiendo.

La regla empírica establece que en la mayoría de las series de datosencontraremos que aproximadamente dos de cada tres observaciones (es decir, el67%), están contenidas en una distancia de una desviación estándar alrededorde la media y aproximadamente 90% a 95% de las observaciones están contenidas auna distancia de 2 desviaciones estándar alrededor de la media.

Uso de la desviación estándar: La regla de Bienaymé Chebyshev

No importa como se distribuyen los datos. el porcentaje de las distribucionesestán contenidas dentro de las dsitancias de k desviaciones estándar alrededorde la media debe ser al menos

1 - 1 / k2

Al menos 75% de las observaciones deben estar contenidas dentro de distanciasde +/-2 desviaciones estándar alrededor de la media. Al menos 88,89% de lasobservaciones deben estar contenidas dentro de una distancia de +/-3desviaciones estándar alrededor de la media. Al menos 93.75% de lasobservaciones deben estar contenidas dentro de distancias de +/-4 desviacionesestándar alrededor de la media.

5. Resumen Capítulo 5 del Libro

Presentación de datos categóricos en tablas y diagramas

Graficación de datos categóricos: de barras, de pastel y de punto

  • Gráfica de barras

En la gráfica de barras, cada categoría se describe mediante una barra,cuya longitud representa la frecuencia o porcentaje de observaciones que caen enuna categoría. Para construir una gráfica de barras se hacen las siguientessugerencias:

  1. Las barras deben construirse horizontalmente.
  2. Todas las barras deben tener el mismo ancho.
  3. Los espacios entre las barras deben variar entre la mitad
  4. del ancho de una barra hasta el ancho de una barra.
  5. Las escalas y guías son auxiliares útiles en la lectura
  6. de una gráfica y deben incluirse. El punto cero u origen debe indicarse.
  7. Los ejes deben etiquetarse.
  • Gráfica de Pastel
  • Gráfica de Puntos

Graficación de datos categóricos: el Diagrama de Pareto.
El diagrama de Pareto es un tipo especial de gráfica de barras verticales en laque las respuestas categórizadas se grafican en el orden de rango descendientede sus frecuencias y se combinan con un polígono acumulativo en la mismaescala. El principio básico detrás de este dispositivo gráfico es sucapacidad de distinguir los "pocos vitales" de los "muchostriviales".

Tabulación de datos categóricos: Tabla de contingencias y supertablas.
Las tablas de contingencia se usan para examinar las respuestas a dos variablescategóricas simultáneamente.
Supertablas. Una supertabla es esencialmente una colección de tablas decontingencia, cada una con las mismas variables y categorías de columna. Sinembargo, se incluyen tantas variables de fila como se deseen para comparacionesfrente a la variable de columna.

Tipos de Gráficos
Medidas Estadísticas.
Medidas Estadísticas descriptivas.

  • Variables Numéricas:
  • Medidas de posición.
  • Media.
  • Mediana.
  • Moda.
  • Cuartiles.
  • Medidas de Variación.
  • Rango.
  • Rango Medio.
  • Varianza.
  • Desvío Estándar.
  • Coeficiente de variación.

6. Capitulo 6 del libro

Probabilidad Básica
La probabilidad es la posibilidad u oportunidad de que suceda un eventoparticular. La probabilidad involucrada es una porción o fracción cuyo valorvaría entre cero y uno exclusivamente. Observamos un evento que no tieneposibilidad de ocurrir (es decir, el evento nulo), tiene una probabilidad decero, mientras que un evento que seguramente ocurrirá (es decir, el eventocierto), tiene una probabilidad de uno. Ejemplo:

  1. La posibilidad de sacar una carta con figura negra de una baraja.
  2. La posibilidad de que un individuo seleccionado aleatoriamente de una encuesta este de acuerdo con X tema.
  3. La posibilidad que tenga éxito un nuevo producto en el mercado.

Cada uno de los ejemplos anteriores se refiere a uno de los tresplanteamientos del tema de la probabilidad. El primero a menudo se denominacomel planteamiento de la probabilidad clásica a priori. Aquí la probabilidad deéxito se basa en el conocimiento nterior del proceso involucrado. En el caso mássimple, cuando cada resultado es igualmente posible. Esta posibilidad puededefinirse de la siguiente manera:
En el segundo ejemplo; llamado probabilidad clásica empírica, aunque laprobabilidad se sigue definiendo como la proporción entre el número deresultados favorables y el número total de resultados, estos resultados sebasan en datos observados, no en el conocimiento anterior a un proceso.

El tercer planteamiento de probabilidad se denomina el enfoque deprobabilidad subjetiva. Mientras que en los dos anteriores enfoques laprobabilidad de un evento favorable se calculaba objetivamente, ya fuera de unconocimiento previo o de datos reales, la probabilidad subjetiva se refiere a laposibilidad de ocurrencia asignada a un evento por un individuo particular. Laprobabilidad subjetiva es especialmetne útil para la toma de decisiones enaquellas situaciones en que la probabilidad de diversos eventos no puededeterminarse empíricamente.

Conceptos de probabilidad básica
Espacios de muestra y eventos
Los elementos básicos de la teoría de probabilidades son los resultados delproceso o fenómeno bajo estudio. Cada tipo posible de ocurrencia se denomina unevento.

Un evento simple puede puede describirse mediante una característicasencilla. la compilación de todos los eventos posibles se llama el espaciomuestral.
La manera en que se subdivide el espacioi muestral depende de los tipos deprobabilidades que se han de determinar. Tomando esto en cuenta, resulta deinterés definir tanto el complemento de un evento como un evento conjunto de lasiguiente manera:
La complemento del evento A incluye todos los elementos que no son parte delevento A. Esta dado por el símbolo A´.
Un evento conjunto es un evento que tiene dos o más características.

Tablas de Contingencias y diagramas de Venn

Existen varias formas en las que puede verse un espacio muestral particular.El primer método implica asignar los eventos apropiados a una tabla declasificaciones cruzadas. Tal tabla también se denomina tabla de contingencia.

 

Roja

Negro

Totales

As

2

2

4

No As

24

24

48

Totales

26

26

52

La segunda forma de presentar el espacio muestral es usando un diagrama deVenn. Este diagrama se representa gráficamente los diversos eventos como"uniones" e "intersecciones" de círculos.

El área contenida dentro del círculo A y de círculo B (área central) esla intersección de de Ay B (y se escribe A

Probabilidad ( marginal ) simple

La regla mas evidente para las probabilidades es que deben variar en valor de0 a 1. Un evento imposible tiene una probabilidad cero de ocurrir, y un eventocierto tiene una probabilidad uno de ocurrir. La probabilidad simple se refierea la probabilidad de ocurrencia de un evento simple.

Ejemplo:

  • la probabilidad de seleccionar una carta negra;
  • la probabilidad de seleccionar un As

La probabilidad simple se denomina probabilidad marginal puesto que el númerototal de éxitos puede obtenerse del márgen apropiado de la table decontingencias.

Probabilidad Conjunta

La probabilidad conjunta se refiere a fenómenos que contienen dos o maseventos, como la probabilidad de un as negro, una reina roja o un empleado queeste satisfecho con el trabajo y haya progresado dentro de la organización.

P (A)= P ( A y B1 ) + P ( A y B2 ) + .....+ P ( A y Bk )

donde B1, B2, ... Bk son eventos mutuamente excluyentes y colectivamenteexhaustivos.

Dos eventos son mutuamente excluyentes si ambos eventos no pueden ocurrir almismo tiempo.

Dos eventos son colectivamente exhaustivos si uno de los eventos debeocurrir.

Por ejemplo, ser hombre y ser mujer son eventos mutuamente excluyentes ycolectivamente exhaustivos. Nadie es ambos ( son mutuamente excluyentes ) ytodos son uno u otro ( son colectivamente exhaustivos ).

Regla de la adición

La regla de la adición se usa para encontrar la probabilidad del evento A oB. Esta regla para obtener la probabilidad de la unión de A y B considera laocurrencia del evento A o del evento B o de ambos, A y B.

El cálculo de P ( A

P ( A

Eventos mutuamente excluyentes

En ciertas circunstancias, sin embargo, la probabilidad conjunta no necesitarestarse porque es igual a cero. Tales circunstancias cuando no existenresultados para un evento particular. Por ejemplo, suponga que deseamos saber laprobabilidad de escoger un corazon o una espada si estuviéramos seleccionando sólouna carta de una baraja estándar de 52 cartas de juego. Usando la regla de laadición, tenemos lo siguiente:

P ( corazón o espada ) = P ( corazón ) + P ( espada ) – P ( corazón yespada )

P = 13/52 + 13/52 – 0/52 = 26/52

La intersección en este caso no existe ( llamado el conjunto nulo ) porqueno contiene resultados, puesto que una carta no puede ser corazón y espadasimultáneamente.

Siempre que la probabilidad conjunta no contenga ningún resultado, loseventos involucrados se consideran mutuamente excluyentes. Asi la regla generalpara eventos mutuamente excluyentes se reduce a:

P ( A o B ) = P ( A ) + P ( B )

Eventos colectivamente exhaustivos

Consideremos la probabilidad de seleccionar una carta negra o rojo. Puestoque son mutuamente excluyentes al usar la ecuación: 26/52 + 26/52 = 1

La probabilidad de rojo o negro suma uno. Dado que uno de los eventos debeocurrir se consideran mutuamente excluyentes.

Probabilidad Condicional.

Cuando estamos calculando la probabilidad de un evento particular A, dadainformación sobre la ocurrencia de otro evento B, esta probabilidad se denominaprobabilidad condicional, P ( A \ B ). La probabilidad condicional P ( A \ B )puede definirse de la siguiente manera:

P ( A \ B ) = P ( A y B )

P ( B )

  • Independencia estadística Se dice que dos eventos independientes si el conocimiento previo de la probabilidad de ocurrencia de uno de ellos no afecta la probabilidad del otro. Puede definirse de la siguiente manera:

P ( A \ B ) = P ( A )

Regla de multiplicación

La fórmula para la probabilidad condicional puede manipularsealgebraicamente de forma tal que la probabilidad conjunta P ( A y B ) puededeterminarse a partir de la probabilidad condicional de un evento.

La regla de multiplicación para eventos independientes puede expresarse dela siguiente manera sustituyendo P ( A ) por P ( A \ B ):

P ( A y B ) = P ( A ) * P ( B )

Si esta regla se cumple para dos eventos, A y B entonces A y B son estadísticamenteindependientes. Por tanto, hay dos formas de determinar la independencia estadística:.

  1. Los eventos A y B son estadísiticamente independientes si y sólo si P ( A \ B )=P (A)
  2. Los eventos A y B son estadísticamente independientes si y sólo si P ( A y B ) = P ( A ) * P ( B ).

Teorema de Bayes
La probabilidad condicional toma en cuenta información respecto a la ocurrenciade un evento para encontrar la probabilidad de otro evento. Este concepto puedeampliarse para revisar probabilidaddes basadas en nueva información y, asídeterminar la probabilidad que un efecto particular se deba a una causa específica.El procedimiento para revisar estas probabilidades se conoce como teorema deBayes.

El teorema de Bayes puede definirse a partir de las definiciones deprobabilidad condicional y probabilidad marginal, asi el teorema de Bayes es:

P ( Bi \ A ) = P ( A \ Bi ) P ( Bi )

P ( A \ B1 ) P ( B1 ) + P ( A \ B2 ) P ( B2 )

7. Capítulo 7 del libro

Algunas distribuciones importantes de probabilidad discreta

Una distribución de probabilidad para una variable aleatoria discreta es unlistado mutuamente excluyente de todos los resultadosposibles para esa variablealeatoria, tal que una probabilidad particular de ocurrencia esté asociada concada resultado.

Esperanza Matemática
La media de una distribución de probabilidad es el valor esperado de suvariable aleatoria.
El valor esperado de una variable aleatoria discreta puede considerarse como supromedio pesadoo sobre todos los resultados posibles, siendo los pesos laprobabilidad asociada con cada uno de los resultados.

Esta medición de resumen puede puede obtenerse multiplicando cada resultadoposible Xi, por su probabilidad correspondiente P (Xi) y luego sumando losproductos resultantes. Por tanto, el valor esperado de la variable aleatoriadiscreta X, simbolizado como E (X), puede expresarse de la siguiente manera:
E(X)= ∑ Xi * P ( Xi)

Varianza y desviación estándar de una variable aleatoria discreta
La varianza de una variable aleatoria discreta puede definirse como el promediopesado de las diferencias cuadradas entre cada resultado posible y su media,siendo los pesos las probabilidades de cada uno de los resultados respectivos.

Esta medición de resumen puede obtenerse multiplicando cada diferenciacuadrada posible ( Xi – μ )2 por su probabilidad correspondiente P (Xi) yluego sumando los productos restantes. Por lo tanto la varianza de la variablealeatoria discreta X puede expresarse de la siguiente manera:

( Xi – μ )2 * P (Xi)

Funciones de distribución de probabilidad discreta
La distribución de probabilidad para una variable aleatoria discreta puede ser:

  1. Un listado teórico de resultados y probabilidades que pueden obtenerse de un modelo matemático que represente algún fenómeno de interés.
  2. Un listado empírico de resultados y sus frecuencias relativas observadas.
  3. Un listado subjetivo de resultados asociados con sus probabilidades subjetivas que representan el grado de convicción del tomador de decisiones respecto a la probabilidad de los resultados posibles.

Un modelo se considera una representación en miniatura de algún fenómenosubyacente. En particular, un modelo matemático es una expresión matemáticaque representa cierto fenómeno subyacente. Para variables aleatorias discretas,esta expresión matemática se conoce como función de distribución deprobabilidad.

La característica escencial de la distribución uniforme es que esigualmente posible que ocurran todos los resultados de la variable aleatoria.

Distribución Binomial

La distribución binomial es una distribución de probabilidad discreta quees extremadamente útil para describir muchos fenómenos.

La distribución binomial posee cuatro propiedades esenciales:

  1. Las observaciones posibles pueden obtenerse mediante dos métodos de muestreo distintos. Cada observación puede considerarse como seleccionada de una población infinita sin reemplazo o de una población finita con reemplazo.
  2. Cada observación puede clasificarse en dos categorías mutuamente excluyentes y colectivamente exhaustivas, usualmente denominadas éxito y fracaso.
  3. La probabilidad de que una observación se clasifique como éxito, p, es constante de observación a observación.
  4. El resultado de cualquier observación es independiente del resultado de cualquier observación.

Modelo matemático

ÇB) , puesto que esta área es parte de A y tambien parte de B. El área total delos dos círculos es la unión de A y B (y se escribe A ÈB ) y contiene todos los resultados que son parte del evento A, parte del eventoB o parte de ambos A y B. El área fuera del diagrama fuera de A ÈB contiene aquelloos resultados que no sonparte de A ni son parte de B.ÈB ), la probabilidad del evento A o B, puede expresarse en la siguiente regla dela adición general:ÈB ) = P ( A o B ) = P ( A ) + P ( B ) – P ( A y B )

P( X= x \ n, p ) = n ! px ( 1 – p ) n-x

X ! ( n –