Resumen: Distribución Normal. Función de densidad. La distribución binomial. Esta distribución es frecuentemente utilizada en las aplicaciones estadísticas. Su propio nombre indica su extendida utilización, justificada por las frecuencia o normalidad con la que las ciertos fenómenos tienden a parecerse en su comportamiento a esta distribución. Muchas variables aleatorias continuas presentan una función de densidad cuya gráfica tiene forma de campana. En otras ocasiones, al considerar distribuciones binomiales, tipo B(n,p), para un mismo valor de p y de valores de n cada vez mayores, se ve que sus polígonos de frecuencias se aproximan a una forma en forma de campana.
Publicación enviada por Angel Moreno
Índice
Índice
1. Introducción
2. Distribución Normal
3. Función De Densidad
4. La Distribución Binomial
1. Introducción
Esta
distribución es frecuentemente utilizada en las aplicaciones estadísticas.
Su propio nombre indica su extendida utilización, justificada por las
frecuencia o normalidad con la que las ciertos fenómenos tienden a parecerse en
su comportamiento a esta distribución.
Muchas variables aleatorias continuas presentan una función de densidad cuya gráfica
tiene forma de campana.
En otras ocasiones, al considerar distribuciones binomiales, tipo B(n,p), para
un mismo valor de p y de valores de n cada vez mayores, se ve que sus polígonos
de frecuencias se aproximan a una forma en forma de campana.
En resumen, la importancia de la distribución normal se debe principalmente a
que hay muchas variables asociadas a fenómenos naturales que siguen el modelo
de la normal.
- Caracteres morfológicos de individuos (personas, animales, plantas,…) de
una especie.
Por ejemplo: tallas, pesos, envergaduras, diámetros, perímetros,…
- Caracteres fisiológicos, por ejemplo: efecto de una misma dosis de un fármaco,
o de una misma cantidad de abono.
- Caracteres sociológicos, por ejemplo: consciente intelectual, grado de
adaptación a un medio.
- Errores cometidos al medir ciertas magnitudes.
- Valores estadísticos maestrales, por ejemplo: la media.
- Otras distribuciones como la binomial o la Poisson son aproximaciones
normales.
Y en general cualquier característica que se obtenga como suma de mucho
factores.
2. Distribución Normal
Esta
distribución es frecuentemente utilizada en las aplicaciones estadísticas. Su
propio nombre indica su extendida utilización, justificada por la frecuencia o
normalidad con la que ciertos fenómenos tienden a parecerse en su
comportamiento a esta distribución.
Muchas variables aleatorias continuas presentan una función de densidad cuya gráfica
tiene forma de campana.
En otras ocasiones, al considerar distribuciones binomiales, tipo B(n,p), para
un mismo valor de p y valores de n cada vez mayores, se ve que sus polígonos de
frecuencias se aproximan a una curva en "forma de campana".
En resumen, la importancia de la distribución normal se debe principalmente a
que hay muchas variables asociadas a fenómenos naturales que siguen el modelo
de la normal.
- Caracteres
morfológicos de individuos (personas, animales, plantas,…) de una
especie, p. ejm. Tallas, pesos, envergaduras, diámetros, perímetros…
- Caracteres
fisiológicos, por ejemplo; efecto de una misma dosis de un fármaco, o de
una misma cantidad de abono.
- Caracteres
sociológicos, por ejemplo: consumo de cierto producto por un mismo grupo de
individuos, puntuaciones de examen.
- Caracteres
psicológicos, por ejemplo: cociente intelectual, grado de adaptación a un
medio……
- Errores
cometidos al medir ciertas magnitudes.
- Valores
estadísticos maestrales, por ejemplo: la media.
- Otras
distribuciones como la binomial o la de Poisson son aproximaciones
normales…
Y
en general cualquier característica que se obtenga como suma de muchos
factores.
3. Función De Densidad
Empleando
cálculos bastante laboriosos, puede demostrarse que el modelo de la función de
densidad que corresponde a tales distribuciones viene dando por la fórmula
Función
De Una Distribución
- Puede
tomar cualquier valor (- ∞ ,+ ∞ )
- Son
más probables los valores cercanos a uno central que llamados media
- Conforme
nos separamos de ese valor µ , la probabilidad va decreciendo de igual
forma a derecha e izquierda (es simétrica).
- Conforma
nos separamos de ese valor µ , la probabilidad va decreciendo de forma más
o menos rápida dependiendo de un parámetro
s
, que es la desviación típica.
4. La Distribución Binomial
Funciones
de probabilidad:
Llamamos función d probabilidad f a la aplicación de E(X) (Espacio Muestral)
en el intervalo [0,1] QUE VERIFICA:
f(A)= p (A)
Básicamente se trata de estudiar la probabilidad como una función utilizando
para su estudio todas las propiedades de las funciones.
La
Distribucion Binomial:
Llamamos experiencia aleatoria dicotómica a aquella que solo puede tener dos
posibles resultados A y A'. Usualmente A recibe el nombre de éxito, además
representaremos como p= p(A) y q=1-p=p(A’).
A la función de probabilidad de una variable aleatoria X resultado de contar el
número de éxitos al repetir n veces una experiencia aleatoria dicotómica con
probabilidad de éxito p la llamamos distribución binomial y la representamos
por B (n, p)
Para esta distribución se verifica que, la variable X puede tomar los valores:
0,1,2,…, n
y que la variable toma cada uno de estos valores con probabilidad:
p( X = r ) = (nr) pr (1 – p) n-r
Parámetros
de una distribución binomial:
Esperanza: n · p
Desviación típica (n · p · q )0.5 ( raíz cuadrada)
Ajuste de una serie de datos a una distribución binomial:
Disponemos de una serie de k datos que toman los valores 0,1, … ,n.
Para saber si estos datos siguen pueden aproximarse por una distribución
binomial:
Calculamos la media de los k datos y la igualamos a la Esperanza teórica de la
Binomial (n · p).
Despejamos de aquí el valor de p.
Calculamos los valores teóricos de p(X = r), multiplicándolos por k para
obtener los valores teóricos de cada posible valor de la variable aleatoria en
series de k datos.
Si la diferencia es " suficientemente pequeña " aceptamos como buena
la aproximación Binomial, si no, la rechazamos.
(nota: la fundamentación estadística que nos permitiría decidir de manera
objetiva si la diferencia entre los datos teóricos y los reales es
"suficientemente pequeña" escapa de los objetivos de esta unidad didáctica,
con lo cual la decisión se deberá tomar de manera subjetiva)
Muestreo
En estadística, es el proceso por el cual se seleccionan los individuos que
formarán una muestra.
Para que se puedan obtener conclusiones fiables para la población a partir de
la muestra, es importante tanto su tamaño como
el modo en que han sido seleccionados los individuos que la componen.
El tamaño de la muestra depende de la precisión que se quiera conseguir en la
estimación que se realice a partir de ella. Para su determinación se requieren
técnicas estadísticas superiores, pero resulta sorprendente cómo, con
muestras notablemente pequeñas, se pueden conseguir resultados suficientemente
precisos. Por ejemplo, con muestras de unos pocos miles de personas se pueden
estimar con muchísima precisión los resultados de unas votaciones en las que
participarán decenas de millones de votantes.
Para seleccionar los individuos de la muestra es fundamental proceder
aleatoriamente, es decir, decidir al azar qué individuos de entre toda la
población forma parte de la muestra.
Si se procede como si de un sorteo se tratara, eligiendo directamente de la
población sin ningún otro condicionante, el muestreo se llama aleatorio simple
o irrestrictamente aleatorio.
Cuando la población se puede subdividir en clases (estratos) con características
especiales, se puede mostrar de modo que el número de individuos de cada
estrato en la muestra mantenga la proporción que existía en la población. Una
vez fijado el número que corresponde a cada estrato, los individuos se designan
aleatoriamente. Este tipo de muestreo se denomina aleatorio estratificado con
asignación proporcional.
Las inferencias realizadas mediante muestras seleccionadas aleatoriamente están
sujetas a errores, llamados errores de muestreo, que están controlados. Si la
muestra está mal elegida - no es significativa - se producen errores sistemáticos
no controlados.
Métodos
De Muestreo
Existen dos métodos de muestreo:
El muestreo probabilístico y no probabilístico
Métodos de muestreo probabilístico
Los métodos de muestreo probabilísticas son aquéllos que se basan en el
principio de equiprobabilidad. Es decir, aquellos en los que todos los
individuos tienen la misma probabilidad de ser elegidos para formar parte de una
muestra y, consiguientemente, todas las posibles muestras de tamaño n tienen la
misma probabilidad de ser elegidas. Sólo estos métodos de muestreo probabilísticas
nos aseguran la representatividad de la muestra extraída y son, por tanto, los
más recomendables. Dentro de los métodos de muestreo probabilísticas
encontramos los siguientes tipos:
Muestreo
aleatorio simple
El procedimiento es el siguiente: 1) se asigna un número a cada individuo de la
población y 2) a través de algún medio mecánico (bolas dentro de una bolsa,
tablas de números aleatorios, números aleatorios generados con una calculadora
u ordenador, etc.) se eligen tantos sujetos como sea necesario para completar el
tamaño de muestra requerido.
Este procedimiento, atractivo por su simpleza, tiene poca o nula utilidad práctica
cuando la población que estamos manejando es muy grande.
Muestreo
aleatorio sistemático
Este procedimiento exige, como el anterior, numerar todos los elementos de la
población, pero en lugar de extraer n números aleatorios solo se extrae uno.
Se parte de ese número aleatorio i, que es un número elegido al azar, y los
elementos que integran la muestras son los que ocupan los lugares
i,i+k,i+2k,i+3k,…,i+(n-1)k, es decir se toman los individuos de k en k, siendo
k el resultado de dividir el tamaño de la población entre el tamaño de la
muestra: k=N/n. el número i que empleamos como punto de partida será un número
al azar entre 1 y k.
El riesgo de este tipo de muestreo está en los casos en que se dan periodicidad
constante (k) podemos introducir una homogeneidad que no se da en la población.
Imaginemos que estamos seleccionando una muestra sobre listas de 10 individuos
en los que los 5 primeros son varones y los últimos 5 son mujeres, si empleamos
un muestreo aleatorio sistemático con k=10 siempre seleccionaríamos o sólo
hombres o sólo mujeres, no podría haber una representación de los dos sexos.
Muestreo
aleatorio estratificado.
Trata de obviar las dificultades que presentan los anteriores ya que simplifican
los procesos y suelen reducir el error muestral para un tamaño dado de la
muestra. Consiste en considerar categorías típicas diferentes entre sí
(estratos) que poseen gran homogeneidad respecto a alguna característica (se
puede estratificar, por ejemplo, según la profesión, el municipio de
residencia, el sexo, el estado civil, etc.). Lo que se pretende con este tipo de
muestreo es asegurarse de que todos los estratos de interés estarán
representados adecuadamente en la muestra. Cada estrato funciona
independientemente, pudiendo aplicarse dentro de ellos el muestreo aleatorio
simple o el estratificado para elegir los elementos concretos que formarán
parte de la muestra. En ocasiones las dificultades que plantean son demasiado
grandes, pues exige un conocimiento detallado de la población. (tamaño geográfico,
sexos, edades…).
La distribución de la muestra en función de los diferentes estratos se
denomina afijación, y puede ser de diferentes tipos:
Afijación
simple
A cada estrato le corresponde igual número de elementos maestrales.
Afijación
proporcional
La distribución se hace de acuerdo con el peso (tamaño) de la población en
cada estrato.
Afijación
Optima
Se tiene en cuenta la previsible dispersión de los resultados, de modo que se
considera la proporción y la desviación típica. Tiene poca aplicación ya que
no suele conocer la desviación.
Muestreo
aleatorio por conglomerados
Los métodos presentados hasta ahora están pensados para seleccionar
directamente los elementos de la población, es decir, que las unidades
maestrales son los elementos de la población. En el muestreo por conglomerados
la unidad muestral es un grupo de elementos de la población que forman una
unidad, a la que llamamos conglomerado. Las unidades hospitalarias, los
departamentos universitarios, una caja de determinado producto, etc., son
conglomerados naturales como, por ejemplo, las urnas electorales. Cuando los
conglomerados son áreas geográficas suele hablarse de "muestreo por áreas".
El muestreo por conglomerados consiste en seleccionar aleatoriamente un cierto número
de conglomerados (el necesario para alcanzar el tamaño muestral establecido) y
en investigar después todos los elementos pertenecientes a los conglomerados
elegidos.
Para finalizar con esta exposición de los métodos de muestreo probabilístico
es necesario comentar que ante lo compleja que puede llegar a ser la situación
real de muestreo con la que nos enfrentemos es muy común emplear lo que se
denomina muestreo polietápico. Este tipo de muestreo se caracteriza por operar
en sucesivas etapas, empleando en cada una de ellas el método de muestreo
probabilístico más adecuado.
Métodos
de muestreo no probabilísticos
A veces, para estudios exploratorios, el muestreo probabilístico resulta
excesivamente costoso y se acude a métodos no probabilísticos, aún siendo
conscientes de que no sirven para realizar generalizaciones, pues no se tiene
certeza de que la muestra extraída sea representativa, ya que no todos los
sujetos de la población tienen la misma probabilidad de ser elegidos. En
general se seleccionan a los sujetos siguiendo determinados criterios procurando
que la muestra sea representativa.
Muestreo
por cuotas.
También denominado en ocasiones "accidental". Se asienta generalmente
sobre la base de un buen conocimiento de los estratos de la población y/o de
los individuos más "representativos" o "adecuados" para los
fines de la investigación. Mantiene, por tanto, semejanzas con el muestreo
aleatorio estratificado, pero no tiene el carácter de aleatoriedad de aquél.
En este tipo de muestreo se fijan unas "cuotas" que consisten en un número
de individuos que reúnen unas determinadas condiciones, por ejemplo: 20
individuos de 25 a 40 años, de sexo femenino y residentes en Gijón. Una vez
terminada la cuota se eligen los primeros que se encuentren que cumplan esas
características. Este método se utiliza mucho en las encuestas de opinión.
Muestreo
opinático o intencional
Este tipo de muestreo se caracteriza por un esfuerzo deliberado de obtener
muestras "representativas" mediante la inclusión en la muestra de
grupos supuestamente típicos. Es muy frecuente su utilización en sondeos
preelectorales de zonas que en anteriores votaciones han marcado tendencias en
voto.
Muestreo
casual o incidental
Se trata de un proceso en el que el investigador selecciona directa e
intencionalmente los individuos de la población. El caso más frecuente de este
procedimiento el utilizar como muestra los individuos a los que se tiene fácil
acceso (los profesores de universidad emplean con mucha frecuencia a sus propios
alumnos). Un caso particular es el de los voluntarios.
Bola
de nieve
Se localiza a algunos individuos, los cuales conducen a otros, y estos a otros,
y así hasta conseguir una muestra suficiente. Este tipo se emplea muy
frecuentemente cuando se hacen estudios con poblaciones "marginales",
delincuentes, sectas, determinados tipos de enfermos, etc.
Error
Muestral
De estimación o estándar. Es la diferencia entre un estadístico y su parámetro
correspondiente. Es una medida de al variabilidad de las estimaciones de
muestras repetidas en torno al valor de la población, nos da una noción clara
de hasta donde y con qué probabilidad una estimación basada en una muestra se
aleja del valor que se hubiera obtenido por medio de un censo completo. Siempre
se comete un error, pero la naturaleza de la investigación nos indicará hasta
qué medida podemos cometerlo (los resultados se someten a error muestral e
intervalos de confianza que varían muestra a muestra). Varía según se calcule
al principio o al final. Un estadístico será más preciso en cuanto y tanto su
error es más pequeño. Podríamos decir que es la desviación de la distribución
muestral de un estadístico y su fiabilidad.
Autor:
Angel Moreno
net_ang@hotmail.com
Compartir
