|
|
Monografias | Principales leyes de distribución de variables aleatoriasPrincipales leyes de distribución de variables aleatoriasResumen: Definimos todos los conceptos relativos a variables aleatorias, describimos las principales leyes de probabilidad que encontramos en las aplicaciones del cálculo de probabilidades. Atendiendo a la clasificación de las v.a. en discretas y continuas describiremos las principales leyes de probabilidad de cada una de ellas, las cuales constituirán el soporte subyacente de la inferencia estadística y a las que será necesario hacer referencia en el estudio de dicho bloque. Iniciamos este capítulo con el estudio de las distribuciones para v.a. discretas. indice 6.2 Introducción Como complemento al capítulo anterior en el que
definimos todos los conceptos relativos a variables aleatorias, describimos en
éste las principales leyes de probabilidad que encontramos en las aplicaciones
del cálculo de probabilidades. Atendiendo a la clasificación de las v.a. en
discretas y continuas describiremos las principales leyes de probabilidad de
cada una de ellas, las cuales constituirán el soporte subyacente de la
inferencia estadística y a las que será necesario hacer referencia en el
estudio de dicho bloque. Iniciamos este capítulo con el estudio de las
distribuciones para v.a. discretas. Consiste en realizar un experimento aleatorio una
sóla vez y observar si cierto suceso ocurre o no, siendo p la
probabilidad de que esto sea así (éxito) y q=1-p el que
no lo sea (fracaso). En realidad no se trata más que de una variable dicotómica,
es decir que únicamente puede tomar dos modalidades, es por ello que el hecho
de llamar éxito o fracaso a los posibles resultados de las pruebas obedece más
una tradición literaria o histórica, en el estudio de las v.a., que a la
situación real que pueda derivarse del resultado. Podríamos por tanto definir
este experimento mediante una v.a. discreta Xque toma los valores X=0
si el suceso no ocurre, y X=1 en caso contrario, y que se denota
Un ejemplo típico de este tipo de variables
aleatorias consiste en lanzar una moneda al aire y considerar la v.a.
Para una v.a. de Bernouilli, tenemos que su función
de probabilidad es:
y su función de distribución:
Su función característica es:
Los principales momentos de la X los
podemos calcular directamente
o bien usando la función característica y la
proposición de la página Se dice que una v.a. X sigue una ley
binomial de parámetros n y p,
Por tanto, su función de distribución es
El modo más simple de calcular la función
característica nos lo da el teorema de la página Los principales momentos de X los
calculamos más fácilmente a partir de
Solución:
Los datos de que disponemos son:
donde E, T+, y T-
tienen el sentido que es obvio. Si queremos saber a cuantas personas el test le
dará un resultado positivo, tendremos que calcular
Sea X1 la v.a. que contabiliza
el número de resultados positivos. Es claro que llamando
Por ello la probabilidad de que a cuatro personas
le de el resultado del test positivo es:
Si queremos calcular a cuantas personas les dará
el test un resultado positivo aunque en realidad estén sanas, hemos de calcular
previamente
Es importante observar este resultado. Antes de
hacer los cálculos no era previsible que si a una persona el test le da
positivo, en realidad tiene una probabilidad aproximadamente del y
Por último vamos a calcular la probabilidad p3
de que el test de un resultado erróneo, que es:
La variable aleatoria que contabiliza el número
de resultados erróneos del test es
Como la probabilidad de que el test sea correcto
para más de siete personas, es la de que sea incorrecto para menos de 3, se
tiene
Consideramos una sucesión de v.a. independientes
de Bernouilli,
Una v.a. X sigue posee una distribución
geométrica,
De este modo tenemos que la ley de probabilidad
de X es
La función característica se calcula teniendo
en cuenta que de nuevo aparece la sumación de los términos de una progresión
geométrica, pero esta vez de razón eit q:
La media y varianza de esta variable aleatoria
son:
Solución: Este es un ejemplo de variable
geométrica. Vamos a suponer que la probabilidad de tener un hijo varón es la
misma que la de tener una hija hembra. Sea X la v.a.
Es claro que
Sabemos que el número esperado de hijos varones
es
La probabilidad de que la pareja acabe teniendo
tres o más hijos, es la de que tenga 2 o más hijos varones (la niña está del
tercer lugar en adelante), es decir,
Hemos preferido calcular la probabilidad pedida
mediante el suceso complementario, ya que sería más complicado hacerlo
mediante la suma infinita
Sobre una sucesión de v.a. de Bernouilli
independientes,
se define la v.a. X como el número de
fracasos obtenidos hasta la aparición de r éxitos en la
sucesión
=1mm Es decir,
De nuevo, el conjunto de posibles valores de esta
v.a. discreta es
Su función característica es
y sus momentos más importantes los obtenemos
derivando esta última:
Solución: Este es un ejemplo claro de
experimento aleatorio regido por una ley binomial negativa, ya que se realizan
intervenciones hasta que se obtengan 4 lóbulos sanos, y éste es el criterio
que se utiliza para detener el proceso. Identificando los parámetros se tiene:
Lo que nos interesa es medir el número de
intervenciones, Y, más que el número de éxitos hasta el r-ésimo
fracaso. La relación entre ambas v.a. es muy simple:
Por claridad, consideremos el siguiente ejemplo:
Tenemos una baraja de cartas españolas (N=40 naipes), de las
cuales nos vamos a interesar en el palo de oros (D=10 naipes de
un mismo tipo). Supongamos que de esa baraja extraemos n=8 cartas de una
vez (sin reemplazamiento) y se nos plantea el problema de calcular la
probabilidad de que hayan k=2 oros (exactamente) en esa extracción.
La respuesta a este problema es
En lugar de usar como dato D es posible
que tengamos la proporción existente, p, entre el número total de oros
y el número de cartas de la baraja
de modo que podemos decir que
Este ejemplo sirve para representar el tipo de
fenómenos que siguen una ley de distribución hipergeométrica. Diremos en
general que una v.a. X sigue una distribución hipergeométrica de
parámetros, N, n y p, lo que representamos del modo
El valor esperado de la hipergeométrica es el
mismo que el de la binomial,
sin embargo su varianza
no es exactamente la de la binomial, pues está
corregida por un factor,
Una v.a. X posee una ley de distribución
de probabilidades del tipo Poisson cuando Este tipo de leyes se aplican a sucesos con
probabilidad muy baja de ocurrir, obteniéndose como la distribución límite de
una sucesión de variable binomiales,
La demostración de esto consiste en
En general utilizaremos la distribución de
Poisson como aproximación de experimentos binomiales donde el número de
pruebas es muy alto, pero la probabilidad de éxito muy baja. A veces se suele
utilizar como criterio de aproximación:
La ley de Poisson la podemos encontrar tabulada
en la tabla número 2, para ciertos valores usuales de La función característica de
de lo que se deduce que valor esperado y varianza
coinciden
Solución: Si consideramos la v.a. X
que contabiliza el número de personas que padecen la enfermedad, es claro que
sigue un modelo binomial, pero que puede ser muy bien aproximado por un modelo
de Poisson, de modo que
Así el número esperado de personas que padecen
la enfermedad es
Las variables aleatorias relacionadas entre si
por uno o más parámetros mediante f, o lo que es equivalente según el
teorema de Fourier (página
Por ejemplo
Un modo sencillo de ver si una familia de
distribuciones es reproductiva con respecto a algún parámetro es analizar su
función característica utilizando el teorema de la página
Utilizando el mismo argumento, tenemos que otra
distribuciones reproductiva es
En esta sección estudiaremos las distribuciones
más importantes de v.a. continuas unidimensionales. El soporte de una
v.a. continua se define como aquella región de Se dice que una v.a. X posee una distribución
uniforme en el intervalo [a,b],
si su función de densidad es la siguiente:
Con esta ley de probabilidad, la probabilidad de
que al hacer un experimento aleatorio, el valor de X este comprendido en
cierto subintervalo de [a,b] depende únicamente de la longitud
del mismo, no de su posición. Cometiendo un pequeño abuso en el lenguaje,
podemos decir que en una distribución uniforme la probabilidad de todos los
puntos del soporte es la misma 6.2.
Teniendo en cuenta que si
la función de distribución de
Como esta distribución es muy simple, vamos a
calcular sus momentos más usuales directamente a partir de la definición, en
lugar de usar la función característica:
La distribución exponencial es el equivalente
continuo de la distribución geométrica discreta. Esta ley de distribución
describe procesos en los que:
Ejemplos de este tipo de distribuciones son:
Concretando, si una v.a. continua X
distribuida a lo largo de se dice que sigue una distribución
exponencial de parámetro luego la función de distribución es:
Para calcular el valor esperado y la varianza de
la distribución exponencial, obtenemos en primer lugar la función característica
para después, derivando por primera vez
y derivando por segunda vez,
Entonces la varianza vale
Solución: El tiempo T de
desintegración de un átomo de
Como el número de átomos de
Solución: Sea T la variable
aleatoria que mide la duración de un marcapasos en una persona. Tenemos que
Entonces
En segundo lugar
Luego como era de esperar, por ser propio a un
mecanismo exponencial,
o sea, en la duración que se espera que tenga el
objeto, no influye en nada el tiempo que en la actualidad lleva funcionando. Es
por ello que se dice que ``la distribución exponencial no tiene memoria". La distribución gaussiana, recibe también
el nombre de distribución normal, ya que una gran mayoría de las v.a
continuas6.3
de la naturaleza siguen esta distribución. Se dice que una v.a. X sigue
una distribución normal de parámetros
La forma de la función de densidad es la llamada
campana de Gauss.
Para el lector es un ejercicio interesante
comprobar que ésta alcanza un único máximo (moda) en El soporte de la distribución es todo La forma de la campana de Gauss depende de los
parámetros La función característica de la distribución
normal, se comprueba más adelante que es
Como consecuencia, la distribución normal es
reproductiva con respecto a los parámetros
Las consecuencias desde el punto de vista práctico
son importantes, ya que eso impide el que podamos escribir de modo sencillo la
función de distribución de la normal, y nos tenemos que limitar a decir que:
sin poder hacer uso de ninguna expresión que la
simplifique. Afortunadamente esto no impide que para un valor de xfijo, F(x)
pueda ser calculado. De hecho puede ser calculado con tanta precisión
(decimales) como se quiera, pero para esto se necesita usar técnicas de cálculo
numérico y ordenadores. Para la utilización en problemas prácticos de la
función de distribución F, existen ciertas tablas donde se ofrecen (con
varios decimales de precisión) los valores F(x) para una serie
limitada de valores xi dados. Normalmente F se
encuentra tabulada para una distribución Z, normal de media 0 y varianza
1 que se denomina distribución normal tipificada:
De manera general se tiene6.8:
Este resultado puede ser utilizado del siguiente
modo: Si
tenemos que el valor obtenido en la tabla, FZ(z)
es la probabilidad buscada.
de modo que
Vamos ahora a demostrar algunas de las
propiedades de la ley gaussiana que hemos mencionado anteriormente.
Por ser la normal una ley de probabilidad se
tiene que es decir, esa integral es constante. Con lo cual,
derivando la expresión anterior con respecto a
Para demostrar la igualdad entre la
Para demostrar el resultado relativo a la función
característica, consideramos en primer lugar la v.a. tipificada de X,
y calculamos
aunque en realidad esta no da resultados muy
precisos a menos que realmente nsea un valor muy grande o
Solución: La v.a. que contabiliza el número
de alumnos que padece la gripe es
Así aproximando la v.a. discreta binomial X,
mediante la v.a. continua normal XN tenemos:
También es necesario calcular
Dada la dificultad numérica para calcular esa
cantidad, y como la distribución binomial no está habitualmente tabulada hasta
valores tan altos, vamos a utilizar su aproximación normal, XN.
Pero hay que prestar atención al hecho de que XN es
una v.a. continua, y por tanto la probabilidad de cualquier punto es cero. En
particular,
lo que ha de ser interpretado como un error de
aproximación. Hay métodos más aproximados para calcular la probabilidad
buscada. Por ejemplo, podemos aproximar
Por último, otra posibilidad es considerar un
intervalo de longitud 1centrado en el valor 60 del que deseamos hallar su
probabilidad y hacer:
Solución: Tenemos que
donde
El valor z0,5 lo podemos
buscar en la tabla 3 (distribución
Por tanto podemos decir que la mitad de la
población tiene una altura inferior a
Para ello observamos que la mayor parte de
probabilidad está concentrada siempre alrededor de la media en las leyes
gaussianas. Entonces podemos tomar un intervalo que contenga un Esto se puede describir como el intervalo
donde x0,25 es el valor que
deja por debajo de sí al
donde
En una tabla encontramos el valor z0,75,
y se destipifica: Análogamente se calcularía
donde
Por la simetría de la distribución normal
con respecto al origen, tenemos que
z0,25= - z0,75.Luego
En conclusión:
De entre los tres intervalos que se han calculado
el que tiene más interés es el último, ya que es simétrico con respecto a la
media, y es el más pequeño de todos los posibles (más preciso). Este ejemplo
es en realidad una introducción a unas técnicas de inferencia estadística que
trataremos posteriormente, conocidas con el nombre de ``estimación
confidencial'' o ``cálculo de intervalos de confianza''. Si consideramos una v.a.
Si tenemos n v.a. independientes
La media y varianza de esta variable son
respectivamente:
y su función de densidad es: Los percentiles de esta distribución que
aparecen con más frecuencia en la práctica los podemos encontrar en la tabla
5.
En consecuencia, si tenemos
Se realizan mediciones de los niveles de glucemia
dados por el instrumento en un grupo de n=100 pacientes. Nos interesa
medir la cantidad de error que se acumula en las mediciones de todos los
pacientes. Podemos plantear varias estrategias para medir los errores
acumulados. Entre ellas destacamos las siguientes:
Solución:
Suponiendo que todas las mediciones son
independientes, se tiene que En este caso los errores no se compensan entre sí,
y si En conclusión, E1 podría ser
utilizado para calcular de modo aproximado El siguiente resultado será de importancia más
adelante. Nos afirma que la media de distribuciones normales independientes es
normal pero con menor varianza y relaciona los grados de libertad de
una v.a. con distribución
La distribución
donde
y nos interesa la distribución de
La función de densidad de
La distribución
en lugar de considerar una primitiva de esa
función y determinar la integral definida, buscaremos el resultado
aproximado en una tabla de la distribución
Otra de la distribuciones importantes asociadas a
la normal es la que se define como cociente de distribuciones
sigue una distribución de probabilidad de
Snedecor, con (n,m) grados de libertad. Obsérvese que
La forma más habitual en que nos encontraremos
esta distribución será en el caso en que tengamos n+m v.a.
independientes
y así
De esta ley de probabilidad lo que más nos
interesa es su función de distribución:
y para ello, como en todas las distribuciones
asociadas a la normal, disponemos de una tabla (la número 6) donde encontrar
aproximaciones a esas cantidades
Es claro que la distribución de Snedecor no es
simétrica, pues sólo tienen densidad de probabilidad distinta de cero, los
punto de Ejercicio 6..1. Para estudiar la regulación
hormonal de una línea metabólica se inyectan ratas albinas con un fármaco que
inhibe la síntesis de proteínas del organismo. En general, 4 de cada 20 ratas
mueren a causa del fármaco antes de que el experimento haya concluido. Si se
trata a 10 animales con el fármaco, ¿cuál es la probabilidad de que al menos
8 lleguen vivas al final del experimento?
Ejercicio 6..2. En una cierta población
se ha observado un número medio anual de muertes por cáncer de pulmón de 12.
Si el número de muertes causadas por la enfermedad sigue una distribución de
Poisson, ¿cuál es la probabilidad de que durante el año en curso:
Ejercicio 6..3. Dañando los cromosomas
del óvulo o del espermatozoide, pueden causarse mutaciones que conducen a
abortos, defectos de nacimiento, u otras deficiencias genéticas. La
probabilidad de que tal mutación se produzca por radiación es del 10%. De las
siguientes 150 mutaciones causadas por cromosomas dañados, ¿cuántas se
esperaría que se debiesen a radiaciones? ¿Cuál es la probabilidad de que
solamente 10 se debiesen a radiaciones?
Ejercicio 6..4. Entre los diabéticos, el
nivel de glucosa en sangre X, en ayunas, puede suponerse de distribución
aproximadamente normal, con media 106 mg/100 ml y desviación típica 8 mg/100
ml, es decir Ejercicio 6..5. Una prueba de laboratorio
para detectar heroína en sangre tiene un 92% de precisión. Si se analizan 72
muestras en un mes, ¿cuál es la probabilidad de que:
Ejercicio 6..6. El 10% de las personas
tiene algún tipo de alergia. Se seleccionan aleatoriamente 100 individuos y se
les entrevista. Hallar la probabilidad de que, al menos, 12 tengan algún tipo
de alergia. Hallar la probabilidad de que, como máximo, 8 sean alérgicos a
algo.
Ejercicio 6..7. La probabilidad de muerte
resultante del uso de píldoras anticonceptivas es de 3/100.000. De 1.000.000 de
mujeres que utilizan este medio de control de natalidad:
Ejercicio 6..8. La probabilidad de
presentar una característica genética es de 1/20.
Ejercicio 6..9. Se supone que en una
cierta población humana el índice cefálico i, (cociente entre
el diámetro transversal y el longitudinal expresado en tanto por ciento), se
distribuye según una Normal. El 58% de los habitantes son dolicocéfalos (i
Ejercicio 6..10. Se supone que la glucemia
basal en individuos sanos, Xs sigue una distribución Ejercicio 6..11. Supóngase que se van a
utilizar 20 ratas en un estudio de agentes coagulantes de la sangre. Como
primera experiencia, se dio un anticoagulante a 10 de ellos, pero por
inadvertencia se pusieron todas sin marcas en el mismo recinto. Se necesitaron
12 ratas para la segunda fase del estudio y se les tomó al azar sin
reemplazamiento. ¿Cuál es la probabilidad de que de las 12 elegidas 6 tengan
la droga y 6 no la tengan? Éste texto es la versión electrónica del
manual de la Universidad de Málaga: Publicación enviada por Universidad de Málaga Contactar http://ftp.medprev.uma.es/libro/ Código ISPN de la Publicación EpZZVZFpyVyvXUdgoq Publicado Monday 23 de February de 2004 Ultimas Publicaciones en ilustrados.com
ilustrados.com nace con el fin difundir el conocimiento publicando trabajos de investigación, monografias, tesis, presentaciones powerpoint y afines. Publicar trabajos en ilustrados.com ha alcanzado prestigio y reconocimiento internacional siendo cada vez más el número de académicos, empresas, investigadores, científicos que consultan las publicaciones de nuestro portal. | ||||||||||||||||