|
|
Monografias | Distribución Normal y MuestreoDistribución Normal y MuestreoResumen: Dada la necesidad de bibliografía para la asignatura Informática Medica II se concibió este Material de Apoyo a la Docencia cuyo contenido forma parte del programa analítico de la asignatura. En el mismo se expone el sumario siguiente: La distribución normal estándar. Ejemplo de aplicación. Muestreo. Ventajas y desventajas. Error de muestreo probabilístico y no probabilístico. Muestra representativa. Esquema de muestreo: simple aleatorio y estratificado. Concepto de estadígrafo y distribución muestral. Distribución muestral de la media aritmética cuando la distribución de la variable original es normal. Error estándar. Breve noción acerca de las distribuciones t-student y Ji-cuadrado (c2). Resumen
Dada
la necesidad de bibliografía para la asignatura Informática Medica II se
concibió este Material de Apoyo a la Docencia cuyo contenido forma parte del
programa analítico de la asignatura. En el mismo se expone el sumario
siguiente: La distribución normal estándar. Ejemplo de aplicación. Muestreo.
Ventajas y desventajas. Error de muestreo probabilístico y no probabilístico.
Muestra representativa. Esquema de muestreo: simple aleatorio y estratificado.
Concepto de estadígrafo y distribución muestral. Distribución muestral de la
media aritmética cuando la distribución de la variable original es normal.
Error estándar. Breve noción acerca de las distribuciones t-student y
Ji-cuadrado (c2). La
distribución normal, curva normal o distribución o curva de Gauss tiene sus orígenes
a principios del siglo XVIII cuando De Moivre encontró la función
matemática de define este tipo de curva. A
finales del propio siglo Gauss y La Place al hacer mediciones astronómicas
cometían errores en las mediciones que realizaban. A los valores numéricos de
estos errores de medición le calcularon las
distribuciones de frecuencias absulotas y relativas y le realizaron los
polígonos de frecuencias correspondientes y
observaron que al igual que las distribuciones de otras variables
cuantitativas continuas, siempre la curva que describían tenía forma de
campana. Por
lo que decidieron utilizar la función que describe este tipo de curva en sus
trabajos como veremos más adelante. Es
bueno recordar, de la enseñanza media, que una recta también tiene una función
matemática que la define: y = a+bx ; donde a es el intercepto, el lugar donde
la recta corta al eje de las y u ordenadas y b es la pendiente de la recta. Como
a y b pueden tomar infinitos valores habrán también infinitas rectas. La
función que define la curva normal es: F(x)=
En
esta expresión e y
Variando
el valor de
Características
de la curva normal -La
distribución normal es simétrica con respecto a una perpendicular trazada
desde el punto más alto de la curva al eje de las x. Queda así dividida en dos
mitades exactamente iguales, que cada una tiene un área de 0.5 o el 50% pues si
recordamos, todo el área bajo la curva es igual a 1 o 100. -La
distribución normal es unimodal -La
media la mediana y la moda son iguales -En
el punto de inflección de la curva, donde cambia de concavidad (cóncava para
convexa) se encuentra a una distancia igual a
Para
darle solución a este problema se creó la
normal estándar, que no es más que una distribución normal pero con
En
la práctica, es mucho más probable, que la distribuciones tengan medias
diferentes de cero y varianza distintas a 1 y esto me limitaría el uso de las
tablas. Para
resolver este problema se transforman los valores de una distribución
cualquiera a normal estándar mediante la expresión: Z
=
Es
bueno aclarar que existen otras formas de representar el valor del área que
delimita Z y UD. puede encontrarse en otras publicaciones otras tablas de la
normal estándar, digamos que con otro diseño, pero por supuesto en esencia son
las mismas.
Veamos
algunos ejemplos que nos ayudaran a entender el manejo e interpretación de las
áreas bajo la curva. Supongamos
que los niveles de glucosa en sangre de diabéticos en ayuna se distribuye de
forma normal con
v
¿Qué
proporción de diabéticos presentan niveles de glicemia entre 90 y 125? v
¿Qué
niveles de glucosa abarcan el 95% de los diabéticos? Lo
primero que tenemos que hacer es transformar los valores de la variable,
glicemia en sangre, en normal estándar. Vamos
a denominar por z los valores de la estándar y por x los de la variable en
estudio. Z
=
Para
x
Z
=
Z
Para
x
Z
=
Z
Ahora
buscamos en la tabla: Z
= -1.67= 0.4525 Z
= 2.22 = 0.4865 0.4525+0.4865=
0.9390 El
94% de los diabéticos presentan niveles de glicemia en ayunas entre 90 y 125. Muestreo El
muestreo constituye una herramienta de la investigación científica. Su función
básica es determinar qué parte de una realidad en estudio
debe ser examinada con el objetivo de hacer inferencias (conclusiones)
sobre el todo de la cual procede, siendo esa parte de la realidad la
muestra y el todo de donde procede la población o universo. Condiciones
de una buena muestra. Muestra Representativa: Una muestra es representativa
cuando lo es en cantidad y calidad. *
Cantidad: En el campo de la medicina se dice que una muestra es representativa
si se escoge entre el 25 y el 30 % de la población. *
Calidad: Debe reflejar fielmente
las características del universo, sólo diferir en el tamaño. Ventajas
del muestreo. Es
muy útil cuando el Universo es muy grande o Infinito. Cuando
algunos de los elementos observados se destruye en la observación. Para
ahorrar recursos, trabajo, tiempo y dinero. Mayor
precisión y exactitud en los resultados por mejor preparación del personal. Desventajas
del muestreo Siempre
está presente el error de muestreo producto de la variabilidad intrínseca de
los elementos del universo, existen diferencias entre las medidas muestrales y
los parámetros poblacionales llamada Error de Muestreo la Inferencia Estadística
permite medir el error de muestreo. Tipos
de muestreo: No probabilístico y Probabilístico. v
No
probabilístico: Es aquel en el cual la teoría de la probabilidad no interviene
para nada en la selección de la muestra, siendo imposible valorar el error de
muestreo. Estos por lo general no se usan para trabajos de corte científico,
prefiriéndose para ello los muestreos probabilísticos. No puede calcularse el
error de muestreo. v
Probabilístico:
es aquel que otorga una probabilidad conocida, no nula, de integrar la muestra a
cada una de las unidades de análisis de la población objeto de estudio. Cuando
la probabilidad de inclusión es la misma para todos los elementos de la población
objeto, se dice que el método es equiprobabilístico. Muestra
representativa: no existe una definición formal que nos permita afirmar que una
muestra es o no representativa de la población objeto de estudio, a pesar de
que la mayoría de los investigadores se refieren a este término en sus
investigaciones. Según Silva (1993), para conseguir representatividad lo que
debe procurarse es que la muestra exhiba internamente el mismo grado de
variabilidad que la población, así, una muestra puede considerarse
representativa de ciertos aspectos específicos de la población, cuando el
error en que se incurre al sacar conclusiones sobre esos aspectos no excede
ciertos límites prefijados. Error
de muestreo o error aleatorio: es el error que se comete debido al hecho de
sacar conclusiones sobre una población a partir del estudio de una muestra de
ella. Podrás suponer, que la magnitud del error aleatorio será mayor en la
medida que el tamaño de la muestra estudiada sea menor. Como investigador, es
obvio, que desearás que ese error sea pequeño y a la vez poder cuantificar su
magnitud. Existen
diferentes tipos de muestreos probabilísticos, aquí estudiaremos el Muestreo
Simple Aleatorio y el Muestreo Estratificado Aleatorio El
muestreo simple aleatorio constituye el más sencillo y conocido procedimiento
probabilístico de muestreo. Es ampliamente utilizado en el diseño
experimental, además de ser un procedimiento básico componente de otros métodos
más complejos Puede
definirse al Muestreo Simple Aleatorio como un procedimiento mediante el cual
las unidades de análisis a integrar la muestra son seleccionadas de manera
equiprobabilística, además, todos los
subconjuntos de tamaño n susceptibles de ser formados a partir de la población
objeto tendrán la misma probabilidad de selección. El
MSA es un método de selección que descansa exclusivamente en el azar,
sin embargo, como hemos visto, el azar no es una garantía de representatividad.
Hay ocasiones en que éste no resuelve el problema, pues se sabe que en la
población objeto existen diferentes grupos de elementos cuya representación
en la muestra se quiere asegurar. Para ello se realizan listas separadas
para dichos grupos y se procede a seleccionar submuestras de cada uno de ellos. A
estos grupos previamente formados se les llama estratos y deben abarcar a toda
la población de estudio (exhaustividad) sin intersectarse (mutuamente
excluyentes), es decir, cada miembro de la población pertenece a uno y sólo un
estrato. La idea es que los grupos sean internamente homogéneos en algún
sentido y consecuentemente diferentes entre sí. Cuando
la selección de la muestra implica la división de la población en estratos y
dentro de los estratos se emplea un procedimiento de selección en que
interviene el azar, sea MSA o MS, se dice que se aplica un Muestreo Aleatorio
Estratificado, (MAE). Por
ejemplo, se desea realizar un estudio en la población de estudiantes de una
Universidad, en el que a través de una muestra de
ellos queremos obtener información sobre el uso del condón. Estimador
o Estadígrafo es una función particular de las observaciones en una muestra
escogida para estimar el parámetro de una población. La media de la muestra es
utilizada para estimar la media de la población(parámetro poblacional), el
valor numérico obtenido se llama estimación. El
poder utilizar esas medidas de tendencia central, como la media muestral, u
otras como la proporción, la varianza y la desviación estándar, por sólo
mencionar las más utilizadas, como estimadores de los parámetros poblacionales
tiene su sustento teórico en el concepto de Distribución muestral de un
estimador. Distribución
muestral de un estimador. Dada una muestra aleatoria de una población, se llama
distribución muestral de un estimador a la distribución de frecuencias de los
valores que ese estimador toma en un número infinito de muestras del mismo tipo
y tamaño. Aclaremos
un poco este concepto con un ejemplo; supongamos
que tenemos una población de niños menores de un año y comenzamos a sacar
muestras de tamaño 10 y calculamos
el peso promedio de los niños para cada muestra. Debemos aclarar que se trata
de un muestreo con reemplazo, o sea, cada vez que saco al azar una muestra de 10
niños y le calculo su peso promedio, esos
niños los devuelvo a la población antes de obtener las otras muestras. De
tal suerte que tendremos un listado de pesos pro medios, tantos como muestras
haya obtenido. Esas
medias yo puedo tratarlas como si fueran valores de una variable, puedo
ordenarlas, calcular su distribución de frecuencias absolutas y relativas,
calcular la media de esas medias y una medida de dispersión, digamos la
desviación estándar. Se
ha comprobado que esa distribución de las medias va a tener tres propiedades
que son: La
media de la distribución de las medias en el muestreo es igual a la media
poblacional
La
forma de la distribución de las medias en el muestreo es aproximadamente el de
las distribución normal, independiente de la forma de distribución de la
población, suponiendo que n sea suficientemente grande ( Teorema central del límite). De
ahí la importancia tan grande que tiene la distribución normal en la estadística
inferencial, porque puede que no
sepa cual es la distribución de mi población o que incluso la población no se
distribuya normal, que si el tamaño de la muestra es suficientemente grande,
por esta segunda propiedad que se conoce como teorema central del límite, la
muestra si sigue esta distribución. La
desviación estándar de la distribución de las medias en el muestreo es
La
distribución Ji cuadrado (c2) Esta
distribución deriva de la
distribución normal. Surge cuando
tenemos n variables independientes, que siguen aproximadamente una distribución
normal estándar (X1, X2,.., Xn). La variable resultante de sumar los cuadrados
de éstas, sigue una distribución Ji cuadrado con n grados de libertad. Se
denota como.
X
~
c2
(n gl) Su
representación gráfica puedes verla en la figura 4.1, para diferentes grados
de libertad.
Figura
1. Representación gráfica de la función de densidad de la distribución Ji
cuadrado para diferentes grados de libertad. Se
trata de una función positiva, no puede tomar valores negativos, pues como podrás
suponer, se deriva de la suma de valores elevados al cuadrado. Su forma depende
de los grados de libertad, con tendencia a aproximarse a la curva normal en la
medida que aumentan los grados de libertad. Al igual que la normal y cualquier
distribución continua, el área bajo la curva es igual a 1, pero no es simétrica. Su
valor esperado y varianza son:
E(c2)
= n y
V(c2)
= 2n Los
grados de libertad se refieren, al número de términos independientes que es
necesario, para obtener el valor de la variable c2.
Una propiedad importante, es que la Ji cuadrado con un grado de libertad, es
igual al cuadrado de la normal estándar. Esta
distribución es muy empleada para probar hipótesis, cuando los datos están en
forma de frecuencias. Estos procedimientos se estudian bajo el título de
pruebas de bondad de ajuste, como verás en cursos posteriores. Siendo más
adecuado su uso, cuando estamos en presencia de variables categóricas. La
cantidad c2,
es una medida del grado de congruencia entre las frecuencias observadas y las
esperadas, bajo el cumplimiento de una hipótesis dada, esto lo entenderás
mejor cuando veamos la aplicación concreta de dicha distribución. Por
ahora, baste que conozcas que existen tablas con los valores de los percentiles
de esta distribución, para diferentes magnitudes de n. La tabla C del Apéndice
es un ejemplo de éstas. Como puedes ver están representados los valores de
algunos percentiles de c2
para diferentes grados de libertad. Por ejemplo, el percentil 95 de la c2
con 12 gl = 21.0 La
distribución t de Student.
Figura
2. Función de densidad de la distribución t de Student con un grado de
libertad. Como
puedes ver es muy similar a la curva normal estándar, pero más dispersa, su
media también es cero. Es simétrica respecto a la media, su forma depende de
los grados de libertad, así en la medida que aumentan los grados de libertad
mayor es la aproximación a la normal. Los grados de libertad tienen el mismo
significado que en la Ji cuadrado. Puede
tomar valores tanto positivos como negativos, y al igual que toda distribución
continua, el área bajo la curva es igual a uno. Su
valor esperado y varianza:
E(t)
= 0 y V(t) =
Al
igual que la Ji cuadrado existen tablas con los percentiles de ella, los que son
empleados en las pruebas de hipótesis y en la construcción de intervalos de
confianza. La tabla B del Apéndice es un ejemplo de estas tablas, en ella se
muestran los valores de la distribución t para diferentes grados de libertad,
correspondientes a los percentiles más empleados en inferencia estadística,
veremos su uso en la medida que sea necesario y así lo entenderás mejor. Bibliografía: 1.
Horsford
Saing R, Bayarre Vea H. Métodos y técnicas aplicadas a la investigación en
Atención Primaria de Salud. La Habana: Ediciones Finlay, 2000. 2.
Daniel WW. Bioestadística. Base para el análisis de las ciencias de la salud.
3ª ed. México D.F.:Limusa; 1997. 3.
Spiegel MR. Teoría y problemas de Estadística. La Habana:Pueblo y Educación;
1977. 4.
Freund J. Estadística elemental moderna. 2ª ed. La Habana:Edición
Revolucionaria; 1988. 5.
Coolican H. Métodos de investigación y estadística en psicología. México
D.F.:El Manual Moderno; 1997 6.
Camel F. Estadísticas médicas y de Salud Pública. La Habana:Pueblo y Educación;
1985. Autoras:
Publicación enviada por Dra. Nelsa María Sagaró del Campo y Dra. Meydis María Macías Navarro Contactar mailto:nsagaro@sierra.scu.sld.cu Código ISPN de la Publicación EEFklVEyVAWHnjjMcz Publicado Thursday 24 de November de 2005 Ultimas Publicaciones en ilustrados.com
ilustrados.com nace con el fin difundir el conocimiento publicando trabajos de investigación, monografias, tesis, presentaciones powerpoint y afines. Publicar trabajos en ilustrados.com ha alcanzado prestigio y reconocimiento internacional siendo cada vez más el número de académicos, empresas, investigadores, científicos que consultan las publicaciones de nuestro portal. | ||||||||||||||