Ilustrados comunidad mundial educativa
Inicio | Escribenos
User: Pass: Recordar ó (Registrate!)

| !Publicar Articulo¡

Distribución Normal y Muestreo

Resumen: Dada la necesidad de bibliografía para la asignatura Informática Medica II se concibió este Material de Apoyo a la Docencia cuyo contenido forma parte del programa analítico de la asignatura. En el mismo se expone el sumario siguiente: La distribución normal estándar. Ejemplo de aplicación. Muestreo. Ventajas y desventajas. Error de muestreo probabilístico y no probabilístico. Muestra representativa. Esquema de muestreo: simple aleatorio y estratificado. Concepto de estadígrafo y distribución muestral. Distribución muestral de la media aritmética cuando la distribución de la variable original es normal. Error estándar. Breve noción acerca de las distribuciones t-student y Ji-cuadrado (c2).
3,435 visitas
Rating: 0
Tell a Friend
Autor: Dra. Nelsa María Sagaró del Campo y Dra. Meydis María Macías Navarro

Resumen

Dada la necesidad de bibliografía para la asignatura Informática Medica II se concibió este Material de Apoyo a la Docencia cuyo contenido forma parte del programa analítico de la asignatura. En el mismo se expone el sumario siguiente: La distribución normal estándar. Ejemplo de aplicación. Muestreo. Ventajas y desventajas. Error de muestreo probabilístico y no probabilístico. Muestra representativa. Esquema de muestreo: simple aleatorio y estratificado. Concepto de estadígrafo y distribución muestral. Distribución muestral de la media aritmética cuando la distribución de la variable original es normal. Error estándar. Breve noción acerca de las distribuciones t-student y Ji-cuadrado (c2).

La distribución normal

La distribución normal, curva normal o distribución o curva de Gauss tiene sus orígenes a principios del siglo XVIII cuando De Moivre encontró la función  matemática de define este tipo de curva.

A finales del propio siglo Gauss y La Place al hacer mediciones astronómicas cometían errores en las mediciones que realizaban. A los valores numéricos de estos errores de medición le calcularon las  distribuciones de frecuencias absulotas y relativas y le realizaron los polígonos de frecuencias correspondientes y  observaron que al igual que las distribuciones de otras variables cuantitativas continuas, siempre la curva que describían tenía forma de campana.

Por lo que decidieron utilizar la función que describe este tipo de curva en sus trabajos como veremos más adelante.

Es bueno recordar, de la enseñanza media, que una recta también tiene una función matemática que la define: y = a+bx ; donde a es el intercepto, el lugar donde la recta corta al eje de las y u ordenadas y b es la pendiente de la recta. Como a y b pueden tomar infinitos valores habrán también infinitas rectas.

La función que define la curva normal es:

 

F(x)=

 

En esta expresión e  y  son constantes; x es el valor que asume la variable por consiguiente los parámetros que definen esa función son: y , la media y la desviación estándar poblacional.

Variando el valor de  se desplaza la curva sobre el eje de las x o abcisas a la derecha y a la izquierda, mientras que al variar el valor de , varía la dispersión por lo que la curva será mas aplanada ( más dispersión) o más apuntada ( menos dispersión), por lo que existen infinitas curvas normales.

Características de la curva normal

 -La distribución normal es simétrica con respecto a una perpendicular trazada desde el punto más alto de la curva al eje de las x. Queda así dividida en dos mitades exactamente iguales, que cada una tiene un área de 0.5 o el 50% pues si recordamos, todo el área bajo la curva es igual a 1 o 100.

-La distribución normal es unimodal

-La media la mediana y la moda son iguales

-En el punto de inflección de la curva, donde cambia de concavidad (cóncava para convexa) se encuentra a una distancia igual a , y se ha demostrado matemáticamente que:

                                     abarca el 68% del área

                               abarca  el 95% del área                    

                              abarca el 99% del área

 

Con fines prácticos a mi me interesaría saber que proporción del área bajo la curva quede entre dos puntos de las abcisas o eje de las x, lo que equivale a decir entre que dos valores de la variable; o conocer para un determinado valor qué área está por encima y qué área queda por debajo. Esto implicaría sustituir los valores de y en la función que define esta curva,  y realizar múltiples cálculos.

Para darle solución a este problema se creó la  normal estándar, que no es más que una distribución normal pero con = 0 y = 1. Para esta distribución normal se calcularon las áreas bajo la curva que aparecen en Tablas.

En la práctica, es mucho más probable, que la distribuciones tengan medias diferentes de cero y varianza distintas a 1 y esto me limitaría el uso de las tablas.

 Para resolver este problema se transforman los valores de una distribución cualquiera a normal estándar mediante la expresión:

Z =

 Es bueno aclarar que existen otras formas de representar el valor del área que delimita Z y UD. puede encontrarse en otras publicaciones otras tablas de la normal estándar, digamos que con otro diseño, pero por supuesto en esencia son las mismas.               

Veamos algunos ejemplos que nos ayudaran a entender el manejo e interpretación de las áreas bajo la curva.

Supongamos que los niveles de glucosa en sangre de diabéticos en ayuna se distribuye de forma normal con = 105 y = 9

v      ¿Qué proporción de diabéticos presentan niveles de glicemia entre 90 y 125?

v      ¿Qué niveles de glucosa abarcan el 95% de los diabéticos?

Lo primero que tenemos que hacer es transformar los valores de la variable, glicemia en sangre, en normal estándar.

Vamos a denominar por z los valores de la estándar y por x los de la variable en estudio.

Z =    

Para x = 90

Z =  = - 1.67

Z = - 1.67

Para x = 125

Z = = 2.22

Z = 2.22

Ahora buscamos en la tabla:

Z = -1.67= 0.4525

Z = 2.22 = 0.4865

 0.4525+0.4865= 0.9390

 

El 94% de los diabéticos presentan niveles de glicemia en ayunas entre 90 y 125.

 Muestreo

El muestreo constituye una herramienta de la investigación científica. Su función básica es determinar qué parte de una realidad en estudio  debe ser examinada con el objetivo de hacer inferencias (conclusiones) sobre el todo de la cual procede, siendo esa parte de la realidad la  muestra y el todo de donde procede la población o universo.

Condiciones de una buena muestra. Muestra Representativa: Una muestra es representativa cuando lo es en cantidad y calidad.

* Cantidad: En el campo de la medicina se dice que una muestra es representativa si se escoge entre el 25 y el 30 % de la población.

* Calidad: Debe  reflejar fielmente las características del universo, sólo diferir en el tamaño.

Ventajas del muestreo.

Es muy útil cuando el Universo es muy grande o Infinito.

Cuando algunos de los elementos observados se destruye en la observación.

Para ahorrar recursos, trabajo, tiempo y dinero.

Mayor precisión y exactitud en los resultados por mejor preparación del personal.

Desventajas del muestreo

Siempre está presente el error de muestreo producto de la variabilidad intrínseca de los elementos del universo, existen diferencias entre las medidas muestrales y los parámetros poblacionales llamada Error de Muestreo la Inferencia Estadística permite medir el error de muestreo.

Tipos de muestreo: No probabilístico y Probabilístico.

v      No probabilístico: Es aquel en el cual la teoría de la probabilidad no interviene para nada en la selección de la muestra, siendo imposible valorar el error de muestreo. Estos por lo general no se usan para trabajos de corte científico, prefiriéndose para ello los muestreos probabilísticos. No puede calcularse el error de muestreo.

v      Probabilístico: es aquel que otorga una probabilidad conocida, no nula, de integrar la muestra a cada una de las unidades de análisis de la población objeto de estudio. Cuando la probabilidad de inclusión es la misma para todos los elementos de la población objeto, se dice que el método es equiprobabilístico.

Muestra representativa: no existe una definición formal que nos permita afirmar que una muestra es o no representativa de la población objeto de estudio, a pesar de que la mayoría de los investigadores se refieren a este término en sus investigaciones. Según Silva (1993), para conseguir representatividad lo que debe procurarse es que la muestra exhiba internamente el mismo grado de variabilidad que la población, así, una muestra puede considerarse representativa de ciertos aspectos específicos de la población, cuando el error en que se incurre al sacar conclusiones sobre esos aspectos no excede ciertos límites prefijados.

Error de muestreo o error aleatorio: es el error que se comete debido al hecho de sacar conclusiones sobre una población a partir del estudio de una muestra de ella. Podrás suponer, que la magnitud del error aleatorio será mayor en la medida que el tamaño de la muestra estudiada sea menor. Como investigador, es obvio, que desearás que ese error sea pequeño y a la vez poder cuantificar su magnitud.

Existen diferentes tipos de muestreos probabilísticos, aquí estudiaremos el Muestreo Simple Aleatorio y el Muestreo Estratificado Aleatorio

El muestreo simple aleatorio constituye el más sencillo y conocido procedimiento probabilístico de muestreo. Es ampliamente utilizado en el diseño experimental, además de ser un procedimiento básico componente de otros métodos más complejos

Puede definirse al Muestreo Simple Aleatorio como un procedimiento mediante el cual las unidades de análisis a integrar la muestra son seleccionadas de manera equiprobabilística, además, todos  los subconjuntos de tamaño n susceptibles de ser formados a partir de la población objeto tendrán la misma probabilidad de selección.

El  MSA es un método de selección que descansa exclusivamente en el azar, sin embargo, como hemos visto, el azar no es una garantía de representatividad. Hay ocasiones en que éste no resuelve el problema, pues se sabe que en la población objeto existen diferentes grupos de elementos cuya representación  en la muestra se quiere asegurar. Para ello se realizan listas separadas para dichos grupos y se procede a seleccionar submuestras de cada uno de ellos.

A estos grupos previamente formados se les llama estratos y deben abarcar a toda la población de estudio (exhaustividad) sin intersectarse (mutuamente excluyentes), es decir, cada miembro de la población pertenece a uno y sólo un estrato. La idea es que los grupos sean internamente homogéneos en algún sentido y consecuentemente diferentes entre sí.

Cuando la selección de la muestra implica la división de la población en estratos y  dentro de los estratos se emplea un procedimiento de selección en que interviene el azar, sea MSA o MS, se dice que se aplica un Muestreo Aleatorio Estratificado, (MAE).

Por ejemplo, se desea realizar un estudio en la población de estudiantes de una Universidad, en el que a través de una muestra de  ellos queremos obtener información sobre el uso del condón.

Estimador o Estadígrafo es una función particular de las observaciones en una muestra escogida para estimar el parámetro de una población. La media de la muestra es utilizada para estimar la media de la población(parámetro poblacional), el valor numérico obtenido se llama estimación.

El poder utilizar esas medidas de tendencia central, como la media muestral, u otras como la proporción, la varianza y la desviación estándar, por sólo mencionar las más utilizadas, como estimadores de los parámetros poblacionales tiene su sustento teórico en el concepto de Distribución muestral de un estimador.

Distribución muestral de un estimador. Dada una muestra aleatoria de una población, se llama distribución muestral de un estimador a la distribución de frecuencias de los valores que ese estimador toma en un número infinito de muestras del mismo tipo y tamaño. 

 Aclaremos un poco este concepto con un ejemplo;  supongamos que tenemos una población de niños menores de un año y comenzamos a sacar muestras de tamaño 10 y  calculamos el peso promedio de los niños para cada muestra. Debemos aclarar que se trata de un muestreo con reemplazo, o sea, cada vez que saco al azar una muestra de 10 niños y le calculo su peso promedio,  esos niños los devuelvo a la población antes de obtener las otras muestras.

De tal suerte que tendremos un listado de pesos pro medios, tantos como muestras haya obtenido.

Esas medias yo puedo tratarlas como si fueran valores de una variable, puedo ordenarlas, calcular su distribución de frecuencias absolutas y relativas, calcular la media de esas medias y una medida de dispersión, digamos la desviación estándar.

Se ha comprobado que esa distribución de las medias va a tener tres propiedades que son:

La media de la distribución de las medias en el muestreo es igual a la media poblacional

La forma de la distribución de las medias en el muestreo es aproximadamente el de las distribución normal, independiente de la forma de distribución de la población, suponiendo que n sea suficientemente grande ( Teorema central del límite).

De ahí la importancia tan grande que tiene la distribución normal en la estadística inferencial, porque puede que  no sepa cual es la distribución de mi población o que incluso la población no se distribuya normal, que si el tamaño de la muestra es suficientemente grande, por esta segunda propiedad que se conoce como teorema central del límite, la muestra si sigue esta distribución.

La desviación estándar de la distribución de las medias en el muestreo es  y se conoce como error estándar.

La distribución Ji cuadrado (c2)

Esta distribución  deriva de la distribución  normal. Surge cuando tenemos n variables  independientes, que siguen aproximadamente una distribución normal estándar (X1, X2,.., Xn). La variable resultante de sumar los cuadrados de éstas, sigue una distribución Ji cuadrado con n grados de libertad. Se denota como.

            X ~ c2 (n gl)

Su representación gráfica puedes verla en la figura 4.1, para diferentes grados de libertad.


No necesariamente deben ser distribuciones normal estándar, también pueden ser variables estandarizadas.

Figura 1. Representación gráfica de la función de densidad de la distribución Ji cuadrado para diferentes grados de libertad.

Se trata de una función positiva, no puede tomar valores negativos, pues como podrás suponer, se deriva de la suma de valores elevados al cuadrado. Su forma depende de los grados de libertad, con tendencia a aproximarse a la curva normal en la medida que aumentan los grados de libertad. Al igual que la normal y cualquier distribución continua, el área bajo la curva es igual a 1, pero no es simétrica.

Su valor esperado y varianza son:

                        E(c2) = n   y  V(c2) = 2n

Los grados de libertad se refieren, al número de términos independientes que es necesario, para obtener el valor de la variable c2. Una propiedad importante, es que la Ji cuadrado con un grado de libertad, es igual al cuadrado de la normal estándar.

Esta distribución es muy empleada para probar hipótesis, cuando los datos están en forma de frecuencias. Estos procedimientos se estudian bajo el título de pruebas de bondad de ajuste, como verás en cursos posteriores. Siendo más adecuado su uso, cuando estamos en presencia de variables categóricas.

La cantidad c2, es una medida del grado de congruencia entre las frecuencias observadas y las esperadas, bajo el cumplimiento de una hipótesis dada, esto lo entenderás mejor cuando veamos la aplicación concreta de dicha distribución.

Por ahora, baste que conozcas que existen tablas con los valores de los percentiles de esta distribución, para diferentes magnitudes de n. La tabla C del Apéndice es un ejemplo de éstas. Como puedes ver están representados los valores de algunos percentiles de c2 para diferentes grados de libertad. Por ejemplo, el percentil 95 de la c2 con 12 gl = 21.0

La distribución t de Student.

 


            Este modelo teórico, al igual que la Ji cuadrado, se deriva del modelo normal, pero es un proceso algo complejo. Se denota por la letra t minúscula, y su forma gráfica se representa en la figura 4.2.

Figura 2. Función de densidad de la distribución t de Student con un grado de libertad.

Como puedes ver es muy similar a la curva normal estándar, pero más dispersa, su media también es cero. Es simétrica respecto a la media, su forma depende de los grados de libertad, así en la medida que aumentan los grados de libertad mayor es la aproximación a la normal. Los grados de libertad tienen el mismo significado que en la Ji cuadrado.

Puede tomar valores tanto positivos como negativos, y al igual que toda distribución continua, el área bajo la curva es igual a uno.

Su valor esperado y varianza:

                        E(t) = 0       y       V(t) =

Al igual que la Ji cuadrado existen tablas con los percentiles de ella, los que son empleados en las pruebas de hipótesis y en la construcción de intervalos de confianza. La tabla B del Apéndice es un ejemplo de estas tablas, en ella se muestran los valores de la distribución t para diferentes grados de libertad, correspondientes a los percentiles más empleados en inferencia estadística, veremos su uso en la medida que sea necesario y así lo entenderás mejor.

Bibliografía:

1. Horsford Saing R, Bayarre Vea H. Métodos y técnicas aplicadas a la investigación en Atención Primaria de Salud. La Habana: Ediciones Finlay, 2000.

2. Daniel WW. Bioestadística. Base para el análisis de las ciencias de la salud. 3ª ed. México D.F.:Limusa; 1997.

3. Spiegel MR. Teoría y problemas de Estadística. La Habana:Pueblo y Educación; 1977.

4. Freund J. Estadística elemental moderna. 2ª ed. La Habana:Edición Revolucionaria; 1988.

5. Coolican H. Métodos de investigación y estadística en psicología. México D.F.:El Manual Moderno; 1997

6. Camel F. Estadísticas médicas y de Salud Pública. La Habana:Pueblo y Educación; 1985.

Autoras:

  • Dra. Nelsa María Sagaró del Campo
  • Dra. Meydis María Macías Navarro
Articulos relacionados:
Hemangioma Vesical Difuso. Presentación de un caso
Resumen:
Se presenta un caso de hemangioma vesical difuso en una paciente femenina de 33 años de edad, haciendo hincapié en el diagnóstico y tratamiento de este tipo de tumores, a...
Propuesta de Programa para Estudiantes de Ciencias Médicas como alternativa del Plan "C" en Educación Civica
Resumen:
La relación entre Cultura Física y Salud Publica constituyen una unidad de acción e intereses tal que muchos de los investigadores por los cuales miden los países desarro...
Vertebroplastia y Cifoplastia (ppt)
Resumen:
La Vertebroplastia:Es la modificación del patrón de carga en la vértebra mediante el uso de cemento quirúrgico. La Cifoplastia :Es la corrección de la altura en los cuerp...
Calidad de vida en pacientes post-infarto de miocardio
Resumen:
Resulta evidente en la práctica clínica un deterioro en la Calidad de Vida en los pacientes que han sufrido un ataque agudo al miocardio y se han recuperado del mismo. En...
Factores de riego y diagnostico de la otitis media aguda en menores de 3 años (doc)
Resumen:
Se realizó un estudio descriptivo de corte transversal en 102 niños menores de 3 años de edad en 10 Consultorios del Médico de la Familia, pertenecientes al policlínico U...
Copyright © 2011 ilustrados.com, Monografias, tesis, bibliografias, educacion. Tofos los temas y publicaciones son propiedad de sus respectivos autores ©