Monografias | Medidas de Dispersión

Medidas de Dispersión

Resumen: Dada la necesidad de bibliografía para la asignatura Informática Medica II se concibió este Material de Apoyo a la Docencia cuyo contenido forma parte del programa analítico de la asignatura. En el mismo se expone el sumario siguiente: Medidas de dispersión (rango (R), Varianza (S2), desviación estándar (s), coeficiente de variación). Características, propiedades y cálculo.

Publicación enviada por Dra. Nelsa María Sagararó y Dra. Meydis María Macías Navarro


 

Resumen

Dada la necesidad de bibliografía para la asignatura Informática Medica II se concibió este Material de Apoyo a la Docencia cuyo contenido forma parte del programa analítico de la asignatura. En el mismo se expone el sumario siguiente: Medidas de dispersión (rango (R), Varianza (S2),  desviación estándar (s), coeficiente de variación). Características, propiedades y cálculo.

Medidas de dispersión

Podría parecer que las medidas de tendencia central son suficientes para resumir y describir los conjuntos de los cuales proceden, sin embargo, múltiples circunstancias exigen la descripción de otros rasgos de los datos existentes. Verás por qué planteamos esto.

Por ejemplo, si un médico a cargo de la sala realiza el siguiente análisis: «tomando en cuenta la FC media, no tengo motivos para preocuparme por la salud de los pacientes, pues, en general, ostentan cifras dentro de límites normales; por ende, tenemos que encaminar nuestros esfuerzos hacia otros problemas».

En principio, no está nada mal, ya que interpretó correctamente el indicador. Pero, hay algo que debes recordar: la realidad es que, hasta donde él sabe, puede que la mayoría de los pacientes sea la que tiene frecuencias cardiacas en los límites considerados normales; pero puede que sea solamente la mitad, mientras la otra mitad permanezca en franca bradicardia (o taquicardia). Claro, este es uno de los casos “extremos”, mas el hecho de que sea algo poco probable no significa que sea imposible. De hecho, nota que en el ejemplo, el intervalo de clase que ostenta mayor frecuencia absoluta (40) es el de 81 a 100 latidos por minuto, o sea, no es precisamente el que contiene a la media.

Veamos otra situación. En estas dos series cuyas medias y medianas coinciden (53). Sin embargo, no podríamos decir que son semejantes, si tomamos en cuenta sus datos:

Serie A: 50, 51, 52, 53, 54, 55, 56

Serie B: 23, 33, 43, 53, 63, 73, 83

Por supuesto que no podemos. En la serie A los datos están más juntos, están más cercanos (distan una unidad entre sí), lo que no ocurre en la serie B, cuyos datos están mucho más alejados entre sí. Si analizas las distancias entre las observaciones y su media, en la serie A la primera y última observaciones están a tres unidades del centro de la serie, mientras que en la otra esas observaciones distan 30 unidades de su media.

Ante una situación parecida, se necesitan otros parámetros acerca de la serie, como aquellos que miden cuán alejadas o agrupadas están las observaciones unas de otras o de la media.

El grado de agrupación o alejamiento de los datos de una serie es lo que recibe el nombre de variabilidad, variación, esparcimiento o dispersión de los datos, la cual puede ser absoluta o relativa. Con el fin de estudiarla, esto es, de conocer hasta qué punto las observaciones están agrupadas o esparcidas, la Estadística nos facilita las medidas de variabilidad, variación, esparcimiento o dispersión, las cuales verás en este epígrafe.

Rango

La amplitud o rango es la más sencilla de las medidas de dispersión. Consiste en la diferencia entre el mayor valor de la serie y el menor, o sea, restar ambos valores. Por ejemplo, la amplitud de los datos de la serie A —vista anteriormente— es de 56 - 50 = 6, y la de la serie B es de 60.

Es muy fácil de determinar. Da una descripción rápida de la variabilidad de un grupo de observaciones. No es muy descriptiva de la misma porque sólo toma en cuenta los valores extremos de la serie, mira el siguiente ejemplo:

Serie A: 150, 160, 170, 180, 190, 200

Serie B: 150, 190, 197, 198, 199, 200

Resulta obvio que ambas tienen la misma amplitud (50), pero salta a la vista que ambas no tienen la misma dispersión. En la primera, los valores se sitúan de forma bastante dispersa entre los extremos; en la segunda la mayoría está cercana al valor mayor de la serie.

La varianza y la desviación estándar

La varianza o variancia se denota por los símbolos S2 ó s2 (letra griega sigma minúscula al cuadrado), su cálculo (para datos simples) se verifica según la fórmula:

donde:

-          Xi son las observaciones de la serie (i = 1,…, n);

-          : media aritmética de la serie;

-          n: total de observaciones.

Esta medida logra describir adecuadamente la dispersión del conjunto de datos, pero tiene un inconveniente: su resultado se expresa en unidades cuadradas, algo harto engorroso y difícil de entender en la mayoría de las situaciones prácticas, y por demás disonante en relación con la medida de tendencia central utilizada. Sería algo así como años cuadrados, o pesos cuadrados.

A fin de eliminar este aparente escollo, puedes hallar la raíz cuadrada positiva del número obtenido, con lo que tendrás de vuelta a las unidades originales, obteniendo así una medida denominada desviación típica o estándar, y es la medida de variación más ampliamente utilizada en el mundo de las estadísticas.

Su símbolo es S (por ser la raíz cuadrada de la varianza), aunque se utiliza también DS (desviación standard) o SD (standard deviation).

Vamos a calcular la desviación estándar de la serie del ejemplo de los pesos (en libras).

150.5, 180.8, 145.3, 127.9, 130.5

 = 147 libras

Xi

(Xi - )2

150.5

12.25

180.8

1142.44

145.3

2.89

127.9

364.81

130.5

272.25

 

1794.64

S2 = 1794.64 ¸ 5 = 358.93 libras2

 

S =  libras

Con el resultado obtenido puedes decir que, en promedio, la mayoría de los datos se desvían de la media en casi 19 libras.

En gran parte de las situaciones del mundo biomédico, y basándose en elementos de la Estadística Inferencial, se puede utilizar la desviación estándar y la media para construir intervalos en los que se mueve la mayor parte de los datos. Por ejemplo,  en el intervalo cuyo extremo inferior sea  – SD y el superior sea  + SD, o sea, [ – SD;  + SD], se encuentra cerca del 68% del total de las observaciones. Si construyes el intervalo con el duplo de la SD: [ – 2·SD;  + 2·SD], entonces ahí estará cerca del 95% de los datos; y si utilizas el triplo de la SD, el intervalo contendrá entonces a más del 99% (99.73%) de las observaciones.

Si los datos están agrupados, el cálculo de la varianza se realiza mediante la fórmula:

 

donde

         MCi: marca de clase de cada IC;

         fi: frecuencia absoluta de cada intervalo de clase;

         : media aritmética de la serie;

         n: total de observaciones.

Los elementos utilizados en el cálculo son los mismos que ya dijimos. El cálculo de la  desviación estándar se limita a extraer la raíz cuadrada del número obtenido arriba.

Calculemos la desviación estándar para el ejemplo de las frecuencias cardiacas (media = 76.3 años).

FC

Pacientes

(MC - )2 fi

21 – 40

1

(30.5 – 76.3)2 = 2097.64

41 – 60

17

(50.5 – 76.3)2 = 11315.88

61 – 80

38

(70.5 – 76.3) 2 = 1278.32

81 – 100

40

(90.5 – 76.3) 2 = 8065.60

101 – 120

4

(110.5 – 76.3) 2 = 4678.56

Total

100

27436.00

S2 = 27 436 ¸ 100 = 274.36

S = 16.5

Esto significa que, en promedio, la mayoría de los pacientes se aleja de la media en 16 latidos por minuto.

Suponiendo que a esta población se le pueden aplicar los porcentajes mencionados, entonces podríamos decir que aproximadamente el 95% de los pacientes tenían una frecuencia cardiaca que oscilaba entre 44 y 109 latidos por minuto.

Si la serie posee valores aberrantes, te viste obligado a utilizar la mediana, por lo que ahora debes sustituir la media por la mediana en la fórmula para calcular la varianza y la desviación típica.

El coeficiente de variación

En muchas ocasiones es necesario comparar la dispersión entre dos o más conjuntos de datos, y sucede que las variables tienen diferentes unidades de medida. Con las medidas de dispersión estudiadas no podrás llegar a una conclusión válida acerca de las desviaciones de los datos. Incluso, aún cuando se trate de una sola unidad de medida, las mediciones pueden variar considerablemente: si comparas la desviación típica de la estatura de los niños de 5-14 años de tu área con la de los estudiantes de preuniversitario, es muy probable que esta última sea mayor que la primera, debido a que las tallas sean mayores per se, y no porque la variabilidad sea mayor precisamente.

Ante casos así es imprescindible contar con una medida de variabilidad relativa, como el coeficiente de variación (CV), que expresa a la desviación típica como porcentaje de la media, y su cálculo se realiza mediante:

Observa que, por tener la desviación estándar y la media las mismas unidades de medida, quedan canceladas dichas unidades, de ahí que el coeficiente de variación no tenga unidades propias, o sea, es adimensional, lo que facilita la comparación.

En el ejemplo siguiente, si comparas las desviaciones estándares de los dos grupos, pudieras creer que ambos tienen igual dispersión:

Grupo 1: media = 60 cm; SD = 4 cm

Grupo 2: media = 170 cm; SD = 4 cm

Sin embargo, si calculas la medida recién conocida, entonces: CV1 = 6.6, CV2 = 2.3. Al contrastarlos, ves algo bien diferente, pues en realidad el grupo 1 tiene casi tres veces más dispersión que el grupo 2.

Bibliografía:

1.Horsford Saing R, Bayarre Vea H. Métodos y técnicas aplicadas a la investigación en Atención Primaria de Salud. La Habana: Ediciones Finlay, 2000.

2. Daniel WW. Bioestadística. Base para el análisis de las ciencias de la salud. 3ª ed. México D.F.:Limusa; 1997.

3. Spiegel MR. Teoría y problemas de Estadística. La Habana:Pueblo y Educación; 1977.

4. Freund J. Estadística elemental moderna. 2ª ed. La Habana:Edición Revolucionaria; 1988.

5. Coolican H. Métodos de investigación y estadística en psicología. México D.F.:El Manual Moderno; 1997

6. Camel F. Estadísticas médicas y de Salud Pública. La Habana:Pueblo y Educación; 1985.

Autoras:

  • Dra. Nelsa María Sagaró del Campo
  • Dra. Meydis María Macías Navarro

Compartir Enviar a menéame  Añadir a tus marcadores de Google  Enviar a noticias Top    Añadir a del.icio.us     Añadir a tus marcadores en Yahoo! 


Publicación enviada por Dra. Nelsa María Sagararó y Dra. Meydis María Macías Navarro
Contactar mailto:nsagaro@medinew.scu.sld.cu


Código ISPN de la Publicación EEFyFllEkAhmAxghQs
Publicado Wednesday 4 de January de 2006

Ultimas Publicaciones en ilustrados.com


ilustrados.com nace con el fin difundir el conocimiento publicando trabajos de investigación, monografias, tesis, presentaciones powerpoint y afines. Publicar trabajos en ilustrados.com ha alcanzado prestigio y reconocimiento internacional siendo cada vez más el número de académicos, empresas, investigadores, científicos que consultan las publicaciones de nuestro portal.


Administración y Finanzas
Agricultura y Ganadería
Anatomía
Antropología
Arqueología y Paleontología
Arquitectura
Arte y Cultura
Astronomía
Biografías
Biología
Ciencia y Tecnología
Computación e Informática
Comunicaciones
Contabilidad
Deportes y Educación Física
Derecho
Derechos Humanos
Ecología
Economía
Educación
Enfermedades
Estadística
Filosofía y Ontología
Física
Geografía
Hardware
Historia
Ingeniería
Internet
Lenguaje y Literatura
Marketing y Publicidad
Mitología
Matemática y Lógica
Música
Nutrición y Ciencias Alimentarias
Política
Programación
Psicología
Química
Recursos Humanos
Redes
Religión
Salud y Medicina
Sistemas Operativos
Sociología
Software
Turismo
Zoología