Monografias | Medidas de DispersiónMedidas de DispersiónResumen: Dada la necesidad de bibliografía para la asignatura Informática Medica II se concibió este Material de Apoyo a la Docencia cuyo contenido forma parte del programa analítico de la asignatura. En el mismo se expone el sumario siguiente: Medidas de dispersión (rango (R), Varianza (S2), desviación estándar (s), coeficiente de variación). Características, propiedades y cálculo. Resumen
Dada
la necesidad de bibliografía para la asignatura Informática Medica II se
concibió este Material de Apoyo a la Docencia cuyo contenido forma parte del
programa analítico de la asignatura. En el mismo se expone el sumario
siguiente: Medidas de dispersión (rango (R), Varianza (S2),
desviación estándar (s), coeficiente de variación). Características,
propiedades y cálculo. Medidas
de dispersión Podría
parecer que las medidas de tendencia central son suficientes para resumir y
describir los conjuntos de los cuales proceden, sin embargo, múltiples
circunstancias exigen la descripción de otros rasgos de los datos existentes.
Verás por qué planteamos esto. Por
ejemplo, si un médico a cargo de la sala realiza el siguiente análisis: «tomando
en cuenta la FC media, no tengo motivos para preocuparme por la salud de los
pacientes, pues, en general, ostentan cifras dentro de límites normales; por
ende, tenemos que encaminar nuestros esfuerzos hacia otros problemas». En
principio, no está nada mal, ya que interpretó correctamente el indicador.
Pero, hay algo que debes recordar: la realidad es que, hasta donde él sabe,
puede que la mayoría de los pacientes sea la que tiene frecuencias cardiacas en
los límites considerados normales; pero puede que sea solamente la mitad,
mientras la otra mitad permanezca en franca bradicardia (o taquicardia). Claro,
este es uno de los casos “extremos”, mas el hecho de que sea algo poco
probable no significa que sea imposible. De hecho, nota que en el ejemplo, el
intervalo de clase que ostenta mayor frecuencia absoluta (40) es el de 81 a 100
latidos por minuto, o sea, no es precisamente el que contiene a la media. Veamos
otra situación. En estas dos series cuyas medias y medianas coinciden (53). Sin
embargo, no podríamos decir que son semejantes, si tomamos en cuenta sus datos: Serie A: 50, 51, 52,
53, 54, 55, 56 Serie
B: 23, 33, 43, 53, 63, 73, 83 Por
supuesto que no podemos. En la serie A los datos están más juntos, están más
cercanos (distan una unidad entre sí), lo que no ocurre en la serie B, cuyos
datos están mucho más alejados entre sí. Si analizas las distancias entre las
observaciones y su media, en la serie A la primera y última observaciones están
a tres unidades del centro de la serie, mientras que en la otra esas
observaciones distan 30 unidades de su media. Ante
una situación parecida, se necesitan otros parámetros acerca de la serie, como
aquellos que miden cuán alejadas o agrupadas están las observaciones unas de
otras o de la media. El
grado de agrupación o alejamiento de los datos de una serie es lo que recibe el
nombre de variabilidad, variación, esparcimiento o dispersión de los datos, la
cual puede ser absoluta o relativa. Con el fin de estudiarla, esto es, de
conocer hasta qué punto las observaciones están agrupadas o esparcidas, la
Estadística nos facilita las medidas de variabilidad, variación, esparcimiento
o dispersión, las cuales verás en este epígrafe. La
amplitud o rango es la más sencilla de las
medidas de dispersión. Consiste en la diferencia entre el mayor valor de la
serie y el menor, o sea, restar ambos valores. Por ejemplo, la amplitud de los
datos de la serie A —vista anteriormente— es de 56 - 50 = 6, y la de la
serie B es de 60. Es
muy fácil de determinar. Da una descripción rápida de la variabilidad de un
grupo de observaciones. No es muy descriptiva de la misma porque sólo toma en
cuenta los valores extremos de la serie, mira el siguiente ejemplo: Serie A: 150, 160,
170, 180, 190, 200 Serie
B: 150, 190, 197, 198, 199, 200 Resulta
obvio que ambas tienen la misma amplitud (50), pero salta a la vista que ambas
no tienen la misma dispersión. En la primera, los valores se sitúan de forma
bastante dispersa entre los extremos; en la segunda la mayoría está cercana al
valor mayor de la serie. La
varianza o variancia se denota por los símbolos S2 ó s2
(letra griega sigma minúscula al cuadrado), su cálculo (para datos simples) se
verifica según la fórmula: donde: -
Xi son las observaciones de la serie (i
= 1,…, n); -
-
n: total de observaciones. Esta
medida logra describir adecuadamente la dispersión del conjunto de datos, pero
tiene un inconveniente: su resultado se expresa en unidades cuadradas, algo
harto engorroso y difícil de entender en la mayoría de las situaciones prácticas,
y por demás disonante en relación con la medida de tendencia central
utilizada. Sería algo así como años cuadrados, o pesos cuadrados. A
fin de eliminar este aparente escollo, puedes hallar la raíz cuadrada positiva
del número obtenido, con lo que tendrás de vuelta a las unidades originales,
obteniendo así una medida denominada desviación típica o estándar, y es la
medida de variación más ampliamente utilizada en el mundo de las estadísticas.
Su
símbolo es S (por ser la raíz cuadrada de la varianza), aunque se utiliza
también DS (desviación standard) o SD (standard deviation). Vamos
a calcular la desviación estándar de la serie del ejemplo de los pesos (en
libras). 150.5,
180.8, 145.3, 127.9, 130.5
Xi (Xi -
150.5 12.25 180.8 1142.44 145.3 2.89 127.9 364.81 130.5 272.25 1794.64 S2 = 1794.64 ¸
5 = 358.93 libras2 S =
Con
el resultado obtenido puedes decir que, en promedio, la mayoría de los datos se
desvían de la media en casi 19 libras. En
gran parte de las situaciones del mundo biomédico, y basándose en elementos de
la Estadística Inferencial, se puede utilizar la desviación estándar y la
media para construir intervalos en los que se mueve la mayor parte de los datos.
Por ejemplo, en el intervalo cuyo extremo inferior sea
Si
los datos están agrupados, el cálculo de la varianza se realiza mediante la fórmula:
donde –
MCi: marca de clase de cada IC; –
fi: frecuencia absoluta de cada
intervalo de clase; –
–
n: total de observaciones. Los
elementos utilizados en el cálculo son los mismos que ya dijimos. El cálculo
de la desviación estándar se
limita a extraer la raíz cuadrada del número obtenido arriba. Calculemos
la desviación estándar para el ejemplo de las frecuencias cardiacas (media =
76.3 años). FC Pacientes (MC
-
21 –
40 1 (30.5
– 76.3)2 = 2097.64 41 –
60 17 (50.5
– 76.3)2 = 11315.88 61 –
80 38 (70.5
– 76.3) 2 = 1278.32 81 –
100 40 (90.5
– 76.3) 2 = 8065.60 101 –
120 4 (110.5
– 76.3) 2 = 4678.56 Total 100 27436.00 S2 = 27 436 ¸
100 = 274.36 S = 16.5 Esto
significa que, en promedio, la mayoría de los pacientes se aleja de la media en
16 latidos por minuto. Suponiendo
que a esta población se le pueden aplicar los porcentajes mencionados, entonces
podríamos decir que aproximadamente el 95% de los pacientes tenían una
frecuencia cardiaca que oscilaba entre 44 y 109 latidos por minuto. Si
la serie posee valores aberrantes, te viste obligado a utilizar la mediana, por
lo que ahora debes sustituir la media por la mediana en la fórmula para
calcular la varianza y la desviación típica. En
muchas ocasiones es necesario comparar la dispersión entre dos o más conjuntos
de datos, y sucede que las variables tienen diferentes unidades de medida. Con
las medidas de dispersión estudiadas no podrás llegar a una conclusión válida
acerca de las desviaciones de los datos. Incluso, aún cuando se trate de una
sola unidad de medida, las mediciones pueden variar considerablemente: si
comparas la desviación típica de la estatura de los niños de 5-14 años de tu
área con la de los estudiantes de preuniversitario, es muy probable que esta última
sea mayor que la primera, debido a que las tallas sean mayores per se, y no
porque la variabilidad sea mayor precisamente. Ante
casos así es imprescindible contar con una medida de variabilidad relativa,
como el coeficiente de variación (CV), que expresa a la desviación típica
como porcentaje de la media, y su cálculo se realiza mediante:
Observa
que, por tener la desviación estándar y la media las mismas unidades de
medida, quedan canceladas dichas unidades, de ahí que el coeficiente de variación
no tenga unidades propias, o sea, es adimensional, lo que facilita la comparación. En
el ejemplo siguiente, si comparas las desviaciones estándares de los dos
grupos, pudieras creer que ambos tienen igual dispersión: Grupo 1: media
= 60 cm; SD = 4 cm Grupo 2: media
= 170 cm; SD = 4 cm Sin
embargo, si calculas la medida recién conocida, entonces: CV1 = 6.6, CV2 = 2.3.
Al contrastarlos, ves algo bien diferente, pues en realidad el grupo 1 tiene
casi tres veces más dispersión que el grupo 2. Bibliografía: 1.Horsford
Saing R, Bayarre Vea H. Métodos y técnicas aplicadas a la investigación en
Atención Primaria de Salud. La Habana: Ediciones Finlay, 2000. 2. Daniel WW.
Bioestadística. Base para el análisis de las ciencias de la salud. 3ª ed. México
D.F.:Limusa; 1997. 3. Spiegel MR.
Teoría y problemas de Estadística. La Habana:Pueblo y Educación; 1977. 4. Freund J.
Estadística elemental moderna. 2ª ed. La Habana:Edición Revolucionaria; 1988.
5. Coolican H. Métodos
de investigación y estadística en psicología. México D.F.:El Manual Moderno;
1997 6. Camel F.
Estadísticas médicas y de Salud Pública. La Habana:Pueblo y Educación; 1985.
Autoras:
Publicación enviada por Dra. Nelsa María Sagararó y Dra. Meydis María Macías Navarro Contactar mailto:nsagaro@medinew.scu.sld.cu Código ISPN de la Publicación EEFyFllEkAhmAxghQs Publicado Wednesday 4 de January de 2006 Ultimas Publicaciones en ilustrados.com
ilustrados.com nace con el fin difundir el conocimiento publicando trabajos de investigación, monografias, tesis, presentaciones powerpoint y afines. Publicar trabajos en ilustrados.com ha alcanzado prestigio y reconocimiento internacional siendo cada vez más el número de académicos, empresas, investigadores, científicos que consultan las publicaciones de nuestro portal. | ||||||||||||||||||||||||||||||||||||||||||||