|
Categorias
|
Distribucion de frecuencia
Resumen:
Dada
la necesidad de bibliografía para la asignatura Informática Medica II se
concibió este Material de Apoyo a la Docencia cuyo contenido forma parte del
programa analítico de la asignatura. En el mismo se expone el sumario
siguiente: Distribuciones
de frecuencia según el tipo de variable. Concepto
de clase o intervalo. Límite
superior e inferior de clase. Rango,
longitud o amplitud de la clase. Frecuencia
absoluta, relativa y acumulada. Distribuciones
de frecuencia según el tipo de variable A
menudo sucede que, con el objetivo de facilitar el trabajo, el investigador toma
la decisión de agrupar los datos de manera tal que convenga a sus intereses.
Ello se logra mediante la construcción de una escala de clasificación, o
simplemente escala.
Una
escala debe cumplir los siguientes requisitos: -
Ser exhaustiva, o sea, que permita clasificar a todas las unidades de análisis.
-
Las clases o categorías que la integran deben ser mutuamente excluyentes,
esto es, que una unidad de análisis puede estar en una y solo una categoría.
Se
puede construir una escala nominal a cualquier variable (dentro de lo
razonablemente lógico, por supuesto), no importa cual sea la naturaleza de
dicha variable. Claro que, al hacerlo, no puedes pasar por alto algo muy
importante: si estás representando una variable de naturaleza no nominal,
sencillamente estás perdiendo información que pudiera resultarte valiosa; es más,
en realidad no estás midiendo cosa alguna, sólo estás clasificando las
unidades de análisis en categorías o grupos. Mira el siguiente ejemplo: Tabla
1. Distribución de recién nacidos según peso. Hospital “Clodomira
Acosta”. Febrero, 1999.
Fuente:
Registro de nacimientos. Hospital “Clodomira Acosta”.
Aquí
vemos cómo una variable continua, el peso, fue tratada como nominal dicotómica.
Es una forma útil de manejar el dato, ya que permite una rápida evaluación de
la situación, pero adolece de falta de información, pues si necesitases más
datos acerca del peso de esos infantes, no te quedaría más remedio que
remitirte a la fuente. En relación con la utilización cada vez más creciente
de los softwares para el tratamiento estadístico de la información, estamos en
el deber de alertarte ante un error bastante frecuente por desgracia. Se trata
del mal uso de la codificación, un recurso que brindan los paquetes estadísticos,
consistente en la asignación de códigos numéricos a las variables en estudio,
a fin de facilitar su manejo. Por ejemplo, el sexo puede tratarse como 1 para el
femenino y 2 para el masculino (o viceversa), pero esto este tratamiento no le
confiere valor cuantitativo a la variable, puesto que es cualitativa; por ende,
no se le pueden aplicar procedimientos matemáticos propios de variables
cuantitativas.
Otra
forma de manipular tus datos es construyendo una escala ordinal. En esta
situación, estás creando rangos[1] al asignar una posición dentro del grupo
al dato en cuestión. Aquí, los datos de una categoría no son simplemente
diferentes a otros en otra categoría, sino que guardan una relación entre sí,
relaciones que pueden ser «mayor/menor/más complejo que», por mencionar
algunas. Sin embargo, no conoces las distancias entre los elementos (el elemento
A está a 2.4 unidades del B, por ejemplo), sólo te limitas a manejar las
relaciones antedichas. Se
pueden representar datos cuantitativos y ordinales en esta escala, pero nunca
datos nominales. Tiene la ventaja de que brinda mayor información que la escala
nominal. Veamos los datos subsiguientes: Tabla
2. Distribución de recién nacidos según peso al nacer. Hospital Municipal
“Mariano Pérez”, Municipio Bartolomé Masó. Primer trimestre, 1999.
Fuente:
Registro de nacimientos. Hospital “Mariano Pérez”.
Indiscutiblemente,
se cuenta con más información que en el ejemplo anterior. Antes sólo sabías
que la mayor parte de los recién nacidos no tenían un peso considerado
“normal”; ahora sabes que nacieron niños con pesos superiores e inferiores
a los estándares, e incluso no es tan difícil imaginar que algo no anda bien
con la atención materno-infantil, a juzgar por los datos. Pero, si necesitaras
más información por alguna causa, entonces estarías en el mismo lugar que en
el ejemplo precedente. Para
construir una escala de intervalo, se mantendrán las características de
una escala ordinal, sólo que en la presente conoces las distancias entre dos números
de la escala. Ella se caracteriza por una unidad de medida común y constante
que asigna un número real, pero tanto la unidad de medida como el punto cero
son arbitrarios, un ejemplo lo constituye la temperatura, que utiliza dos
escalas (Celsius y Fahrenheit) en las que el punto cero difiere entre sí,
siendo arbitrario en ambos casos.
Si
una escala posee las características antedichas, pero con la diferencia de que
se origine en un cero real, entonces la misma es una escala de razón. La
razón entre dos puntos cualesquiera no depende de la unidad de medida. Escalas
construidas al peso, la talla, u otra variable continua en su clara esencia,
constituyen ejemplos de este tipo de escala. De hecho, muchas de las escalas
consignadas como de intervalo, en realidad son de razón. Otra
forma de manejar las variables cuantitativas[2] es mediante la construcción de escalas
discretas o discontinuas y escalas continuas, guardando consonancia con las
características de las variables de igual nombre. Sólo debes tener en cuenta
que puedes manejar una variable continua en escala continua o discreta, pero una
discreta no puede ser tratada en escala continua. Concepto
de clase o intervalo. La
construcción de escalas cuantitativas de intervalo requiere que la
analicemos con esmero, por ser de mucha utilidad y necesitar ciertos requisitos
adicionales. Ante
todo, debes saber que esta escala de clasificación está compuesta por varias
divisiones ordenadas llamadas intervalos de clase (IC), los cuales están
delimitados por límites de clase, que son los valores mayor y menor que
los enmarcan. Las
escalas pueden ser cerradas o abiertas, en virtud de que todos sus intervalos
posean o no sus límites de clase. Algunos autores denominan semiabiertas o
semicerradas a aquellas escalas que omiten uno de los límites, ya sea el límite
inferior del primer intervalo de clase, o el límite superior del último
intervalo; reservando el término abierto para las escalas que omiten ambos límites.
Para
ilustrar las ideas planteadas, te mostramos una escala cuantitativa de
intervalos abierta y los intervalos utilizados:
Ilustración
1. Escala cuantitativa abierta Los
intervalos pueden o no tener igual amplitud, aunque se prefiere lo primero, ya
que facilita enormemente el trabajo posterior con los datos. Límite
superior e inferior de clase Los
límites de clase superior e inferior son los valores mayor e inferior,
respectivamente, de la clase. Otro
término utilizado es el de límite real (LR). En realidad son dos
límites reales para cada intervalo: el superior (LRS) y el inferior
(LRI), con la particularidad de que el LRS de un intervalo es, a la vez,
el LRI del intervalo siguiente. Si bien los LR no se utilizan para la construcción
de una escala definitiva, son útiles en la determinación de la llamada
amplitud del intervalo y en la construcción de algunos gráficos, como verás
con posterioridad. Se calculan mediante la semisuma[3] de los límites de clase
superior e inferior de intervalos contiguos. Rango,
longitud
o amplitud de la clase. La
amplitud o recorrido (A) de un intervalo de clase es la longitud
de éste. Su cálculo puede hacerse de distintas maneras: 1.
La más utilizada consiste en hallar la diferencia entre los límites reales del
intervalo en cuestión. En el ejemplo anterior, los límites reales del segundo
IC son 14.5 y 19.5, por lo que la amplitud es 5. 2.
Otra forma estriba en hallar la diferencia de los límites de clase del
intervalo de referencia y, luego, adicionarle una unidad al resultado obtenido.
Así, para el segundo IC del ejemplo anterior, A = (19 – 15) + 1 = 5. 3.
Por último, puedes calcular A contando los números enteros que se encuentran
entre los valores límites, incluyendo éstos. Así, para el segundo IC del
ejemplo anterior, la amplitud sería el conteo de 15, 16, 17, 18 y 19, es decir,
A = 5. Obviamente,
los casos 2 y 3 sólo son válidos cuando los límites de las escalas son números
enteros. Por
otra parte, la marca de clase de un IC es el punto medio de dicho
intervalo, que se computa mediante la semisuma de los límites de clase del
intervalo referido. Por ejemplo, la marca de clase del tercer intervalo es MC =
(20 + 24) / 2 = 22. Para
construir una escala con intervalos de clase de igual amplitud, se siguen los
siguientes pasos: 1.
Determina
el recorrido de la serie (R).
Esto lo logras restando el valor mínimo al máximo. 2.
Fija
el número mínimo de intervalos de clase deseado.
Esta decisión va por ti, lo determinarás en dependencia de tus necesidades. No
siempre este es el número definitivo de ICs, ocasionalmente requerirás un IC
adicional. 3.
Calcula
la amplitud (A) de los intervalos.
Para ello, divide el recorrido que obtuviste en el paso 1 por el número que
fijaste en el paso anterior. 4.
Delimita
los límites inferiores (LI) de los intervalos.
Partiendo del valor mínimo de la serie, añádele la amplitud y tendrás el LI
del intervalo siguiente, a este le sumas la amplitud y tendrás el subsiguiente,
y así hasta llegar al último LI de la escala. 5.
Delimita
los límites superiores (LS).
Lo harás sustrayendo una unidad al LI siguiente. En el caso del LS del último
intervalo, lo obtendrás sumándole la amplitud al último LI, y luego restando
al resultado una unidad. 6.
Determina
el recorrido de la serie (R).
Esto lo logras restando el valor mínimo al máximo. 7.
Fija
el número mínimo de intervalos de clase deseado.
Esta decisión va por ti, lo determinarás en dependencia de tus necesidades. No
siempre este es el número definitivo de ICs, ocasionalmente requerirás un IC
adicional. 8.
Calcula
la amplitud (A) de los intervalos.
Para ello, divide el recorrido que obtuviste en el paso 1 por el número que
fijaste en el paso anterior. 9.
Delimita
los límites inferiores (LI) de los intervalos.
Partiendo del valor mínimo de la serie, añádele la amplitud y tendrás el LI
del intervalo siguiente, a este le sumas la amplitud y tendrás el subsiguiente,
y así hasta llegar al último LI de la escala. 10.
Delimita
los límites superiores (LS).
Lo harás sustrayendo una unidad al LI siguiente. En el caso del LS del último
intervalo, lo obtendrás sumándole la amplitud al último LI, y luego restando
al resultado una unidad. Se
sugiere redondear en el paso 3 para convertir la amplitud en un número redondo,
lo que te facilitará la construcción de la escala. Veamos
un ejemplo. Se tiene una lista con los pesos (en libras) de 20 adolescentes, y
deseas agruparlos en una escala cuantitativa con intervalos de igual amplitud.
Para
visualizar mejor el recorrido, comencemos por ordenar los pesos:
El
valor mínimo es 150.00, y el máximo es 174.00, de tal suerte que la escala se
construiría de la siguiente manera: 1.
El recorrido de la serie es R = 174.00 – 150.00 = 24. 2.
Supongamos que deseas como mínimo 4 intervalos de clase. 3.
La amplitud que tendrán los intervalos es A = 24 ¸ 4 = 6. 4.
Límites inferiores: IC
LIs 1.
150 2.
150 + 6 = 156 3.
156 + 6 = 162 4.
162 + 6 = 168 5.
Límites superiores: IC
LIs 1.
156 - 1 = 155 2.
162 - 1 = 161 3.
168 - 1 = 167 4.
174 - 1 = 173 Con
lo que hemos hecho hasta ahora, la escala será 150-155, 156-161, 162-167,
168-173, completando así los cuatro intervalos deseados. Mas, como puedes
comprobar, en los datos existe un valor que supera 173, de ahí que sea
necesario añadir un intervalo de clase al número predicho con el objetivo d
lograr la exhaustividad de la escala: Límite
inferior del quinto IC: 168 + 6 = 174 Límite
superior del último intervalo: 174 + 6 - 1 = 179 Finalmente,
la escala que necesitabas construir es la siguiente:
Observa
que esta escala cumple con los requisitos planteados al inicio de este epígrafe.
En otras partes del curso verás algunos usos específicos de las escalas. Frecuencias
absolutas, relativas y acumuladas En
la mayoría de las situaciones prácticas de la investigación, se hace
imprescindible echar mano a un recurso sumamente útil: la agrupación de las
unidades de análisis en dependencia de su frecuencia de aparición, partiendo
de las escalas de clasificación que ya viste con anterioridad. Supón
que, a petición del delegado del Poder Popular, estás registrando el estado
constructivo de 10 de las casas del área que atiendes, para lo cual te riges
por ciertas reglas que te permiten clasificarlo en bueno, regular y malo.
Redactas un informe con los resultados que obtuviste, y finalmente entregas
esto:
Cuando
el funcionario reciba el solicitado informe, puede que se extrañe un tanto. ¿Por
qué? Mira, no es que esté mal lo que le entregaste, la información se ajusta
a lo pedido, pero hay algo que no facilita las cosas. ¡Claro! ¡La presentación
de los datos! Juzga por ti mismo la diferencia:
Al
resumir la información y exponerla de forma asequible, estás
garantizando —en gran medida— que un lector abrumado por mucho trabajo
dedique un minuto a tu informe, y no lo destine a la gaveta del olvido, entre
otras cosas. Esto
que acabas de hacer, o sea, agrupar los datos por frecuencia de aparición, de
acuerdo con la escala que más se ajusta a tus necesidades, es lo que se
denomina distribución de frecuencias, que es el modo en que se
distribuyen las unidades de análisis entre las clases o categorías que
conforman la escala de clasificación de la variable en cuestión. Las
distribuciones de frecuencias pueden clasificarse en:
Las
dos primeras se utilizan cuando se tratan variables en cualquier escala, en
tanto que las acumuladas se emplean cuando se estudian variables en una escala
cuantitativa o dimensional. La
frecuencia absoluta es el resultado de contar los casos u observaciones
(o sea, el número de observaciones) que corresponden a cada una de las clases o
categorías de la escala de clasificación. La
frecuencia relativa es la importancia o peso relativos que tienen las
unidades de análisis de una categoría o clase sobre el total de las unidades.
Se calcula dividiendo la frecuencia absoluta de la clase en cuestión por el
total de observaciones, en cuyo caso obtendrás una proporción. Si multiplicas
este resultado por 100, obtendrás un porcentaje. Las
frecuencias acumuladas son las frecuencias absolutas o relativas que se
acumulan hasta un intervalo de clase dado. Se calculan sumando las frecuencias
(absolutas o relativas, en dependencia de la que necesites) hasta la clase
deseada. La frecuencia acumulada para el último IC será el total de
observaciones, si se tratare de la frecuencia absoluta acumulada; y si fuera el
caso de la relativa, entonces será 1 ó 100, en dependencia de si usaste
proporción o porcentaje, respectivamente. Ejemplo: En
un estudio sobre riesgos profesionales en los trabajadores de la industria del
cromo en 1995, se encontraron los siguientes datos en una muestra de 897
trabajadores:
Si
observas detenidamente, te podrás dar cuenta que: -
La
suma de las frecuencias absolutas es el total de la muestra o población
estudiada. -
La
suma de las frecuencias relativas es igual a 1 o a 100, en dependencia de que se
trate de una proporción o de un porcentaje. -
En
las frecuencias acumuladas la última clase o categoría de la variable suma el
total, la unidad o el ciento por ciento. Puede
que la suma de los porcentajes no sea 100 exactamente debido a las imprecisiones
de la aproximación, de ahí que se admita hasta 99.9 como total; pero debes
evitar cifras inferiores ya que denotan errores de cálculo. La
elaboración de los datos recogidos, es decir el procesamiento y análisis de
los datos es la etapa final del método estadístico. Una vez recogidos los
datos es necesario elaborarlos, procesarlos, analizarlos e interpretarlos. Bibliografía: 1.
Horsford Saing R, Bayarre Vea H. Métodos y técnicas aplicadas a la investigación
en Atención Primaria de Salud. La Habana: Ediciones Finlay, 2000. 2.
Daniel WW. Bioestadística. Base para el análisis de las ciencias de la salud.
3ª ed. México D.F.:Limusa; 1997. 3.
Spiegel MR. Teoría y problemas de Estadística. La Habana:Pueblo y Educación;
1977. 4.
Freund J. Estadística elemental moderna. 2ª ed. La Habana:Edición
Revolucionaria; 1988. 5.
Coolican H. Métodos de investigación y estadística en psicología. México
D.F.:El Manual Moderno; 1997. Autoras:
Articulos relacionados:
|
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
