|
| |
Métodos estadísticos a la solución de problemas técnico-económicos
Resumen: Análisis de los métodos estadísticos a la solución de problemas técnico-económicos que existen cotidianamente en nuestra sociedad. El presente trabajo se ha realizado con el objetivo de poner en práctica los conocimientos adquiridos en la asignatura de estadística ii, en vista a seleccionar problemas existentes en las empresas y otros que se dan en nuestra sociedad. Para darle cumplimiento a estos objetivos hemos utilizados los métodos y técnicas estadísticas ya estudiados, como son: regresión simple, regresión múltiple, método paso a paso, análisis de varianza, diseño de experimento, análisis de series, entre otros.
Publicación enviada por Yuriel Noa Góngora
Índice
Índice
1. Introducción
2. Desarrollo
3. Diseño de experimento
4. Series Cronológicas
5. Conclusiones
6. Bibliografía
1. Introducción
Podemos
decir que en estos tiempos en el entorno empresarial cubano se hacemuy poco uso
y quizás nulo de las técnicas y métodos estadísticos queresultan de vital
importancia en la solución de disímiles problemas que se dana diario en
nuestras empresas, mientras el mundo de la informática sedesarrolla cada vez más
y son muchos los programas que han surgido entre losque se encuentran varios de
análisis estadísticos.
Nuestro trabajo se desarrolló con el fin de conocer la situación del peso
delas gallinas pertenecientes a la Unidad Económica Básica "Frank País"de
Moa en función de la cantidad de pienzo y agua que consumen, así como
lainfluencia de los alimentos que ingerimos a diario y los distintos horarios
deldía en los valores de presión arterial.
2. Desarrollo
Regresión
Lineal Simple Y Múltiple
Problema 1.
En la Unidad Económica Básica "Frank País" de Moa se desea
conocerel peso promedio que alcanzarán las gallinas en el próximo trimestre. A
finalde cada trimestre estas gallinas son distribuidas a la población y se
inicianuevamente el ciclo de crecimiento.
Se conoce la cantidad de pienzo y agua consumida por estas juega un
papeldeterminante en el peso de las mismas.
En el actual trimestre se realizó un estudio donde se obtuvieron los datos
para35 gallinas. (Ver anexo 1). (Los datos recopilados no sonreales).
Análisis
de la Regresión Simple.
Variables:
- Variable
dependiente: Y. Peso de las gallinas en libras (lb.).
- Variable
independiente: X. Cantidad de pienzo consumida en kilogramos (Kg.)
Dócima
de la pendiente.
Planteamiento de las hipótesis:


Si
se acepta H0 : la variable no es significativa.(No existerelación
lineal entre Y y X ).
Si
se rechaza H0 la variable es significativa (Existe relaciónlineal
entre Y y X ).
|
F.
variación
|
S.C
|
G.L
|
C.M
|
F
|
P
|
|
Regresión
|
153,198
|
1
|
153,198
|
90,58
|
0,0000
|
|
Residuos
|
55,815
|
33
|
1,69136
|
|
|
|
Total
|
209,013
|
34
|
|
|
|
El
coeficiente de correlación = 0,856131(las variables se encuentranrelacionadas
linealmente en un 85,6131%).
R2 = 73,2959 (Se ha eliminado un 73,2959 % de los errores con
laregresión).
El error estándar = 1,30052
Como el valor de probabilidad es 0,0000<0,05 se RH0 lo que
quieredecir que el pienzo es determinante en el peso de las gallinas.
La
ecuación determinada para esta estimación es:
Dócima
de la falta de ajuste.
(Elmodelo lineal proporciona un buen ajuste).
(Elmodelo lineal no proporciona un buen ajuste).
El
modelo que mejor ajusta es el Square Root-X
|
F.
variación
|
S.C
|
G.L
|
C.M
|
F
|
P
|
|
F.A
|
36,1583
|
24
|
1,5066
|
0,69
|
0,7771
|
|
E.P
|
19,6567
|
9
|
2,18407
|
|
|
Como
el valor de probabilidad 0,7771>0,10 se AH0 por lo que elmodelo
proporciona un buen ajuste.
Análisis
de la Regresión múltiple:
Variables:
- Variable
dependiente: Y. Peso de las gallinas en libras (lb.).
- Variable
independiente: X1 .cantidad de pienzo consumida en kilogramos
(Kg.).
- Variable
independiente: X2 .cantidad de agua consumida en litros (L.).
Dócima
de la pendiente
|
F.
variación
|
S.C
|
G.L
|
C.M
|
F
|
P
|
|
Regresión
|
177,586
|
2
|
88,7929
|
90,41
|
0,0000
|
|
Residuos
|
31,4272
|
32
|
0,982099
|
|
|
|
Total
|
209,013
|
34
|
|
|
|
R2
= 84,964 %
R2 ajustada =84,0243 %
Error estándar =0,991009
Error medio absoluto = 0,742858
Estadístico de Durbin Watson = 1,76054.
Como la probabilidad es menor que 0,05 entonces se RH0, lo que
indicaque algunas de estas variables son útiles para hacer estimaciones del
peso delas gallinas (Y).
Método
paso a paso.(paso alante )
Con este método podemos determinar cuáles variables del modelo
sonsignificativas.
Estadígrafo para entrar = 4,14911
Estadígrafo para remover = 4,14911
En el paso número cero tenemos cero variables en el modelo con 34 G.L para
elerror y un coeficiente de determinación de 0,00 %.
En el paso número uno adicionamos la variable X1 con un estadígrafopara
entrar de 87,4949 y como este valor es mayor que 4,14911 esta variablequeda en
el modelo con 33 G.L para el error y un coeficiente de determinaciónde 72,61 %.
En el paso número dos adicionamos la variable X2 con un estadígrafopara
entrar de 26,2859 y como este valor es mayor que 4,14911 esta variablequeda en
el modelo con 32 G.L para el error y un coeficiente de determinaciónde 84,96 %.
Como podemos observar, tanto el pienzo como el agua que consumen las gallinasson
significativas en el peso de las mismas.
El
modelo tiene la siguiente ecuación:
Verificación
de supuestos:
Normalidad:
Si aproximadamente el 95 % de los residuos están en el intervalo de
,
entonces no hay razón para rechazar el supuesto de normalidad.


El
intervalo es (-1,982018; 1,982018)
Se cumple el supuesto de normalidad ya que el 94,29 % de los errores
aleatoriosse encuentran dentro del intervalo indicado.
Homocedasticidad:
(Hay Homocedasticidad)
Algún
difiere
(No hay Homocedasticidad)
n =35
c = 3
p =3
S.C Residual G.1 = 22, 2067
S.C Residual G.2 = 24,306

F
= 1, 0945345


1,0945345<2,57693
Se
acepta H0 por lo que se cumple el supuesto de Homocedasticidad.
No autocorrelación:
(No hay autocorrelación).
(Hay autocorrelación)
n
=35


dl =1,343
dv =1,584
RH0 AH0 RH0
0 1,343 1,584 2,416 2,657 4
d =1,76054. Se encuentra
en la región de aceptación por lo que se cumple este supuesto.
No multicolinialidad:
(No hay multicolinialidad)
(Si hay multicolinialidad)
R.C:
R.C:


> 4,13927
Se
RH0 por lo no se cumple el supuesto de no multicolinialidad.
Haciendo un pronóstico del peso que debería alcanzar una gallina para
unconsumo de pienzo de 10,6 Kg. y 9 L de agua obtuvimos un valor de 10,5669 con
unerror estándar 1,04204.
3. Diseño de experimento
Problema
2.
En un estudio realizado por el ministerio de salud pública se obtuvo que
lamayor parte de la población cubana que padece de Hipertensión Arterial
seconcentra en las provincias orientales. Según criterios médicos una de
lascausas fundamentales de tal enfermedad es el régimen alimenticio que llevan
laspersonas. Se pudo observar además que los alimentos que se consumen no
provocanel mismo efecto en la presión para los distintos horarios del día.
Es interés de todos conocer cuáles son los alimento que podemos consumir
enmayor o menor medida, los horarios en que son menores y mayores los valores
detensión arterial, así como la mejor y la peor combinación de estos
factores.
Para darle respuestas a estas interrogantes se tomaron muestras de valores
depresión por 6 días en diferentes horarios del día de una persona. (Ver
anexo2).
Análisis
de varianza para datos tipo III
|
F.
variación
|
S.C
|
G.L
|
C.M
|
F
|
P
|
|
P.
Efectos
|
|
|
|
|
|
|
A:
Factor A.
|
1733,33
|
2
|
866,667
|
39,00
|
0,0024
|
|
B:
Factor H.
|
1200,0
|
2
|
600
|
27,00
|
0,0048
|
|
C:
Réplic.
|
5,55556
|
1
|
5,55556
|
0,25
|
0,6433
|
|
Interacción
|
|
|
|
|
|
|
AB
|
266,667
|
4
|
66,6667
|
3,00
|
0,1562
|
|
AC
|
311,111
|
2
|
155,556
|
7,00
|
0,0494
|
|
BC
|
44,4444
|
2
|
22,2222
|
1,00
|
0,4444
|
|
Residuos
|
88,8889
|
4
|
22,2222
|
|
|
|
Total
|
3650,0
|
17
|
|
|
|
Analizando
el P-value del factor A. se obtuvo que para
serechaza
H0 lo que significa que hay diferencias significativas entrelos
alimentos que se consumen, por lo que la variable es significativa en
lainestabilidad de la presión.
Haciendo el mismo análisis para el factor H. se obtuvo que para
serechaza
H0 lo que significa que hay diferencias significativas entrelos
horarios del día en que se toma la presión, por lo que la variable
essignificativa en la inestabilidad de la presión.
Haciendo el análisis para las réplicas se obtuvo que para
seacepta
H0 lo que significa que la variable no es significativa en
lainestabilidad de la presión.
En las interacciones tenemos que solo es significativa la interacción delfactor
A con las réplicas.
Para obtener en cuáles horarios y en cuáles alimentos están estas
diferenciassignificativas se uso del método de Duncan obteniéndose:
Pruebas de rangos múltiples para los datos por el Factor A.
|
Método
de Duncan con 95 %
|
|
Factor
A.
|
Conteo
|
Media
LS
|
Grupos
Homogéneos
|
|
Verduras
Harina
Sal
|
6
6
6
|
118,333
135,0
141,667
|
X
X
X
|
|
Contraste
Diferencia
|
|
Harina-sal
Harina-verduras
Sal-verduras
|
-6,66667
*16,6667
*23,3333
|
De
aquí se deduce que existe homogeneidad entre los alimentos harina y sal
yexisten diferencias significativas entre harina-verduras y sal-verduras.
Pruebas
de rangos múltiples para los datos por el Factor H.
|
Método
de Duncan con 95 %
|
|
Factor
H.
|
Conteo
|
Media
LS
|
Grupos
Homogéneos
|
|
Meridiano
Noche
mañana
|
6
6
6
|
121,667
131,667
141,667
|
X
X
X
|
|
Contraste
Diferencia
|
|
Mañana-meridiano
Mañana-noche
Meridiano-noche
|
*20,0
*10,0
*-10,0
|
De
aquí se obtiene que existen diferencias significativas entre los treshorarios.
Para el Factor A.
Chequeo de varianza.
Prueba C. de Cochran`s: 0,565217 P-value = 0,279372
Prueba de Bartlett`s: 1,15598 P-value = 0,368475
En la prueba de Cochran`s P-value > 0,05
En la prueba de Bartlett`s P-value > 0,05
Se cumple el supuesto de igualdad de varianza.
Para
el Factor H.
Chequeo de varianza
Prueba C. de Cochran`s: 0,442177 P-value = 0,749976
Prueba de Bartlett`s: 1,17879 P-value = 0,322074
En la prueba de Cochran`s P-value > 0,05
En la prueba de Bartlett`s P-value > 0,05
Se cumple el supuesto de igualdad de varianza.
Para
el Factor Combi.
Pruebas de rangos múltiples para los datos por el Facto Combi.
|
Método
de Duncan con 95 %
|
|
Factor
Combi.
|
Conteo
|
Media
|
Grupos
Homogéneos
|
|
8
9
7
5
2
6
3
4
1
|
2
2
2
2
2
2
2
2
2
|
115,0
115,0
125,0
125,0
125,0
135,0
145,0
145,0
155,0
|
X
X
XX
XX
XX
XX
XX
XX
X
|
Con
el experimento anterior llegamos a la conclusión de que los alimentosque
debemos consumir en mayor proporción son las verduras y los que menosdebemos
consumir son aquellos que contengan alto contenido de sal. El horariodel día en
que la presión alcanza menores valores es el meridiano y mayoresvalores por la
mañana. La mejor combinación es verduras-meridiano y la peorsal-mañana.
4. Series Cronológicas
Analizando
el problema anterior pero con datos correspondientes a cuatrosemanas se desea
analizar el comportamiento de la presión en cada semana asípodría comportarse
en los próximos días. (Ver anexo 3).
- Serie
de tendencia constante estacional con período 7.
Tt = B0
Media: 139,6429 Varianza: 153,4439 Modelo híbrido.
- Estimación
y chequeo.

B0 =139,643 p = 7 n = 28
E (1) =1,074 E (2) = 0,967 E (3) = 1,074 E (4) = 0,967
E (5) = 0,859 E (6) = 0,985 E (7) = 1,074
Varianza: 63,7500 Desv. Típica: 7,9844
- Diseño
de pronóstico.
Horizonte
(K): 2 N = 28 m = 28 n = 14

Función de pronóstico:

E
(1) = 1,060 E (2) = 0,971 E (3) = 1,065 E (4) = 0,975
E (5) = 0,851 E (6) = 0,953 E (7) = 1,094
Media
de los errores: - 5,361
Suma de cuadrados: 980,298 Cuadrado Medio: 75,405
Raíz del Cuadrado Medio: 8,683752
Cálculo
del intervalo de confianza para un nivel de confianza de 95 %.
Pronóstico para T = 30: 132,7373
Intervalo de confianza para el pronóstico (115,09; 150,38)
Desviación Estándar (1,25 DAP):9,0026
Valor del DAP: 7,20
Coeficiente de alisamiento del DPA: 0,250
5. Conclusiones
Consideramos
que en dicho trabajo hemos cumplido con los objetivos propuestosdebido a que se
puso en práctica los conocimientos adquiridos en clases, con laaplicación de métodos
estadísticos en la resolución de problemas, con el usode paquetes de programas
profesionales. Obtuvimos como resultados que en el pesode las gallinas juega un
papel importante la cantidad de pienzo y aguaconsumida; que los alimentos que
ingerimos a diario, los diferentes horarios deldía y la combinación de estos
factores influyen significativamente en losvalores de presión arterial.
Recomendaciones
Exhortamos que se continúen realizando estos trabajos investigativos debido
aque nos permite elevar nuestros conocimientos y llevarlos a la práctica,logrando
formar profesionales más integrales, los cuales en futuro puedenrescatar
aquellas técnicas estadísticas que se han perdido.
Recomendamos además que la hora de seleccionar los alimentos a ingerir
tengamospresentes, cuáles son aquellos más beneficiosos y los que resulten másperjudiciales;
que preferentemente predominen en nuestras mesas las verduras yque en aquellos
horarios tiende a alcanzar mayores valores evitemos consumiralimento que
contribuyen a elevar la misma.
6. Bibliografía
- García
Francis, Ramón y Coautores: Problemas Resueltos y Propuestos de Estadística
Matemática II. Editorial Pueblo y Educación. La Habana, 1986.
- Guyon
Dalmau, Luis y Coautores: Estadística Matemática II. Ediciones Avenida del
Bosque Nr. 168. La Habana, 1986 (Dos tomos).
- López
Planes, Reinaldo: Diseño Estadístico de experimento.
- Probabilidades
y Estadística para Ingenieros. Segunda parte. Cuarta Edición
Anexo
1.
Datos
del problema 1.
|
N.
|
Y
(Peso
en lb.)
|
X1
(Cant.
Pienzo en Kg.)
|
X2
(Cant.
Agua en L.)
|
|
1
|
5
|
8
|
6
|
|
2
|
8
|
9,5
|
7,4
|
|
3
|
10
|
11
|
8,4
|
|
4
|
9
|
10
|
7,9
|
|
5
|
12
|
13
|
8
|
|
6
|
5,6
|
8,5
|
7
|
|
7
|
7,3
|
8
|
8
|
|
8
|
6,2
|
7
|
6
|
|
9
|
5,5
|
9
|
4
|
|
10
|
3
|
6
|
5
|
|
11
|
8,5
|
7
|
7
|
|
12
|
7
|
6,5
|
6
|
|
13
|
4
|
6,2
|
5
|
|
14
|
4,5
|
7
|
5,6
|
|
15
|
| |