|
|
Monografias | Ponderación de Referenciales por medio del Análisis de Regresión Logística MúltiplePonderación de Referenciales por medio del Análisis de Regresión Logística MúltipleResumen: Objetivo del metodo. Introduccion al analisis de regresion logistica. Demostracion del metodo para el caso de variables dicotomicas. Aplicación de la correlacion logistica en la ponderacion de los referenciales. La regresion logistica multiple. Índice 1. Objetivo del método
Para la implementación del
Método de Aproximación al Mercado (marketing approach) es necesario la
localización de inmuebles comparables al objeto del avalúo a fin de cumplir el
axioma: "Inmuebles Similares de Venderán en un Mercado Abierto a Precios
Similares".
La fuente principal de Datos
Comparables o Referenciales (en Venezuela) son las Oficinas Subalternas de
Registro Público de la localidad donde se ubique el bien inmueble objeto del
avalúo; sin embargo existen otras fuentes tales como lo son las Notarías, las
Oficinas Municipales de Catastro y la Prensa.
Nos referimos a las Notas
del Registro como la fuente principal de Datos Referenciales ya que los mismos
son "datos ciertos" que cualquier persona puede consultar y
evidenciar, ya que la información es pública y los mismos son certificados por
un funcionario público (Registrador), que además de verificar quienes son los
otorgantes (vendedor y comprador), comprueba la tradición legal del inmueble.
El problema fundamental de
las Notas de Registro, consiste en que una parte significativa de las
operaciones de Compra-Venta protocolizadas, pueden estar sub-valoradas en función
de la evasión fiscal de los otorgantes. Sin embargo, desde hace unos pocos años
esta costumbre de protocolizar por menos del valor, ha disminuido
considerablemente en función de el Nuevo Régimen de Indexación implementado
por el Estado Venezolano para el cálculo del Impuesto Sobre la Renta y la
reciente autonomía de los Registros Públicos.
Ante el hecho anterior,
pareciese que la prensa tiende a generar referenciales o comparables mas
confiables que los que se pudiesen localizar en una Oficina Subalterna de
Registro Público; sin embargo la realidad es otra: En los avisos de prensa,
solo se indica el precio que una de las partes "aspira" por su
inmueble, no indicando el precio definitivo pactado o concertado por "ambas
partes" en la operación de compra-venta.
Por lo tanto, observamos que
ambas fuentes (Registro y Prensa), tienen "fortalezas" y
"debilidades", pudiendo concluir que: "Debería existir una
ponderación entre ambas, de la que resultase una opinión de valor mas afinada
que la de tomar individualmente cada una de ellas".
El objetivo de esta monografía
consiste en presentar una hipótesis sobre el manejo simultáneo de
referenciales provenientes del Registro y de la Prensa mediante la técnica del
Análisis de Regresión Logística Múltiple con la finalidad de verificar la
teoría anterior
2. Introduccion al
analisis de regresion logistica
El análisis de regresión
logística es la técnica para el estudio de la relación entre una o mas
variables independientes (X1, X2,X3....Xn) y una variable dependiente de tipo
dicotómica.
Se define como variable
dicotómica aquella que solo admite dos categorías que definen opciones o
características mutuamente excluyentes u opuestas tales como (Y=SI , Y=NO);
(Y=0 , Y=1), (Y=Encendido , Y=Apagado).
Un modelo de regresión logística
permite estimar o predecir la probabilidad de que un individuo posea una
característica (Y=Registro , Y=Oferta) en función de una determinada o unas
determinadas características individuales (X1=Precio Unitario, X2=Edad, X3=Area
.....Xn).
La diferencia fundamental
entre el modelo de regresión lineal y de regresión logística es que el
primero predice el valor medio de la variable dependiente (Y) a partir de una o
mas variables independientes (X1, X2, X3 ... Xn); mientras que el segundo
permite predecir la proporción de una de las dos categorías de la variable
dependiente dicotómica (Y=SI , Y=NO) en función de una o mas variables
independientes (X1, X2, X3 ... Xn).
La probabilidad, por
definición, solo puede incluir un valor comprendido entre 0 y 1; por lo tanto
hay que desarrollar un modelo matemático que pueda estimar valores de P(Y=1)
dentro del rango real de 0 a 1.
El modelo matemático que
mejor estima tal probabilidad, debido a que restringe los valores a su rango 0
< p
< 1, es el siguiente:
Este modelo comúnmente
presenta una forma de "S", limitada en el eje de las Ordenadas entre
los valores 0 y 1
El modelo antes descrito se
denomina Función Logística.
por la expresión: P(Y=1) .o sea lapSustituyendo probabilidad de
que el Precio Unitario de un Referencial cualesquiera de la serie se corresponda
a un "Valor de Prensa", se obtendrá que la Función Logística vendrá
representada por el modelo No Lineal siguiente:
Este es el momento de
interpretar el significado de esta función en base a la problemática de los
referenciales obtenidos en el Registro y los obtenidos a través de la Prensa:
En teoría los Referenciales
de Prensa y Registro deberían ser muy similares para cumplir con el axioma del
mercado (inmuebles similares se venderán a precios similares). Sin embargo no
siempre sucede así, tal como antes se ha explicado.
P(Y=1) de cada referencial
de la serie obtenida en la Oficina de Registro, se interpretará como la
probabilidad de que el Precio Unitario de cada uno de ellos se equipare con los
Precios Unitarios de la Prensa.
Para el caso de un
referencial de registro, una P(Y=1) = 0.65 indica que, la probabilidad de ese
referencial de Registro en equipararse con la serie de referenciales de Prensa
es del 65%.
El mismo razonamiento es válido
para los referenciales de Prensa, una P(Y=1) = 0.80, indica que el referencial
de Prensa tiene una Probabilidad del 80% de ser equiparado a su propia serie
(como en realidad es).
Para el mismo referencial de
prensa, la Probabilidad Complementaria (Y=0) = 0.20 = 1-P(Y=1) = 1-0.80; indica
que, la probabilidad de un referencial de Prensa en equipararse con la serie de
referenciales de Registro es del 20%.
3. Demostracion del
metodo para el caso de variables dicotomicas
En el siguiente ejemplo se
desarrollará la metodología aquí explicada. Se estudiará un Modelo de
Regresión Logística Simple, o sea una variable dicotómica [ (Y=0) ; (Y=1) ]
dependiente y una variable independiente (X).
Se tiene una serie de
referenciales obtenidos de dos fuentes:
Correspondientes todos a Precios Unitarios de Apartamentos en
Propiedad Horizontal en el casco central de la ciudad de Cumaná, Estado Sucre.
El primer paso, consiste en la Identificación de la Variable
Dicotómica Dependiente: En este caso se asignará como P(Y=1) a los datos
obtenidos de la prensa y se asignará como P(Y=0) a los datos obtenidos de la
Oficina de Registro.
La Unica Variable Independiente del modelo de regresión será
el Precio Unitario de Apartamentos (X), expresado en Bs/M2.
Seguidamente se clasificarán y ordenarán los datos de la
manera siguiente:
Una vez examinado los datos anteriores, hay que destacar lo
siguiente:
La representación gráfica de estas series es la siguiente:
El análisis de Regresión Logística, no es lineal; por lo
tanto hay que utilizar un paquete estadístico dedicado, capaz de resolver este
tipo de correlación no lineal. Para este ejemplo se utilizará el módulo
"Nonlineal Regression", incluído en el software StatGraphics 5.0 para
DOS, sin embargo es posible resolver este tipo de regresiones con otros
programas.
En primer lugar se preparan los datos a enterar al sowftware
estadístico:
VARIABLE
VARIABLE
INDEPENDIENTE
DICOTOMICA
Bs/M2
DEPENDIENTE
(X)
(Y)
160,000
1
190,000
1
200,000
1
210,000
1
210,000
1
220,000
1
190,000
1
100,000
0
110,000
0
110,000
0
130,000
0
140,000
0
160,000
0
130,000
0
Análisis de la Salida del Programa Estadístico:
Las dos salidas anteriores se interpretan de la siguiente
manera:
en
el modelo de Regresión Logística:
se
sustituyen los valores de los parámetros a y b del modelo:
4. Aplicación de la correlación logística en la ponderación
de los referenciales
En el punto anterior, se estudió paso a paso la obtención
del Modelo de Correlación Logística de dos series de referenciales.
En este ejemplo numérico, se aplicará el método estudiado
a fin de obtener en un avalúo real la ponderación entre los referenciales de
la prensa y los referenciales del registro a fin de generar un valor ponderado
en proporción a las dos series de datos.
Se desea obtener el valor de una parcela de terreno de 1,500
M2 en el sector conocido como Los Villarroel, Municipio Autónomo Díaz del Esto
Nueva Esparta.
Clasificación y Orden de los Datos Referenciales:
Corrección por Area:
Corrección por Actualización
Cálculo del Valor Unitario Promedio de cada Serie:
Cálculo de los pesos de cada Serie aplicando la metodología
de Regresión Logística:
Serie Sin Corregir:
Salidas del Paquete Estadístico:
Modelo de Correlación Logística:
Representación Gráfica:
Cálculo de la Ponderación (Registro vs. Prensa)
Seguidamente se procederá a calcular los pesos
proporcionales correspondiente al Promedio Corregido de la serie de
Referenciales de Registro y de la serie de Referenciales de Prensa.
Se calculará la Probabilidad P(Y=1) correspondiente al
Promedio Corregido de la Serie de Referenciales de Prensa:
P(Y=1)
= 0.8854
Se interpretará P(Y=1) = 0.8854, como la Probabilidad
de que el Promedio Corregido de la Serie de Referenciales de Prensa sea
efectivamente un Valor de Prensa; por lo tanto su Probabilidad Complementaria
P(Y=0) será 1 - P(Y=1) = 1 - 0.8854 = 0.1146.
Por lo tanto los Pesos Proporcionales para cada uno de los
Promedios (Referenciales de Registro y Referenciales de Prensa) serán:
Cálculo del Valor del Terreno:
5. La regresion logistica multiple
Toda la teoría vista hasta ahora (Regresión Logística
Simple), aplicada a Dos (2) Variables, una independiente y la otra dependiente y
dicotómica, es válida en el caso de la Regresión Logística Múltiple.
La Regresión Logística Múltiple podrá expresarse de la
siguiente manera:
Este modelo genera una Probabilidad (del 0 al 1) en base a múltiples
variables independientes.
Debido a que una de las variables independientes,
necesariamente debe ser el Precio Unitario y si también se seleccionara la
Variable Independiente Area; se podría presentar problemas de Multicolinealidad
entre esas dos variables, por estar una función de la otra.
En estos casos es obligatorio el uso de la Matriz de
Correlación para determinar si efectivamente las dos variables independientes
estuviesen autocorrelacionadas.
El paquete estadístico, deberá poder generar la Matriz de
Correlación a fin de poder detectar problemas de Multicolinealidad entre las
variables independientes. En caso de que no fuera así, es preferible no enterar
en el modelo la Variable Independiente Area.
Ejemplo de la aplicación del Método:
Se necesita saber el Valor de un Apartamento con un área de
75 M2, tiene 5 años de haberse construído y que está ubicado en la urbanización
Bella Vista de la ciudad de Maracaibo.
Se obtuvieron los siguientes referenciales de apartamentos
con áreas muy similares, tomados de la Oficina Subalterna del 1er. Circuito del
Dtto. Maracaibo y del periódico "Panorama":
Expresado
En Miles De Bolivares
Corrección por Depreciación y Obsolescencia:
PRENSA
Calculo de los Valores Unitarios Promedio Corregidos:
Cálculo de la Ponderación (Registro vs. Prensa)
Seguidamente se procederá a calcular los pesos
proporcionales correspondiente al Promedio Corregido de la serie de
Referenciales de Registro y de la serie de Referenciales de Prensa.
Serie sin Corregir:
Y
= 0 : Registro
Y
= 1 : Prensa
Salidas del Paquete Estadístico:
Análisis de las Salidas del Paquete Estadístico
Donde:
X1: Variable Precio Unitario
X2:
Variable Edad
Se calculará la Probabilidad P(Y=1) correspondiente al
Promedio Corregido de la Serie de Referenciales de Prensa y a la Edad del
Edificio:
P(Y=1)
= 0.99
Se interpretará P(Y=1) = 0.99, como la Probabilidad
de que el Promedio Corregido de la Serie de Referenciales de Prensa sea
efectivamente un Valor de Prensa; por lo tanto su Probabilidad Complementaria
P(Y=0) será 1 - P(Y=1) = 1 - 0.99 = 0.01.
Por lo tanto los Pesos Proporcionales para cada uno de los
Promedios (Referenciales de Registro y Referenciales de Prensa) serán:
En
Miles de Bolívares por M2
Cálculo del Valor del Apartamento:
Representación Gráfica:
6. Bibliografía
Álvarez Cáceres, R., Estadística multivariante y no paramétrica
con SPSS, Madrid, Editorial Díaz Santos,1994.
Carrasco, J. L. y Hernán, M. A., Estadística multivariante
en las ciencias de la vida, Madrid, Editorial Ciencia 3, 1993.
Hosmer, D. W.; TABER, S y
Lemeshow, S., Applied logistic regression, New York, Editorial John Wiley, 1989
Jovell, A. J., Análisis de regresión logística, Madrid,
Ediciones del Centro de Investigaciones Sociológicas, 1995
Kleinbaum, D.G., Logistic
regression. A self-learning text, New York, Editorial Springer-Verlag, 1994
Piol Puppio, R., Herramientas estadísticas básicas, 2da.
parte: Análisis de variables múltiple, Soitave, 1990 - 1997
Autor: Publicación enviada por Ing. Roberto Piol Puppio Contactar mailto:rpiol@yahoo.com Código ISPN de la Publicación EpyAlEZlppidraNMlb Publicado Tuesday 25 de November de 2003 Ultimas Publicaciones en ilustrados.com
ilustrados.com nace con el fin difundir el conocimiento publicando trabajos de investigación, monografias, tesis, presentaciones powerpoint y afines. Publicar trabajos en ilustrados.com ha alcanzado prestigio y reconocimiento internacional siendo cada vez más el número de académicos, empresas, investigadores, científicos que consultan las publicaciones de nuestro portal. | ||||||||||||||||||||||||||||||||||||||||||||