jueves, 28 de enero de 2010

CORRELACIÒN Y REGRESIÒN

CORRELACIÒN

El análisis de correlación simple nos permite obtener relación entre dos conjuntos de puntuaciones.

Para investigar la relación entre dos variables es conveniente considerar:

*Las observaciones que muestran los valores de las variables
*Si se tiene “n” observaciones bidimensionales, cada par de puntos(X, Y) se representa en un sistema de coordenadas rectangulares por un punto como parejas de observaciones se tenga.

El grado de asociación entre dos variables “X” e “Y” podemos describirlos como fuerte, bajo positivo, negativo o moderado; pero estos términos carecen de precisión y objetividad.
El análisis del grado de asociación entre la variable independiente “X” y la variable dependiente “Y” constituye la correlación..

Grupo de técnicas estadísticas empleado para medir la intensidad de la relación (correlación) entre dos variables.



Gráfica que representa la relación entre las dos variables de interés (peso y talla).



COMO TRAZAR UN DIAGRAMA DE DISPERSIÓN


COEFICIENTE DE CORRELACIÒN

El coeficiente de correlación describe la intensidad de la relación entre dos conjuntos de variables de nivel de intervalo o de nivel de razón. Y se le denota con r, con frecuencia se menciona tambien como r de Pearson.




Correlación = Nubes de Puntos

Sea un conjunto de pares de valores de las variables X e Y. Si los representamos en un diagrama de dispersión obtendremos una “nube de puntos” que nos dará una idea gráfica de la posible correlación entre ambas variables.



CALCULO DEL COEFICIENTE DE CORRELACION SIMPLE



Coeficiente de determinación R2



R2 x 100 es el por ciento de la variación total de los datos que es explicada por la línea de regresión.

*Permite establecer numéricamente el ajuste entre las variables.
*R2 cercano a cero significa que “y” no se explica a partir del comportamiento de “x”.
*R2 cercanos o iguales a 1 que y se explica por el comportamiento de “x”.

ANALISIS DE REGRESIÒN

El análisis de regresión sirve para predecir una medida en función de otra medida (o varias).
Y = Variable dependiente predicha explicada
X = Variable independiente predictora explicativa
¿Es posible descubrir una relación?
Y = f(X) + error
f es una función de un tipo determinado el error es aleatorio, pequeño, y no depende de X

Ecuaciòn e regresiòn

Determinar la Ecuación de la Linea de Regresión;
Y = a + bX
Usada para predecir el valor de la Variable Dependiente (Y) basado en los valores de la Variable Independiente (X).



Variable Dependiente (Y): La variable que queremos estimar o predecir.
Variable Independiente (X): La variable que se usa para hacer la predicción o estimación.

Modelo de regresiòn


En el modelo de regresión lineal simple, dado dos variables:
Y (dependiente)
X (independiente, explicativa), buscamos encontrar una función de X muy simple (lineal) que nos permita aproximar Y mediante

Ŷ = b0 + b1X

b0 (ordenada en el origen, constante)
b1 (pendiente de la recta)
Y e Ŷ rara vez coincidirán por muy bueno que sea el modelo de regresión. A la cantidad
e=Y-Ŷ se le denomina residuo o error residual

Error estandsar de estimaciòn

*La media del error es = a cero.
*Si se es pequeño los errores tienden a estar cerca de cero (cerca de la media del error). Entonces, el modelo ajusta bien los datos.
*Por lo tanto, se puede usar se como una medida de la conveniencia de usar un modelo lineal.
*El estimador de se se simboliza como se



El Error Estándar del Estimado mide la dispersión o variabilidad de los datos alrededor de la linea de regresión
Las fórmulas usadas para calcular el Error Estándar son:



Coeficiente de determinación R2

Permite establecer numéricamente el ajuste entre las variables
R2 cercano a cero significa que “y” no se explica a partir del compramiento de “x”
R2 cercanos o iguales a 1 que y se explica por el comportamiento de “x”
Es una medida de la bondad de ajuste del modelo de regresión hallado.



Donde:

SSR representa la suma de cuadrados debido a la regresión y SST representa la suma de cuadrados del total.
El coeficiente de determinación es simplemente el cuadrado del coeficiente de correlación.
El coeficiente de Determinación varía entre 0 y 1.
R2 indica qué porcentaje de la variabilidad de la variable de respuesta Y es explicada por su relación lineal con X.

1 comentario:

  1. No soy boquímica sino arquitecta, y necesito aplicar estos conceptos para estudios urbanos. Creo que ahora ya me han quedado claros. Muchas gracias, Teresa

    ResponderEliminar