lunes, 8 de junio de 2020

TEMA 12: CONCORDANCIA Y CORRELACIÓN


1.     RELACIONES ENTRE VARIABLES Y REGRESIÓN.


El término regresión fue introducido por Galton en su libro “Natural inheritance” (1889) refiriéndose a la “ley de la regresión universal”

·       Cada peculiaridad en un hombre es compartida por sus descendientes, pero en media, en un grado menor


Regresión a la media:

·       Su trabajo se centraba en la descripción de los rasgos físicos de los descendientes (una variable) a partir de los de sus padres (otra variable).
·       Pearson (su amigo) realizó un estudio con más de 1000 registros de grupos familiares observando una relación del tipo:
-      Altura del hijo =85cm + 0,5 altura del padre (aprox)
-      Conclusión: los padres muy altos tienen tendencia a tener hijos que heredan parte de esta altura, aunque tienen tendencia a acercarse (regresar) a la media. Lo mismo puede decirse de los padres muy bajos.
Hoy en día el sentido de regresión es el de predicción de una medida basándonos en el conocimiento de otra.


2.     ESTUDIO CONJUNTO DE DOS VARIABLES.

A la derecha tenemos una posible manera de recoger los datos obtenidos observando dos variables en varios individuos de una muestra.
·       En cada fila tenemos los datos de un individuo.
·       Cada columna representa los valores que toma una variable sobre los mismos.
·       Los individuos no se muestran en ningún orden particular.

Dichas observaciones pueden ser representadas en un diagrama de dispersión (scatterplot). En ellos, cada individuo es un punto cuyas coordenadas son los valores de las variables.
Nuestro objetivo será intentar reconocer a partir del mismo si hay relación entre las variables, de qué tipo, y si es posible predecir el valor de una de ellas en función de la otra.
En el eje X coloco la variable independiente que en este caso es la altura.
En la recta tenemos una correlación positiva y parece que el peso aumenta con la altura
RELACIÓN DIRECTA E INVERSA 

3.   REGRESIÓN LINEAL SIMPLE: CORRELACIÓN Y DETERMINACIÓN.


Se trata de estudiar la asociación lineal entre dos variables cuantitativas.

EJEMPLO: Influencia de la edad en las cifras de Tensión arterial Sistólica

Este ejemplo se trata de una regresión lineal simple: una sola variable independiente que es  la  edad,  esperamos una correlación positiva.

Si hubiese más de una variable independiente (por ejemplo, que no solo influye la edad, sino también el peso) entonces tenemos una regresión lineal múltiple (no vamos a verlo)
Todo parte de la ecuación de la recta: y=ax+b (ej: TAS =a x edad + b)

·      La pendiente de la recta a= B1, cuanto más negativa sea, más decreciente es la recta.
·      Punto de intersección con el eje de coordenadas b = B0.
·      B1 expresa la cantidad de cambio que se produce en la variable dependiente por unidad de cambio de  la variable independiente. Se refiere a cuanto sube la tensión arterial cuando la persona aumenta un  año la edad.
·      B0 expresa cual es el valor de la variable dependiente cuando la independiente vale 0.
Modelos lineales determinista: la variable independiente determine el valor de la variable dependiente. Entonces para cada valor de la variable independiente sólo habría un valor de la dependiente. Yo no puedo decir que una persona cuando tenga 80 años va a tener “x” tensión, aunque el modelo me lo diga.
La recta no es un modelo lineal determinista, es probabilístico: para cada valor de la variable independiente existe una distribución de probabilidad de valores de la dependiente. Con una probabilidad entre 0 y 1.
La recta a determinar es aquella con la menor distancia de cada punto a ella.

Hay dos tipos de coeficientes, se elige uno u otro dependiendo de si las variables siguen una distribución normal:
·      Pearson: paramétrica, por lo que requiere que la distribución siga la normalidad. Si siguen ambas variables una normal cogemos a Pearson
·     
Spearman: no paramétrica, por lo que requiere que se emplee cuando la distribución no siga una normalidad. Si tiene solo una variable que sigue una distribución normal o ninguna.

No hay comentarios:

Publicar un comentario

TEMAS 14 AL 17: VISIÓN GENERAL DE LAS TICS. TICS Y SALUD. CUIDADOS 2.0 La sociedad está cada vez más condicionada por el uso de las...