Variable cualitativa:
1. Nominal: estado civil → soltero, casado, separado, divorciado y viudo.
2. Ordinal: (no numéricas que admite orden) → La nota en un examen: suspenso, aprobado, notable, sobresaliente.
Variable cuantitativa
1. Discreta ↔ número de hermanos
2. Continua (decimales) → altura
Recta de regresión: Si la correlación es nula, r = 0, las rectas de regresión son perpendiculares entre sí
De Y sobre X: se utiliza para estimar los valores de la Y a partir de los de la X.
La pendiente de la recta es el cociente entre la covarianza y la varianza de la variable X.
De X sobre Y: se utiliza para estimar los valores de la X a partir de los de la Y.
COVARIANZA (Sxy): indica el sentido de la correlación entre las variables
Si σxy > 0 la correlación es directa.
Si σxy <> 0 la correlación es inversa.
La covarianza presenta como inconveniente, el hecho de que su valor depende de la escala elegida para los ejes.
CORRELACIÓN: trata de establecer la relación o dependencia que existe entre las dos variables que intervienen en una distribución bidimensional.
Es decir, determinar si los cambios en una de las variables influyen en los cambios de la otra. En caso de que suceda, diremos que las variables están correlacionadas o que hay correlación entre ellas.
1º Correlación directa: se da cuando al aumentar una de las variables la otra aumenta. La recta correspondiente a la nube de puntos de la distribución es una recta creciente.
2º Correlación inversa: se da cuando al aumentar una de las variables la otra disminuye. La recta correspondiente a la nube de puntos de la distribución es una recta decreciente.
3º Correlación nula. Cuando no hay dependencia de ningún tipo entre las variables. En este caso se dice que las variables son incorreladas y la nube de puntos tiene una forma redondeada.
Grado de correlación: indica la proximidad que hay entre los puntos de la nube de puntos. Fuerte, débil, nulo
COEFICIENTE DE CORRELACIÓN LINEAL(R): es el cociente entre la covarianza y el producto de las desviaciones típicas
Propiedades
1. El coeficiente de correlación no varía al hacerlo la escala de medición. Es decir, si expresamos la altura en metros o en centímetros el coeficiente de correlación no varía.
2. El signo del coeficiente de correlación es el mismo que el de la covarianza.
Si la covarianza es positiva, la correlación es directa.
Si la covarianza es negativa, la correlación es inversa.
Si la covarianza es nula, no existe correlación.
3. El coeficiente de correlación lineal es un número real comprendido entre −1 y 1. −1 ≤ r ≤ 1
4. Si el coeficiente de correlación lineal toma valores cercanos a −1 la correlación es fuerte e inversa, y será tanto más fuerte cuanto más se aproxime r a −1.
5. Si el coeficiente de correlación lineal toma valores cercanos a 1 la correlación es fuerte y directa, y será tanto más fuerte cuanto más se aproxime r a 1.
6. Si el coeficiente de correlación lineal toma valores cercanos a 0, la correlación es débil.
7. Si r = 1 ó −1, los puntos de la nube están sobre la recta creciente o decreciente. Entre ambas variables hay dependencia funcional.
EL ERROR MÁXIMO DE ESTIMACIÓN:
Cuanto mayor sea el tamaño de la muestra, n, menor es el error.Cuanto mayor sea el nivel de confianza, 1-α, mayor es el error
TAMAÑO DE LA MUESTRA:
Si aumentamos el nivel de confianza, aumenta el tamaño de la muestra.Si disminuimos el error, tenemos que aumentar el tamaño de la muestra.
Hipótesis estadísticas: extraer conclusiones que permitan aceptar o rechazar una hipótesis previamente emitida sobre el valor de un parámetro desconocido de una población.
H0 = hipótesis emitida o hipótesis nula
H1= hipótesis contraria o
Contrastes de hipótesis
1. Enunciar la hipótesis nula H0 y la alternativa H1.
Bilateral H0=k H1 ≠ k Unilateral H0≥ k H1 <>H0 ≤k H1> k
2. A partir de un nivel de confianza 1 − α o el de significación α. Determinar:
El valor zα/2 (bilaterales), o bien zα (unilaterales)
La zona de aceptación del parámetro μ o p.
3. Calcular: x o p’, a partir de la muestra.
4. Si el valor del parámetro muestral está dentro de la zona de la aceptación, se acepta la hipótesis con un nivel de significación α. Si no, se rechaza.
Contraste Bilateral
Se presenta cuando la hipótesis nula es del tipo H0: μ = k (o bien H0: p = k) y la hipótesis alternativa, por tanto, es del tipo H1: μ≠ k (o bien H1: p≠ k).
El nivel de significación α se concentra en dos partes (o colas) simétricas respecto de la media.
Errores de tipo I y tipo II
Error de tipo I. Se comete cuando la hipótesis nula es verdadera y, como consecuencia del contraste, se rechaza.
Error de tipo II. Se comete cuando la hipótesis nula es falsa y, como consecuencia del contraste se acepta.
H0 Verdadera Falsa Aceptar Decisión correcta
Probabilidad = 1 – α Decisión incorrecta:
ERROR DE TIPO IIRechazar ERROR DE TIPO I
Probabilidad = α
Decisión correcta
La probabilidad de cometer Error de tipo I es el nivel de significación α. La probabilidad de cometer Error de tipo II depende del verdadero valor del parámetro. Se hace tanto menor cuanto mayor sea n.
Intervalos característicos
El nivel de confianza (p) se designa mediante 1 – α.
El nivel de significación se designa mediante α.
El valor crítico (k) como z α/2 .
P(Z>z α/2 ) = α/2 P[-z α/2 < z α/2 ] = 1- α
En una distribución N(μ, σ ) el intervalo característico correspondiente a una probabilidad p = 1 – α es:
(μ – z α/2 · σ , μ + z α/2 · σ )
1 – α | α/2 | z α/2 | Intervalos característicos |
---|---|---|---|
0.90 | 0.05 | 1.645 | (μ – 1.645 · σ , μ + 1.645 · σ) |
0.95 | 0.025 | 1.96 | (μ – 1.96 · σ , μ + 1.96 · σ ) |
0.99 | 0.005 | 2.575 | (μ – 2.575 · σ , μ + 2.575 · σ ) |
Contrastes de hipótesis
1. Enunciar la hipótesis nula H0 y la alternativa H1.
Bilateral | H0=k | H1 ≠ k |
---|---|---|
Unilateral | H0≥ k | H1 <> |
H0 ≤k | H1> k |
2. A partir de un nivel de confianza 1 – α o el de significación α. Determinar:
El valor z α/2 (bilaterales), o bien z α (unilaterales)
La zona de aceptación del parámetro muestral (x o p’).
3. Calcular: x o p’, a partir de la muestra.
4. Si el valor del parámetro muestral está dentro de la zona de la aceptación, se acepta la hipótesis con un nivel de significación α. Si no, se rechaza.
Contraste Bilateral
Se presenta cuando la hipótesis nula es del tipo H0: μ = k (o bien H0: p = k) y la hipótesis alternativa, por tanto, es del tipo H1: μ≠ k (o bien H1: p≠ k).
El nivel de significación α se concentra en dos partes (o colas) simétricas respecto de la media.
Errores de tipo I y tipo II
Error de tipo I. Se comete cuando la hipótesis nula es verdadera y, como consecuencia del contraste, se rechaza.
Error de tipo II. Se comete cuando la hipótesis nula es falsa y, como consecuencia del contraste se acepta.
H0 Verdadera Falsa Aceptar Decisión correcta
Probabilidad = 1 – α Decisión incorrecta:
ERROR DE TIPO IIRechazar ERROR DE TIPO I
Probabilidad = α
Decisión correcta
La probabilidad de cometer Error de tipo I es el nivel de significación α. La probabilidad de cometer Error de tipo II depende del verdadero valor del parámetro. Se hace tanto menor cuanto mayor sea n.
Intervalos característicos
El nivel de confianza (p) se designa mediante 1 – α.
El nivel de significación se designa mediante α.
El valor crítico (k) como z α/2 .
P(Z>z α/2 ) = α/2 P[-z α/2 < z α/2 ] = 1- α
En una distribución N(μ, σ ) el intervalo característico correspondiente a una probabilidad p = 1 – α es:
(μ – z α/2 · σ , μ + z α/2 · σ )