Estadística: Variables, Distribuciones, Muestreo e Inferencia

Variables Aleatorias Discretas y Continuas

Variables Aleatorias Discretas (Binomial o Poisson)

Importante: En variables discretas, sí importa si la desigualdad incluye el igual (≤ ≥) o no (< >).

  • Función de probabilidad o cuantía
  • Función de distribución

Momentos:

  • E(X) = ∑Xᵢ * Pi (Momento de primer orden)
  • Var(X) = E(X²) – E²(X)
  • E(X²) = ∑Xᵢ² * Pi (Momento de segundo orden)

Distribución Binomial

P(X=r) = (n r) * pr * (1-p)n-r

  • E(X) = n*p
  • Var(X) = n*p*q
  • σx = √(n*p*q)

Distribución de Poisson

P(X=r) = (e * λr) / r!

  • E(X) = λ
  • Var(X) = λ
  • σx = √λ

Variables Aleatorias Continuas (Uniforme, Normal o Exponencial)

Importante: En variables continuas, no importa si la desigualdad incluye el igual (≤ ≥) o no (< >).

  • Función de densidad de probabilidad
  • Función de distribución de probabilidad

La probabilidad en un punto no existe, sólo está definida en un intervalo.

Momentos:

  • E(X) = ∫ xf(x)dx
  • Var(X) = E(X²) – E²(X)
  • E(X²) = ∫x²f(x)dx

Distribución Uniforme

U(a,b)

f(x) = 1/(b-a) // F(X) = (x-a)/(b-a) // a≤x≤b

  • E(X) = (a+b)/2
  • Var(X) = (b-a)²/12
  • σx = (b-a)/√12

Distribución Normal

N(μ,θ) // Z = (x-μ)/θ

Distribución Exponencial

Exp (λ) // f(x) = λ*e-λx

Cálculo de Probabilidades: Discretas vs. Continuas

Variables Discretas

p(x<4) = p(x≤3) = p(X=0)+p(x=1)+p(x=2)+p(x=3) // p(x≥3) = 1-p(x<3) = 1-( p(x=0)+p(x=1)+p(x=2) ) // p(x>2) = 1-p(x≤2) = 1-(…)

Variables Continuas

p(x≤2) = p(x<2) = F(2) // p(x>3) = 1-p(x≤3) = 1-F(3) // p(2<x<3) = F(3)-F(2) = p(x<3)-p(x<2)

Población y Muestra

Población (Parámetros): μ / θ / θ² / p o π

Parámetro:

  • No es una variable aleatoria, es un valor constante.
  • Valor numérico, a veces desconocido.
  • Valor constante para toda la población.
  • Caracteriza total o parcialmente la función de densidad de probabilidad de la población objeto de estudio.

Muestra (Estadísticos): Ẋ / S / S² / ṗ

Estadístico:

  • Variable aleatoria.
  • Función matemática (no lineal) que depende de los valores muestrales y no contiene ningún parámetro poblacional desconocido.

Teorema del Muestreo

Si n≥30 o la población es normal:

  • Media muestral: E(Ẋ) = μ // Var(Ẋ) = θ²/n
  • Proporción muestral: E(ṗ) = p o π // Var(ṗ) = (π*(1-π))/n

Propiedades de la Esperanza y Varianza:

  • E(a)=a // E(a+bx)=a+bE(x) // E(a+bẊ)=a+bE(Ẋ) // E(Ẋ)=μ // E(Xi)=μ // E(2X1)=2μ // E(S²)=θ²
  • Var(a)=0 // Var(a+bẊ)=b²Var(Ẋ) // Var(Ẋ)=θ²/n // Var(Xi)=θ² // Var(-X2)=(-1)²θ²=θ² (no -θ²)

Estadísticos Muestrales

Media Muestral: Ẋ

Ẋ=ΣXi/n

  • θ conocida → Normal → Z = (Ẋ-μ) / (θ/√n)
  • θ desconocida → t-Student → t = (Ẋ-μ) / (S/√n) = (Ẋ-μ) / (√(S²/n))

Varianza Muestral: S²

S² = ∑(Xᵢ-Ẋ)² / (n-1) = (ΣXi² – n(Ẋ)²) / (n-1)

S² → Chi-cuadrado → χ² = (n-1)*S² / θ² χ² (n-1)

Proporción Muestral: ṗ

ṗ=x/n // ṗ = (LS+LI)/2

ṗ → Normal → Z = (ṗ-π) / √(π*(1-π)/n)

(Cuanto más se acerque a 0,5 el % que nos den, mayor error)

Intervalos de Confianza

1-α = Confianza / α = Significación o error

  • Confianza: Probabilidad de que el verdadero valor del parámetro poblacional esté dentro del intervalo.
  • Significación: Probabilidad de que el verdadero valor del parámetro poblacional no esté dentro del intervalo.

+ Confianza → + Amplitud – Precisión + Error // + n → – Error – Amplitud

Si no nos dan la ṗ, ponemos 0,5 (el error máximo será el máximo posible).

Si el 0 está dentro del intervalo → No hay diferencia a nivel poblacional // Si el 0 no está → Sí hay diferencia.

Si α ≠ αintervalo → Si α > αintervalo = Hay diferencia // Si α < αintervalo = ?

Intervalo de Confianza para la Media Poblacional: μ

  • μ ∈ (Ẋ ± Z * (θ/√n)) Emax=Z*(θ/√n)=AI/2
  • μ ∈ (Ẋ ± t * (S/√n)) AI=LS-LI=2*Emax

Intervalo de Confianza para la Varianza Poblacional: θ²

θ² ∈ ((n-1)*S² / χ²grande ; (n-1)*S² / χ²pequeña)

No hay Emax porque no hay centro // AI=LS-LI

Intervalo de Confianza para la Proporción Poblacional: π

π ∈ ṗ ± Z * √((ṗ*(1-ṗ)/n)

Intervalo de Confianza para la Diferencia de Medias: μXY

  • μXY ∈ ((Ẋ-Ϋ) ± Z * (√((θ²X/nX)+(θ²Y/nY)))
  • μXY ∈ ((Ẋ-Ϋ) ± t * (√((S²X/nX)+(S²Y/nY))))
  • μXY ∈ ((Ẋ-Ϋ) ± t * (√((S²/nX)+(S²/nY))))
  • S² = ( (nX-1)*S²X + (nY-1)*S²Y ) / (nX + nY – 2)

Intervalo de Confianza para la Diferencia de Proporciones: πXY

πXY ∈ ((ṗX-ṗY) ± Z * √(((pX*qX)/nX) + ((pY*qY)/nY)))

Contrastes de Hipótesis

H0 y Ha son mutuamente excluyentes, no tienen ningún elemento en común.

Contraste para la Media Poblacional

  • Z = (Ẋ-μ0) / (θ/√n)
  • t = (Ẋ-μ0) / (S/√n)

Contraste para la Varianza Poblacional

χ² = (n-1)*S² / θ²0

Contraste para la Proporción Poblacional

Z = (ṗ-π0) / √(π0*(1-π0)/n)

Contraste para la Diferencia de Medias Poblacionales

  • Z = (Ẋ-Ϋ) – (μXY) / √((θ²X/nX) + (θ²Y/nY))
  • t = (Ẋ-Ϋ) – (μXY) / (√((S²X/nX)+(S²Y/nY)))
  • Si nX=nY → S² = (S²X+S²Y) / 2
  • t = (Ẋ-Ϋ) – (μXY) / (√((S²/nX)+(S²/nY)))

Contraste para la Diferencia de Proporciones Poblacionales

Z = (ṗX – ṗY) – (πXY) / √(ṗ*q*((nX+nY)/(nX*nY)))

ṗ = (x+y)/(nX+nY) = ((ṗX*nX) + (ṗY*nY)) / (nX+nY)

Contraste para la División de Varianzas Poblacionales

F = S²X / S²Y = S²grande/S²pequeña

Errores en los Contrastes de Hipótesis

  • Significación o Error tipo I: α = P (Rechazar H₀ / H₀ cierta)
  • Error tipo II: β = P (Aceptar H₀ / Ha cierta)
  • Confianza: 1-α = P (Aceptar H₀ / H₀ cierta)
  • Potencia del contraste: 1-β = P (Rechazar H₀ / Ha cierta)

Intervalo de confianza con contraste: Si μ está dentro del intervalo → Acepto H0

Propiedades de los Estimadores

  • Cota de Cramer-Rao (CCR): Si un estimador θ² es insesgado y de varianza mínima, y su varianza coincide con la CCR, entonces el estimador es eficiente en términos absolutos.
  • Eficiencia en términos relativos: El estimador más eficiente es aquel con menor varianza o menor error cuadrático medio (ECM). (Elevar al cuadrado y el más pequeño es el más eficiente).
  • Método de los Momentos (MM): Los estimadores son consistentes.
  • Método de Máxima Verosimilitud (MV): Los estimadores son consistentes, asintóticamente insesgados, asintóticamente eficientes y asintóticamente normales.

Cálculo del Tamaño de la Muestra

Máxima Amplitud

n = (2²*Z²*σ²) / A²

Máximo Error de Estimación

n = (Z²*σ²) / e²

IC para p (cuando no tenemos p*q, usamos 0,25)

  • Máxima Amplitud: n = (2²*Z²*p*q) / A²
  • Máximo Error de Estimación: n = (Z²*p*q) / e²

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *

Este sitio usa Akismet para reducir el spam. Aprende cómo se procesan los datos de tus comentarios.