Análisis de tablas bidimensionales
Tabla bidimensional o de doble entrada estudia dos características, sirven para organizar y analizar datos que involucran dos variables. Componentes: Filas y columnas, márgenes. Uso y aplicaciones: frecuencias bidimensionales (registrar cantidad de observaciones que caen en cada categoría), relaciones entre variables (explorar la asociación o independencia identificando patrones), análisis estadístico (calcular medidas de tendencia central), toma de decisiones (brindar información para toma de decisiones). Beneficios: organización y claridad, identificación de patrones, análisis estadístico, comunicación efectiva.
Consideraciones adicionales
Selección de variables (tienen que tener relación entre sí), escalas de medición (nominal, ordinal, intervalo o razón), interpretación cuidadosa.
Covarianza
Indica en qué medida dos variables varían juntas en la misma dirección o en direcciones opuestas, mide el grado de relación entre dos variables y usan la escala de medida intervalo/razón. Propiedades: unidades, la covarianza tiene las mismas unidades que el producto de las variables originales. Limitaciones: depende de las unidades de medida de las variables, no es una medida estandarizada por lo que no se puede comparar directamente la covarianza de diferentes pares de variables.
Coeficiente de determinación
Es un número positivo que permite indicar el grado de certeza con que una variable depende de la otra. También se puede representar como un porcentaje (multiplicándolo por 100) de validez con el que se afirma que una variable depende de otra.
Correlación de Pearson
La regresión lineal consta de covarianza y coeficiente, este es una medida estandarizada de la covarianza dividida por desviación, permite comparar la covarianza de diferentes variables independiente de sus unidades de medida. Indica si las puntuaciones están relacionadas entre sí, p es cuando se calcula en población y r cuando es muestra. Es independiente de la escala de medición de las variables cuantitativas. *El gráfico de dispersión es el mejor para representar la relación entre dos variables. Interpretación ventajas: comparar la relación entre variables con diferentes unidades de medida, proporciona una medida de la fuerza de la asociación lineal entre variables. Desventajas: supone una relación lineal entre las variables, es sensible a valores atípicos.
Relación entre covarianza y coeficiente
La correlación de Pearson es una medida estandarizada de la covarianza. La covarianza se puede obtener multiplicando la correlación de Pearson por las desviaciones estándar de las variables. Ambas medidas proporcionan información sobre la asociación entre las variables, pero la correlación de Pearson es más útil para comparar la fuerza de la relación entre variables con diferentes unidades de medida.
Probabilidad
Mide la frecuencia con la que ocurre un resultado.
Experimento aleatorio
Operación que repetimos bajo idénticas condiciones iniciales y no se obtienen siempre los mismos resultados. Espacio muestral: conjunto de todos los sucesos elementales del experimento aleatorio, son todas las caras del dado. Suceso elemental: cada uno de los resultados posibles del experimento aleatorio; un suceso elemental consta de un solo elemento del espacio muestral (dado). Suceso o evento (h): conjunto formado por uno o más sucesos elementales, es decir, un subconjunto de resultados elementales del experimento aleatorio. Suceso seguro: coincide con el suceso elemental, ya que al realizar el experimento aleatorio se obtendrá con seguridad uno de los posibles resultados o sucesos elementales, y por tanto ocurrirá. Suceso imposible: es el que no tiene ningún elemento del espacio muestral (Q), y por tanto no ocurrirá nunca.
Sucesos o eventos mutuamente excluyentes
Los eventos son mutuamente excluyentes o disjuntos si ambos no pueden ser verdaderos (o suceder simultáneamente). Sucesos o eventos independientes: dos eventos son independientes si el resultado del segundo evento no es afectado por el resultado del primer evento. Si A y B son eventos independientes, la probabilidad de que ambos eventos ocurran es el producto de las probabilidades de los eventos individuales.
Probabilidad como Frecuencia Relativa: probabilidad estimada o probabilidad empírica de un evento es la frecuencia relativa de ocurrencia del evento cuando la cantidad de observaciones es muy grande. La probabilidad misma es el límite de esta frecuencia relativa a medida que la cantidad de observaciones aumenta de manera indefinida.
Teorema de Bayes
Calcular la probabilidad de que suceda un evento, teniendo en cuenta el uso de nueva información o evidencia que podría afectar a la probabilidad de que suceda el evento en cuestión. El Teorema de Bayes parte de una situación en la que es posible conocer las probabilidades de que ocurran una serie de sucesos Ai. A esta se añade un suceso B cuya ocurrencia proporciona cierta información, porque las probabilidades de ocurrencia de B son distintas según el suceso Ai que haya ocurrido. Conociendo que ha ocurrido el suceso B, la fórmula del teorema de Bayes nos indica cómo modifica esta información las probabilidades de los sucesos Ai.
Puntos clave: nos permite actualizar la probabilidad de un evento basándonos en nueva evidencia o información. A diferencia de otros métodos, Bayes trabaja ‘al revés’, utilizando lo que ya sabemos sobre un evento para evaluar cómo la nueva información afecta su probabilidad. El teorema es muy efectivo cuando se aplica correctamente, es decir, cuando los eventos considerados son exclusivos y abarcan todas las posibilidades.