Glosario de Términos Estadísticos y Metodológicos
Definiciones
Asociación entre variables cualitativas: Cuidado con terceras variables. Correlación no siempre significa causa. Dos variables varían de forma simultánea, como consecuencia de terceras variables. Para que una sea causa y la otra efecto, debe haber relación, una debe suceder antes que la otra, y no debe haber terceras variables.
Barras agrupadas: Permiten comparar las diferencias entre las modalidades/periodos y si esas diferencias varían en los grupos formados según otra variable (por ejemplo, sexo).
Barras apiladas: Permiten describir las diferencias entre cada modalidad/periodo en la magnitud general y desagregada.
Barras horizontales: Se utilizan cuando hay muchas categorías, nombres largos, etc.
Características del proceso de investigación:
- Empírico.
- Pretende ser objetivo.
- Verificable o replicable.
- No es infalible.
- Acumulativo.
- Es público.
Cartograma: Es un mapa o diagrama que muestra datos de cantidad asociados a respectivas áreas, mediante la modificación de los tamaños de las unidades de enumeración. La información es aportada mediante la distorsión de las superficies reales, utilizando cada superficie de enumeración como un símbolo proporcional, el cual aumenta o disminuye en función de los valores correspondientes.
Chi-cuadrado: Es la suma de “n” variables normales estandarizadas elevadas al cuadrado. Chi-cuadrado = 0 no existe asociación. Valores esperados y observados serán iguales.
Coeficiente de asimetría: Una distribución es simétrica si su parte derecha es igual a la izquierda (espejo). La asimetría es positiva o negativa dependiendo de dónde esté la cola de la distribución. La media tiende a desplazarse hacia los valores extremos. En distribuciones simétricas, media, mediana y moda coinciden.
Coeficiente de contingencia de Pearson: Mide la asociación o dependencia entre las dos variables. Ofrece valores entre 0 y 1, siendo 0 independencia total y 1 dependencia total.
Coeficiente de correlación lineal de Pearson: Determina si existe relación lineal entre dos variables. Toma valores entre -1 y 1 (adimensional):
- -1: relación lineal inversa.
- 0: no existe relación.
- 1: relación lineal directa.
Coeficiente de correlación lineal directa: A medida que una variable aumenta, la otra también; cuando una crece, la otra también.
Coeficiente de correlación lineal inversa: A medida que una variable aumenta, la otra disminuye; cuando una crece, la otra decrece.
Coeficiente de correlación lineal: Es el cociente entre la covarianza y el producto de las desviaciones típicas de ambas variables.
Coeficiente de Curtosis: Indica el grado de apuntamiento de una distribución comparada con una distribución normal.
Coeficiente de determinación: Porcentaje de variabilidad de una variable que es explicada por la otra.
Coeficiente de variación: Resulta útil para comparar la variabilidad de dos variables medidas en diferentes escalas (en ocasiones se expresa en porcentajes). Solo para variables con datos positivos. Invariable a los cambios de escala.
Combinación: Se parte de la idea de que el resultado de una investigación que aplica el método A puede perfeccionarse a partir de que también se aplique el método B. El resultado de A se emplea como input para mejorar B, cuyo resultado es la finalidad de la investigación. Los métodos A y B son diferentes, como en la complementación, pero A se integra incorporándose a B. El grado de integración es, por tanto, mayor que en la complementación.
4 tipos diferentes:
- Las técnicas cuantitativas apoyan el diseño de técnicas cuantitativas.
- Las técnicas cuantitativas informan el diseño de técnicas cualitativas: El fenómeno es poco frecuente, está socialmente semioculto y se quieren detectar sectores que son “la excepción”.
- Las técnicas cualitativas informan el diseño de técnicas cualitativas.
- Las técnicas cualitativas informan el diseño de técnicas cuantitativas: Como exploratoria por desconocimiento del tema, fuente de hipótesis; como preparación de instrumentos cuantitativos; para una más adecuada construcción de la muestra identificando sectores relevantes.
Ejemplos: Utilizando datos cuantitativos del CIS => criterios discriminantes de organización del tiempo: género y estatus. Grupos de discusión.
Complementación: En un mismo estudio, se desea contar con dos imágenes distintas de la realidad, proporcionadas por métodos distintos. La finalidad de la estrategia es aditiva, porque: no se trata de buscar convergencia ni confirmación entre resultados, sino de contar simultáneamente con dos imágenes que enriquezcan nuestra comprensión de los hechos; no se pretenden solapamiento alguno. El producto: un informe con dos partes bien diferenciadas, con los resultados de las dos metodologías aplicadas. El grado de integración es mínimo. Ejemplo: Las características del perfil de usuario de transporte público en contextos urbanos y rurales y las razones que explican este diferente perfil.
Covarianza: Indica el grado de variación conjunta de dos variables aleatorias.
- Valor → 0: no hay relación.
- Valor → positivo > 0: relación directa.
- Valor → negativo < 0: relación inversa.
Cualitativa:
- Tablas de frecuencia: “absoluto, relativo, absoluto acumulado, relativo acumulado”.
- Gráficos: “barras, columnas, líneas, pictograma, sectores”.
- Tablas de contingencia.
- Coeficiente de contingencia (0, 1).
- Gráficos.
Cuantitativa:
- Gráficos: “histograma, cajas”.
- Tendencia central: “media, mediana, moda”.
- Posición: “cuartil, decil, quintil”.
- Dispersión: “covarianza, cuasivarianza, desviación típica, varianza”.
- Forma: “asimetría, curtosis”.
- Coeficiente de correlación: (-1, 1).
- Gráficos de dispersión.
Cuartiles “Q”: Se dividen en cuatro partes iguales.
Cuasivarianza: Es semejante a la varianza, excepto que la división es por “n-1” (tamaño de la muestra) y no por “n” (tamaño del grupo de datos).
Deciles “D”: Se dividen en diez partes iguales.
Desviación media: Es la media aritmética de los valores absolutos de las desviaciones respecto a la media.
Desviación típica: Es la raíz cuadrada de la varianza de la variable.
Diagrama de sectores: Se utiliza para todo tipo de variables, pero se usa frecuentemente para las variables cualitativas.
Diagrama/gráfico de barras: Variables cualitativas y discretas. Comparar magnitudes de cada modalidad. En el eje horizontal se representan las modalidades y en el vertical su frecuencia (absoluta o relativa). El orden de las modalidades en el gráfico puede ser según su orden “natural” (ordinales), alfabético (útil cuando hay muchas modalidades), según la magnitud (de menor a mayor) o aleatorio.
El proceso de investigación aplicado a la comunicación: La investigación es un proceso que debe ser sistemático: importancia del método científico. El método científico permite la conexión entre las teorías y las observaciones de la realidad. El punto de partida lo constituye la determinación del tema a investigar.
- Delimitación del problema a investigar.
- Selección de la perspectiva metodológica principal.
- Operacionalización del problema a investigar.
- Diseño de la investigación.
- Fase de observación y producción de datos primarios.
- Edición y análisis de datos.
- Interpretación de resultados, conclusiones y difusión.
Estadística descriptiva bivariante: Permite el análisis conjunto de dos características de los individuos de una población con el propósito de detectar posibles relaciones entre ellas.
Estadística descriptiva univariante: Se centra en el análisis de una única característica o cualidad del individuo.
Frecuencia absoluta (ni): Número de veces que se repite ese valor (xi) o modalidad en el total de individuos.
Frecuencia absoluta acumulada (Ni): Suma de ni acumuladas hasta esa clase.
Frecuencia relativa (fi): Número de veces, en tantos por uno, que se repite ese valor (xi) o modalidad en el total de individuos.
Frecuencia relativa acumulada (Fi): Es el cociente entre la frecuencia acumulada de un determinado valor y el número total de datos. Se puede expresar en %.
Gráficos de dispersión o gráficos X-Y: Su función principal es la de mostrar la relación que existe entre los valores numéricos de diferentes series de datos sobre los ejes de coordenadas “X-Y”.
Hipótesis: Contienen conceptos teóricos, surgidos en el marco teórico, la revisión bibliográfica o en torno a la pregunta y objetivos de investigación.
Histograma: Similar al diagrama de barras pero sin hueco, para dar idea de continuidad. También puede tener un polígono de frecuencias asociado.
Indicador: Variable medible mediante la cual nos acercamos a un concepto o propiedad que no es directamente observable y medible.
Índice de Desarrollo Humano:
- Esperanza de vida al nacer.
- Tasa alfabetización y matriculación.
- PIB.
Índice o indicador: Debe responder a un concepto teórico, que debe estar bien definido. Validez, miden adecuadamente el concepto teórico que queremos medir: de criterio, de contenido, de constructo. Fiabilidad, produce mediciones estables.
Índices: Integra las diferentes puntuaciones de los indicadores propuestos en una única medida sintética. Es necesario atribuir una ponderación a las diferentes dimensiones y categorías de las dimensiones. Los índices permiten abarcar mejor las dimensiones del concepto y permiten una mejor precisión.
Integración: Es el diseño multimétodo de mayor combinación entre técnicas. Se realiza incorporando a los sujetos investigados como sujetos investigadores. Éstos últimos participan en el diseño de fases posteriores. Ejemplo: Como parte observada o parte de un grupo de discusión, ayudan al equipo investigador a interpretar los grupos entrevistados, valorar espacios/situaciones o a identificar personas para realizar entrevistas.
Investigación: Es un proceso sistemático, organizado, replicable, crítico y “objetivo”, realizado con el fin de responder una pregunta o una necesidad de información. Consiste en la aplicación de un método científico a la resolución de problemas (a una pregunta de investigación). Ejemplo: El método positivista hipotético deductivo: conocimiento teórico → Hipótesis → Análisis empírico → Conclusiones.
Leptocúrtica: Presenta una distribución más apuntada, con una elevación superior a la curva normal. Curtosis > 0.
Media aritmética ponderada: Todos los valores no tienen el mismo peso.
Media: Suma de todos los valores entre el total de individuos. Más utilizada. Centro de gravedad de la variable.
Mediana: En una variable cuyas observaciones han sido ordenadas de menor a mayor, la mediana es el valor que deja por debajo y por encima el 50% de las observaciones.
Medidas de dispersión: Permiten analizar las diferencias que se dan entre los individuos en la variable, es decir, las diferencias entre los sujetos en las puntuaciones de la variable. También permiten cuantificar la representatividad de una medida de posición, permitiéndonos establecer hasta qué punto una medida de tendencia central es representativa como síntesis de una distribución.
Mesocúrtica: Es el que corresponde a la curva normal y presenta un nivel de apuntamiento considerado como ideal. Curtosis = 0.
Moda: En una distribución de frecuencias, se denomina moda al valor de la variable que más se repite (tiene mayor frecuencia). Puede no haber moda. Puede haber más de una moda (bimodal, trimodal…). También para variables cualitativas. Útiles para distribuciones que se concentran en torno a un valor.
Operacionalización: Consiste en el proceso que permite pasar de los conceptos teóricos a la medición empírica, para poder así medir la ocurrencia del concepto. Algunos conceptos son directamente observables y medibles en la realidad.
Para que hablemos de dependencia entre dos variables: Los porcentajes por columna sean diferentes. Los porcentajes por fila sean diferentes. Los valores reales y esperados “independencia absoluta” sean diferentes.
Percentiles “P”: Se dividen en cien partes iguales.
Perspectiva o metodología cualitativa: Comprensión, descripción e interpretación desde el marco de referencia del sujeto, significado de los actores. Necesariamente flexible. Representación simbólica. Profundo, descubrimiento.
Perspectiva o metodología cuantitativa: Medir, relacionar, establecer, causalidad, explicar. Estructurado y sistemático. Representación estadística. Superficial, confirmación.
Pictogramas: Representan, mediante un dibujo con alusión al tema de estudio, las frecuencias de las modalidades de una variable.
Pirámide de población: Es un histograma que está hecho a base barras cuya altura es proporcional a la cantidad que representa la estructura de la población por sexo y edad.
Platicúrtica: Presenta una curva más aplastada, con una elevación de la distribución inferior a la curva normal. Curtosis < 0.
Población objeto de estudio: Sobre la que vamos a obtener conclusiones. Se obtiene a partir de los objetivos de investigación pero conviene explicitarla porque condiciona los recursos económicos o temporales. Población objeto de estudio no tiene que ser la población finalmente estudiada (muestreo).
Principales medidas de forma y asimetría: Nos ayudan a definir mejor la variable, nos muestran la forma de la distribución. Nos permiten saber si los datos se reparten de una forma simétrica, y el nivel de apuntamiento de la distribución.
Principales técnicas de investigación cualitativa:
- Entrevista:
- Estructurada: “guión cerrado, secuencial, dirigida, relación entrevistador-entrevistado: cordial, entrevistas a expertos”.
- Semiestructurada: “guión temático, preguntas abiertas, permite discurso”.
- No estructurada o en profundidad: “lista de temas, libre discurso, reconducción del entrevistado, profundización en aspectos relevantes, relación entrevistador-entrevistado: confianza”.
- En grupo (focus group): “exposición a una situación o estímulo, estudios de marketing (anuncios publicitarios), guión de entrevista cerrado, relación entrevistador-entrevistados: directiva, herramienta de intervención social”.
- Grupo de discusión:
- Homogénea: Lo habitual es la similitud de posiciones de los participantes acerca del tema a investigar, puesto que normalmente se busca profundizar en el discurso.
- Heterogénea: A veces, en función de los objetivos, conviene recurrir a participantes de perfil diferente o contrapuesto, para buscar el contraste entre posturas.
- Observación: “método más experimental. A veces exploratorio. Flexible y adaptable. Temáticas que puedan distorsionarse al intervenir el investigador: personas con dificultades para hablar; provoca incomodidad explicar.
- Participante: “el observador se incluye en el grupo, hecho o fenómeno observado para conseguir la información desde dentro. Binomio observación – participación”.
- No participante.
Problemas de la integración:
- Problemas económicos: Emplear más métodos resulta más costoso.
- Problemas de tiempo: No tan problemático en integraciones basadas en la complementación, pero sí en otras como el encadenamiento/combinación.
- La falta de conocimiento de investigadores/as: Tras la dicotomía cualitativista/cuantitativista se esconden a veces incapacidades individuales.
- La utilización conjunta de técnicas, a veces, implica la renuncia a la potencialidad total de cada técnica.
Propiedades de la mediana: No afectada por valores extremos (útil para asimétricas). Cálculo rápido e interpretación sencilla. Siempre es un valor de la variable que estudiamos (importante en discretas).
Propiedades de la varianza y desviación típica: Son sensibles a la variación de algún dato. Tienen muchas propiedades para la estimación. No son recomendables cuando la media no es una buena medida de tendencia central. No pueden ser valores negativos.
Rango o recorrido: Es la variación total de los datos y se calcula restando a la puntuación mayor la menor (en ocasiones se le suma la unidad). Fácil de calcular y medida en unidades de la variable. No utiliza todas las observaciones. Muy afectada por los datos extremos.
Recorrido intercuartílico y semi-intercuartílico: No se ve tan afectado por valores extremos.
Tabla de contingencia: Se emplean para registrar y analizar la asociación entre dos o más variables, habitualmente de naturaleza cualitativa (nominales u ordinales).
Tablas de frecuencias y gráficos: Son formas equivalentes de recoger de una manera rápida la información de la matriz de datos de una forma ordenada y resumida. Muy útil en presentación de resultados y análisis exploratorio.
Tendencias temporales: Se suelen representar mediante gráficos de barras o diagramas de líneas.
Triangulación: Dos o más metodologías se orientan al cumplimiento de un mismo propósito de investigación. Ambos se organizan para capturar una misma realidad social. Objetivo: reforzar la validez de los resultados. Si dos métodos logran una misma imagen de la realidad social, la validez será mayor. El resultado será un informe en el que el apartado de resultados de la aplicación de ambos métodos será único. La legitimidad residirá en creer que ambas metodologías son capaces de captar exactamente una misma realidad. El nivel de integración es mayor que en las anteriores estrategias. Ejemplo: los acontecimientos en el nuevo panorama político vasco.
Variable confusora: Cuando estando relacionada con alguna variable independiente, afecta a una variable dependiente.
Variable dependiente: Es aquella cuyos valores dependen de los que tomen otra variable. La variable dependiente en una función se suele representar por “y”. La variable dependiente se representa en el eje de ordenadas.
Variable independiente: Es aquella cuyo valor no depende del de otra variable. La variable independiente en una función se suele representar por “x”. La variable independiente se representa en el eje de abscisas.
Variables cualitativas o discretas: Útil para comparación de las diferentes modalidades o para describir el peso de cada una de ellas en el total de la población. No es útil cuando las modalidades de respuesta son muchas.
Varianza: Media de las distancias al cuadrado.
Ventajas de la investigación cualitativa: Información holística, contextualizada y personalizada. Interacción directa y posibilidad de clarificar los conceptos con el entrevistado. Ayudar la fase de operacionalización y análisis preliminar de otras investigaciones. Contraste de resultados cuantitativos o soporte a la interpretación de los datos. Intimidad de la relación y profundidad de recogida.