La Voz Humana: Producción, Características y Análisis Acústico

La Voz Humana

Voz humana: La voz es una onda de presión acústica producida por el aparato fonador. Se utiliza para comunicarse (transmisión de mensajes).

Intensidad Vocal

Depende de la interacción de la presión subglótica, de la resistencia que le opongan las cuerdas vocales (fuerza de oposición a la presión) y de la situación del tracto vocal.

Intensidad media: 70 dB
El intervalo de la voz se encuentra entre los 35 y 105 dB.

Frecuencia Fundamental

Frecuencia fundamental: Número de veces que vibran por segundo las cuerdas vocales. La percepción de la frecuencia fundamental es el tono vocal.

F₀ es inversamente proporcional al tamaño de la estructura anatómica que lo sustenta.

Cuerdas vocales con mucha masa y que están muy vascularizadas: voz grave.
Cuerdas vocales pequeñas y poco vascularizadas: voz aguda.
Niños y niñas tienen una F₀ parecida (240 Hz) hasta la pubertad. Luego, los varones tienen un descenso hasta los 110 Hz, mientras las mujeres se mantienen en 210 Hz.
Hacia la tercera edad vuelven a coincidir los tonos.

Parámetros del Timbre Vocal (Espectrografía)

Espectrografía: Técnica usada para detectar la frecuencia fundamental de la voz, los armónicos y los formantes. Detecta la energía no vocal, el ruido que aparece entre los armónicos (disfonía). Refleja 3 características simultáneamente: las frecuencias de la voz, el tiempo en que acontece el fenómeno vocal, y la intensidad de cada una de las frecuencias armónicas.

Espectrograma de Banda Ancha: Muestra muy bien los pulsos glóticos y los formantes (bandas oscuras horizontales de concentración de energía), pero muy mal las frecuencias.
Espectrograma de banda estrecha: Muestra muy bien las frecuencias, pero mal los pulsos glóticos y deficientemente los formantes.

Análisis Acústico de la Voz

Voz humana: Sonido complejo armónicamente rico. Puede representarse como forma de onda (waveform, amplitud v/s tiempo) o como espectro (amplitud v/s frecuencia). Ambas representaciones están matemáticamente relacionadas por la FFT. El espectro laríngeo presenta una serie de armónicos cuya energía declina cuanto más agudo es el armónico (12 dB / Oct). Una vez producido el sonido en la laringe, éste viaja a lo largo del tracto vocal donde sufrirá un filtrado, dando lugar a máximos relativos de intensidad en determinados armónicos, áreas que se denominan formantes.

Representaciones Gráficas del Sonido

Oscilograma (Waveform): Amplitud v/s Tiempo. El período puede apreciarse por la separación temporal de los máximos. Muestra (en el caso de una vocal), el período glotal y por tanto el tono o pitch (frecuencia de la vibración glótica) y la amplitud de la señal (valor máximo).
Espectrograma (Power spectrum): Amplitud v/s Frecuencia.
Sonograma (Sound Spectrogram): Frecuencia v/s Tiempo.

Variación de la Frecuencia Fundamental (Jitter)

Parámetro que mide la variación del tono fundamental ciclo a ciclo. Se basa en la detección de peaks periódicos máximos en la señal y en la premediación de la desviación en cada ciclo. Puede expresarse en milisegundos o como porcentaje. Los valores normales deben ser menores al 1 %.

Shimmer

Mide la variación de la amplitud de onda ciclo a ciclo. Se basa en la detección de peaks periódicos máximos en la señal y en la premediación de la desviación de la amplitud de cada pico. La unidad es el dB. Los valores normales deben ser menores a 0.6 dB.

Producción de los Sonidos del Habla

El habla es generada por la acción coordinada de 3 estructuras anatómicas agrupadas:

Por debajo de la laringe: La acción de los músculos y las fuerzas generadas por los pulmones al comprimirse y expandirse permite elevar la presión de aire por debajo de la laringe.
En la laringe: Las cuerdas vocales se posicionan de distintas formas de manera que el flujo de aire que circula por ellas las puede poner o no, en vibración.
Por encima de la laringe: Lengua, mandíbula, velo, labios y otras estructuras que forman las cavidades oral y nasal. Cambiando las formas de estas cavidades, se crean las características específicas de cada sonido producido.

Producción y Emisión de los Sonidos del Habla

Una corriente de aire, la cual es producida por los pulmones y los músculos respiratorios.
Vibrador sonoro, constituido por las cuerdas vocales que se encuentran en la laringe.
Un resonador, conformado por la boca, la nariz y la garganta (o faringe).
Articuladores, conformado por los labios, dientes, paladar duro, velo del paladar, mandíbula.

La distribución de frecuencias armónicas o inarmónicas respecto de las frecuencias naturales determina las resonancias de mayor energía, llamadas Formantes a la salida de los labios.

Características del Sonido Vocal

Si dichas cuerdas se aproximan y vibran se origina un»sonido sonor», pero si no vibran será un»sonido sord».
La vibración provoca una onda sonora o tono fundamental y unos armónicos que filtrados (en la cavidad bucal y en la nasal) producen el timbre del sonido.
Al pasar el aire hacia las cuerdas vocales con mayor o menor energía se produce la intensidad de voz.
La duración se produce por un impulso psicomotriz a través del nervio recurrente hacia el diafragma. Este comprime los pulmones el tiempo necesario para la duración deseada.

Análisis de Fourier

Casi todos los sonidos que percibimos tienen vibraciones complejas que son descomponibles (por medio del Análisis Espectral de Fourier), en otras más simples que guardan entre sí algún tipo de relación. La onda sonora compleja se forma de una onda sinusoidal que contiene una frecuencia llamada fundamental. Junto a ella, aparecen otras frecuencias progresivamente más agudas, con sus respectivas ondas sinusoidales y que van formando los siguientes armónicos. Por ejemplo, cuando se hace vibrar la cuerda de una guitarra, el sonido emitido estará formado por una onda compuesta de la frecuencia fundamental más sus armónicos. Las características sonoras de la onda dependerán del tamaño, longitud y consistencia del objeto que vibra. La caja de la guitarra (resonador), vibrará armónicamente (en fase o consonancia con el sonido fundamental que emite la cuerda) dando lugar a uno de los formantes esenciales del sonido de la guitarra. Los distintos puntos de la caja de una guitarra donde resuenen armónicamente más o menos las distintas frecuencias (notas) emitidas por las cuerdas generarán formantes que, con sus armónicos correspondientes, dan el timbre característico del instrumento.// En la voz humana, el timbre depende del número y de la calidad de los armónicos.

Formantes

Frecuencias naturales de resonancia de todas las cavidades supraglóticas, en el momento de producir un sonido determinado. Los formantes caracterizan el timbre.

Ancho de Banda

Valor en Hz correspondiente a la diferencia de frecuencias que se obtiene al descender 3 dB del valor máximo de un peak del espectro.

Armónicos

En una señal periódica, son las frecuencias múltiplo de la frecuencia fundamental.

Banda Crítica

Ancho de banda mínimo necesario para enmascarar un tono ubicado en el centro de la misma banda.

Frecuencia Fundamental

Frecuencia más baja de un sonido complejo. Frecuencia de vibración de las cuerdas vocales.

Frecuencias Naturales de Resonancia

Frecuencias de máxima energía de una cavidad resonancial.// La voz humana es producida en la laringe, cuya parte esencial, la glotis, constituye el verdadero órgano de fonación humano. El aire procedente de los pulmones, es forzado durante la espiración a través de la glotis, haciendo vibrar los dos pares de cuerdas vocales, que se asemejan a dos lengüetas dobles membranáceas. Las cavidades de la cabeza, relacionadas con el sistema respiratorio y nasofaríngeo, actúan como resonadores.

001FFLPTXVVVt9NdZKBwQAOw==

Timbre

Describe aquellas características del sonido las cuales permiten al oído distinguir sonidos que tienen la misma altura y sonoridad. Se determina principalmente por el contenido armónico y por las características dinámicas del sonido tales como el vibrato y la envolvente de ataque-decaimiento. Se ha concluido que, después de un tiempo de 60 ms, el oído es capaz de reconocer el timbre.

Sobretonos y Armónicos

Un armónico es un número entero múltiplo de la frecuencia fundamental de vibración de un objeto (cuerda, membrana, columna de aire). Sobretono se refiere a alguna frecuencia resonante por sobre la frecuencia fundamental, que puede o no ser armónico.

9k=

La Voz Humana

Intensidad Vocal

Frecuencia Fundamental

Parámetros del Timbre Vocal (Espectrografía)

Análisis Acústico de la Voz

Representaciones Gráficas del Sonido

Variación de la Frecuencia Fundamental (Jitter)

Shimmer

Producción de los Sonidos del Habla

Producción y Emisión de los Sonidos del Habla

Características del Sonido Vocal

Análisis de Fourier

Formantes

Ancho de Banda

Armónicos

Banda Crítica

Frecuencia Fundamental

Frecuencias Naturales de Resonancia

Timbre

Sobretonos y Armónicos

Deja una respuesta Cancelar la respuesta