SciELO - Scientific Electronic Library Online

 
vol.77 número4Presbilaringe. Revisión de la literatura índice de autoresíndice de materiabúsqueda de artículos
Home Pagelista alfabética de revistas  

Servicios Personalizados

Revista

Articulo

Indicadores

Links relacionados

  • En proceso de indezaciónCitado por Google
  • No hay articulos similaresSimilares en SciELO
  • En proceso de indezaciónSimilares en Google

Compartir


Revista de otorrinolaringología y cirugía de cabeza y cuello

versión On-line ISSN 0718-4816

Rev. Otorrinolaringol. Cir. Cabeza Cuello vol.77 no.4 Santiago dic. 2017

http://dx.doi.org/10.4067/s0718-48162017000400474 

Artículo de Revisión

Aplicaciones clínicas del análisis acústico de la voz

Clinical applications of acoustic voice analysis

Yoel G. Droguett1 

1Fonoaudiólogo, docente en Universidad Viña del Mar

RESUMEN

El análisis acústico de la voz es un método de evaluación vocal objetivo y no invasivo, utilizado con fines diagnósticos, terapéuticos e investigativos. Utiliza registros acústicos obtenidos directamente de la voz del paciente mediante el uso de un micrófono profesional. Existe una gran variedad de programas y métodos de graficación disponibles, que favorecen la versatilidad y especificidad del proceso. Esta revisión muestra los métodos de graficación de la voz más utilizados.

Palabras clave: Análisis acústico de la voz; oscilograma; espectro FFT; sonograma; código por predicción lineal; espectro promedio a largo plazo; cepstrum

ABSTRACT

The acoustic voice analysis is an objective and non invasive vocal assessment method, used for voice diagnosis, therapy and research. It uses acoustic records obtained from the patient's voice using professional microphones. There is a variety of softwares and graphing programs available that allows process versatility and specificity. This review presents the most utilized methods of voice graphing.

Key words: Acoustic voice analysis; waveform; FFT spectrum; sonogram; linear predictive code (LPC); long-term average spectrum (LTAS); cepstrum

INTRODUCCIÓN

El análisis acústico de la voz es una herramienta objetiva y no invasiva de exploración vocal, que emplea el registro y análisis de la señal acústica obtenida a partir de una tarea vocal. Se utiliza como complemento del diagnóstico de voz, para seguimiento ambulatorio, como mecanismo de retroalimentación visual y auditivo, para determinar la efectividad de las técnicas de rehabilitación aplicadas y para la obtención de datos objetivos con fines investigativos16. Su aplicación es sencilla, ya que sólo requiere del seguimiento de órdenes simples por parte del sujeto evaluado. Además, los recursos necesarios para realizarlo son asequibles2,5.

Para obtener el registro de la voz, se debe captar la señal acústica de una vocal sostenida, habla encadenada o voz cantada, utilizando un micrófono profesional ubicado a una distancia entre 5 y 20 centímetros de la boca del paciente y con un ángulo de 30° a 45°. Sus características técnicas, varían de acuerdo a la necesidad personal del evaluador79. La señal captada con el micrófono debe ser preamplificada y digitalizada utilizando una interfaz de audio conectada al computador, el que debe disponer de una tarjeta de sonido que soporte resoluciones de 16 bits y frecuencias de muestreo de 44.100 Hz2,7. Para el tratamiento de la señal, se necesita de programas específicos que grafiquen la información acústica y entreguen sus respectivos resultados numéricos. Actualmente, existe una amplia gama de programas dedicados a esto, podemos encontrar tanto opciones gratuitas como de pago. A pesar de que la mayoría de los programas de análisis acústico son compatibles con Windows, podemos encontrar diversas alternativas para computadores con sistemas operativos GNU/Linux, Mac u otras distribuciones6. Una desventaja derivada de la gran variedad de programas que existen, es que cada uno utiliza diferentes algoritmos para obtener las mismas mediciones, lo cual obstaculiza la estandarización de los datos acústicos obtenidos5,8.

Con respecto al proceso de grabación, es importante cautelar que el lugar donde se realiza la grabación esté libre de ruido ambiental y de ruido electromagnético originado por las señales telefónicas, por ruidos de equipos eléctricos o electrónicos y por el cableado propio del lugar1. Otro aspecto a considerar, es que la emisión vocal de un mismo paciente puede ser distinta de un momento a otro, pudiendo obtener diferencias significativas incluso con dos registros consecutivos1,2. Esta variación es aceptable considerando la inestabilidad natural de la voz humana, lo importante es que la tasa de cambio se mantenga dentro de ciertos límites para ser confiable10.

A pesar de la significancia del uso del análisis acústico como un elemento sofisticado de evaluación de la voz, no debemos olvidar que los datos obtenidos a través de este medio deben ser cotejados e interpretados considerando los resultados de otras evaluaciones como la aerodinámica, perceptual, endoscópica y con los antecedentes anamnésicos. Ningún sistema actual tiene capacidad suficiente como para reemplazar al oído humano bien entrenado1,2,8.

A continuación, se presentarán los métodos de graficación más utilizados en el estudio acústico de la voz humana.

I. OSCILOGRAMA

También llamado forma de onda o waveform (Figura 1), corresponde a la representación de la amplitud de la señal vocal expresada en pascales (eje vertical) en función del tiempo expresado en segundos (eje horizontal)1114. Es la visualización directa del sonido grabado con el micrófono12. Este gráfico permite determinar las variaciones fonéticas y los silencios propios del habla12,14.

Figura 1 Oscilograma de una vocal. 

Además, el oscilograma es útil en la identificación de características vocales como la estabilidad de la emisión12,15, inicio vocal (ataque vocal)12, voice onset time (VOT)6,12 y el final de la emisión (filatura o liberación). El estudio del inicio vocal es poco confiable, ya que cuando la onda está comprimida, puede dar un falso positivo de inicio vocal duro16. Otros aspectos visibles en este gráfico son la duración total de la muestra, la amplitud del sonido y la frecuencia de la voz, éste último parámetro se calcula por medio del conteo de la cantidad de ciclos presentes en 1 segundo, o bien obteniendo el periodo de la vibración de los pliegues vocales12,15.

El uso del oscilograma como método de análisis de voz, es completamente prescindible, ya que la mayoría de los fenómenos acústicos que se estudian en la clínica vocal son más sencillos de obtener e interpretar a partir de otros gráficos e índices exceptuando la medición del voice onset time, que sólo se puede calcular con el oscilograma12.

II. ESPECTRO FFT

Corresponde a una visualización alternativa de la onda sonora, por medio de la aplicación del algoritmo de trasformada rápida de Fourier (FFT), que descompone la señal compleja en cada una de sus frecuencias parciales1,9,13. El espectro FFT o power spectrum es la representación de la amplitud de los armónicos expresado en decibeles (eje vertical) en función de su frecuencia expresada en herzios (eje horizontal)1,13. El gráfico, permite una visión estática del número y la paridad de los armónicos del perfil espectral1, además del número y posición de las zonas del espectro enfatizadas por la resonancia y desenfatizadas por la antirresonancia (Figura 2)13.

Figura 2 Espectro FFT. 

A modo general, en el espectro de la señal glotal (sin influencia formántica), el primer armónico (F0), es el de mayor amplitud, por tanto el más audible, y cada parcial subsiguiente disminuye su amplitud progresivamente en 12 dB por cada octava aumentada1,17,18.

El espectro FFT permite valorar diferencias en la calidad vocal1921, y en el modo de fonación22. Tiene correlación directa con los parámetros perceptuales8 y es un recurso usado para estudiar la presencia de subarmónicos21, soplosidad y tensión en la fonación8,19.

III. SONOGRAMA

También llamado espectrograma, es la representación más completa de cualquier tipo de vibración, ya que es posible observar los armónicos, los formantes, y el ruido de la señal (Figura 3) todo en un mismo gráfico en forma nítida, sin ayuda de ninguna base de datos extra para su interpretación1,18. El sonograma, muestra la evolución temporal de la caracterización espectral en forma bidimensional13. El plano de proyección es el de frecuencia expresada en herzios (eje vertical), el tiempo medido en segundos (eje horizontal)13,18 y la amplitud es representada por la densidad del trazado (eje lateral)1,23.

Figura 3 Sonograma de banda estrecha (45 Hz / 30 ms). 

Algunos programas de análisis acústico, permiten variar a elección la paleta de colores usada en la representación del sonograma. Usualmente la escala de grises es la gama de color predeterminada. Lo importante, es utilizar aquellos colores que faciliten la distinción de las características importantes del trazado y minimicen la tasa de pérdida de información1,7.

Existen dos tipos de sonogramas: de banda estrecha (45 Hz y 30 ms) y de banda ancha (300 Hz y 5 ms), en función del ancho de banda del filtro que se utilice al realizar el análisis frecuencial. El primero (Figura 3), provee una mejor resolución frecuencial con estimaciones espectrales más precisas, condición favorable para el estudio del F0, los armónicos y la valoración de la disfonía, mientras que el segundo (Figura 4) permite una mejor resolución temporal de los fenómenos del habla y los formantes13,23,24.

Figura 4 Sonograma de banda ancha (300 Hz / 5 ms). 

El estudio del sonograma de banda estrecha, es el más significativo de ambos, y puede correlacionarse directamente con las mediciones de la evaluación perceptual8,25. Permiten la observación de subarmónicos21, inicio vocal15, características del vibrato24, nasalidad26,27, diplofonía, temblor, inestabilidad, aperioricidad, turbulencias18, ruido añadido a la voz, la existencia de segmentos áfonos, características del tono y la regularidad de la emisión1.

ESCALA DE YANAGIHARA

De acuerdo a Yanagihara, la severidad de la ronquera o disfonía puede clasificarse en cuatro tipos, considerando ciertas características visuales del espectrograma de banda estrecha1,8,28.

  • TIPO I: existe una mezcla sutil entre los componentes armónicos de las vocales y los componentes de ruido1,8.

  • TIPO II: los componentes de ruido en el segundo formante de /e/-/i/ predominan sobre los componentes armónicos y aparece ruido adicional en altas frecuencias (alrededor de los 3000 Hz)1,8.

  • TIPO III: el segundo formante de /e/-/i/ es reemplazado por ruido. Aumenta el componente de ruido alrededor de los 3000 Hz1,8.

  • TIPO IV: Presencia de ruido desde el segundo formante de /a/-/e/-/i/, hasta las frecuencias altas. Incluso el primer formante de todas las vocales podría perder sus componentes armónicos siendo reemplazados por componentes de ruido1,8.

CLASIFICACIÓN SEGÚN LA NCVS

Algunos índices como jitter, shimmer y HNR, necesitan de cierto grado de perioricidad de la señal para poder ser aplicados8. Por consiguiente, la NCVS establece que la evaluación de voz patológica debe comenzar con una espectrografía para clasificarla y determinar las mediciones posteriores7. La NCVS describe 3 tipos:

  • TIPO I: Voz normal o con disfonía leve, con vibraciones casi periódicas y clara estructura de armónicos. En caso de existir subarmónicos, sus amplitudes son menores a la de la frecuencia fundamental. Puede aplicarse índices de perturbación y ruido, espectrografía y análisis perceptual79,21.

  • TIPO II: Voces patológicas con modulaciones y subarmónicos, cuya amplitud es cercana a la de la frecuencia fundamental; se percibe diplofonía. Solamente permite espectrografía y análisis perceptual79,21.

  • TIPO III: Voces caóticas y aleatorias, sin estructura periódica armónica. Sólo admite métodos subjetivos como análisis perceptual79,21.

IV. CÓDIGO POR PREDICCIÓN LINEAL (LPC)

El código por predicción lineal o LPC, se obtiene a partir del espectro. Entrega información de la resonancia utilizando cálculos basados en la aproximación o predicción de las muestras de voz1,13,24. Está representada la frecuencia en herzios (eje horizontal) y la amplitud en decibeles (eje vertical) de cada pico espectral (Figura 5).

Figura 5 LPC de una vocal. 

Se pueden obtener mediciones estáticas del LPC (LPC slice) o dinámicas (historia formántica)15.

El trazado del LPC será diferente en cada fonema, debido a las características tímbricas distintivas de cada sonido1,14,17,24,29.

Los dos primeros formantes (F1 y F2), permiten la discriminación e identificación de los sonidos continuos del lenguaje, como las vocales y algunas consonantes14,29,33. En cambio, los formantes más altos (F3, F4 y F5) determinan el timbre de la voz32.

El formante en sí, no constituye una frecuencia única, sino un conjunto de frecuencias con un ancho de banda específico. Ambos valores pueden ser medidos con fines terapéuticos e investigativos15,30 y varían de acuerdo con las modificaciones del tracto vocal y por factores intrínsecos de cada persona1,24,29,31,32. Desde un punto de vista perceptual, es más correcto interpretar un espectro LPC, ya que el oído es incapaz de distinguir más de 6 o 7 frecuencias simultáneamente9,24.

El LPC puede superponerse con el gráfico del espectro FFT, si se observa una buena coincidencia entre el trazado de los parciales y del LPC, se considerará como un máximo aprovechamiento de energía. Otra forma de medirlo es calculando el valor de los anchos de banda de los formantes. A mayor aprovechamiento de energía, menor valor del ancho de banda de los formantes y viceversa24,36.

Otro aspecto visible en el LPC es el formante del cantante, también conocido como singing formant o ring voice, caracterizado por un refuerzo de energía entre los 2400 y los 3800 Hz, dado por el efecto cluster de los formantes F3, F4 y F53235,37. También se halla en actores y hablantes de género masculino con entrenamiento vocal3740. Además de lo anterior, el LPC es un indicador efectivo en el estudio de la nasalización26,27 y para el análisis de la posición laríngea15.

V. ESPECTRO PROMEDIO A LARGO PLAZO (LTAS)

El LTAS (long term average spectrum) o LTASS (Long term average speech spectrum)41, es la representación del promedio de varios espectros sucesivos de la señal acústica, que utiliza ventanas cortas de 100 milisegundos41. Entrega información de la distribución frecuencial de la energía sonora43,44. Está representado el nivel de presión sonora en decibeles (eje vertical), y la frecuencia en Herzios (eje horizontal) (Figura 6)11,42,45.

Figura 6 LTAS de un texto. 

LTAS funciona mejor en emisiones largas, por lo que se recomienda tomar muestras de duración extensa: entre 20 segundos y 1 minuto39,44,46 para lograr mayor estabilidad de la voz. Puede aplicarse tanto en muestras de habla espontánea, lectura o canto41,42,47,48 y no se ve influenciado por parámetros de habla, acentuación, articulación o pausas39,45,48. Además, tiene la ventaja de no requerir una señal vocal periódica o cuasiperiódica para ser confiable49. Sin embargo, se afecta por variaciones en la sonoridad, aspecto inconveniente al momento de cotejar avances terapéuticos42.

LTAS es una herramienta útil para cuantificar la calidad vocal general44,45,4951 vinculando la contribución tanto de la fuente como del filtro39,51. Permite identificar diferencias de género51,52, edad, profesión, valorar la presencia de disfonía24,39,41,45,51,53, determinar la presencia de nasalidad27,41, soplosidad, tensión54,55, la aparición del formante del cantante, hablante y actor3740, analizar la posición laríngea41,55, los cambios en la sonoridad42, como método de seguimiento terapéutico55 y para comprobar la eficacia de las técnicas de entrenamiento o rehabilitación15.

A continuación se detallarán las mediciones que se pueden realizar con LTAS.

PROPORCIÓN ALFA

También conocido como alpha ratio (a ratio) o spectral tilt, corresponde a la medición de la pendiente espectral de la energía entre las regiones de 50Hz – 1 KHz y 1 KHz – 5 KHz39,43,50,52,5660.

Es usado en el diagnóstico y seguimiento de patologías de voz15,56 y se correlaciona con cambios en la calidad vocal56. El valor de la pendiente del gráfico será distinta en función de las características de la voz5053,57. En mujeres los valores alpha ratio son mayores que en hombres, no obstante existe gran variabilidad entre los resultados intersujeto60.

PROPORCIÓN L1-L0 (F1 - F0)

Su valor se relaciona con el modo de fonación61 y con la sonoridad51. Se obtiene midiendo la energía entre 300 Hz – 800 Hz y 50 Hz – 300 Hz51,59. Un valor significativamente mayor de L0 por sobre el L1 es indicativo de hipofunción vocal o soplosidad, en cambio un mayor valor de L1 por sobre L0, indica hiperfunción vocal o tensión fonatoria38,45,56,59.

PROPORCIÓN 1/5 – 5/8

Compara la energía sonora presente desde los 1 KHz – 5KHz, con la energía aperiódica presente desde los 5 KHz – 8 Khz. Su valor es utilizado para cuantificar los niveles de ruido y la soplosidad59,62. Un menor valor es equivalente a una energía espectral disminuída, en cambio un nivel alto es indicativo de mayor presencia de ruido59.

ENERGY RATIO

También llamado Singing Power Ratio (SPR), es un indicador de las características acústicas de la voz cantada43,63. Se obtiene calculando la diferencia entre el pico más alto entre los 2 KHz - 4KHz y el pico más alto entre los 0 Hz – 2 KHz43,6365. Puede medirse también con el espectro FFT63. Valores altos de SPR indican mayor energía en los armónicos altos, lo que se relaciona con voces cantadas o habladas de mejor calidad y entrenadas43.

EQUIVALENT SOUND LEVEL (Leq)

Medición estándar del nivel de intensidad promedio de toda la señal o sólo de algún segmento42,50,59. Cuando varía el Leq en una emisión, tiende a cambiar el trazado del LTAS en forma variable, sobre todo en las frecuencias altas42.

VI. CEPSTRUM

Se obtiene al aplicar dos FFT a la señal9,15,36,57,64. Se calcula como la transformada inversa de Fourier del logaritmo del espectro FFT9,36 (Figura 7). En el gráfico, se visualiza la quefrency en milisegundos (eje horizontal), y la amplitud en decibeles (eje vertical). Permite determinar el F0, mediante el análisis del pico de mayor amplitud presente en la escala temporal9. La amplitud del pico da información sobre el grado de perioricidad de la señal66 y su estructura armónica64, permitiendo valorar la calidad vocal, la presencia de disfonía y su grado de severidad20,36,6670. Un menor valor del cepstrum supone una voz menos estable, con menor energía o menos periódica57,64,70,71, al igual que un aumento de la anchura de su base20,66.

Figura 7 Cepstrum. 

La palabra cepstrum se origina al invertir las primeras cuatro letras de la palabra spectrum, algo similar ocurre con otras palabras usadas en este gráfico: Harmonic por Rahmonic, Frequency por Quefrency y Filtering por Liftering72.

CONCLUSIONES

El análisis acústico de la voz es una herramienta útil en el diagnóstico, rehabilitación e investigación vocal.

En la terapia fonoaudiológica, su aplicación resulta esencial para cuantificar la efectividad del tratamiento de voz y como mecanismo de retroalimentación en tiempo real. Para aplicarlo, es necesario conocer de física acústica, fisiología normal y fisiopatología laríngea con el fin de realizar una interpretación significativa de los hallazgos. A pesar de lo anterior, el análisis acústico de la voz aun no es lo suficientemente sofisticado para sustituir al oído bien entrenado, por consiguiente los resultados obtenidos tras su aplicación quedan supeditados al criterio clínico, y se deben vincular con otras evaluaciones.

BIBLIOGRAFÍA

1. Cobeta I, Nuñez F. Capítulo 9: Laboratorio de voz. Cobeta I, Nuñez F, Fernández S. Patología de la Voz, 1a ed. Barcelona: Marge Médica Books; 2013, p. 188-98. [ Links ]

2. Cobeta I, González-Herranz R, Casado J. Capítulo 5: Análisis acústico de la voz. Casado J, Adrián J. La evaluación clínica de la voz fundamentos médicos y logopédicos 1a ed. Málaga: Ediciones Aljibe; 2002, p. 93-107. [ Links ]

3. Tavares R, Monteiro N, Correia S, Costa S, Aguiar B, Macêdo J. Optimizing laryngeal pathology detection by using combined cepstral features. Proceedings of 20th International Congress on Acoustic ICA 2002. [ Links ]

4. Oguz H, Kilic M, Safak M. Comparison of results in two acoustic analysis programs: Praat and MDVP. Turk J Med Sci 2011; 41(5): 835-41. [ Links ]

5. Elisei N. Análisis acústico de la voz normal y patológica utilizando dos sistemas diferentes: Anagraf y Praat. Interdisciplinaria 2012; 29(2): 339-57. [ Links ]

6. Mendes A, Ferreira L, Castro E. Software e hardware de análise acústica da voz e da fala. Distúrb comun 2012; 24(3): 421-30. [ Links ]

7. Titze I, Verdolini K. Capítulo 5: Vocometry: instrumentation. En Vocology the science and practice of voice habilitation: National center for voice and speech; 2012, p. 166-75. [ Links ]

8. Farías P. Capítulo 2: Voz normal versus voz anormal clasificaciones de disfonías características vibratorias y síntomas. En Ejercicios que restauran la función vocal, 1a ed: Libreria Akadia Editorial; 2007, p. 88-94. [ Links ]

9. Jackson-Menaldi M. Capítulo 12: Aspectos generales del trabajo vocal. En La voz patológica, 1a ed: Médica Panamericana; 2002, p. 212-23. [ Links ]

10. Gonzalez J, Cervera T, Miralles J. Análisis acústico de la voz: fiabilidad de un conjunto de …. [ Links ]

11. FALTA TEXTO parámetros multidimensionales. Acta otorrinolaringol Esp 2002; 53: 256-68. [ Links ]

12. Boersma P, Weenink D. Praat: doing phonetics by computer [Programa computacional]. Versión 6.0.18, recuperado el 23 de mayo de 2016 desde http://www.praat.org/. [ Links ]

13. Boersma P. Capítulo 17: Acoustic analysis. Podesva R, Sharma D. Research methods in linguistics, 1a ed: Cambridge University Press; 2013. [ Links ]

14. Faúndez M. Capítulo 2: Tratamiento de voz. En Tratamiento digital de voz e imagen, 1a ed. México: Alfaomega Grupo Editor; 2001, p. 32-68. [ Links ]

15. Correa J. Manual de análisis acústico del habla con Praat. Bogotá: Instituto Caro y Cuervo, imprenta Patriótica; 2014, pp. 38-64. [ Links ]

16. Droguett Y. Laboratorio y análisis acústico de la voz. En Seminario de Voz CEFUA; 2015. Universidad Autónoma de Chile, Santiago de Chile. [ Links ]

17. Cecconello L, Golub N. Inicio vocal predominante en niños. Fonoaudiológica revista digital ASALFA 2008; 54(1): 57-67. [ Links ]

18. Sundberg J. The science of singing voice. Dekalb, IL: Northern Illinois. University Press; 1987, p. 49-133. [ Links ]

19. Nuñez F. Análisis del timbre: espectrografía clínica de la voz. Casado J, Adrián J. La evaluación clínica de la voz fundamentos médicos y logopédicos Málaga: Ediciones Aljibe; 2002, p. 93-107. [ Links ]

20. Chen G, Park S, Kreiman J, Alwan A. Investigating the effect of F0 and vocal intensity on harmonic magnitudes: Data from high-speed laryngeal endoscopy. Interspeech 2014, pp. 1668-72. [ Links ]

21. Alonso J, Ferrer M, León J, Travieso C. Cuantificación de la calidad de la voz para su evaluación clínica por medio del análisis acústico. IV jornadas de tecnología del habla; 2006, Zaragoza. [ Links ]

22. Titze I. Workshop on acoustic voice analysis. National center for voice and speech [ Links ]

23. Gordon M, Ladefoged P. Phonation types: a cross linguistic overview. Journal of Phonetics 2001; 29(4): 383-406. [ Links ]

24. Boone D, Mcfarlane S, Von Berg S, Zraick R. Capítulo 6: Evaluation of the voice. En The voice and voice therapy, 9th ed: Pearson; 2014, p. 154. [ Links ]

25. Cecconello L. Capítulo 3: Parámetros acústicos. En Aplicación del análisis acústico en la clínica vocal. Trabajando con Anagraf, 1a ed. Argentina: Libreria Akadia, p. 19-27. [ Links ]

26. Nuñez F, Díaz J, García I, Moreno A, Costales M, Moreno C, Martínez P. El espectrograma de banda estrecha como ayuda para el aprendizaje del método GRBAS de análisis perceptual de la disfonía. Acta Otorrinolaringol Esp 2012; 63(3): 173-9. [ Links ]

27. Cecconello L, Maldonado M, Gurlekian J. Indicadores acústicos de nasalidad en niños cantantes. Revista de la federación argentina de sociedades de otorrinolaringología 2011; 18(11): 68. [ Links ]

28. Molina N, Méndez M. Características acústicas objetivas de la nasalidad. Revista de la federación argentina de sociedades de otorrinolaringología 2006; 60(2): 119-22. [ Links ]

29. Yumoto E, Gould W, Baer T. Harmonics-to-noise ratio as an index of the degree of hoarseness. J Acou Soc Am 1982; 71(6): 1544- 50. [ Links ]

30. Morrison M, Rammage L. Anatomía y fisiología de la producción de la voz. En Tratamiento de los trastornos de la voz, 1a ed: Masson; 1996, p. 213-21. [ Links ]

31. Cordeiro H, Fonseca J, Ribeiro C. LPC spectrum first peak analysis for voice pathology detection. Procedia technology 2013; 9(2013): 1104-11. [ Links ]

32. Latorre C. Comportamiento de los formantes y vocales respecto a la apertura mandibular y el género. Fonoaudiología Iberoamericana Areté 2008; 8(1), 27-40. [ Links ]

33. Sundberg J. The acoustic of the singing voice. Sci Am 1977; 236(3): 104-16. [ Links ]

34. Olivera G, Orduña F. Evocanto: programa de cómputo para analizar la voz cantada mediante técnicas de procesamiento digitales de señales. Computación y sistemas 2011; 15(1): 39-50. [ Links ]

35. Wicklund K. The normal voice: anatomy and physiology. En Singing voice rehabilitation, 1a ed: Delmar, Cengage Learning; 2010, p. 31-2. [ Links ]

36. Jackson-Menaldi M. Capítulo 5: Análisis y características de la voz hablada y cantada. En La voz normal, 1a edicion. Buenos Aires: Ed. Médica Panamericana; 2005, p, 181. [ Links ]

37. Gurlekian J, Molina N. Índice de perturbación, de precisión vocal y de grado de aprovechamiento de energía para la evaluación del riesgo vocal. Revista de logopedia, foniatría y audiología 2012; 32(4): 156-63. [ Links ]

38. Leino T, Laukkanen A, Radolf V. Formating of the actor's/speaker's formant: a study applying spectrum analysis and computer modeling. Journal of voice 2011; 25(2): 150-8. [ Links ]

39. Leino T. Long-term average spectrum study on speaking voice quality in male actors. SMAC 93. Proceedings of the Stockholm Music Acoustics Conference. Sweden; 28 Julio – 1 Agosto, 1993. pp. 206-10. [ Links ]

40. Master S, De Biase N, Madureira S. What about the “actor's formant” in actresses voices? Journal of voice 2012; 26(3): 117-22. [ Links ]

41. Bele I. The Speaker's Formant. Journal Of Voice 2006; 20(4): 555-78. [ Links ]

42. Cecconello L, Gurlekian J. Espectro promedio de largo plazo en niños. 2° manual de la asociación argentina de otorrinolaringología y fonoaudiología pediátrica 2009; 2: 88-100. [ Links ]

43. Nordenberg M, Sundberg J. Effect on LTAS of vocal loudness variation. Logoped Phoniatr Vocol 2004; 29: 183-91. [ Links ]

44. Watts C, Barnes-Burroughs K, Estis J, Blanton D. The singing power ratio as an objetive measure of singing voice quality in untrained talented and nontalented singers. Journal of voice 2006; 20(1): 82-8. [ Links ]

45. Leino T. Long-term average spectrum in screening of voice quality in speech: untrained male university students. Journal of voice 2009; 23(6): 671-76. [ Links ]

46. Master S, De Biase N, Pedrosa V, Chari B. O espectro médio de longo termo na pesquisa e na clínica fonoaudiológica. Prófono Revista de Atualizaçao Científica 2006; 18(1): 111-20. [ Links ]

47. Le Huche F, Allali A. La Voz: patología de origen funcional. Tomo II, 2a ed: Masson: 2003, p. 43. [ Links ]

48. Löfqvist A, Mandersson B. Long-time average spectrum of speech and voice analysis. Folia phoniatrica et logopaedica 1987; 39(5): 221-9. [ Links ]

49. Ternström S. Long-time average spectrum characteristics of different choirs in different rooms. British voice association 1993; 2: 55-77. [ Links ]

50. Houtz D, Roy N, Merril R, Smith M. Differential diagnosis of muscle tension dysphonia and adductor spasmodic dysphonia using spectral moments of the long-term average spectrum. The laryngoscope 2010; 120: 749-57. [ Links ]

51. Kitzing P. LTAS criteria pertinent to the measurement of voice quality. Journal of phonetics 1986; 14: 477-82. [ Links ]

52. Torres P, Master S, Andreoni S, Pontes P, Ramos L. Acoustic and long-term average spectrum measures to detect vocal aging in women. Journal of voice 2011; 25(4): 411-9. [ Links ]

53. Mendoza E, Valencia N, Muñoz J, Trujillo H. Differences in voice quality between men and women: use of the long-term average spectrum (LTAS). Journal of voice 1996; 10(1): 59-66. [ Links ]

54. Weingartová L, Volín J. Short-term spectral slope measures and their sensitivity to speaker, vowel identity and prominence. Akustické listy 2014; 20(1): 5-12. [ Links ]

55. Deirdre M, Heman-Ackah Y, Goding G. Correlations between measures of cepstral peak prominence, long-term average spectrum, and perceptual ratings of dysphonia in persons with glottic incompetence. Voice foundation's 30th Annual symposium: care of the professional voice, 2001. [ Links ]

56. Camargo Z, Spínola G, Cukier S. Parãmetros perceptivo-auditivos e acústicos de longo termo da qualidade vocal de individuos disfõnicos. Rev CEFAC, 2004; 6(2): 189-96. [ Links ]

57. Frøkjaer-Jensen B, Prytz S. Registration of voice quality. Bruel Kjaer Technol Rev 1976; 3: 3-17. [ Links ]

58. Hillenbrand J. Acoustic analysis of voice: a tutorial. Department of speech pathology and audiology Western Michigan University Kalamazoo. [ Links ]

59. Tamarit L, Goudbeek M, Scherer K. Spectral slope measurements in emotionally expressive speech. ISCA tutorials and research workshop, Aalborg, Denmark, 2008. [ Links ]

60. Guzmán M, Correa S, Muñoz D, Mayerhoff R. Influence on spectral energy distribution of emotional expression. Journal of voice 2012; 27(1): 129.e1-129.e10. [ Links ]

61. Johnsi R, Supraja A, Savithri S. Long term average spectral (LTAS) measures in children and adults - a normative study. Proceedings of FRSM-2008 SCVRCPM. [ Links ]

62. Gauffin J, Sundberg J. Data on the glottal voice source behaviour in vowel production. Speech transmission laboratory – Quarterly progress and status report, Nos 2-3, 61-70. [ Links ]

63. Yanagihara N. Significance of harmonic changes and noise components in hoarseness. J Speech Lang Hear Res 1967; 10: 531-41. [ Links ]

64. Omori K, Kacker A, Carroll L, Riley W, Blaugrund S. Singing power ratio: quantitative evaluation of singing voice quality. Journal of voice 1996; 10(3): 228-35. [ Links ]

65. Guzmán M, Malebrán M, Zavala P, Saldívar P, Muñoz D. Cambios acústicos de la voz como signos de fatiga vocal en locutores de radio: resultados preliminares. Acta otorrinolaringol Esp 2013; 64(3): 176-83. [ Links ]

66. Cecconello L, Golub N, Moreno A, Master S. Desarrollo del formante del cantante mediante un ejercicio de tracto vocal semi-ocluído. Jornada internacional de integración de profesionales de la voz cantada. Memoria. Ed: FIVCH, pp.140-150. [ Links ]

67. Cecconello L, Farías P, Gurlekian J. Aplicación del cepstrum en la clínica vocal. Revista de la federación argentina de sociedades de otorrinolaringología, Edición especial 30° congreso argentino de otorrinolaringología. 2008; 15(1): 12-14. [ Links ]

68. Cecconello L, Farías P, Gurlekian J, Elisei N. El cepstrum como indicador de la calidad vocal. XIX world congress of otorhino-laryngology-IFOS Brazil. 2009. [ Links ]

69. Heman-Ackah Y, Heuer R, Michael D, Ostrowski R, Horman M, Baroody M, Hillenbrand J, Sataloff R. Cepstral peak prominence: a more reliable measure of dysphonia. Ann Otol Rhinol Laryngol, 2003; 112(4): 324-33. [ Links ]

70. Zieger K, Schneider C, Gerull G, Mrowinski D. Cepstrum analysis in voice disorders. Folia phoniatrica et logopaedica, 1995, 47(4): 210-7. [ Links ]

71. Dejonckere P. Cepstral voice analysis: link with perception and stroboscopy. Revue de laryngologie-rhinologie, 1998; 119(4): 245. [ Links ]

72. Balasubramanium R, Bhat J, Fahim S, Raju R. Cepstral analysis of voice in unilateral adductor vocal fold palsy. Journal of voice, 2010; 25(3): 326-9. [ Links ]

73. Randall R. A history of cepstrum analysis and its application to mechanical problems. Proceedings Surveillance 7, presented at Surveillance 7 – International conference, France, 2013. [ Links ]

Recibido: 24 de Julio de 2016; Aprobado: 09 de Abril de 2017

Dirección: Yoel Droguett G. Universidad Viña del Mar, Chile E mail: yoel.droguett@voicelife.cl

Creative Commons License This is an Open Access article distributed under the terms of the Creative Commons Attribution License, which permits unrestricted use, distribution, and reproduction in any medium, provided the original work is properly cited.