SciELO - Scientific Electronic Library Online

 
 número43Metatextos literarios de la vanguardia chilena (1914-1938)Reflexiones sobre identidades contemporáneas a partir de No Telephone to Heaven índice de autoresíndice de materiabúsqueda de artículos
Home Pagelista alfabética de revistas  

Servicios Personalizados

Revista

Articulo

Indicadores

Links relacionados

Compartir


Estudios filológicos

versión impresa ISSN 0071-1713

Estud. filol.  n.43 Valdivia sep. 2008

http://dx.doi.org/10.4067/S0071-17132008000100013 

ESTUDIOS FILOLOGICOS 43: 179-190, 2008

 

Inteligibilidad acústica en español: una propuesta para su medición*

Acoustic intelligibility in Spanish: a proposal for its measurement

 

Claudia Rosas1, Jorge Sommerhoff2

1 Universidad Austral de Chile, Instituto de Lingüística y Literatura, Apartado postal 567, Valdivia, Chile, e-mail: claudiarosas@uach.cl
2
Universidad Austral de Chile, Instituto de Acústica, Apartado postal 567, Valdivia, Chile,e-mail: jsommerh@uach.cl


El presente trabajo analiza el comportamiento de una lista de 1200 logatomos en español de estructura CVC (Consonante + Vocal + Consonante) con el objeto de elaborar varias listas de logatomos que permitan medir el porcentaje de articulación, como característica de calidad acústica de una sala para la voz hablada, y cuyos resultados sean comparables con las mediciones de STI. Como resultado se obtiene un corpus de 850 logatomos con los cuales se confeccionaron 17 listas de prueba de 50 logatomos cada una.

Palabras clave: inteligibilidad, mediciones, logatomos en español.


This work analyzes the behavior of a list of 1200 Spanish logatoms with a CVC (Consonant + Vowel + Consonant) structure in order to elaborate several lists of logatoms that allow for the measurement of articulation percentage, as characteristic of the acoustic quality of a room for the spoken word, and whose results are comparable with the measurements of STI. As a result, a corpus of 850 logatoms is obtained, with which 17 test lists of 50 logatoms were made.

Key words:intelligibility, measurements, Spanish logatoms.


 

1. Introducción

Se define la inteligibilidad del habla como una medición de la efectividad para comprender la voz hablada1. Los procedimientos utilizados para ello se clasifican en dos tipos: subjetivos y objetivos. El método subjetivo consiste en contar los aciertos transcritos de un dictado de segmentos (sílabas, palabras o frases). El resultado de este procedimiento, conocido como test de articulación2, depende fundamentalmente de dos variables: el corpus –la lista de segmentos– y la administración de la prueba o test. (Cf. Egan, J.P. 1948). El método objetivo, por su parte, utiliza máquinas, cuyos resultados se correlacionan con los obtenidos mediante el método subjetivo. Uno de los tests objetivos más utilizado corresponde al STI (Speech Transmition Index) desarrollado por Houtgast y Steeneken (1973). El STI es una técnica de medición que determina el grado de disminución que sufre la amplitud de la modulación de la señal sonora de prueba que se entrega a la sala, producto de la reverberación y ruido que existe en ella. Y esta diminución producida en el punto de recepción está directamente relacionada con la pérdida de inteligibilidad, cuyos resultados se distribuyen en una escala que va desde 0 (ininteligibilidad absoluta) a 1 (inteligibilidad absoluta).

A continuación, la siguiente figura 1 muestra la relación obtenida por Houtgast y Steeneken (1985) en el idioma inglés entre el sistema de prueba y el porcentaje de inteligibilidad medido utilizando un listado logatomos con estructura CVC (Consonante + Vocal + Consonante) y STI.


Dado que la prueba subjetiva de logatomos3 en el idioma español también es dependendiente del corpus utilizado (Cf. Sommerhoff y Rosas 2007: 224), en este trabajo se elaboró un corpus ad hoc con el objeto de obtener resultados para el español, en función del STI, semejantes a los que se obtienen de las listas del idioma inglés, establecidas por Houtgast y Steeneken.

2. metodología

2.1. El Corpus

El corpus utilizado para medir la inteligibilidad está formado por 1200 logatomos de estructura CVC (Consonante + Vocal + Consonante) que incluye todas las combinaciones CVC fonéticamente posibles del español, representados en ortografía normal. Este corpus se presenta en cinco tablas, donde la tabla 1 corresponde a la vocal "a" de la estructura CVC, la tabla 2 corresponde a la vocal "e" de la estructura CVC, y así sucesivamente hasta la vocal "u". Las filas de cada tabla se refieren a la primera consonante de CVC y las columnas a la segunda consonante de CVC. Los casilleros en blanco señalan combinaciones de consonantes no utilizadas, ya que coinciden fonéticamente con otras consonantes. Los casilleros con números y las sombras en algunos de ellos, corresponden a resultados que se explicarán más adelante.



2.2. Materiales y Métodos

La metodología general seguida para la realización del objetivo propuesto consideró tres aspectos: constitución del corpus inicial; administración de la prueba, y obtención del corpus final. Cada uno, a su vez, consideró una serie de tareas específicas como se describe a continuación.

2.2.1. Constitución del corpus inicial

2.2.1.1. Formación del corpus ad hoc: se construyó un corpus de 1200 logatomos de estructura CVC (Consonante + Vocal + Consonante) que incluye todas las combinaciones posibles del español.

2.2.1.2. Distribución del corpus: el corpus inicial de 1200 logatomos se dividió en doce listas de cien unidades cada una.

2.2.1.3. Digitalización de las listas: las listas ordenadas fueron grabadas en una sala anecoica con una separación de 1,5 s entre cada logatomo, a las que se agregaron frases introductorias ("pongan atención", "ahora escuchen", "escuchen a continuación", etc). Finalmente, se digitalizó la potencia acústica, ajustándola a la de la voz de una persona normal.

2.2.2. Administración de la prueba

2.2.2.1. Selección de los auditores: se utilizaron 30 estudiantes universitarios, de ambos sexos, sanos auditivamente y elegidos al azar, los cuales se distribuyeron en seis grupos de cinco individuos cada uno. Se les explicó el procedimiento y propósito de la tarea, como se detalla más adelante.

2.2.2.2. Selección de los recintos: se eligieron salas con un STI entre 0.38 y 0.7, rango de valores donde más claramente se manifiestan las diferencias de la relación entre STI y % de articulación, del corpus utlizado. Los recintos ad hoc utilizados se encuentran en Campus miraflores4 y en el Campus Teja de la Universidad Austral de Chile.

2.2.2.3. Selección de los instrumentos de medición: para medir el STI se utilizó el medidor nTI Acoustilyzer junto con la fuente sonora nTI Talk box que imita la voz humana (tanto en su potencia acústica como en su directividad) y que, gracias a su tarjeta Compact Flash, permite el almacenamiento de las señales que emite, en nuestro caso: STI y corpus de logatomos.

2.2.2.4. Aplicación de la prueba: los auditores se distribuyeron en distintos puntos de recepción de las salas desde donde escribieron las palabras escuchadas, en plantillas adaptadas al propósito. En esos mismos lugares se midió el STI de acuerdo al montaje que se muestra en la figura 2.


2.2.3. Obtención del corpus final

2.2.3.1. Análisis comparativo de las mediciones: los porcentajes de inteligibilidad obtenidos en la prueba de articulación fueron pareados con los resultados del STI.

2.2.3.2. Afinación del corpus final: se fueron eliminando sucesivamente los logatomos más difíciles de escuchar hasta lograr un nivel semejante al obtenido por Houtgast y Steeneken en la curva de relación entre STI y % de articulación, con un total de 850 logatomos.

Presentación del corpus: el corpus final obtenido se divide en 17 listas de 50 logatomos balanceadas en cuanto a criterios de composición fonética CVC y grado de dificultad observado.

Resultados

En los casilleros de tablas 1, 2, 3, 4 y 5 se indica el porcentaje global de aciertos, considerando la totalidad de las pruebas realizadas. Este resultado es indicativo de la dificultad relativa que existe entre cada logatomo CVC de ser escuchado con claridad en distintas condiciones acústicas. Así, por ejemplo, el logatomo JAb (con un 29% de aciertos) es más difícil de escucharlo en condiciones acústicamente adversas que el logatomo LUm (con un 89% de aciertos).





Los errores observados que se cometen al escuchar los logatomos pueden ser de cinco tipos, los cuales se identifican en la tabla 6.


De acuerdo a esta clasificación, el porcentaje de error cometido en cada categoría de distribución del corpus seleccionado se muestra en la tabla 7. En esta tabla se evidencia que el gran porcentaje de los errores ocurre al escuchar las consonantes y, principalmente, al escuchar la segunda consonante del logatomo con estructura CVC5.


Este resultado es coherente con lo publicado por Peutz (1971: 23-27) donde se establece que la pérdida de articulación de las consonantes está relacionada en una forma simple con la acústica de la sala y la relación señal-ruido, y por lo tanto, puede ser utilizada como una medida confiable de la inteligibilidad del habla. También, está claro que el mayor número de errores ocurre al escuchar la segunda consonante de CVC puesto que está precedida por la primera consonante y vocal, que se mantienen en la sala debido a la reverberancia del recinto, enmascarándola más o menos según su tiempo de reverberación. De esto se concluye que las listas deben estar balanceadas fonéticamente con la segunda consonante.

La figura 3 muestra el resultado de la relación de entre el % de inteligibilidad y el STI medidos para el conjunto de los 1200 logatomos CVC, para el conjunto de 1000 logatomos de mayor acierto, para el conjunto 950 logatomos de mayor acierto, para el conjunto 900 logatomos de mayor acierto y para el conjunto 850 logatomos de mayor acierto, todos ellos en comparación con la curva de Houtgast y Steeneken.

Dado que la curva de resultado del conjunto de los 1200 logatomos está bajo la curva de Houtgast y Steeneken, se procedió a eliminar paulatinamente los logatomos con menor acierto, hasta lograr una curva con una altura semejante, como se muestra en la figura 3.


Así, se determinó que la curva que considera a los 850 logatomos con mayor acierto es la más cercana a la de Houtgast y Steeneken como se muestra en la figura 4.


A continuación, la tabla 8 muestra la distribución balanceada de las segundas consonantes de cada lista. Se observa que en cada fila (consonante), la diferencia de ocurrencia de cada consonante entre las distintas columnas (listas) nunca es mayor a 1, excepto en la fila de la consonante F donde en un solo caso alcanza la diferencia de 2.


También se ha balanceado el grado de dificultad de cada lista y ordenado aleatoriamente los logatomos en cada una de ellas. La figura 5 muestra las curvas de mejor ajuste de cada lista en su correlación con el % de articulación y STI, y comparadas con la curva de Houtgast y Steeneken.


Finalmente, la siguiente tabla muestra las 17 listas finales de 50 logatomos cada una.


4. Balance

En este trabajo se ha aplicado la medición de la inteligibilidad con empleo de un corpus inicial adecuado al español panhispánico de 1200 logatomos que representan de manera exhaustiva las combinaciones posibles de estructura Consonante + Vocal + Consonante existentes en él. Los resultados de estas mediciones han sido pareados con los resultados de las mediciones de STI, junto con los porcentajes de medición subjetiva del inglés según las listas establecidas por Houtgast y Steeneken. Lo anterior ha permitido proponer un nuevo corpus para evaluar la inteligibilidad del español de 850 logatomos que conserva la estructura CVC, clasificados en 17 listas fonéticamente balanceadas que tienen en cuenta, de acuerdo a lo constatado en este mismo trabajo, especialmente la importancia de la segunda consonante en el grado de efectividad de los resultados.

Finalmente, con el objeto de afinar esta propuesta y hacerla funcionalmente equivalente al STI para la medición acústica de los recintos, en español, se ha empezado a trabajar en la actualidad, en tareas de aplicación y evaluación del corpus diseñado.

 

Notas

1 Se ha utilizado "inteligibilidad del habla" en el sentido más tradicional y amplio que esta formulación tiene en el estudio de la voz: capacidad de comprensión del material lingüístico (Cf. Llisterri 1991: 118 y 119).

2 El uso extendido del término "prueba de articulación" permite aludir inequívocamente a los métodos subjetivos que utilizan en sus mediciones de inteligibilidad seres humanos que transcriben lo que oyen o lo que alguien "articula" frente a los denominados métodos objetivos que utilizan máquinas (Cf. Gavilán 1988: 244).

3 Palabras sin sentido, pero que formalmente se ajustan al sistema de una lengua cualquiera (por ejemplo: charchar, criso que son palabras inventadas en español) (Cf. Llisterri 1991: 71).

4 Posteriormente demolidos en febrero de 2007.

5 Sobre la incidencia de las características articulatorias en el porcentaje de inteligibilidad ver: ¿Existe la inteligibilidad absoluta? fonemas críticos en español (Sommerhoff y Rosas, en preparación).

 

Obras citadas

Egan, FP. 1948. "Articulation testing methods". Laryngoscope 58: 955-991.         [ Links ]

Gavilán, J. 1988. Fonoaudiología para educadores. madrid: Universidad nacional de Educación a Distancia.         [ Links ]

Houtgast, T. y J. m. Steeneken. 1973. "The modulation Transfer Function in room acoustics as a predictor of speech intelligibility". Acustica, 28 (1): 66-73.         [ Links ]

_____1985. "The modulation Transfer Function mDT in room acoustics". B & K Tech. Rev., 3, 3-29.         [ Links ]

Llisterri, J. 1991. Introducción a la fonética: el método experimental. barcelona: Editorial Anthropos.         [ Links ]

Peutz, V.m.A. 1971. "Articulation loss of consonants as a criterion for speech transmission in a room", Journal of Audio Engineering Society. V. 19, nº 11: 23-27.         [ Links ]

Sommerhoff, J. y C. Rosas. 2007. Evaluación de la inteligibilidad del habla. Estudios Filológicos 42: 215-225.         [ Links ]

_____(en preparación). "¿Existe la inteligibilidad absoluta? fonemas críticos en español"         [ Links ].


* Este trabajo ha sido elaborado en el marco del proyecto de investigación Fondecyt 1070210 (Investigadora Responsable C. Rosas y Coinvestigador J. E. Sommerhoff). Para ello se han utilizado datos provenientes de un proyecto interno anterior Ref.: DID UACh S-2005-50 financiado por la Universidad Austral de Chile (Investigador Responsable J. E. Sommerhoff).

Creative Commons License Todo el contenido de esta revista, excepto dónde está identificado, está bajo una Licencia Creative Commons