SciELO - Scientific Electronic Library Online

 
vol.48 número89Indicadores de cambio temático en el discurso parlamentario: Análisis de un discurso de Rodríguez Zapatero [2011]Impacto de una intervención lingüística en la comprensión inferencial retórica y la metacognición durante la lectura académica en inglés lengua extranjera: Un estudio cuasi-experimental con métodos mixtos índice de autoresíndice de materiabúsqueda de artículos
Home Pagelista alfabética de revistas  

Servicios Personalizados

Revista

Articulo

Indicadores

Links relacionados

  • En proceso de indezaciónCitado por Google
  • No hay articulos similaresSimilares en SciELO
  • En proceso de indezaciónSimilares en Google

Compartir


Revista signos

versión On-line ISSN 0718-0934

Resumen

MOLINA SALINAS, Claudio  y  SIERRA MARTINEZ, Gerardo. Towards a frequency normalization of CREA and CORDE corpora. Rev. signos [online]. 2015, vol.48, n.89, pp.307-331. ISSN 0718-0934.  http://dx.doi.org/10.4067/S0718-09342015000300002.

CORDE (Corpus Diacrónico del Español) and CREA (Corpus de Referencia del Español Actual) are two of the largest and most frequently used databases in the study of the Spanish language. However, they have some limitations in terms of size, sample unit and representativeness that may influence the results of studies and descriptions of linguistic phenomena. In this paper we identify these limitations and propose a method for the normalization of document frequencies by computing moving averages. We show how this method allows for a more realistic interpretation of corpus data and, thus, a more effective use of these resources.

Palabras clave : Corpus linguistics; corpus statistics; corpus frequency normalization; quantitative linguistics; CORDE and CREA corpora.

        · resumen en Español     · texto en Español     · Español ( pdf )

 

Creative Commons License Todo el contenido de esta revista, excepto dónde está identificado, está bajo una Licencia Creative Commons