SciELO - Scientific Electronic Library Online

 
vol.21 número1Parámetros que Afectan la Corriente de Neutro en Presencia de Armónicos índice de autoresíndice de materiabúsqueda de artículos
Home Pagelista alfabética de revistas  

Servicios Personalizados

Revista

Articulo

Indicadores

Links relacionados

Compartir


Información tecnológica

versión On-line ISSN 0718-0764

Inf. tecnol. v.21 n.1 La Serena  2010

http://dx.doi.org/10.4067/S0718-07642010000100013 

Información Tecnológica-Vol. 21 Nº1-2010, pág.: 91-99
doi:10.1612/inf.tecnol.4134it.08

ARTICULOS VARIOS

Weibull_fit.xla: Programa para el Ajuste Óptimo dela Función de Densidad de Probabilidad Weibull de Tres Parámetros

Weibull_fit.xla: Software for Optimum Adjustment of the Probability Density Function Weibull 3P 

Oscar S. Vallejos y Darío M. Aedo
Universidad de Talca, Facultad de Ciencias Forestales, Departamento de Producción Forestal, 2 Norte 685, Talca-Chile (e-mail: ovallejo@utalca.cl)


Resumen

En este trabajo se da a conocer el programa de dominio público denominado Weibull_fit.xla que amplió la propuesta original de los autores. La nueva propuesta considera como función objetivo, además de la prueba de Kolmogorov-Smirnov, las restantes pruebas de bondad de ajuste y el índice de error. Se introdujo esta modificación por la incorporación del índice de error que trabaja con clases diamétricas y porque matemáticamente es posible obtener resultados negativos del parámetro de localización. Como ejemplo se modelaron los diámetros de árboles de una parcela de Pinus radiata (D. Don) con el método de los momentos, considerando cada indicador de error. Se concluye que el programa Weibull_fit.xla es una herramienta computacional que permite estimar los parámetros de las función Weibull 3P que minimizan los estadígrafos de las pruebas de bondad de ajuste o del índice de error.

Palabras clave: Weibull_fit.xla, ajuste óptimo, función densidad, Weibull 3P, diámetro de árboles


Abstract

The probability density function Weibull 3P is broadly used in the literature to represent continuous data. Most of the software that adjusts this distribution utilizes a specific parameter estimation method that calculates values for only two parameters, assuming the value for the third one. On the other hand, the generated public domain program calculates the three parameters that minimize the chosen error indicator (six in total) for the selected parameter estimation method (four in total). The potential error indicators to be used are associated with the statistic scores of five goodness-of-fit and the index of error. As an example the tree diameters data of a Pinus radiata (D. Don) plot was modeled by the moment method, considering each of the error indicators. In each adjustment was verified that the minimum error was reached for the calculated parameters.

Keywords: Weibull_fit.xla, optimum fitting, density function, Weibull 3P, tree diameter


INTRODUCCIÓN

La función de densidad de probabilidad  (fdp) Weibull (1) fue propuesta inicialmente por Fisher y Tippet en el año 1928. Esta función adoptó el apellido del físico sueco Waloddi Weibull, quien la difundió a partir del año 1939 en estudios de resistencia de materiales (Johnson et al., 1994), siendo ampliamente usada en distintas áreas del conocimiento para modelar datos continuos. Su amplia utilización radica en la representación de diversas formas, de este modo si el parámetro de forma es menor que uno la forma será decreciente, si es uno la forma será exponencial, si es dos la forma será Rayleigh, si es tres coma seis la forma será normal y si es mayor que tres coma seis la forma será normal pero con asimetría negativa (Nord-Larsen y Cao, 2006). Además posee integral definida (2) permitiendo el cálculo confiable de probabilidades (Borders et al., 1987). Finalmente, Liu et al. (2004) y Mehtätalo (2004) resaltan la relativa facilidad para estimar sus parámetros.

(1)

   

(2)

Donde a, b y c son los parámetros de localización, escala y forma respectivamente y x es una variable continua.

En el sector forestal los precursores de la utilización de esta fdp fueron Bailey y Dell en el año 1973. Su uso en este sector se ha concentrado en modelar la estructura de los rodales, pudiendo conocer la frecuencia relativa y acumulada de los diversos tamaños de los árboles (Prodan et al., 1997). El tamaño de los árboles, es decir la variable x continua de la función, corresponde mayoritariamente al diámetro a la altura del pecho (DAP) de los árboles medidos en cada unidad muestral. Diversos  autores han comprobado que la fdp Weibull caracteriza de manera confiable los rodales considerados en sus investigaciones (Jiang y Brooks, 2009; Breidenbach et al., 2008; Castedo-Dorado et al., 2007; Palahi et al., 2007; Vallejos, 2003)

Si bien es cierto que conocer los parámetros de la fdp en un momento dado es importante, aún más relevante es poder proyectar el tamaño de los árboles en el tiempo (Prodan et al., 1997). Una de las técnicas usadas es el método de predicción de parámetros, el cual consiste en relacionar los parámetros de la fdp con variables que caracterizan el rodal. Diversos autores han utilizado este método con la fdp Weibull caracterizando de manera confiable los rodales considerados en sus investigaciones (Nord-Larsen y Cao, 2006 y  Palahi et al., 2006)

Para estimar los parámetros de esta fdp se han descrito diversos métodos de estimación, algunos de ellos tienen larga data de publicación, ya que son procedimientos matemáticos validados hace mucho tiempo. Se puede mencionar entre otros (Tabla 1): el método híbrido descrito por Cao (2004), el método de máxima verosimilitud descrito por Johnson et al. (1994), el método de los momentos descrito por Cao (2004) y el método de los percentiles descrito por Scolforo (1998).

En los métodos de estimación de la Tabla 1 es necesario asumir un valor para el parámetro de localización. Este parámetro ha sido considerado como un porcentaje del DAP mínimo; frecuentemente se ha utilizado el valor 0.50 (Frazier, 1981,  citado por Cao, 2004; Hawkins et al., 1988 y Liu et al., 2004). Otros porcentajes empleados han sido: 0.00, 0.33,  0.66 y 1.00 (Liu et al., 2004). Nepal y Somers (1992) asumen que el parámetro de localización es el límite inferior de la primera clase diamétrica. Finalmente se ha propuesto que este parámetro se obtenga restando una constante al DAP mínimo, cuyos valores han sido: 0.5; 1.0, 1.5 y 2.0 cm (Zhang et al., 2003).

Tabla 1: Métodos de estimación de parámetros de la fdp Weibull 3P

Método y autor

Expresión

Híbrido

(Cao, 2004)

   

Máxima verosimilitud

(Johnson et al. 1994)

   

Momentos

(Cao, 2004)

   

Percentiles

Scolforo (1998)

Donde x es la variable continua en estudio, n es la cantidad total de observaciones, xi es la observación i-ésima de la variable x, xq es la media cuadrática de la variable x, es la media aritmética de la variable x, Gi es la función gamma de G(1 + i/c), x93 es el valor de la variable x al percentil 93, xxj es ln(-ln(1- j / 10)) e yj es ln(xj), siendo j = 10, 20, ..., 80, 90 percentiles.

Vallejos (2003), definió un método numérico que estima incluso el parámetro de localización, evitando el uso de un supuesto que limitaba las capacidades de ajuste de la función. Vallejos et al. (2004) indican que mediante un proceso iterativo de búsqueda binaria usando el algoritmo Newton-Raphson, se calculan los tres parámetros (4), dependiendo del método de estimación seleccionado (Tabla 1), que minimizan el estadístico Dn de la prueba de bondad de ajuste de Kolmogorov-Smirnov (3). También, Chen (2006) utilizó este algoritmo para el ajuste de la fdp Lognormal de tres parámetros.

Función objetivo: Minimizar

(3)

Sujeto a:

0

a

DAP mínimo

 

(4)

   

b

0

   
   

c

0

   

Donde i varía entre 1 a n (contador desde el menor al mayor valor del DAP) y que ya fue definido en la ecuación 2.

La presente publicación da a conocer el programa de dominio público denominado Weibull_fit.xla que amplió la propuesta original de Vallejos (2003) y Vallejos et al. (2004), ya que considera como función objetivo (Tabla 2), además de la prueba de Kolmogorov-Smirnov las restantes pruebas de bondad de ajuste (Anderson-Darling, Kuiper, Cramer-Von Mises y Watson) y el índice de error (Reynolds et al. 1988). Además se modificó la restricción asociada al parámetro de localización, ya que este podrá ser menor o igual que el límite inferior de la primera clase diamétrica. Se introdujo esta modificación por la incorporación del índice de error que trabaja con clases diamétricas y porque matemáticamente es posible obtener resultados negativos del parámetro de localización.

Tabla 2: Descripción de la función objetivo

Función objetivo

Expresión

Pruebas de

bondad de

ajuste

Kolmogorov-Smirnov

Anderson-Darling

Kuiper

Cramer-Von Mises

Watson

Índice de error

 

Donde  es el promedio de los ,  y  son el número de elementos medidos y estimados respectivamente en la clase j y k es el total de clases (como la información continua puede ser muy extensa, la variable DAP se discretiza generando clases diamétricas de amplitud predefinida)

MÉTODOLOGIA

Weibull_fit.xla fue programado en Microsoft Visual Basic 6.3, que una vez instalado se presenta como un menú desplegable en Microsoft Excel (Figura 1). El programa puede solicitarse gratuitamente llenando el formulario de contacto disponible en:

http://www.cienciasforestales.cl/contacto/demo.php.

En la Figura 2 se presenta la secuencia de programación de Weibull_fit.xla, que entra en ejecución al seleccionar el módulo Calculo (Figura 1).


Fig. 1: Menú desplegable del programa Weibull_fit.xla

 


Fig. 2: Diagrama de flujo de la programación de Weibull_fit.xla

En primer lugar se debe indicar la ubicación de la muestra aleatoria de datos en estudio. En segundo lugar se formula el problema, para esto se selecciona una función objetivo, especificando qué prueba de bondad de ajuste o índice de error se utilizará (Tabla 2) y se definen las restricciones asociadas al método escogido para la estimación de parámetros (Tabla 1). En tercer lugar, el programa interactúa con Solver.xla que lleva a cabo la minimización mediante el algoritmo de Newton Raphson. Una vez que se logra un mínimo de la función objetivo, se presentan los resultados en forma tabular y se despliega un formulario que presenta las opciones del usuario (Figura 3). Es posible observar o imprimir la información tabular o gráfica, modificar la formulación del problema, cambiando la función objetivo o las restricciones, procesar otra parcela o bien salir del programa.

Fig. 3: Opciones posteriores a la minimización.

Como ejemplo se hizo la minimización de todas las pruebas de bondad de ajuste y del índice de error considerando el método de los momentos para estimar los parámetros. Los datos provienen de la parcela descrita en la página 198 de Prodan et al. (1997) que corresponde a una parcela de Pinus radiata (D. Don) de 400 m2 con 41 árboles de 20 años de edad.

RESULTADOS Y DISCUSION

Se debe indicar la ubicación de los datos de la parcela (Figura 4). Estos deben estar dispuestos en una columna.


Fig. 4: Definición de los datos de la parcela.

Para formular el problema se debe escoger la función objetivo y las restricciones (Figura 5). Cuando la función objetivo corresponde a la minimización del índice de error, además se solicitará la amplitud de las clases diamétricas, donde se puede escoger desde 1 a 10 cm. De igual modo, sí el método de los percentiles es escogido, se tendrá que indicar el valor de éstos, pudiendo escoger entre 1 y 100. Los trabajos de Dubey (1967) y Bailey y Dell (1973) consideraron dos percentiles. Scolforo (1998) aumentó a nueve el máximo de percentiles posibles de ser definidos pero, Weibull_fit.xla permite una completa libertad en la definición de ellos.

Los resultados se presentan en forma tabular (Figura 6), donde se indica la función objetivo, las restricciones (métodos de estimación de parámetros), los parámetros de la fdp Weibull 3P, los estadígrafos de cada prueba de bondad de ajuste y el valor porcentual del índice de error, el cual se obtiene al dividir el índice de error (Tabla 2) por la cantidad de elementos medidos (n). Además, se presentan dos resultados donde se asume el parámetro de localización igual a cero o igual a la mitad del diámetro mínimo (a = 0 y a = DAP mínimo/2). Estos valores se incluyeron ya que son los más recomendados en la literatura y sirven para establecer una comparación con los resultados minimizados.


Fig. 5: Formulación del problema.



Fig. 6: Resultado tabular del ejemplo.

Según la conveniencia del usuario es posible obtener el resultado de un ajuste en particular hasta las 32 posibilidades que entrega el programa [4 métodos de estimación de parámetros * (6 indicadores de error ha minimizar) + 2 alternativas que asumen un valor para el parámetro de localización)].

Se observa que las estimaciones de los parámetros sin minimizar, generan estadígrafos superiores a los obtenidos al aplicar minimización. También se comprueba que el valor mínimo de cada estadígrafo se alcanza cuando dicho estadígrafo es considerado como la función objetivo a minimizar. Esto muestra que Weibull_fit.xla emplea un modelo optimizante para el ajuste de los parámetros de la función Weibull 3P.

En la Figura 7 se presenta el resultado gráfico de los ajustes. Al ejecutar el programa las líneas asociadas a cada ajuste aparecen en color, de modo que es posible distinguir entre ellas. Se observa que pese a lograr resultados estadísticos significativos, probabilidad asociada a la prueba Kolmogorov-Smirnov varía entre 87.7% y 99.6%, la estimación del número de árboles por clase diamétrica no logra una adecuada representación, ya que el índice de error porcentual fluctúa entre un 36.5% y un 58.3%.

Las limitaciones del programa Weibull_fit.xla están asociadas a la sincronía con el complemento Solver.xla de Microsoft Excel®. En la versión 2000 y 2003 la sincronía es perfecta, lo cual no ocurre en la versión 2002 y 2007 donde el programa entrega un error de aplicación y no puede ser ejecutado. En futuras versiones del programa se permitirá la exportación de la tabla de resultados.

Si un usuario requiere desarrollar un método de predicción de parámetros, con la finalidad de proyectar el tamaño de los árboles en el tiempo, encontrará en Weibull_fit.xla una herramienta para la obtención de los parámetros. La relación entre los parámetros y las variables que caracterizan un rodal tendrá que desarrollarse con cualquier programa estadístico comercial.


Fig. 7: Resultados gráfico del ejemplo.

CONCLUSIONES

El programa Weibull_fit.xla es una herramienta computacional que permite estimar los parámetros de las función Weibull 3P que minimizan los estadígrafos de las pruebas de bondad de ajuste o del índice de error.

El programa presenta en una sola tabla todos los resultados obtenidos, de modo que es posible establecer comparaciones entre los métodos de ajuste (restricciones), o entre las pruebas de bondad de ajuste e índice de error (funciones objetivos alternativas).

REFERENCIAS

Bailey, R. y T. Dell; Quantifying diameter distributions with the Weibull function, Forest Science: 19(2); 97 – 104 (1973).        [ Links ]

Borders B. y otros tres autores; Percentile-based distributions characterize forest stand tables, Forest Science: 33(2); 570 – 576 (1987).        [ Links ]

Breidenbach, J., C. Glaser y M. Schmidt; Estimation of diameter distributions by means of airborne laser scanner data, Canadian Journal Of Forest Research, 38(6); 1611 – 1620 (2008).        [ Links ]

Cao Q.; Predicting parameters of a Weibull function for modeling diameter distribution, Forest Science: 50(5); 682 – 685 (2004).        [ Links ]

Castedo-Dorado, F., U. Dieguez-Aranda y JG Alvarez-Gonzalez; A growth model for Pinus radiata D. Don stands in north-western Spain, Annals of Forest Science: 64(4); 453 – 465 (2007).        [ Links ]

Chen C.; Test of fit the three-parameter lognormal distribution, Computational Statistics & Data Analysis: 50; 1418 – 1440 (2006).        [ Links ]

Dubey S.; Some percentile estimators for Weibull parameters, Technometrics: 9; 119-129 (1967).        [ Links ]

Hawkins, K. y otros tres autores; Using the Weibull distribution to model harvesting machine productivity, Forest Products Journal: 38(4); 59 – 65 (1988).        [ Links ]

Jiang, L.   y J. Brooks; Predicting Diameter Distributions for Young Longleaf Pine Plantations in Southwest Georgia, Southern Journal of Applied Forestry: 33(1); 25 – 28 (2009).         [ Links ]

Johnson, N., S. Kotz y N. Balakrisnan; Weibull distributions, Continuous univariate distributions,  Second Edition, John Wiley & Sons, Inc., volume 1, pp 628 – 722,  New York, USA (1994).         [ Links ]

Liu, Ch. y otros cuatro autores; Evaluation of three methods for predicting diameter distributions of black spruce (Picea mariana) plantations in central, Canadian Journal of Forest Research: 34; 2424- 2432 (2004).        [ Links ]

Mehtätalo L.; An algorithm for ensuring compatibility between estimates percentiles of diameter distribution and measured stand variables, Forest Science: 50(1); 20 – 32 (2004).        [ Links ]

Nepal, S. y G. Somers; A generalized approach to stand table projection, Forest Science: 38(1); 120 –133 (1992).        [ Links ]

Nord-Larsen, T. y Q. Cao; A diameter distribution model for even-aged beech in Denmark, Forest Ecology and Management: 231(1-3); 218 – 225 (2006)          [ Links ]

Palahi, M., T. Pukkala y A. Trasobares; Modelling the diameter distribution of Pinus sylvestris, Pinus nigra and Pinus halepensis forest stands in Catalonia using the truncated Weibull function, Forestry: 79(5); 553 – 562 (2006).           [ Links ]

Palahi, M. y otros tres autores; Comparison of beta, Johnson's SB, Weibull and truncated Weibull functions for modeling the diameter distribution of forest stands in Catalonia (north-east of Spain), European Journal of Forest Research: 126(4); 563 – 571 (2007).        [ Links ]

Prodan, M. y otros tres autores; Mensura Forestal serie investigación y educación en desarrollo sostenible, IICA/BMZ/GTZ, pp 198, San José, Costa Rica (1997).        [ Links ]

Reynolds, M. Jr., T. Burk y W. Huang; Goodness-of-fit test and model selection procedures for diameter distribution models, Forest Science: 34(2); 373 – 399 (1988).        [ Links ]

Scolforo J.; Distribuição Weibull, Modelagem do crescimento e da produção de florestas plantadas e nativas, Universidade Federal de Lavras, Fundação de Apoio ao Ensino, Pesquisa e Extensão, pp 103 - 113 (1998).        [ Links ]

Vallejos O.; Sistema de simulação do crescimento e produção de Populus spp. no Chile (Sistema SALICA), Doctorado en Ciencias Forestales, Universidad Federal de Paraná, Sector de Ciencias Agrarias, Departamento de Ciencias Forestales (2003).         [ Links ]

Vallejos, O. y otros cuatro autores; Proposta metodológica para o ajuste ótimo da distribuição diamétrica Weibull 3P, Rev. Floresta, ISSN: 1982-4688 (en línea), 34(3); 387-393; 2004.  http://ojs.c3sl.ufpr.br/ojs2/index.php/floresta/issue/view/268. Acceso: 5 de Mayo (2007).         [ Links ]

Zhang, L.; K. Packard y Ch. Liu. A comparison of estimation methods for fitting Weibull and Johnson’s SB distributions to mixed spruce-fir stands in northeastern North America, Canadian Journal of Forest Research: 33; 1340 – 1347 ( 2003).        [ Links ]

Creative Commons License Todo el contenido de esta revista, excepto dónde está identificado, está bajo una Licencia Creative Commons