SciELO - Scientific Electronic Library Online

 
vol.47 número1NEW SYNTHESIS AND CHARACTERIZATION OF THE SODIUM 3- N-ACETYLAMINO-2,4,6-TRIIODOBENZOATE: ANTIBACTERIAL ACTIVITY EVALUATIONANÁLISIS DE LA FRACCCIÓN LIPÍDICA DE LA YEMA DE HUEVOS POR AMD-HPTLC índice de autoresíndice de assuntospesquisa de artigos
Home Pagelista alfabética de periódicos  

Serviços Personalizados

Journal

Artigo

Indicadores

Links relacionados

Compartilhar


Boletín de la Sociedad Chilena de Química

versão impressa ISSN 0366-1644

Bol. Soc. Chil. Quím. v.47 n.1 Concepción mar. 2002

http://dx.doi.org/10.4067/S0366-16442002000100010 

OPTIMIZACIÓN DEL EXPONENTE IMPLÍCITO EL EL ALGORITMO
CORRESPONDIENTE AL INDICE DE CONECTIVIDAD DE
VALENCIA TRIDIMENSIONAL COREGIDO L (q).
APLICACIÓN A
HIDROCARBUROS SATURADOS

E. Cornwell

Departamento de Química Inorgánica y Analítica, Facultad de Ciencias Químicas y Farmacéuticas. Universidad de Chile. Casilla 233, Santiago, Chile.

(Recibido: Junio 18, 2001 - Aceptado: Diciembre 26, 2001)

RESUMEN

En este trabajo se demuestra que el uso del algoritmo correspondiente al índice de conectividad de valencia tridimensional corregido (L (q), utilizado a un valor de exponente óptimo, produce un valor máximo para el índice de correlación (r) correspondiente a la regresión lineal entre los logaritmos de los tiempos de retención relativos de un conjunto de 30 hidrocarburos saturados tomados como modelo. Este hecho particular induce a considerar la optimización del exponente de este índice topológico u otro índice de estructura similar en cualquier otra relación de regresión donde estos índices estén implícitos.

PALABRAS CLAVES: Índice de conectividad de valencia tridimensional, exponente, optimización.

SUMMARY

In this work one demostrates that the use of the algorithm corresponding to the corrected three-dimensional valence conectivity index (L (q), used at a value of optimal exponent, produces a maximun value for the correlation index (r) corresponding to the linear regression between the logarithm of the relative retention times of a set of 30 hydrocarbons taken as a model. This particular fact, lead us to consider optimization of the exponent of this topological index or another index of similar structure in any other relation of regression where these indices are implicit.

KEY WORDS: Three-dimensional valence connectivity index, exponent, optimization.

INTRODUCCIÓN

Desde 1817 existe un concepto fundamental en química como también en otras disciplinas científicas, este concepto se refiere al siguiente postulado: la forma precede a la función1) Desde el punto de vista químico esto significa una dependencia entre la estructura molecular y su distribución electrónica versus las propiedades moleculares2). Las disciplinas que se preocupan de esta dependencia se denominan: relación cuantitativa entre estructura y propiedades químicas (QSPR), relación cuantitativa entre actividad biológica y estructura química (QSAR) y relación cuantitativa entre retención y estructura química (QSRR)3), la retención se refiere a retención cromatográfica. La estructura molecular y la distribución electrónica se pueden caracterizar mediante diferentes descriptores, para el caso de la disciplina QSRR3) que es la disciplina que trata este trabajo, cabe mencionar los descriptores no específicos como: masa molecular, índice de refracción, volumen molecular, energía total, acceso de superficies por solventes. Aquellos de carácter netamente electrónicos como: momento dipolar, exceso de carga atómica, energía orbital, superdelocalización, carga superficial parcial. Aquellos relacionados con la geometría molecular como: momento de inercia, energía de ángulos tensionados, relación de largo a ancho molecular. Parámetros fisicoquímicos como: constantes hidrofóbicas, constantes de Hammett, parámetros de solubilidad, constantes de equilibrio, puntos de ebullición. Parámetros topológicos caracterizados por los llamados índices topológicos.

Entre las propiedades moleculares se pueden citar entre otras: propiedades biológicas, farmacológicas, fisicoquímicas y de retención cromatográficas2,3)

Los índices topológicos son un elemento de la disciplina denominada teoría de los grafos químicos que se basa en la representación de una molécula como un grafo simple donde los átomos se simbolizan por puntos ( vértices) y los enlaces covalentes por líneas (puentes). El principal objetivo de esta aproximación es encontrar una manera de representar la estructura molecular como un número simple y reducir el problema de la relación estructura-propiedad a un problema de correlación matemática entre dos series de números, un de ellos representando la propiedad y la otra serie, representando la estructura química4.

La teoría de los grafos es una rama de las matemáticas discretas relacionada con la topología y la combinatoria y trata de las maneras como se conectan los objetos y la consecuencia de estas conexiones. La teoría de los grafos químicos implica el uso como objeto de análisis la estructura molecular. Se entiende como grafo a un conjunto de objetos aplicados a sí mismos y la relación binaria entre estos elementos, los grafos son objetos unidimensionales pero se pueden proyectar a espacios de dimensiones superiores. En química, los grafos se caracterizan en dos dimensiones, puntos (vértices) y líneas (puentes) que unen estos puntos, en química se suele designar esta representación como diagrama. En química los grafos pueden ser usados para representar una variedad de objetos químicos tales como: moléculas, reacciones químicas, cristales, etc. El rasgo común en los sistemas químicos es la presencia de puntos y conexiones entre ellos, los puntos pueden ser: átomos, electrones, moléculas, fragmentos moleculares, intermediarios etc. Las conexiones pueden representar enlaces, etapas de reacción, fuerzas de van der Waals. En forma particular los grafos moleculares son grafos químicos que representan estructuras moleculares donde los vértices son los átomos individuales y los puentes corresponden a los enlaces entre ellos5)

La resolución de un grafo molecular a un número mediante un proceso topológico debe ser inequívoca con la estructura molecular que se refiere, si este es el caso, se habla de un invariante, de lo contrario de hace referencia de un grado degenerativo. Según sea el algoritmo topológico se obtienen índices del índice topológico distintos6)

Uno de los primeros índices topológicos fue el de M. Randic7) el cual utiliza la expresión (1) como algoritmo de cálculo de una molécula.

El elemento di (como dj ) es número asignado al átomos i de grafo molecular y es iguale a la suma de los elementos aij, aii de una fila o columna de la matriz cuadrada de adyacencia correspondiente al grafo a la estructura molecular que se caracteriza7)

Este índice topológico c ha sido modelo de otros índices posteriores que utilizan en forma básica el mismo algoritmo descrito por la ecuación (1) y difieren entre si, en cuanto a la definición del elemento di siendo el exponente constante y de un valor de -1/2. El desarrollo de las distintas modificaciones, aplicaciones, ventajas y limitaciones de otros índice topológiocos derivados de c se analizan en la literatura9-31. Como resultado de ello se han obtenido índices más específicos y extensivos a todo tipo de molécula orgánica.

En este trabajo se analiza, como varía el grado de correlación entre una variable dependiente (log del tiempo de retención relativo cromatográfico de un conjunto de hidrocarburos saturados) versus la variable independiente (índice topológico de E. Estrada) al utilizar distintos valores del exponente en el índice de conectividad de valencia tridimensional corregido, cuyo autor es E. Estrada8) (L (q). Este índice se basa en la expresión de la ecuación (1), pero se define en forma distinta los términos di correspondientes a cada átomo del grafo molecular, manteniendo constante el exponente en -1/2.

En la literatura se menciona el uso de exponentes distintos a -1/2 en los algoritmos relacionados al índice topológico de M. Randic, como lo son -1/3, esto sin explicación razonable de su aplicación21,33) El propósito de un estudio sistemático para obtener un exponente dado con el cual se obtenga una correlación máxima debida a este efecto entre la variable dependiente e independiente, no solo es inobjetable, si no que, el uso de un exponente así optimizado puede producir un cambio en la dirección de una mayor correlación que la obtenida por una redefinición de los elementos di y dj del algoritmo en estudio.

Cabe hacer notar que en las definiciones actuales de los elementos di y dj concurren métodos complejos como se verá a continuación.

El descriptor tridimenciona de E. Estrada8) se define por la siguiente expresión: (2)

El valor de q para un átomo i es qi y corresponde a la densidad de carga electrónica existente en el átomo i y se usa como valor asignado al átomo de carbono para los grafos moleculares en este trabajo. Su magnitud se evalúa mediante la química cuántica usando la expresión (3)

Donde Zi es la carga nuclear, P es la matriz de densidad, S es la matriz de superposición y el término de la sumatoria es la población de Mulliken. (el número de electrones en cada orbital atómico m ). Los conceptos y características de estas consideraciones se indican en la literatura8,34) y se dan por explicadas en el trabajo tomado como base8)

El cálculo de la densidad de carga electrónica de conectividad d(qi ) en este caso de un átomo de carbono i se calcula restando al valor de qi el número de hidrógenos unidos a aquel átomo de carbono i (hi). Este cálculo se efectúa mediante la ecuación (4)

Como en un grafo molecular existen diferentes átomos de hidrógeno, la densidad de carga de conectividad de carga corregida se evalúa mediante la ecuación (5)

Donde qhj es la densidad de carga electrónica del átomo j unida al átomo i

La densidad de carga electrónica se obtiene por el método PM335) La optimización geométrica mediante el método Broyden-Goldfard-Shanon36) utilizando el software MOPAC versión 6.037) y el cómputo del índice se realizó por el sistema MODEST versión 1.0 38)

Los resultados de los valores de carga electrónica correspondientes a distintos tipos de átomos unidos a hidrógeno u otros tipos de átomos fueron publicados por el autor del índice topológico en estudio8) Para el caso del presente trabajo donde solo se consideran 4 distintos tipos de átomos de carbono en cuanto a la cantidad de átomos de hidrógeno unidos a él, los valores calculados8) correspondientes se detallan en la Tabla I.

Tabla I Valores delos parámetros di para diferentes grupos atómicos

grupo

dc(q)
-CH3 1.2208
-CH2-- 2.2015
-CH< 3.1349
>C< 4.0413

DESARROLLO

Se demuestra que, para un conjunto de sustancias tomadas como modelo, la correlación entre una propiedad física que las caracteriza y el índice topológico L (q) corregido, ocurre con un índice de correlación de valor máximo si el exponente del índice topológico L o(q) concurre con un valor óptimo. Esta consideración no se encuentra en los trabajos de esta índole comúnmente publicados9,31).

Para la demostración se utilizó como modelo 30 hidrocarburos saturados. Se utilizó como variable dependiente los valores del logaritmo de los tiempos de retención relativos (log Trr) al n-heptano medidos en columna apolar mediante un proceso cromatográfico en fase gaseosa32), ver Tabla II y se utilizó como variable independiente el índice L o(q) corregido8) modificado a un valor óptimo del exponente. El proceso para obtener este exponente óptimo consistió en tomar como referente el valor implícito en el índice L (q), y sobre la base de ello, se eligieron 27 valores de exponentes distintos al original, ver Tabla III. Se utilizó la ecuación (2) conteniendo estos exponentes mencionados y manteniendo los otros parámetros en condición de su definición original, ver Tabla I, consecuencia de ello se obtuvo 27 ecuaciones distintas para L (q), con lo cual se calcularon 27 índices topológicos distintos para cada grafo molecular perteneciente a cada hidrocarburo saturado.

Tabla II. Parámetros de retención para los distintos hidrocarburos saturados

 

Tabla III. Distintos valores de los exponentes (-n) utilizados y los valores de los índices de regresión obtenidos.

 

Se correlacionaron linealmente los logaritmos de los tiempos de retención relativos de los 30 hidrocarburos saturados versus los distintos tipos de índices topológicos obtenidos L n(q), de ello se obtiene 27 ecuaciones lineales con sus respectivos índices de correlación (r)

La correlación lineal entre el conjunto de valores de r y los exponentes (n), rf (n), responde a una correlación lineal expresada por el modelo (5) Con este modelo se obtiene un índice de determinación (R2) alto.

y = A + BX + CX2 + DX3 (5)

La ecuación particular para rf (n) para los valores de la Tabla II corresponde a la ecuación (6)

r = 0.9797 - 0.0478n - 0.0138n2 + 0.0600n3 (6)
R2 = 0.9994
SD =9.25 10-6
N = 27

La ecuación particular para rf (n) presenta una alta correlación (R2) y baja desviación estándar (SD), lo que implica un modelo muy eficiente.

Esta función presenta un par ordenado crítico (n,r) máximo, cuyo valor numérico se obtiene derivando la ecuación (6) y haciendo esta derivada igual a cero y obteniendo el valor crítico n y r por los métodos corrientes matemáticos. La derivada corresponde a la siguiente expresión (7).

-0.0478 - 0.0276n + 0.1801n2 = 0 (7)

Siendo el primer miembro, la derivada (dr/dn) de la ecuación (6)

El exponente óptimo es igual a -0.44434 y r máximo se obtuvo utilizando este exponente en la relación de correlación logTrr f (L o(q)), para dicha relación el coeficiente de correlación r tiene un valor de 0.9930.

La ecuación de regresión que contiene el par ordenado crítico que genera la regresión óptima se representa por la ecuación (8)

log Trr = -3.3062 + 1.0017L o(q) (8)
r = 0.9930
SD = 0.0741
n = 30

Si se utiliza como exponente el usado en forma común en la literatura9-31) (-0.5000) para este algoritmo de este modelo, se obtiene la ecuación de regresión (9)

log Trr = -3.3527 + 1.104 L (q) (9)
r = 0.9920
SD = 0.0880
N = 30

En ambas situaciones (ecuaciones (8),(9)) los índices de correlación y desviación estándar son semejantes, esto obliga a un análisis de evaluación de las diferencias, para ello se usó el siguiente criterio:

a.- Para ambas situaciones; ecuaciones (8), (9) donde se emplean los exponentes asociados al índice L (q) cuyos valores son -0.44434; -0.5000, sé obtuvieron las diferencias absolutas entre los tiempos de retención relativos experimentales y calculados mediante las ecuaciones (8),(9) respectivamente. Para el primer caso [exponente óptimo(-0.44434)] la mediana de las diferencias a la mitad de las puntuaciones tiene un valor de 0.0031, para el segundo caso, en las mismas condiciones de puntuación un valor de 0.0041, según el trabajo de Otto Exner39) el modelo más eficiente es aquel que presenta una menor mediana de las diferencias a la mitad de las puntuaciones. En este caso corresponde al índice corregido L o(q) con exponente óptimo igual a -0.44434, obtenido por el procedimiento señalado en este trabajo. Se recomienda en índices topológicos que respondan a la misma estructura del propuesto por M. Randic y sus derivados utilizar esta optimización del exponente toda vez que se utilicen distintos tipos de series homólogas orgánicas, puesto que el exponente óptimo tiene valores distintos en función de que tipo de serie homólogas se trate21, 40)

Nota. f : significa, función de. L (q) significa, índice de E. Estrada, L 0(q) significa índice de E. Estrada con exponente óptimo calculado en este trabajo y L n(q) significa índice de E. Estrada con exponente distinto a -1/2 pero distinto al óptimo.

CONCLUSIONES

1.- La función de optimización estudiada es continua y tiene un solo punto crítico correspondiente al máximo de la función.

2.- A través del procedimiento de optimización del exponente implícito en el índice topológico L (q), se logró una mayor correlación entre las variables en estudio, en comparación con la situación donde se utiliza como exponente el valor -1/2, esto sin alterar el significado físico de los otros elementos involucrados en dicho índice.

3.- El procedimiento de optimización del exponente es significativamente mas simple que una redefinición de los otros parámetros implícitos en L (q), y probablemente se obtenga mediante esta modificación un grado de correlación mas significativo que aquella situación donde se mantiene el exponente en un valor igual a -1/2 y se redefinen los demás parámetros implícitos en L (q).

BIBLIOGRAFIA

1. P. Seybolt, M. M. Bagal. 66, 575 (1987)

2. E. S. Ariens, Drug Desing Vol 1 p. 271, Vol 2 p.133 Academic Press. New York (1971)        [ Links ]

3. R. Kalizan. Anal.Chem.64, 619 A (1992)        [ Links ]

4. E. Estrada. J. Chem. Inf. Comput. Sci. 35, 701 (1995)        [ Links ]

5. Z. Mihalic, N. Trinystic. J. Chem. Educ. 69, 701 (1992)        [ Links ]

6. E. Cornwell. Bol. Soc. Chil. Quím. 45, 649 (2000)        [ Links ]

7. M. Randic., J.A.C.S. 97, 6609 (1975)        [ Links ]

8. E. Estrada. J. Chem. Inf. Comput. Sci. 35, 708 (1995)        [ Links ]

9. G.L. Amidon., S.T. Anic. J. Pharm. Sci. 65, 801 (1976)        [ Links ]

10. L.B. Kier., W.J. Muray., M. Randic., L. Hall. J.Pharm. Sci. 65, 1226 (1976)        [ Links ]

11. L.B. Kier., L.H. Hall. J. Med. Chem. 20, 1631 (1977)        [ Links ]

12. L.H. Hall., L.B. Kier. J. Pharm. Sci. 67, 1743 (1978)        [ Links ]

13. L.B. Kier., L.H. Hall. J. Pharm. Sci. 68, 120 (1979)        [ Links ]

14. S.C. Basak., D.P. Gieschen, O.K. Harris., V.R. Maguson J. Pharm. Sci. 72, 934 (1983)        [ Links ]

15. P.J. Hansen., P.C. Jurs., J. Chem. Educ. 65, 574 (1988)        [ Links ]

16. A.R. Katritzky., E.V. Gordeeva, J. Chem. Inf. Comput. Sci. 33, 835 (1993)        [ Links ]

17. A. Sabljic., D. Horvatic. J. Chem. Inf. Comput. Sci. 33, 292 (1993)        [ Links ]

18. J. Galvez., R. García-Domenech, V. De Julian-Ortiz.,R. Saler. J. Chem. Inf. Comput. Sci. 34,1198 (1994)        [ Links ]

19. Pogliani. J. Phys. Chem. 98, 1494 (1994)        [ Links ]

20. A.T. Balaban, J. Chem. Inf. Comput. Sci. 35, 339 (1995)        [ Links ]

21. E. Estrada. J. Chem. Inf. Comput. Sci. 35, 1022 (1995)        [ Links ]

22. E. Estrada. J. Chem. Inf. Comput. Sci. 35, 31 (1995)        [ Links ]

23. D. Amic., D. Davidovic-Amic., A. Juric, B. Lucic., N. Trinajstic. J. Chem. Inf. Comput Sci. 35, 1034 (1995)         [ Links ]

24. E. Estrada. J. Chem. Inf. Comput. Sci. 36, 837 (1996)        [ Links ]

25. V. Sharma., R. Goswami., A.K. Madan. J. Chem. Inf. Comput. Sci. 37, 273 (1997)        [ Links ]

26. E. Estrada., N. Guevara, J. Gutman. J. Chem. Inf. Comput. Sci. 38, 428 (1998)        [ Links ]

27. E. Estrada. L. Rodríguez. J. Chem. Comput. Sci. 39, 1037. (1999)        [ Links ]

28. E. Estrada. J. Chem. Inf. Comput. Sci. 39, 1042 (1999)        [ Links ]

29. L.B. Kier, L.H. Hall. J. Chem. Inf. Comput. Sci. 40, 792 (2000)        [ Links ]

30. D. Bonchev. J. Chem. Inf. Comput. Sci. 40, 934 (2000)        [ Links ]

31. J. Huuskonem. J. Chem. Inf. Comput. Sci. 40, 773 (2000)        [ Links ]

32. P.H. Desty., S. Goldup., E.Y. Swanton. Gas Chromatography. Editorial Academic Press. New York (1962)        [ Links ]

33. Alterburg. Phys. Chem (Elipsis) 261, 389 (1980)        [ Links ]

34. Sublej,J. Semiempirical methods of Quantum Chemistry. Ellis Hardwood Ltd: West Sussex (1985) p.152        [ Links ]

35. J.J.P Stewart..Optimization of Parameters for Semi-Empirical Methods j. Comput. Chem. 10, 209 (1989)        [ Links ]

36. D. F. Shanon. J. Optim.. Ther. Appl. 46, 87 (1985)        [ Links ]

37. J. P.Stewart quantum Chemistry program Exchange N° 581

38. L. Rodríguez, E, Estrada, Y Gutiérrez, Y Muñoz. MODEST (Molecular DESIng Tools) versión 1.0 Central University of las Villas, Santa Clara, Cuba

39. O. Exner., J. Kramosil., I. Vajoa. J. Chem. Inf. Comput. Sci. 33, 407 (1993)        [ Links ]

40. S.C. Basak., S. Nikoliv., N. Trinajstic., D. Amic., D. Beslo. J. Chem. Inf. Comput. Sci. 40, 927 (2000)        [ Links ]

Creative Commons License Todo o conteúdo deste periódico, exceto onde está identificado, está licenciado sob uma Licença Creative Commons