Autores
- Gil Marin, José Alexander (1)
- (1) DEPARTAMENTO DE INGENIERÍA AGRÍCOLA, ESCUELA DE INGENIERÍA AGRONÓMICA (EIA), UNIVERSIDAD DE ORIENTE (UDO), MATURÍN, ESTADO DE MONAGAS, VENEZUELA.
Se estudió un conjunto de datos recolectados durante el año 2016 en ochos pozos de la ciudad de Maturín, Estado de Monagas, Venezuela, en un intento por evaluar y determinar las aportaciones de la fuente que afectan la calidad del agua. Una técnica precisa de regresiones lineales múltiples (RLM) se utilizó como herramienta avanzada para el modelado y pronóstico de la calidad de las aguas subterráneas. Igualmente, se utilizó el análisis de componentes principales (ACP) para simplificar y comprender la compleja relación entre el agua y los parámetros de calidad. Se encontraron seis componentes principales responsables del 86.57% de la variación total. Se comprobó que la mayor fuente de contaminación de los acuíferos de Maturín la constituyen las descargas residuales con altos valores de coliformes fecales. El resultado del estudio mostró que el uso del ACP como entrada mejoró la predicción del modelo RLM al reducir su complejidad y eliminar la colinealidad de datos, donde el valor de R2 en este estudio fue de 0.99, indicando que el 99% de la variabilidad de los índices de calidad del agua (ICA) es explicada por las once variables independientes utilizadas en el modelo.
PALABRAS CLAVE: antropogénicos, análisis estadístico multivariado, monitoreo ambiental, contaminación.
Um conjunto de dados coletados durante 2016 em oito poços na cidade de Maturín, Monagas, Venezuela, foi estudado na tentativa de avaliar e determinar as contribuições da fonte que afetam a qualidade da água. Uma técnica precisa de regressão linear múltipla (RLM) foi usada como uma ferramenta avançada para modelar e prever a qualidade das águas subterrâneas. Da mesma forma, a Análise de Componentes Principais (ACP) foi usada para simplificar e entender a complexa relação entre água e parâmetros de qualidade. Seis componentes principais foram encontrados, responsáveis por 86,57% da variação total. Verificou-se que a principal fonte de contaminação dos aqüíferos de Maturín foram as descargas residuais com altos valores de coliformes fecais. O resultado do estudo mostrou que o uso de ACP como insumos melhorou a previsão do modelo RLM, reduzindo sua complexidade e eliminando a colinearidade de dados, onde o valor de R2 neste estudo foi de 0,99, indicando que 99% da variabilidade dos índices de qualidade da água (ACI) é explicada pelas onze variáveis independentes usadas no modelo.
PALAVRAS CHAVE: antropogénica, análise estatística multivariada, monitoramento ambiental, contaminação.
Introducción
El agua es vital para la naturaleza y es un recurso limitante para los seres humanos y otros seres vivos. Se requiere agua de calidad y en cantidades adecuadas para satisfacer las crecientes necesidades domésticas, industriales y agrícolas (Azaza, et al., 2011; Pazand, et al., 2012). Dependiendo de su uso y consumo, puede ser un recurso renovable o no renovable. Por lo tanto, los problemas de calidad del agua y sus opciones de gestión deben recibir mayor atención en los países.
El agua subterránea es la principal fuente de agua para fines domésticos, agrícolas e industriales en el mundo. Se estima que aproximadamente un tercio de la población mundial usa agua subterránea para beber (Simge y Aysen, 2014). Entre las diversas razones, las más importantes son la falta de disponibilidad de agua superficial potable y la creencia general de que el agua subterránea es más pura y segura que el agua superficial debido a las cualidades protectoras de la cubierta del suelo (Mishra, et al., 2005; Arumugam y Elangovan, 2009). Sin embargo, en los últimos años, debido a la llegada del crecimiento industrial, la aplicación a gran escala de fertilizantes sintéticos para la producción agrícola y el uso de pesticidas e insecticidas para la producción han causado una gran preocupación respecto a la susceptibilidad de contaminación del agua subterránea.
Los cambios naturales en la calidad del agua subterránea se deben a la interacción roca-agua y a las reacciones de óxido-reducción durante la filtración del agua a través de los acuíferos. Además de estos procesos, los agentes patógenos transmitidos por el agua, los contaminantes tóxicos y no tóxicos son los principales parámetros de calidad del agua que se transportan desde el área de recarga al área de descarga a través de los acuíferos por el movimiento del agua subterránea (Simge y Aysen, 2014). La calidad del agua se identifica en términos de sus parámetros físicos, químicos y biológicos. Las aguas subterráneas contaminadas no pueden lograr un ecosistema equilibrado. Un ecosistema equilibrado es aquel en el que los seres vivos y el medio ambiente interactúan de forma beneficiosa entre sí. La calidad del agua obviamente juega un papel crítico en esta relación (Ntengwe, 2006), ya que es clave para el mantenimiento de un entorno bien equilibrado.
Un problema particular en el caso del monitoreo de la calidad del agua es la complejidad asociada al análisis de la gran cantidad de variables medidas. Los conjuntos de datos contienen abundante información sobre el comportamiento de los recursos hídricos. La clasificación, el modelado y la interpretación de los datos monitoreados son los pasos más importantes en la evaluación de la calidad del agua (Boyacioglu, 2006). La aplicación de diferentes técnicas estadísticas multivariadas, como el análisis de conglomerados (AC), el análisis de componentes principales (ACP), el análisis factorial (AF) y el análisis de regresión múltiple (ARM) ayudan a identificar componentes o factores importantes, representando la mayoría de las variaciones de un sistema (Ouyang, et al., 2006; Shrestha y Kazama, 2007). Están diseñados para reducir el número de variables a un pequeño número de índices al intentar preservar las relaciones presentes en los datos originales. El objetivo de este estudio consistió en utilizar los ACP y ARM en los estudios de calidad del agua para extraer los parámetros más relevantes que permitan evaluar las variaciones en la calidad de las aguas subterráneas de la ciudad de Maturín.
Materiales y Métodos
Sitio de estudio
El trabajo se llevó a cabo en la ciudad de Maturín, municipio de Maturín, estado de Monagas, situado geográficamente a 9°46’46” de latitud norte y 63°11’05” de longitud oeste, y a una altura de 63.5 m.s.n.m (Figura 1). Holdridge, citado por Gil y otros (2012), señalan que el clima de la zona es del tipo bosque seco tropical, caracterizado por presentar una estación lluviosa de mayo a diciembre y una estación seca de enero a abril, con una precipitación media anual de 1219.6 mm, una temperatura media anual de 25.9 °C, una evapotranspiración potencial de 1372 mm y una evaporación de 1573 mm. Tiene una superficie de 13.352 km2 y es la sexta urbe más grande del país con 542.259 habitantes (Instituto Nacional de Estadística, 2011).
Según el Ministerio del Poder Popular del Ambiente (2009), los acuíferos de Maturín se encuentran ubicados en la región hidrológica de la provincia del Orinoco, en el sistema acuífero Mesa- Las Piedras, y se caracterizan por presentar una profundidad media de 40 m, un nivel medio de 10 m y un caudal de 10.5 l/s. Constituyen uno de los reservorios subterráneos con mayor potencial del país con unidades litológicas de sedimentos poco o nada consolidados (gravas, conglomerados, areniscas, con intercalaciones de arcillas y lutitas), que cubren un área de 352.000 km2(Duran, 2011).
Lugares de muestreo
Se realizó una encuesta detallada dentro de un radio de 10 km en Maturín para identificar los pozos de perforación activos que se utilizan con fines agrícolas y consumo humano. En consecuencia, se seleccionaron 8 pozos de perforación en diferentes lugares (Figura 2) para el muestreo del agua, de los cuales 5 lugares (P1, P2, P3, P5, y P7) se ubicaron en zonas urbanas, y 3 en zonas rurales y agrícolas (P4, P6 y P8).
Conjunto de datos
En este estudio, veinte parámetros de calidad del agua fueron observados a lo largo de los pozos de monitoreo del acuífero. Un total de 960 observaciones se utilizaron para la distribución de fuentes y técnicas de modelado. El índice de calidad del agua (ICA) se determinó para evaluar el estado de la calidad del agua y la clasificación de la clase del acuífero en base a los datos de calidad del agua, utilizando la metodología empleada por Gil y otros (2018). Los veinte parámetros de calidad del agua consistieron en: fenoles, hierro (Fe), calcio (Ca), magnesio (Mg), manganeso (Mn), sodio (Na), potasio (K), nitrito (NO2), nitrato (NO3), sulfato (SO4), bicarbonatos (HCO3), carbonatos (CO3), coliformes totales (CT), coliformes fecales (CF), temperatura, conductividad eléctrica (CE), pH, total de sólidos disueltos (TDS), dureza (mg/l) y cloro (Cl). El ICA proporciona una manera útil de predecir cambios y tendencias en la calidad del agua considerando múltiples parámetros. Por lo tanto, en este estudio se formó con catorce variables seleccionadas: coliformes fecales (CF), temperatura, conductividad eléctrica (CE), pH, sodio (Na), manganeso (Mn), hierro (Fe), fenoles, potasio (K), nitrito (NO2), nitrato (NO3), sulfato (SO4), dureza (mg/l) y cloro (Cl).
Tratamiento previo del conjunto de datos
Los datos se dispusieron inicialmente según las estaciones y el mes de muestreo.A todos los datos se les aplicó la prueba de normalidad de Wilk-Shapiro (Azkue y Soto, 2004), con una probabilidad del 95%. La hipótesis nula de que los datos son normales es rechazada al nivel de significancia α (α = 0.05) si la probabilidad de la prueba es inferior al nivel de significancia (p ≤ 0.05). Esta se llevó a cabo con el paquete estadístico SAS, versión 8.0, y el procedimiento “univariate”. Luego, el cálculo estadístico de ACP y RLM se realizó utilizando el software SPSS, versión 16.0.
Análisis de componentes principales (ACP)
El análisis de componentes principales presenta los parámetros más significativos y describe la reducción de datos de una representación de conjunto de datos completos, con la pérdida mínima de información original (Helena, et al., 2000 y Wunderlin, et al., 2001). Los ACP son sensibles a los valores atípicos, a los datos que faltan y a la mala correlación lineal entre las variables debido a la insuficiencia de las variables asignadas (Sarbu y Pop, 2005). Por lo tanto, debe realizarse un tratamiento previo detallado al conjunto de datos para obtener una imagen más clara en datos complejos. Es una técnica prominente para el reconocimiento de patrones en los intentos de explicar la varianza de un gran conjunto de variables correlacionadas y la transformación en un conjunto más pequeño de variables independientes (no correlacionadas) (componentes principales). El componente principal (CP) se expresa como:
Yij = Zi1X1j + Zi2X2j + Zi3X3j +...+ ZimXmj.......(1)
Donde Z es la carga del componente, Y es la puntuación del componente, X es el valor medido de una variable, i es el número del componente, j es el número de la muestra y m es el número total de variables. Mientras tanto, el análisis factorial (AF) intenta extraer una estructura lineal de dimensión inferior del conjunto de datos. Reduce aún más la contribución de las variables menos significativas obtenidas de ACP y el nuevo grupo de variables conocidas como varifactores (VF), que se extrae mediante la rotación del eje definido por ACP. En el AF, el concepto básico se expresa en la ecuación 2.
Yij = Zp1P1i+Z p2P2i + Z p3P3i +...+ZprPri+Cpj.......(2)
Donde Y es el valor medido de una variable, i se refiere a la carga del factor, P es la puntuación del factor, C es el término residual que representa los errores u otras fuentes de variación, i es el número de muestra, j es el número de la variable y r es el número total de factores. Principalmente, los métodos ACP y AF se expresan en ecuaciones similares; la diferencia está en CP, donde se expresa como una combinación lineal de variables medidas. Mientras que en AF, la variable medida se expresa como una combinación de factores y la ecuación contiene el término residual y, por lo tanto, un VF puede incluir variables latentes no observables, hipotéticas (Helena, et al., 2000, Wunderlin, et al., 2001 y Liu, et al., 2003).
El análisis de componentes principales o el análisis factorial se realizó en la matriz de correlación de los datos reorganizados (todas las observaciones para cada grupo de sitios), por lo tanto explica la estructura del conjunto de datos subyacentes. La matriz de coeficientes de correlación mide qué tan bien puede explicarse la varianza de cada constituyente en función de la relación entre sí. El ACP de las variables normalizadas (conjunto de datos de calidad del agua) se realizó para extraer CP significativos y reducir aún más la contribución de las variables con menor importancia; estos CP se sometieron a rotación varimax (en bruto) generando VF.
Los CP resultantes de ACP a veces no se interpretan fácilmente y la rotación de varimax debe realizarse para reducir la dimensionalidad de los datos e identificar las nuevas variables más significativas. El coeficiente del factor varimax (VF) con una correlación de > 0.75 se explica como una carga de factor significativo fuerte (Liu, et al., 2003). Mientras que los rangos de correlación de 0.75-0.50 y 0.50-0.30 se consideran carga de factores moderada y débil respectivamente. En pocas palabras, el análisis de componentes principales tiene como objetivo descubrir un conjunto más subyacente de factores que explican el patrón principal de todas las variables originales (Saima, et al., 2009).
Análisis de regresión lineal múltiple (RLM)
El análisis de regresión lineal múltiple (RLM) nos permite establecer la relación que se produce entre una variable dependiente Y y un conjunto de variables independientes (X1, X2,... XK). El análisis de regresión lineal múltiple, a diferencia del simple, se aproxima más a situaciones de análisis reales; puesto que los fenómenos, hechos y procesos naturales son complejos por definición y, en consecuencia, deben ser explicados en la medida de lo posible por la serie de variables que, directa e indirectamente, participan en su concreción (Karim y Abdolrahman, 2011).
La anotación matemática del modelo o ecuación de regresión lineal múltiple es la siguiente:
Yu=β0 +β1 Xu1+β2+Xu2+.......+βk Xuk+Eu......(3)
Donde Yudenota la respuesta observada en el intento u o variable dependiente, Xui representa el nivel del factor i en el intento u o variables independientes, las β son parámetros desconocidos y Eu representa el error aleatorio en Yu.
En el análisis de regresión lineal múltiple, la construcción de su correspondiente ecuación se realizó con el método “stepwise” o paso a paso, seleccionando las variables una a una. La finalidad fue buscar entre todas las posibles variables explicativas (parámetros físicos, químicos y biológicos) aquellas que más y mejor expliquen la variable dependiente (ICA), sin que ninguna de ellas sea una combinación lineal de las restantes. Este procedimiento implica tres pasos: en el primero, solo se introduce aquella variable que cumple con los criterios de entrada; en segundo lugar, se valora si la misma cumple con los criterios de salida; y por último último, se calculan los factores de bondad de ajuste de los datos al modelo de regresión lineal y los parámetros del modelo verificado. El proceso se inicia sin ninguna variable independiente en la ecuación de regresión y el proceso concluye cuando no queda ninguna variable fuera de la ecuación que satisfaga el criterio de selección (garantiza que las variables seleccionadas son significativas) y/o el criterio de eliminación (garantiza que una variable seleccionada no es redundante). El análisis comenzó con 20 variables explicativas y terminó recomendando solo 11 variables.
Resultados y discusión
Las estadísticas descriptivas relacionadas con la calidad del agua se presentan en la Tabla 1. Los valores de calidad del agua para el manganeso, nitrito, nitrato, fenol y coliformes fecales sobrepasan los límites permisibles según la Organización Mundial de la Salud (Organización Mundial de la Salud, 2006) y la normativa nacional Decreto N° 883 (Venezuela, 1995). Para el pH, el valor promedio se encuentra un poco por debajo del valor umbral. Los valores de dureza, sodio (Na), conductividad eléctrica(CE) y cloruro (Cl) parecen ser de desviación estándar muy alta. Estas variables cambian considerablemente en los pozos con respecto a sus valores promedios, pero no influyen en la calidad de sus aguas porque no sobrepasan los valores límites establecidos en las normas planteadas.
*LMP=Límite máximo permitido por la normativa venezolana, Decreto 883* (Venezuela, 1995) y la Organización Mundial de la Salud, 2006.
Análisis de componentes principales (ACP)
Antes de ejecutar los análisis de componentes principales (ACP), se aplicó la prueba de Kolmogorov Smirnov (K-S) a todo el conjunto de datos para comprobar si se ajustaron a una distribución normal. La prueba K-S indicó que todas las variables siguen una distribución normal de registro. Por otra parte, a fin de confirmar la idoneidad de los datos para el análisis de componentes principales se aplicaron las pruebas de Kaiser-Mayer-Olkin (KMO) y de esfericidad Barlett. La prueba de KMO mide adecuación del muestreo y señala la fracción de variables que tienen varianza común. Los valores de KMO superiores a 0.5 son considerados como satisfactorios para ACP. En el presente estudio, el valor de 0.575 (Tabla 2) indica que el conjunto de datos estuvo en forma para el análisis de componentes principales. En tanto, la prueba de esfericidad de Barlett indica si las variables están significativamente relacionadas y si la matriz de correlación es una matriz de identidad. El nivel de significancia de 0.00 para este estudio indicó claramente que la matriz de correlación no es la matriz de identidad y que las variables están significativamente relacionadas.
El análisis de componentes principales se aplicó a los datos obtenidos de los ocho sitios de muestreo, utilizando el software SPSS 16.0. Los resultados del ACP en la matriz de correlación y factores fueron extraídos por el método del centroide rotado a través de la rotación Varimax (Ahmed, 2005). Existen reglas para determinar el adecuado número de factores a conservar. Entre ellas se encuentra el que se conoce como criterio de Kaiser (Kaiser, 1960), que indica que hay que conservar los componentes principales cuyos valores propios sean mayores que la unidad o que el porcentaje de varianza total explicada por cada componente o factor (varianza acumulada) sea lo suficientemente alto (Holland y Witthuser, 2009; Belkhiri, et al., 2010; Kanade y Gaikwad, 2011). Bajo estos criterios, solo los factores con valores propios mayores o iguales a 1 fueron aceptados como posibles fuentes de varianza en los datos, con la más alta prioridad atribuida al factor que tiene la suma más grande del eigenvector (Belkhiri, et al., 2010). Los autovalores indican la importancia del factor, valores mayores a 1 son considerados significativos. Los resultados del ACP señalaron que los primeros seis valores de los autovalores son mayores a 1 y por lo tanto fueron considerados como significativos. En la figura 3 se puede observar que la mayor parte de la variación en los datos originales se explica por los primeros seis factores.
Los valores propios para diferentes factores, varianza porcentual, variación porcentual acumulada y componentes cargados (sin rotar y Varimax rotadas), son presentados en la Tabla 3. Este análisis condujo a la explicación del 86.57% de las varianzas en los datos. Los parámetros de carga para los seis componentes del ACP del conjunto de datos se dan en la Tabla 4. Liu y otros (2003) clasificaron a las cargas factoriales como “fuertes”, “moderadas” y “débiles”, correspondientes a valores de carga absolutos de > 0.75, 0.75–0.50 y 0.50–0.30, respectivamente. A modo de determinar el factor relevante para cada factor solo se tomaron en cuenta valores superiores a 0.65.
Método de extracción: Análisis de componentes principales.
Método de rotación: Normalización Varimax con Kaiser.
a. La rotación ha convergido en 8 iteraciones.
El primer componente (CP1), denominado componente geológico, explica el 36.48% de la varianza total, presentando una fuerte correlación positiva con las variables pH, CE, Ca, dureza, TDS, y HCO3. Esta combinación de variables destaca el grado natural de mineralización del agua y podría estar relacionada con la geología del área estudiada, derivada de los procesos de evaporación y disolución. Por otro lado, esto indica que las variables CE, Ca, dureza, TDS y HCO3 en el área de estudio están muy influenciadas por los valores del pH. Los valores de pH presentaron un valor mínimo de 4.12 (P6) y un máximo de 7.56 (P1), con un promedio de 5.57, que les otorga a las aguas subterráneas de la ciudad de Maturín una naturaleza ligeramente ácida. A pH bajo, una parte importante del carbono inorgánico disuelto está como ácido carbónico (H2 CO3) o CO3 disuelto. Además, las aguas subterráneas suelen contener cantidades apreciables de ácido silícico no disociado, que se suele expresar como sílice disuelta. En general, un agua con un pH menor a 6.5 podría ser ácida y corrosiva. La dureza depende de la presencia de Ca2 + y Mg2 + en el agua. Un patrón similar en la variación estacional de dureza y HCO3 se debe posiblemente a la disolución de minerales como la calcita y la dolomita a través del proceso de meteorización HCO3. Este proceso está representado por la siguiente reacción simplificada (Cai, et al., 2007).
CaCO3 + CO2 + H2 O <–> Ca2+ + 2HCO3-
La reacción del CaCO3 mineral con dióxido de carbono disuelto (ácido carbónico) libera HC03- y Ca2-+ en el agua del acuífero. Existe una relación inversa entre la temperatura y el CO2 disuelto (Zare, et al., 2011), por lo tanto, la intensidad de la intemperie de carbonatos y la concentración de HCO3 y dureza es mayor en las estaciones frías y menor en las estaciones cálidas.
El segundo componente (CP2) representa el 14.56% de la varianza total, y fue correlacionado de manera fuertemente positiva con las variables CT y CF, lo que revela la intensiva descarga de aguas residuales en el acuífero. Este componente principal representa un factor microbiológico de la calidad del agua. En esta investigación, se observó un valor mínimo de 0 NMP/100ml de coliformes fecales y un valor máximo de 4,300 NMP/100ml, que sobrepasa en más de un 4,000% al máximo permitido por la normativa vigente, siendo el valor promedio de 260.75 NMP/100ml. Estos altos valores de coliformes fecales tienen como causa principal la filtración de aguas contaminadas hacia los acuíferos debido a una mala disposición de sus desechos fecales (pozos sépticos, napas freáticas y otros) y a las actividades pecuarias de la zona. Las bacterias coliformes se excretan en grandes cantidades en las heces de los humanos y otros animales de sangre caliente. En consecuencia, el agua contaminada por materia fecal se identifica como potencialmente peligrosa debido a los organismos indicadores que coexisten con Escherichia coli (E. coli), que causa el cólera (Cansu, et al., 2008). Algunos ejemplos de enfermedades causadas por beber o nadar en agua contaminada con heces son diarrea, cólera, disentería e infecciones de piel, ojos, oídos, nariz y garganta (Organización Mundial de la Salud, 2006).
El CP3, denominado factor mineral, representa el 12.59% de la varianza total del conjunto de datos del agua del acuífero y muestra una fuerte correlación negativa con el sodio (Na) y una moderada correlación positiva con el magnesio (Mg). Este factor contiene variables hidrogeoquímicas (Mg y Na), que se originan en la mineralización de los componentes geológicos de los acuíferos. La contribución de Mg a este factor puede considerarse como resultado de los procesos de intercambio de cationes en la interfaz suelo-agua (Guo y Wang 2004) y la disolución de minerales con calcio que se encuentran en la región (Memet y Bulent, 2009). Según Beita-Sandí y Barahona (2010), el Na en aguas naturales varía de manera considerable dependiendo de las condiciones geológicas locales y las descargas de aguas residuales. La correlación negativa del Na indica que su introducción en el agua subterránea no se debe a la disolución natural del suelo o la roca, y la fuente de este parámetro puede estar relacionada con una contaminación del tipo antropogénica.
El CP4 representa el 9.72% de la varianza total y muestra una fuerte correlación negativa con los nitratos (NO3-) y una moderada correlación positiva con fenoles y Cl-. Este componente principal representa un factor de contaminación orgánica de la calidad del agua, que se produce por desechos domésticos y nutrientes. Mientras se produzca nitrificación en el agua, un aumento en NO3-y una reducción en NH4+ es un evento normal. En cuanto al nitrato (NO3-), se observó su presencia en todos los puntos de muestreo, resultando con mayor concentración el P2, con valores de 59.50 mg/l, y un valor mínimo para el P3 con 4.50 mg/l. A pesar de que las aguas subterráneas presentaron nitrato, solo en P2 se observaron valores por encima de la normativa (Organización Mundial de la Salud, 2006). El NO3- presente en las aguas subterráneas tiene un origen orgánico. Los altos valores de esta especie se asocian con la actividad antrópica, excreto de animales, uso de fertilizantes (Cardona, et al., 2004 y Jin, et al., 2004). La concentración de esta especie en aguas subterráneas no contaminadas varía ampliamente, aunque no suele sobrepasar los 10 mg/l (Porras, et al., 1985). Para el fenol, (C6 H5 OH) se observaron diferencias significativas en los meses de muestreo y en los pozos estudiados, dando como resultados valores mayores a 0.002 mg/l en todos los muestreos, valor umbral indicado por la normativa Decreto N° 883 (Venezuela, 1995). Las concentraciones de este compuesto en las aguas subterráneas de la ciudad de Maturín son alarmantes ya que las estudiadas durante el periodo de lluvia incrementaron los valores del compuesto químico, sobrepasando los niveles permitidos. Esto es sumamente inquietante ya que estudios científicos señalan que un exceso de este compuesto en el agua para consumo puede generar toxicidad, debido a su acción cancerígena y mutagénica en los seres vivos (Nieves, et al., 2005), además de alteraciones en el intestino y en muchos casos la muerte, según la concentración de ingesta. Su presencia en las aguas subterráneas de Maturín es una característica que se debe analizar con más detalle ya que su incorporación a los acuíferos puede estar asociado a procesos de contaminación de la fuente por desechos industriales, aguas servidas o residuales y/o agentes químicos que presenten este compuesto fenólico (Díaz, et al., 2005). Por otra parte, el cloruro en el agua potable se origina de fuentes naturales, aguas residuales, efluentes industriales y escorrentía urbana. Su concentración excesiva aumenta la velocidad de corrosión de los metales en el sistema de distribución de agua y depende de la alcalinidad del agua; y esto puede llevar a un aumento de las concentraciones de metales en el suministro (Organización Mundial de la Salud, 2006).
El quinto componente (CP5) explica el 7.24% de la varianza total, presentando una fuerte correlación positiva con las variables NO2- y Mn; y se puede asumir como un componente antropogénico tóxico. En el proceso de nitrificación, NO2- es un intermediario inestable que tiende a transformarse en NO3. El manganeso (Mn) no existe como un metal libre en la naturaleza, pero forma parte de otros minerales, algunos de los cuales incluyen diferentes óxidos, silicatos, boratos, sulfuros, carbonatos y fosfatos (Nádaská, et al., 2010). El Mn se introduce en ambientes acuáticos a través de fuentes antropogénicas, como descargas de aguas residuales municipales, lodos de depuración, emisiones de las industrias de aleaciones, hierro y acero, y procesamiento de minerales y minería. Además de ser un elemento esencial para el ser humano y otros animales, tanto la carencia como la sobreexposición pueden causar efectos adversos, como lo indican diversos estudios que han notificado efectos neurológicos adversos tras la exposición prolongada a concentraciones muy altas en el agua de consumo (Calla y Cabrera, 2010). La presencia de Mn puede derivarse de la generación de procesos de reducción (bajo potencial redox) en las corrientes contaminadas con aguas residuales; estos procesos solubilizan metales como el Mn (Chávez-Alcántar, et al., 2011). Las aguas residuales son también fuente de metales pesados (Chávez-Alcántar, et al., 2011). A pesar de la ausencia del elemento en algunos pozos, se evidenció su presencia en otros, y en concentraciones que sobrepasan la normativa sanitaria (0.1 mg/l). Los pozos P2, P4, P5 y P6 no evidenciaron la presencia de este elemento, por lo que el promedio general de manganeso estuvo en 0,09 ± 0,15 mg/l, con un valor máximo de 0,50 mg/l para el P8 y un mínimo de 0,00 mg/l.
El último componente (CP6), denominado componente físico, explica el 5.99% de la varianza total, presentando una fuerte correlación positiva con la variable temperatura. La temperatura es una de las variables fundamentales a ser medidas en ambientes acuáticos, debido a su influencia en todos los procesos hidrológicos, químicos y biológicos. Tiene gran efecto en la solubilidad de las sales y las reacciones biológicas de los seres vivos, y también acelera la putrefacción y la demanda de oxígeno (Benítez, 2004). Además influye en el pH, afecta los procesos físicos y químicos (pH, equilibrio iónico, velocidades de reacción) y los procesos biológicos (tasa metabólica, descomposición de materia orgánica); y por lo tanto, repercute en el efecto de los agentes contaminantes (Villa, 2011). La temperatura es un parámetro muy importante para un acuífero. En este sentido, Gil (2003) señala que, por lo general, las temperaturas de las aguas subterráneas permanecen constantes a menos de que existan factores externos que intervengan.
Análisis de regresión lineal múltiple (RLM)
Básicamente, la RLM se basa en un proceso lineal de ajuste de mínimos cuadrados y requiere un elemento traza o propiedad a ser determinada para cada fuente o categoría de fuente (Mohd, et al., 2011). La RLM se utilizó para identificar las posibles fuentes de contaminación en los pozos muestreados. Dos tipos de modelos básicos de receptores que generalmente se aplican a la fuente son el balance químico de masa (BQM) y las técnicas multivariadas (Gordon, 1988). Usando el paquete estadístico SPSS, versión 16.0, se realizó el análisis de regresión múltiple para determinar los factores que contribuyen con el índice de calidad del agua. En este análisis se fijó el índice de calidad del agua (ICA) como variable dependiente, y pH, CE, Fe, Mn, Na, NO2, NO3, SO4, Cl, Fenol y CF como variables independientes (o predictoras).
El procedimiento Stepwise de SAS, con la opción de Backward, que comenzó con las 20 variables tomadas en consideración para el análisis de los ICA, finalmente nos redujo el número de variables a 11 sin perder la precisión en el análisis de datos, con un R2 igual a 0.9999. Según Grivas y Chaloulakou (2006), el procedimiento de regresión múltiple por pasos se usa comúnmente para producir un modelo parsimonioso que maximiza la precisión, con un número opcionalmente reducido de variables predictoras. El coeficiente β representa el coeficiente en el modelo para predecir la calidad del agua. ET representa el error estándar o típico del coeficiente β, mientras que el β estandarizado es el peso de cada variable independiente. Esto es más importante, ya que el objetivo principal del estudio es evaluar la influencia de los predictores en la calidad del agua en lugar de predecir la calidad del agua.
Los resultados del análisis estadístico se presentan en la Tabla 5.
Los once parámetros considerados para la evaluación del ICA están contribuyendo significativamente con el ICA. Los CF, el fenol y los nitritos presentan los valores más altos de los pesos de los β estandarizados y tienen una marcada influencia en el índice de calidad del agua en el área de Maturín. Para el resto de los parámetros de calidad del agua, aunque estadísticamente significativo (p <.001), su contribución al ICA es insignificante en comparación con CF, Fenol y nitritos, basado en el coeficiente β estandarizado obtenido del análisis de regresión múltiple realizado para definir el ICA. La mala calidad del agua de Maturín se puede determinar en orden por CF, Fenol y nitritos. Este estudio brinda una visión general de la calidad del agua potable de aguas subterráneas en esta zona. La identificación de los indicadores de calidad del agua ayudaría a concentrarse en pocos elementos (atributos) durante un estudio (el chequeo) regular de la calidad del agua; por lo tanto, solo se determinarían los parámetros de CF, Fenol y nitritos. Esto ahorra tiempo, energía y gasto en gran medida sin comprometer la calidad de los resultados.
La Tabla 6 muestra el resumen del modelo del ICA. El valor R2 ajustado es alto y el cuadrado medio residual es bajo para el modelo. Los coeficientes de regresión derivados no son cero ni menos que el error estándar. Para un modelo, el R2 ajustado aumenta si la adición de la variable reduce el cuadrado medio residual. Además de esto, no es bueno retener variables insignificantes, es decir, variables con coeficientes cero o coeficientes menores que sus correspondientes errores estándar (Montgomery, et al., 2003).
El estadístico R-cuadrado indica que el modelo explica un 99.9997% de la variabilidad en el ICA. El estadístico R-cuadrado ajustado, que es más conveniente para comparar modelos con diferentes números de variables independientes, es 99.9995%. El error estándar de la estimación muestra la desviación típica de los residuos que es 0.278912. Este valor puede usarse para construir los límites de predicción para las nuevas observaciones. El error absoluto medio (MAE) de 0.16287 es el valor medio de los residuos. El estadístico Durbin-Watson (DW) examina los residuos para determinar si hay alguna correlación significativa basada en el orden en que se introdujeron los datos en el fichero. Dado que el p-valor es inferior a 0.05, hay indicio de una posible correlación serial. Para decidir la simplificación del modelo, se tomó en cuenta que el p-valor más alto en las variables independientes fue 0.003, perteneciendo a SO4. Puesto que el p-valor es inferior a 0.01, ese término es estadísticamente significativo para un nivel de confianza del 99%. Por lo tanto, no vale la pena quitar ninguna variable del modelo.
Por último, los coeficientes de regresión del modelo para la ecuación ICA se muestran a continuación:
ICA = -39.477 + 6.373*pH + 0.005*CE (μS/cm) + 9.417*Fe (mg/l) + 31.618*Mn (mg/l) +0.017*Na (mg/l) +2.104*NO2 (mg/l) + 0.136*NO3(mg/l) + 0.02*SO4(mg/l) + 0.025*Cl (mg/l) +6318.54*Fenol (mg/l) + 0.126*CF (NMP/100ml)......... (3).
El análisis de varianza (ANOVA) para el modelo indicó que el valor observado F fue 1,1157,469 para ICA, mientras que el valor crítico de tabla F (0.01, 11, 12) fue 4.23, revelando que el valor observado es muchas veces mayor que el valor crítico. Para que un modelo de regresión sea útil como predictor, la relación F observada debe ser al menos cuatro o cinco veces mayor que el valor crítico de F, como lo señalan Montgomery y otros (2003).
Gupta y Roy (2012), para aguas subterráneas en una zona minera de la India, reportan una ecuación múltiple con 9 parámetros fisicoquímicos (arsénico, magnesio, dureza, COD, turbidez, dureza total, BOD, DO, nitrato y sulfato). Mientras Pius y otros (2012), también para aguas subterráneas en una zona industrial al sur de la India, definen una ecuación con pH, alcalinidad, TDS, Ca, Mg, cloruro, sulfato y nitrato como variables independientes (o predictores).
Conclusiones
La mayor fuente de contaminación de los acuíferos de Maturín la constituyen las descargas residuales con altos valores de coliformes fecales infiltrados, producto de una mala disposición de sus desechos fecales (pozos sépticos, napas freáticas y otros) y de las actividades pecuarias de esta zona. En segundo lugar, se ubican las actividades de la industria petrolera y la agricultura, en las cuales se identifican a los parámetros de fenoles y NO3- como las mayores cargas de contaminación.
Los ACP dieron como resultado seis factores que explicaron el 86.57% de la varianza acumulada en el conjunto de datos. El primer factor explicó el 36.48% de la varianza acumulada; el segundo factor, el 14.56%; el tercer factor, el 12.58%; el cuarto, el 9.72%; el quinto, el 7.24%; y por último, el sexto, el 5.99% de las varianzas acumuladas.
Los resultados del análisis de regresión lineal múltiple (RLM) revelan que pH, CE, Fe, Mn, Na, NO2, NO3, SO4, Cl, Fenol y CF son los parámetros más importantes utilizados para evaluar los cambios en la calidad del agua subterránea. Los resultados anteriores muestran que el modelo APC-ARM proporciona una buena precisión para el pronóstico del ICA, donde el valor R2 es 0.99 y el modelo indica que el 99.99% de variabilidad del ICA se explica por las once variables independientes utilizadas en el modelo. El análisis estadístico multivariado gestiona numerosos y complejos datos para disminuir el número de variables y proporcionar datos completos. En este estudio, los métodos estadísticos multivariantes se expresaron como bastante exitosos en la determinación de la calidad del agua. Numerosas variables fueron explicadas con un menor número de variables. Al mismo tiempo, estas variables proporcionaron información más útil sobre la calidad del agua subterránea del área de Maturín. Por lo tanto, esta técnica se puede aplicar con mucho éxito para la planificación y el seguimiento de la calidad en el futuro.