ENFOQUE DE APRENDIZAJE AUTOMÁTICO PARA LA PARAMETRIZACIÓN DE SUELOS COHESIVOS

Conoce como el Machine Learning puede ayudar a estimar parámetros geotécnicos

La estimación de parámetros geotécnicos es fundamental en el proceso de diseño y construcción de infraestructura. Tradicionalmente, esta estimación se ha basado en métodos empíricos y pruebas de laboratorio que, aunque efectivas, pueden verse limitadas por la calidad y densidad de las muestras no perturbadas en una campaña de exploración convencional. Las técnicas de aprendizaje automático (ML) han surgido como herramientas prometedoras para predecir estos parámetros en los últimos años. El aprendizaje automático permite el análisis de grandes volúmenes de datos y la identificación de patrones complejos que no son fácilmente discernibles a través de los métodos tradicionales. Este blog explora el potencial de las técnicas de aprendizaje automático en la estimación de parámetros geotécnicos, destacando su capacidad para integrar datos de diversas fuentes y mejorar la predictibilidad de los modelos geotécnicos, lo que puede ayudar en la forma en que abordamos los estudios y diseños en ingeniería geotécnica. El aprovechamiento de las muestras perturbadas y sus propiedades índice permite una mayor densidad de variables que pueden relacionarse con parámetros geotécnicos que normalmente se derivan solo de muestras no perturbadas. Además, con los resultados de pruebas de campo como la Prueba de Penetración Estándar (SPT) y las pruebas de fondo de pozo, es posible buscar correlaciones entre varios parámetros geotécnicos y propiedades índice que tienen una mayor densidad de muestras disponibles. Este blog tiene como objetivo explorar estas relaciones para aumentar la densidad de los parámetros geotécnicos estimados, mejorando así la caracterización geotécnica del sitio. Al integrar técnicas de aprendizaje automático, es posible utilizar la riqueza de los datos obtenidos de las muestras perturbadas y las pruebas de campo, optimizando el proceso de estimación y proporcionando una comprensión más detallada y precisa del comportamiento del suelo.

Enfoque de aprendizaje automático

Según Géron (2022), el aprendizaje automático es la ciencia de programar computadoras para aprender de los datos.

El aprendizaje automático es una rama de la inteligencia artificial que se centra en el desarrollo de algoritmos y modelos que permiten a las computadoras aprender y hacer predicciones o decisiones basadas en datos (ver Figura 1). En lugar de estar programadas explícitamente para realizar una tarea, las máquinas utilizan datos de entrenamiento para identificar patrones y mejorar su rendimiento con el tiempo. Los métodos de aprendizaje automático incluyen aprendizaje supervisado, no supervisado y de refuerzo, y tienen aplicaciones en una amplia gama de campos de la ingeniería.

Figura 1 Enfoque general del aprendizaje automático. Fuente: Géron (2022).

Tipos de aprendizaje automático

Existen varios tipos diferentes de sistemas de aprendizaje automático, según cómo se supervisen:

  • Supervisados
  • No supervisados
  • Semisupervisados
  • Autosupervisados

Los métodos de aprendizaje automático supervisados ​​se basan en el uso de conjuntos de datos etiquetados, donde cada ejemplo de entrenamiento está asociado con una respuesta conocida. Estos algoritmos aprenden de las relaciones entre las características de entrada y las etiquetas de salida, lo que les permite hacer predicciones sobre datos nuevos no etiquetados. El uso más común de estos algoritmos se relaciona con problemas de regresión y clasificación.

Figura 2 Problema de regresión. Fuente: Géron (2022).

Análisis exploratorio de datos

El análisis exploratorio de datos (EDA) es un paso crucial en cualquier proyecto de análisis de datos. Este proceso ayuda a comprender mejor las características y patrones de los datos, identificar anomalías y establecer una base para el modelado posterior.

Según McKinney (2015), durante el proceso de análisis y modelado de datos, se dedica una cantidad significativa de tiempo a la preparación de los datos: carga, limpieza, transformación y reorganización de los datos.

La base de datos a analizar contiene resultados de pruebas de laboratorio y de campo. A continuación, se presentan las estadísticas descriptivas de algunas variables.

Figura 3 Estadística de la humedad natural (Wn).
Figura 4 Estadística del límite líquido (Ll).
Figura 5 Distribución de clasificación de materiales.
Figura 6: Estadísticas del peso unitario total.
Figura 7: Estadísticas del ángulo de fricción.
Figura 8: Estadísticas de la resistencia al corte no drenada (Su).

De acuerdo con los gráficos estadísticos, se identifican distribuciones que contienen algunos valores atípicos. Por esta razón, la limpieza de datos se realiza considerando relaciones multivariables. Representar datos faltantes para una variable de propiedad de índice en relación con una propiedad de resistencia o compresibilidad puede ser crucial. Es importante entender que estos parámetros solo deben usarse con muestras no perturbadas para garantizar la precisión y confiabilidad de los análisis.

Figura 9: Análisis multivariable para la limpieza de datos relacionados con el peso unitario total.

Correlación de variables

Una vez realizada la limpieza de datos y el análisis exploratorio de las variables disponibles, el siguiente paso es seleccionar las variables objetivo para la predicción. Posteriormente, se relacionan los parámetros geotécnicos de los materiales cohesivos, asegurando que las variables seleccionadas sean representativas y relevantes para los modelos predictivos a desarrollar.

Con las variables representativas, se crea una matriz de correlación para identificar cuáles son las variables que mejor predicen el peso unitario total. Este enfoque facilita la integración del mínimo número de componentes necesarios para explicar el comportamiento de los materiales, evitando así la creación de modelos sobreajustados. Al seleccionar solo las variables más significativas, se mejora la eficiencia y la precisión del modelo predictivo.

Figura 10: Matriz de correlación para los datos de peso unitario total.

Resultados

A continuación, se presentan los resultados de los modelos de regresión para los parámetros geotécnicos identificados. Estos resultados reflejan el desempeño de las técnicas de aprendizaje automático aplicadas en este estudio, resaltando la capacidad de los modelos para predecir parámetros geotécnicos clave de los suelos cohesivos de la sabana de Bogotá. Se discute la implementación de varios modelos de regresión, como ridge, lasso, elastic net, neural networks y support vector machines, junto con el ensamblaje de los modelos más efectivos utilizando técnicas de stacking.

Figura 11: Validación de la regresión de peso unitario total.
Figura 12: Validación de la regresión de relación de vacíos.
Figura 13: Validación de la regresión de índice de compresión.
Figura 14: Validación de la regresión de índice de recompresión.
Figura 15: Validación de la regresión de resistencia cortante no drenada.
Figura 16: Validación de la regresión de ángulo de fricción interna.

Conclusiones

El uso de técnicas de aprendizaje automático para la predicción de variables geotécnicas en suelos cohesivos de la sabana de Bogotá ha demostrado ser una metodología efectiva y robusta. A lo largo de este estudio, se ha enfatizado en la importancia del entrenamiento y validación de modelos, así como en el uso de técnicas avanzadas como stacking para el ensamblaje de los mismos.

Análisis exploratorio de datos (EDA): El EDA fue un elemento fundamental en la limpieza y preparación de los datos. Este proceso permitió la identificación y el manejo de valores atípicos, así como la comprensión de las relaciones entre las diferentes variables de predicción. La representación de los datos faltantes y la comprensión de la relación entre las variables de las propiedades del índice y las propiedades de resistencia o compresibilidad fueron cruciales para la precisión del modelo.

Entrenamiento y validación de modelos: El proceso de entrenamiento y validación de modelos es crucial para garantizar la precisión y confiabilidad de las predicciones. Se implementaron varios modelos de regresión, incluidos los de cresta, lazo, red elástica, redes neuronales y máquinas de vectores de soporte. Estos modelos se entrenaron y validaron utilizando un conjunto de datos dividido en 2/3 para el entrenamiento y 1/3 para las pruebas, lo que evaluó de manera efectiva su desempeño.

Ensamblaje de modelos (apilamiento): El ensamblaje de modelos con las mejores métricas de desempeño mediante técnicas de apilamiento permitió la optimización de las predicciones de peso unitario total. Este enfoque combinado aprovecha las fortalezas individuales de cada modelo, lo que da como resultado resultados de regresión más precisos y robustos.

Ventajas y aplicabilidad: Si bien este proceso requiere una cantidad significativa de exploraciones geotécnicas, la principal ventaja de esta metodología es su capacidad de adaptarse a proyectos específicos con información geotécnica particular. Esto permite realizar predicciones basadas en datos específicos del proyecto, mejorando la precisión y utilidad de los resultados para cada caso particular.

El uso de técnicas de aprendizaje automático para predecir variables geotécnicas en suelos cohesivos de la sabana de Bogotá ha demostrado ser una metodología efectiva, mejorando significativamente la caracterización y comprensión del comportamiento del suelo. Esta metodología no solo optimiza los recursos disponibles, sino que también proporciona un marco flexible y adaptable para futuras aplicaciones en proyectos geotécnicos específicos.

Referencias

Author picture

by: Camilo García

Posts Relacionados

Oficina central

Calle 10 30, San Pedro de los Pinos, Benito Juárez, 03800 Ciudad de México, CDMX

SOPORTE DE CORREO ELECTRÓNICO

info@soilsolution.com.mx

El futuro del monitoreo en la construcción
Newsletter Semanal
Mantente al día en el Sector de la Construcción con boletines semanales que presentan noticias, Inversiones, proyectos y más.
Copyright © 2024 terzaghi.mx Todos los derechos reservados, desarrollado por Soilsolution Company.