AutoML es una importante tecnología que simplifica la construcción, entrenamiento e implementación de modelos de aprendizaje automático, o Machine Learning (ML). En resumen, elimina la complejidad del flujo de trabajo de punta a punta. Esto permite que incluso los usuarios principiantes puedan experimentar el poder del ML. Startups, grandes empresas y comunidades de todo el mundo están desarrollando herramientas con funcionalidades de fácil uso que, en algunos casos, solo requieren unas pocas líneas de código para operar, como AutoGluon, una de las herramientas más populares en esta categoría.
La promesa de AutoML suena a ficción, pero no lo es. Un día en el futuro, esta tecnología estará en todas partes; no solo en la nube, sino también en automóviles, teléfonos, sitios web, aplicaciones y mucho más, con cada pieza desempeñando su papel. Además, requerirá una intervención humana mínima para construir, entrenar e implementar modelos sobre la marcha.
En la actualidad, algunas herramientas, como la propia AutoGluon, son capaces de preparar los datos, limpiarlos, realizar ingeniería de atributos o Feature Engineering, selección de algoritmos, ajuste de hiperparámetros, selección de modelos, entrenamientos y mucho más. Esto cortesía de Amazon, la organización detrás de la herramienta.
AutoGluon puede “entrenar modelos de ML de última generación para la clasificación de imágenes, detección de objetos, clasificación de textos y predicción de datos tabulares” sin la necesidad de ser expertos en el área. Hay otras populares herramientas de AutoML de código abierto como Auto-sklearn, NNI y Google Model Search. A continuación, encontrarás una lista de herramientas dentro de este mercado. Algunas están en constante evolución y tienen grandes comunidades detrás de ellas.
Herramientas de AutoML
- AutoGluon
- TransmogrifAI
- Auto-sklearn
- Neural Network Intelligence (NNI)
- Auto-Keras
- TPOT
- AutoWeka
- Model Search
Algunas de las tareas más difíciles en el trabajo con Machine Learning (ML), especialmente para alguien sin experiencia en la ciencia de datos, son la preparación de datos, la selección de algoritmos, la selección de modelos y el ajuste de hiperparámetros. Las herramientas de AutoML resuelven todo eso en minutos.
Lista de herramientas de AutoML de código abierto
Nombre | Tipo | Notas | Características |
AutoGluon | Funciona con aprendizaje profundo (deep learning) y Machine Learning clásico. | Compatible con datos de texto, objetos y tablas. | Ajuste automático de hiperparámetros, selección de modelos, búsqueda de arquitectura. |
TransmogrifAI | Acelera la productividad de los desarrolladores de ML. | Funciona con datos estructurados. | Los algoritmos ayudan con la feature engineering, la selección de modelos y atributos. |
Auto-sklearn | Aprendizaje automático supervisado listo para usar. | Viene con 15 algoritmos de clasificación y 14 de preprocesamiento de atributos. | Busca un conjunto de datos correcto y optimiza los hiperparámetros. |
NNI | Gestiona experimentos de AutoML. | Busca la mejor arquitectura neuronal y los mejores hiperparámetros. | Automatiza la feature engineering, el ajuste de hiperparámetros, la compresión de modelos y NAS (búsqueda). |
Auto-Keras | Trabaja con aprendizaje profundo, clasificación y regresión. | Bastante integrado con TensorFlow. | Encuentra los mejores hiperparámetros y arquitectura de modelo. |
TPOT | Desarrollado inicialmente para la comunidad científica. | Optimiza los pipelines de ML. | Explora miles de posibles pipelines para identificar el mejor. |
Auto-Weka | Para la preparación, clasificación, regresión, agrupación y visualización de datos. | Ayuda a identificar los mejores algoritmos e hiperparámetros para una aplicación determinada. | Recopilación de algoritmos para la minería de datos. |
Google Model Search | Ayuda con problemas de clasificación. | Listo para usar, busca y compara modelos. | Búsqueda de arquitectura modelo. |
Mientras que algunas herramientas de AutoML proporcionan un conjunto más estrecho de funcionalidades listas para usar, otras como AutoGluon son integrales. Nuestra predicción es que AutoML se volverá algo más común en unos tres años.