Aprendizaje automático automático
El aprendizaje automático automatizado ( AutoML ) es el proceso de automatización del proceso integral de aplicación del aprendizaje automático a problemas del mundo real. En una aplicación típica de aprendizaje automático, el usuario debe aplicar adecuados de preprocesamiento de datos , ingeniería de características, extracción de características y selección de características que hacen que el conjunto de datos sea adecuado para el aprendizaje automático. Después de estos pasos, el trabajador debe realizar la selección de algoritmos y la optimización de hiperparámetros para maximizar el rendimiento previsto del modelo final. Dado que muchos de estos pasos no pueden ser realizados por humanos sin ser expertos, el enfoque de AutoML se ha propuesto como una solución basada en IA para la necesidad cada vez mayor de aprendizaje automático [1] [2] . Automatizar el proceso de principio a fin de aplicar el aprendizaje automático tiene la ventaja de obtener soluciones más simples, una creación más rápida de tales soluciones y modelos que a menudo superan a los modelos creados manualmente.
El aprendizaje automático automático puede apuntar a diferentes etapas del proceso [2] :
- preparación automática de datos y recopilación y almacenamiento de datos (a partir de datos sin procesar y varios formatos):
- detección automática del tipo de columna, como datos booleanos, datos numéricos discretos, valores numéricos continuos o texto;
- determinación automática del significado de la columna; por ejemplo, un objetivo, una etiqueta, un campo de regionalización , un atributo numérico, una categoría de texto o texto libre;
- descubrimiento automático de tareas, como clasificación binaria , regresión , agrupamiento o clasificación ;
- construcción automática de características :
- selección de funciones
- extracción de características
- meta -aprendizaje y transferencia de aprendizaje
- detección y procesamiento de datos asimétricos o valores faltantes;
- selección automática de modelo ;
- optimización de hiperparámetros del algoritmo de aprendizaje y caracterización;
- selección automática de canales por tiempo, memoria y límites de dificultad;
- selección automática de métricas de evaluación y procedimientos de validación;
- Comprobación automática de tareas:
- detección de fugas;
- identificar errores de configuración;
- análisis automático de los resultados obtenidos;
- resultados personalizados y visualización para el aprendizaje automático automático
Notas
- ↑ Auto-WEKA: Selección combinada y optimización de hiperparámetros de algoritmos de clasificación . KDD '13 Actas de la 19.ª conferencia internacional ACM SIGKDD sobre descubrimiento de conocimiento y minería de datos. páginas. 847-855.
- ↑ 1 2 Hutter F, Caruana R, Bardenet R, Bilenko M, Guyon I, Kegl B y Larochelle H. AutoML 2014 @ ICML . Taller de AutoML 2014 en ICML . Recuperado: 28 de marzo de 2018. (indefinido)
Literatura
- Kotthoff L., Thornton C., Hoos HH, Hutter F., Leyton-Brown K. Auto-WEKA 2.0: selección automática de modelos y optimización de hiperparámetros en WEKA // Journal of Machine Learning Research. — 2017.
- Feurer M., Klein A., Eggensperger K., Springenberg J., Blum M., Hutter F. Aprendizaje automático eficiente y robusto // Avances en sistemas de procesamiento de información neuronal 28 (NIPS 2015). — 2015.
- Olson RS, Urbanowicz RJ, Andrews PC, Lavender NA, Kidd L., Moore JH Automatización de la ciencia de datos biomédicos a través de la optimización de canalizaciones basadas en árboles // Actas de EvoStar 2016. - 2016. - doi : 10.1007/978-3-319-31204 -0_9 . -arXiv : 1601.07925 . _
- Olson RS, Bartley N., Urbanowicz RJ, Moore JH Evaluación de una herramienta de optimización de tuberías basada en árboles para automatizar la ciencia de datos // Actas de EvoBIO 2016. - 2016. - doi : 10.1145/2908812.2908918 . -arXiv : 1603.06212 . _
- Alex GC de Sá, Walter José GS Pinto, Luiz Otavio VB Oliveira, Gisele L. Pappa. RECETA : Un marco basado en la gramática para canalizaciones de clasificación en evolución automática . - Springer International Publishing, 2017. - (Lecture Notes in Computer Science). — ISBN 9783319556956 . -doi : 10.1007 / 978-3-319-55696-3_16 .