Aprendizaje automático automático

El aprendizaje automático automatizado ( AutoML ) es el proceso de automatización del proceso integral de aplicación del aprendizaje automático a problemas del mundo real. En una aplicación típica de aprendizaje automático, el usuario debe aplicar adecuados de preprocesamiento de datos , ingeniería de características, extracción de características y selección de características que hacen que el conjunto de datos sea adecuado para el aprendizaje automático. Después de estos pasos, el trabajador debe realizar la selección de algoritmos y la optimización de hiperparámetros para maximizar el rendimiento previsto del modelo final. Dado que muchos de estos pasos no pueden ser realizados por humanos sin ser expertos, el enfoque de AutoML se ha propuesto como una solución basada en IA para la necesidad cada vez mayor de aprendizaje automático [1] [2] . Automatizar el proceso de principio a fin de aplicar el aprendizaje automático tiene la ventaja de obtener soluciones más simples, una creación más rápida de tales soluciones y modelos que a menudo superan a los modelos creados manualmente.

El aprendizaje automático automático puede apuntar a diferentes etapas del proceso [2] :

preparación automática de datos y recopilación y almacenamiento de datos (a partir de datos sin procesar y varios formatos):
- detección automática del tipo de columna, como datos booleanos, datos numéricos discretos, valores numéricos continuos o texto;
- determinación automática del significado de la columna; por ejemplo, un objetivo, una etiqueta, un campo de regionalización , un atributo numérico, una categoría de texto o texto libre;
- descubrimiento automático de tareas, como clasificación binaria , regresión , agrupamiento o clasificación ;
construcción automática de características :
- selección de funciones
- extracción de características
- meta -aprendizaje y transferencia de aprendizaje
- detección y procesamiento de datos asimétricos o valores faltantes;
selección automática de modelo ;
optimización de hiperparámetros del algoritmo de aprendizaje y caracterización;
selección automática de canales por tiempo, memoria y límites de dificultad;
selección automática de métricas de evaluación y procedimientos de validación;
Comprobación automática de tareas:
- detección de fugas;
- identificar errores de configuración;
análisis automático de los resultados obtenidos;
resultados personalizados y visualización para el aprendizaje automático automático

Notas

↑ Auto-WEKA: Selección combinada y optimización de hiperparámetros de algoritmos de clasificación . KDD '13 Actas de la 19.ª conferencia internacional ACM SIGKDD sobre descubrimiento de conocimiento y minería de datos. páginas. 847-855. Parámetro desconocido |год=( ayuda ); Parámetro desconocido |автор=( ayuda ); Parámetro desconocido |ссылка=( ayuda )
↑ 1 2 Hutter F, Caruana R, Bardenet R, Bilenko M, Guyon I, Kegl B y Larochelle H. AutoML 2014 @ ICML . Taller de AutoML 2014 en ICML . Recuperado: 28 de marzo de 2018. (indefinido)

Literatura

Kotthoff L., Thornton C., Hoos HH, Hutter F., Leyton-Brown K. Auto-WEKA 2.0: selección automática de modelos y optimización de hiperparámetros en WEKA // Journal of Machine Learning Research. — 2017.
Feurer M., Klein A., Eggensperger K., Springenberg J., Blum M., Hutter F. Aprendizaje automático eficiente y robusto // Avances en sistemas de procesamiento de información neuronal 28 (NIPS 2015). — 2015.
Olson RS, Urbanowicz RJ, Andrews PC, Lavender NA, Kidd L., Moore JH Automatización de la ciencia de datos biomédicos a través de la optimización de canalizaciones basadas en árboles // Actas de EvoStar 2016. - 2016. - doi : 10.1007/978-3-319-31204 -0_9 . -arXiv : 1601.07925 . _
Olson RS, Bartley N., Urbanowicz RJ, Moore JH Evaluación de una herramienta de optimización de tuberías basada en árboles para automatizar la ciencia de datos // Actas de EvoBIO 2016. - 2016. - doi : 10.1145/2908812.2908918 . -arXiv : 1603.06212 . _
Alex GC de Sá, Walter José GS Pinto, Luiz Otavio VB Oliveira, Gisele L. Pappa. RECETA : Un marco basado en la gramática para canalizaciones de clasificación en evolución automática . - Springer International Publishing, 2017. - (Lecture Notes in Computer Science). — ISBN 9783319556956 . -doi : 10.1007 / 978-3-319-55696-3_16 .

Aprendizaje automático y minería de datos
Tareas	Problema de clasificación Aprender sin un maestro Aprendizaje asistido por profesores Análisis de regresión AutoML reglas de asociación Extracción de características entrenamiento de rasgos Entrenamiento de clasificación Derivación gramatical Aprender en línea
Aprendiendo con un maestro	método del k-vecino más cercano Clasificador bayesiano ingenuo árbol de decisión Máquinas de vectores soporte Regresión lineal Regresión logística perceptrón conjuntos de modelos Harpillera impulsar bosque aleatorio Método de vector relevante
análisis de conglomerados	método k-medias método de agrupamiento difuso Agrupación jerárquica algoritmo EM ABEDUL CURAR DBSCAN ÓPTICA Desplazamiento medio
Reducción de dimensionalidad	Análisis factorial Método de componentes principales CCA ICA LDA Expansión de matriz no negativa t-SNE
Pronóstico estructural	Graficar modelo probabilístico red bayesiana Modelo oculto de Markov FRC
Detección de anomalías	método del k-vecino más cercano Nivel de emisión local
Graficar modelos probabilísticos	red bayesiana Red de Markov Modelo oculto de Markov
Redes neuronales	Máquina Boltzmann limitada mapa autoorganizado Función de activación Sigmoideo softmax Funcion de base radial Método de propagación hacia atrás Aprendizaje profundo perceptrón multicapa Red neuronal recurrente memoria a corto plazo Bloque recurrente controlado Red neuronal convolucional U-red Codificador automático
Aprendizaje reforzado	proceso de Markov Ecuación de Bellman Algoritmo codicioso Q-aprendizaje SARAS Diferencia temporal (DT)
Teoría	Teoría de Vapnik-Chervonenkis Dilema de dispersión de sesgo Teoría del aprendizaje computacional Minimización empírica del riesgo El aprendizaje de Occam aprendizaje PAC Teoría del aprendizaje estadístico
revistas y congresos	NeurIPS ICML ML JMLR ArXiv:cs.LG