Teoría del aprendizaje computacional

La teoría del aprendizaje computacional ( en inglés Computational Learning  Theory , o simplemente teoría del aprendizaje ) es un subcampo de la teoría de la inteligencia artificial , dedicado al desarrollo y análisis de algoritmos de aprendizaje automático [1] .

Resumen

Los resultados teóricos en el aprendizaje automático se ocupan principalmente del aprendizaje inductivo, que se denomina aprendizaje supervisado . Con este enfoque, el algoritmo recibe muestras etiquetadas de alguna manera. Por ejemplo, las muestras pueden ser descripciones de hongos y la etiqueta determina si el hongo es comestible o no. El algoritmo toma estas muestras etiquetadas y las usa para obtener el clasificador . El clasificador es una función que asigna etiquetas a las muestras, incluidas las muestras que el algoritmo no ha escaneado previamente. El objetivo del aprendizaje supervisado es optimizar alguna medida de rendimiento, como minimizar la cantidad de errores cometidos en nuevas muestras.

Además de la frontera de eficiencia, la teoría del aprendizaje computacional estudia la complejidad temporal y la realizabilidad de un algoritmo. En la teoría del aprendizaje computacional, se dice que un cálculo es realizable si se puede realizar en tiempo polinomial . Hay dos tipos de complejidad temporal de los resultados:

Los resultados negativos a menudo se basan en ciertas afirmaciones que se creen pero no se prueban, como:

Hay varios enfoques diferentes para la teoría del aprendizaje computacional. Estas diferencias se basan en suposiciones sobre los principios de inferencia utilizados para generalizar a partir de datos limitados. Estos principios incluyen la definición de probabilidad (ver probabilidad de frecuencia , probabilidad bayesiana ) y varios supuestos sobre la generación de muestras. Varios enfoques incluyen:

La teoría del aprendizaje computacional conduce a algunos algoritmos prácticos. Por ejemplo, la teoría VPK dio origen al impulso , la teoría de Vapnik-Chervonenkis condujo a las máquinas de vectores de soporte y la inferencia bayesiana condujo a las redes bayesianas (autor: Judah Pearl ).

Véase también

Notas

  1. ACL: Asociación para el aprendizaje computacional . Consultado el 5 de diciembre de 2018. Archivado desde el original el 25 de enero de 2012.

Literatura

Enlaces