ID3 (algoritmo)

El algoritmo ID3  es uno de los algoritmos para construir un árbol de decisión . Diseñado por John R. Quinlan John R. Quinlan .  Posteriormente, Quinlan creó una versión mejorada: el algoritmo C4.5 .

Algoritmo

  1. Tome todas las características no utilizadas y calcule su entropía en relación con las muestras de prueba
  2. Elija una característica para la que la entropía sea mínima (y la ganancia de información, respectivamente, sea máxima)
  3. Haz un nodo de árbol que contenga este rasgo

El algoritmo es el siguiente:

ID3 (Tabla de ejemplos, Característica de destino, Características)

  1. Si todos los ejemplos son positivos, devuelva el nodo con la etiqueta "+".
  2. Si todos los ejemplos son negativos, devuelva el nodo con la etiqueta "-".
  3. Si el conjunto de características está vacío, devuelva el nodo con la etiqueta que aparece más en los valores de características de destino en los ejemplos.
  4. De lo contrario:
    1. A es la característica que mejor clasifica los ejemplos (con el máximo beneficio informativo).
    2. Crear una raíz de árbol de decisión; el signo en la raíz será .
    3. Para cada valor posible ( ):
      1. Agregue una nueva rama de árbol debajo de la raíz con un nodo con valor
      2. Seleccione un subconjunto de ejemplos que tengan .
      3. Si el subconjunto de ejemplos está vacío, debajo de esta nueva rama, agregue un nodo con la etiqueta que aparece más en los valores de la función de destino en los ejemplos.
      4. De lo contrario, debajo de esta nueva rama, agregue un subárbol llamando recursivamente a ID3( , Target Feature, Features)
  5. Devolver raíz.

Literatura