El análisis exploratorio de datos ( EDA ) es un análisis de las principales propiedades de los datos, encontrando patrones comunes, distribuciones y anomalías en ellos, construyendo modelos iniciales, a menudo utilizando herramientas de visualización .
El concepto fue introducido por el matemático John Tukey , quien formuló los objetivos de dicho análisis de la siguiente manera:
Los principales medios de análisis exploratorio son el estudio de distribuciones de probabilidad de variables, la construcción y análisis de matrices de correlación , análisis factorial , análisis discriminante , escalamiento multidimensional .