Anotación automática de imágenes

La anotación automática de imágenes (también conocida como etiquetado automático de imágenes o indexación lingüística ) es el proceso mediante el cual un sistema informático asigna automáticamente metadatos en forma de leyendas o palabras clave a una imagen digital . Esta aplicación de técnicas de visión artificial se utiliza en sistemas de recuperación de imágenes para organizar y recuperar imágenes de una base de datos de interés.

Este método puede verse como un tipo de clasificación de imágenes de varias clases con una gran cantidad de clases: el tamaño es comparable al vocabulario. Por lo general, las técnicas de aprendizaje automático utilizan el análisis de imágenes en forma de vectores de características extraídos y palabras de entrenamiento de anotaciones para tratar de aplicar anotaciones automáticamente a nuevas imágenes. Los primeros métodos estudiaron las correlaciones entre las características de la imagen y las anotaciones de entrenamiento, luego se desarrollaron métodos utilizando la traducción automática para intentar traducir un diccionario de texto con "vocabulario visual" o regiones agrupadas conocidas como blobs. El trabajo posterior a estos esfuerzos incluyó enfoques clasificatorios, modelos de relevancia, etc.

La ventaja de la anotación automática de imágenes sobre la búsqueda de imágenes de contenido (CBIR) es que el usuario puede especificar las consultas de manera más natural. [1] CBIR generalmente (actualmente) requiere que los usuarios busquen conceptos de imagen como color y textura, o busquen consultas de muestra. Algunas características de la imagen en las imágenes de muestra pueden anular el concepto en el que el usuario está realmente enfocado. Los métodos tradicionales de búsqueda de imágenes se basan en imágenes etiquetadas manualmente, lo cual es un proceso costoso y lento, especialmente dadas las grandes y crecientes bases de datos de imágenes que existen.

Varios motores están conectados a Internet, incluido un motor de marcado en tiempo real [2] desarrollado por investigadores de la Universidad Estatal de Pensilvania y Behold. Empresas como Playment, Edgecase.ai, Microsoft VOTT.ai y dataloop.ai han creado motores de anotación de video automatizados integrados. Empresas como Alegion.com, Infolks, DataPure.co, Scaleapi.com, Diffgram.com, Figure-eight.com ofrecen una combinación de anotación automática de imágenes con una combinación de revisión manual cuando falla la automatización.

Notas

  1. Masashi Inoué. Sobre la necesidad de recuperación de imágenes basada en anotaciones  // Instituto Nacional de Informática 2-1-2 Hitotsubashi, Chiyoda-ku Tokio, Japón.
  2. ALIPR.com (enlace descendente) . Archivado desde el original el 3 de marzo de 2016.