Reconocimiento de imagen

El reconocimiento de imágenes ( análisis de imágenes en inglés ) es una rama del reconocimiento de patrones y el procesamiento de imágenes . En el reconocimiento de imágenes, se intenta segmentar objetos en una imagen . A estos se les asigna una descripción simbólica, pero no se buscan conexiones entre los objetos, como es habitual en el análisis de patrones .

definición

El reconocimiento de imágenes en el contexto del procesamiento de imágenes es la capacidad del software para identificar objetos, lugares, personas, escritos y acciones en imágenes. Las computadoras pueden usar tecnologías de procesamiento de imágenes en combinación con una cámara y software de inteligencia artificial para lograr objetos en imágenes.

Si bien los cerebros de los humanos y los animales reconocen fácilmente los objetos, las computadoras todavía tienen dificultades con tales tareas hasta el día de hoy. El software para el reconocimiento de imágenes requiere un profundo aprendizaje automático . Los procesadores de convolución de redes neuronales artificiales funcionan mejor porque la tarea específica requiere enormes recursos de hardware debido a su naturaleza computacionalmente intensiva . Los algoritmos de reconocimiento de imágenes pueden funcionar con la ayuda de modelos 3D comparativos , apariencias desde diferentes ángulos con la ayuda del reconocimiento de bordes o mediante componentes. Estos algoritmos a menudo se entrenan mecánicamente en millones de imágenes preetiquetadas .

Aplicaciones

Existen innumerables áreas de aplicación para el reconocimiento de imágenes digitales:

  • Etiquetar y etiquetar automáticamente objetos en imágenes en grandes bases de datos de imágenes, e . B. en flickr.com o la API Cloud Vision de Google.
  • Reconozca imágenes o secciones de imágenes de productos multimedia y asígnelas al producto correspondiente. A continuación, se puede consultar información sobre los productos, por ejemplo, información de contenido, género, asignación, críticas, reseñas o comparaciones de precios.
  • Reconocimiento facial
  • Control de robots autónomos , vehículos autónomos y sistemas de prevención de accidentes.
  • Reconocimiento de marcas de registro en la industria. Los componentes electrónicos y las marcas de registro se miden para lograr el ensamblaje más preciso posible.
  • Clasificación y detección de errores, p. Ej. B. de productos a granel, placas de circuitos, impresiones fotográficas.
  • Análisis de imágenes basado en objetos OBIA como método de geografía
  • Detección automatizada de "comportamientos anormales" de personas en los flujos de datos de vídeo de las cámaras de vigilancia pública para la prevención del delito, véase el controvertido proyecto de la UE INDECT
  • Con la aplicación TapTapSee, las personas ciegas pueden tomar fotografías de su entorno. Luego, una voz dice lo que se puede ver en la imagen. Por ejemplo, las personas ciegas pueden averiguar el color de una prenda de vestir. La aplicación es gratuita, por lo que puede probar esta tecnología usted mismo.

literatura

  • H. Niemann: Análisis y comprensión de patrones. Serie Springer en Ciencias de la Información, Berlín 1990
  • A. Pinz: Comprensión de imágenes. Libros de texto de informática, Springer-Verlag

enlaces web

Evidencia individual

  1. TechTarget: reconocimiento de imágenes
  2. Una aplicación gratuita muestra a los ciegos el mundo chip.de.