Visión por computadora

Visión por computadora es un campo de inteligencia artificial que faculta a una computadora con la habilidad de ver a través de modelos entrenados a partir de información visual.  El objetivo principal es replicar algunas de las tareas que el humano realiza en su vida diaria como clasificar un objeto, localizarlo y diferenciarlo de su entorno a través de imágenes.

Para lograr realizar estas tareas, se toma de base la información de cada uno de los pixeles de la imagen que puede estar en una gran variedad de espacios de color. En el caso de RGB, los valores de los pixeles oscilan de 0 a 255 y es a través de la mezcla de los valores de estos tres canales se originan diversos colores. Esta información por si sola no basta, por lo que se tienen que hacer procesamientos a la imagen para poder extraer información relevante que nos permita interpretar su significado. Anteriormente un especialista seleccionaba uno a uno los procesamientos de la imagen, ahora con el avance en los métodos de machine learning podemos usar redes de aprendizaje profundas (Deep Learning) donde la extracción  de características no se realiza de manera manual si no a través de los mejores parámetros encontrados durante el entrenamiento de la red.

 Las principales tareas de visión por computadora son:

  • Clasificación: El proceso de categorizar una imagen por grupos.

  • Localización: Identificar en que parte de la imagen está el objeto a través de un bounding box.

  • Detección de un objeto: Establecer tanto la categoría como la localización de un objeto.

  • Segmentación Semántica: Identificar a que clase corresponde un píxel en una imagen.

  • Segmentación de instancia: identificación a que clase y a que objeto pertenece un píxel en una imagen.

Imagen tomada de CS231n Stanford.

Imagen tomada de CS231n Stanford.

 

Aplicaciones

Existe una gran diversidad de aplicaciones de visión por computadora, a continuación se mencionan algunas de ellas:

Vehículos autónomos: visión por computadora permite a los vehículos autónomos tener información relevante de su entorno como detección de carriles, señales de tránsito, peatones, personas, obstáculos entre otros. Esto se logra a través del procesamiento en tiempo real de las imágenes recabadas de varias cámaras ubicadas en diferentes ángulos y posiciones en el vehículo.

 Reconocimiento Facial. Se podría decir que es una de las aplicaciones más famosas de visión por computadora, ya que la integran aplicaciones enfocadas a redes sociales y  de seguridad. Un a algoritmo muy famoso en este ámbito es el de DeepFace de Facebook.

Cuidado de la Salud. Es un área que ha tomado gran relevancia en los últimos años y que permite a través del análisis de imágenes (RGB, rayos x, entre otras) poder detectar aquellas que tienen una alta probabilidad de ser cáncer.

Agricultura. El poder monitorear las diversas variables en los campos es una necesidad actualmente que impacta no solamente en las producciones de cultivos si no en el uso eficiente de recursos. Por lo que visión por computadora se ha estado utilizado para segmentar el cultivo, medir su crecimiento, detectar frutos y también amenazas como enfermedades y pestes.

 

Mercado de Visión por Computadora

De acuerdo con el estudio de Verified Market Research, el mercado global de visión por computadora en el 2018 estaba valuado en 11.88 Billones de USD y se tiene proyectado para el 2026 que alcance 21.24 Billones de USD. El mayor crecimiento se presentará en Asía, siguiendo por Norte América y Europa como se puede observar en la siguiente figura.

Imagen tomada de Verified Market Research.

Imagen tomada de Verified Market Research.

 

Conclusiones:

Visión por Computadora es un área que está en continuo crecimiento y evolución debido a la gran necesidad de aplicarla en actividades que involucran información visual. Además de la actual capacidad de procesamiento, algoritmos especializados y acceso a grandes cantidades de datos. Por lo que el impacto del desarrollo de nuevas aplicaciones y algoritmos no solo se restringe al ámbito científico, si no tecnológico y empresarial.  

Te invitamos a ser parte de este crecimiento a través de nuestros servicios de consultoría y entrenamiento especializado.

PhD (c). María de la Paz Rico Fernández.

Guest User