Según leemos en el blog del MIT, Google está desarrollando un software capaz de describir lo que aparece en una imagen.
Uno de las principales aspiraciones de Google es entender y procesar de forma automatizada la información aportada por el usuario para ofrecerle los mejores resultados. A lo largo de los años, han ido mejorando su sistema de búsqueda, devolviendo cada vez resultados más acertados y completos a las cuestiones planteadas. También se han enfocado en conseguir un sistema de voz a texto que pudiese entender con gran precisión el lenguaje natural, lo que han logrado bastante bien con su servicio de voz.
También se enfocaron en crear y perfeccionar la búsqueda de imágenes en la Web. En 2012, ya introdujeron un sistema para buscar información, introduciendo una imagen como patrón de búsqueda. Ahora, los chicos de Google quieren ir un paso más allá y están trabajando en un prometedor proyecto sobre la descripción automática de imágenes.
En concreto, se trata de un software, que están desarrollando en fase experimental, y que es capaz de describir automáticamente el contenido de las imágenes, en forma de frases completas, lo que supondría un gran avance en el campo del análisis de imágenes. Según Google, el desarrollo de este sistema ha sido posible gracias a los grandes avances que se han producido en el campo de la traducción automática y gracias a la utilización de Redes Neuronales Recurrentes (RNN).
Hasta ahora, el análisis de imágenes se centraba en la detección de objetos únicos, en base a patrones previos, pero Google quiere juntar el análisis computarizado de la imagen y el procesado de lenguaje natural para realizar una descripción de la imagen con un enfoque bastante humanizado, proporcionando una frase natural, como si la estuviese describiendo una persona.
Los investigadores ya han probado el software con conjuntos de datos como Flickr8k, Pascal y SBU, mostrando unos resultados prometedores. Con este sistema, que todavía está en una fase experimental, se mejoraría radicalmente la búsqueda de imágenes, pero también podrá ser utilizado como una ayuda para describir el contenido de las imágenes a personas invidentes o con deficiencias visuales.