Actualmente, buscar imágenes en Google o Yahoo! puede resultar una experiencia bastante dispar, sobretodo si intentamos encontrar algo que excede el concepto de objeto (perro, casa, auto, etc.). La tecnología utilizada hasta el momento se basa en la información META de la imagen, sea título, “alt=”, fecha u otros datos básicos; lo que de por si torna muy limitada su capacidad, ya que por ejemplo muchos webmasters no utilizan nombres descriptivos como niño-saltando.jpg, sino asfew7897.jpg. De hecho, al buscar una imagen para este artículo con los términos lupa y foto, no encontré nada satisfactorio.

Sin embargo, investigadores de la Universidad de California (UCSD) han desarrollado una nueva tecnología para buscar imágenes que si bien no soluciona el problema, brinda un nuevo mecanismo para identificarlas. Denominaron esta especie de acercamiento como “basado en contenido”, el cuál considera elementos como color, textura y líneas para formar una descripción automática. Luego, las características de la imagen son comparadas con las de otras imágenes y así forman coincidencias probables en base a estadísticas; pero en lugar de referirse sólo a números, utiliza palabras claves o “etiquetas semánticas” como parte de la descripción.

El sistema almacena una inmensa cantidad de objetos junto a sus respectivas etiquetas, lo que posibilita un mayor acierto al compararlos con objetos que aún no fueron etiquetados, y alcanzando en muchos casos palabras iguales a las utilizadas por humanos para describirlos. El resultado será un motor de búsqueda que clasifica con etiquetas los objetos incluidos dentro de una imagen. Así, en una foto de una pradera, teorícamente podría producir palabras como “sol”, “pasto”, “flores” para describirla y facilitar el ser hallada.

Hace un tiempo Google realizó una experimento muy inteligente en forma de juego, dónde dos visitantes veían imágenes al azar y cada uno debía colocar la palabra que mejor la describiera; en caso de que ambos eligieran la misma, se formaba una coincidencia. Google aprovechó toda esa información para incluirla en su motor de búsqueda de imágenes, con palabras que a priori no podían atribuirse por datos básicos.

Así vemos que la tecnología “basada en contenido” realiza básicamente lo mismo que Google probó con nosotros pero de manera automatizada, donde en primer lugar las computadoras reemplazan al ojo humano para describir, y luego forman conclusiones en base a coincidencias estadísticas; arrojando por último palabras claves que eventualmente coincidirán con las utilizadas por los usuarios al buscar.

El problema es -y seguirá siendo por bastante tiempo- cómo describir sentimientos, verbos y demás abstracciones que superan a meros objetos elementales y que se encuentran presentes en una gran cantidad de imágenes.

Fuente: Technology Review