2/19/2005

Google OCR

Google ha comenzado a escanear los graficos de su base de datos, a fin de conseguir un mayor nivel de identificacion de las imagenes
Imaginate un cartel de carretera que informa de la proximidad del monasterio de Silos , por ejemplo
El autor de la web le pone como titulo el que sale de la camara digital : 45122984.jpeg, o por el contrario , senalcarretera.jpeg

En una busqueda de Silos jamas aparecera esta imagen, necesitarian un ejercito de escribas digitales revisando los millones de imagenes que se suben diariamente para poder identificarlos correctamente y aun con esta tecnica sera muy parcial la informacion

Seguramente fotografiado al borde de la carretera con un paisaje castellano al fondo en poniente la imagen deberia de llevar etiquetas identificativas adicionales como: Espa�a, Castilla, paisaje, lengua espa�ola, monasterio, Silos, puesta de sol , verano... y eso el OCR no esta en condiciones de etiquetarlo adecuadamente

Esta informacion optimizada solo se ve en las bases de datos de imagenes de pago y es que tienen que tener un ejercito de humanos detras a�adiendo los tags identificativos . Ninguna maquina puede interpretar totalmente las imagenes