FRIKADAS: La red neuronal de Google que adivina la ubicación de cualquier foto

Publicado por campusMVP el 17 de marzo de 2016 a las 07:00

🚀 Avanza en tu carrera como desarrollador de la mano de los mejores »

Te proponemos una tarea complicada: vete a tu buscador de imágenes favorito, busca una fotografía cualquiera y trata de adivinar, solo usando la imagen, aproximadamente en dónde fue tomada. No hace falta acertar la ciudad, llega con el país o incluso el continente...

Parece una tarea sencilla, pero no lo es en absoluto. Si la foto tiene un edificio representativo o un cartel de carretera es muy fácil, pero si lo único que tenemos es un paisaje o, peor aún, el interior de un edificio, es casi imposible acertar por mucho mundo que tengamos.

Hace unos días un equipo de investigación de Google, liderado por el especialista alemán en visión artificial Tobias Weyand, han lanzado un software, PlaNet, capaz de hacer precisamente eso: identificar la ubicación aproximada de una foto usando tan solo la propia foto.

La aplicación se basa, como no, en deep learning, y un entrenamiento acelerado imposible para cualquier humano.

Lo primero que hicieron fue recopilar de Internet 126 millones de imágenes geo-posicionadas. Dividieron el planeta en una rejilla de 26.000 rectángulos de diferente tamaño dependiendo de la cantidad de imágenes tomadas en cada zona, de modo que las grandes ciudades, por ejemplo, tenían una cantidad de rectángulos mayor que otras zonas donde se toman menos fotos. De hecho dejaron fuera los océanos y algunas zonas donde apenas se toman fotografías:

Google-Image-Location

Entregaron al algoritmo, como datos de entrenamiento, 91 millones de esas imágenes, y utilizaron las restantes para comprobar el grado de acierto que se conseguía.

Los resultados fueron muy buenos ya que PlaNet es capaz de ubicar:

El 3,6% de las imágenes llegando al detalle de en qué calle están tomadas.
El 10,1% con el detalle de ciudad
El 28,4% adivinando el país
El 48% indicando el continente en el que fueron tomadas

Puede que no parezcan resultados espectaculares, pero lo son. Comparados con un humano muy "viajado" acierta muchísimo más.

De hecho puedes medirte contra PlaNet de manera muy sencilla visitando www.geoguessr.com. Verás lo difícil que es. ¡Cuidado!, es muy adictivo :-)

Puedes leer con más detalle sobre PlaNet y el proyecto en el MIT's Technology Review.

😱 Descubre la mejor formación online en español, para programadores como tú »

campusMVP es la mejor forma de aprender a programar online y en español. En nuestros cursos solamente encontrarás contenidos propios de alta calidad (teoría+vídeos+prácticas) creados y tutelados por los principales expertos del sector. Nosotros vamos mucho más allá de una simple colección de vídeos colgados en Internet porque nuestro principal objetivo es que tú aprendas. Ver todos los posts de campusMVP

Archivado en: DevFacts

0 comentarios

FRIKADAS: La red neuronal de Google que adivina la ubicación de cualquier foto

Solo cosas útiles. Una vez al mes.

Agregar comentario