Menú de navegaciónMenú
Categorías

La mejor forma de Aprender Programación online y en español www.campusmvp.es

?id=806f0a28-8b8d-4098-b511-580baacda3f5

FRIKADAS: La red neuronal de Google que adivina la ubicación de cualquier foto

Icono de advertencia ATENCIÓN: este contenido tiene más de 2 años de antigüedad y, debido a su temática, podría contener información desactualizada o inexacta en la actualidad.

Te proponemos una tarea complicada: vete a tu buscador de imágenes favorito, busca una fotografía cualquiera y trata de adivinar, solo usando la imagen, aproximadamente en dónde fue tomada. No hace falta acertar la ciudad, llega con el país o incluso el continente...

Parece una tarea sencilla, pero no lo es en absoluto. Si la foto tiene un edificio representativo o un cartel de carretera es muy fácil, pero si lo único que tenemos es un paisaje o, peor aún, el interior de un edificio, es casi imposible acertar por mucho mundo que tengamos.

Hace unos días un equipo de investigación de Google, liderado por el especialista alemán en visión artificial Tobias Weyand, han lanzado un software, PlaNet, capaz de hacer precisamente eso: identificar la ubicación aproximada de una foto usando tan solo la propia foto.

La aplicación se basa, como no, en deep learning, y un entrenamiento acelerado imposible para cualquier humano.

Lo primero que hicieron fue recopilar de Internet 126 millones de imágenes geo-posicionadas. Dividieron el planeta en una rejilla de 26.000 rectángulos de diferente tamaño dependiendo de la cantidad de imágenes tomadas en cada zona, de modo que las grandes ciudades, por ejemplo, tenían una cantidad de rectángulos mayor que otras zonas donde se toman menos fotos. De hecho dejaron fuera los océanos y algunas zonas donde apenas se toman fotografías:

Google-Image-Location

Entregaron al algoritmo, como datos de entrenamiento, 91 millones de esas imágenes, y utilizaron las restantes para comprobar el grado de acierto que se conseguía.

Los resultados fueron muy buenos ya que PlaNet es capaz de ubicar:

  • El 3,6% de las imágenes llegando al detalle de en qué calle están tomadas.
  • El 10,1% con el detalle de ciudad
  • El 28,4% adivinando el país
  • El 48% indicando el continente en el que fueron tomadas

Puede que no parezcan resultados espectaculares, pero lo son. Comparados con un humano muy "viajado" acierta muchísimo más.

De hecho puedes medirte contra PlaNet de manera muy sencilla visitando www.geoguessr.com. Verás lo difícil que es. ¡Cuidado!, es muy adictivo :-)

Puedes leer con más detalle sobre PlaNet y el proyecto en el MIT's Technology Review.

Fecha de publicación:
campusMVP campusMVP es la mejor forma de aprender a programar online y en español. En nuestros cursos solamente encontrarás contenidos propios de alta calidad (teoría+vídeos+prácticas) creados y tutelados por los principales expertos del sector. Nosotros vamos mucho más allá de una simple colección de vídeos colgados en Internet porque nuestro principal objetivo es que tú aprendas. Ver todos los posts de campusMVP
Archivado en: DevFacts

Boletín campusMVP.es

Solo cosas útiles. Una vez al mes.

🚀 Únete a miles de desarrolladores

DATE DE ALTA

x No me interesa | x Ya soy suscriptor

La mejor formación online para desarrolladores como tú

Agregar comentario

Los datos anteriores se utilizarán exclusivamente para permitirte hacer el comentario y, si lo seleccionas, notificarte de nuevos comentarios en este artículo, pero no se procesarán ni se utilizarán para ningún otro propósito. Lee nuestra política de privacidad.