A partir de 500 mil fotografías tomadas con cámaras sencillas por unos 150 mil usuarios de Flickr, un equipo de científicos del Laboratorio de Imágenes y Gráficos de la Universidad de Washington construyó modelos digitales en 3D de tres ciudades europeas: Roma, Venecia y la ciudad croata de Dubrovnik. El gran desafío era lograr resultados similares a los obtenidos con Photosynth, de Microsoft, pero a mayor velocidad. ¿Lo habrán logrado? El futuro del planeamiento urbanístico, mezclado con la preservación de lugares históricos, está naciendo de la mano de la modelación 3D. Ven y viaja con nosotros.
Un grupo de investigadores tomaron de Flickr, el popular sitio de almacenamiento e intercambio de imágenes, cerca de 500 mil fotografías desde el perfil de unos 150 mil usuarios (alguna vez turistas) que poseían en sus imágenes tags con el nombre de la ciudad de Roma y que, con sus cámaras personales, fotografiaron cada rincón de la ciudad. Gracias a esto, en el Laboratorio de Imágenes y Gráficos de la Universidad de Washington fueron capaces de reconstruir los principales paseos de la ciudad en un día.
El trabajo realizado por estos estudiosos se sustenta en algoritmos utilizados en la aplicación Photosynth de Microsoft con la diferencia sustancial que este nuevo sistema funciona como si tuviera un “plus” de esteroides. En referencia a este trabajo, el profesor asistente de la Universidad de Washington, Sameer Agarwal, señaló que la diferencia clave con Photosynth radica en que este producto está destinado a hacer un solo monumento o lugar de referencia o escenario, lo que significa trabajar con unos centenares (o miles) de fotografías antes de transformarse en un proceso demasiado lento.
Además, Agarwal aseguró que el gran avance presentado por estos investigadores es la capacidad de interpolar las imágenes a la mayor velocidad posible, posibilitando de esta forma el procesamiento de enormes conjuntos de datos. Una serie de videos en el sitio web del proyecto les permite a los visitantes volar a través de lugares históricos como la Basílica de San Pedro, el Coliseo Romano y la Plaza San Marco de Venecia. En el caso de Dubrovnik, que es un lugar mucho más pequeño, se puede ver toda la ciudad, incluyendo las montañas en la distancia. Cada vídeo incluye grupos de formas rómbicas pequeñas al nivel del suelo que representan a cada fotógrafo y su punto de vista.
Los equipos de trabajo construyeron un nuevo algoritmo cuyo funcionamiento se puede dividir en dos fundamentos básicos. Primero, hacer coincidir todos los puntos en común que poseen las fotografías, al mejor estilo de un rompecabezas, y luego seleccionar la escena de acuerdo a la pose de cada fotógrafo al momento de realizar la toma. También diseñaron para este trabajo un nuevo software en el que se puede resolver más rápidamente el tipo de problemas matemáticos de gran tamaño que existen en una reconstrucción 3D a partir de imágenes planas.
Se necesitaron 13 horas de proceso utilizando 500 ordenadores para que coincidan las 150 mil fotos de monumentos de Roma y ocho horas más para construir una imagen 3D de ellos. Para las imágenes de la ciudad de Venecia participaron 250 mil imágenes que necesitaron 27 horas para que coincidan y 38 horas para generar el modelo en tres dimensiones. Haciendo la comparación, si se hubiesen utilizado sólo los algoritmos en que se basa Photosynth, los 500 ordenadores tendrían que haber trabajado por lo menos un año para que coincidan las 250.000 mil imágenes utilizadas.
En el caso de la costera ciudad croata de Dubrovnik había menos fotos, así que sólo se necesitaron cerca de cinco horas para la interpolación de imágenes, pero la reconstrucción y el armado del modelo en 3D consumió casi 18 horas de trabajo. En referencia a esto, el equipo dejó ver que es lógico que con más fotos se necesitara mayor tiempo de proceso, pero había tantas similitudes entre las fotos de Roma que era más fácil de poner a todas juntas en puntos de referencia individuales. Es decir, el equipo encontró montones de fotografías que, colocadas juntas, daban una cantidad muy importante de “detalles finos” de la parte frontal de la Fontana de Trevi, por ejemplo. Por su parte, el Coliseo Romano para sí solo tenía 2 mil imágenes. Sin embargo, en el trabajo realizado en Dubrovnik, el equipo pudo recabar tan solo 4.600 fotos que correspondían a todas las porciones o sectores de la ciudad "vieja", que comprende varias calles estrechas y edificios altos.
"Para Roma, ya que la mayoría de las imágenes recibidas fueron paisajes, la geometría es bastante simple. Incluso a pesar de que la geometría de las edificaciones es bastante complicada, en general el trabajo global resultó bastante sencillo", aseguró Agarwal. "Para Dubrovnik, en cambio, no es sólo una cuestión de tener una gran cantidad de imágenes sino que arquitectónicamente la geometría requerida para un modelado 3D de esta ciudad es mucho más compleja".
Steve Seitz, otro miembro del equipo, dijo que el próximo objetivo es unir un millón de fotos con el objeto de obtener la creación de un tour 3D que abarque toda la ciudad. Mencionó además que "este es uno de los principales desafíos intelectuales aquí. Queremos ver cómo gran parte de la ciudad puede ser reconstruida a partir de las imágenes que los propios turistas puedan tomar de manera casual". Agarwal, por su parte, expresó que este tipo de tecnología podría utilizarse para todo, desde juegos de video y una próxima generación de GPS hasta la preservación de sitios históricos, en aras de la posteridad.
Este es el caso de Venecia que se hunde lentamente en la laguna que la rodea. Una gran reconstrucción en 3D podría preservar la ciudad para las generaciones futuras, aquellas que quizás ya no la vean. Otro ejemplo expuesto se refiere a las ciudades que son propensas a sufrir movimientos sísmicos. Toda la información acopiada podría ser catalogada tanto para la historia como para los esfuerzos de una apropiada y responsable planificación municipal. "Si usted tiene una representación digitalizada y en tres dimensiones de algo, de algún lugar, entonces usted puede estudiarlo minuciosamente. Los mapas sólo le ofrecen una visión 2D muy limitada", argumentó Agarwal. "Existe una diversidad de usos muy grandes para algo como esto. Y estos son precisamente los aspectos de la ciencia que está avanzando para comprender cómo se puede hacer construcciones 3D a gran escala".