Las cámaras de bolsillo podrán tener una difusión cada vez más grande, en especial ahora que son parte integral de cualquier teléfono móvil, y una webcam puede convertirse en una fuente de vídeo más o menos decente, pero cuando tratamos de salir de las dos dimensiones para llegar al 3D, se necesita un poco más poder para lograrlo. Una demostración hecha por Tohto C-Tech nos muestra cómo cámaras estéreo y la fuerza del GPGPU logran captar en tiempo real una representación en tres dimensiones de un rostro humano. Cualquier rostro humano.
Capturar y renderizar nuestro rostro en tiempo real puede parecer un poco lejano para los ordenadores de escritorio promedio. A decir verdad, si todavía no hay soluciones sólidas para cosas como el reconocimiento de voz, que nuestro rostro aparezca representado en tres dimensiones sobre una pantalla con un mínimo de latencia suena a algo proveniente de otro planeta. Irónicamente, ya tenemos el poder de procesamiento para hacer algo así, y se encuentra en las tarjetas de vídeo. Aunque la gran mayoría de los modelos todavía lucha con el temido "Crysis" con detalles y resolución al máximo, el procesamiento con objetivos generales, mejor conocido como GPGPU, puede tener la respuesta. Hemos visto al GPGPU elevar de forma considerable los resultados de Folding@Home, o comerse crudas a las protecciones de redes inalámbricas. Ahora, puede digitalizar un rostro de forma dinámica e inmediata.
El proyecto fue presentado por la gente de Tohto C-Tech en la edición 2010 de la convención "Embedded Technology" llevada a cabo en los primeros días de diciembre. En el vídeo se puede apreciar un equipo montado con cámaras estéreo apuntando desde diferentes ángulos, y la representación en tres dimensiones se logra a partir de un método de comparación basado en correlación de fase. El GPGPU aporta su magia a la hora de la velocidad, ya que la "captura" no sólo es realizada en tiempo real, sino que también se debe lidiar con una enorme cantidad de información proveniente de las cámaras. De acuerdo a sus desarrolladores, el poder de procesamiento de un CPU convencional es insuficiente para obtener esta clase de resultados.
Una de las posibles aplicaciones para esta clase de tecnologías es sin dudas la identificación de personas, pero lo cierto es que podría ir mucho más allá. Con el poder de procesamiento suficiente y tal vez más cámaras, se podría alcanzar una representación en tres dimensiones completa, pero eso depende de que tan "escalable" sea el sistema. Lamentablemente, no se mencionan detalles sobre el hardware GPGPU utilizado, pero no sería nada descabellado imaginar a un par de tarjetas Tesla trabajando en paralelo para capturar nuestros rostros en tiempo real, pero sería mejor aún que el GPGPU tenga más presencia entre las tareas cotidianas. Sin ir más lejos, hoy en NeoTeo realizamos una compresión de archivos de unos 450 MB, y se tomó su buen tiempo mientras la tarjeta gráfica se reía en nuestras caras.