La mayoría de las personas que poseen una actividad relacionada con los textos o los diagramas conocen la importancia que tiene la cantidad de información que puede albergarse en un dibujo hecho a mano alzada. Equipos como el Tablet PC o como el nuevo iPad de Apple son equipos que pueden almacenar un dibujo que hagamos en su superficie. Pero sólo almacenarán eso: un dibujo. Un grupo de líneas abstractas y sin sentido para el ordenador. Los investigadores del MIT pretenden cambiar esta realidad con un nuevo sistema que pueda interpretar bocetos, que pueda entender lo que quisiste dibujar. Es decir, puedes dibujar un circuito electrónico a mano alzada y el software reconocerá los componentes junto a sus conexiones y hasta será capaz de analizar el funcionamiento de tu desarrollo.
Dentro de cualquier garabato, podemos identificar decenas de indicadores que representan hasta el estado de ánimo que teníamos al momento de tirar un par de líneas en un papel. Incluso otras personas pueden interpretar un gráfico de manera fácil sin necesidad de emitir siquiera un monosílabo para explicarle de qué se trata lo que está viendo. Además, muchas actividades en la vida de un profesional se realizan en diferentes ámbitos laborales y, durante el traslado de un lugar a otro, pueden aparecer ideas en la mente que, si no se anotan o se las guarda en una agenda o se escriben en papel, se volatilizan con las horas. Más tarde, durante la noche, sabemos que algo se nos ocurrió, pero no recordamos a ciencia cierta de qué se trataba o se nos escapan muchos detalles importantes por no haberlos anotado en el momento justo.
Para ayudar a resolver muchos de estos problemas, los investigadores del MIT están desarrollando un sistema que pueda interpretar bocetos. Un químico, por ejemplo, utilizaría un lápiz (un bolígrafo de plástico sin tinta) para trazar una molécula en un equipo Tablet PC. El software sería capaz de identificar diferentes tipos de enlaces químicos, símbolos de los elementos y determinar la estructura de la molécula. Del mismo modo, si un ingeniero eléctrico dibuja un diagrama de un circuito, el software se encargaría de identificar los componentes individuales que forman parte del circuito (resistencias, condensadores, baterías y cables de conexión) y mostrarlos en colores diferentes. Además, el software de análisis podría determinar si el circuito que se muestra en el esquema funcionará correctamente. Otras aplicaciones del desarrollo serían programas que puedan interpretar dibujos mecánicos, árboles de la familia y esquemas de los programas de ordenador (diagramas de flujo). Una vez que el boceto ha sido interpretado por el ordenador, se vuelve útil, aplicable en otros entornos y compatible con otras plataformas. Un boceto de química, por ejemplo, podría ser la base para una búsqueda en la Web sobre la literatura correspondiente, para ver si hay alguna investigación previa sobre la misma molécula.
Escribiendo en la pared
La aplicación del reconocimiento de los bocetos aplicados en el campo de la química surgió de una colaboración con Pfizer, afirma Tom Ouyang, estudiante de doctorado en Informática y Ciencias perteneciente al Laboratorio de Inteligencia Artificial (CSAIL) del MIT, quien desarrolló el nuevo sistema junto con el profesor Randall Davis, también del CSAIL. "Una vez visitamos los laboratorios de Pfizer y nos dimos cuenta de que en todas sus pizarras, e incluso en algunas de sus ventanas, tenían todas estas estructuras químicas dibujadas con marcadores de borrado en seco, y cuando hablamos con ellos, mencionaron que utilizan estos diagramas gráficos todo el tiempo". En la actualidad, explica Ouyang, la única manera de traducir estos diagramas en un formato que una computadora pueda entender es utilizando un software específico y dedicado, en el que se requiere que el investigador seleccione un elemento (un símbolo químico) a partir de una paleta de elementos precargados, haga clic en él, lo arrastre por la pantalla, lo coloque en su lugar y luego repita el proceso para cada elemento sucesivo. "Eso no es tan intuitivo o tan rápido como dibujarlo en un papel", dice Ouyang.
La mayoría de los Tablet PC actuales, e incluso algunos teléfonos inteligentes, vienen con un software que puede reconocer la letra manuscrita. Sin embargo, la interpretación de un diagrama es "completamente diferente al reconocimiento de una escritura", dice Tom Stahovich, profesor asociado de Ingeniería Mecánica en la Universidad de California, quien investiga el reconocimiento de dibujos. "Al hacer el reconocimiento de escritura, hay un orden temporal y espacial natural para él. Por lo general, usted escribe de izquierda a derecha, de arriba hacia abajo. Por lo tanto, a cada dibujo (letra), intuir y averiguar lo que viene después es mucho más fácil". En un diagrama de circuito, por otra parte, una resistencia podría ser en orientación horizontal o vertical, puede aparecer encima, debajo o al lado del elemento del circuito anterior, es decir, se puede saltar desde un punto de la pantalla a otro sin un orden específico y predecible. Stahovich explica, además, que los sistemas de reconocimiento de escritura explotan regularidades (patrones preestablecidos) que son únicos a la lengua. "Ellos tienen un léxico determinado, sólo una lista gigante de palabras y se limitan a encontrar la palabra más parecida a lo que el reconocedor interpreta".
Anatomía de un dibujo
Para satisfacer las demandas particulares del reconocimiento de un dibujo, los investigadores del MIT pretenden combinar la información sobre la apariencia física del boceto final con la información acerca de cómo se ha dibujado. Es decir, el sistema puede recordar la dirección en la que el lápiz se estaba moviendo cuando se hizo un trazo en particular. Esto le ofrece una mejor idea de si una línea estaba destinada a ser horizontal, vertical o diagonal. De este modo, el sistema descompone un símbolo trazado en sus partes constituyentes: sus elementos horizontales, sus elementos verticales y sus elementos diagonales, interpretando todos los extremos (límites) gráficos del símbolo dibujado. Los algoritmos del software resuelven en forma automática los componentes eliminando las marcas perdidas y mejorando los trazos intencionales. Por último, el sistema busca, a través de una base de datos de símbolos, los trazos obtenidos de la muestra en descomposición en busca de coincidencias. Davis y Ouyang aseguran que los ensayos realizados con una decena de personas fueron suficientes para que tanto el esquema molecular como el diagrama de circuito eléctrico dieran resultados muy confiables, incluso para usuarios que por primera vez tomaban contacto con una pizarra electrónica. El hardware ya existe para el desarrollo de estas maravillosas aplicaciones, ahora sólo hace falta el software, y la gente del MIT está trabajando en ello.