El estándar Unicode trajo orden al caos. Su definición alcanza a más de 140 mil caracteres, originalmente distribuidos en muchos sets incompatibles que ahora se encuentran a un clic de distancia, o en el peor de los casos, a un código. Eso significa que Unicode es una fuente casi inagotable de símbolos extraños y representaciones misteriosas. El ejemplo más reciente que mantiene en vilo a la Web es ⍼, código U+237C, «Ángulo recto con flecha zigzag hacia abajo», o simplemente «angzarr». El estudiante Jonathan Chan de la Universidad de British Columbia decidió arrojarse al pozo de sus orígenes, y para ser honesto, no creo que haya logrado salir…
Unicode y STIX
La aventura no comienza del todo bien: La sección 22.7 de Símbolos Técnicos en el estándar Unicode bajo la categoría Técnico Misceláneo ni siquiera hace una mención básica del símbolo. La investigación de Jonathan lo llevó a la Propuesta para Codificar Símbolos Matemáticos Adicionales del 14 de marzo de 2000, donde podemos observar a «angzarr» en completa soledad, y con cierto aire de misterio…
Sin embargo, ese no fue su punto de partida. Las raíces de la propuesta se extienden hasta los inicios del Proyecto STIX, que tenía como objetivo la introducción de símbolos adicionales en Unicode para publicaciones técnicas y enfocadas en matemática. Aquí Jonathan descubrió el trabajo de Barbara Beeton, quien recolectó y combinó algunas de las primeras tablas de caracteres en junio de 1997. Al estudiar esas tablas, nuestro amigo «angzarr» aparece de nuevo como D97C, con una asociación al reporte técnico ISO TR9573. Una tabla posterior confirma a «angzarr» como parte de ese reporte, e incluso le asigna un código Unicode temporal, E248.
Arqueología ISO
La versión original de TR9573 (lamentablemente detrás de un paywall, como muchos documentos ISO) se remonta a julio de 1991. Allí, «angzarr» está definido como D97C/55676. Sus ediciones posteriores ya identifican al símbolo como U+237C, pero Jonathan sugiere que eso sucedió después de su ingreso formal en Unicode.
¡Y aún hay más! La sección 13 de TR9573 (donde está «angzarr») sirve como reemplazo del Anexo D de ISO 8879:1986. Sin embargo, al analizar ese documento, Jonathan descubrió que «angzarr» brilla por su ausencia.
De regreso a TR9573, su Sección 5 reporta que los símbolos contienen «un identificador de glifos, registrado de acuerdo con ISO/IEC 10036». Por suerte, el registro 10036 está en línea, y si buscamos 55676 allí…
Un símbolo por 5 dólares
Lo más interesante es que 10036 describe a los glifos como «heredados» de la AFII. ¿Qué era la AFII? La Association for Font Information Interchange, autoridad de registro para ISO 10036. Bajo la AFII, cualquiera podía registrar un símbolo por una módica suma (entre 5 y 50 dólares de la época), pero la industria no tardó en favorecer a ISO 10646 (el Universal Coded Character Set) y a Unicode. El International Glyph Register de la AFII debería tener mayores precisiones sobre «angzarr». Lamentablemente, ese documento parece estar perdido.
A wild Barbara appeared…
La investigación de Jonathan concluye (por ahora) con una participación de la propia Barbara Beeton en StackExchange, quien confirmó que TR9573 efectivamente precede a la AFII y al Proyecto STIX, pero no agregó nada más sobre el origen o el uso de «angzarr». Entonces… todo lo que tenemos es un símbolo misterioso con una descripción genérica, heredado de una documentación que se remonta a principios de los ’90, y se manifestó en algún punto de la segunda mitad de los ’80. ¿Tienes una mejor idea? ¡Deja un comentario!
Fuentes: Jonathan Chang, Hackaday, Stack Exchange