Un investigador de IBM asegura haber encontrado un algoritmo capaz de permitir a los ordenadores efectuar cómputos con datos cifrados sin necesidad de descifrarlos previamente. Esto, lejos de ser una curiosidad matemática, puede convertirse en una formidable herramienta de seguridad, que permitiría a las empresas como Google almacenar y manipular información confidencial de terceros sin siquiera “ver” los datos privados originales.
Uno de los dilemas más interesantes que nos plantea la actual sociedad basada en la información es la privacidad de los datos. En efecto, resulta sumamente útil disponer -por ejemplo- de buscadores como Google, que sean capaces de encontrar la información que buscamos, dentro del caos de datos que es la red. Sin embargo, para poder hacer un trabajo eficiente, el software que corre en los servidores del buscador deben poder acceder a esos datos y “leerlos”, de forma de poder determinar si su contenido es o no relevante para los intereses del usuario que ha encargado la búsqueda.
Esto enfrenta dos intereses que, a primera vista, pueden parecer incompatibles. Por un lado, los usuarios necesitamos de herramientas de búsqueda que conviertan la información disponible en la red en algo útil. Y, por otro, queremos proteger nuestra intimidad a toda costa. Ambos objetivos son muy difíciles de conciliar. Imagina que estás haciendo alguna clase de estudio sociológico, y que necesitas utilizar como base el texto de las conversaciones mantenidas a través de mensajeros instantáneos en los últimos 2 meses. Es muy posible que analizando esos textos puedas encontrar información muy útil para tu proyecto, pero difícilmente los usuarios implicados en dichas conversaciones te permitan acceder al contenido de las mismas. Algo parecido ocurre con los filtros antispam: para hacer un trabajo eficiente, el software encargado de detectar el correo basura necesita “abrir” cada correo de tu bandeja de entrada y “leer” su contenido. Si bien el volumen de correos procesados cada día prácticamente garantiza que tus miserias se mantengan a salvo de miradas humanas, hay ámbitos -como el industrial o el judicial- en los que permitir a terceros un acceso de este tipo es un riesgo de seguridad inaceptable.
Una de las formas más eficaces de proteger el contenido de los datos “sensibles” consiste en someterlos a algún proceso de cifrado. Mediante estas técnicas se consigue que solo los usuarios autorizados -y que cuentan con las contraseñas adecuadas- puedan efectuar el proceso inverso y volver los datos implicados a su estado original. Sin embargo, los datos así tratados son ininteligibles para buscadores o filtros antispam. Y aquí es donde el trabajo de Craig Gentry, de IBM, puede convertirse en algo muy útil.
Gentry ha conseguido desarrollar un sistema de seguridad denominado “fully homomorphic encryption”, que básicamente consiste en un algoritmo matemático capaz de interactuar con datos cifrados de formas que hasta ahora eran imposibles. Con el mecanismo ideado por Craig se pueden hacer cálculos con datos cifrados sin que sea necesario descifrarlos previamente. Esto, expresado con palabras simples, permitiría cosas como poder indexar el contenido de un documento sin que el software encargado de hacerlo conozca su contenido, o aplicar un filtro que elimine el correo basura sin necesidad de “abrir” cada email para revisar su contenido.
En IBM están exultantes, y aseguran que esta tecnología será clave para impulsar el modelo de la “informática en la nube”, en la que un proveedor de servicios guarda los datos confidenciales de terceros en servidores propios. “Creemos que esta tecnología les permitirá a las empresas tomar las decisiones apropiadas, sin comprometer el derecho a su intimidad”, dicen. Si están en lo cierto, los editores de documentos online quizás sean los primeros grandes beneficiados de esta tecnología, ya que derribaría definitivamente el argumento de muchos usuarios que se oponen a mantener sus datos “en la nube” por cuestiones de seguridad.
Vaya!.
Una cosilla que me reconcome es que, si es capaz de operar con esos datos, realmente, en cierto modo, cierta información se descifra (se hace operable e interpretable), aunque no toda. Aunque tampoco entiendo papa del tema de cifrado y tal, asi que nada, bienvenido sea el avance
"indexar el contenido de un documento sin que el software encargado de hacerlo conozca su contenido" como es posible indexar algo sin saber q es?, me suena a engaño…
Que yo sepa, en las matemáticas, debemos saber que valor tiene una cosa para poder operar con ella, aunque no sepamos su valor numérico, su valor relativo, como se hace en álgebra. Y la informática es matemática.
Me suena a timo…
Suena muy raro…. indexación de contenido sin conocer el contenido…. uffff no sé, no sé, me huele un poco a fake. Si los datos están cifrados con algoritmos robustos y todos eso bla, bla, bla, como vamos a clasificar una información desconocida?? a no ser que se utilice algún tipo de encabezado en el paquete cifrado que permita catalogarlo… (un pequeño ejemplo como los TAGS en los MP3…, pero que pasa si el TAG se cambia o se elimina?)… 🙁
Salu2
Si tengo mil numeros y los encripto manteniendo sus tamaños relativos los puedo ordenar de la misma manera que estaban antes de la encriptación. Lo mismo con cualquir signo