IBM, una de las más importantes e innovadoras empresas del sector informático, acaba de anunciar que ha batido su propio récord mundial al escanear diez mil millones de archivos en sólo 43 minutos. Semejante logro ha sido posible gracias a su sistema de archivos General Parallel File System (GPFS) y a un arreglo de discos flash provistos por Violin Memory. IBM ha conseguido superar la anterior marca en 37 veces, mejorando ostensiblemente las tres horas que había necesitado en aquella oportunidad para escanear mil millones de archivos. GPFS es el sistema de archivos que IBM utiliza en sus superordenadores desde 1998.
Seguramente estás encantado con la velocidad de tu ordenador. Posiblemente sea unas 3 o 4 veces más rápido del que tenias hace solo dos años atrás. Sin embargo, al comparar su potencia con la de un superordenador nos damos cuenta que no son más que un juguete caro. IBM, la empresa que gracias a la invención del IBM PC en 1981 originó la revolución informática que hoy disfrutamos, es una de las que más invierte en investigación y desarrollo, presentando miles de patentes cada año. El sistema de almacenamiento de archivos que emplean sus superordenadores, llamado General Parallel File System (GPFS), les ha permitido la semana pasada superar su propio récord de velocidad al escanear un (enorme) grupo de ficheros.
La multinacional presentó una nota de prensa en la que declara haber superado su propio récord mundial en escaneo de archivos, consiguiendo escanear diez mil millones de ficheros en 43 minutos, un tiempo 37 veces menor que el requerido para establecer su anterior marca, en la que habían necesitado unas tres horas para escanear mil millones de ficheros. Los archivos estaban almacenados en un arreglo de discos flash provistos por Violin Memory, cuya velocidad seguramente es en buena medida responsable de semejante mejora respecto de la marca anterior. IBM utilizará esta tecnología para mejorar sus productos, sobre todo los sistemas de almacenamiento que las grandes compañías utilizan para brindar servicios en la nube.
El director de sistemas de almacenamiento de IBM Research, Bruce Hillsberg, ha comentado que el nuevo récord representa un hito muy importante para la industria, ya que en este momento las grandes bases de datos empleadas por los servicios basados en la nube requieren de un sistema de backup y replicación que dependen en buena medida del escaneo rápido de nuevos archivos. En cuanto al GPFS, se trata del sistema de ficheros distribuido de alto rendimiento que proporciona un acceso concurrente de alta velocidad a las aplicaciones que se ejecutan sobre los múltiples nodos de un cluster, brindando la visión de un disco compartido entre todos ellos. Es utilizado por muchos de los supercomputadores que forman el TOP500, entre los que se encuentran Magerit y Marenostrum, los dos más importantes de España.