lunes, 3 de noviembre de 2014

Unidades de Medida de Almacenamiento de la Información

Unidades de Medida de Almacenamiento de la Información.


Recientemente se publicó información relacionada con las cualidades que debe poseer un Científico de Datos, en esta oportunidad  vamos a conocer las unidades de medida del almacenamiento de información, las cuales van desde el simple bit (0,1), hasta el gigante e incomprensible Geopbyte  que se representa con una cifra de 31 números decimales.

Como debe ser del conocimiento de la mayoría de las personas, las computadoras y todos los sistemas digitales operan en base al sistema de numeración binario, esto por la facilidad de representar las situaciones o estados dicotómicos mediante ceros y unos, como por ejemplo: encendido y apagado, verdadero y falso, correcto e incorrecto entre otros. Los sistemas digitales convierten los pulsos eléctricos, señales ópticas y ondas electromagnéticas en ceros y unos dependiendo de la intensidad,  la presencia o ausencia de señal.  La siguiente imagen muestra en forma gráfica las unidades de medidas y la estimación actual con la que se le compara.



bit (0,1)

Como ya se dijo anteriormente representa un estado dicotómico mediante un cero o un uno (0,1), en su representación más básica sirve para que los sistemas tomen decisiones como por ejemplo los bit utilizados en las comunicaciones seriales vía módem, para indicar paridad (par, impar) o el bit de parada.

byte (00000000-11111111)

Un byte está conformado por 8 bits, en el Código Americano Estándar para el Intercambio de Información o ASCII por sus siglas en ingles un byte representa cada uno del conjunto de caracteres imprimibles y no imprimibles de este sistema los cuales son 128 en el sistema básico y 256 en el sistema extendido. Para escribir la palabra byte se requieren 4 bytes = 32 bits (b=01100010, y= 01111001, t=01110100, e=01100101). El byte al igual que el bit, si no se le observa en un contexto de sistema no aporta ninguna información relevante.

Kilobyte (1024 bytes)

Lo constituyen 1024 bytes y con esta cantidad si se puede representar uno o dos párrafos de información relevante tal como la que se muestra a continuación:
“Esta información representa un kilobyte (1 Kbyte) de almacenamiento porque contiene 1024 caracteres alfanuméricos incluidos los espacios en blanco, estas representaciones  son utilizadas en la Codificación ASCII extendida para las letras, números y símbolos especiales que en total suman 256, cada carácter es representado por un byte, el cual a su vez se origina de elevar a la potencia ocho la base del sistema de numeración binario es decir 2^8 = 256 combinaciones,  a cada carácter se le da  un número en el sistema decimal, en el caso del circunflejo o sombrerito (^) es el 94, otro muy utilizado es el 64, el cual representa el arroba (@), esta información es útil cuando nuestro teclado no se corresponde con la configuración de la región de nuestro idioma, ya que si se presiona la tecla Alt y el número correspondiente al carácter, lograremos imprimirlo en el texto en pantalla; todo el contenido de este texto representa un Kilobyte de información que es igual a 1024 caracteres incluidos los espacios en blanco”.

Megabyte (1024 kilobytes)

Si se copia y pega el párrafo anterior 1024 veces estaríamos ante un documento de un megabyte, equivalente aproximadamente a 256 páginas, sin incluir imágenes sólo texto. Esta capacidad de almacenamiento podría constituir un pequeño libro en el que se podrían encontrar datos, información y conocimiento. Cuando comenzó la masificación de la computación en el hogar Las unidades de disco flexible (Floppy Disk) podían almacenar hasta 1.44 Megabyte de información.

Gigabyte (1024 megabytes)

Continuando con el ejemplo anterior, con un gigabyte se puede almacenar el equivalente a 1024 libros de aproximadamente 256 páginas, sin incluirle imágenes sólo texto. Si llevamos al contexto del almacenamiento los mensajes de texto enviados en Venezuela en un día los cuales alcanzan la cifra de 319.000.000, si lo promediamos a razón de 70 caracteres por mensajes, entonces diariamente la empresas de telefonía requieren de aproximadamente 20 Gbyte de almacenamiento solamente para los mensajes de texto o SMS. Ahora supongamos que la información de los SMS aporta conocimiento por lo que se puede agrupar para crear libros entonces diariamente en Venezuela se crearían aproximadamente 20.480 libros sólo a través de los servicios de SMS.

Terabyte (1024 gigabytes)

A partir de esta unidad de medida vamos a cambiar de ejemplo, ahora utilizaremos el del servicio de mensajería SMS de Venezuela, si cada día se generan aproximadamente 20 Gbyte de información, al mes se producen 600 Gbytes por lo tanto al año se producen 7200 Gbytes que equivale a 7 Terabyte, para producir información del orden de los terabytes se requieren millones de usuarios, enviando millones de mensajes diarios.

Petabyte (1024 terabytes)

Para el año 2008 la producción de datos a nivel global, se cuantificaba en el orden de los Petabytes, se estimaba que solamente google procesaba 20petabytes diarios de información, sin embargo las organizaciones individuales a nivel global procesaron en promedio 63 terabytes de información al año. Análogamente, los sistemas de monitoreo meteorológicos,  de simulación físico-químicos y otros también producen abundante información en periodos de tiempo relativamente cortos.

Exabyte (1024 petabytes)

Si procesar información por el orden de los petabytes resulta asombroso, entonces que se espera para los que está en la unidad de los exabyte, estas cantidades se lograron alcanzar en los años 2090 y 2010 a nivel global. Toda la información generada en los sistemas en línea como google, YouTube, Facebook y los distintos sectores económicos mundiales lograron producir y/o procesar semejante cantidad de información.

Zetabytes (1024 Exabytes)

La producción y consumo de información a nivel global se encuentra actualmente en la unidad de los Zetabytes, esta tendencia se estima que se va a mantener en lo que resta de esta década, con todas las implicaciones que ello conlleva, por todos los desarrollos realizados en las capacidades de almacenamiento y comunicación la producción y transmisión de información seguirá creciendo a un ritmo vertiginoso.
Ya estamos llegando al nivel en que la comunicación de información supera de forma avasallante el manejo y almacenamiento de la misma, creando nuevos problemas como consecuencia de la inmensa cantidad de información disponible, sobre todo aquella que no se encuentra estructurada o no es fácil de clasificar.