Unidades de Medida de Almacenamiento de la Información.
Recientemente se publicó información relacionada con las
cualidades que debe poseer un Científico de Datos, en esta oportunidad vamos a conocer las unidades de medida del
almacenamiento de información, las cuales van desde el simple bit (0,1), hasta
el gigante e incomprensible Geopbyte que
se representa con una cifra de 31 números decimales.
Como debe ser del conocimiento de la mayoría de las
personas, las computadoras y todos los sistemas digitales operan en base al
sistema de numeración binario, esto por la facilidad de representar las situaciones
o estados dicotómicos mediante ceros y unos, como por ejemplo: encendido y
apagado, verdadero y falso, correcto e incorrecto entre otros. Los sistemas
digitales convierten los pulsos eléctricos, señales ópticas y ondas electromagnéticas
en ceros y unos dependiendo de la intensidad, la presencia o ausencia de señal. La siguiente imagen muestra en forma gráfica las unidades de medidas y la estimación actual con la que se le compara.
bit (0,1)
Como ya se dijo anteriormente representa un estado dicotómico
mediante un cero o un uno (0,1), en su representación más básica sirve para que
los sistemas tomen decisiones como por ejemplo los bit utilizados en las
comunicaciones seriales vía módem, para indicar paridad (par, impar) o el bit
de parada.
byte (00000000-11111111)
Un byte está conformado por 8 bits, en el Código Americano Estándar
para el Intercambio de Información o ASCII por sus siglas en ingles un byte representa
cada uno del conjunto de caracteres imprimibles y no imprimibles de este
sistema los cuales son 128 en el sistema básico y 256 en el sistema extendido. Para
escribir la palabra byte se requieren 4 bytes = 32 bits (b=01100010, y= 01111001,
t=01110100, e=01100101). El byte al igual que el bit, si no se le observa en un
contexto de sistema no aporta ninguna información relevante.
Kilobyte (1024 bytes)
Lo constituyen 1024 bytes y con esta cantidad si se puede
representar uno o dos párrafos de información relevante tal como la que se
muestra a continuación:
“Esta información representa un kilobyte (1 Kbyte) de
almacenamiento porque contiene 1024 caracteres alfanuméricos incluidos los
espacios en blanco, estas representaciones son utilizadas en la Codificación ASCII extendida
para las letras, números y símbolos especiales que en total suman 256, cada carácter
es representado por un byte, el cual a su vez se origina de elevar a la
potencia ocho la base del sistema de numeración binario es decir 2^8 = 256
combinaciones, a cada carácter se le da un número en el sistema decimal, en el caso
del circunflejo o sombrerito (^) es el 94, otro muy utilizado es el 64, el cual
representa el arroba (@), esta información es útil cuando nuestro teclado no se
corresponde con la configuración de la región de nuestro idioma, ya que si se
presiona la tecla Alt y el número correspondiente
al carácter, lograremos imprimirlo en el texto en pantalla; todo el contenido
de este texto representa un Kilobyte de información que es igual a 1024 caracteres
incluidos los espacios en blanco”.
Megabyte (1024 kilobytes)
Si se copia y pega el párrafo anterior 1024 veces estaríamos
ante un documento de un megabyte, equivalente aproximadamente a 256 páginas,
sin incluir imágenes sólo texto. Esta capacidad de almacenamiento podría constituir
un pequeño libro en el que se podrían encontrar datos, información y
conocimiento. Cuando comenzó la masificación de la computación en el hogar Las
unidades de disco flexible (Floppy Disk) podían almacenar hasta 1.44 Megabyte
de información.
Gigabyte (1024 megabytes)
Continuando con el ejemplo anterior, con un gigabyte se
puede almacenar el equivalente a 1024 libros de aproximadamente 256 páginas,
sin incluirle imágenes sólo texto. Si llevamos al contexto del almacenamiento
los mensajes de texto enviados en Venezuela en un día los cuales alcanzan la
cifra de 319.000.000, si lo promediamos a razón de 70 caracteres por mensajes, entonces
diariamente la empresas de telefonía requieren de aproximadamente 20 Gbyte de almacenamiento
solamente para los mensajes de texto o SMS. Ahora supongamos que la información
de los SMS aporta conocimiento por lo que se puede agrupar para crear libros
entonces diariamente en Venezuela se crearían aproximadamente 20.480 libros sólo
a través de los servicios de SMS.
Terabyte (1024 gigabytes)
A partir de esta unidad de medida vamos a cambiar de ejemplo,
ahora utilizaremos el del servicio de mensajería SMS de Venezuela, si cada día
se generan aproximadamente 20 Gbyte de información, al mes se producen 600
Gbytes por lo tanto al año se producen 7200 Gbytes que equivale a 7 Terabyte, para
producir información del orden de los terabytes se requieren millones de
usuarios, enviando millones de mensajes diarios.
Petabyte (1024 terabytes)
Para el año 2008 la producción de datos a nivel global, se
cuantificaba en el orden de los Petabytes, se estimaba que solamente google
procesaba 20petabytes diarios de información, sin embargo las organizaciones
individuales a nivel global procesaron en promedio 63 terabytes de información
al año. Análogamente, los sistemas de monitoreo meteorológicos, de simulación físico-químicos y otros también producen
abundante información en periodos de tiempo relativamente cortos.
Exabyte (1024 petabytes)
Si procesar información por el orden de los petabytes
resulta asombroso, entonces que se espera para los que está en la unidad de los
exabyte, estas cantidades se lograron alcanzar en los años 2090 y 2010 a nivel
global. Toda la información generada en los sistemas en línea como google, YouTube,
Facebook y los distintos sectores económicos mundiales lograron producir y/o
procesar semejante cantidad de información.
Zetabytes (1024 Exabytes)
La producción y consumo de información a nivel global se
encuentra actualmente en la unidad de los Zetabytes, esta tendencia se estima
que se va a mantener en lo que resta de esta década, con todas las implicaciones
que ello conlleva, por todos los desarrollos realizados en las capacidades de
almacenamiento y comunicación la producción y transmisión de información seguirá
creciendo a un ritmo vertiginoso.
Ya estamos llegando al nivel en que la comunicación de información
supera de forma avasallante el manejo y almacenamiento de la misma, creando
nuevos problemas como consecuencia de la inmensa cantidad de información
disponible, sobre todo aquella que no se encuentra estructurada o no es fácil de
clasificar.