Almacenamiento

Gestión de datos en las empresas

2016-05-18T10:40:43+02:00mayo 18, 2016|Seguridad|

De acuerdo al estudio Data Genomics Index, realizado por Veritas, el 41% de los archivos en las empresas tienen más de tres años de antigüedad. Las imágenes, archivos de desarrolladores y archivos comprimidos representan casi un tercio de la totalidad.

El periodo aproximado para que los datos se vuelvan caducos es de tres años, sin embargo, alrededor del 41% de los datos no ha sido modificado en ese tiempo, asegura la marca. Los datos que no poseen un propietario atribuido, debido a algún cambio de funciones o a la partida de un empleado, se consideran huérfanos y estos datos suelen pasar desapercibidos en las organizaciones.

En un segundo informe, Global Databerg, Veritas revela la forma en que las empresas de todo el mundo almacenan y gestionan sus datos, haciendo énfasis en las actitudes y conductas que fomentan su excesiva generación.

Se identifica tres tipos de datos almacenados en los llamados Databergs:

Datos críticos del negocio, identificados como vitales para la continuidad y el éxito operativo de la organización.

Datos redundantes, obsoletos y triviales (ROT), datos que han perdido su valor empresarial. Es necesario reducir proactivamente los datos ROT mediante su eliminación de forma segura y periódica.

Datos oscuros, son datos cuyo valor aún no ha sido identificado. Pueden incluir datos críticos del negocio, así como datos ROT inútiles. Sin importar de qué se traten, consumen recursos.

Descubrieron que las organizaciones a nivel mundial almacenan en promedio 52% de datos oscuros, 33% de datos ROT y 15% de datos críticos identificables.

Algunas conductas que permiten el crecimiento de datos oscuros y ROT:

  • Estrategias y presupuestos basados únicamente en volúmenes de datos, no en su valor empresarial.
  • La rápida adopción de aplicaciones y soluciones de almacenamiento bajo la falsa premisa del “almacenamiento gratuito”.
  • La creencia de los empleados de que pueden usar los recursos de TI corporativos en forma gratuita, tanto para uso empresarial como personal.

A fin de evitar la espiral de costos en la gestión de datos a futuro, es necesario tomar medidas. Lo que significaría esclarecer los datos oscuros, deshacerse de los datos ROT y alentar a los empleados a mantener y gestionar los datos de forma proactiva.

¿Qué es la deduplicación?

2016-05-18T09:34:44+02:00mayo 18, 2016|Seguridad|

La deduplicación es una técnica especializada de compresión y eliminación de copias o datos duplicados. Es ideal para operaciones de elevada redundancia como el respaldo de información, que utiliza la copia y el almacenamiento repetidos del mismo conjunto de datos varias veces para fines de recuperación, regularmente por períodos de 30 a 90 días.

La deduplicación segmenta un flujo de datos entrante, identifica los segmentos y los compara con los datos almacenados anteriormente. Si el segmento es único, se almacena en el disco, pero si un segmento de datos entrante es un duplicado de uno almacenado, únicamente se crea una referencia a este; evitando que el segmento se almacene nuevamente. Este proceso reduce las necesidades en cuanto a capacidad de almacenamiento entre 10 a 30 veces aproximadamente. Es decir, una empresa podría almacenar de 10 TB a 30 TB de datos de respaldo en 1 TB de capacidad física de disco. La eliminación de los datos redundantes también mejora la eficiencia del ancho de banda.

Las empresas suelen almacenar muchas versiones de la misma información, de modo que los nuevos empleados puedan reutilizar el trabajo ya hecho. Esto vuelve el respaldo de información extremadamente redundante.

La deduplicación reduce los costos de almacenamiento, ya que se necesitan menos unidades de almacenamiento. También mejora la recuperación ante desastres, debido a que existen menos datos que transferir.

Algunas cosas que se deben considerar para la deduplicación:

Estos sistemas buscan patrones y los sistemas de cifrado eliminan los patrones, así que absténgase de encriptar los datos antes de que los vea el sistema de deduplicación.

No comprima los datos antes, debido a que la información se comprime después de deduplicar, de modo que no está adelantando nada al realizar la compresión. También, podrían mezclarse los datos y dificultar la búsqueda de patrones.

En la mayor parte de los sistemas de deduplicación, los datos creados por un ser humano (como documentos de Office o anotaciones en bases de datos) se deduplican bien. En cambio, los datos generados automáticamente por un equipo de cómputo, no. Considere conservarlos en un sistema de almacenamiento sin deduplicación (algunos sistemas pueden desactivar la deduplicación de determinados conjuntos de datos).

Le invitamos a ponerse en contacto con nosotros para proveerle más información respecto a herramientas de deduplicación, así como los casos de éxito con nuestros clientes.

Ir a Arriba