Inicio Artículos de fondo Cinco consejos para mejorar la deduplicación de datos

Cinco consejos para mejorar la deduplicación de datos

148
3
Compartir

Cinco consejos para mejorar la deduplicación de datos

La mayoría de proveedores de soluciones de backup en red y gestión de almacenamiento ofrecen un producto de deduplicación de datos o una opción similar. Por este motivo, los entornos IT de mediano tamaño se encuentran ante el reto de encontrar las características ‘dedupe’ más apropiadas para reducir tiempo, espacio y coste.

¿Por qué ‘dedupe’? Los profesionales de Arkeia Software, proveedor líder por rapidez, facilidad de uso y coste de soluciones de backup en red, creen que esta técnica puede lograr una disminución del 95 por ciento del volumen de datos para aquellos usuarios que “salvan” los mismos datos, como backups diarios, o guardan decenas de  máquinas virtuales VMware de múltiples hosts físicos.

Aunque los ratios son muy variables y dependen del tipo de datos y ficheros de la red, una estrategia correcta de ‘dedupe’ provoca reducciones significativas en tiempo, capacidad y coste.

A continuación se ofrecen cinco recomendaciones para elegir la tecnología adecuada y desarrollar una deduplicación rápida, simple y económica.

1. Comenzar con la fuente

La deduplicación “source-side” es la base de un ‘dedupe’ más eficiente, ya que determina si el backup en curso tiene una copia en el bloque específico de datos (del cliente). Los entornos virtuales suelen contar con múltiples copias de los mismos sistemas operativos y aplicaciones, por lo que la técnica “source-side” evita el movimiento de datos duplicados y redundantes al disco, cinta o cloud. Incluso cuando los backups se limitan a una red de área local (LAN), la deduplicación “source-side” acelera los procesos al disminuir los requerimientos de ancho de banda (eliminando los “tradicionales” cuellos de botella).

2. En línea

La deduplicación puede tener lugar en línea, aunque el backup se encuentre en progreso o en post-proceso en una caché o fase inicial antes del envío a su destino de almacenamiento. En aplicaciones de backup, los negocios suelen preferir una deduplicación en línea. Dedupe “source-side” necesita un proceso ‘in-line’ porque la ventana de backup no se puede cerrar hasta que la información se haya deduplicado y exportado.

3. Dar la vuelta

Las tecnologías ‘dedupe’ tienen sus “puntos débiles”: tareas basadas o en archivos o en bloques. La deduplicación basada en archivos no es suficiente en redes empresariales, que disponen de muchas versiones del mismo fichero con mínimas diferencias entre ellas. La técnica de bloque fijo es importante, pero no puede detectar archivos tan similares y la deduplicación de bloque variable conlleva un incremento de coste y proceso (que ralentiza los backups).

La deduplicación “progresiva” solventa estas “limitaciones”. Es rápida como ‘dedupe’ de bloque fijo y ofrece mejoras en compresión como el bloque variable. También se adecua a diversos tamaños de bloque, en función del tipo de datos, como archivos ejecutables, de texto o registros de la base de datos, para aportar el mejor rendimiento posible.

4. Aceleración de replicación

La replicación de backups ‘on-premise’ para nubes públicas y privadas o redes WAN es uno de los casos donde ‘dedupe’ proporciona mayores ventajas en velocidad y eficiencia. Al “deduplicar” los datos antes de la replicación no sólo se reduce el tiempo necesario para mover datos por la red, sino que también se minimiza el coste de ancho de banda y capacidad de almacenamiento en nube. Los primeros usuarios de cintas para protección de datos ‘off-site’ descubrirán que con ‘dedupe’ es factible realizar transferencias WAN.

5. Todo en uno

Actualmente no existen razones para elegir un producto ‘dedupe’ por separado como principal solución de backup en red. Una alternativa “todo en uno” es más económica y facilita las tareas de integración y configuración.

Las aplicaciones de almacenamiento ‘deduped’ pueden reducir los volúmenes de almacenamiento, pero no dotan de las mejoras de velocidad de la deduplicación “source-side”. Las herramientas de optimización de red pueden disminuir el ancho de banda WAN necesario pero sin los beneficios añadidos de menores requerimientos de almacenamiento en destino.

Por lo tanto, si el servidor de backup se despliega como una aplicación física o virtual o como parte de un paquete de software, un sistema unificado de deduplicación y protección de datos contribuirá decisivamente a bajar los costes y acelerar los backups.

“En la batalla por encontrar formas más eficientes de gestionar la creciente cantidad de datos, la deduplicación es crucial. Sin embargo, el mercado de soluciones para medianas empresas está repleto de productos sin las funciones requeridas o demasiado complejos”, afirma Bill Evans, CEO de Arkeia Software. “La deduplicación progresiva y “source-side” sí proporciona avances y mejoras en estos entornos, a la medida de medianas empresas”. 

Utilice nuestro SERVICIO AL LECTOR GRATUITO para contactar con el proveedor

3 Comentarios

Comments are closed.