La copia de seguridad en la cadena de tiendas de alimentos con sede en Francia Franprix se había convertido en un desastre confuso. Fue entonces cuando hizo el cambio a Veeam Backup & Replication y suavizó las cosas.
“Teníamos sistemas de respaldo duplicados que ya no se ajustaban a nuestra TI”, dijo Jérôme Chapelle, gerente de infraestructura de Franprix. “Nuestras copias de seguridad diarias comenzaron todas las noches a las 10 p. m. y continuaron hasta las 2 p. m. del día siguiente. Si deseaba restaurar un archivo eliminado por error durante ese tiempo, tenía que esperar a que finalizara la copia de seguridad. Realmente puso un bloqueo en las cosas.
“Además de eso, el proceso generó numerosos errores que dedicamos una cantidad increíble de tiempo a corregir. Eso significaba que nuestro equipo de cinco nunca podría comenzar con otros proyectos”.
La infraestructura de TI de Franprix comprende una docena de servidores físicos que ejecutan alrededor de 600 máquinas virtuales (VM).
Se llevó a cabo la modernización a VMware y, posteriormente, se implementó la configuración de doble copia de seguridad. Basado en cinta y diseñado para servidores físicos, presentaba numerosas limitaciones, incluida la necesidad de deduplicar datos aguas arriba o crear máquinas virtuales para restaurar.
“La copia de seguridad es siempre el pariente pobre en TI”, dijo Chapelle. “No recibe la inversión, pero cuando no funciona, es un desastre”.
Retos de precio, escalabilidad y rendimiento
Para 2018, la situación se había vuelto insostenible y se tomó la decisión de buscar una alternativa. Sin mucho tiempo para probar las soluciones disponibles, Franprix eligió al líder del mercado Veeam y la estrella en ascenso Cohesity.
“Cohesity parecía muy innovador, pero también era bastante caro”, dijo Chapelle. “Y con nuestra TI alojada en los centros de datos de [parent group] Casino, Veeam presentó una mejor oportunidad financiera porque el equipo de TI de Casino también necesitaba invertir en un nuevo sistema de respaldo. En consecuencia, Veeam nos permitió realizar una compra grupal”.
Además del costo, Franprix estaba más interesado en Veeam desde el principio porque traía la promesa de escalabilidad y la capacidad de continuar funcionando, sin importar el hardware que se encuentre aguas arriba. Dio la casualidad de que funcionó desde el principio para realizar copias de seguridad de los recursos virtuales de VMware vCenter.
El grupo había previsto que, a partir de 2018, se actualizaría a arreglos de discos capaces de tomar instantáneas, y eso fue lo que sucedió cuando Franprix invirtió en hardware Pure Storage para sus máquinas virtuales.
Pero fue al realizar las pruebas de validación que otra métrica conquistó al equipo de Chapelle. “Nos llamó la atención la actuación”, dijo. “La duración de los trabajos de copia de seguridad se redujo dos o tres veces.
“Lo mismo ocurría con las restauraciones, incluidas aquellas que implicaban volver a implementar una copia funcional completa de una aplicación en hardware de emergencia en caso de un incidente.
“Anteriormente, este tipo de procedimiento, que realizábamos regularmente como parte de las pruebas de recuperación, tomaba tres días. Con Veeam, existe una función de recuperación instantánea que permite la reimplementación de un sistema en unos minutos”.
Errores de autorreparación
Veeam Backup & Restore finalmente se implementó a principios de 2019. El software se ejecuta como una VM entre las demás y se ocupa de 600 VM de producción con un total de 80 TB.
Los respaldos se ejecutan todos los días; Chapelle estima 16 TB de cambios por día y se envían a un arreglo Data Domain donde se almacenan después de la deduplicación. Hasta la fecha, hay 23 TB de datos de respaldo consolidados en Data Domain.
“Todos los trabajos de copia de seguridad se ejecutan por la noche y se completan cuando llegamos por la mañana”, dijo Chapelle.
“Dicho esto, aún ocurrieron errores durante las copias de seguridad. A veces se debió a una máquina virtual de Windows que se bloqueó durante el proceso. A veces, Data Domain bloqueaba momentáneamente una de las cuentas de usuario para las que Veeam intentaba escribir copias de seguridad. Realmente no sabemos por qué sucedieron estas cosas, pero Veeam siempre las detectaba y automáticamente reiniciaba los trabajos hasta que tenían éxito. No tenemos que arreglar las cosas nosotros mismos ahora”.
Y agregó: “El tiempo que hemos ganado nos ha permitido, por ejemplo, comenzar a trabajar en la creación de procesos automatizados que mejoren la eficiencia al momento de responder a los socios”.
Más allá de la copia de seguridad de máquinas virtuales
Franprix también ha invertido en la consola Veeam ONE para monitorear las copias de seguridad, aunque Chapelle la usa para más que eso en la práctica.
“De hecho, Veeam ONE va más allá de las copias de seguridad”, dijo. “Aporta visibilidad a todos los recursos de la infraestructura de virtualización.
“Nos advierte si las cosas no están del todo bien, como si se asignan 20 GB de RAM a una VM cuando 4 GB serían suficientes. Es una herramienta muy poderosa. Lo usamos mucho para planificar la capacidad, para saber cuál es la mejor manera de lanzar nuevos proyectos con los recursos que tenemos”.
Finalmente, desde 2021, Franprix ha comenzado a buscar copias de seguridad de datos en servicios en la nube, en particular Microsoft 365 (Teams, OneDrive, SharePoint, etc.).
“Hemos encontrado un proveedor que aloja copias de seguridad de estos servicios en su propio centro de datos”, dijo Chapelle. “El punto interesante es que nos permite restaurar datos de estas copias de seguridad desde la consola de Veeam Backup & Replication. Era exactamente lo que esperábamos cuando buscábamos una solución de respaldo que siguiera siendo compatible con la evolución de nuestros sistemas de TI”.