Qumulo LogoQumulo Logo

Caso de Éxito - Azure Native Qumulo para servicios de perfil de Azure Virtual Desktop

Este caso práctico anónimo detalla un despliegue real de Azure Native Qumulo que ayudó a una empresa líder de servicios financieros a gestionar el almacenamiento de datos para su solución VDI que da servicio a 8000 usuarios remotos en todo el país.

Descargar white paper

Una empresa líder en servicios financieros quería jubilar su plataforma de escritorio remoto que había llegado al final de su vida útil. Al mismo tiempo, estaban contratando nuevos empleados para satisfacer un aumento de la demanda provocado por una pandemia. Con 8.000 usuarios remotos proporcionando servicios críticos de negocio a sus clientes y distribuidos a través de las costas este y oeste, y con la expectativa de que seguirían ampliando ese número, el cliente optó por mover sus servicios de escritorio remoto a Azure Virtual Desktop (AVD), utilizando Nerdio Manager for Enterprise para gestionar los recursos y servicios de AVD, y utilizando FSLogix para gestionar los perfiles de usuario remoto para todos los usuarios en ambos despliegues.

Requisitos de la solución

Habiendo gestionado ya una solución para usuarios remotos a menor escala, y habiendo aprendido qué arquitecturas y prácticas de gestión funcionaban o no, el cliente definió los siguientes requisitos para su entorno de escritorio virtual actualizado:

Simplicidad escalable

La solución anterior del cliente no era capaz de soportar hasta 4.000 usuarios por región dentro de un único volumen o espacio de nombres. A medida que aumentaba el número de usuarios remotos, el cliente necesitaba aprovisionar nuevos recursos compartidos en su servicio de datos de archivos existente para dar cabida a la mayor demanda de capacidad e IOPS.

Lo que el cliente descubrió al expandirse fue que cada nuevo recurso compartido aumentaba su carga operativa: en primer lugar, al requerir tiempo administrativo para supervisar el estado operativo, los niveles de utilización y el rendimiento del recurso compartido; y en segundo lugar, al requerir que se aprovisionara un recurso compartido dedicado en la otra región de Azure para que sirviera como volumen de conmutación por error en caso de que se produjera una interrupción regional. El servicio de archivos anterior no ofrecía herramientas de replicación nativas, por lo que la duplicación de cada recurso compartido en la otra región implicaba un complicado sistema de herramientas de terceros, comprobaciones manuales periódicas y resolución de problemas cuando la replicación fallaba por cualquiera de las razones.

Con 4.000 usuarios en cada región, y con la posibilidad de añadir nuevos empleados remotos en respuesta a las demandas empresariales en continuo cambio, el cliente necesitaba una solución que no sólo ofreciera escalar mucho más allá del número inicial de 4.000 usuarios remotos por región, sino que también soportara la replicación de datos de usuario a cualquier escala a la otra región Azure. Idealmente, el cliente quería una solución que escalara sin problemas a cualquier tamaño dentro de un único espacio de nombres para minimizar la complejidad operativa de la solución global.

Optimizado para un rendimiento máximo con un coste mínimo

En cada región, hasta 4.000 usuarios remotos se conectan a la solución al mismo tiempo, lo que supone una gran carga para la solución cada mañana y cada noche cuando se desconectan. Un sistema de almacenamiento infradimensionado podría tener dificultades para soportar tantas solicitudes simultáneas, lo que provocaría tiempos de conexión/desconexión excesivos para cada usuario, o bien la imposibilidad total de conectar a algunos usuarios, obligándoles a intentar volver a conectarse. En cualquiera de los dos casos, el resultado neto es una pérdida de productividad de los usuarios, un servicio degradado para los clientes de la organización y una carga excesiva para el personal de TI interno a la hora de gestionar las ralentizaciones cuando se producen.

Al mismo tiempo, un servicio dimensionado para satisfacer las demandas de caudal de una ventana de inicio de sesión de 30 minutos por la mañana y una ventana de desconexión de 30 minutos por la tarde puede significar que el cliente pague por un ancho de banda que no es necesario las otras 23 horas de cada día.

Uno de los requisitos clave del sistema de almacenamiento de perfiles era la capacidad de soportar los picos de demanda de caudal generados por miles de usuarios que se conectan al sistema al mismo tiempo, pero sin incurrir en gastos por el caudal que no se utiliza.

Alta disponibilidad

La solución debía seguir estando disponible no sólo en caso de una interrupción del servicio local, como un problema de hardware o de red en una región determinada, sino también para poder recuperar rápidamente todos los servicios y datos relacionados en caso de un fallo a nivel de región dentro de Azure.

Como parte de su nueva solución AVD, el cliente quería minimizar el riesgo de interrupción del servicio, garantizando que en caso de fallo en una región, todos los usuarios afectados pudieran reconectarse rápidamente a los servicios y datos AVD en la otra región para volver a la productividad.

Requisitos de almacenamiento

El anterior servicio de almacenamiento de perfiles AVD del cliente había sometido a su equipo de TI a cuellos de botella de rendimiento que no podían resolverse fácilmente, y la falta de facilidad de ampliación del servicio había provocado una carga administrativa inaceptablemente alta sólo para mantener los niveles de servicio normales. Además, los elevados costes de transacción del servicio hacían difícil justificar su ampliación, incluso cuando la demanda de usuarios iba en aumento.

Para proporcionar servicios de almacenamiento a sus perfiles de usuario remotos, el cliente tuvo en cuenta varios factores a la hora de evaluar las opciones disponibles. Además de los requisitos ya mencionados de escalabilidad sin fisuras, rendimiento elástico (tanto IOPS como ancho de banda en todo el servicio) y compatibilidad con replicación nativa en una segunda región de Azure, el proceso de selección de almacenamiento del cliente también tuvo en cuenta lo siguiente:

  • El coste por usuario por GB al mes para el almacenamiento de referencia del perfil del usuario

  • El coste por usuario y mes para garantizar que el perfil de cada usuario se replicaba en la región secundaria. El cliente debía tener en cuenta tanto el coste de la capacidad del servicio remoto como el coste de replicar datos entre regiones Azure.

  • El coste de garantizar que se disponga del caudal necesario para atender a cada usuario durante los periodos punta.

Solución

El cliente ya había decidido complementar su servicio AVD con Nerdio Manager for Enterprise para la gestión de imágenes, infraestructuras y recursos. Para garantizar una experiencia de usuario coherente en un entorno de escritorio efímero, eligieron FSLogix, un servicio de Microsoft que utiliza una plataforma de almacenamiento de archivos back-end para ofrecer portabilidad al usuario en escritorios físicos y virtuales.

Al dimensionar los requisitos de su solución, el cliente calculó que el sistema de almacenamiento compatible con FSLogix debía escalar a más de 400 TB de capacidad total (el perfil único de cada usuario requería una media de 50 GB de espacio en disco), ser capaz de soportar 40.000 IOPS de uso sostenido por región, así como acomodar un rendimiento en ráfagas de hasta 60.000 IOPS por región durante las ventanas de inicio y cierre de sesión cada día.

Tras evaluar los servicios de datos Azure disponibles para perfiles de almacenamiento, el cliente eligió Azure Native Qumulo (ANQ), un servicio de almacenamiento de archivos nativo de la nube, reconociendo que, de los servicios de almacenamiento revisados, solo ANQ era capaz de cumplir todos los objetivos del cliente en cuanto a escalabilidad, rendimiento y simplicidad.

Las ventajas de Azure Native Qumulo

Después de haber experimentado una serie de interrupciones y ralentizaciones del servicio debido a su solución de almacenamiento de perfil anterior, y buscando evitar la complejidad de gestión y los altos costes de transacción que venían con ella, el cliente decidió que Azure Native Qumulo proporcionaría un servicio de almacenamiento mucho más simple, a un coste menor, que cualquiera de las otras alternativas de almacenamiento basadas en Azure.

De las opciones de almacenamiento consideradas, Azure Native Qumulo ofrecía una serie de ventajas, que la convirtieron en la elección clara para prestar servicios de datos de perfiles, entre ellas:

  • Solo Azure Native Qumulo ofrecía una elasticidad nativa de la nube que permitía al servicio proporcionar el rendimiento requerido -incluidas tanto las IOPS como el ancho de banda general del servicio- de forma totalmente independiente de la capacidad. Todos los demás servicios vinculaban las IOPS disponibles de sus servicios directamente a la capacidad aprovisionada, obligando al cliente en algunas situaciones a aprovisionar y pagar más capacidad de la que realmente necesitaba para alcanzar los niveles objetivo de ráfagas de IOPS por usuario.

  • Sólo Azure Native Qumulo era capaz de soportar un único espacio de nombres para todos los usuarios de cada región, independientemente de la capacidad requerida. Mientras que los 4.000 usuarios de AVD del cliente en cada región podrían haber compartido nominalmente un único volumen en cualquiera de los otros servicios de almacenamiento, el cliente tendría que crear y gestionar múltiples volúmenes/comparticiones por región para soportar los niveles de IOPS requeridos.

  • Azure Native Qumulo fue el único servicio que incluyó la replicación entre regiones como una función básica de la cuota de suscripción mensual. De los otros servicios de almacenamiento disponibles, uno no ofrecía la replicación como una característica básica en absoluto, y el otro requería un coste de licencia adicional, así como un cargo de replicación por GB para todos los datos que se replicaban en cualquier dirección.

  • Sólo Azure Native Qumulo ofrecía una economía de escala que reducía el coste por usuario del servicio a medida que se añadían más usuarios. La tarifa por usuario al mes de los demás servicios se mantenía bastante constante independientemente del número de usuarios que soportara la solución.

Además de la sencillez de gestión y concesión de licencias de ANQ, su arquitectura nativa en la nube significaba que el cliente también podía aprovechar su escalabilidad de capacidad y rendimiento para dar cabida a nuevos usuarios a prácticamente cualquier escala y ofrecer las IOPS necesarias para mantener la actividad de los usuarios, minimizando las ralentizaciones del servicio incluso durante las horas punta, todo ello a una fracción del coste de cualquiera de los otros servicios de almacenamiento de archivos en la nube.

Arquitectura

La solución Azure Virtual Desktop del cliente se desplegó finalmente con los siguientes componentes:

Azure Native Qumulo Scalable File Service (ANQ) para alojar los perfiles individuales basados en VHD de cada usuario de escritorio. Se ha desplegado una instancia de ANQ independiente en cada región.

Red virtual Azure

VNet Injection para conectar la instancia ANQ de cada región a los recursos de suscripción Azure propios del cliente

Azure Virtual Desktop, desplegado en dos regiones Azure, con un grupo separado de usuarios asignados a los recursos AVD de cada región como su sitio primario, y cada región configurada como el sitio secundario para la otra región en caso de una interrupción del servicio regional.

Nerdio Manager para simplificar y agilizar el proceso de gestión de servicios relacionados con AVD: grupos de recursos, conectividad, seguridad, imágenes de escritorio, aplicaciones y monitorización de servicios.

FSLogix Profile Containers para conectar a cada usuario AVD con su perfil asignado en el almacenamiento ANQ como parte del proceso de inicio de sesión

Replicación continua de Qumulo, configurada para replicar datos de perfiles de usuario desde el clúster ANQ local de cada región a la instancia ANQ de la otra región, garantizando que los servicios de perfiles de usuario sigan estando disponibles en caso de que se produzca una conmutación por error regional.

Topología

La solución AVD del cliente se desplegó en las regiones Azure East US 2 y Azure West US 2, con usuarios repartidos equitativamente entre ambas. Cada usuario remoto se conecta a la región más cercana a su ubicación física.

Para permitir que todo el servicio AVD permanezca en línea en caso de fallo en una de las regiones Azure de alojamiento, cada región se configura como un dominio de conmutación por error de la otra región Azure. En el caso de una interrupción en toda la región, el conjunto completo de servicios AVD estará en línea en la región restante.

Los perfiles de usuario se replican bidireccionalmente desde la instancia local del servicio Azure Native Qumulo en cada región al destino ANQ remoto. Esto garantiza que los datos de los perfiles de usuario también estarán disponibles en cualquiera de las regiones en caso de que se produzca una interrupción regional.

La arquitectura completa de la solución, incluidos los servicios AVD compatibles, Nerdio Manager for Enterprise, FSLogix y los servicios de datos Azure Native Qumulo, se muestra en el siguiente diagrama.

Ventajas de la solución

Como resultado de la elección de una solución de trabajador remoto multirregión basada en Azure Virtual Desktop, con servicios de perfil de usuario alojados en Azure Native Qumulo, el cliente pudo obtener los siguientes beneficios:

Mayor productividad de los usuarios

En comparación con el anterior despliegue de escritorios virtuales del cliente, la nueva configuración del servicio permitió tiempos de inicio de sesión más rápidos para cada usuario cada mañana. El resultado fue una base de usuarios más productiva, menos llamadas al personal de soporte informático interno y menos tiempo dedicado a solucionar problemas de disponibilidad y rendimiento del servicio.

Elasticidad de los servicios

Una solución de tamaño insuficiente puede afectar a la productividad de los usuarios durante los periodos de máxima actividad -por ejemplo, durante las horas de inicio y cierre de sesión, o en periodos de uso intensivo-, lo que se traduce en tiempos de espera más largos, personal informático sobrecargado, clientes frustrados y posibles pérdidas de ingresos. Una solución sobredimensionada puede incurrir en importantes costes operativos si sólo se utiliza plenamente durante unas pocas horas o menos al día.

Tal y como se implementó, utilizando Azure Native Qumulo para proporcionar almacenamiento de perfiles de usuario, el servicio fue capaz de añadir capacidad de IOPS y rendimiento al servicio durante los periodos de carga máxima y, a continuación, volver automáticamente a los servicios normales en el resto de los momentos. Esto significaba que el cliente no estaba pagando más de lo necesario por una solución sobredimensionada, ni estaba causando ralentizaciones innecesarias del servicio con una solución infradimensionada.

Resiliencia

Los perfiles de usuario replicados son de sólo lectura en circunstancias normales. El RTO de la solución debe incluir el tiempo necesario para conmutar por error a la instancia ANQ secundaria (por ejemplo, romper la relación de replicación y hacer que todos los perfiles sean de escritura) antes de conectar a los usuarios de la región remota a las instancias AVD.

Coste

De hecho, la escalabilidad y elasticidad de Azure Native Qumulo resultaron directamente en el beneficio más significativo para el cliente: una economía de escala que redujo el coste total de los servicios a un punto de precio mucho más bajo por usuario y mes que el que habrían experimentado con cualquiera de los otros servicios de almacenamiento de perfiles que el cliente consideró. Según los propios cálculos del cliente, su elección de utilizar Azure Native Qumulo para los servicios de datos de perfiles de AVD supuso un ahorro de costes de 325.000 dólares al año en comparación con el entorno de almacenamiento de su solución anterior

Conclusión

Basándose en su anterior solución de usuario de escritorio remoto, el cliente tenía mucha experiencia con lo que no funcionaba: su solución anterior era demasiado compleja, demasiado lenta y demasiado poco fiable. Al evaluar otras soluciones de archivos en la nube basadas en Azure para almacenar perfiles de usuario, determinaron que las alternativas a Azure Native Qumulo eran todo lo anterior, además de demasiado caras.

El cliente se dio cuenta de que, de todas las opciones para el almacenamiento del perfil de Azure Virtual Desktop, solo Azure Native Qumulo cumplía los requisitos del cliente en cuanto a escalabilidad de un único espacio de nombres, rendimiento (proporcionando IOPS sostenidas y en ráfaga según fuera necesario) y simplicidad, incluso en un despliegue multirregional utilizando las funciones de replicación nativas de Qumulo, todo ello a un coste inferior.

Recursos relacionados

Servicio de archivos escalable Qumulo nativo de Azure

Replicación continua de Qumulo

Servicio de archivos escalable Qumulo nativo de Azure (Azure Marketplace)

Servicio de archivos escalable Qumulo nativo de Azure (Azure Blog)

Azure Native Qumulo Scalable File Service Guide (Documentación del producto Azure)

Uso de Failover con Replicación en Qumulo

Replicación Qumulo: Make Target Writable