
Étude de cas - Azure Native Qumulo pour les services de profil de bureau virtuel Azure
Cette étude de cas anonyme détaille un déploiement réel d'Azure Native Qumulo qui a aidé une grande société de services financiers à gérer le stockage des données pour sa solution VDI desservant 8 000 utilisateurs distants à travers le pays.
Une importante société de services financiers cherchait à mettre au rebut sa plate-forme de bureau à distance en fin de vie. Dans le même temps, elle recrutait de nouveaux employés pour répondre à une augmentation de la demande due à une pandémie. Avec 8 000 utilisateurs distants fournissant des services commerciaux essentiels à ses clients et répartis sur les côtes Est et Ouest, et avec la perspective de continuer à augmenter ce nombre, le client a choisi de déplacer ses services de bureau à distance vers Azure Virtual Desktop (AVD), en utilisant Nerdio Manager for Enterprise pour gérer les ressources et les services AVD, et en utilisant FSLogix pour gérer les profils d'utilisateurs distants pour tous les utilisateurs dans les deux déploiements.
Exigences de la solution
Ayant déjà géré une solution pour utilisateurs distants à plus petite échelle, et ayant appris quelles architectures et pratiques de gestion fonctionnaient ou non, le client a défini les exigences suivantes pour son environnement de bureau virtuel mis à jour :
Simplicité évolutive
L'ancienne solution du client n'était pas en mesure d'évoluer pour prendre en charge jusqu'à 4 000 utilisateurs par région au sein d'un seul volume ou espace de noms. Au fur et à mesure que le nombre d'utilisateurs distants augmentait, le client devait provisionner de nouveaux partages sur son service de données de fichiers existant pour répondre à la demande accrue en termes de capacité et d'IOPS.
Au fur et à mesure de son expansion, le client a constaté que chaque nouveau partage alourdissait sa charge opérationnelle : d'une part, en exigeant du temps administratif pour surveiller l'état opérationnel du partage, les niveaux d'utilisation et les performances ; d'autre part, en exigeant qu'un partage dédié soit provisionné dans l'autre région Azure pour servir de volume de basculement en cas d'interruption de service régionale. Le service de fichiers précédent n'offrait pas d'outils de réplication natifs, de sorte que la mise en miroir de chaque partage dans l'autre région impliquait un système compliqué d'outils tiers, de vérifications manuelles régulières et de dépannage lorsque la réplication échouait pour l'une ou l'autre des raisons suivantes.
Avec 4 000 utilisateurs dans chaque région et la possibilité d'ajouter de nouveaux employés à distance en réponse à des demandes commerciales en constante évolution, le client avait besoin d'une solution qui non seulement offrait la possibilité d'évoluer bien au-delà du nombre initial de 4 000 utilisateurs à distance par région, mais qui prenait également en charge la réplication des données des utilisateurs à n'importe quelle échelle vers l'autre région Azure. Idéalement, le client souhaitait une solution qui s'adapte de manière transparente à n'importe quelle taille au sein d'un espace de noms unique afin de minimiser la complexité opérationnelle de la solution globale.
Optimisé pour des performances maximales à un coût minimal
Dans chaque région, jusqu'à 4 000 utilisateurs distants se connectent à la solution en même temps, ce qui crée une lourde charge sur la solution chaque matin et chaque soir lorsqu'ils se déconnectent. Un système de stockage sous-dimensionné pourrait avoir du mal à prendre en charge autant de demandes simultanées, ce qui entraînerait des temps de connexion/déconnexion excessifs pour chaque utilisateur, ou encore l'impossibilité de connecter certains utilisateurs, ce qui les obligerait à essayer de se reconnecter. Dans les deux cas, le résultat net est une perte de productivité pour les utilisateurs, une dégradation du service pour les clients de l'organisation et une charge excessive pour le personnel informatique interne qui doit gérer les ralentissements lorsqu'ils se produisent.
Dans le même temps, un service dimensionné pour répondre aux exigences de débit d'une fenêtre de connexion de 30 minutes le matin et d'une fenêtre de déconnexion de 30 minutes le soir peut signifier que le client paie pour une largeur de bande qui n'est pas nécessaire les 23 autres heures de la journée.
L'une des principales exigences du système de stockage de profils était de pouvoir supporter les pics de débit générés par des milliers d'utilisateurs se connectant tous en même temps au système, sans que des frais soient facturés pour le débit qui n'est pas utilisé.
Très disponible
La solution devait rester disponible non seulement en cas d'interruption d'un service local tel qu'un problème de matériel ou de réseau dans une région donnée, mais aussi être capable de récupérer rapidement tous les services et données connexes en cas de défaillance au niveau régional dans Azure.
Dans le cadre de sa nouvelle solution AVD, le client souhaitait minimiser le risque d'interruption de service, en veillant à ce qu'en cas de panne dans une région, tous les utilisateurs concernés puissent rapidement se reconnecter aux services AVD et aux données dans l'autre région afin de retrouver leur productivité.
Exigences en matière de stockage
Le précédent service de stockage de profils AVD du client avait soumis son équipe informatique à des goulets d'étranglement en termes de performances qui ne pouvaient pas être facilement résolus, et le manque de facilité d'extension du service avait entraîné une charge administrative inacceptable simplement pour maintenir des niveaux de service normaux. En outre, les coûts de transaction élevés du service rendaient difficile la justification de son extension, alors même que la demande d'utilisateurs augmentait.
Pour fournir des services de stockage à ses profils d'utilisateurs distants, le client a pris en compte plusieurs facteurs lors de l'évaluation des options disponibles. Outre les exigences susmentionnées en matière d'évolutivité transparente, de débit élastique (IOPS et bande passante à l'échelle du service) et de prise en charge de la réplication native vers une deuxième région Azure, le processus de sélection du stockage du client a également pris en compte les éléments suivants :
Coût par utilisateur, par Go et par mois, pour le stockage de base du profil de l'utilisateur
Le coût par utilisateur et par mois pour s'assurer que le profil de chaque utilisateur est répliqué dans la région secondaire. Le client devait prendre en compte à la fois le coût de la capacité du service distant et le coût de la réplication des données entre les régions Azure.
Le coût pour garantir que le débit requis sera disponible pour chaque utilisateur pendant les périodes de pointe.
Solution
Le client avait déjà décidé de compléter son service AVD avec Nerdio Manager for Enterprise pour la gestion des images, de l'infrastructure et des ressources. Pour garantir une expérience utilisateur cohérente dans un environnement de bureau éphémère, il a choisi FSLogix, un service Microsoft qui utilise une plate-forme de stockage de fichiers en arrière-plan pour assurer la portabilité de l'utilisateur sur les bureaux physiques et virtuels.
En évaluant les exigences de sa solution, le client a calculé que le système de stockage supportant FSLogix devait évoluer jusqu'à plus de 400 To de capacité totale (le profil unique de chaque utilisateur nécessite en moyenne 50 Go d'espace disque), être capable de supporter 40 000 IOPS d'utilisation soutenue par région, ainsi que de supporter un débit en rafale allant jusqu'à 60 000 IOPS par région pendant les fenêtres de connexion et de déconnexion chaque jour.
Après avoir évalué les services de données Azure disponibles pour les profils de stockage, le client a choisi Azure Native Qumulo (ANQ), un service de stockage de fichiers natif du cloud, reconnaissant que parmi les services de stockage examinés, seul ANQ était en mesure de répondre à tous les objectifs du client en matière d'évolutivité, de performance et de simplicité.
Les avantages d'Azure Native Qumulo
Ayant subi un certain nombre d'interruptions de service et de ralentissements en raison de leur solution de stockage de profil précédent, et cherchant à éviter la complexité de gestion et les coûts de transaction élevés qui l'accompagnent, le client a décidé que Azure Native Qumulo fournirait un service de stockage beaucoup plus simple, à moindre coût, que n'importe laquelle des autres alternatives de stockage basées sur Azure.
Parmi les options de stockage envisagées, Azure Native Qumulo offrait un certain nombre d'avantages qui en ont fait un choix évident pour la fourniture de services de données de profil, notamment :
Seul Azure Native Qumulo offrait une élasticité native dans le nuage qui permettait au service de fournir le débit requis - y compris les IOPS et la bande passante globale du service - de manière totalement indépendante de la capacité. Les autres services ont tous lié les IOPS disponibles de leurs services directement à la capacité provisionnée, obligeant dans certains cas le client à provisionner et à payer une capacité supérieure à celle dont il a réellement besoin pour atteindre les niveaux cibles d'IOPS en rafale par utilisateur.
Seul Azure Native Qumulo était en mesure de prendre en charge un espace de noms unique pour tous les utilisateurs de chaque région, quelle que soit la capacité requise. Alors que les 4 000 utilisateurs AVD du client dans chaque région auraient pu nominalement partager un seul volume sur l'un des autres services de stockage, le client aurait dû créer et gérer plusieurs volumes/partages par région afin de prendre en charge les niveaux d'IOPS requis.
Azure Native Qumulo était le seul service à inclure la réplication interrégionale dans les frais d'abonnement mensuels. Parmi les autres services de stockage disponibles, l'un d'entre eux ne proposait pas du tout la réplication comme fonctionnalité de base, et l'autre nécessitait un coût de licence supplémentaire, ainsi que des frais de réplication par Go pour toutes les données répliquées dans un sens ou dans l'autre.
Seul Azure Native Qumulo offrait une économie d'échelle qui réduisait le coût par utilisateur du service au fur et à mesure de l'ajout d'utilisateurs. Le coût par utilisateur et par mois des autres services est resté relativement constant, quel que soit le nombre d'utilisateurs pris en charge par la solution.
Outre la simplicité de gestion et de licence de l'ANQ, son architecture cloud-native permettait au client de tirer parti de sa capacité et de son évolutivité de débit pour accueillir de nouveaux utilisateurs à pratiquement n'importe quelle échelle et fournir les IOPS nécessaires pour soutenir l'activité des utilisateurs, en minimisant les ralentissements de service même pendant les périodes de pointe, le tout pour une fraction du coût de n'importe quel autre service de stockage de fichiers dans le nuage.
Architecture
La solution Azure Virtual Desktop du client a finalement été déployée avec les composants suivants :
Azure Native Qumulo Scalable File Service (ANQ) pour héberger les profils individuels basés sur VHD de chaque utilisateur de bureau. Une instance ANQ distincte a été déployée dans chaque région.
Réseau virtuel Azure
Injection VNet pour connecter l'instance ANQ de chaque région aux ressources d'abonnement Azure du client
Azure Virtual Desktop, déployé dans deux régions Azure, avec un pool séparé d'utilisateurs assignés aux ressources AVD de chaque région en tant que site principal, et chaque région configurée en tant que site secondaire pour l'autre région en cas d'interruption du service régional.
Nerdio Manager pour simplifier et rationaliser le processus de gestion des services liés à l'AVD : pools de ressources, connectivité, sécurité, images de bureau, applications et surveillance des services.
FSLogix Profile Containers pour connecter chaque utilisateur de l'AVD au profil qui lui a été attribué sur la mémoire de l'ANQ dans le cadre de la procédure de connexion
Qumulo Continuous Replication, configuré pour répliquer les données de profil d'utilisateur du cluster ANQ local de chaque région vers l'instance ANQ de l'autre région, ce qui garantit que les services de profil d'utilisateur resteront disponibles en cas de basculement régional.
Topologie
La solution AVD du client a été déployée dans les régions Azure East US 2 et Azure West US 2, avec des utilisateurs également répartis entre les deux. Chaque utilisateur distant se connecte à la région la plus proche de son emplacement physique.
Pour permettre à l'ensemble du service AVD de rester en ligne en cas de panne dans l'une des régions Azure d'hébergement, chaque région est configurée comme un domaine de basculement à partir de l'autre région Azure. En cas de panne à l'échelle d'une région, l'ensemble des services AVD sera mis en ligne dans la région restante.
Les profils d'utilisateur sont répliqués de manière bidirectionnelle à partir de l'instance de service Azure Native Qumulo locale dans chaque région vers la cible ANQ distante. Cela garantit que les données des profils d'utilisateur seront également disponibles dans l'une ou l'autre région en cas de panne régionale.
L'architecture complète de la solution, y compris les services AVD, Nerdio Manager for Enterprise, FSLogix et les services de données Azure Native Qumulo, est présentée dans le diagramme suivant.
Avantages de la solution
En choisissant une solution de télétravail multirégionale basée sur Azure Virtual Desktop, avec des services de profil d'utilisateur hébergés sur Azure Native Qumulo, le client a pu bénéficier des avantages suivants :
Amélioration de la productivité des utilisateurs
Par rapport au déploiement antérieur de postes de travail virtuels du client, la nouvelle configuration du service a permis des temps de connexion plus rapides pour chaque utilisateur chaque matin. Le résultat a été une base d'utilisateurs plus productive, moins d'appels au personnel d'assistance informatique interne et moins de temps passé à résoudre les problèmes de disponibilité et de performance du service.
Élasticité des services
Une solution sous-dimensionnée peut nuire à la productivité des utilisateurs pendant les périodes de pointe - par exemple pendant les temps de connexion et de déconnexion, ou pendant les périodes d'utilisation intensive - ce qui entraîne des temps d'attente plus longs, une surcharge du personnel informatique, des clients frustrés et une perte potentielle de revenus. Une solution surdimensionnée peut entraîner des coûts opérationnels importants si elle n'est pleinement utilisée que pendant quelques heures ou moins par jour.
Tel qu'il a été déployé, en utilisant Azure Native Qumulo pour fournir le stockage du profil de l'utilisateur, le service a été en mesure d'ajouter des IOPS et de la capacité de débit au service pendant les périodes de charge maximale, puis de revenir automatiquement à des services normaux à tout autre moment. Cela signifie que le client ne payait pas plus que nécessaire pour une solution surdimensionnée, et qu'il ne provoquait pas non plus de ralentissements inutiles du service avec une solution sous-dimensionnée.
La résilience
Les profils d'utilisateurs répliqués sont en lecture seule dans des circonstances normales. Le RTO de la solution doit inclure le temps nécessaire pour basculer sur l'instance ANQ secondaire (par exemple, rompre la relation de réplication et rendre tous les profils accessibles en écriture) avant de connecter les utilisateurs de la région distante aux instances AVD.
Coût
En fait, l'évolutivité et l'élasticité d'Azure Native Qumulo se sont directement traduites par l'avantage le plus important pour le client : une économie d'échelle qui a permis de réduire le coût global des services à un niveau de prix par utilisateur et par mois bien inférieur à celui qu'il aurait connu avec l'un des autres services de stockage de profils envisagés par le client. De l'avis même du client, son choix d'utiliser Azure Native Qumulo pour les services de données de profil AVD s'est traduit par une économie de 325 000 dollars par an par rapport à l'environnement de stockage de sa solution précédente !
Conclusion
En se basant sur sa précédente solution d'utilisateur de bureau à distance, le client avait une grande expérience de ce qui ne fonctionnait pas : sa solution antérieure était trop complexe, trop lente et trop peu fiable. En évaluant d'autres solutions de fichiers dans le nuage basées sur Azure pour le stockage des profils d'utilisateurs, il a déterminé que les alternatives à Azure Native Qumulo étaient toutes les mêmes et trop chères.
Le client a réalisé que, parmi toutes les options de stockage du profil Azure Virtual Desktop, seul Azure Native Qumulo répondait aux exigences du client en matière d'évolutivité de l'espace de nommage unique, de performance - en fournissant des IOPS soutenus et en rafale selon les besoins - et de simplicité, même dans un déploiement multirégional utilisant les fonctions de réplication natives de Qumulo, le tout à un coût inférieur.
Ressources connexes
Azure Native Qumulo Scalable File Service (service de fichiers évolutifs)
Réplication continue Qumulo
Azure Native Qumulo Scalable File Service (Azure Marketplace)
Azure Native Qumulo Scalable File Service (Azure Blog)
Azure Native Qumulo Scalable File Service Guide (Azure Product Documentation)
Utiliser le basculement avec la réplication dans Qumulo
Qumulo Replication : Rendre la cible inscriptible