
사례 연구 - Azure 가상 데스크톱 프로필 서비스를 위한 Azure Native Qumulo
이 익명의 사례 연구에서는 선도적인 금융 서비스 회사가 전국 8,000명의 원격 사용자에게 서비스를 제공하는 VDI 솔루션의 데이터 스토리지 관리를 지원한 Azure Native Qumulo의 실제 배포에 대해 자세히 설명합니다.
한 선도적인 금융 서비스 회사는 수명이 다한 원격 데스크톱 플랫폼을 폐기하려고 했습니다. 동시에 팬데믹으로 인한 수요 증가를 충족하기 위해 새로운 직원을 채용하고 있었습니다. 8,000명의 원격 사용자가 고객에게 중요한 비즈니스 서비스를 제공하고 동부 해안과 서부 해안 모두에 분산되어 있으며 그 수가 계속 늘어날 것으로 예상되는 이 고객은 원격 데스크톱 서비스를 Azure Virtual Desktop(AVD)으로 이전하고, 엔터프라이즈용 Nerdio Manager를 사용하여 AVD 리소스 및 서비스를 관리하고 FSLogix를 사용하여 두 배포의 모든 사용자의 원격 사용자 프로필을 관리하기로 선택했습니다.
솔루션 요구 사항
이미 소규모로 원격 사용자 솔루션을 관리하고 어떤 아키텍처와 관리 관행이 효과가 있는지, 그렇지 않은지 파악한 이 고객은 업데이트된 가상 데스크톱 환경에 대해 다음과 같은 요구 사항을 정의했습니다:
확장 가능한 단순성
고객의 이전 솔루션 스택은 단일 볼륨 또는 네임스페이스 내에서 지역당 최대 4,000명의 사용자를 지원하도록 확장할 수 없었습니다. 원격 사용자 수가 증가함에 따라 고객은 용량과 IOPS 모두에 대한 수요 증가를 수용하기 위해 기존 파일 데이터 서비스에 새로운 공유를 프로비저닝해야 했습니다.
고객이 확장하면서 발견한 것은 새로운 공유가 추가될 때마다 첫째, 공유의 운영 상태, 사용률 수준 및 성능을 모니터링하는 데 관리 시간이 필요하고 둘째, 지역 중단 시 장애 조치 볼륨으로 사용할 전용 공유를 다른 Azure 지역에 프로비저닝해야 한다는 점 등 운영 부담이 가중된다는 것이었습니다. 이전 파일 서비스는 기본 복제 도구를 제공하지 않았기 때문에 각 공유를 다른 리전으로 미러링하려면 타사 도구의 복잡한 시스템, 정기적인 수동 검사, 여러 가지 이유로 복제에 실패했을 때의 문제 해결이 필요했습니다.
각 지역에 4,000명의 사용자가 있고 지속적으로 변화하는 비즈니스 수요에 따라 새로운 원격 직원을 추가할 가능성이 있는 이 고객은 지역당 초기 원격 사용자 수인 4,000명 이상으로 확장할 수 있을 뿐만 아니라 다른 Azure 지역으로 사용자 데이터를 규모에 관계없이 복제하는 것을 지원하는 솔루션이 필요했습니다. 이상적으로, 고객은 전체 솔루션의 운영 복잡성을 최소화하기 위해 단일 네임스페이스 내에서 모든 규모로 원활하게 확장할 수 있는 솔루션을 원했습니다.
최소한의 비용으로 최고의 성능을 발휘하도록 최적화됨
각 지역에서는 솔루션에 동시에 접속하는 원격 사용자가 최대 4,000명에 달해 매일 아침과 저녁에 로그오프할 때 솔루션에 과부하가 걸립니다. 용량이 부족한 스토리지 시스템은 많은 동시 요청을 처리하지 못해 각 사용자의 로그인/로그아웃 시간이 과도하게 늘어나거나 일부 사용자의 연결이 완전히 실패하여 다시 연결을 시도해야 하는 상황이 발생할 수 있습니다. 어떤 경우든 결과적으로 사용자 생산성 저하, 대고객 서비스 저하, 속도 저하 이벤트 발생 시 이를 관리해야 하는 내부 IT 직원의 과도한 부담으로 이어집니다.
동시에 아침에는 30분 동안 로그인하고 저녁에는 30분 동안 연결 해제하는 처리량 수요를 충족하기 위해 서비스 크기를 조정하면 고객은 매일 나머지 23시간 동안 필요하지 않은 대역폭에 대한 비용을 지불하게 될 수 있습니다.
프로필 스토리지 시스템의 핵심 요구사항은 수천 명의 사용자가 동시에 시스템에 접속하여 발생하는 최대 처리량 수요를 지원하면서도 사용하지 않는 처리량에 대해서는 요금을 부과하지 않는 기능이었습니다.
높은 가용성
솔루션은 특정 지역 내에서 하드웨어 또는 네트워크 문제와 같은 로컬 서비스 중단이 발생하는 경우뿐만 아니라 Azure 내에서 지역 수준의 장애가 발생하는 경우에도 모든 관련 서비스 및 데이터를 신속하게 복구할 수 있어야 했습니다.
이 고객은 새로운 AVD 솔루션의 일환으로 서비스 중단 위험을 최소화하여 한 지역에서 지역 전체에 장애가 발생하는 경우 영향을 받는 모든 사용자가 다른 지역의 AVD 서비스 및 데이터에 신속하게 다시 연결하여 생산성을 회복할 수 있기를 원했습니다.
스토리지 요구 사항
이 고객의 이전 AVD 프로필 스토리지 서비스는 쉽게 해결할 수 없는 성능 병목 현상에 시달렸고, 서비스 확장이 용이하지 않아 정상적인 서비스 수준을 유지하는 데만도 관리 부담이 너무 컸습니다. 게다가 서비스의 높은 거래 비용으로 인해 사용자 수요가 증가하고 있음에도 불구하고 서비스 확장을 정당화하기 어려웠습니다.
원격 사용자 프로필을 위한 스토리지 서비스를 제공하기 위해 이 고객은 사용 가능한 옵션을 평가할 때 몇 가지 요소를 고려했습니다. 위에서 언급한 원활한 확장성, 탄력적인 처리량(IOPS 및 서비스 전체 대역폭), 두 번째 Azure 리전으로의 기본 복제 지원에 대한 요구 사항 외에도 고객의 스토리지 선택 프로세스에서는 다음 사항도 고려했습니다:
사용자 프로필의 기본 스토리지에 대한 월별 GB당 사용자당 비용입니다
각 사용자의 프로필이 보조 리전으로 복제되도록 하기 위한 사용자당 월별 비용. 고객은 원격 서비스의 용량에 대한 비용과 Azure 리전 간에 데이터를 복제하는 비용을 모두 고려해야 했습니다.
피크 기간 동안 각 사용자를 지원하기 위해 필요한 처리량을 확보하는 데 드는 비용입니다.
솔루션
이 고객은 이미 이미지, 인프라 및 리소스 관리를 위해 Nerdio Manager for Enterprise로 AVD 서비스를 보완하기로 결정했습니다. 임시 데스크톱 환경에서 일관된 사용자 환경을 보장하기 위해 백엔드 파일 스토리지 플랫폼을 사용하여 물리적 데스크톱과 가상 데스크톱 모두에서 사용자 이동성을 제공하는 Microsoft 서비스인 FSLogix를 선택했습니다.
솔루션 요구 사항의 규모를 산정할 때, 고객은 FSLogix를 지원하는 스토리지 시스템이 총 용량을 400TB 이상으로 확장하고(각 사용자의 고유 프로필에 평균 50GB의 디스크 공간이 필요함), 지역당 40,000 IOPS의 지속적인 사용을 지원할 수 있어야 하며, 매일 로그온 및 로그오프 기간 동안 지역당 최대 60,000 IOPS의 버스트 처리량을 처리할 수 있어야 한다는 계산을 했습니다.
이 고객은 스토리지 프로필에 사용 가능한 Azure 데이터 서비스를 평가한 후, 검토한 스토리지 서비스 중 확장성, 성능 및 단순성에 대한 고객의 모든 목표를 충족할 수 있는 서비스는 ANQ뿐이라는 것을 인식하고 클라우드 네이티브 파일 스토리지 서비스인 Azure Native Qumulo(ANQ)를 선택했습니다.
Azure 네이티브 Qumulo의 장점
이전 프로필 스토리지 솔루션으로 인해 서비스 중단 및 속도 저하를 여러 번 경험한 이 고객은 관리 복잡성과 높은 거래 비용을 피하고자 Azure Native Qumulo가 다른 어떤 Azure 기반 스토리지 대안보다 훨씬 더 저렴한 비용으로 훨씬 더 간단한 스토리지 서비스를 제공할 것이라고 판단했습니다.
고려한 스토리지 옵션 중 Azure Native Qumulo는 다음과 같은 여러 가지 이점을 제공하므로 프로필 데이터 서비스를 제공하기 위한 확실한 선택이었습니다:
클라우드 네이티브 탄력성을 제공하는 서비스는 Azure Native Qumulo만이 용량과 완전히 독립적으로 IOPS 및 전체 서비스 대역폭을 모두 포함하여 필요한 처리량을 제공할 수 있었습니다. 다른 서비스는 모두 서비스의 가용 IOPS를 프로비저닝된 용량에 직접 연결했기 때문에 일부 상황에서 고객은 사용자당 버스트 IOPS의 목표 수준에 도달하기 위해 실제로 필요한 것보다 더 많은 용량을 프로비저닝하고 비용을 지불해야 했습니다.
필요한 용량에 관계없이 각 지역의 모든 사용자에게 단일 네임스페이스를 지원할 수 있는 것은 Azure Native Qumulo뿐이었습니다. 각 지역에 있는 고객의 4,000명의 AVD 사용자가 명목상으로는 모두 다른 스토리지 서비스에서 단일 볼륨을 공유할 수 있지만, 필요한 IOPS 수준을 지원하려면 지역별로 여러 볼륨/공유를 만들고 관리해야 합니다.
지역 간 복제를 월 구독료의 핵심 기능으로 포함하는 서비스는 Azure Native Qumulo가 유일했습니다. 사용 가능한 다른 스토리지 서비스 중 하나는 복제를 핵심 기능으로 전혀 제공하지 않았고, 다른 하나는 추가 라이선스 비용과 양방향으로 복제되는 모든 데이터에 대해 GB당 복제 요금이 필요했습니다.
사용자 수가 추가될수록 사용자당 서비스 비용이 감소하는 규모의 경제를 제공하는 것은 Azure Native Qumulo뿐이었습니다. 다른 서비스의 사용자당 월별 요금은 솔루션이 지원하는 사용자 수에 관계없이 상당히 일정하게 유지되었습니다.
ANQ의 관리 및 라이선스 간소화 외에도 클라우드 네이티브 아키텍처는 고객이 용량과 처리량 확장성을 활용하여 거의 모든 규모의 신규 사용자를 수용하고 사용자 활동을 유지하는 데 필요한 IOPS를 제공함으로써 다른 클라우드 파일 스토리지 서비스보다 훨씬 적은 비용으로 피크 기간에도 서비스 속도 저하를 최소화할 수 있음을 의미했습니다.
아키텍처
고객의 Azure Virtual Desktop 솔루션은 최종적으로 다음과 같은 구성 요소로 배포되었습니다:
각 데스크톱 사용자의 개별 VHD 기반 프로필을 호스팅하기 위해 Azure Native Qumulo Scalable File Service(ANQ)를 사용합니다. 각 지역에 별도의 ANQ 인스턴스가 배포되었습니다.
Azure 가상 네트워크
각 지역의 ANQ 인스턴스를 고객의 자체 Azure 구독 리소스에 연결하기 위한 VNet Injection
Azure Virtual Desktop은 두 개의 Azure 지역에 배포되며, 각 지역의 AVD 리소스에 별도의 사용자 풀이 기본 사이트로 할당되고 지역 서비스가 중단되는 경우 각 지역이 다른 지역의 보조 사이트로 설정됩니다.
리소스 풀, 연결, 보안, 데스크톱 이미지, 애플리케이션, 서비스 모니터링 등 AVD 관련 서비스 관리 프로세스를 간소화하고 능률화할 수 있는 Nerdio Manager입니다.
로그인 프로세스의 일부로 각 AVD 사용자를 ANQ 스토리지의 할당된 프로필에 연결하기 위한 FSLogix 프로필 컨테이너
각 지역의 로컬 ANQ 클러스터에서 다른 지역의 ANQ 인스턴스로 사용자 프로필 데이터를 복제하여 지역 장애 조치 시에도 사용자 프로필 서비스를 계속 사용할 수 있도록 구성한 Qumulo 연속 복제입니다.
토폴로지
고객의 AVD 솔루션은 Azure East US 2 및 Azure West US 2 지역에 배포되었으며, 사용자는 두 지역에 균등하게 분산되어 있습니다. 각 원격 사용자는 자신의 실제 위치에서 가장 가까운 지역에 연결합니다.
호스팅 Azure 지역 중 하나에서 장애가 발생하는 경우 전체 AVD 서비스가 온라인 상태를 유지할 수 있도록 각 지역은 다른 Azure 지역의 장애 조치 도메인으로 구성됩니다. 지역 전체가 중단되는 경우 나머지 지역에서 전체 AVD 서비스 세트가 온라인 상태가 됩니다.
사용자 프로필은 각 지역의 로컬 Azure Native Qumulo 서비스 인스턴스에서 원격 ANQ 대상으로 양방향으로 복제됩니다. 따라서 지역 중단이 발생하는 경우에도 사용자 프로필 데이터를 어느 지역에서나 사용할 수 있습니다.
AVD 서비스, 엔터프라이즈용 Nerdio Manager, FSLogix 및 Azure Native Qumulo 데이터 서비스 지원을 포함한 전체 솔루션 아키텍처는 다음 다이어그램에 나와 있습니다.
솔루션 혜택
Azure Virtual Desktop을 기반으로 하는 다중 지역 원격 작업자 솔루션과 Azure Native Qumulo에서 호스팅되는 사용자 프로필 서비스를 선택한 결과, 고객은 다음과 같은 이점을 실현할 수 있었습니다:
사용자 생산성 향상
고객의 이전 가상 데스크톱 배포와 비교했을 때, 새로운 서비스 구성으로 매일 아침 각 사용자의 로그인 시간이 단축되었습니다. 그 결과 사용자들의 생산성이 향상되고 내부 IT 지원팀과의 통화 횟수가 줄어들었으며 서비스 가용성 및 성능 문제를 해결하는 데 소요되는 시간이 단축되었습니다.
서비스 탄력성
솔루션 크기가 작으면 로그온 및 로그오프 시간이나 사용량이 많은 시간대에 사용자 생산성이 저하되어 대기 시간이 길어지고 IT 직원의 업무 부담이 가중되며 고객 불만과 잠재적인 매출 손실로 이어질 수 있습니다. 솔루션이 하루에 몇 시간 이하로만 완전히 활용되는 경우 대형 솔루션은 상당한 운영 비용을 발생시킬 수 있습니다.
배포된 Azure Native Qumulo를 사용하여 사용자 프로필 스토리지를 제공한 이 서비스는 부하가 가장 많은 시간대에 서비스에 IOPS 및 처리량 용량을 추가한 다음 다른 모든 시간에는 자동으로 정상 서비스로 돌아갈 수 있었습니다. 즉, 고객은 오버사이즈 솔루션에 필요 이상의 비용을 지불하지 않아도 되고, 오버사이즈 솔루션으로 인해 불필요한 서비스 속도 저하를 일으키지 않아도 되었습니다.
복원력
복제된 사용자 프로필은 일반적인 상황에서 읽기 전용입니다. 솔루션의 RTO에는 원격 지역의 사용자를 AVD 인스턴스에 연결하기 전에 보조 ANQ 인스턴스로 장애 조치하는 데 필요한 시간(예: 복제 관계를 끊고 모든 프로필을 쓰기 가능하게 만드는 시간)이 포함되어야 합니다.
비용
실제로 Azure Native Qumulo의 확장성과 탄력성은 고객에게 가장 중요한 이점인 규모의 경제를 통해 고객이 고려했던 다른 프로필 스토리지 서비스보다 훨씬 낮은 사용자당 월별 서비스 비용으로 전체 서비스 비용을 절감하는 데 직접적으로 기여했습니다. 고객이 자체적으로 계산한 결과, AVD 프로필 데이터 서비스에 Azure Native Qumulo를 사용하기로 선택함으로써 이전 솔루션의 스토리지 환경에 비해 연간 325,000달러의 비용을 절감할 수 있었습니다!
결론
이 고객은 이전 원격 데스크톱 사용자 솔루션이 너무 복잡하고, 너무 느리고, 너무 불안정하여 실패한 경험이 많았습니다. 사용자 프로필을 저장하기 위한 다른 Azure 기반 클라우드 파일 솔루션을 평가하는 과정에서 Azure Native Qumulo의 대안은 모두 위와 같은 문제를 가지고 있을 뿐만 아니라 너무 비싸다는 것을 알게 되었습니다.
이 고객은 Azure Virtual Desktop 프로필 스토리지에 대한 모든 옵션 중에서 단일 네임스페이스 확장성, 성능(필요에 따라 지속적 및 버스트 IOPS를 모두 제공) 및 단순성에 대한 고객의 요구 사항을 충족하는 것은 Qumulo의 기본 복제 기능을 활용하는 다중 지역 배포에서도 Azure Native Qumulo만이 더 저렴한 비용으로 제공한다는 사실을 깨달았습니다.
관련 리소스
Azure 네이티브 Qumulo 확장 가능한 파일 서비스
Qumulo 연속 복제
Azure 네이티브 Qumulo 확장 가능한 파일 서비스(Azure 마켓플레이스)
Azure 네이티브 Qumulo 확장 가능한 파일 서비스(Azure 블로그)
Azure Native Qumulo 확장 가능한 파일 서비스 가이드(Azure 제품 설명서)
Qumulo에서 복제와 함께 장애 조치 사용
Qumulo 복제: 대상 쓰기 가능 만들기