검색
이 검색 상자를 닫습니다.

클라우드 기반 모니터링으로 고객 성공 창출

작성자 :

우리가 Qumulo에서 가장 자랑스러워하는 것 중 하나는 고객과의 관계입니다. 우리는 Slack을 통해 또는 전화로 의사 소통하고 클라우드 기반 모니터링을 사용하여 고객이 가지고 있는 모든 문제를 가능한 한 효율적이고 신속하게 해결하는 전담 고객 성공 팀을 통해 고객을 지원합니다. 고객은 우리가 하는 모든 일의 중심에 있는 자기장입니다.

Qumulo에서 데이터를 사용하여 생성, 저장 및 구축하는 것은 우리의 초능력입니다. 즉, 고객의 문제를 쉽게 해결하기 위해 고객의 요구를 충족시키는 능력을 포함하여 모든 것을 측정합니다. 업계 전반에 걸쳐 해당 측정항목을 고객 만족도 NPS(Net Promoter Score)라고 하며, Qumulo의 NPS는 지난 분기에 91 우리 회계 연도의. 아마도 더 인상적인 것은 고객 기반이 성장함에 따라 고객 만족도 등급이 계속 상승한다는 것입니다!

이제 저는 엔지니어입니다. 몇 년 전 회사에 합류했을 때 "고객 성공"이라는 용어를 인식하지 못했습니다. 오늘날 저는 이것이 스테로이드에 대한 "고객 지원"과 같다는 것을 이해합니다. 보장 고객은 진정으로 성공했습니다 목표를 달성하기 위해 파일 데이터 플랫폼을 사용합니다.

클라우드 기반 모니터링 문제 조사 

Qumulo's는 어떻게 고객 성공(CS) 팀 현장의 어려운 문제를 그렇게 빨리 해결합니까? 음, 많은 고객이 Cloud-Based Monitoring 또는 "Mission Qontrol"(여기에는 문자 Q가 있습니다)을 활성화했는데, 이는 수많은 시스템 상태 메트릭을 데이터 분석 시스템으로 보내는 폰홈 기능입니다. . 내부적으로 CS 팀은 데이터에 대한 상태 메트릭 차트를 가져와 시각화하여 고객의 많은 복잡성을 관리하도록 설계된 시스템 동작에 대한 세부적인 통찰력을 얻을 수 있습니다. 

건강 메트릭 데이터를 시각화하기 위해 다양한 데이터 소스에서 가져올 수 있는 Grafana라는 오픈 소스 애플리케이션을 사용합니다. 사내에서 우리는 고객 클러스터에서 모든 상태 메트릭 데이터를 가져오고 데이터베이스에 안전하게 저장하고 그 과정에서 적절한 변환을 수행하는 데이터 파이프라인을 설계합니다. 

사례: 문제 보기

최근에 생물의학 연구 고객이 Qumulo 클러스터를 업그레이드했으며 며칠 후 데이터 관리자는 기존 파일 시스템 스냅샷의 한계에 도달했음을 알게 되었습니다. 일부 프로세스가 중단되지 않도록 하기 위해 스냅샷 수에 높은 제한이 있습니다. 그런데 왜 그랬을까요? 결국 고객은 스냅샷을 1분 주기로 자동으로 생성 및 삭제하는 복제 기능의 일부로 일상적인 방식으로 스냅샷을 사용하고 있었습니다. 분명히 이것은 더 많은 조사가 필요한 것이었습니다.

Mission Qontrol 클라우드 기반 모니터링 대시보드를 사용하여 CS 조사관은 제품이 스냅샷에 대한 한계에 도달했음을 신속하게 확인한 다음 단일 노드에서 CPU 사용량이 실제로 높다는 것을 식별할 수 있었습니다. 이 경우 엄청난 수의 "권한 설정"(Setattr) 작업이 해당 노드로 들어오고 있었습니다. 또한 고객은 스냅샷 정리 작업이 평소보다 오래 걸리는 것을 확인할 수 있었습니다. 

이 모든 점을 염두에 두고 그들은 setattr 작업이 스냅샷 정리를 위해 백로그된 많은 작업을 빠르게 생성하고 스냅샷이 천천히 누적되게 한다는 것을 이해했습니다. 모니터링 시스템은 각 노드에 대해 수천 개의 상태 메트릭을 보유하고 있지만 조사관은 그림 1 – 4와 같이 데이터 시각화를 통해 모든 항목을 쉽게 탐색할 수 있었습니다.

시스템 상태 지표에 대한 이 모든 데이터를 어떻게 수집합니까?

2013년에 첫 고객과 함께 시작했을 때 고객 문제에 대한 대응이 성공의 열쇠라는 것을 알고 있었기 때문에 주요 고객 통계 및 알림을 포함하는 대략적인 준비 시스템을 구축했습니다. 그 이후로 우리의 클라우드 모니터링 능력은 훨씬 더 똑똑해졌습니다. 노드당, 때로는 디스크당 추적되는 10,000개 이상의 다양한 메트릭으로 보고되는 상태 메트릭의 수를 확장했습니다.

작년에 우리는 서비스를 여러 구성 요소로 분할하여 이 아키텍처에 계속 투자했습니다. 들어오는 메트릭을 포착하는 웹 서버, 버퍼링하고 많은 내부 소비자에 대한 팬아웃을 관리하는 분산 대기열 시스템 , 그리고 데이터를 저장하고 조사자가 쉽게 쿼리할 수 있도록 하는 우수한 분석 데이터베이스.

오늘날의 Mission Qontrol 클라우드 기반 모니터링 아키텍처는 데이터 소비자를 서로 및 고객 생산 시스템에서 분리하여 분산 대기열을 통해 데이터 분석을 효율적으로 지원합니다.

대기열 시스템의 경우 사용하기 쉽고 친숙한 API와 함께 필요한 기능이 있고 광범위하고 만족스러운 사용자 커뮤니티가 있는 것 같았기 때문에 RabbitMQ를 선택했습니다. 우리는 약 XNUMX년 동안 그것을 실행했고 그것이 매우 안정적이라는 것을 알게 되었습니다.

중앙에 있는 이 플라이휠을 사용하여 데이터를 모든 데이터 소비자에게 제공함으로써 많은 일을 할 수 있습니다. 우리는 앞에서 이야기한 연구 기관의 문제와 같은 특정 고객 문제를 볼 수 있습니다. 클러스터에 저장된 수십억 개의 파일로 집계 분석을 수행할 수 있습니다. 우리는 새로운 기능이 고객을 위해 얼마나 잘 수행되는지 평가하고 우리가 제공해야 하는 추가 개선 사항을 식별할 수 있습니다. 다양한 제품 기능의 사용이 시간이 지남에 따라 어떻게 변했는지 연구할 수 있습니다.

그리고 이 모든 데이터는 어디에 저장됩니까? 물론 Qumulo에서. 실제로 데이터 센터에 하나, 클라우드에 네임스페이스 하나, 두 개의 Qumulo 클러스터가 있으므로 Qumulo 파일 데이터 플랫폼, 그리고 물론 "우리 자신의 개밥 먹기".

자세히 알아보기
문의하기

시승하기. 대화형 Hands-On Lab에서 Qumulo를 시연합니다.

Qumulo 블로그 구독 고객 사례, 기술 통찰력, 업계 동향 및 제품 뉴스를 제공합니다.

관련 게시물

위쪽으로 스크롤