Azure Native Qumulo 이제 EU, 영국 및 캐나다에서 사용 가능 – 자세히 알아보기

AWS EBS sc1에서 비용 효율적인 엔터프라이즈 스토리지를 얻는 방법

작성자 :
AWS EBS sc1을 프로덕션 워크로드를 위한 강력한 스토리지 매체로 전환하는 방법을 알아보십시오.

AWS EBS sc1을 프로덕션 워크로드를 위한 강력한 스토리지 매체로 전환하는 방법을 알아보십시오.

2020년 초에 고객으로부터 Qumulo의 클라우드에 더 많은 파일 데이터를 저장하고 싶다는 피드백을 받았지만 AWS EBS st1 인프라 비용이 50TB 이상으로 올라가면서 폭발했습니다. 우리는 솔루션의 비용을 분류하고 다양한 각도에서 살펴보았고 용량을 확장함에 따라 비용이 EBS에 의해 지배되는 것을 보았습니다. 그해 후반에 더 많은 테스트와 우리 제품이 대기 시간이 긴 디스크를 처리하는 방식에 약간의 변경을 가한 후 가격을 최대 70%. 어떻게 했지?

첫째, 배경. 

AWS의 Qumulo SSD에는 EBS gp2 볼륨을, HDD에는 st1 볼륨을 사용합니다.

  Qumulo 파일 데이터 플랫폼 클러스터에서 동일하게 구성된 여러 노드에서 실행되는 고가용성 분산 파일 시스템입니다. 클러스터의 모든 노드는 동등한 참여자이며 Qumulo 시스템의 데이터에 액세스해야 하는 다른 시스템 또는 사용자는 모든 노드에서 액세스할 수 있으며 모두 정확히 동일한 상태를 볼 수 있습니다. 

이를 통해 수천 개의 연결된 클라이언트에 서비스를 제공하도록 확장할 수 있으며 일부 구성은 1M IOPS 및 수십 GB/s에 도달할 수 있습니다. 귀하의 데이터는 EBS 볼륨의 손실로부터 보호되며(EBS는 연간 장애율 0.1%-0.2%를 알립니다) 노드가 재부팅되거나 일시적으로(예: 유지 관리를 위해) 종료되는 경우에도 계속 액세스할 수 있습니다.

Qumulo의 두 가지 주요 작동 모드는 모두 SSD입니다. 즉, SSD에서 데이터를 쓰고 읽고 다른 곳으로 이동하지 않습니다. 이것을 비디오 편집, 재생 및 렌더링과 같은 작업에 대해 일관되게 짧은 대기 시간을 제공하도록 설계된 단일 계층 플랫폼이라고 생각하십시오. 또한 영구 캐시 역할을 하는 얇은 SSD 레이어로 구성된 XNUMX계층 모드가 있으며 "스토리지"는 실제로 더 저렴한 HDD의 큰 뱅크에서 지원합니다. 이것은 우리가 고객을 위해 보다 비용 효율적으로 만드는 데 초점을 맞춘 구성이었습니다.

AWS 제품은 SSD에 EBS gp2 볼륨을 사용하고 HDD에 st1 볼륨을 사용합니다. Qumulo 클러스터의 용량을 50TB에서 100TB, 200TB, 400TB로 늘리면 st1 비용이 전체 솔루션 비용을 지배하기 시작합니다. 그리고 그것은 정말 빨리 비싸집니다. (관련된: 고성능 데이터 전략을 위한 예산을 책정하고 비용을 통제하는 방법)

이제 AWS EBS에 대해 조금이라도 알고 계시다면 AWS에 sc1이라는 저렴한 HDD 클래스가 있다는 사실을 알고 계실 것입니다. 다음과 같이 광고됩니다. "이들(sc1)은 처리량(MiB/s)이 지배적인 성능 속성인 큰 I/O 크기를 가진 대규모 콜드 데이터 세트가 있는 자주 액세스하지 않는 워크로드에 이상적입니다."

Qumulo는 초기에 sc1을 실험했지만 문제가 되는 데이터를 보았습니다. 레이턴시가 훨씬 더 높았고, 비용은 성능 차이를 반영하지 않는 것 같았습니다. 

1년 초 IO 지연 시간 sc1 대 st2020 성능 테스트

읽기 쓰다
순차 72% 159%
랜덤 무작위 162% 213%

 

또한 네트워크에 연결된 EBS의 IO 대기 시간 오버헤드가 성능에 영향을 미친다는 것을 이미 알고 있었습니다. 우리 소프트웨어에 대한 일부 일화적인 테스트도 유망해 보이지 않았습니다. 우리는 sc1을 고객에게 제안하기에는 너무 위험한 것으로 분류했습니다. 그 시간에.

AWS EBS sc1에서 비용 효율적인 엔터프라이즈 스토리지를 원하는 고객

작년 말, Qumulo는 시스템에서 성능을 튜닝하는 데 여러 번의 길고 값비싼 개발 주기를 보낸 후 다시 살펴보았습니다. 그리고 sc1을 특별히 요구하는 고객이 있었기 때문에 우리는 말했습니다. 자, 한 번만 더 해보자. 우리는 몇 가지 테스트를 했고, 우리가 조정해야 할 코드에서 몇 가지 병목 현상을 발견한 다음, 우리가 어디에 도달했는지에 대한 아이디어를 얻기 위해 벤치마킹을 시작했습니다.

우리는 즐겁게 놀랐습니다.

sc1이 지원되는 클러스터의 최대 멀티스트림 성능은 일치하고 때때로 st1을 실행하는 동급 클러스터의 성능을 초과했습니다. 이것이 모든 워크로드에 대해 항상 발생하는 것은 아니라는 것을 알고 있지만 엔터프라이즈 파일 시스템에서 비용 효율적인 스토리지 계층을 사용하는 효과를 은폐하는 데 우리 기술이 얼마나 도움이 되었는지를 보여줍니다.

엔터프라이즈 파일 시스템의 비용 효율적인 계층

 1년 sc1 대 st2021의 샘플

클러스터 AWS 인프라 월별 비용(us-west-2) 최대 멀티스트림 쓰기 MB/s 최대 멀티 스트림 읽기(캐시 또는 SSD에서) MB/s HDD MB/s에서 최대 멀티 스트림 읽기
M5.12xlarge 4x55TiB st1 $17,989.28 1635MiB/s 3192MiB/s 3202MiB/s
M5.12xlarge 4x55TiB sc1 $ 11,230.88 (-37 %) 1683MiB/s 3135MiB/s 3194MiB/s

위 표의 값은 정보 제공용으로만 제공되며 4노드 클러스터 및 m5.12xlarge 인스턴스로 수행된 단일 다중 스트림 테스트 Qumulo를 나타냅니다. 가격은 기업 계약과 원하는 배포 지역에 따라 달라집니다. 성능은 네트워킹 지연 시간, 인스턴스 유형 및 노드 수에 따라 달라질 수 있습니다.

오늘날 어떻게 이것이 가능합니까? 

Qumulo는 처음부터 제품 최적화와 성능 개선에 중점을 두었습니다. 우리의 소프트웨어 정의 솔루션을 사용하여 끌어낼 수 있는 유일한 수단은 우리의 소프트웨어를 더 똑똑하고, 더 좋고, 빠르게 만드는 것입니다. 이것은 단점처럼 보일 수 있지만(왜 독점 하드웨어로 속임수를 쓰지 않는 것일까요?), 장점은 온프레미스가 아닌 모든 곳에서 이러한 가치와 노력을 얻을 수 있다는 것입니다.

Qumulo의 최적화는 다음을 의미합니다.

  1. 항상 플래시에 쓰기, 마침표. 우리는 데이터 쓰기에 대한 핫 경로에 느린 HDD를 포함하지 않습니다.
  2. 항상 모든 데이터 캐시 동일한 데이터를 다시 요청하는 경우를 대비하여 메모리에도 기록합니다. 디스크를 읽거나 다른 노드에 동일한 데이터를 요청할 필요도 없습니다.
  3. 백그라운드에서 HDD로 데이터 이동, 시야에서, 마음에서, 필요에 따라 자동으로. 이를 보다 저렴한 스토리지로 자동 계층화하는 것으로 생각하십시오. 우리는 항상 가장 차가운 데이터를 이동하고 파일 시스템의 블록 수준에서 이 작업을 수행합니다. 따라서 Linux 파일 명령을 계속해서 실행하고 파일의 처음 4KB만 읽는 경우 첫 번째 블록은 핫으로 처리하고 나머지 파일은 핫이 아닌 것으로 처리합니다. 이것은 SSD 캐시의 사용을 최대화합니다.
  4. 캐시에 없는 데이터를 요청할 때 SSD를 사용해 보세요.. SSD에 없으면 HDD에서 읽지만 파일의 다음 블록도 미리 가져오기 시작하므로 아직 요청하지 않은 경우 메모리 캐시에 이미 있습니다. 왜요? 당신이 그것을 요구하기 전에 그것에 당신을 이길. 프리페처에 의해 마스킹되기 때문에 HDD에서 읽기가 빨라 보입니다. 디렉토리에서 파일을 순차적으로 읽는 경우에도 이 작업을 수행합니다.
  5. HDD에서 몇 번 읽은 블록을 다시 SSD로 이동. 왜요? 해당 데이터를 계속 요청하려는 경우 느린 매체로 유지할 이유가 없습니다. 조정이나 정책이 필요하지 않으므로 자동으로 승격됩니다.
  6. 블록 할당 시스템 최적화 주소가 데이터를 쓸 때까지 기다릴 시간이 없도록 합니다.
  7. 거의 전체 코드 스택을 소유 데이터 구조와 알고리즘에 이르기까지 제품의 모든 것. 우리는 잘못된 정렬이나 다른 사람의 사업처럼 잘못된 캐시 라인을 공격하는 해시 맵을 조정할 수 있습니다. 우리는 NFS 및 SMB 구현을 처음부터 작성했으며 스택의 모든 것을 위에서 아래로 조정할 수 있습니다.
  8. 사용자 공간에서 완전히 실행, 커널 컨텍스트 전환을 방지하고 비동기 IO를 통해 모든 작업을 수행하는 자체 작업 스케줄러가 있습니다.

AWS EBS sc1을 프로덕션 워크로드를 위한 강력한 스토리지 매체로 전환

Qumulo의 파일 데이터 플랫폼과 같은 스케일 아웃 스토리지 시스템을 구축하려면 시간이 걸립니다. 그러나 이렇게 하는 것의 가치는 보여줍니다. Amazon이 "활성 워크로드"에 대해 권장하지 않는 EBS 볼륨 유형인 sc1을 프로덕션 워크로드를 위한 강력한 스토리지 매체로 효과적으로 전환합니다. ~에 GiB-월당 $0.015, 가장 저렴한 GiB-월당 $3인 S0.021, EBS sc1은 실제로 S28 표준보다 3% 적습니다. 바로 스토리지입니다! S3는 스토리지 외에 API 호출에 대해 요금을 부과합니다.

자세히 알아보기
AWS에서 Qumulo를 사용하는 방법

관련 게시물

위쪽으로 스크롤