Azure Native Qumulo 이제 EU, 영국 및 캐나다에서 사용 가능 – 상세 보기

이레이저 코딩 대 RAID 설명: 데이터 보호 방법

작성자 :

이레이저 코딩(EC)은 RAID 및 미러링 전략에 비해 데이터에 더 많은 디스크를 사용할 수 있기 때문에 효율성으로 인해 가장 잘 알려진 데이터 보호 방법 중 하나입니다.

이레이저 코딩의 주요 장점 중 하나는 유연성입니다. IT 관리자는 물리적 미디어 장애로부터 성능과 복구 시간과 시스템이 견딜 수 있는 동시 장애 수 사이에서 적절한 균형을 유지하는 방법을 결정할 수 있습니다.

이레이저 코딩 아래에서 더 자세히 논의할 예제와 함께 이해하는 것이 가장 쉽습니다. 하지만 이레이저 코딩이 대체 무엇인지와 같은 몇 가지 사항이 궁금할 수 있습니다. RAID 및 미러링 데이터 보호 체계와 비교하면 어떻습니까? RAID 스트라이핑 및 미러링과 같은 다른 데이터 보호 방법과 비교하여 삭제 코딩의 장점과 단점은 무엇입니까? 이 모든 중요한 질문은 기업이 데이터를 안전하게 보호할 수 있는 최상의 위치에 놓이도록 하는 중요한 질문입니다.

이레이저 코딩이란?

Erasure Coding은 고급 수학을 활용하여 파일 시스템 소프트웨어가 패리티 블록. 아래에서 설명하겠지만 이레이저 코딩은 데이터의 두 번째 전체 복사본이 필요하지 않지만 누락된 부분을 복원할 수 있기 때문에 미러 복사본보다 우수한 데이터 보호 기능을 제공합니다.

이레이저 코딩 대 RAID: 장단점

이레이저 코딩이 다른 데이터 보호 방법보다 얼마나 우수한지 설명하기 위해 다양한 형태의 데이터 보호와 장단점을 이해하는 데 도움이 됩니다.

저렴한 디스크의 중복 어레이(RAID)

RAID는 오랫동안 사용되어 왔습니다. 가장 기본적인 데이터 보호 구성은 미러링이라고도 하는 RAID 1입니다. 이름에서 알 수 있듯이 미러링은 두 개(또는 그 이상) 드라이브에 동시에 데이터를 기록하여 동일한 복사본, 즉 미러 이미지를 만드는 것을 포함합니다.

RAID 1 미러링 구성에서는 각 복사본이 별도의 디스크에 있기 때문에 세트의 기본 디스크에 장애가 발생하면 '미러 이미지'에서 데이터를 복구할 수 있습니다. 미러링은 구현이 간단하지만 몇 가지 단점이 있습니다. 미러링에는 데이터의 전체 복사본이 하나 이상 필요하므로 데이터 보호에 필요한 공간 측면에서 낭비입니다. 또한 미러링은 단일 드라이브 고장 한 번에, 특히 클러스터 크기가 증가함에 따라 일반적으로 많은 사용 사례에 대해 충분한 보호가 되지 않습니다.

미러링 외에도 RAID 표준은 성능, 보호 또는 둘 다를 최적화하기 위해 다른 구성을 제공합니다. 일반적인 옵션은 미러링보다 효율성과 읽기 성능을 향상시키는 패리티가 있는 RAID 5 또는 디스크 스트라이핑입니다. 그러나 이러한 고급 RAID 구성은 매우 복잡해지고 관리 및 유지 관리가 어려워질 수 있습니다. 또한 구성 요소 오류가 발생하는 경우 RAID를 사용한 재구축 시간이 허용할 수 없을 정도로 느려질 수 있으며 이는 사용자의 성능에 상당한 영향을 미칩니다.

스토리지 데이터 보호를 위해 RAID를 고려할 때 RAID는 모든 작업을 수행할 수 없으며 RAID 구성을 구축할 때 종종 어려운 선택으로 이어집니다. IT 관리자가 강력한 데이터 보호, 성능 또는 그 이상 중에서 선택해야 함 저장 효율성? 답은 그들이 모두 원해, 하지만 RAID는 제공할 수 없습니다.

이레이저 코딩

Qumulo Core 아키텍처는 Qumulo를 중심으로 구축되었습니다. 확장 가능한 블록 스토어(SBS), 이레이저 코딩으로 효율적인 블록 기반 데이터 보호를 가능하게 하는 기반 레이어입니다.

이레이저 코딩은 RAID와 완전히 다르며 RAID의 단점을 해결합니다. RAID 스트라이핑 또는 미러링과 달리 이레이저 코딩은 대규모 데이터 스토리지를 위한 확장 가능한 보호 기능으로, 훨씬 더 성능이 뛰어나고 구성이 가능하며 공간 효율성이 높기 때문에 완전한 데이터 보호 및 응답성을 유지하면서 클러스터를 무제한으로 확장할 수 있습니다.

이레이저 코딩은 고급 수학(예: 이 경우 Reed-Solomon 공식)을 사용하여 알려진 데이터 조각(패리티 블록)에서 누락된 데이터를 재생성할 수 있습니다.

따라서 완전한 두 번째 사본이 필요한 RAID 미러링과 달리 이레이저 코딩은 3,2개의 데이터 블록(XNUMX 인코딩이라고 함)마다 하나의 패리티 블록만 필요로 하여 효율성을 높일 수 있습니다.

이레이저 코딩 설명(예시)

이레이저 코딩은 예제를 통해 가장 쉽게 이해할 수 있습니다. 다음은 3,2 인코딩 예입니다.

 

3,2 인코딩에서 3개의 블록(m = 1)은 2개의 별개의 물리적 장치에 분산됩니다. 블록 2과 XNUMX에는 보호하려는 사용자 데이터(n = XNUMX)가 포함되고 세 번째 블록을 패리티 블록이라고 합니다. 패리티 블록의 내용은 삭제 코딩 알고리즘을 사용하여 계산됩니다.

각 블록은 별도의 드라이브에 기록되기 때문에 세 개의 드라이브 중 하나가 실패할 수 있으며 블록 1과 2에 저장된 정보는 패리티 블록에서 다시 생성될 수 있기 때문에 여전히 안전합니다.

이레이저 코딩 작동 방식

여기 그것이 작동하는 방법입니다. 데이터 블록 1을 사용할 수 있는 경우 시스템은 단순히 데이터 블록을 읽습니다. 데이터 블록 2의 경우도 마찬가지입니다. 그러나 데이터 블록 1이 누락된 경우 삭제 코딩 시스템은 데이터 블록 2와 패리티 블록을 읽고 데이터 블록 1의 값을 재구성합니다.

마찬가지로 데이터 블록 2가 장애가 발생한 디스크에 있으면 시스템은 데이터 블록 1과 패리티 블록을 읽습니다. SBS는 시스템이 블록에서 동시에 읽을 수 있도록 항상 블록이 다른 스핀들에 있는지 확인합니다.

3,2 인코딩의 효율성은 2/3(n/m) 또는 67%입니다. 미러링의 50% 효율성보다는 낫지만 3,2 인코딩은 여전히 ​​단일 디스크 오류에 대해서만 보호할 수 있습니다.

이레이저 코딩은 구성 가능한 데이터 보호 기능을 제공합니다.

Erasure Coding은 성능 최적화, 미디어 장애가 발생한 경우 복구 시간 최적화 또는 복원력 최적화(최대 XNUMX개의 장애가 발생한 디스크 또는 한 번에 XNUMX개의 장애가 발생한 노드)로 구성할 수 있습니다. 일반적으로 보호 기능이 향상되면 사용 가능한 용량이 줄어듭니다.

최소한 Qumulo는 6,4 인코딩을 사용합니다. 이 인코딩은 미러링과 동일한 공간에 세 번째 사용자 데이터를 추가로 저장하고 미러링이나 3,2에서와 같이 하나의 디스크 오류 대신 두 개의 디스크 오류를 허용하는 기능이 있습니다. 6,4 구성에서 사용자 데이터를 포함하는 두 개의 블록을 사용할 수 없는 경우에도 시스템은 누락된 데이터를 복구하기 위해 나머지 두 개의 데이터 블록과 두 개의 패리티 블록만 읽으면 됩니다.

이 모든 무엇을 의미합니까?

다른 파일 플랫폼과 같이 파일 수준이 아닌 블록 수준에서 작업하는 Qumulo Core 이레이저 코딩은 전체 데이터 볼륨의 1:1 복사본을 생성하지 않고도 데이터를 효과적으로 보호할 수 있을 뿐만 아니라 파일 크기를 의미합니다. 인코딩 및 복구 시간에 영향을 미치지 않습니다. 파일의 크기가 매머드이든 미니이든 상관없이 인코딩 및 복구 성능은 빠를 뿐만 아니라 신뢰할 수 있습니다.

다른 시스템은 클러스터에 저장된 파일 크기의 조합에 따라 이벤트에서 복구하는 데 몇 시간에서 며칠이 소요될 수 있습니다. Qumulo는 저장된 파일 데이터의 조합에 관계없이 성능에 영향을 주지 않고 빠르고 안정적으로 복구합니다. 또한 이를 통해 Qumulo 고객은 시장에서 가장 크고 경제적인 드라이브를 위험 없이 활용할 수 있습니다.

2부에서 자세히 알아보세요!

이레이저 코딩에 대한 2부작 시리즈의 다음 항목에서 설명합니다. 이레이저 코딩을 구현하는 방법 현대 디지털 시대를 위한 스토리지 시스템에서 대규모 확장성을 제공합니다.

편집자 주: 원래 3년 2021월 XNUMX일에 게시된 이 기사는 정확성과 포괄성을 위해 업데이트되었습니다.

관련 게시물

위쪽으로 스크롤