を検索
この検索ボックスを閉じます。

イレイジャーコーディングとRAIDの説明:データ保護の方法

作成者:

イレイジャーコーディング(EC)は、RAIDやミラーリング戦略と比較して、より多くのディスクをデータに使用できるため、その効率性もあり、データ保護の最もよく知られた方法のXNUMXつです。

イレイジャーコーディングの主な利点のXNUMXつは、それが提供する柔軟性です。 IT管​​理者は、物理メディア障害からのパフォーマンスと回復時間、およびシステムが耐えられるようにするために必要な同時障害の数の適切なバランスをとる方法を決定できます。

イレイジャーコーディング 例を使用すると最も理解しやすくなります。これについては、以下で詳しく説明します。 しかし、イレイジャーコーディングとは一体何なのかなど、いくつか疑問に思われるかもしれません。 RAIDおよびミラーリングデータ保護スキームと比較してどうですか? また、RAIDストライピングやミラーリングなどの他のデータ保護方法と比較したイレイジャーコーディングの長所と短所は何ですか? これらはすべて、データを安全に保つために企業を最適な位置に置くために、私たちが解決する重要な質問です。

イレイジャーコーディングとは何ですか?

Erasure Codingは、高度な数学を活用して、ファイルシステムソフトウェアが既知のデータと呼ばれる部分を使用して欠落データを再生成できるようにするストレージデータ保護方法です。 パリティブロック。 以下で説明するように、イレイジャーコーディングは、主にデータの完全なXNUMX番目のコピーを必要としないが、欠落している部分を復元できるため、ミラーコピーよりも優れたデータ保護を提供します。

イレイジャーコーディングとRAID:長所と短所

イレイジャーコーディングが他のデータ保護方法よりも優れていることを説明するために、さまざまな形式のデータ保護とその長所と短所を理解するのに役立ちます。

安価なディスクの冗長アレイ(RAID)

RAIDは長い間使用されてきました。 最も基本的なデータ保護構成は、ミラーリングとも呼ばれるRAID1です。 その名前が示すように、ミラーリングでは、データをXNUMXつ(またはそれ以上)のドライブに同時に記録し、それによって同一のコピー、いわばミラーイメージを作成します。

RAID 1ミラーリング構成では、各コピーが別々のディスクに存在するため、セット内のプライマリディスクに障害が発生した場合にデータを「ミラーイメージ」から回復できます。 ミラーリングは簡単に実装できますが、いくつかの欠点があります。 ミラーリングにはデータの完全なコピーが少なくともXNUMXつ必要であるため、データ保護に必要なスペースの点で無駄になります。 また、ミラーリングはXNUMXつしか処理できません ドライブ障害 一度に、特にクラスターサイズが大きくなると、多くのユースケースでは一般的に十分な保護にはなりません。

ミラーリング以外にも、RAID標準は、パフォーマンス、保護、またはその両方を最適化するための他の構成を提供します。 一般的なオプションは、RAID 5またはパリティ付きのディスクストライピングです。これにより、ミラーリングよりも効率と読み取りパフォーマンスが向上します。 ただし、これらのより高度なRAID構成は、非常に複雑になり、管理と保守が困難になる可能性があります。 また、コンポーネントに障害が発生した場合、RAIDを使用した再構築時間が許容できないほど遅くなる可能性があり、ユーザーのパフォーマンスに大きな影響を与えます。

ストレージデータ保護のためにRAIDを検討する場合、RAIDはそれをすべて行うことはできず、RAID構成を構築する際に難しい選択につながることがよくあります。IT管理者は強力なデータ保護、パフォーマンス、またはそれ以上のいずれかを選択する必要があります。 ストレージ効率? 答えは彼らです すべて欲しい、しかしRAIDは提供できません。

イレイジャーコーディング

QumuloコアアーキテクチャはQumuloを中心に構築されています スケーラブルブロックストア(SBS)、これは、イレイジャーコーディングによる効率的なブロックベースのデータ保護を可能にする基盤レイヤーです。

イレイジャーコーディングはRAIDとはまったく異なり、RAIDの欠点を解決します。 RAIDストライピングやミラーリングとは異なり、イレイジャーコーディングは、大容量データストレージのスケーラブルな保護であり、パフォーマンスがはるかに高く、構成可能で、スペース効率が高いため、完全なデータ保護と応答性を維持しながら、クラスターを無制限に拡張できます。

イレイジャーコーディングでは、高度な数学(この場合はリードソロモン公式)を使用して、既知のデータ(パリティブロック)から欠落データを再生できるようにします。

したがって、完全な3,2番目のコピーを必要とするRAIDミラーリングとは異なり、イレイジャーコーディングは効率を高め、XNUMXつのデータブロックごとにXNUMXつのパリティブロックのみを必要とします(XNUMXエンコーディングと呼ばれます)。

イレイジャーコーディングの説明(例)

イレイジャーコーディングは、例を使用すると最も理解しやすくなります。 これが3,2エンコーディングの例です。

 

3,2エンコーディングでは、3つのブロック(m = 1)が2つの異なる物理デバイスに分散されます。 ブロック2とXNUMXには、保護するユーザーデータ(n = XNUMX)が含まれ、XNUMX番目はパリティブロックと呼ばれます。 パリティブロックの内容は、イレイジャーコーディングアルゴリズムを使用して計算されます。

各ブロックは別々のドライブに書き込まれるため、1つのドライブのいずれかが故障する可能性があり、ブロック2とXNUMXに格納されている情報は、パリティブロックから再作成できるため、引き続き安全です。

イレイジャーコーディングのしくみ

これはどのように動作するのですか? データブロック1が使用可能な場合、システムはそれを読み取るだけです。 データブロック2についても同じことが言えます。ただし、データブロック1が欠落している場合、イレイジャーコーディングシステムはデータブロック2とパリティブロックを読み取り、データブロック1の値を再構築します。

同様に、データブロック2が障害のあるディスク上にある場合、システムはデータブロック1とパリティブロックを読み取ります。 SBSは、システムがブロックから同時に読み取ることができるように、ブロックが異なるスピンドル上にあることを常に確認します。

3,2エンコーディングの効率は2/3(n / m)、つまり67%です。 ミラーリングの50%の効率よりも優れていますが、3,2エンコーディングは単一のディスク障害からのみ保護できます。

イレイジャーコーディングは、構成可能なデータ保護を提供します

Erasure Codingは、パフォーマンスを最適化するように、メディアに障害が発生した場合のリカバリ時間に最適化するように、または復元力を高めるために最適化するように構成できます。 一般に、保護を強化すると、使用可能な容量が犠牲になります。

少なくとも、Qumuloは6,4エンコーディングを使用します。これは、ミラーリングと同じスペースに3,2分の6,4のユーザーデータを格納し、ミラーリングやXNUMXのようにXNUMXつだけではなく、XNUMXつのディスク障害に耐える機能を備えています。 XNUMX構成では、ユーザーデータを含むXNUMXつのブロックが使用できない場合でも、システムは残りのXNUMXつのデータブロックとXNUMXつのパリティブロックを読み取るだけで、欠落しているデータを回復できます。

これはすべて何を意味するのか?

Qumulo Coreのイレイジャーコーディングは、他のファイルプラットフォームのようにファイルレベルではなくブロックレベルで機能するため、データボリューム全体の1:1コピーを作成しなくてもデータを効果的に保護できるだけでなく、ファイルのサイズも意味します。エンコーディングとリカバリ時間には影響しません。 ファイルのサイズが巨大であろうとミニであろうと、エンコードとリカバリのパフォーマンスは高速であるだけでなく、信頼性もあります。

他のシステムは、クラスターに保存されているファイルサイズの組み合わせによっては、イベントからの回復に数時間から数日、またはそれ以上かかる場合があります。 Qumuloは、保存されているファイルデータの組み合わせに関係なく、パフォーマンスに影響を与えることなく、迅速かつ確実に回復します。 これにより、Qumuloのお客様は、市場で最大かつ最も経済的なドライブをリスクなしで活用できるようになります。

パート2で詳細をご覧ください!

イレイジャーコーディングに関するこの2部構成のシリーズの次のエントリでは、説明します イレイジャーコーディングを実装する方法 現代のデジタル時代のストレージシステムで、大規模なスケーラビリティを備えています。

編集者注:3年2021月XNUMX日に最初に公開されたこのストーリーは、正確さと包括性のために更新されました。

関連記事

上へスクロール