Azure Native Qumulo ahora disponible en la UE, el Reino Unido y Canadá: Más información

Explicación de la codificación de borrado frente a RAID: métodos de protección de datos

Escrito por:

La codificación de borrado (EC) es uno de los métodos más conocidos para la protección de datos, debido en parte a su eficiencia, ya que hay más disco disponible para datos en comparación con RAID y estrategias de duplicación.

Una de las principales ventajas de la codificación de borrado es la flexibilidad que ofrece. Los administradores de TI pueden decidir cómo lograr el equilibrio adecuado entre el rendimiento y el tiempo de recuperación de fallas en los medios físicos y la cantidad de fallas simultáneas que necesitan que el sistema pueda soportar.

Codificación de borrado es más fácil de entender con ejemplos, que analizaremos con más detalle a continuación. Pero es posible que se esté preguntando algunas cosas, como ¿qué diablos es la codificación de borrado? ¿Cómo se compara con los esquemas de protección de datos RAID y espejo? ¿Y cuáles son las ventajas y desventajas de la codificación de borrado en comparación con otros métodos de protección de datos, como la creación de bandas RAID y la duplicación? Todas estas son preguntas importantes que aclararemos, poniendo a su empresa en la mejor posición para mantener sus datos seguros.

¿Qué es la codificación de borrado?

La codificación de borrado es un método de protección de datos de almacenamiento que aprovecha las matemáticas avanzadas para permitir que el software del sistema de archivos regenere los datos faltantes utilizando fragmentos de datos conocidos llamados bloques de paridad. Como explicaremos a continuación, la codificación de borrado ofrece una protección de datos superior a una copia espejo principalmente porque no requiere una segunda copia completa de los datos, pero puede restaurar cualquier parte faltante.

Borrado de codificación frente a RAID: pros y contras

Para ayudar a explicar cómo la codificación de borrado es superior a otros métodos de protección de datos, es útil comprender las diversas formas de protección de datos que existen, así como sus ventajas y desventajas.

Matriz redundante de discos económicos (RAID)

RAID existe desde hace mucho tiempo. La configuración de protección de datos más básica es RAID 1, también llamada Mirroring. Como sugiere su nombre, la duplicación implica la grabación de datos simultáneamente en dos (o más) unidades, haciendo así copias idénticas: imágenes duplicadas, por así decirlo.

En una configuración de duplicación RAID 1, debido a que cada copia reside en un disco separado, los datos se pueden recuperar de la 'imagen duplicada' en caso de que falle el disco principal de un conjunto. La duplicación es fácil de implementar, pero tiene algunas desventajas. Dado que la duplicación requiere al menos una copia completa de los datos, es un desperdicio en términos del espacio requerido para la protección de datos. Además, la duplicación solo puede manejar una falla de la unidad a la vez, lo que generalmente no es suficiente protección para muchos casos de uso, particularmente a medida que aumenta el tamaño de los clústeres.

Más allá de la duplicación, el estándar RAID ofrece otras configuraciones para optimizar el rendimiento, la protección o ambos. Una opción común es RAID 5 o bandas de disco con paridad que mejoran la eficiencia y el rendimiento de lectura en comparación con la duplicación. Sin embargo, estas configuraciones RAID más avanzadas pueden volverse extremadamente complejas y difíciles de administrar y mantener. Y, en caso de falla de un componente, los tiempos de reconstrucción con RAID pueden ser inaceptablemente lentos, lo que afecta significativamente el rendimiento de los usuarios.

Al considerar RAID para la protección de datos de almacenamiento, RAID no puede hacerlo todo y, a menudo, conduce a una elección difícil al crear configuraciones RAID: ¿Deben los administradores de TI elegir entre protección de datos sólida, rendimiento o mejor? eficiencia de almacenamiento? La respuesta es ellos quieres todo, pero RAID no puede entregar.

Codificación de borrado

La arquitectura de Qumulo Core se basa en Qumulo Tienda de bloques escalables (SBS), que es la capa base que permite una protección de datos eficiente basada en bloques con codificación de borrado.

La codificación de borrado es completamente diferente de RAID y resuelve las deficiencias de RAID. A diferencia de la creación de bandas o la duplicación de RAID, la codificación de borrado es una protección escalable para el almacenamiento masivo de datos, mucho más eficiente, más configurable y más eficiente en el espacio, lo que permite un crecimiento ilimitado de los clústeres mientras se mantiene la protección y la capacidad de respuesta de los datos completos.

La codificación de borrado utiliza matemáticas avanzadas (es decir, la fórmula de Reed-Solomon, en este caso) para permitir la regeneración de datos faltantes a partir de datos conocidos (bloques de paridad).

Entonces, a diferencia de la duplicación RAID que requiere una segunda copia completa, la codificación de borrado permite una mayor eficiencia, requiriendo solo un bloque de paridad por cada tres bloques de datos (llamado codificación 3,2).

Explicación de la codificación de borrado (ejemplos)

La codificación de borrado es más fácil de entender con ejemplos. Aquí está nuestro ejemplo de codificación 3,2:

 

En una codificación 3,2, tres bloques (m = 3) se distribuyen en tres dispositivos físicos distintos. Los bloques 1 y 2 contienen los datos del usuario que queremos proteger (n = 2) y el tercero se llama bloque de paridad. El contenido del bloque de paridad se calcula utilizando el algoritmo de codificación de borrado.

Dado que cada bloque se escribe en una unidad separada, cualquiera de las tres unidades podría fallar y la información almacenada en los bloques 1 y 2 aún está segura porque se puede volver a crear a partir del bloque de paridad.

Cómo funciona la codificación de borrado

Como solicitar su diseño gráfico Si el bloque de datos 1 está disponible, el sistema simplemente lo lee. Lo mismo ocurre con el bloque de datos 2. Sin embargo, si falta el bloque de datos 1, el sistema de codificación de borrado lee el bloque de datos 2, más el bloque de paridad, y reconstruye el valor del bloque de datos 1.

De manera similar, si el bloque de datos 2 reside en el disco averiado, el sistema lee el bloque de datos 1 y el bloque de paridad. SBS siempre se asegura de que los bloques estén en diferentes ejes para que el sistema pueda leer de los bloques simultáneamente.

Una codificación 3,2 tiene una eficiencia de 2/3 (n / m) o 67%. Si bien es mejor que la eficiencia del 50% de la duplicación, la codificación 3,2 todavía solo puede proteger contra una falla de un solo disco.

La codificación de borrado proporciona protección de datos configurable

La codificación de borrado se puede configurar para optimizar el rendimiento, optimizar el tiempo de recuperación en el caso de medios fallidos u optimizarse para una mayor resistencia, hasta cuatro discos fallidos o cuatro nodos fallidos a la vez. Generalmente, el aumento de la protección se realiza a costa de la capacidad utilizable.

Como mínimo, Qumulo utiliza la codificación 6,4, que almacena un tercio más de datos de usuario en la misma cantidad de espacio que la duplicación, y tiene la capacidad de tolerar dos fallas de disco en lugar de solo una como la duplicación o 3,2. En una configuración 6,4, incluso si dos bloques que contienen datos de usuario no están disponibles, el sistema solo necesita leer los dos bloques de datos restantes y los dos bloques de paridad para recuperar los datos faltantes.

¿Qué significa todo esto?

Trabajando a nivel de bloque en lugar de a nivel de archivo como otras plataformas de archivos, la codificación de borrado de Qumulo Core no solo hace posible proteger los datos de manera efectiva sin tener que crear una copia 1: 1 de todo el volumen de datos, sino que también significa el tamaño de los archivos. no tiene ningún impacto en los tiempos de codificación y recuperación. Ya sea que los archivos tengan un tamaño gigantesco o pequeño, el rendimiento de codificación y recuperación es más que rápido, también es confiable.

Otros sistemas pueden tardar de horas a días, o más en recuperarse de un evento, según la combinación de tamaños de archivos almacenados en el clúster. Qumulo se recupera de forma rápida y confiable sin afectar el rendimiento, independientemente de la combinación de datos de archivos almacenados. Esto también permite a los clientes de Qumulo la capacidad de aprovechar las unidades más grandes y económicas del mercado sin riesgo.

¡Aprenda más en la parte 2!

En la siguiente entrada de esta serie de dos partes sobre codificación de borrado, explicamos cómo implementar la codificación de borrado en sistemas de almacenamiento para la era digital moderna, con escalabilidad masiva.

Nota del editor: Publicado originalmente el 3 de noviembre de 2021, esta historia se ha actualizado para mayor precisión y exhaustividad.

Artículos Relacionados

Ir al Inicio