ZFS

¿Qué es RAID-Z??

¿Qué es RAID-Z??
Los sistemas de archivos son más antiguos que el propio UNIX. Y desde que comenzamos a digitalizar nuestras vidas en cintas, discos y SSD, una amenaza ha sido inminente. Eso es por falla de hardware. Los datos almacenados en discos suelen ser más caros que los propios discos y estos datos necesitan toda la redundancia que podamos reunir.

RAID-Z es una de las mejores herramientas que garantizaría que sus datos vivan lo más libres de errores posible incluso en la colección de discos más barata. Es parte de OpenZFS. Puede comprender los conceptos básicos de OpenZFS en este breve artículo si no ha oído hablar de él antes. Es un sistema de archivos de código abierto de grado empresarial disponible en Linux, FreeBSD, Mac OS X, SmartOS, Illumos y otros sistemas operativos importantes.

Pero primero ... ¿qué es RAID??

RAID significa Matriz redundante de discos independientes (económicos). Esto se refiere a la práctica de toda la industria de almacenar datos no solo en un disco, sino en varios discos, de modo que incluso cuando hay una falla en el disco, los datos se pueden reconstruir a partir de otros discos. La forma en que los datos se distribuyen entre los discos es diferente para los diferentes tipos de redundancias, por lo que se denominan RAID 0, RAID 1, etc. No vamos a tratar con ellos aquí. Nos centraríamos en un RAIDZ específico de OpenZFS.

RAID (y también RAID-Z) no es lo mismo que escribir copias de datos en un disco de respaldo. Cuando tiene dos o más discos configurados en RAID, los datos se escriben en ellos simultáneamente y todos los discos están activos y en línea. Esta es la razón por la que RAID es diferente de las copias de seguridad y, lo que es más importante, por qué RAID no sustituye a las copias de seguridad. Si todo su servidor se quema, entonces todos los discos en línea podrían ir con el servidor, pero las copias de seguridad le salvarán el día. Del mismo modo, si hay una falla en un solo disco y no se realizó una copia de seguridad de algo, porque no puede hacerlo todos los días, RAID puede ayudarlo a recuperar esa información.

Las copias de seguridad son copias periódicas de los datos relevantes y RAID es una redundancia en tiempo real. Hay varias formas en que los datos se almacenan en los sistemas RAID tradicionales, pero no entraremos en ellos aquí. Aquí, profundizaríamos en RAIDZ, que es una de las características más interesantes de OpenZFS.

Una última cosa antes de comenzar, el RAID tradicional a veces alienta el uso de dispositivos de hardware dedicados para hacer el RAID. Esto deja al sistema operativo y al sistema de archivos inconscientes de los mecanismos RAID que están en su lugar. Pero a menudo la tarjeta RAID (el hardware dedicado) en sí misma encuentra una falla que deja toda la matriz de discos esencialmente inútil.

Para evitar esto, siempre debe intentar usar OpenZFS sin ningún controlador RAID de hardware.

RAID-Z1, RAID-Z2, RAID-Z3

ZFS combina las tareas del administrador de volumen y los sistemas de archivos. Esto significa que puede especificar los nodos de dispositivo para sus discos mientras crea un nuevo grupo y ZFS los combinará en un grupo lógico y luego puede crear conjuntos de datos para diferentes usos como / home, / usr, etc., además de ese volumen.

La configuración de RAID-Z requeriría al menos 3 o más discos. No puedes usar menos de tres discos. El proveedor de almacenamiento puede ser algo más, también almacenamiento conectado a la red, dispositivo de bloque virtual, etc., pero limítese a tres discos de tamaños iguales como un ejemplo simple.

Los tres discos se pueden combinar en un dispositivo virtual (vdev). Este es el bloque de construcción de un zpool. Si está comenzando con solo 3 discos, tiene 1 vdev en su zpool. Puede tener 2 vdevs con 6 discos y así sucesivamente.

Suponga que tiene un archivo de 1 GB que desea almacenar en este grupo. RAID-Z lo divide en dos partes iguales de 512 MB y luego realiza una operación matemática entre ellas que genera una tercera parte de 512 MB (llamada bloque de paridad). Luego, los tres fragmentos se escriben en tres vdevs separados. Entonces el archivo termina tomando 1.5GB de espacio en total.

Sin embargo, la ventaja es que, si uno de los discos falla, digamos que se pierde el primer fragmento, entonces el segundo fragmento y el bloque de paridad se pueden usar para recrear el primero. De manera similar, si se pierde el segundo fragmento, el primero y el tercero se pueden usar para recrear el segundo.

Sus archivos utilizan un 50% más de espacio del necesario, pero puede soportar la falla de un disco por vdev. Esto es RAID-Z1.

Pero un grupo de ZFS puede crecer y eventualmente necesitará más espacio. Bueno, no puede agregar más discos directamente a un vdev (esa característica se propone y podría estar en desarrollo en este momento). Sin embargo, puede agregar un vdev. Esto significa que puede agregar discos en conjuntos de tres y tratar cada nuevo conjunto como un único vdev lógico.

Ahora puede tolerar una falla de un solo disco en este nuevo vdev y una falla de un solo disco en el anterior. Pero si falla más de un disco dentro de un solo vdev, eso no es recuperable. Todo su grupo se vuelve inútil incluso los vdevs más saludables.

Este es un modelo realmente simplificado. Los archivos nunca se dividen exactamente en mitades, pero los datos se tratan como bloques de longitudes fijas. Además, puede usar más de 3 discos (pero 3 es el mínimo) por vdev y RAID-Z1 se asegurará de que cada bloque de datos único se escriba de manera que pueda recuperarse de la falla de cualquier disco en cada vdev. Afortunadamente, no tiene que preocuparse por estos detalles internos. Esa es la responsabilidad de ZFS. Una vez que el grupo está configurado, los datos se distribuyen automáticamente a través de él de la manera más óptima.

La tolerancia a fallas aún está limitada a una falla de disco por vdev. Para ir más allá, tenemos que ir a RAID-Z2. RAID-Z2 funciona de manera similar, pero crea dos bloques de paridad y dos bloques de datos a partir de una única información. Esto le permite soportar hasta 2 fallas de disco por vdev. Además, un vdev debe tener al menos 4 discos si va a implementar una configuración RAID-Z2.

Del mismo modo, RAID-Z3 requiere al menos 5 discos por vdev y puede soportar la falla de 3 de ellos. RAID-Z3 no es tan eficiente en espacio como RAID-Z2, que no es tan eficiente en términos de espacio como RAID-Z1.

Conclusión

Con RAID-Z vemos una compensación entre el espacio utilizable que ofrecen los discos individuales y la confiabilidad que la colección de dichos discos puede ofrecer. Con una mayor cantidad de discos, la probabilidad de que varios discos fallen simultáneamente también aumenta.

La mejor manera de contrarrestarlo es utilizando una estrategia RAID-Z efectiva que ofrezca confiabilidad y el mejor rendimiento por su inversión. Háganos saber si este tutorial le resultó útil o si tiene alguna pregunta con respecto a RAID-Z!

Emule los clics del mouse colocando el mouse con Clickless Mouse en Windows 10
El uso excesivo de un mouse o teclado en una postura incorrecta puede provocar muchos problemas de salud, como tensión, síndrome del túnel carpiano y ...
Agregue gestos del mouse a Windows 10 con estas herramientas gratuitas
En los últimos años, las computadoras y los sistemas operativos han evolucionado enormemente. Hubo un momento en que los usuarios tenían que usar coma...
Controle y administre el movimiento del mouse entre múltiples monitores en Windows 10
Administrador de mouse de doble pantalla le permite controlar y configurar el movimiento del mouse entre varios monitores, al ralentizar sus movimient...