REDADA

Copia de seguridad vs RAID

Copia de seguridad vs RAID
Las copias de seguridad son una parte crucial de nuestra vida digital. Cada computadora, desde bases de datos gigantes hasta una sola computadora personal o dispositivo móvil, necesita una copia de seguridad. Un lugar donde los datos de usuario más relevantes se pueden almacenar durante mucho tiempo y también se almacenan de tal manera que se pueden recuperar en el momento de necesidad. Podemos establecer una distinción entre los datos de nuestro sistema en ejecución, llamémoslo datos en tiempo real, y el respaldado datos. Este último se almacena lejos del sistema actual que está utilizando los datos en vivo.

RAID, se ocupa de los datos en vivo, es un mecanismo con el que un sistema en ejecución combina varios discos en una sola entidad de almacenamiento. Luego, los datos se distribuyen en todos los discos de tal manera que puedan sobrevivir a la falla de al menos uno (o más) de los discos físicos. El tipo más simple de matriz RAID es RAID1, o duplicación. Aquí es donde copia (o duplica) los mismos datos en dos o más discos, de modo que si uno de los discos falla, los datos aún pueden sobrevivir y seguir utilizándose activamente. También hay otras configuraciones RAID, y las discutiremos a medida que avanzamos.

Acerca de RAID

RAID, o matriz redundante de discos económicos, es un mecanismo para almacenar datos en todos los discos. Existe una amplia "gama" de configuración RAID con la que puede ir, pero los dos mecanismos básicos en los que se basan son los siguientes:

1. Reflejo:

La duplicación implica que sus bloques de datos se copian, duplican, en varios discos. Si refleja sus datos en tres discos, puede sobrevivir hasta el fallo de dos discos en un momento dado, los discos fallidos se pueden reemplazar por otros nuevos sin mucha molestia. Del mismo modo, si copia datos en n + 1 discos, puede soportar hasta norte discos fallando. La desventaja de esto es que solo obtiene la capacidad de almacenamiento igual al disco más pequeño en su matriz RAID.

2. Paridad:

Un segundo enfoque es dividir sus datos en dos partes, utilizando los dos bloques de datos del usuario puede crear un tercer bloque de 'paridad'. Los tres bloques son todos del mismo tamaño y están distribuidos en diferentes dispositivos. Se necesitan un mínimo de tres dispositivos para que esta configuración funcione. Si alguno de los discos falla, puede recrear los bloques almacenados en ese disco usando los otros dos bloques. Por ejemplo, si se pierde el segundo bloque de usuario, el primer bloque y el bloque de paridad se pueden utilizar para calcular el segundo bloque de usuario. Si está interesado en cómo funciona esto, consulte esta maravillosa explicación.

Este método se puede mejorar aún más para tener 2 o incluso 3 bloques de paridad. Pero no se ven más de 3 bloques de paridad en la industria que a menudo. Si tiene un bloque de paridad, puede sobrevivir a una falla de disco. El bloque de dos paridades significa que puede soportar fallas de dos discos, etc.

Es más eficiente en términos de utilización del almacenamiento que la duplicación. Si tiene un bloque de paridad, solo necesita un 50% más de almacenamiento físico por cada dato de usuario real que está almacenando. Esto significa que para almacenar 1 GB de datos necesitará 1.5GB de almacenamiento (además hay una pequeña sobrecarga para los metadatos). Esto es mucho más eficiente que incluso el esquema de duplicación más eficiente en el que necesita al menos 2 GB de almacenamiento para duplicar 1 GB de datos entre dos discos.

La desventaja es que las operaciones de escritura aleatorias se ralentizarán, gracias al bit adicional de operación de cálculo y escritura asociado con el bloque de paridad. Además, la fiabilidad no es tan buena como la de un n + 1 discos reflejados donde puede prepararse para cualquier número arbitrario de discos que falle.

Las configuraciones RAID pueden ser tan complejas o tan simples como desee, puede combinar las estrategias de paridad y duplicación y modificarlas a gusto de su empresa. Hay controladores RAID dedicados a los que conecta sus discos físicos, y el sistema operativo ve un solo disco lógico como lo muestra el controlador. LSI es uno de esos proveedores de controladores RAID. También puede realizar RAID en el software OpenZFS es probablemente la mejor apuesta que tiene en ese sentido.

Un último tipo de RAID, que recibe una mención de honor es RAID 0. Técnicamente, no es un esquema RAID, porque no hay redundancia involucrada aquí. La idea detrás de RAID 0 es simplemente distribuir sus datos a través de múltiples dispositivos de almacenamiento sin alguna resiliencia contra fallas de disco. La ventaja es que obtiene mejoras de rendimiento al hacer esto. Si está escribiendo 1 GB de datos en un solo disco, el proceso es lento. El disco solo puede realizar un número limitado de operaciones de escritura por segundo y su sistema operativo tiene que esperar a que termine esa operación antes de que se envíen nuevos datos. Si distribuye el mismo 1 GB de datos en dos de estos discos, puede escribir (y leer) en ambos simultáneamente y obtener una mejora considerable del rendimiento.

Back Ups

El concepto de copias de seguridad es más importante que el de RAID. Una copia de seguridad, en el contexto de la gestión del almacenamiento, es una buena copia conocida de los datos, desde un momento determinado, desde la que puede restaurar archivos en su sistema principal cuando sea necesario. En términos de implementación, hay muchas soluciones alojadas en la nube y muchas fuera de línea que se pueden utilizar.

Tarsnap y Backblaze son mis servicios de respaldo administrados favoritos para casos de uso privados y comerciales. También puede incluir Google Drive, iCloud o Dropbox en esta definición de respaldo solución, pero están dirigidos más al mercado de consumo que a la empresa. Sin embargo, el principio subyacente sigue siendo el mismo. Cuando inicias sesión en un nuevo iPhone o iPad, todos los datos, tus contactos, fotos, biblioteca multimedia, etc., se sincronizan desde tu cuenta de iCloud sin problemas y, a medida que sigues usando tu dispositivo, los datos más nuevos se respaldan silenciosamente en la nube y tú no ' no tengo que preocuparme por eso.

Su solución de respaldo puede ser tan simple como copiar datos a un disco duro externo o usar rsync (o zfs send, si está usando OpenZFS) para generar periódicamente una copia de toda la información relevante. Esto podría incluir su carpeta Documentos, su base de datos, su repositorio de origen o incluso todo el sistema de archivos raíz en un zip plano o un tarball. Los criterios importantes que debe cumplir una buena solución de copia de seguridad son los siguientes:

  1. Las copias de seguridad deben realizarse con frecuencia: si realiza copias de seguridad de los datos todos los meses, en lugar de cada semana, corre el riesgo de perder hasta un mes de datos cuando ocurre un desastre.
  2. Sus copias de seguridad deben retroceder en el tiempo: el almacenamiento de la copia de seguridad es finito. A veces tienes que deshacerte de las copias de seguridad más antiguas. Cuanto más almacenamiento tenga, mejores serán sus copias de seguridad. Suponga que realiza una copia de seguridad de sus datos semanalmente, pero desecha las copias de seguridad de más de 2 semanas. Si un archivo se elimina accidentalmente y esto pasa desapercibido durante dos semanas, no tendrá forma de recuperarlo.
  3. Sus archivos deberían ser realmente restaurables: si nunca ha intentado recuperar sus datos de la copia de seguridad, no tiene una copia de seguridad. No debería tener que aprender a recuperar datos, en el momento crítico en el que sufrió una pérdida de datos. Planifique con anticipación y sepa cómo restaurar el sistema desde la última copia de seguridad válida conocida.
  4. Su copia de seguridad debe estar separada del sistema en ejecución: cuando ocurre un desastre y todos sus archivos en el servidor de producción se cifran, eliminan o corrompen, debe asegurarse de que no suceda lo mismo con su copia de seguridad. Una buena forma de garantizar esto es asegurarse de que su dispositivo de respaldo no esté 'conectado' a su entorno de producción, i.e, desconecte su disco duro USB, desmonte su sistema de archivos NFS cuando haya terminado de hacer una copia de seguridad. Al menos, no le dé al sistema de producción el privilegio de sobrescribir o modificar sus datos de respaldo. Hágalo de solo lectura.

Ahora que sabemos un poco sobre RAID y copia de seguridad, resaltemos algunas diferencias entre ellos.

Archivos y bloques

RAID siempre se ocupa de los bloques de datos, no de cómo el sistema de archivos presenta esos datos al usuario. Tanto el software como el hardware RAID tratan los datos como bloques de información, el tamaño de los bloques puede variar de 128 KiB a 1 MiB.

Las copias de seguridad, por otro lado, son mucho más flexibles. Por lo general, se realizan a nivel del sistema de archivos, aunque no existe una regla estricta y rápida para que este sea el caso. También son más granulares. Puede restaurar un solo archivo desde su copia de seguridad, si su solución es lo suficientemente flexible. Las matrices RAID no son copias de seguridad, son solo una forma de distribuir datos en varios discos. Si se elimina un archivo, todos sus bloques reflejados y bloques de paridad se liberan. Fin de la historia.

Casos de uso

Las copias de seguridad son para todos. El enfoque y el alcance pueden variar de un caso de uso personal a otro empresarial, pero todos los que tienen una vida digital necesitan respaldo. RAID es más una función empresarial / empresarial específica. Ve matrices RAID en servidores, dispositivos de almacenamiento como NAS y SAN, hipervisores en la nube, etc. Prácticamente cualquier lugar que almacene datos críticos en vivo utiliza alguna forma de RAID. Incluso los servidores que ejecutan sus copias de seguridad alojadas en la nube probablemente usan matrices RAID. Estas no son tecnologías mutuamente excluyentes.

Esto no significa que no pueda usar RAID para su caso de uso personal, solo tiene más utilidad en las empresas. Parte de la razón detrás de esto es que en la empresa, los discos se golpean con operaciones de E / S 24/7. En un entorno de producción, como el almacenamiento de una base de datos o un servicio de transmisión de video o un hipervisor en la nube, el dispositivo de almacenamiento de su servidor estará bajo una carga espantosa constante, los datos se leen y escriben constantemente en estos dispositivos y, a menudo, por varias aplicaciones simultáneamente. En estas condiciones, es mucho más probable que fallen las unidades. Tener una configuración RAID significa que si una unidad falla, sufre poco o ningún tiempo de inactividad. La mayoría de los servidores pueden seguir funcionando incluso después de una falla en el disco para que no pierda nueva información y solicitudes que llegan cada segundo.

Una computadora de escritorio promedio difícilmente puede recrear la misma condición estresante, incluso si el disco muere, si está utilizando una solución de respaldo como Backblaze, puede recuperar la mayoría de sus datos perdidos y perder algunas horas de trabajo es probablemente lo peor que puede pasar. Incluso esto se está convirtiendo en una rareza gracias a las soluciones alojadas en la nube como Adobe Creative Cloud, Office 365, etc.

RAID no sustituye a la copia de seguridad

Si hay una sola conclusión que desea de este artículo, debería ser esta. RAID NO sustituye a la copia de seguridad. Siempre haga una copia de seguridad de sus datos! Hay muchas personas que piensan que si tiene RAID, significa que los datos están seguros en varios discos y, por lo tanto, no es necesario realizar una copia de seguridad. Nada mas lejos de la verdad. RAID está destinado a tratar un solo problema específico: los discos fallan o devuelven datos erróneos. Tener RAID no lo protegerá de un millón de otras amenazas como las siguientes:

  1. Errores de usuario y eliminaciones accidentales
  2. Errores de la aplicación o del sistema operativo que causan una corrupción generalizada de los datos
  3. Ransomware u otro malware que cifra, elimina o corrompe sus datos
  4. Fallo de los propios controladores RAID

Los datos de su matriz RAID están activos. Si el sistema operativo, una aplicación (o un usuario) se vuelve loco y elimina algunos archivos aquí y allá, el archivo se eliminará en toda su matriz RAID. Tener una copia separada de sus datos, una copia de seguridad, es la única forma en que puede protegerse contra este tipo de situaciones.

Conclusión

Si está preocupado por sus datos, su primera preocupación debería ser la solución de respaldo. La mayoría de los usuarios de escritorio, excepto quizás los usuarios avanzados, deberían invertir más en una copia de seguridad confiable en lugar de jugar con RAID1, RAID5 o RAIDZ. Si desea construir su propio servidor de respaldo, debe pensar en una política de respaldo decente y un backend de almacenamiento confiable. Este artículo puede ser un buen punto de partida. Puede usar rsync o zfs send para realizar una copia periódica de sus datos en este backend.

Si está en la empresa y está considerando una solución RAID para almacenar todos sus datos en vivo. Considere el uso de OpenZFS, ofrece una solución muy flexible, desde la duplicación de n-discos hasta RAIDZ1 con un bloque de paridad hasta RAIDZ2 y RAIDZ3 con 2 y 3 bloques de paridad. Debe considerar mucho los requisitos de su aplicación antes de tomar una decisión. Existen compensaciones entre su rendimiento de lectura y escritura, la capacidad de recuperación y la eficiencia del almacenamiento. Sin embargo, le recomendaría que solo piense en RAID después de haber decidido una solución de copia de seguridad.

Tutorial de Battle for Wesnoth
The Battle for Wesnoth es uno de los juegos de estrategia de código abierto más populares que puedes jugar en este momento. Este juego no solo ha esta...
0 A.D. Tutorial
De los muchos juegos de estrategia que existen, 0 A.D. logra destacarse como un título completo y un juego táctico muy profundo a pesar de ser de códi...
Tutorial de Unity3D
Introducción a Unity 3D Unity 3D es un potente motor de desarrollo de juegos. Es multiplataforma, es decir, te permite crear juegos para dispositivos ...