Qué es RAID y sus Niveles 0, 1, 5, 6, 01, 10, 50 Explicados

Total
2
Shares
Qué Son RAID 0, 1, 5, 6, 01, 10, 50, 100 y Más
Qué Son RAID 0, 1, 5, 6, 01, 10, 50, 100 y Más

El almacenamiento de datos requiere un almacenamiento seguro, con un espacio de disco interno considerable y la capacidad de proteger cualquier información de daños o pérdidas accidentales. El RAID cumple con estos requisitos, y en las siguientes secciones se describirá el RAID con más detalle, esbozando sus principios de funcionamiento, las opciones disponibles en el diseño final, sus ventajas y algunos de sus inconvenientes.

La combinación de discos duros puede suponer una gran mejora de rendimiento o de seguridad para los datos almacenados. Dichas combinaciones de discos duros se denominan RAID.

Qué es un RAID

Es una tipología de configuración de múltiples discos duros que pueden trabajar de forma coordinada. El término RAID proviene del acrónimo inglés de: Redundant Array of Independent Disks.

Concepto de RAID
Concepto de RAID

Dentro de los sistemas RAID encontramos dos grandes grupos:

  • Espejo de discos (disk mirroring): Sistemas RAID que buscan la redundancia ante un posible fallo de uno de los discos duros
  • Stripping de discos (disk striping): Sistema RAID que no busca la redundancia, sino una alta velocidad de transferencia de datos

Para qué Sirve un RAID

Los usos de este tipo de agrupaciones suelen ser muy variados. Depende mucho de las necesidades de cada usuario, ya que tenemos configuraciones que mejoran la velocidad de transferencia de datos y otras de redundancia de datos. Algunas configuraciones RAID combinan estos dos elementos.

Servidor con matrices de disco duro
Servidor con matrices de disco duro

Actualmente hay configuraciones que ya no se utilizan tanto, como los RAID 0 (striping de discos) que están pensados para la velocidad de transferencia. Este tipo de configuración tuvo su apogeo con los discos duros mecánicos. Estos discos tenían la desventaja de ofrecer bajas velocidades de lectura y escritura. Lo que se hacía era combinar varias de estas unidades para mejorar el rendimiento.

Especialmente las configuraciones RAID se utilizan para «proteger» los datos de los discos duros. Algunas configuraciones ofrecen una simple copia de datos y otras configuraciones con paridad. Dependiendo de las necesidades, podemos elegir un tipo de configuración con redundancia de datos.

Tipos de Niveles RAID

Existen diferentes tipos de configuraciones dependiendo de las necesidades que tengas. Aquí explicaremos cada una de estas configuraciones. En todas ellas hay que tener en cuenta una cosa y es que los discos duros deben ser siempre de la misma capacidad. Si la capacidad es diferente, se tomará siempre la capacidad del más pequeño, dejando sin uso la capacidad restante del más grande.

RAID Nivel 0

«RAID 0» (striping de disco): Este nivel implica el proceso de dividir una matriz de datos en bloques individuales y luego distribuirlos a través de múltiples dispositivos de almacenamiento, como unidades de disco duro («HDD») o unidades de estado sólido («SSD»), combinados en un grupo agregado. Los bloques se asignan secuencialmente y contienen cada parte de los datos en una unidad independiente.

Ilustración de RAID Nivel 0
Ilustración de RAID Nivel 0

Dado que la división en franjas distribuye los datos entre más unidades físicas, varias unidades pueden acceder al contenido de un archivo, lo que da lugar a operaciones de escritura y lectura más rápidas, respectivamente. Sin embargo, a diferencia de los otros niveles, el RAID 0 no tiene paridad. A su vez, una división de discos sin datos de paridad no tiene redundancia ni tolerancia a fallos. Esto significa que si una unidad falla, todos los datos de la unidad se perderán.

A continuación, se indican los puntos clave que hay que recordar para el nivel 0 de RAID.

  • Mínimo 2 discos.
  • Excelente rendimiento (ya que los bloques se dividen en franjas).
  • No hay redundancia (ni espejo ni paridad).
  • No lo utilices para ningún sistema crítico.

«RAID 0» se utiliza mejor para el almacenamiento en el que la protección contra la pérdida de datos no es una preocupación, pero se requiere un soporte de lectura/escritura de alta velocidad.

El almacenamiento en caché de la transmisión de vídeo en directo y la edición de vídeo son los principales usos de RAID 0 debido a la necesidad de mayor velocidad y rendimiento. La separación de discos no redundantes también puede utilizarse para datos temporales o en situaciones en las que la copia maestra de los datos puede recuperarse fácilmente de otro dispositivo de almacenamiento.

RAID Nivel 1

La duplicación de discos, también conocida como «RAID 1«, consiste en colocar obligatoriamente los datos en dos o más discos formando una única matriz, con el contenido de las copias sincronizado. Sin embargo, no hay función de striping en esta variante de matriz de almacenamiento. La duplicación de discos es una buena opción para las aplicaciones de alto rendimiento y alta disponibilidad, como las responsables de las transacciones financieras, el envío y la recepción de correos electrónicos y el funcionamiento del sistema operativo. El mirroring funciona bien tanto con discos duros como con unidades de estado sólido.

Ilustración de RAID Nivel 1
Ilustración de RAID Nivel 1

Como cada unidad de la matriz está en condiciones de funcionar, los datos pueden leerse de ellas al mismo tiempo, lo que mejora enormemente el rendimiento de la lectura. Una matriz RAID 1 será totalmente funcional aunque sólo quede una unidad operativa. Las operaciones de escritura son más lentas, sin embargo, porque cada operación de escritura se realiza por separado para cada disco (en el caso de un array/matriz de dos discos se escribirá dos veces).

A continuación, se indican los puntos clave que hay que recordar para el nivel 1 de RAUD.

  • Mínimo 2 discos.
  • Buen rendimiento (sin striping. sin paridad).
  • Excelente redundancia (ya que los bloques se duplican).

La duplicación de discos es particularmente útil para los escenarios de recuperación de desastres, ya que proporciona una recuperación instantánea de los datos necesarios, para las aplicaciones de misión crítica, inmediatamente después de un fallo del disco.

Si los discos primarios de la matriz se dañan o quedan inutilizables, se producirá un cambio a los discos secundarios o a los discos de respaldo en espejo con copias funcionales, y el funcionamiento de las aplicaciones que acceden a los datos en demanda no se verá interrumpido.

RAID Nivel 2

Esta configuración de almacenamiento de datos utiliza la separación de discos, además de que se asignan algunos discos individuales que almacenan información de comprobación y corrección de errores («ECC«). Este código de corrección de errores permite analizar los datos leídos o transmitidos y, si es necesario, corregirlos directamente durante el proceso de transferencia.

Ilustración de RAID Nivel 2
Ilustración de RAID Nivel 2

«RAID 2» también utiliza un código Hemming de paridad dedicado para detectar y corregir errores. Pero como los discos duros modernos también utilizan un código Hemming autocontrolado, el «RAID 2» se considera ahora obsoleto. Además, cabe destacar que el «RAID 2» no tiene ninguna ventaja sobre la siguiente opción de matriz de discos, el «RAID 3», por lo que ya no se utiliza.

RAID Nivel 3

Este formato de organización de matrices de discos unificadas utiliza el striping y asigna un disco, del conjunto de unidades disponibles, para almacenar la información de paridad, que se encarga de comprobar la integridad determinando si los datos se han perdido o sobrescrito cuando se trasladan directamente de una ubicación de almacenamiento a otra o cuando se transfieren entre ordenadores. La información «ECC» incrustada se utiliza para detectar errores y la recuperación de datos se realiza calculando la información exclusiva registrada en otros discos.

Ilustración de RAID Nivel 3
Ilustración de RAID Nivel 3

Como la información de paridad reside en una unidad individual y la operación de E/S accede a todas las unidades simultáneamente, RAID 3 no funciona correctamente cuando se realizan numerosas peticiones de datos pequeños. Por este motivo, esta matriz es la más adecuada para los sistemas de un solo usuario con largas transferencias de datos secuenciales, como el procesamiento y la transferencia de medios de transmisión, gráficos o la realización de operaciones de edición de vídeo.

RAID Nivel 4

Esta configuración RAID utiliza una unidad de paridad dedicada y un striping a nivel de bloque entre varias unidades, lo que permite a los usuarios realizar operaciones de lectura y escritura desde cualquier unidad. Sin embargo, como todas las escrituras deben ir a una unidad de paridad dedicada, el rendimiento de este proceso se reduce considerablemente.

Ilustración RAID Nivel 4
Ilustración RAID Nivel 4

El RAID 4, así como el RAID 3 y el RAID 2 introducidos anteriormente, no se utilizan habitualmente en los sistemas modernos.

RAID Nivel 5

La configuración de la matriz redundante de discos independientes en este formato se basa en el principio de striping a nivel de bloques de paridad. Los datos y la información de paridad se distribuyen uniformemente entre todas las unidades, lo que supone reducir la vulnerabilidad crítica de una unidad de almacenamiento individual en una unión organizada y permite que una matriz RAID 5 funcione incluso en caso de fallo de una sola unidad, e incluso que se recuperen mediante la intercalación de datos perdidos del dispositivo problemático. En el «RAID 5» la información de paridad se almacena en diagonal en todos los discos de la matriz. Si una unidad falla, los datos brutos se calculan basándose en la información de paridad que queda en los restantes dispositivos de almacenamiento válidos del conjunto.

Las ventajas de RAID 5 residen principalmente en el uso combinado de la separación de unidades y la paridad, que permite un aumento significativo del rendimiento y la productividad junto con un alto nivel de fiabilidad.

Ilustración de RAID Nivel 5
Ilustración de RAID Nivel 5

La arquitectura RAID 5 permite que las operaciones de lectura y escritura se realicen de manera uniforme y equilibrada en varios discos, y este tipo de matriz es actualmente uno de los formatos de organización RAID más utilizados. Proporciona más almacenamiento utilizable que las configuraciones RAID 1 y RAID 10, y ofrece un nivel de rendimiento equivalente al de RAID 0. Los grupos RAID 5 tienen un mínimo de tres discos duros («HDDs»), pero a menudo, por razones de eficiencia, se recomienda un mínimo de cinco HDDs. Como los datos de paridad se distribuyen entre todas las unidades, el RAID 5 se considera una de las configuraciones RAID más seguras.

A continuación, se indican los puntos clave que hay que recordar para el nivel RAID 5.

  • Mínimo 3 discos.
  • Buen rendimiento ( ya que los bloques están rayados ).
  • Buena redundancia (paridad distribuida).
  • Es la opción más rentable que proporciona tanto rendimiento como redundancia. Utilízalo para una base de datos muy orientada a la lectura. Las operaciones de escritura serán lentas.

Las matrices RAID 5 se consideran generalmente una mala opción para su uso en sistemas de escritura intensiva debido al impacto en el rendimiento asociado a la escritura de datos de paridad. Cuando un disco falla, reconstruir una matriz RAID 5 puede llevar bastante tiempo.

RAID Nivel 6

Este formato organizativo de espacio de disco agrupado, también conocido como «RAID con doble paridad», es muy similar a la capa anterior «RAID 5», pero incluye además un segundo esquema de paridad distribuido en diagonal por los discos de la matriz. RAID 6 es uno de los diversos esquemas RAID que funciona colocando los datos en varios discos y permitiendo que las operaciones de E/S («I/O») se solapen de forma equilibrada. El uso de la paridad adicional permite que la matriz siga funcionando incluso si dos discos fallan al mismo tiempo. Sin embargo, el mayor nivel de seguridad tiene un impacto a la baja en el rendimiento de la matriz, que es menor que en un formato de almacenamiento «RAID 5».

Ilustración de RAID Nivel 6
Ilustración de RAID Nivel 6

La matriz de discos redundantes «RAID 6» proporciona una tolerancia a fallos muy alta y puede utilizarse en entornos que requieren largos periodos de almacenamiento de datos, como el archivado.

Combinación de Niveles RAID

Algunos niveles RAID se clasifican como niveles RAID combinados. Estos patrones de organización y diseño de los dispositivos de almacenamiento en un mismo formato de matriz representan una combinación variada de los niveles básicos de RAID ya existentes. Veremos varios ejemplos de matrices combinadas comunes y populares.

«RAID 10» («RAID 1 + 0»)

«RAID 10», también conocido como «RAID 1 + 0», es una configuración «RAID» que combina la duplicación de discos y la separación de discos para proteger los datos. Se requiere un mínimo de cuatro discos, alternando los datos en los pares de espejos. Mientras uno de los discos de cada par de espejos funcione, los datos pueden recuperarse. Si dos discos de un par de espejos fallan, todos los datos se perderán debido a la falta de paridad en los conjuntos alternativos.

La configuración «RAID 1» sólo protegerá los datos copiando todos los datos de un disco a otro. Los datos están totalmente protegidos, ya que se dispone de una copia en espejo si la unidad original se desactiva o se daña. Como los datos están completamente duplicados, el RAID 1 requiere el doble de capacidad que los datos originales. «RAID 0» no proporciona ninguna protección de datos y su único propósito principal es mejorar el rendimiento. Esto se consigue distribuyendo los datos entre dos o más unidades, de modo que varios cabezales de lectura/escritura de las unidades puedan escribir o acceder a partes de los datos simultáneamente, acelerando así el procesamiento general.

Ilustración de RAID 10
Ilustración de RAID 10

A continuación, se indican los puntos clave que hay que recordar para el nivel 10 de RAID.

  • Un mínimo de 4 discos.
  • También se denomina «stripe of mirrors«.
  • Excelente redundancia (ya que los bloques se duplican)
  • Excelente rendimiento (ya que los bloques se dividen en franjas)
  • Si puede permitirse el lujo de pagar, esta es la MEJOR opción para cualquier aplicación de misión crítica (especialmente las bases de datos).

RAID 10 proporciona redundancia de datos y mayor productividad, y es claramente una buena opción para las aplicaciones de E/S con gran cantidad de datos, como el correo electrónico, el almacenamiento remoto y las bases de datos, las operaciones que requieren un alto rendimiento del disco y las organizaciones que no pueden permitirse un tiempo de inactividad.

El alto rendimiento del RAID 10, con su capacidad para acelerar las operaciones de escritura y lectura, lo hace adecuado para los servidores de bases de datos de uso frecuente y de misión crítica. Sin embargo, el requisito mínimo de cuatro discos hace que el RAID 10 sea una opción cara para los entornos informáticos pequeños, ya que implica una sobrecarga de almacenamiento del cien por cien, lo que puede resultar demasiado costoso para las pequeñas empresas o para el uso personal.

«RAID 01» («RAID 0 + 1»)

El formato combinado RAID 0 + 1 es similar al RAID 1 + 0, salvo que este método de organización de datos tiene una diferencia clave. En lugar de alternar matrices en espejo, el nivel agregado de RAID 0 + 1 crea una matriz RAID 1 formada por dos matrices RAID 0 anidadas. Este formato de presentación supone que se utiliza un número par de discos. El nivel general de productividad e, inherente a las características de la matriz, la eficiencia de la combinación de dispositivos de almacenamiento de «RAID 01» en comparación con el ejemplo de «RAID 10» es casi idéntica con los mismos parámetros, pero la tolerancia a fallos de la opción «RAID 01» es algo menor, por lo que este tipo de matriz prácticamente no se utiliza.

«RAID 03» («RAID 0 + 3», también conocido como «RAID 53» o «RAID 5 + 3»)

La capa de matriz de discos combinada que se presenta utiliza el striping (al estilo del nivel base «RAID 0») para los bloques de discos virtuales en un formato constructivo «RAID 3». Este método de organización agregada proporciona un mejor rendimiento que una matriz «RAID 3», pero tiene un impacto significativo en el coste final al alza.

«RAID 50» (también conocido como RAID 5 + 0)

Esta configuración combina la paridad distribuida «RAID 5» con el striping «RAID 0» para mejorar el rendimiento de la variante RAID 5 en cuestión sin comprometer la protección de los datos. Estructuralmente, la arquitectura de la matriz requiere un mínimo de seis discos para una funcionalidad completa. El orden de espacio en disco agregado basado en RAID 50 ofrece un rendimiento de escritura significativamente mejor, una mayor protección de los datos y una recuperación más rápida que el nivel base de RAID 5.

La productividad y la eficiencia general no se degradan tan drásticamente como con el «RAID 5» porque un solo fallo afecta sólo a una matriz. En conjunto, se pueden superar hasta cuatro fallos de unidad si cada unidad que falla está en una matriz RAID 5 independiente. La desventaja del «RAID 50» es sólo el hecho de que la matriz necesita un controlador sofisticado. El mejor uso de RAID 50 es para aplicaciones que requieren alta fiabilidad.

Niveles RAID no Estándar

La principal característica que distingue a estos niveles RAID de los tipos básicos de RAID es, por supuesto, su desarrollo directo, por parte de empresas u organizaciones individuales, y el posterior uso de la configuración única de RAID, que es propiedad de los creadores, para fines de propiedad. A continuación, presentamos algunos ejemplos de ello.

RAID 7

Un nivel RAID no estándar cuya marca es propiedad de Storage Computer Corporation. El RAID se basa estructuralmente en los niveles básicos de RAID 3 y RAID 4 con la adición de una operación de caché. RAID 7 incorpora un sistema operativo en tiempo real integrado como controlador responsable de ejecutar el código para realizar las funciones integradas, el almacenamiento en caché del bus de alta velocidad utilizando la memoria RAM y otras características para controlar el acceso al disco y el flujo de datos.

RAID Adaptativo

Esta variante de la configuración RAID da prioridad al «controlador RAID» para determinar el orden de paridad de los discos. La decisión se basará en una comparación de los dos niveles de «RAID 3» y «RAID 5», y dependerá directamente de qué tipo de «conjunto RAID» funcionará mejor con el tipo de datos que se escriben en las unidades.

Linux MD RAID 10

La capa propuesta proporcionada por el kernel «Linux» soporta la creación de «matrices RAID» combinadas y no estándar y permite la gestión de «dispositivos RAID» utilizando la funcionalidad de la aplicación apropiada. El software «RAID» para «Linux» también puede soportar la creación de configuraciones estándar como «RAID 0», «RAID 1», «RAID 4», «RAID 5» y «RAID 6».

Ventajas de RAID

No hay duda de que la tecnología RAID ofrece una serie de ventajas, y las enumeraremos todas a continuación.

  • Mayor eficiencia económica debido a que se utilizan grandes cantidades de discos duros de bajo coste.
  • El uso combinado de varias unidades de disco duro permite que RAID aumente el rendimiento de cada uno de los elementos de la matriz final.
  • Aumenta la velocidad y la fiabilidad del ordenador y protege los datos tras el fallo de uno de los elementos del disco de una «matriz de almacenamiento RAID», según la configuración.
  • Las operaciones de lectura y escritura de datos mediante una matriz RAID 0 pueden realizarse mucho más rápido que en una sola unidad de disco duro. El aumento de la velocidad y del rendimiento se consigue gracias al diseño de la matriz, que permite distribuir y compartir los bloques de datos de manera uniforme entre las unidades.
  • La disponibilidad, en forma de una mayor tolerancia a los fallos y a las averías, aumenta cuando se utiliza RAID 5.
  • La función de duplicación permite que la matriz RAID tenga una copia completamente idéntica de los datos originales en una unidad separada y garantiza que una unidad seguirá funcionando si la otra falla o se daña irremediablemente.
Ventajas de uso de RAID
Ventajas de uso de RAID

Desventajas del Uso de «RAID»

Aunque hay muchas ventajas realmente necesarias e importantes, también hay algunas desventajas en las matrices RAID. Algunas de ellas se presentan en la siguiente lista ordenada.

  • Los niveles RAID combinados son más caros de implementar que los niveles RAID básicos tradicionales, ya que requieren un mayor número de discos.
  • El coste por unidad de almacenamiento (gigabyte) de la variante matriz-RAID es mayor porque se utilizan muchas unidades para la redundancia.
  • Cuando una unidad falla, la probabilidad de que otra unidad de la matriz también falle pronto aumenta, lo que puede provocar una pérdida de datos importante. Esto implica que todas las unidades de una «matriz RAID» suelen montarse al mismo tiempo, pertenecen al mismo lote y tienen las mismas características funcionales, por lo que están sometidas al mismo desgaste y tienen el mismo tiempo de actividad y de funcionamiento.
  • Algunos niveles «RAID» (como el «RAID 1» y el «RAID 5») pueden soportar el fallo de una sola unidad.
  • Las matrices RAID y los datos ubicados en ellas se encuentran en un estado vulnerable hasta que se sustituya la unidad que ha fallado y se llene la nueva unidad con el contenido de información adecuado.
  • Si se produce un fallo en la unidad, es posible que las unidades restantes de la matriz contengan sectores corruptos o datos ilegibles, lo que podría llevar a una mayor incapacidad para recuperar completamente la información perdida.

A pesar de los posibles inconvenientes, los niveles RAID combinados solucionan estos problemas proporcionando un alto grado de redundancia, lo que reduce significativamente la posibilidad de que se produzcan fallos en el nivel de la matriz debido a fallos simultáneos de las unidades.

Historia del RAID

El término «RAID» fue acuñado y creado en 1987 por David A. Patterson, Randy H. Katz y Garth A. Gibson. En su informe técnico de 1988, «A Case for Redundant Arrays of Inexpensive Disks (RAID)«, sostenían que un conjunto de unidades de disco de bajo coste puede superar a las mejores unidades de su época, y superar significativamente a las más caras en términos de capacidad, velocidad y estabilidad. Y utilizando la redundancia, una «matriz RAID» podría ser más fiable que cualquier otra unidad.

En su momento, este informe fue la primera prueba en la que se mencionó oficialmente el nombre común del concepto «RAID». Sin embargo, el uso de discos redundantes ya había sido discutido por otros. Gus Herman y Ted Grunau de Geac Computer Corporation mencionaron por primera vez la idea y la presentaron como «MF-100». Norman Ken Ouchi, de IBM, presentó una patente en 1977 para una tecnología que posteriormente se denominó RAID 4. En 1983 Digital Equipment Corporation introdujo las unidades que más tarde se denominarían RAID 1 y en 1986 se registró otra patente de IBM para lo que se convertiría en RAID 5. Petterson, Katz y Gibson también exploraron lo que ofrecían empresas como Tandem Computers, Thinking Machines y Maxstor para definir el concepto y los parámetros de la especificación «RAID».

Aunque las capas «RAID» enumeradas en el informe de 1988 nombran esencialmente tecnologías que ya están en uso, la creación de una terminología común para el concepto ha ayudado a estimular el mercado de almacenamiento para desarrollar más productos «RAID».

Conclusión

El volumen de datos que utilizan habitualmente los usuarios no deja de aumentar y requiere un almacenamiento seguro y fiable con acceso directo e instantáneo a la información que se necesita.

La tecnología RAID, que combina varias unidades de disco físicas en una sola unidad lógica, proporciona altos niveles de tolerancia a fallos, rendimiento y seguridad para los datos allí ubicados.

La tecnología RAID está evolucionando rápidamente con nuevos diseños de matrices de discos listos para usar, cada uno con sus propias ventajas y desventajas y diseñados para encajar en ciertas áreas de aplicación de alta prioridad.

Con la información de esta guía, los usuarios podrán entender el concepto de matrices de discos redundantes, conocer la variedad de niveles «RAID» disponibles y determinar por sí mismos el diseño RAID final más adecuado en función de sus necesidades personales y de las opciones disponibles.

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *

Este sitio usa Akismet para reducir el spam. Aprende cómo se procesan los datos de tus comentarios.


[mailpoet_form id="2"]
You May Also Like