RAID: Redundant Array of Independent Disks
RAID es un método de combinación de varios discos duros para formar una única unidad lógica en la que se almacenan los datos de forma redundante. En este método, la información se reparte entre varios discos, usando técnicas como el entrelazado o la duplicación de discos para proporcionar redundancia, reducir el tiempo de acceso y/o obtener mayor ancho de banda para leer y/o escribir.
La tecnología RAID protege los datos; si se produce un fallo, mantiene el servidor activo. Los sistemas RAID suponen la pérdida de parte de la capacidad de almacenamiento para conseguir redundancia o almacenar los datos de paridad.
Ventajas de RAID
- Tolerancia a fallos: RAID protege contra la pérdida de datos.
- Mejora del Rendimiento/Velocidad: RAID permite a varias unidades trabajar en paralelo, lo que aumenta el rendimiento del sistema.
- Mayor Fiabilidad: RAID emplea dos técnicas para aumentar la fiabilidad:
- La redundancia de los datos implica el almacenamiento de los mismos datos en más de una unidad. Es muy eficaz, pero también es muy costoso.
- La paridad de datos se realiza mediante un algoritmo matemático. Es menos costoso que la redundancia, ya que no requiere el uso de un conjunto redundante de unidades de disco.
- Alta Disponibilidad: Se divide en dos aspectos:
- La integridad de los datos: capacidad de obtener los datos adecuados en cualquier momento. Reparación dinámica de sectores.
- La tolerancia a fallos: capacidad para mantener los datos disponibles en caso de que se produzcan uno o varios fallos en el sistema.
Niveles de RAID
La elección de los diferentes niveles de RAID depende de las necesidades del usuario, como el factor de seguridad, velocidad, capacidad, coste, etc.
Cada nivel de RAID ofrece una combinación específica de tolerancia a fallos (redundancia), rendimiento y coste, diseñados para satisfacer necesidades de almacenamiento. No hay un nivel de RAID mejor que otro; cada uno es apropiado para determinadas aplicaciones y entornos informáticos. Lo más frecuente es el uso de varios RAID para distintas aplicaciones del mismo servidor. Existen 6 niveles diferentes de RAID (0 al 6) más las posibles combinaciones (10, 50…).
RAID 0: Disk Striping
“La más alta transferencia, pero sin tolerancia a fallos.”
Conocido como separación o fraccionamiento.
Los datos se desglosan en pequeños segmentos y se distribuyen entre varias unidades. Este nivel de array o matriz no ofrece tolerancia al fallo.
El fallo de cualquier disco de la matriz es igual a la pérdida de los datos y sería necesario restaurarlos con copia de seguridad.
Consiste en una serie de unidades de disco conectadas en paralelo que permiten una transferencia simultánea de datos a todos ellos, con lo que se obtiene una gran velocidad en las operaciones de lectura y escritura. La velocidad de transferencia de datos aumenta en relación al número de discos que forman el conjunto.
Este array es aconsejable en aplicaciones de tratamiento de imágenes, vídeo, audio. Se necesita un mínimo de dos unidades de disco para implementar RAID 0.
RAID 1: Mirroring
“Redundancia. Igual de rápido, pero más seguro.”
Llamado duplicación (discos en espejo).
- Utiliza discos adicionales sobre los que se realiza una copia en todo momento de los datos que se están modificando.
- Ofrece disponibilidad de los datos mediante la redundancia total (se duplican todos los datos de una unidad en otra). Con esto se asegura la integridad de los datos y la tolerancia al fallo; en caso de avería, se seguirá trabajando con los discos no dañados.
- Se pueden leer los datos desde una unidad duplicada sin que se produzcan interrupciones (es costoso para los grandes sistemas).
- Soluciona las aplicaciones que requieren redundancia cuando hay solo dos unidades disponibles. Los servidores de archivos pequeños son un buen ejemplo.
- Se necesita un mínimo de dos unidades de disco para implementar RAID 1.
RAID 0+1
Es una excelente solución para cualquier uso que requiera gran rendimiento y tolerancia a fallos, pero no una gran capacidad.
- Se utiliza en entornos como servidores de aplicaciones que permiten a los usuarios acceder a una aplicación en el servidor y almacenar datos en sus discos duros locales, o como los servidores web.
RAID 5: Comprobación y Rapidez
“Seguridad y velocidad. Acceso independiente con paridad distribuida.”
Ofrece tolerancia al fallo, pero además, optimiza la capacidad del sistema permitiendo una utilización de hasta el 80% de la capacidad del conjunto de discos.
(Se consigue mediante el cálculo de información de paridad y su almacenamiento alternativo por bloques).
Si falla un disco, se puede recuperar la información en tiempo real, mediante operaciones de lógica, sin que el servidor deje de funcionar.
Para evitar el problema de cuello de botella, no asigna un disco específico a esta misión, sino que asigna un bloque alternativo de cada disco a esta misión de escritura.
Al distribuir la función de comprobación entre los discos, se disminuye el cuello de botella, proporcionando una velocidad equivalente a RAID 0.
RAID 5 es el nivel de RAID más eficaz y el de uso preferente para las aplicaciones de servidor básicas para la empresa.
Comparado con otros niveles RAID con tolerancia a fallos, RAID 5 ofrece la mejor relación rendimiento-coste en un entorno con varias unidades.
Es el indicado para trabajar con sistemas operativos MULTIUSUARIO. Se necesita un mínimo de tres unidades para implementar una solución RAID 5.
El resultado óptimo de capacidad se obtiene con 7 o más unidades.
Es la solución más económica por megabyte que ofrece la mejor relación de precio, rendimiento y disponibilidad para la mayoría de los servidores.
RAID 2: Acceso Paralelo con Discos Especializados
“Redundancia a través del código Hamming.” Adapta la técnica usada para detectar y corregir errores en memorias de estado sólido.
RAID 3: Acceso Síncrono con un Disco Dedicado a Paridad
Dedica un único disco al almacenamiento de información de paridad. Se necesita un mínimo de tres unidades para implementar RAID 3.
RAID 4: Comprobación
“Acceso Independiente con un Disco Dedicado a Paridad.”
Dedica un disco para guardar la información de paridad de los otros discos. Se necesita un mínimo de tres unidades para implementar RAID 4.
RAID 6: Acceso Independiente con Doble Paridad
Similar al 5, pero incluye un segundo esquema de paridad distribuido por los distintos discos.
Tolerancia extremadamente alta a los fallos y a las caídas de disco, ofreciendo dos niveles de redundancia.
El coste de implementación es mayor al de otros niveles.
Sistemas LVM: Logical Volume Management
La gestión de volúmenes lógicos proporciona una vista de alto nivel sobre el almacenamiento en un ordenador, en vez de la tradicional vista de discos y particiones.
Los volúmenes de almacenamiento bajo el control de LVM pueden ser redimensionados y movidos a voluntad.
Permite la administración en grupos definidos por el usuario, permitiendo al administrador del sistema tratar con volúmenes llamados “ventas” en vez de nombres de dispositivos físicos como “sda”.
Ventajas de LVM
- La necesidad de estimar cuánto espacio será necesario para el sistema, para los temporales o para los datos personales, puede ser un problema porque los usuarios optan por crear una partición que ocupe todo el disco.
- Aun habiendo estimado cuánto espacio se necesita para cada directorio, es bastante común que nos quedemos sin espacio en estas particiones.
- Cuando un nuevo disco se añade al sistema, no es necesario mover los datos de los usuarios (se añade un nuevo disco al grupo lógico).
- También se pueden migrar los datos de discos antiguos a otros nuevos.
Sistemas NAS: Network Attached Storage
Un NAS es un equipo de almacenamiento que no está conectado directamente a un computador, sino que se accede a ellos a través de la red LAN. Su propósito es el servicio especializado de ficheros.
El uso de dispositivos NAS permite separar en máquinas diferentes el servicio de gestión de los datos del servicio de almacenamiento de los mismos, y aprovechar las ventajas de este hecho.
Se compone de un sistema de almacenamiento al que cualquier equipo con los permisos adecuados puede acceder. El cliente se descargará los archivos del servidor y trabajará de manera local en su sistema de archivos.
El servidor NAS solo presta el servicio de acceso a ficheros, no realiza ninguna otra labor, por lo que tiene un hardware simple. Suelen tener una gran memoria RAM para proporcionar caché de disco. Utilizan sistemas operativos especializados, como FreeNAS.
Ventajas de NAS
- Permite compartir datos entre sistemas heterogéneos: Cualquier cliente conectado a la Red que utilice los protocolos estándares puede acceder a los ficheros almacenados en la NAS.
- Es un sistema de almacenamiento compartido de bajo precio, comparado con la alternativa SAN.
- Son dispositivos especializados, solo proporcionan el servicio de almacenamiento. Por lo que tienen un gran rendimiento, disponibilidad y fiabilidad.
- Son muy escalables, basta con ir conectando más dispositivos a la red.
- Son muy fáciles de usar y mantener gracias a su simplicidad.
- Facilitan la implantación de proyectos de gestión de copias de seguridad y de tolerancia a errores.
Desventajas de NAS
- Su rendimiento está directamente relacionado con el rendimiento de la red LAN.
- El rendimiento de las operaciones de E/S es menor, especialmente al trabajar con ficheros de gran tamaño.
- No es un medio de almacenamiento válido para todo tipo de aplicaciones, debido al uso de un protocolo de transferencia de ficheros.
- La capacidad de ampliación de los NAS es menor que los SAN.
Sistemas SAN: Storage Area Network
SAN es una tecnología de transferencia de datos desde y hacia discos duros. En una red SAN se utiliza la virtualización del espacio de almacenamiento, es decir, se abstrae la organización lógica del espacio de almacenamiento de su organización física. Todos los dispositivos de almacenamiento masivo de la organización se organizan como un solo bloque de espacio de almacenamiento. Este bloque se divide en particiones que se utilizan para diferentes usos.
Ventajas de SAN
- Rapidez: permite acceder a la información de forma rápida. Las conexiones a la red SAN son de alta velocidad gracias a la fibra óptica, pudiendo alcanzar los 4 GBps.
- Alcance: aprovecha las capacidades de la fibra óptica para poder tener conexiones de hasta 10 km sin routers.
- Control: se consigue una administración centralizada y homogénea. Se reasigna espacio de almacenamiento sin hacer modificaciones en las conexiones físicas. Permite modificar la ubicación física de los datos de forma transparente a los servidores.
- Libera a la red LAN de sobrecargas por tráfico de datos.
- Son escalables y muy flexibles.
Desventajas de SAN
- Utilización de los recursos poco eficaz: un servidor puede necesitar espacio libre de almacenamiento mientras que a otro le puede sobrar.
- Se genera redundancia de datos: se puede producir la copia innecesaria de un mismo archivo en varios servidores, por lo que se estaría ocupando espacio de forma innecesaria.
- Colapsos en la red LAN: durante los procesos de tratamiento masivo de datos, la red puede colapsarse.
- Dificultad de administración: los servidores deben saber en qué equipo NAS está el fichero que necesita.
