O RAID é uma tecnologia usada para aumentar o desempenho e / ou a confiabilidade do armazenamento de dados. A abreviatura significa Redundant Array of Inexpensive Disks . Um sistema RAID consiste em duas ou mais unidades trabalhando em paralelo. Estes discos podem ser discos rígidos, mas há uma tendência para também usar a tecnologia para SSD (drives de estado sólido). Existem diferentes níveis de RAID, cada um otimizado para uma situação específica. Estes não são padronizados por um grupo de indústria ou comitê de padronização. Isso explica por que as empresas às vezes vêm com seus próprios números únicos e implementações. Este artigo abrange os seguintes níveis de RAID:
- RAID 0-striping
- RAID 1-espelhamento
- RAID 5-distribuição com paridade
- RAID 6-distribuição com paridade dupla
- RAID 10-combinando espelhamento e striping
O software para executar a funcionalidade RAID e controlar as unidades pode ser localizado em uma placa controladora separada (um controlador RAID de hardware) ou pode ser simplesmente um driver. Algumas versões do Windows, como o Windows Server 2012, bem como o Mac OS X, incluem funcionalidade RAID de software. Controladores RAID de hardware custam mais do que software puro, mas também oferecem melhor desempenho, especialmente com RAID 5 e 6.
Sistemas RAID podem ser usados com várias interfaces, incluindo SCSI, IDE, SATA ou FC (canal de fibra). Existem sistemas que usam discos SATA internamente, mas que possuem uma interface FireWire ou SCSI para o sistema host.
Às vezes, os discos em um sistema de armazenamento são definidos como JBOD, que significa 'Just a Bunch Of Disks' . Isso significa que esses discos não usam um nível RAID específico e atuam como discos autônomos. Isso geralmente é feito para unidades que contêm arquivos de swap ou dados de spool.
Abaixo está uma visão geral dos níveis de RAID mais populares:
Nível de RAID 0 - Striping
Em um sistema RAID 0 os dados são divididos em blocos que são escritos em todas as unidades da matriz. Usando vários discos (pelo menos 2) ao mesmo tempo, isso oferece desempenho superior de I / O. Este desempenho pode ser melhorado ainda mais usando vários controladores, idealmente um controlador por disco.
Vantagens
- O RAID 0 oferece ótimo desempenho, tanto em operações de leitura quanto de gravação. Não há sobrecarga causada por controles de paridade.
- Toda a capacidade de armazenamento é usada, não há sobrecarga.
- A tecnologia é fácil de implementar.
Desvantagens
- O RAID 0 não é tolerante a falhas. Se uma unidade falhar, todos os dados na matriz RAID 0 serão perdidos. Não deve ser usado para sistemas de missão crítica.
Uso ideal
O RAID 0 é ideal para armazenamento não crítico de dados que precisam ser lidos / gravados em alta velocidade, como em uma estação de retoque de imagens ou edição de vídeo.
Se você quiser usar RAID 0 puramente para combinar a capacidade de armazenamento de unidades twee em um único volume, considere montar uma unidade no caminho da pasta da outra unidade. Isso é suportado no Linux, no OS X e no Windows e tem a vantagem de que uma única falha de unidade não tem impacto nos dados do segundo disco ou unidade SSD.
Nível RAID 1 - Espelhamento
Os dados são armazenados duas vezes, gravando-os tanto na unidade de dados (ou no conjunto de unidades de dados) quanto na unidade espelhada (ou conjunto de unidades). Se uma unidade falhar, o controlador usa a unidade de dados ou a unidade espelhada para recuperação de dados e continua a operação. Você precisa de pelo menos 2 unidades para uma matriz RAID 1.
Vantagens
- O RAID 1 oferece uma excelente velocidade de leitura e uma velocidade de gravação que é comparável à de uma única unidade.
- No caso de uma unidade falhar, os dados não precisam ser reconstruídos, eles só precisam ser copiados para a unidade de substituição.
- RAID 1 é uma tecnologia muito simples.
Desvantagens
- A principal desvantagem é que a capacidade de armazenamento eficaz é apenas metade da capacidade total da unidade porque todos os dados são escritos duas vezes.
- Soluções RAID 1 de software nem sempre permitem a troca a quente de uma unidade com falha. Isso significa que a unidade com falha só pode ser substituída após desligar o computador ao qual ele está conectado. Para servidores que são usados simultaneamente por muitas pessoas, isso pode não ser aceitável. Esses sistemas normalmente usam controladores de hardware que suportam hot swapping.
Uso ideal
O RAID-1 é ideal para armazenamento de missão crítica, por exemplo para sistemas de contabilidade. Também é adequado para pequenos servidores em que apenas serão usados dois drives de dados.
Nível RAID 5
RAID 5 é o nível RAID seguro mais comum. Ele requer pelo menos 3 unidades, mas pode trabalhar com até 16. Os blocos de dados são listrados através das unidades e em uma unidade uma soma de verificação de paridade de todos os dados do bloco é escrito. Os dados de paridade não são gravados em uma unidade fixa, eles são espalhados por todas as unidades, como mostra o desenho abaixo. Usando os dados de paridade, o computador pode recalcular os dados de um dos outros blocos de dados, caso esses dados não estejam mais disponíveis. Isso significa que uma matriz RAID 5 pode resistir a uma única falha de unidade sem perder dados ou acessar dados. Embora RAID 5 pode ser alcançado em software, um controlador de hardware é recomendado. Muitas vezes memória cache adicional é usada nesses controladores para melhorar o desempenho de gravação.
Vantagens
- As transações de dados de leitura são muito rápidas enquanto as transações de dados de gravação são um pouco mais lentas (devido à paridade que deve ser calculada).
- Se uma unidade falhar, você ainda terá acesso a todos os dados, mesmo quando a unidade com falha está sendo substituída eo controlador de armazenamento reconstrói os dados na nova unidade.
Desvantagens
- As falhas de unidade têm um efeito na taxa de transferência, embora isso ainda seja aceitável.
- Esta é uma tecnologia complexa. Se um dos discos em uma matriz usando discos 4TB falhar e for substituído, restaurar os dados (o tempo de reconstrução) pode levar um dia ou mais, dependendo da carga na matriz ea velocidade do controlador. Se outro disco ficar ruim durante esse tempo, os dados serão perdidos para sempre.
Uso ideal
RAID 5 é um bom sistema completo que combina armazenamento eficiente com excelente segurança e desempenho decente. É ideal para servidores de arquivos e aplicativos que possuem um número limitado de unidades de dados.
RAID nível 6 - Striping com paridade dupla
RAID 6 é como RAID 5, mas os dados de paridade são gravados em duas unidades. Isso significa que requer pelo menos 4 unidades e pode suportar 2 drives morrendo simultaneamente. As chances de que duas unidades quebram exatamente no mesmo momento são, naturalmente, muito pequenas. No entanto, se uma unidade de um sistema RAID 5 morrer e for substituída por uma nova, demora horas ou até mais do que um dia para reconstruir a unidade trocada. Se outra unidade morrer durante esse tempo, você ainda perderá todos os seus dados. Com o RAID 6, o array RAID ainda sobreviverá a essa segunda falha.
Vantagens
- Como com o RAID 5, as transações de dados de leitura são muito rápidas.
- Se duas unidades falharem, você ainda terá acesso a todos os dados, mesmo quando as unidades com falha estão sendo substituídas. Assim, o RAID 6 é mais seguro que o RAID 5.
Desvantagens
- As transações de dados de gravação são mais lentas que o RAID 5 devido aos dados de paridade adicionais que devem ser calculados. Em um relatório eu li o desempenho de gravação foi 20% menor.
- As falhas de unidade têm um efeito na taxa de transferência, embora isso ainda seja aceitável.
- Esta é uma tecnologia complexa. Reconstruir uma matriz em que uma unidade falhou pode demorar muito tempo.
Uso ideal
RAID 6 é um bom sistema completo que combina armazenamento eficiente com excelente segurança e desempenho decente. É preferível ao RAID 5 em servidores de arquivos e aplicativos que usam muitas unidades grandes para armazenamento de dados.
RAID nível 10 - combinando RAID 1 & RAID 0
É possível combinar as vantagens (e desvantagens) de RAID 0 e RAID 1 em um único sistema. Esta é uma configuração de RAID aninhada ou híbrida. Fornece segurança ao espelhar todos os dados em unidades secundárias ao usar o striping em cada conjunto de unidades para acelerar as transferências de dados.
Vantagens
- Se algo der errado com um dos discos em uma configuração RAID 10, o tempo de reconstrução é muito rápido, pois tudo o que é necessário é copiar todos os dados do espelho sobrevivente para uma nova unidade. Isso pode levar até 30 minutos para unidades de 1 TB.
Desvantagens
- Metade da capacidade de armazenamento vai para espelhamento, por isso em comparação com grande RAID 5 ou RAID 6 arrays, esta é uma maneira cara de ter redundância.
Nível de RAID 50 (RAID 5 + 0)
O RAID 50, também conhecido como RAID 5 + 0, combina a paridade distribuída ( RAID 5 ) com striping ( RAID 0 ). Requer um mínimo de seis unidades . Esse nível de RAID oferece melhor desempenho de gravação, maior proteção de dados e recriações mais rápidas do que o RAID 5. O desempenho não diminui tanto quanto em um array RAID 5, porque uma única falha afeta apenas um array. Até quatro falhas de unidade podem ser superadas, desde que cada unidade com falha ocorra em um array RAID 5 diferente.
E quanto aos níveis RAID 2, 3, 4 e 7?
Esses níveis existem, mas não são comuns (RAID 3 é essencialmente como RAID 5, mas com os dados de paridade sempre gravados na mesma unidade). Esta é apenas uma introdução simples aos sistemas RAID.
RAID não é substituto para back-up!
Todos os níveis de RAID exceto o RAID 0 oferecem proteção contra uma única falha de unidade. Um sistema RAID 6 ainda sobrevive a danificação de 2 discos simultaneamente. Para uma segurança completa, você ainda precisa fazer backup dos dados de um sistema RAID.
- Esse backup será útil se todas as unidades falharem simultaneamente por causa de um pico de energia.
- É uma salvaguarda quando o sistema de armazenamento é roubado.
- Os back-ups podem ser mantidos fora do local em um local diferente. Isso pode ser útil se um desastre natural ou incêndio destrói seu local de trabalho.
- O motivo mais importante para fazer backup de várias gerações de dados é o erro do usuário. Se alguém excluir acidentalmente alguns dados importantes e isso passar despercebido por várias horas, dias ou semanas, um bom conjunto de backups garante que você ainda pode recuperar esses arquivos