Índice:
- O que é NAS de controladora dupla?
- Como as controladoras gerenciam o mesmo storage?
- Qual a diferença entre active-active e active-passive?
- O que acontece quando uma controladora falha?
- O foco é desempenho ou alta disponibilidade?
- Quais cenários justificam o investimento?
- Compatibilidade de hardware: o que considerar?
- Essa tecnologia vale a pena fora do ambiente enterprise?
- Redundância e failover substituem o backup?
Muitas empresas paralisam suas operações por uma falha inesperada em seus sistemas computacionais. Esse único ponto vulnerável pode causar perdas financeiras e também arranhar a reputação da marca.
A indisponibilidade de dados críticos interrompe faturamento, afeta a produtividade das equipes e até mesmo a experiência dos clientes. Um servidor de armazenamento comum simplesmente não foi projetado para suportar falhas em seus componentes principais.
Assim, garantir a continuidade dos serviços se torna um desafio constante para qualquer gestor de TI, que precisa de uma arquitetura resiliente.
O que é NAS de controladora dupla?
NAS de controladora dupla é um sistema de armazenamento que possui dois módulos de processamento independentes. Cada módulo, conhecido como controladora, contém seu próprio processador, memória RAM e portas de rede. Essa arquitetura foi projetada para eliminar a controladora como um ponto único de falha, um dos componentes mais críticos em qualquer infraestrutura de armazenamento.
Ambos os módulos se conectam a um backplane compartilhado, que por sua vez dá acesso ao mesmo conjunto de discos rígidos ou SSDs. Eles também se comunicam constantemente através de um link dedicado, chamado heartbeat, para monitorar o status um do outro. Se uma controladora apresentar qualquer problema, a outra assume imediatamente todas as operações, sem que os usuários ou aplicações percebam a transição.
Em nossos testes, essa redundância se mostrou a forma mais eficaz para manter serviços essenciais no ar. A tecnologia é fundamental para ambientes que não toleram qualquer tipo de interrupção, como hospitais, instituições financeiras e grandes plataformas de e-commerce.
Como as controladoras gerenciam o mesmo storage?
As controladoras duplas operam sobre o mesmo conjunto de discos graças a um design de hardware altamente integrado. O componente central dessa arquitetura é o backplane passivo, uma placa de circuito que interliga as duas controladoras e todas as baias de disco. Ele permite que qualquer controladora acesse qualquer disco a qualquer momento, o que viabiliza o failover.
Para que o processo funcione, as duas controladoras mantêm suas configurações e o cache de escrita perfeitamente sincronizados. Essa comunicação contínua ocorre por uma conexão de alta velocidade, geralmente uma interface Non-Transparent Bridge (NTB) via PCIe. Desse modo, a controladora secundária sempre tem uma cópia exata do estado da controladora principal.
Quando uma falha é detectada pelo heartbeat, a controladora sobrevivente assume os endereços de rede e as LUNs (Logical Unit Numbers) da unidade que falhou. Esse processo é quase instantâneo e garante que os servidores conectados continuem acessando os dados sem interrupções. A maioria dos sistemas operacionais lida com essa transição de forma transparente.
Qual a diferença entre active-active e active-passive?
A principal distinção entre os modos de operação reside em como as controladoras dividem a carga de trabalho. Em um conjunto active-passive, apenas uma controladora está ativa, ou seja, ela processa todas as requisições de leitura e escrita. A segunda controladora fica em modo de espera (standby), apenas espelhando o estado da unidade principal e pronta para assumir em caso de falha.
Já na configuração active-active, ambas as controladoras processam requisições de I/O simultaneamente. Essa abordagem distribui a carga de trabalho, o que melhora o desempenho geral dos serviços. Cada controladora pode ser "dona" de um conjunto específico de LUNs ou volumes, mas ambas têm a capacidade de assumir a carga total se a outra falhar. O failover em um cluster active-active é frequentemente mais rápido.
A escolha entre as duas tecnologias depende muito do orçamento e da necessidade de performance. O modo active-active geralmente entrega mais IOPS e menor latência, porém exige um hardware mais sofisticado e, consequentemente, um investimento maior. Para muitas empresas, o formato active-passive já oferece um nível de proteção excelente.
O que acontece quando uma controladora falha?
Quando uma controladora falha, o mecanismo de failover é acionado automaticamente. A controladora saudável detecta a ausência do "pulso" da sua parceira através do link heartbeat. Imediatamente, ela inicia o processo para assumir o controle total do armazenamento, uma ação que geralmente leva poucos segundos.
O primeiro passo é tomar posse de todos os recursos que pertenciam à controladora com defeito. Isso inclui os endereços IP virtuais, as portas Fibre Channel (FC) e as LUNs. Como os dados de configuração e o cache já estavam sincronizados, a transição ocorre sem perda de dados. Os servidores conectados ao storage simplesmente redirecionam suas requisições para a controladora que agora está ativa.
Ao mesmo tempo, o gerenciamento emite alertas para os administradores de TI sobre a falha. Isso permite que a equipe de suporte técnico possa diagnosticar o problema e providenciar a substituição do módulo defeituoso. A maioria dos storages com controladoras duplas suporta hot-swap, ou seja, a troca do componente pode ser feita com o equipamento em pleno funcionamento.
O foco é desempenho ou alta disponibilidade?
O foco principal de um NAS com controladoras duplas é, sem dúvida, a alta disponibilidade. A arquitetura foi concebida para garantir que o acesso aos dados não seja interrompido por uma falha de hardware em um dos componentes mais complexos da estrutura. A meta é manter a operação contínua, mesmo durante um incidente grave.
Ainda assim, o desempenho também é um benefício, especialmente nas estruturas active-active. Ao distribuir as requisições de I/O entre duas controladoras, o ambiente de produção consegue entregar mais IOPS e uma taxa de transferência maior. Isso é particularmente útil em ambientes com muitas máquinas virtuais ou bancos de dados que geram cargas de trabalho intensas e simultâneas.
Vale ressaltar, no entanto, que todo esse sistema precisa ser dimensionado para que uma única controladora consiga suportar 100% da carga durante um evento de failover. Por isso, mesmo em modo active-active, o ganho de performance não é uma duplicação linear. A alta disponibilidade sempre será a prioridade do projeto.
Quais cenários justificam o investimento?
A adoção de um storage com controladoras duplas faz sentido em qualquer cenário onde a paralisação dos serviços gera um impacto financeiro ou operacional significativo. Ambientes de virtualização com VMware ou Hyper-V são o caso de uso mais comum. Neles, dezenas ou centenas de máquinas virtuais dependem de um único ponto de armazenamento, tornando a alta disponibilidade essencial.
Bancos de dados transacionais, como SQL Server e Oracle, também se beneficiam imensamente dessa arquitetura. A interrupção de um banco de dados pode corromper transações e causar perdas de dados irreparáveis. Um servidor de armazenamento resiliente garante que as operações de escrita no banco continuem mesmo após uma falha de hardware.
Outras aplicações críticas incluem softwares de planejamento de recursos empresariais (ERP), plataformas de vídeo sob demanda (VOD) e qualquer serviço que precise operar 24 horas por dia, 7 dias por semana. Para essas cargas de trabalho, o custo de uma hora de inatividade quase sempre supera o investimento adicional em um equipamento com alta disponibilidade.
Compatibilidade de hardware: o que considerar?
Sistemas de controladora dupla são plataformas de processamento fechadas e altamente integradas. As controladoras, o chassi, o backplane e as fontes de alimentação são projetados pelo fabricante para funcionar como uma unidade coesa. Por essa razão, não é possível misturar componentes de marcas diferentes. A compatibilidade é definida estritamente pelo fornecedor do equipamento.
Os discos rígidos e SSDs também precisam estar na Lista de Compatibilidade de Hardware (HCL) do fabricante. Usar um disco não homologado pode causar instabilidade, perda de desempenho ou até mesmo falhas na detecção do volume de armazenamento pela rede. Os firmwares dos discos são frequentemente otimizados para trabalhar em conjunto com o software da controladora.
O mesmo se aplica a módulos de expansão de rede ou memória. Qualquer upgrade deve seguir as recomendações do fabricante para garantir que a estabilidade e a alta disponibilidade não sejam comprometidas. Tentar economizar com peças não certificadas quase sempre resulta em problemas futuros e invalida o suporte técnico.
Essa tecnologia vale a pena fora do ambiente enterprise?
Para a grande maioria dos usuários domésticos e pequenas empresas, um NAS de controladora dupla raramente se justifica. O custo de aquisição é consideravelmente mais alto que o de um storage com controladora única. Além disso, a complexidade de configuração e gerenciamento exige um conhecimento técnico mais avançado.
Em vez de investir em um hardware tão robusto, um escritório pequeno ou um usuário avançado geralmente obtém um retorno melhor com outras estratégias. Por exemplo, uma rotina de backup 3-2-1 bem estruturada, com cópias locais e na nuvem, oferece uma excelente proteção contra perda de dados por um custo muito menor.
A combinação de um bom NAS single-controller com snapshots e replicação para um segundo equipamento também pode criar um ambiente bastante resiliente. A alta disponibilidade de nível enterprise é realmente necessária apenas quando o custo do tempo de inatividade é proibitivo, o que não é o caso para a maioria dos cenários de pequeno porte.
Redundância e failover substituem o backup?
É fundamental entender que redundância e failover não substituem o backup. Muitas pessoas confundem esses conceitos, mas eles protegem contra ameaças completamente diferentes. Um servidor de controladora dupla, assim como arranjos RAID, foi projetado para proteger contra falhas de hardware e manter os serviços no ar.
O backup, por outro lado, protege contra a perda de dados. Ele é a sua única defesa contra erros humanos, como a exclusão acidental de um arquivo importante, a corrupção de dados causada por um software ou um ataque de ransomware que criptografa todos os seus arquivos. Nenhuma arquitetura de alta disponibilidade consegue recuperar um arquivo que foi deletado ou corrompido.
Portanto, as duas estratégias são complementares e indispensáveis em um ambiente crítico. A alta disponibilidade garante a continuidade do negócio, enquanto o backup garante a recuperação dos dados em caso de desastre. Para uma proteção completa, toda empresa precisa implementar ambas as soluções. Nessa situação, um sistema de armazenamento resiliente aliado a uma política de cópias de segurança robusta é a resposta.
