Alta Disponibilidade com pfSense

disco-rigido

As redes de ensinos tornam-se mais complexas à medida que os requisitos aumentam. Geralmente tem WLAN em toda a escola, uso de tablets e laptops na sala de aula, serviços em nuvem, padrões de logins para todos os serviços: os requisitos para um administrador de rede ou prestador de serviços na instituição são muitos e variados. Se tudo estiver funcionando, que geralmente esta, então ótimo! Mas o que acontece se o servidor, firewall ou switch falhar? As consequências podem ser muito diferentes. Quanto tempo demora para que o ambiente volte ao normal? Qual a importância da alta disponibilidade em uma instituição?

Elevada disponibilidade

Segundo a Wikipedia , alta disponibilidade é definida da seguinte forma

A alta disponibilidade (HA) é uma característica de um sistema, cujo objetivo é garantir um nível acordado de desempenho operacional, geralmente tempo de atividade, por um período maior que o normal.

O ponto é que um sistema (“a rede de ensino”) permanece operacional, mesmo que um ou mais componentes falhem. Isso pode causar interrupções. Dependendo do tempo de duração da interrupção, a alta disponibilidade é dividida em diferentes classes. Uma rede de ensino deve estar operacional, especialmente em dias letivos (aproximadamente 180 a 200 dias por ano). Mesmo que a disponibilidade de 99,999% seja absolutamente necessária em poucas instituições, o funcionamento adequado é muito importante para a rede de ensino.

Ponto único de falha

Para obter alta disponibilidade no pfsense, você deve reduzir os chamados “pontos únicos de falha”. Esses são componentes cuja falha faria com que toda a rede de ensino parasse. O que pode ser um “ponto único de falha”?

  • Firewall → se falhar, não haverá mais acesso à Internet, dependendo da configuração, a rede interna não funcionará mais.
  • Switches (especialmente o switch central)
  • O servidor → em caso de falha, muitos aplicativos não são mais acessíveis, ou seja, logins de acesso, aplicativos Web, serviços em nuvem e etc.
  • Conexões com a Internet → se o único acesso falhar, ele será desconectado.

História rápida:

Na semana passada, em um dos nossos clientes teve o firewall desconectado (devido ao erro no modem Embratel). A rede caiu, o cliente ficou sem internet. Uma primeira tentativa quando o técnico chegou ao local foi de virtualizar o firewall mas não conseguiu, então trocamos por um appliance firewall BM6A. Precisávamos de algumas configurações adicionais em nosso switch principal para dividir todas as WAN e VLAN em duas placas de rede. Depois de algumas horas, a rede estava funcionando novamente (conseguimos restaurar o backup da configuração com poucas alterações).

Como você pode aumentar a alta diponibilidade no pfSense?

Existem várias maneiras de aumentar a confiabilidade, disponibilidade e proteger melhor a “rede de ensino” contra as falhas. Em geral, trata-se de ter a menor quantidade possível (de preferência não) de “pontos únicos de falha” e componentes críticos que são tolerantes a falhas em caso de falha. Como já mencionado acima, os requisitos para uma rede de ensino de alta disponibilidade dependem amplamente das circunstâncias e prioridades dos responsáveis de TI. Por um lado, é uma questão de planejamento e investimentos, já que precisa levantar qual o prejuízo de uma instituição de ensino parada.

Aqui estão algumas idéias sobre como aumentar a confiabilidade:

  • Hardware qualitativo → um bom hardware custa mais, mas geralmente funciona mais estável
  • Backups → Configurações, dados, máquinas virtuais, contêineres: não há como evitar backups (os backups também devem ser testados!)
  • Monitoramento → um bom monitoramento pode detectar erros no início de alguns casos e oferece uma visão geral de onde há problemas na rede. Portanto, você pode reagir mais rapidamente e não depender dos avisos dos usuários da rede (“A Internet não está mais funcionando”, “A impressora não imprime”, …).
  • Aumente a tolerância a falhas → também chamada de “failover”, ou seja, duas fontes de alimentação no servidor, várias conexões à Internet (“Multi-WAN”), dois firewalls, RAID, dois servidores, …
  • Mantenha as peças de reposição disponíveis → Discos rígidos, fonte de reposição,…
  • O UPS → protege o hardware em caso de oscilações de energia e continua a operação mesmo em caso de queda de energia (por tempo limitado)
  • “Redundância de pessoal” → Ter pelo menos dois ou mais administradores de TI ou prestadores de serviços (em caso de licença médica, férias, …)
  • peças de reposição preventivo

Linha de base

Uma rede de ensino certamente não é um sistema muito crítico, mas com a crescente digitalização das instituições, é cada vez mais importante que a infraestrutura de TI permaneça acessível e sem falhas. Em algumas escolas, a falha da Internet é tão grave que dificilmente o trabalho pode continuar (sistemas on-line para administração, sistemas em nuvens, sistemas de aprendizado on-line, sistemas de ERP dos alunos). Para aumentar a confiabilidade, você nem sempre precisa gastar muito dinheiro. Muito mais importante é que você esteja preparado para uma falha (especialmente no ponto único de falha).

Deixe um comentário