Backup em Fita vs. Disco: qual o desempenho mais eficiente?

Backup em Fita vs. Disco: qual o desempenho mais eficiente?

É comum o pensamento de que a solução de backup em disco possui maior desempenho do que a solução em fita, entretanto ambos ambientes de backup podem ter o mesmo desempenho. A grande diferença entre essas tecnologias é que para obter o mesmo desempenho será necessário investir mais em fita do que na solução em disco.
A fita não tem a mesma eficiência de desempenho do disco porque é uma mídia de leitura e escrita sequencial o que limita a gravação do backup. Além disso, o backup em disco elimina a etapa de migração, é uma mídia de escrita e leitura paralela e possui restauração e recuperação mais rápidas. Em geral, ele também utiliza a tecnologia de desduplicação que reduz o volume de dados armazenados do backup e aumenta o desempenho.

Por que a gravação sequencial limita o desempenho do backup em fita?


Um dos grandes problemas da gravação sequencial da fita é que não pode haver espaços entre as escritas. Dessa forma toda vez que há diferença entre as velocidades do servidor de backup e da gravação, a cabeça avança mais do que a escrita e isso faz com que a fita seja rebobinada até o último ponto conhecido e em seguida avance para a última gravação. Nesse caso, o backup se torna mais lento, já que a fita não está apta a gravar enquanto rebobina e avança. Isso também causa desgaste físico à fita e ao drive.
A gravação sequencial também traz outro problema de desempenho, só é possível escrever um lote por vez. Dessa maneira, em uma situação em que é necessário realizar backup de 05 aplicações, por exemplo, só será possível gravar uma por vez e as outras entrarão em fila. A velocidade da gravação nesse caso, não será a capacidade total do drive da fita, mas sim a velocidade de transferência do servidor de backup. Portanto, mesmo que o drive tenha capacidade para escrita de 5 GB/h, se o servidor de backup só transferir 1 GB/h, a velocidade da gravação será de 1 GB/h. Nesse caso, para ter um desempenho igual ao disco será necessário um drive para cada aplicação, o que será mais custoso.
Uma solução encontrada em muitas arquiteturas de backup em fita é realizar o backup em um pool de discos (como se fosse um cache) e em seguida migrar todos os dados para fita. Dessa forma, tudo é enviado em lote único e a fita é utilizada com mais eficiência. O grande problema é que será adicionado mais uma etapa ao backup, o que gera mais custos e pode aumentar o tempo se o disk pool não for dimensionado corretamente.

Entenda por que o backup em disco é mais eficiente

O backup em disco possui leitura e escrita paralela, por isso grava de maneira aleatória e possui endereçamento. Assim, não importa em qual local do disco a cabeça de gravação esteja, a informação será escrita e endereçada. Portanto, o disco é apto a gravar em todo o processo de backup. Além disso, como possui leitura e escrita paralela, o backup das aplicações não precisam entrar em fila, ele é realizado simultaneamente, utilizando toda a capacidade de desempenho do disco.
O processo de restauração e recuperação da solução de backup em disco também é mais rápido do que a solução de backup em fita. Em vez de permitir acesso aleatório aos dados, como nos discos, as unidades de fita somente permitem o acesso sequencial aos dados. O disco rígido pode mover suas cabeças de leitura/gravação para qualquer ponto aleatório dos discos num intervalo mínimo de tempo, mas uma unidade de fita gasta um tempo considerável avançando e rebobinando a mídia para poder ler qualquer segmento de dados. O resultado é que unidades de fita possuem um tempo médio de busca muito lento. Além disso, os erros manuais na operação das fitas, como a quebra, armazenamento inadequado, perda ou catalogação incorreta das tapes, tornam os esforços de recuperação ainda mais complexos.
A solução de backup em disco permite a utilização da tecnologia de desduplicação, o que reduz o volume de dados armazenados do backup e aumenta o desempenho. Essa tecnologia elimina os dados redundantes e cria apenas uma cópia física no local de armazenamento. Os algoritmos dessa solução dividem o dado em blocos e dão uma identificação a cada bloco. Em seguida verificam se essas identidades já estão salvas no destino. Caso alguma esteja, eles eliminam esses segmentos e inserem ponteiros na cópia única. Caso não esteja, salvam no diretório. Como o volume de dados para cópia é menor, o desempenho é ainda maior. Essa tecnologia não é disponível em soluções de backup em fita, por causa da limitação da escrita sequencial.

Conclusão


Por muitos anos, era inviável investir em uma solução de backup em disco pelo alto custo em comparação à fita. Entretanto, no contexto atual com ambientes de TI cada vez mais virtualizados, crescente aumento do volume de dados e necessidades cada vez maiores de desempenho, a tecnologia de backup em fita se tornou deficiente em atender de maneira satisfatória as demandas da Tecnologia da Informação. Isso se agravou com o surgimento da tecnologia de desduplicação e o barateamento dos discos que tornaram o backup em disco não só mais eficiente, como também o mais adequado para responder aos desafios da TI atual.
O backup em disco permite não só alto desempenho à operação de backup como também eficiência de armazenamento. Além disso, elimina a complexidade do gerenciamento e diminui o RPO e RTO das aplicações. Portanto, a solução de backup em fita pode até ter o mesmo desempenho do disco, mas não a mesma eficiência.

E-book desduplicação

Posted by Bruna Spaniol / Posted on 16 out
    • Ricardo Costa

      Parabéns pelo artigo!

    • Luiz Henrique

      Excelente Artigo, com riqueza de detalhes.
      Muito Obrigado pela contribuição!