Instabilidade nos Serviços em 14/05 e Migração de Datacenter

Comunicado aos Clientes

Ontem, dia 14 de maio, por volta das 11h00, tivemos uma indisponibilidade no Storage (STaaS) utilizado em nossa infraestrutura, responsável pelo armazenamento dos dados dos serviços, incluindo e-mails, sites e demais aplicações hospedadas.

Com a falha, praticamente todos os serviços foram afetados, incluindo:

  • E-mails (IMAP, POP3, SMTP e Webmail)
  • Sites e páginas hospedadas
  • Demais serviços dependentes do Storage

A EVEO foi acionada imediatamente, porém, como infelizmente já ocorreu em outras ocasiões, recebemos apenas respostas genéricas e superficiais, confirmando apenas que o problema estava no ambiente de Storage deles, sem detalhes técnicos claros ou previsão precisa para normalização.

Por volta das 22h00, recebemos a informação de que a pane no Storage fez com que o ambiente entrasse em modo de reparação. Segundo a EVEO, não houve — e não deverá haver — perda de dados, porém trata-se de um processo demorado, com previsão de duração de dias.

Como não existe possibilidade operacional de manter nossos serviços indisponíveis por esse período, a EVEO disponibilizou um novo ambiente de Storage para utilização emergencial. A partir disso, iniciamos o processo de restauração do backup realizado durante a madrugada de hoje.

Possíveis impactos durante a normalização:

  • (1) O processo de restauração do backup é gradual e pode levar algumas horas. Portanto, caso você acesse sua conta via IMAP ou Webmail e ainda não visualize seus e-mails, não se preocupe. As mensagens irão reaparecer progressivamente conforme o restore for concluído.
  • (2) E-mails enviados ou recebidos após o horário do backup (aproximadamente 01h00 da madrugada da quinta feira) até o momento da falha, por volta das 11h00, não estão presentes nesse backup inicial e, portanto, podem não aparecer temporariamente em sua conta. Assim que o Storage antigo voltar a operar, realizaremos uma sincronização diferencial para recuperar esses dados (até semana que vem).

Atualizaremos este comunicado assim que a restauração estiver 100% finalizada.

Desta forma, os serviços começaram a ser restabelecidos apenas às 05h30 da madrugada do dia 15/05.

Pedimos sinceras desculpas por mais esta falha. Embora o problema tenha ocorrido em uma infraestrutura de terceiros, somos os responsáveis pela contratação e entendemos plenamente nosso compromisso com a estabilidade dos serviços prestados aos nossos clientes.

Diante das recorrentes falhas da EVEO, tomamos a decisão de realizar ainda neste semestre a migração completa de nossa infraestrutura para outro Datacenter. Infelizmente, ficou evidente que a qualidade, confiabilidade e capacidade de resposta entregues pela EVEO estão muito abaixo do esperado para um ambiente crítico de hospedagem e e-mails.

Muitos clientes estão conosco há anos e conhecem nosso histórico de estabilidade e comprometimento. Também fomos surpreendidos negativamente pelas sucessivas falhas ocorridas após a migração para este Datacenter, que deveria representar uma evolução de infraestrutura — e não uma redução de qualidade.

Novas informações sobre o processo de migração serão publicadas em breve.

Atenciosamente.

EDITADO 17/05 – 01:03 – REFERENTE AO RESTORE ITEM 1 ACIMA

O processo de restore completo de todas as contas foi finalizado às 01h00 da madrugada deste domingo. Com isso, todos os e-mails — incluindo mensagens antigas e conteúdos de todas as pastas — já devem ter reaparecido normalmente em sua conta.

Importante:

Como executamos uma dupla verificação durante o processo de restauração para garantir a máxima consistência dos dados, pode ocorrer de alguns e-mails que já haviam reaparecido anteriormente e foram excluídos na sexta-feira ou sábado voltarem a aparecer após a segunda etapa do restore.

Optamos por essa abordagem por segurança e integridade dos dados. Em um cenário como esse, é melhor que um e-mail eventualmente apareça novamente do que correr o risco de alguma mensagem não ser restaurada definitivamente.

Eventual lentidão nos acessos é esperado nessa segunda feira (próximo dia útil) devido ao volume de usuários acessando suas contas e fazendo o IMAP resincronizar os indexes que estarão incompletos.

EDITADO 24/05 – 21:30 – REFERENTE AO RESTORE ITEM 2 ACIMA

O antigo Storage voltou a operar após a conclusão do processo de repair. Com isso, conseguimos restaurar com sucesso todos os e-mails do dia 14 que haviam ficado fora do restore principal, devido à diferença entre o horário do backup (aproximadamente 01h00 da madrugada do dia 14) e o horário da pane no Storage (por volta das 11h00 do mesmo dia).

Desta forma, todos os e-mails já devem estar novamente disponíveis normalmente em sua conta.

Importante:

Caso algum e-mail recebido no dia 14 tenha sido apagado após o primeiro restore, ele pode ter reaparecido agora durante esta sincronização complementar. Optamos por essa abordagem visando máxima segurança e integridade dos dados. Em situações como essa, é muito melhor que uma mensagem eventualmente reapareça do que correr o risco de algum e-mail não ser restaurado definitivamente.

Também vale lembrar que e-mails enviados para você após o início da pane (por volta das 11h00 do dia 14) podem ter seguido comportamentos diferentes dependendo do servidor remetente:

  • Muitos servidores mantiveram as mensagens em fila e realizaram a entrega posteriormente, já nos dias 15 em diante.
  • Em alguns casos, o remetente pode ter recebido mensagens de erro temporárias, como timeout ou falha ao localizar o servidor de destino.

Não houve, portanto, perda alguma de mensagens.

Seguimos também com o planejamento de migração para outro Datacenter, conforme informado anteriormente. Em breve publicaremos novas informações sobre esse processo.

Compartilhe isso: