Skip to content

Alertas & Incidentes

Este documento explica como o Holter determina a saúde de um monitor, o que são incidentes e como os dois interagem.

Status de Saúde

Cada monitor tem um campo health_status que resume sua condição atual:

StatusSeveridadeSignificado
DOWN4 (maior)A última verificação falhou ou há um incidente de indisponibilidade aberto
COMPROMISED3Um erro de SSL ou incidente de adulteração está aberto
DEGRADED2O monitor está acessível, mas com desempenho abaixo do esperado
UP1Todas as verificações passam e não há incidentes abertos
UNKNOWN0Nenhuma verificação foi executada ainda

Quando múltiplos sinais divergem, o de maior severidade prevalece.

Estado Lógico

O logical_state é separado da saúde e controla se o monitor está executando ativamente:

EstadoSignificado
activeAs verificações são executadas conforme o agendamento
pausedAs verificações estão suspensas; o monitor não é avaliado
archivedO monitor está desabilitado e excluído das contagens de cota

Um monitor pausado mantém seu último status de saúde conhecido, mas não é reavaliado até ser retomado.

Incidentes

Um incidente é um problema aberto detectado pelo sistema. Há três tipos:

Indisponibilidade (Downtime)

Aberto quando uma verificação HTTP falha. A saúde do monitor é definida como DOWN durante o período. O incidente fecha quando uma verificação bem-sucedida subsequente é registrada.

Adulteração (Defacement)

Aberto quando o corpo da resposta contém uma palavra-chave negativa, sugerindo que o conteúdo da página foi manipulado. A saúde do monitor é definida como COMPROMISED.

Expiração SSL (SSL Expiry)

Aberto quando uma verificação de certificado SSL detecta um problema:

Causa RaizSaúde Resultante
Certificado expiradoCOMPROMISED
Vencimento em até 7 dias (Crítico)COMPROMISED
Erro de conexão SSLCOMPROMISED
Vencimento em até 15 dias (Aviso)DEGRADED

Incidentes de expiração SSL são suprimidos quando o campo Ignorar Erros de SSL está habilitado no monitor. Qualquer incidente de expiração SSL aberto é resolvido na próxima verificação após salvar a configuração. Veja Configurações do Monitor.

Recálculo de Saúde

Após cada verificação, o Holter recalcula a saúde do monitor combinando dois sinais:

  1. Status do log mais recente — o resultado da última verificação HTTP
  2. Incidentes abertos — o status de maior severidade implicado por qualquer incidente aberto

O health_status final é o que tiver maior severidade entre esses dois sinais.

Classificação no Dashboard

Os monitores são classificados no Dashboard para que os itens mais acionáveis apareçam primeiro:

  1. Monitores ativos ordenados por severidade (DOWN → COMPROMISED → DEGRADED → UP → UNKNOWN)
  2. Dentro do mesmo grupo de severidade, monitores com mais incidentes abertos aparecem primeiro
  3. Monitores pausados (sempre por último, independentemente do status de saúde)

Histórico de Incidentes

Todos os incidentes são registrados permanentemente e acessíveis na página de Histórico de Incidentes. O histórico pode ser filtrado por tipo, estado (aberto ou resolvido) e período. Cada entrada vincula a uma página de Detalhe do Incidente que exibe a causa raiz completa e o snapshot do monitor capturado quando o incidente foi aberto.

Released under the AGPL-3.0 License.