A ilusão do ‘tempo real justo’ no Kubernetes: por que seu cluster mente pra você

A Dor Real: Quando o Kubernetes te promete o impossível

Se você já recebeu aquele alerta de “latência inexplicável” em horário de pico, sabe o que vou dizer: **seu cluster não está lento — ele está saturado**. Só que a maioria corre para tunar autoscaling, mexer em readiness probe ou aumentar CPU como quem troca vela do carro esperando que o motor vire V8.

A verdade é simples: Kubernetes não foi projetado para **tempo real justo**. Ele mascara picos, mas não os resolve. E quando a fila cresce, a latência explode. Exatamente como mostrado na vida real (e muito bem explicado no material sobre Teoria das Filas listado nas fontes).

A Solução Pragmática: Modele a fila, estabilize o throughput, pare de brigar com o cluster

O caminho é direto: **controle a taxa de entrada**, **reduza variância de processamento**, e **orquestre scaling com parcimônia**, subindo pods devagar para não criar rajadas de cold starts.

É feio? É simples? É. Mas funciona.

Implementação de Senior: Como estabilizar latência usando fila + limites bem definidos

Abaixo um exemplo real de como restringir throughput no próprio serviço para impedir avalanche de requisições sobre o cluster. Aqui uso um rate limiter simples acoplado ao handler HTTP (Go):

package main

import (
  "golang.org/x/time/rate"
  "net/http"
  "log"
)

var limiter = rate.NewLimiter(50, 100) // 50 req/s com burst máximo de 100

func limited(next http.Handler) http.Handler {
  return http.HandlerFunc(func(w http.ResponseWriter, r *http.Request) {
    if !limiter.Allow() {
      w.WriteHeader(http.StatusTooManyRequests)
      return
    }
    next.ServeHTTP(w, r)
  })
}

func main() {
  mux := http.NewServeMux()
  mux.HandleFunc("/process", func(w http.ResponseWriter, r *http.Request) {
    w.Write([]byte("OK"))
  })

  log.Fatal(http.ListenAndServe(":8080", limited(mux)))
}

Agora o serviço responde dentro de limites previsíveis. O cluster deixa de ser o gargalo e vira apenas o executor.

O Custo da Escolha: Determinismo não é grátis

Adotar controle rígido de throughput significa dizer “não” a picos. Significa rejeitar requisições quando necessário. Significa expor limites que muitos times têm medo político de admitir.

Mas a alternativa é pior: **latência fantasma** em produção e dashboards mentindo sobre o real impacto da saturação.

Direto das Trincheiras

Latência nunca é linear. Sempre modele fila antes de escalar pod.
Reinicio automático de container, como o pessoal lembrou no Reddit, cria buracos de desempenho. Evite que isso aconteça em rajadas.
Autoscaling agressivo é um convite a cold starts simultâneos. Suba pods com calma.

Fontes

Quanto tempo você gasta aprendendo fora do horário de trabalho?, Como a Teoria das Filas explica latências ‘inexplicáveis’ em produção., Sem amor pelo Systemd? : r/devops – Reddit

Obrigado por acompanhar essa reflexão até o fim! Espero que esses pontos ajudem você a tomar decisões mais lúcidas no seu próximo projeto. Não deixe de conferir outros artigos aqui no blog reymaster.dev.br, onde descascamos outros hypes da nossa área. Valeu e até a próxima! 😉

Domain Driven Design

O Overhead Invisível que Está Matando Seus Microserviços

Se você acha que microserviços são a bala de prata do seu projeto, prepare-se: eles podem virar o maior gerador de dívida técnica da sua carreira. Não é exagero — é experiência de trincheira. Quando o hype atropela o contexto de negócio, o resultado é um Frankenstein distribuído, impossível de depurar e caríssimo de operar. Neste artigo, eu, Rei Nascimento, destrincho sem gourmetização por que o overhead de microserviços sabota projetos e como o DDD ajuda a evitar esse suicídio arquitetural.

Backend

Microserviços: O Imposto Invisível Que Está Matando Sua Agilidade

Muita equipe entra na onda dos microserviços achando que vai ganhar autonomia e velocidade. Mas na vida real — a das trincheiras — o que aparece é latência, debugging impossível, deploy caótico e uma avalanche de complexidade que ninguém pediu. Aqui eu destrincho, sem gourmetização, o preço real dessa brincadeira e quando ela simplesmente vira um tiro no pé do backend.

Frontend

Microfrontends Prometeram Escala. Entregaram Atrito.

Microfrontend virou hype corporativo: promessa de times autônomos, deploy independente e um frontend que ‘escala igual microsserviços’. Mas na trincheira, a história é outra: UX fragmentada, integrações frágeis e um Frankenstein de iframes, módulos remotos e pipelines que ninguém mais controla. Aqui eu destrincho, sem gourmetização, por que esse modelo falhou em entregar o que realmente importa: uma experiência de usuário coesa e rápida.