Quando o Kubernetes é o Gargalo — e Não a Solução

A Dor Real: O Cluster Que Escala Tudo, Menos Seu Produto

O problema não começa no Kubernetes; começa no time que compra o hype achando que “escalabilidade” é sinônimo de “orquestrador distribuído”. A verdade nua: Kubernetes resolve problemas de gente grande, mas cria novos gargalos para times que ainda estão lutando com deploys manuais, pipelines instáveis e serviços que mal escalam verticalmente.

O paradoxo aparece quando o cluster cresce, mas o throughput do negócio continua o mesmo. O gargalo deixa de ser a infraestrutura e vira a arquitetura — mais especificamente, o excesso de peças que o próprio Kubernetes incentiva quando usado sem critério.

Se você não tem clareza do fluxo da sua aplicação, Kubernetes só vai empilhar dívida técnica mais rápido.

A Solução Pragmática: Limitar o Escopo e Medir Gargalos de Verdade

Antes de falar em pods, nodes e autoscaling, você precisa identificar o gargalo real. A Teoria das Restrições é direta: otimize o que trava o fluxo. Spoiler: quase nunca é falta de orquestração distribuída.

Se sua aplicação não bate 1k RPS de forma consistente, provavelmente o gargalo está em lógica de negócio, queries ruins, filas mal dimensionadas ou I/O travando tudo.

Kubernetes só entra na equação quando:

A arquitetura é naturalmente distribuída.
Os serviços têm requisitos de isolamento, disponibilidade e observabilidade que valem o custo.
A equipe tem maturidade para operar o cluster sem virar refém de YAML duplicado e deploys quebrados.

Implementação de Sênior: Observando o Gargalo Com Métricas e Autoscaling Real

Quer saber se o Kubernetes é gargalo? Meça.

Abaixo um exemplo de configuração de HPA (Horizontal Pod Autoscaler) realmente funcional, que aponta diretamente onde dói: consumo de CPU e latência de aplicação.

apiVersion: autoscaling/v2beta2
kind: HorizontalPodAutoscaler
metadata:
  name: api-hpa
spec:
  scaleTargetRef:
    apiVersion: apps/v1
    kind: Deployment
    name: api-service
  minReplicas: 2
  maxReplicas: 10
  metrics:
    - type: Resource
      resource:
        name: cpu
        target:
          type: Utilization
          averageUtilization: 70
    - type: Pods
      pods:
        metric:
          name: request_latency_ms
        target:
          type: AverageValue
          averageValue: 200

Repare que incluímos latência como métrica de verdade — porque throughput ruim não se resolve com mais pods, e sim entendendo o fluxo que limita o sistema.

Quer algo ainda mais direto? Um diagrama simples do fluxo de gargalo:

Client -> API Gateway -> Service A -> Database
                          |-> Queue -> Worker -> External API

Se Service A está lento:
- aumentar pods não resolve query ruim
- retries excessivos matam o cluster
- Kubernetes apenas amplifica o caos

O Custo da Escolha: Kubernetes Pode Ser uma Âncora

Kubernetes dá superpoderes, mas cobra pedágio alto.

Os principais custos:

Stack operacional enorme (Prometheus, Grafana, Ingress, Service Mesh…).
Fragmentação da lógica de deploy: configuração vira outro sistema para manter.
Escalabilidade que escala custo antes de escalar valor.
Times júniores totalmente travados em problemas que nada têm a ver com produto.

Por outro lado, não usar Kubernetes também tem custos:

Escalabilidade manual cansativa.
Dificuldade de automação.
Ambientes inconsistentes.

A decisão final é simples: Kubernetes só vale quando o negócio precisa, não quando o arquiteto quer.

Direto das Trincheiras

Se você não monitora latência e throughput, não tem maturidade para Kubernetes.
Antes de migrar, reescreva os piores serviços: containerizar lixo só cria lixo distribuído.
Simplifique: service mesh não é obrigatório; às vezes um Ingress bem configurado resolve.

Fontes Utilizadas

Diretório de artigos, Framework Well-Architected da AWS – Framework, Sistemas Operacionais – Fundamentos, Evolução e Arquitetura …

Obrigado por acompanhar essa reflexão até o fim!

Espero que esses pontos ajudem você a tomar decisões mais lúcidas no seu próximo projeto. Não deixe de conferir outros artigos aqui no blog reymaster.dev.br, onde descascamos outros hypes da área.

Vlw, até a próxima! 😉

Gestão Estratética de TI

O mito da ‘agilidade’ em 47 microserviços: por que sua equipe está ficando mais lenta

Quando uma equipe acha que dividir tudo em microserviços é sinônimo de maturidade técnica, o desastre já começou. O hype promete autonomia, escalabilidade e deploy contínuo. A realidade? Dependências cruzadas, arquitetura Frankenstein e metade da sprint resolvendo quebra-cabeças de infraestrutura. Neste artigo, eu — Rei Nascimento — explico como o uso excessivo de microserviços virou fábrica de dívida técnica e destruidor de foco. E, mais importante, mostro como sair desse buraco.

Programação

Go é simples — e é exatamente por isso que ele atropela arquiteturas complicadas

Dev vive tropeçando em arquiteturas que parecem ter sido projetadas para impressionar o LinkedIn, não para resolver problemas reais. Neste artigo, assumo meu lado direto e pragmático para explicar por que a simplicidade de Go não é limitação — é vantagem estratégica. Menos camadas, menos mágica, mais previsibilidade. Se você já se queimou com over-engineering, prepare-se: aqui a conversa é de trincheira.

Mindset Ágil

Scrum Não é Cura Milagrosa: Como a Agilidade Mal Aplicada Está Quebrando Times Inteiros

Scrum virou mantra corporativo. Todo mundo repete, poucos entendem, e quase ninguém percebe o rastro de frustração, dívida técnica e desperdício que aparece quando se usa agilidade como religião. Neste artigo, falo direto das trincheiras: onde o método se perde, como resgatar o foco em valor real e por que times experientes estão abandonando cerimônias inúteis para voltar a priorizar contexto de negócio e entrega de software de verdade.