Pular para o conteúdo

AI LIKE A PRO #01 - A armadilha de US$1.000 por semana que ninguém te conta sobre vibe coding

Vibe coding prometia democratizar programação. Entregou contas de US$1k, código com 2.74x mais vulnerabilidades e lock-in de backend. Plataformas de vibe coding cobram pelos próprios bugs que criam.

Vou te contar uma parada que me deixou genuinamente puto: o custo real das plataformas de vibe coding é de 3 a 10 vezes maior do que o preço anunciado. Usuários do Replit reportam gastos de US$1.000 em uma única semana. No Bolt.new, um desenvolvedor queimou 20 milhões de tokens tentando resolver um bug de autenticação. Enquanto isso, existe uma stack de duas ferramentas (Google Antigravity + Claude Projects & Skills) que entrega controle, ownership e custo previsível. Esse artigo é pra quem cansou de alugar software e de resolver bugs que a própria IA criou.


O cassino dos tokens: quanto custa de verdade construir com vibe code

Toda plataforma de vibe coding começa igual: US$20-25/mês, venha construir seu app com IA. O que nenhuma landing page mostra é o que acontece quando você passa do “Hello World” para algo que precisa funcionar de verdade.

O Replit cobra US$25/mês no plano Core, com “créditos de uso” inclusos. O problema é que esses créditos cobrem tudo ao mesmo tempo: Agent, hospedagem, banco de dados, storage, transferência. Uma edição simples custa ~US$0.10, mas features complexas passam de US$5 por interação. O The Register documentou usuários gastando US$1.000 em uma semana após o lançamento do Agent 3, em setembro de 2025, quando antes gastavam US$180-200/mês. Um usuário do fórum desabafou: “Replit/Agent costs me ca. $30 per hour, totaling $360 today.” Reviews no G2 descrevem cobranças de US$114 em overages e contas de US$45 após apenas uma semana com o app em produção. O site Launchpad.io resumiu com uma frase que diz tudo: o pricing parece mais um cassino do que software.

O Bolt.new é ainda mais brutal. Nota no Trustpilot: 1.4 de 5, em mais de 140 reviews. O sistema de tokens funciona assim: um projeto novo consome ~10K tokens por prompt. O mesmo projeto com 20 componentes passa a consumir 100K tokens pelo mesmo prompt, porque o codebase inteiro é enviado a cada requisição. Uma análise da Trickle documentou um desenvolvedor que perdeu 1.3 milhão de tokens em um único dia. Outro queimou 7-12 milhões tentando corrigir erros simples. O padrão é vicioso: você pede pro Bolt corrigir um bug, ele cria outro, tenta corrigir esse, cria um terceiro. Trinta minutos depois, 500.000 tokens queimados e o problema original continua lá. Um post no Hacker News reportou que o agente do Bolt fez deploy não-autorizado na Netlify, criando “ghost files” que quebraram todos os pagamentos.

No Lovable, o plano Pro dá 100 créditos por US$25/mês. O blog de Adam Cameron fez a conta: 100 tokens por 25 dólares pra um mês inteiro, sendo que uma sessão de planejamento de um componente já come a maior parte. Ele calculou que o Lovable compra tokens da Anthropic a preço de varejo e revende com markup absurdo. Pra piorar, 30-40% do uso é gasto em bug fixes e tweaks quando o código gerado quebra, segundo análise da Softr. E cada app precisa de um backend Supabase separado, mais US$25/mês + US$10/app adicional.

O v0 da Vercel mudou para pricing baseado em tokens em maio de 2025. O modelo avançado (v0-1.5-lg) custa US$7.50 por milhão de tokens de input e US$37.50 por milhão de output. Detalhe: o v0 adiciona contexto de sistema por baixo dos panos, inflando o consumo sem você perceber. Um usuário escreveu no Medium que a Vercel cobra pelos próprios erros do modelo, e por isso estava abandonando a plataforma.

O Base44 (adquirido pela Wix em abril 2025) opera com sistema duplo de créditos: “message credits” para prompts e “integration credits” para ações dos usuários do app. Créditos não acumulam, não podem ser comprados avulso, e quando acabam, a plataforma simplesmente para de funcionar até o próximo ciclo. O lock-in mais severo de todos: exportação de código é apenas frontend. Backend e banco ficam presos no Base44 para sempre.

O Rocket.new é mais recente (US$25-100/mês, tokens que acumulam), com menos reclamações por enquanto, mas segue o mesmo modelo token-based.

Pra colocar em perspectiva: um desenvolvedor hospedando 4 web apps no AWS Amplify com Route 53, WAF e CloudFront CDN paga US$15.75/mês total. Isso é menos do que o plano básico de qualquer plataforma de vibe coding, sem contar tokens.

Fred Benenson, escrevendo no UX Collective, quantificou a própria experiência: gastou mais de US$1.000 em vibe coding desde o lançamento do Claude Code. A análise dele sobre o incentivo perverso é precisa: os desenvolvedores de LLM não têm incentivo nenhum para resolver o problema de código verboso, porque fazer isso cortaria receita. O SmarterArticles foi mais cirúrgico: a economia dessas plataformas se parece mais com monetização de jogos mobile do que com licenciamento de software.


De um tweet casual a um desastre de engenharia: a história real do vibe coding

O termo “vibe coding” nasceu em 6 de fevereiro de 2025, num tweet de Andrej Karpathy, cofundador da OpenAI e ex-diretor de IA da Tesla. O tweet acumulou 4.5 milhões de visualizações. A descrição original é reveladora: ele descreveu um estilo de programação onde você se entrega ao fluxo, aceita tudo que a IA sugere sem ler os diffs, cola mensagens de erro sem comentar, e quando o LLM não resolve um bug, pede mudanças aleatórias até o problema sumir.

Karpathy disse explicitamente que isso era para projetos descartáveis de fim de semana. Mas o mercado ouviu outra coisa. A Y Combinator revelou que 25% das startups do batch Winter 2025 tinham codebases 95% gerados por IA. O Collins English Dictionary elegeu “vibe coding” como Palavra do Ano de 2025. The Economist cunhou “vibe valuation” para VCs que estavam ignorando métricas tradicionais em startups de IA.

Um ano depois, em fevereiro de 2026, Karpathy reconheceu: foi um tweet de pensamentos soltos que ele disparou sem pensar, mas que de alguma forma nomeou uma coisa no momento certo. Ele propôs o termo “agentic engineering” como sucessor profissional.

Os dados mostram por que a distinção importa. A CodeRabbit analisou 470 pull requests no GitHub em dezembro de 2025: código co-autorado por IA tinha 1.7x mais issues “major”, 75% mais erros de lógica e 2.74x mais vulnerabilidades de segurança. A GitClear analisou 211 milhões de linhas de código entre 2020 e 2024: refatoração caiu de 25% para menos de 10%, duplicação de código quadruplicou, e code churn quase dobrou.

O estudo mais perturbador veio da METR, em julho de 2025. Um ensaio randomizado controlado mostrou que desenvolvedores experientes ficaram 19% mais lentos usando ferramentas de IA, apesar de preverem que seriam 24% mais rápidos e acreditarem depois que tinham sido 20% mais rápidos. Uma diferença de 43 pontos percentuais entre percepção e realidade. Lê de novo esse número. Quarenta e três pontos.

Em segurança, a coisa fica feia. O estudo da NYU (”Asleep at the Keyboard”) testou 1.689 programas gerados pelo Copilot: ~40% continham vulnerabilidades. A Stanford confirmou: desenvolvedores usando assistentes de IA escreveram código menos seguro e demonstraram mais confiança justamente quando o código era mais vulnerável. A Veracode, em 2025, testou 80+ LLMs: 45% dos casos introduziram vulnerabilidades classificadas no OWASP Top 10. Em Java, a taxa passou de 70%. A pesquisa da Apiiro com empresas Fortune 50 foi a mais grave: até junho 2025, código gerado por IA introduzia mais de 10.000 novos achados de segurança por mês, um aumento de 10x em seis meses. Caminhos de escalação de privilégio subiram 322%. Falhas de design arquitetural, 153%.

O conceito que explica tudo isso tem 30 anos. Em 1997, Brian Foote e Joseph Yoder publicaram “Big Ball of Mud”: uma descrição de código bagunçado, espaguete, grudado com fita adesiva. A definição poderia ter sido escrita ontem sobre qualquer codebase vibe-coded. A chave está no padrão “Throwaway Code”: protótipos descartáveis que nunca são descartados. Vibe coding é, por definição, throwaway code que persiste. É a gênese exata de uma Big Ball of Mud.

No Brasil, Fábio Akita, cofundador da Codeminer 42 e com 20+ anos de programação, publicou uma série extensa sobre vibe coding em 2026. A conclusão dele: programar vibe coding da forma correta só tem um jeito, e é Extreme Programming. Todas as coisas “chatas” e “burocráticas” que todo desenvolvedor odeia fazer são exatamente o que garante que a IA vai devolver um resultado aceitável pra colocar em produção. Ele cunhou o conceito de “Senior Agile Vibe Coder”: vibe coding funciona, mas exige pair programming com IA, TDD, CI e refatoração constante.


DHH e a filosofia de quem cansou de pagar aluguel digital

Enquanto o mercado vendia a nuvem como inevitável, a 37signals (criadora do Basecamp e HEY) fez o caminho inverso. Em outubro de 2022, DHH publicou “Why We’re Leaving the Cloud”, e os números que se seguiram viraram referência de indústria.

O gasto anual da 37signals com AWS e Google Cloud em 2022: US$3.201.564 (cifra exata, publicada). A empresa comprou ~US$600.000 em servidores Dell, migrou tudo para data centers colocation da Deft, e em setembro de 2023 já reportava US$1 milhão em economia. Em 2024, a economia chegou a US$2 milhões. A projeção revisada para 5 anos: US$10 milhões economizados, reduzindo custos de infraestrutura entre metade e dois terços. A equipe de operações? A mesma de 10 pessoas, antes e depois.

Em maio de 2025, começaram a migrar os últimos 18 petabytes de dados do S3, com a AWS dispensando US$250.000 em taxas de egresso. O custo anual do S3 era ~US$1.5 milhão; o storage Pure Storage que o substituiu roda por menos de US$200.000/ano.

DHH é cortante quando fala sobre isso: a margem de lucro da AWS é quase 30%, então é óbvio que alugar computador dos outros sai caro, mas ninguém apresenta a coisa nesses termos. E quando é difícil entender a sua fatura de cloud, é porque alguém está se aproveitando. Ele chama cloud providers de “merchants of complexity”, incentivados a tornar tudo o mais complicado possível pra manter clientes presos.

O produto ONCE (once.com) é a materialização dessa postura na prática. Lançado em setembro de 2023 por Jason Fried, o manifesto abre direto: algo aconteceu com software de negócios, você costumava pagar uma vez, instalar e rodar, hoje é tudo aluguel. A frase que viralizou: “Add up your SaaS subscriptions last year. You should own that shit by now.”

O primeiro produto, Campfire (chat em equipe), foi lançado a US$299 e depois liberado como open source. A comparação do DHH: Campfire rodando na Hetzner custaria US$479 para 500 usuários em 3 anos. Slack com os mesmos seats: US$270.000. Uma diferença de 99.9%. O Writebook (publicação de livros na web) é gratuito. Ambos se instalam com uma única linha de comando, rodam em Docker, e o código-fonte é seu.

A 37signals opera com ~55 funcionários, nunca levantou venture capital (fora um investimento pessoal de Jeff Bezos em 2006), e é lucrativa há mais de 68 trimestres consecutivos. Jason Fried define a filosofia “Calm Company”: lucratividade, respeito pelo tempo das pessoas, expectativas razoáveis, 40 horas de trabalho por semana.

A conexão com o tema aqui é direta: assim como uma calm company rejeita dependência de VCs, a 37signals rejeita dependência de cloud providers e modelos SaaS. Ownership não é nostalgia. É estratégia.


Google Antigravity e Firebase Studio: a aposta do Google contra o Cursor

O Google mantém dois produtos de IDE com IA, complementares e ambos gratuitos na fase atual.

O Firebase Studio (antes Project IDX, renomeado em abril de 2025 no Google Cloud Next) é uma IDE no navegador, construída sobre o Code OSS (VS Code open-source) e alimentada pelo Gemini 2.5 Pro. Tem dois modos: codificação com controle total e um “App Prototyping agent” que permite construir apps por linguagem natural. Suporta Next.js, React, Angular, Vue, Flutter, Django, Rails e 60+ templates. Deploy direto para Firebase, Cloud Run, ou infraestrutura customizada. Aceita texto, imagens, screenshots e desenhos como input. Gratuito durante o Preview, sem SLA.

O Google Antigravity é o mais ambicioso dos dois. É uma IDE desktop (macOS, Windows, Linux) lançada em 18 de novembro de 2025 junto com o Gemini 3. A filosofia é “agent-first”: agentes de IA são cidadãos de primeira classe, não assistentes pendurados no sidebar. O diferencial que chamou minha atenção é o Manager View, uma interface de orquestração onde até 5 agentes trabalham simultaneamente em diferentes partes do codebase. Nenhuma outra IDE oferece isso. Inclui um sub-agente Chrome embutido para teste de UI, artefatos estruturados (planos, screenshots, gravações), e suporte a múltiplos modelos: Gemini 3.1 Pro, Claude Sonnet 4.6, Claude Opus 4.6, GPT-OSS-120B. Score de 76.2% no SWE-bench Verified. 100% gratuito hoje.

Pra comparar: o Cursor cobra US$20/mês (Pro), tem 360.000+ clientes pagantes e valuation de US$29.3B. O Windsurf (US$15/mês) foi adquirido pela Cognition em julho de 2025 após o Google pagar US$2.4B para contratar os fundadores e licenciar a tecnologia. O GitHub Copilot atende 20M+ desenvolvedores (de gratuito a US$39/mês).

A estratégia do Google é integração vertical: modelos (Gemini) → IDE (Firebase Studio/Antigravity) → deploy (Firebase/Cloud Run) → monitoramento. E o free-first como ataque direto ao Cursor e Windsurf.

Ambos os produtos suportam regras de projeto, que são arquivos de configuração definindo o comportamento da IA. O Firebase Studio lê, em ordem de prioridade: .idx/airules.md, GEMINI.md, .gemini/styleguide.md, AGENTS.md, e .cursorrules (pra compatibilidade). O Antigravity usa .antigravity/rules.md e também reconhece .cursorrules. Essa camada de configuração é o que transforma uma ferramenta genérica em algo que realmente entende o seu projeto.


Claude Skills, Projects e o cérebro do seu projeto

A segunda peça da stack é o Claude, não como chatbot, mas como plataforma de trabalho com memória e capacidades modulares.

Claude Projects são workspaces persistentes no claude.ai. Cada projeto tem sua base de conhecimento (documentos uploadados, PDFs, código), instruções customizadas que se aplicam a todos os chats do projeto, e históricos separados. O detalhe que faz diferença: o contexto dos documentos e das instruções persiste entre conversas, criando continuidade que um chat comum não oferece. Disponível em planos Pro (US$20/mês), Team (US$30/mês) e Enterprise.

Claude Skills (Agent Skills) são o salto de qualidade. Lançadas em outubro de 2025 e atualizadas pesado em dezembro, Skills são módulos autocontidos: diretórios com um arquivo SKILL.md contendo instruções, scripts e recursos que o Claude carrega dinamicamente quando são relevantes. São composáveis (empilham-se), portáveis (funcionam no claude.ai, Claude Code, API e até em ferramentas não-Anthropic como Cursor e Gemini CLI), e eficientes (carregam só quando necessário).

O poder real aparece na combinação com o MCP (Model Context Protocol), padrão aberto criado pela Anthropic em novembro de 2024 para conectar agentes a ferramentas externas. A adoção foi rápida: OpenAI, Google DeepMind, Microsoft e GitHub adotaram o protocolo. Em dezembro de 2025, o MCP foi doado à Agentic AI Foundation sob a Linux Foundation. Números atuais: 97M+ downloads mensais de SDK, 5.800+ servidores MCP, 300+ clientes MCP. Jensen Huang da NVIDIA declarou que o trabalho com MCP revolucionou o cenário de IA.

A infraestrutura de memória de projeto virou um ecossistema. O CLAUDE.md funciona como memória hierárquica: user memory (~/.claude/CLAUDE.md, preferências globais), project memory (./CLAUDE.md, commitado no Git, compartilhado com o time), local memory (CLAUDE.local.md, overrides pessoais), e subdirectory memory. O comando /init gera um CLAUDE.md starter baseado na estrutura do projeto; o Claude também mantém auto memory, que são aprendizados persistentes entre sessões sobre builds, debugging e estilo de código.

O AGENTS.md é o padrão universal: um formato aberto suportado por Claude Code, Cursor, Codex CLI, Gemini CLI, e outros. Já está presente em 60.000+ repositórios open-source. O repositório da OpenAI usa 88 arquivos AGENTS.md. A regra é simples: README.md é para humanos, AGENTS.md é para agentes.

A prática profissional que emerge disso é manter cinco documentos: Research Report, PRD (Product Requirements), Technical Design Document, AGENTS.md/CLAUDE.md, e Testing Documentation. Addy Osmani, engineering leader do Google Chrome, sintetizou bem: a qualidade do output de IA é diretamente proporcional à qualidade do contexto que você fornece. Projetos com CLAUDE.md bem-estruturado reduzem lembretes manuais em 40%, segundo o SFEIR Institute.


Firecrawl: a infraestrutura que alimenta agentes de IA

O Firecrawl é a peça que conecta agentes de IA à web aberta. Criado por Caleb Peffer, Eric Ciarla e Nicolas Silberstein Camara, nasceu do Y Combinator (S22) como um spin-off do Mendable, uma aplicação de “chat with your docs” usada por Snapchat, MongoDB e DoorDash. A equipe percebeu que o problema real estava antes: transformar dados da web em formato consumível por LLMs.

Os números: 350.000+ desenvolvedores e empresas usando a plataforma, 43.000+ stars no GitHub, 15x crescimento de receita no último ano, e a empresa já é lucrativa. Em agosto de 2025, levantou US$14.5M em Série A liderada pela Nexus Venture Partners, com participação de Tobias Lütke (CEO da Shopify), Zapier e Postman. Clientes incluem OpenAI, Alibaba, Replit e PricewaterhouseCoopers.

Na prática, o Firecrawl converte qualquer website em markdown limpo ou JSON estruturado, lidando com JavaScript rendering, mecanismos anti-bot e conteúdo dinâmico. Oferece scrape (URL única), crawl (site inteiro), search (busca + scrape), extract (linguagem natural → JSON), e um modo Agent autônomo. O diferencial técnico é o Fire-Engine proprietário: 33% mais rápido e 40% maior taxa de sucesso que scrapers tradicionais. Integra com Claude, Cursor e Windsurf via MCP. O plano Standard custa US$83/mês para 100.000 créditos.

Pro contexto desse artigo: o Firecrawl é o tipo de ferramenta que não existe dentro de plataformas fechadas de vibe coding. É infraestrutura que você controla, conecta via API ou MCP, e que dá aos seus agentes a capacidade de pesquisar, extrair e processar dados da web real.


Skills como o novo infoproduto: de ebooks a conhecimento executável

O mercado de produtos digitais está mudando de conhecimento estático (ebooks, cursos) para conhecimento executável (prompts, automações, skills, agentes).

O PromptBase, primeiro marketplace de prompts (lançado em junho de 2022), tem 260.000+ prompts, 425.000+ usuários e opera com 20% de comissão. Prompts individuais custam US$1.99-9.99. Creators no topo reportam ganhos de US$5.000-20.000/mês combinando vendas de prompts, consultoria e produtos digitais. Uma loja no Etsy vendendo prompts de IA gerou mais de US$9.300 a um preço médio de US$3.43 por prompt.

Mas a evolução real está nos marketplaces de automação. O n8n (workflow automation open-source) hospeda 8.515 templates comunitários. Em torno dele, surgiram marketplaces independentes: n8nmarket.com, ManageN8N, HaveWorkflow.com, AutomationWorkflows.io, SellYour.ai. A dinâmica mudou: não se vende mais “como fazer”. Vende-se a coisa que faz.

O GPT Store da OpenAI ilustra o limite do modelo centralizado. Com 3 milhões+ de GPTs criados, a monetização para criadores é quase inexistente: a maioria ganha zero, o programa de receita exige 25+ conversas/semana, e os que qualificam reportam centenas a poucos milhares de dólares por trimestre. Criadores espertos ignoram o GPT Store e monetizam direto via Stripe e Gumroad, cobrando US$50-500 por acesso.

O que muda o jogo são as Claude Skills como formato de distribuição. Skills são portáveis (funcionam em Claude Code, Cursor, Gemini CLI, Codex CLI), composáveis, e version-controlled. O repositório anthropics/skills no GitHub funciona como um marketplace público. A Anthropic publicou Skills como padrão aberto em dezembro de 2025, sinalizando que o formato é maior que qualquer ferramenta específica.

O mercado de automação por workflow está projetado para crescer de US$20.3 bilhões (2023) para US$71 bilhões até 2031. O mercado de ferramentas de escrita com IA, de US$1.5 bilhão (2024) para US$6.5 bilhões até 2033. A oportunidade está no “missing middle”: não são desenvolvedores elite, são profissionais de negócio que querem apertar um botão e obter um resultado.

A evolução segue uma escada: venda de prompts de texto (2022-2023) → venda de apps no-code com IA (2024) → venda de workflows de agentes autônomos (2025-2026). Quem entende isso primeiro, define o mercado.


Conclusão: ownership como vantagem competitiva

A real é que os dados contam uma história bem clara: as plataformas de vibe coding vendem conveniência a US$25/mês e entregam contas de US$300 a US$1.000, código com 2.74x mais vulnerabilidades, e lock-in de backend que transforma seu produto em refém. O modelo econômico se parece mais com monetização de jogos mobile do que com software profissional.

A alternativa não é voltar a programar na mão. É adotar uma stack que te dá controle sem te enterrar em complexidade. Google Antigravity oferece uma IDE agent-first com 5 agentes paralelos, suporte a múltiplos modelos, e custo zero hoje. Claude Projects + Skills transformam o Claude de chatbot em plataforma de trabalho com memória persistente, módulos reutilizáveis e conexão a qualquer ferramenta via MCP. Firecrawl dá aos agentes acesso à web real. E arquivos como CLAUDE.md e AGENTS.md criam um “cérebro” de projeto que sobrevive entre sessões e se compartilha com o time.

DHH gastava US$3.2 milhões por ano alugando servidores e economizou US$10 milhões comprando os seus. Karpathy inventou o termo “vibe coding” num tweet casual e um ano depois propôs “agentic engineering” como a versão séria. Akita abraçou vibe coding, mas com Extreme Programming como fundação. O padrão é consistente: a ferramenta muda, a disciplina permanece. O que a 37signals fez com infraestrutura, profissionais de negócio podem fazer com sua stack de IA: parar de alugar, começar a construir sobre o que é seu.