· 16 min de leitura · ...

A última milha do ROI: por que a IA funciona para o dev e some na empresa

Não é bolha. O ganho individual da IA é real e medido, mas vaza no caminho até o resultado da empresa. Com dados de WRITER, MIT, Gartner, Goldman, Forrester e Google DORA, mostro onde o dinheiro some e o que separa os 29% que capturam valor.

IAROIcusto de tokensagentesbolhaprodutividadeharness
Indice

A Uber queimou o orçamento inteiro de ferramentas de IA de 2026 em quatro meses. A Microsoft, sócia de boa parte da Anthropic, começou a cancelar licenças internas do Claude Code porque uma divisão consumiu tanto token que estourou o orçamento anual da área em poucos meses. Quando duas das empresas mais maduras em engenharia do planeta batem no teto de custo ao mesmo tempo, a sala inteira começa a fazer a mesma pergunta: e se isso aqui for uma bolha prestes a estourar?

Eu acho a pergunta errada. Não porque o custo não seja real, ele é, e está medido. É errada porque “bolha” sugere que a tecnologia é fake e vai desinflar. Não é isso que os dados mostram. O que os dados mostram é mais incômodo: a tecnologia entrega, mas o valor vaza no caminho entre o desenvolvedor que ficou mais produtivo e o resultado que deveria aparecer na empresa. Esse vazamento tem nome, e eu vou chamar ele de a última milha do ROI.

Esse post é sobre onde o dinheiro some nessa última milha, com dado de verdade, e sobre o que separa quem captura valor de quem só paga a conta.

O debate errado

A internet adora dois extremos: “IA funciona e vai substituir todo mundo” contra “IA é hype e vai estourar”. Ninguém sério defende nenhum dos dois. O debate honesto começa quando você troca esse falso dilema por duas perguntas concretas.

Primeira: o valor que a IA gera supera o custo total dela? Custo total, não assinatura. Token, risco de segurança e atrito de gente boa indo embora entram na conta.

Segunda: quem paga a conta está capturando esse valor? Porque, como você vai ver, o ganho que aparece no seu código nem sempre aparece no balanço da empresa que comprou a licença.

Essas duas perguntas têm respostas diferentes, e é justamente aí que mora a confusão. A resposta da primeira é “depende de quem”. A resposta da segunda é “quase ninguém”. Junte as duas e você entende por que 7 em cada 10 empresas estão frustradas com IA enquanto os devs que sabem usar não largam mais a ferramenta.

A conta que não para de subir

Vamos falar de dinheiro de verdade primeiro. Bill Staples, CEO do GitLab, escreveu para os clientes que a conta de ferramentas por desenvolvedor saiu de dezenas de dólares por mês para centenas, e está indo para milhares. O motivo é puramente técnico. Um agente de IA não é um autocomplete que sugere a próxima linha. É um processo que abre várias requisições por tarefa, lê arquivos, roda testes, itera a noite inteira e entrega funcionalidade fechada. Cada uma dessas iterações queima token.

A Gartner mostra que 29% das organizações já gastam entre US$200 e US$500 por desenvolvedor por mês só em token, e que os power users passam de US$2.000 mensais. Eu conheço gente que chegou perto de cinco dígitos em um mês. E o detalhe que quebra o modelo de negócio: um VP da NVIDIA, Bryan Catanzaro, disse a frase mais honesta de todo esse debate. Para o time dele, o custo de compute já é maior que o custo dos funcionários. Leia de novo. A máquina ficou mais cara que o próprio dev.

Foi exatamente isso que estourou o modelo de assinatura ilimitada. O GitHub pausou novas assinaturas pagas do Copilot em abril de 2026 porque preço fixo com uso ilimitado não fecha mais quando o agente consome sem limite. O GitLab mudou o jeito de cobrar o assento: ele deixou de ser uma unidade de valor e virou uma unidade de tarefa. O custo subiu, isso é fato. Eu já tinha tocado nessa ferida em O Custo Invisível dos Tokens Desperdiçados, e o que era um problema de eficiência virou um problema de modelo de negócio.

O paradoxo agêntico: token mais barato, conta maior

Aqui a matemática parece não bater. O preço do token está despencando. A própria Gartner projeta que rodar inferência em um modelo de um trilhão de parâmetros vai custar mais de 90% menos até 2030. E mesmo assim a conta das empresas vai subir. Por quê?

Porque o consumo cresce mais rápido do que o preço cai. A Goldman Sachs estima que o uso agêntico vai multiplicar o consumo de token por 24 vezes até 2030, chegando à casa dos quatrilhões de tokens por mês. Token mais barato, conta maior. Esse é o paradoxo central da era agêntica, e ele não é novo: tem nome desde 1865.

Paradoxo de Jevons. Quando uma tecnologia fica mais eficiente, a demanda por ela cresce em vez de cair, e o consumo total sobe mesmo com o custo unitário menor. William Jevons observou isso com carvão na Inglaterra vitoriana. Satya Nadella e Dario Amodei invocam o mesmo princípio para token hoje.

Para entregar código de qualidade com agente, você precisa de um harness que gasta mais token, não menos: mais contexto, mais testes rodados, mais verificação. Quanto melhor você quer o resultado, mais você consome. O barateamento do token não é um alívio na fatura, é um convite para gastar mais. Quem espera a conta cair com o tempo entendeu o gráfico ao contrário.

O outro lado do número

Custo alto não é problema se o retorno for maior. O problema é que o retorno trava. A WRITER fez em 2026 uma pesquisa de adoção de IA com 2.400 trabalhadores, metade C-level, metade funcionários. O resultado: 79% das empresas admitem enfrentar problemas sérios na adoção, e só 29% veem ROI significativo de IA generativa. Sete em cada dez botando dinheiro sem ver retorno claro.

E quando você troca a régua de “percepção do executivo” para “impacto medido no balanço”, o número desaba. O relatório do MIT NANDA, “State of AI in Business 2025”, mediu impacto real no P&L e concluiu que 95% dos pilotos de IA generativa não entregam nenhum impacto financeiro mensurável. Cerca de 5% entregam.

RéguaQuem medeSucesso
ROI percebido pelo executivoWRITER (2.400 trabalhadores)29%
Impacto medido no P&LMIT NANDA (State of AI in Business)~5%

Repare que são metodologias diferentes, com severidades diferentes, e por isso os números diferem. Mas as duas apontam para o mesmo buraco. Quando uma fonte que mede percepção e outra que mede balanço chegam à mesma conclusão por caminhos opostos, tem algo estrutural acontecendo. E aqui está o ponto que muda tudo: se uma fração tão pequena consegue resultado real com a mesma tecnologia que está disponível para todo mundo, então o teto não é o modelo. O teto é o quanto a empresa está disposta a mudar para chegar lá.

Onde o dinheiro vaza

Agora o pivô do post inteiro. O mesmo levantamento que diz que só 29% veem ROI também diz que os superusers economizam quase nove horas por semana e são até cinco vezes mais produtivos. Noventa e sete por cento dos executivos relatam benefício individual claro. Ou seja: o dev sênior, o staff, o tech lead que sabe usar IA tem um ganho gigante, medido, inegável.

Pare e olhe para o contraste. O ganho no nível da pessoa é enorme e medido. O ganho no nível da empresa não aparece, ou demora muito para aparecer. Só existe uma explicação possível para essa diferença. O dinheiro está vazando no trajeto entre o ganho do indivíduo e o resultado da organização. É isso que eu chamo de última milha do ROI.

A Última Milha do ROI. A distância entre a produtividade que a IA gera no desenvolvedor e o valor que chega ao resultado da empresa. A primeira é curta e medida em horas economizadas. A segunda é longa e cheia de fricção: integração, processo, governança, cultura. Quase todo o ROI prometido se perde nesse trajeto, e nenhuma licença nova encurta ele.

O diagnóstico do próprio MIT é cirúrgico: o problema não é a qualidade do modelo, é a integração e o learning gap da ferramenta dentro da organização. O modelo é o caminhão. A última milha é a rua esburacada entre o galpão e a porta do cliente. Você pode comprar o caminhão mais rápido do mundo e ainda assim a encomenda não chega.

Colher o fruto sem plantar a árvore

Por que o ganho individual não vira ganho da empresa? Porque transformar produtividade em ROI de verdade exige três coisas que ninguém quer pagar: redesenho de processo, governança e mudança de cultura. Essas três não se compram com cartão de crédito nem se resolvem com hype.

O que a maioria faz é o contrário. Compra licença, distribui para os devs, espera a mágica acontecer e cobra deadline igual cobrava antes. É colher o fruto sem plantar a árvore. A árvore é o trabalho chato: redesenhar o fluxo de revisão, definir onde o agente pode e não pode atuar, treinar o time, reconstruir o harness, mudar a forma como a equipe mede sucesso. Sem isso, a ferramenta amplifica o caos que já existia em vez de gerar valor novo.

E é exatamente a parte que ninguém quer tocar, porque não tem atalho. Você não pula a parte difícil. Quem pula fica com a fatura do token e sem o retorno, e depois conclui que “IA não presta”. A IA presta. O que faltou foi plantar a árvore.

A bolha de verdade é demitir antes de saber ganhar

Tem um comportamento no mercado que sim, eu chamaria de bolha. Olhe o contraste. Sessenta e nove por cento das empresas relatam demissões atribuídas à IA, mas 39% admitem não ter nenhuma estratégia formal para gerar receita com essas ferramentas. Traduzindo: está demitindo antes de saber como ganhar dinheiro com a tecnologia. Isso não faz sentido nenhum.

E a Gartner enterra o argumento de que cortar gera retorno. Em um levantamento com 350 executivos, 80% relataram redução de quadro, e não houve correlação nenhuma entre cortar e ter mais ROI. As empresas que mais cortam não são as que mais lucram. A Forrester foi além: 55% das empresas que demitiram citando IA já se arrependeram, porque perderam conhecimento institucional de domínio, gente sênior, e ganharam custo de retrabalho e de recontratação. Sam Altman deu nome a parte disso: AI washing, usar a IA como desculpa para um corte que ia acontecer de qualquer jeito. De mais de cem mil demissões analisadas em um recorte, só cerca de 7% citavam IA de fato.

O caso do GitLab é o retrato perfeito da contradição. Empresa lucrativa, crescendo 16%, com US$220 milhões de fluxo de caixa livre, e mesmo assim cortou 7% do quadro vestindo a narrativa da era agêntica.

A narrativa do corteA realidade nos dados
Cortar quadro libera margem e prova maturidade em IASem correlação entre corte e ROI (Gartner, 350 execs)
A IA substitui o sênior55% se arrependem por perda de conhecimento (Forrester)
O mercado premia quem corta cedoAção do GitLab caiu mais de 8% no dia do anúncio
É decisão de eficiência movida por IABoa parte é AI washing, corte que ia acontecer mesmo

Repare na última linha da realidade. A ação do GitLab caiu mais de 8% no mesmo dia. O mercado que antes premiava esses cortes começou a desconfiar. Estamos entrando na fase da realidade, e ela é menos generosa com a narrativa fácil.

O custo total que ninguém soma

Tem um custo da IA que não aparece em nenhuma fatura, e é o cultural. Cinquenta e quatro por cento dos executivos dizem que adotar IA está rasgando a empresa por dentro. Vinte e nove por cento dos funcionários admitem sabotar a estratégia de IA da empresa, número que sobe para 44% entre os mais jovens. E 67% relatam que dados já vazaram por alguma ferramenta de IA não aprovada.

Some isso ao token. O custo total que eu mencionei lá no começo não é só inferência. É token, mais risco de segurança, mais o atrito de gente boa que vai embora porque a adoção foi imposta sem processo. Quando você soma tudo, entende por que, na média, hoje o custo supera o retorno capturado mesmo nos lugares onde a tecnologia tecnicamente funciona. O problema raramente é a ferramenta. É tudo que está em volta dela e que ninguém colocou na planilha.

Oito meses até o retorno

Se a última milha é tão cara de pavimentar, vale a pena? Os dados do Google, pelas métricas DORA, dizem que sim, com paciência. O modelo deles para uma organização de engenharia estima um payback de cerca de oito meses para o investimento em IA se pagar, e um retorno na casa de 39% no primeiro ano para quem atravessa essa curva.

Oito meses fazendo o trabalho que desacelera no curto prazo: treinar gente, remover gargalo, pagar débito técnico, ajustar processo. É a curva J clássica. Você piora antes de melhorar. A maioria desiste no vale da curva, conclui que não deu certo e volta a cobrar deadline. Quem aguenta o vale é quem colhe o retorno do outro lado.

E é aqui que o harness importa. Eu já argumentei em Do SonarQube ao Processo Agentic que métrica vira função de recompensa quando o agente otimiza contra ela, e em O Rato no Labirinto que o desempenho do agente depende mais do labirinto do que do rato. A pavimentação da última milha é exatamente isso: construir os trilhos que transformam ganho individual em ganho estrutural. Sem trilho, a produtividade do dev evapora antes de chegar ao balanço.

Por que é caminho sem volta

Apesar de tudo isso, eu não tenho dúvida de que é caminho sem volta. E não é fé, é o que os dados sustentam.

Primeiro, o ganho individual não é percepção, é tempo medido. Nove horas por semana é mais que um dia útil inteiro. Para um sênior, um staff, um principal, isso é superpoder. Segundo, o mercado de ferramentas de coding com IA mais que dobrou em pouco tempo. Gente pagando caro e reclamando do preço, mas sem largar, porque vê valor. Isso não é comportamento de bolha estourando, é comportamento de quem encontrou alavanca.

Terceiro, o argumento histórico. Pelo paradoxo de Jevons, eficiência maior puxa demanda maior, não desemprego em massa. David Solomon, CEO da Goldman Sachs, escreveu que o apocalipse de empregos está superestimado e que a economia se adapta como sempre se adaptou. O próprio Dario Amodei, da Anthropic, recuou da previsão de que a IA eliminaria metade dos empregos júnior, reformulando para a lógica de Jevons: se você automatiza 90% da tarefa, todo mundo passa a fazer os 10% restantes, e isso cria trabalho novo. Um estudo da Harvard Business School mostra exatamente esse deslocamento: queda de 17% nas vagas de funções automatizáveis e alta de 22% nas funções de amplificação.

Pensa no carro elétrico e no carro autônomo. Por que ainda não tem em todo lugar? Porque as cidades precisam se adaptar, a infraestrutura precisa mudar, o sistema precisa treinar em cada contexto novo. Mas é inevitável. Ninguém vai voltar para o passado. A IA no desenvolvimento está na mesma curva: a adoção é desigual, dolorida, cheia de quem está subindo do jeito errado, mas a direção não tem retorno.

O que separa os 29%

Então o que os 29% que capturam valor fazem de diferente? Eles tratam IA como redesenho de processo e amplificação das pessoas, não como substituição. E tecnicamente, eles têm harness.

Traduzindo para quem não acompanha meus outros posts: se o seu projeto tem teste com boa cobertura, contexto claro, arquitetura legível e convenções definidas, a IA vira um amplificador desses padrões. Ela aplica a mesma convenção em duzentos arquivos sem cansar. Ela escreve mais teste do que um humano escreveria com a mesma paciência. Ela propaga padrão sênior para o código do júnior automaticamente. Time com maturidade e bom harness entrega mais código, mais limpo, com mais qualidade. Time sem harness entrega mais caos, mais rápido.

É a mesma tese que defendi em A Alucinação Vem do Código, Não do Modelo: o vetor que mais muda a saída de um agente não é o modelo, é a engenharia em volta dele. Os 29% pavimentaram a última milha. Os outros 71% compraram o caminhão e deixaram a rua esburacada.

Conclusão

Junte tudo. O custo da IA é real e está subindo, em alguns times já passou o custo de gente. O retorno existe, mas trava no nível individual e não sobe para a empresa, porque falta processo, governança e cultura. Demitir não é fonte de retorno, na maioria das vezes é o oposto. E mesmo com tudo isso, é caminho sem volta, porque o valor de base é real e o mercado já decidiu.

Por isso a metáfora da bolha falha. Bolha estoura e some. O que está acontecendo é outra coisa: uma curva de adoção que a maioria está subindo do jeito errado, pagando a conta sem pavimentar a última milha. A IA não vai desinflar. Quem vai ficar para trás é quem achou que dava para pular o dever de casa, e vai continuar pagando o token enquanto reclama que a tecnologia não entrega.

Agora eu quero saber de você, que vive isso na pele. A IA está amplificando o seu time e o seu trabalho, ou virou só uma desculpa para corte e mais pressão? A resposta diz de que lado da última milha você está.

Referências

  1. WRITER (2026). “Enterprise AI Adoption Survey 2026”. 2.400 trabalhadores. writer.com/blog/enterprise-ai-adoption-2026
  2. MIT NANDA (2025). “The GenAI Divide: State of AI in Business 2025”. Cobertura: fortune.com
  3. Staples, B. / GitLab. “GitLab CEO sees developer tool bill increasing 100-fold”. infoworld.com
  4. Gartner (2026). Projeção de custo de inferência para LLM de 1 trilhão de parâmetros até 2030. gartner.com
  5. Goldman Sachs (2025). “AI agents forecast to boost tech cash flow as usage soars”. goldmansachs.com
  6. Catanzaro, B. / NVIDIA. “Cost of AI is greater than cost of employees”. fortune.com
  7. The Next Web (2026). “GitHub pauses Copilot sign-ups over agentic AI usage”. thenextweb.com
  8. Gartner (2026). “AI layoffs may create budget room but do not deliver returns”. 350 executivos. gartner.com
  9. Forrester (2026). “The AI layoff trap: why half will be quietly rehired”. hrexecutive.com
  10. Altman, S. (2026). “AI washing” e demissões. fortune.com
  11. The Next Web (2026). “GitLab layoffs and the agentic era”. thenextweb.com
  12. WRITER / Workplace Intelligence (2026). “AI adoption is tearing companies apart”. hrgrapevine.com
  13. Google DORA (2025). “The ROI of AI-assisted software development”. cloud.google.com
  14. Solomon, D. / Goldman Sachs (2026). “AI job apocalypse is overblown”. webpronews.com
  15. Amodei, D. / Anthropic (2026). Recuo da previsão sobre empregos júnior. fortune.com
  16. Harvard Business School (2026). “How AI is changing the labor market”. hbr.org
  17. NPR Planet Money (2025). “Jevons paradox e a economia da IA”. npr.org
  18. Yahoo Finance (2026). “Uber burned its entire 2026 AI budget”. finance.yahoo.com
  19. Windows Central (2026). “Microsoft cancels Claude Code licenses”. windowscentral.com

Comentários

Carregando comentários...

Deixe um comentário

Posts relacionados

Fique por dentro

Receba artigos sobre arquitetura de software, IA e projetos open source direto no seu e-mail.