A última milha do ROI: por que a IA funciona para o dev e some na empresa

A Uber queimou o orçamento inteiro de ferramentas de IA de 2026 em quatro meses. A Microsoft, sócia de boa parte da Anthropic, começou a cancelar licenças internas do Claude Code porque uma divisão consumiu tanto token que estourou o orçamento anual da área em poucos meses. Quando duas das empresas mais maduras em engenharia do planeta batem no teto de custo ao mesmo tempo, a sala inteira começa a fazer a mesma pergunta: e se isso aqui for uma bolha prestes a estourar?

Eu acho a pergunta errada. Não porque o custo não seja real, ele é, e está medido. É errada porque “bolha” sugere que a tecnologia é fake e vai desinflar. Não é isso que os dados mostram. O que os dados mostram é mais incômodo: a tecnologia entrega, mas o valor vaza no caminho entre o desenvolvedor que ficou mais produtivo e o resultado que deveria aparecer na empresa. Esse vazamento tem nome, e eu vou chamar ele de a última milha do ROI.

Esse post é sobre onde o dinheiro some nessa última milha, com dado de verdade, e sobre o que separa quem captura valor de quem só paga a conta.

O debate errado

A internet adora dois extremos: “IA funciona e vai substituir todo mundo” contra “IA é hype e vai estourar”. Ninguém sério defende nenhum dos dois. O debate honesto começa quando você troca esse falso dilema por duas perguntas concretas.

Primeira: o valor que a IA gera supera o custo total dela? Custo total, não assinatura. Token, risco de segurança e atrito de gente boa indo embora entram na conta.

Segunda: quem paga a conta está capturando esse valor? Porque, como você vai ver, o ganho que aparece no seu código nem sempre aparece no balanço da empresa que comprou a licença.

Essas duas perguntas têm respostas diferentes, e é justamente aí que mora a confusão. A resposta da primeira é “depende de quem”. A resposta da segunda é “quase ninguém”. Junte as duas e você entende por que 7 em cada 10 empresas estão frustradas com IA enquanto os devs que sabem usar não largam mais a ferramenta.

A conta que não para de subir

Vamos falar de dinheiro de verdade primeiro. Bill Staples, CEO do GitLab, escreveu para os clientes que a conta de ferramentas por desenvolvedor saiu de dezenas de dólares por mês para centenas, e está indo para milhares. O motivo é puramente técnico. Um agente de IA não é um autocomplete que sugere a próxima linha. É um processo que abre várias requisições por tarefa, lê arquivos, roda testes, itera a noite inteira e entrega funcionalidade fechada. Cada uma dessas iterações queima token.

A Gartner mostra que 29% das organizações já gastam entre US$200 e US$500 por desenvolvedor por mês só em token, e que os power users passam de US$2.000 mensais. Eu conheço gente que chegou perto de cinco dígitos em um mês. E o detalhe que quebra o modelo de negócio: um VP da NVIDIA, Bryan Catanzaro, disse a frase mais honesta de todo esse debate. Para o time dele, o custo de compute já é maior que o custo dos funcionários. Leia de novo. A máquina ficou mais cara que o próprio dev.

Foi exatamente isso que estourou o modelo de assinatura ilimitada. O GitHub pausou novas assinaturas pagas do Copilot em abril de 2026 porque preço fixo com uso ilimitado não fecha mais quando o agente consome sem limite. O GitLab mudou o jeito de cobrar o assento: ele deixou de ser uma unidade de valor e virou uma unidade de tarefa. O custo subiu, isso é fato. Eu já tinha tocado nessa ferida em O Custo Invisível dos Tokens Desperdiçados, e o que era um problema de eficiência virou um problema de modelo de negócio.

O paradoxo agêntico: token mais barato, conta maior

Aqui a matemática parece não bater. O preço do token está despencando. A própria Gartner projeta que rodar inferência em um modelo de um trilhão de parâmetros vai custar mais de 90% menos até 2030. E mesmo assim a conta das empresas vai subir. Por quê?

Porque o consumo cresce mais rápido do que o preço cai. A Goldman Sachs estima que o uso agêntico vai multiplicar o consumo de token por 24 vezes até 2030, chegando à casa dos quatrilhões de tokens por mês. Token mais barato, conta maior. Esse é o paradoxo central da era agêntica, e ele não é novo: tem nome desde 1865.

Paradoxo de Jevons. Quando uma tecnologia fica mais eficiente, a demanda por ela cresce em vez de cair, e o consumo total sobe mesmo com o custo unitário menor. William Jevons observou isso com carvão na Inglaterra vitoriana. Satya Nadella e Dario Amodei invocam o mesmo princípio para token hoje.

Para entregar código de qualidade com agente, você precisa de um harness que gasta mais token, não menos: mais contexto, mais testes rodados, mais verificação. Quanto melhor você quer o resultado, mais você consome. O barateamento do token não é um alívio na fatura, é um convite para gastar mais. Quem espera a conta cair com o tempo entendeu o gráfico ao contrário.

O outro lado do número

Custo alto não é problema se o retorno for maior. O problema é que o retorno trava. A WRITER fez em 2026 uma pesquisa de adoção de IA com 2.400 trabalhadores, metade C-level, metade funcionários. O resultado: 79% das empresas admitem enfrentar problemas sérios na adoção, e só 29% veem ROI significativo de IA generativa. Sete em cada dez botando dinheiro sem ver retorno claro.

E quando você troca a régua de “percepção do executivo” para “impacto medido no balanço”, o número desaba. O relatório do MIT NANDA, “State of AI in Business 2025”, mediu impacto real no P&L e concluiu que 95% dos pilotos de IA generativa não entregam nenhum impacto financeiro mensurável. Cerca de 5% entregam.

Régua	Quem mede	Sucesso
ROI percebido pelo executivo	WRITER (2.400 trabalhadores)	29%
Impacto medido no P&L	MIT NANDA (State of AI in Business)	~5%

Repare que são metodologias diferentes, com severidades diferentes, e por isso os números diferem. Mas as duas apontam para o mesmo buraco. Quando uma fonte que mede percepção e outra que mede balanço chegam à mesma conclusão por caminhos opostos, tem algo estrutural acontecendo. E aqui está o ponto que muda tudo: se uma fração tão pequena consegue resultado real com a mesma tecnologia que está disponível para todo mundo, então o teto não é o modelo. O teto é o quanto a empresa está disposta a mudar para chegar lá.

Onde o dinheiro vaza

Agora o pivô do post inteiro. O mesmo levantamento que diz que só 29% veem ROI também diz que os superusers economizam quase nove horas por semana e são até cinco vezes mais produtivos. Noventa e sete por cento dos executivos relatam benefício individual claro. Ou seja: o dev sênior, o staff, o tech lead que sabe usar IA tem um ganho gigante, medido, inegável.

Pare e olhe para o contraste. O ganho no nível da pessoa é enorme e medido. O ganho no nível da empresa não aparece, ou demora muito para aparecer. Só existe uma explicação possível para essa diferença. O dinheiro está vazando no trajeto entre o ganho do indivíduo e o resultado da organização. É isso que eu chamo de última milha do ROI.

A Última Milha do ROI. A distância entre a produtividade que a IA gera no desenvolvedor e o valor que chega ao resultado da empresa. A primeira é curta e medida em horas economizadas. A segunda é longa e cheia de fricção: integração, processo, governança, cultura. Quase todo o ROI prometido se perde nesse trajeto, e nenhuma licença nova encurta ele.

O diagnóstico do próprio MIT é cirúrgico: o problema não é a qualidade do modelo, é a integração e o learning gap da ferramenta dentro da organização. O modelo é o caminhão. A última milha é a rua esburacada entre o galpão e a porta do cliente. Você pode comprar o caminhão mais rápido do mundo e ainda assim a encomenda não chega.

Colher o fruto sem plantar a árvore

Por que o ganho individual não vira ganho da empresa? Porque transformar produtividade em ROI de verdade exige três coisas que ninguém quer pagar: redesenho de processo, governança e mudança de cultura. Essas três não se compram com cartão de crédito nem se resolvem com hype.

O que a maioria faz é o contrário. Compra licença, distribui para os devs, espera a mágica acontecer e cobra deadline igual cobrava antes. É colher o fruto sem plantar a árvore. A árvore é o trabalho chato: redesenhar o fluxo de revisão, definir onde o agente pode e não pode atuar, treinar o time, reconstruir o harness, mudar a forma como a equipe mede sucesso. Sem isso, a ferramenta amplifica o caos que já existia em vez de gerar valor novo.

E é exatamente a parte que ninguém quer tocar, porque não tem atalho. Você não pula a parte difícil. Quem pula fica com a fatura do token e sem o retorno, e depois conclui que “IA não presta”. A IA presta. O que faltou foi plantar a árvore.

A bolha de verdade é demitir antes de saber ganhar

Tem um comportamento no mercado que sim, eu chamaria de bolha. Olhe o contraste. Sessenta e nove por cento das empresas relatam demissões atribuídas à IA, mas 39% admitem não ter nenhuma estratégia formal para gerar receita com essas ferramentas. Traduzindo: está demitindo antes de saber como ganhar dinheiro com a tecnologia. Isso não faz sentido nenhum.

E a Gartner enterra o argumento de que cortar gera retorno. Em um levantamento com 350 executivos, 80% relataram redução de quadro, e não houve correlação nenhuma entre cortar e ter mais ROI. As empresas que mais cortam não são as que mais lucram. A Forrester foi além: 55% das empresas que demitiram citando IA já se arrependeram, porque perderam conhecimento institucional de domínio, gente sênior, e ganharam custo de retrabalho e de recontratação. Sam Altman deu nome a parte disso: AI washing, usar a IA como desculpa para um corte que ia acontecer de qualquer jeito. De mais de cem mil demissões analisadas em um recorte, só cerca de 7% citavam IA de fato.

O caso do GitLab é o retrato perfeito da contradição. Empresa lucrativa, crescendo 16%, com US$220 milhões de fluxo de caixa livre, e mesmo assim cortou 7% do quadro vestindo a narrativa da era agêntica.

A narrativa do corte	A realidade nos dados
Cortar quadro libera margem e prova maturidade em IA	Sem correlação entre corte e ROI (Gartner, 350 execs)
A IA substitui o sênior	55% se arrependem por perda de conhecimento (Forrester)
O mercado premia quem corta cedo	Ação do GitLab caiu mais de 8% no dia do anúncio
É decisão de eficiência movida por IA	Boa parte é AI washing, corte que ia acontecer mesmo

Repare na última linha da realidade. A ação do GitLab caiu mais de 8% no mesmo dia. O mercado que antes premiava esses cortes começou a desconfiar. Estamos entrando na fase da realidade, e ela é menos generosa com a narrativa fácil.

O custo total que ninguém soma

Tem um custo da IA que não aparece em nenhuma fatura, e é o cultural. Cinquenta e quatro por cento dos executivos dizem que adotar IA está rasgando a empresa por dentro. Vinte e nove por cento dos funcionários admitem sabotar a estratégia de IA da empresa, número que sobe para 44% entre os mais jovens. E 67% relatam que dados já vazaram por alguma ferramenta de IA não aprovada.

Some isso ao token. O custo total que eu mencionei lá no começo não é só inferência. É token, mais risco de segurança, mais o atrito de gente boa que vai embora porque a adoção foi imposta sem processo. Quando você soma tudo, entende por que, na média, hoje o custo supera o retorno capturado mesmo nos lugares onde a tecnologia tecnicamente funciona. O problema raramente é a ferramenta. É tudo que está em volta dela e que ninguém colocou na planilha.

Oito meses até o retorno

Se a última milha é tão cara de pavimentar, vale a pena? Os dados do Google, pelas métricas DORA, dizem que sim, com paciência. O modelo deles para uma organização de engenharia estima um payback de cerca de oito meses para o investimento em IA se pagar, e um retorno na casa de 39% no primeiro ano para quem atravessa essa curva.

Oito meses fazendo o trabalho que desacelera no curto prazo: treinar gente, remover gargalo, pagar débito técnico, ajustar processo. É a curva J clássica. Você piora antes de melhorar. A maioria desiste no vale da curva, conclui que não deu certo e volta a cobrar deadline. Quem aguenta o vale é quem colhe o retorno do outro lado.

E é aqui que o harness importa. Eu já argumentei em Do SonarQube ao Processo Agentic que métrica vira função de recompensa quando o agente otimiza contra ela, e em O Rato no Labirinto que o desempenho do agente depende mais do labirinto do que do rato. A pavimentação da última milha é exatamente isso: construir os trilhos que transformam ganho individual em ganho estrutural. Sem trilho, a produtividade do dev evapora antes de chegar ao balanço.

Por que é caminho sem volta

Apesar de tudo isso, eu não tenho dúvida de que é caminho sem volta. E não é fé, é o que os dados sustentam.

Primeiro, o ganho individual não é percepção, é tempo medido. Nove horas por semana é mais que um dia útil inteiro. Para um sênior, um staff, um principal, isso é superpoder. Segundo, o mercado de ferramentas de coding com IA mais que dobrou em pouco tempo. Gente pagando caro e reclamando do preço, mas sem largar, porque vê valor. Isso não é comportamento de bolha estourando, é comportamento de quem encontrou alavanca.

Terceiro, o argumento histórico. Pelo paradoxo de Jevons, eficiência maior puxa demanda maior, não desemprego em massa. David Solomon, CEO da Goldman Sachs, escreveu que o apocalipse de empregos está superestimado e que a economia se adapta como sempre se adaptou. O próprio Dario Amodei, da Anthropic, recuou da previsão de que a IA eliminaria metade dos empregos júnior, reformulando para a lógica de Jevons: se você automatiza 90% da tarefa, todo mundo passa a fazer os 10% restantes, e isso cria trabalho novo. Um estudo da Harvard Business School mostra exatamente esse deslocamento: queda de 17% nas vagas de funções automatizáveis e alta de 22% nas funções de amplificação.

Pensa no carro elétrico e no carro autônomo. Por que ainda não tem em todo lugar? Porque as cidades precisam se adaptar, a infraestrutura precisa mudar, o sistema precisa treinar em cada contexto novo. Mas é inevitável. Ninguém vai voltar para o passado. A IA no desenvolvimento está na mesma curva: a adoção é desigual, dolorida, cheia de quem está subindo do jeito errado, mas a direção não tem retorno.

O que separa os 29%

Então o que os 29% que capturam valor fazem de diferente? Eles tratam IA como redesenho de processo e amplificação das pessoas, não como substituição. E tecnicamente, eles têm harness.

Traduzindo para quem não acompanha meus outros posts: se o seu projeto tem teste com boa cobertura, contexto claro, arquitetura legível e convenções definidas, a IA vira um amplificador desses padrões. Ela aplica a mesma convenção em duzentos arquivos sem cansar. Ela escreve mais teste do que um humano escreveria com a mesma paciência. Ela propaga padrão sênior para o código do júnior automaticamente. Time com maturidade e bom harness entrega mais código, mais limpo, com mais qualidade. Time sem harness entrega mais caos, mais rápido.

É a mesma tese que defendi em A Alucinação Vem do Código, Não do Modelo: o vetor que mais muda a saída de um agente não é o modelo, é a engenharia em volta dele. Os 29% pavimentaram a última milha. Os outros 71% compraram o caminhão e deixaram a rua esburacada.

Conclusão

Junte tudo. O custo da IA é real e está subindo, em alguns times já passou o custo de gente. O retorno existe, mas trava no nível individual e não sobe para a empresa, porque falta processo, governança e cultura. Demitir não é fonte de retorno, na maioria das vezes é o oposto. E mesmo com tudo isso, é caminho sem volta, porque o valor de base é real e o mercado já decidiu.

Por isso a metáfora da bolha falha. Bolha estoura e some. O que está acontecendo é outra coisa: uma curva de adoção que a maioria está subindo do jeito errado, pagando a conta sem pavimentar a última milha. A IA não vai desinflar. Quem vai ficar para trás é quem achou que dava para pular o dever de casa, e vai continuar pagando o token enquanto reclama que a tecnologia não entrega.

Agora eu quero saber de você, que vive isso na pele. A IA está amplificando o seu time e o seu trabalho, ou virou só uma desculpa para corte e mais pressão? A resposta diz de que lado da última milha você está.

Referências

WRITER (2026). “Enterprise AI Adoption Survey 2026”. 2.400 trabalhadores. writer.com/blog/enterprise-ai-adoption-2026
MIT NANDA (2025). “The GenAI Divide: State of AI in Business 2025”. Cobertura: fortune.com
Staples, B. / GitLab. “GitLab CEO sees developer tool bill increasing 100-fold”. infoworld.com
Gartner (2026). Projeção de custo de inferência para LLM de 1 trilhão de parâmetros até 2030. gartner.com
Goldman Sachs (2025). “AI agents forecast to boost tech cash flow as usage soars”. goldmansachs.com
Catanzaro, B. / NVIDIA. “Cost of AI is greater than cost of employees”. fortune.com
The Next Web (2026). “GitHub pauses Copilot sign-ups over agentic AI usage”. thenextweb.com
Gartner (2026). “AI layoffs may create budget room but do not deliver returns”. 350 executivos. gartner.com
Forrester (2026). “The AI layoff trap: why half will be quietly rehired”. hrexecutive.com
Altman, S. (2026). “AI washing” e demissões. fortune.com
The Next Web (2026). “GitLab layoffs and the agentic era”. thenextweb.com
WRITER / Workplace Intelligence (2026). “AI adoption is tearing companies apart”. hrgrapevine.com
Google DORA (2025). “The ROI of AI-assisted software development”. cloud.google.com
Solomon, D. / Goldman Sachs (2026). “AI job apocalypse is overblown”. webpronews.com
Amodei, D. / Anthropic (2026). Recuo da previsão sobre empregos júnior. fortune.com
Harvard Business School (2026). “How AI is changing the labor market”. hbr.org
NPR Planet Money (2025). “Jevons paradox e a economia da IA”. npr.org
Yahoo Finance (2026). “Uber burned its entire 2026 AI budget”. finance.yahoo.com
Windows Central (2026). “Microsoft cancels Claude Code licenses”. windowscentral.com