Bloco F · Semana 14 Tempo estimado: 22 min de leitura + ~3h de prática (mapear TCO Team Studio) Output prático: você precifica proposta Team Studio sabendo o que cobrir e com margem realista


TL;DR

Semana 13 te deu SLA e métricas. Agora o tema mais sensível em reunião com cliente: dinheiro. Cliente pergunta "quanto custa Team Studio?" e você precisa responder sem chutar pra cima (perde venda) nem pra baixo (queima caixa).

Você vai sair desta semana sabendo:

  1. TCO (Total Cost of Ownership) - o que vendedor genérico esconde e CFO experiente exige saber
  2. Custos escondidos de cloud - egress, idle, cross-region, backup, observability (onde gente perde dinheiro sem ver)
  3. Custo de LLMs em produção - modelos de billing, cálculo realista por interação, caching agressivo
  4. 4 modelos de pricing - fixed, usage-based, value-based, hybrid (quando usar cada)
  5. Como precificar serviço de IA com margem - custo direto, indireto, churn, margem alvo B2B
  6. Quando dar desconto, quando não dar - razões legítimas vs ruins
  7. Como Team Studio precifica em 2026 - 3 tiers com lógica explícita
  8. 5 perguntas pra reunião sobre custo
  9. Exercício prático - proposta pra rede de franquias com 200 unidades

1. TCO (Total Cost of Ownership)

TCO é o custo total de algo ao longo de toda a vida útil. Não é só preço de aquisição. Inclui:

  • Aquisição: setup inicial, licenças, contratação
  • Operação: manutenção mensal, suporte, atualizações, infraestrutura
  • Manutenção: bugs, evolução, retreinamento
  • Descomissionamento: custo de sair da solução (migração, downtime, retreinamento)

Por que TCO importa

Vendedor genérico fala em "preço da mensalidade". CFO experiente pergunta TCO em 3-5 anos. A diferença pode ser 5-10x.

Exemplo concreto: software com mensalidade R$ 2.000.

Item Ano 1 Ano 2-3 Total 3 anos
Mensalidade R$ 24.000 R$ 48.000 R$ 72.000
Setup + treinamento R$ 15.000 - R$ 15.000
Customizações iniciais R$ 25.000 - R$ 25.000
Manutenção de customizações - R$ 12.000 R$ 12.000
Integrações com legado R$ 8.000 R$ 4.000 R$ 12.000
Treinamento contínuo (rotatividade) R$ 3.000 R$ 6.000 R$ 9.000
TCO real R$ 75.000 R$ 70.000 R$ 145.000

Cliente que olhou só mensalidade pensava em R$ 72k. TCO real foi R$ 145k. Diferença de 2x.

Postura Team Studio: apresentar TCO 12-36 meses em proposta. Cliente que vê TCO desde o início confia. Cliente que descobre depois acha que foi enganado.

Componentes que vendedor esconde

  1. Setup e onboarding: configuração, integrações iniciais, treinamento da equipe
  2. Migração de dados: pegar dado do sistema antigo e colocar no novo
  3. Customizações: cliente sempre quer algo específico que não vem pronto
  4. Manutenção das customizações: quem mantém quando provider atualiza versão
  5. Treinamento contínuo: turnover força retreinamento
  6. Integrações com sistemas legados: ERP/CRM/folha do cliente
  7. Compliance interno: aprovações, auditorias, documentação
  8. Custo de sair: se cliente quiser trocar de fornecedor, quanto custa migrar

Componentes que cliente esquece

  1. Tempo do time do cliente: cada hora de reunião com fornecedor custa
  2. Oportunidade: 3 meses focados em implementar = 3 meses sem fazer outra coisa
  3. Risco de falha: implementação falha custa não só o investimento mas o atraso

Cenário Team Studio

Cliente pergunta: "Quanto custa Team Studio por mês?"

Resposta genérica ruim: "R$ 2.000/mês"

Resposta TCO honesta: "R$ 2.000/mês de mensalidade + R$ 8.000 de setup inicial (uma tarde de implantação + ajustes da semana seguinte) + R$ 0 de infraestrutura (rodamos no nosso ambiente) + R$ 0 de migração (não substituímos sistema, complementamos) + opcional R$ 500-3.000 por nova integração específica. Em 12 meses, TCO típico R$ 32-40k. Em 36 meses, R$ 80-100k considerando 1-2 expansões por ano."

Diferença em conversa: cliente sabe o que esperar, ROI é calculável, contrato fica robusto.


2. Custos escondidos de cloud

Cloud parece barato no início. Depois cresce sem ninguém notar. Vamos pelos principais ralos.

2.1 Egress (saída de dados)

Custo de mandar dado pra fora da cloud. Quase todo provider cobra.

  • AWS: USD 0.09/GB pra primeiros 10 TB/mês (sa-east-1 → internet)
  • GCP: similar, USD 0.08-0.12/GB
  • Azure: similar
  • Cloudflare R2: USD 0/GB (egress free, diferencial gigante)
  • Backblaze B2: USD 0.01/GB

Cenário comum: cliente serve vídeos. 1 TB de tráfego/mês = USD 90/mês só de egress AWS. Cresce pra 50 TB com viralização = USD 4.500/mês.

Mitigação: CDN agressivo (Cloudflare cacheia, custo de origem despenca). Usar serviços egress-free pra storage de objetos.

2.2 Idle (recursos sem uso)

VM rodando 24/7 a custo cheio mesmo sem tráfego. EBS volumes anexados a EC2s desligadas. Elastic IPs reservados não usados. Snapshots antigos esquecidos.

Cenário real (cliente típico): - 15 VMs criadas pra projetos pilotos, abandonadas, esquecidas: USD 800/mês - 200 GB de EBS volumes órfãos: USD 20/mês - 30 snapshots de 2 anos atrás: USD 50/mês - Total desperdício: USD 870/mês = USD 10.440/ano

Mitigação: AWS Trusted Advisor (alerta sobre idle), automação de scheduling (desliga dev/staging à noite), governança de tags (cada recurso tem owner).

2.3 Cross-region data transfer

Mover dado entre regiões da mesma cloud também custa.

  • AWS sa-east-1 → us-east-1: USD 0.02/GB
  • Inter-AZ na mesma região: USD 0.01/GB (escondido, mas existe)

Cenário comum: arquitetura multi-region por DR, mas réplica nunca testada. Dado fica replicando 24/7. 1 TB/dia = USD 600/mês só de transfer.

2.4 Backups e snapshots

Snapshots EBS, RDS automated backups, S3 versioning, replicação. Cada um cobra.

  • RDS automated backup: % do storage instance (geralmente 1-2x o tamanho)
  • EBS snapshot: USD 0.05/GB-month (sa-east-1)
  • S3 versioning sem lifecycle: storage cresce indefinidamente

Mitigação: lifecycle policy (apaga snapshots antigos automático), S3 Intelligent Tiering, validação periódica de "vale a pena manter?"

2.5 Logs e observability

CloudWatch Logs cobra ingestão (USD 0.50/GB) + storage (USD 0.03/GB-month).

Cenário real: app loga DEBUG em produção. 100 GB/dia de log. CloudWatch: - Ingestão: 100 GB × USD 0.50 × 30 dias = USD 1.500/mês - Storage: ~3 TB acumulando × USD 0.03 = USD 90/mês depois de 30 dias

Total: USD 1.500-1.800/mês só de log de DEBUG que ninguém lê.

Mitigação: log level INFO em produção (DEBUG só quando necessário), S3 com lifecycle pra logs frios, ferramentas de log mais baratas (Loki, ClickHouse).

2.6 FinOps como prática

FinOps = disciplina de gerenciar custo cloud como produto. Surgiu em 2018, popularizou em 2020-2022.

Princípios: 1. Visibilidade: todo recurso tem tag, todo dashboard mostra custo por área 2. Responsabilidade: cada time responsável pelo custo dele 3. Otimização contínua: rightsizing, reservations, savings plans 4. Forecasting: prever crescimento de custo antes de explodir

Ferramentas: AWS Cost Explorer, GCP Billing, Azure Cost Management, Vantage, CloudHealth, Cloudability, Apptio.

Em 2026, empresa com gasto cloud acima de USD 30k/mês tem FinOps formal (1 pessoa ou consultoria). Abaixo disso, é responsabilidade do CTO ou ops.


3. Custo de LLMs em produção

Cálculo realista de quanto custa rodar agentes de IA. Categoria que vendedor exagera (pra cima ou pra baixo) e cliente não sabe avaliar.

3.1 Modelos de billing

Provider típico cobra por token (unidade de texto, aproximadamente 3-4 caracteres em português).

Tabela de preços em meados de 2026 (USD por milhão de tokens):

Provedor Modelo Input Output
Anthropic Claude Opus 4.7 15 75
Anthropic Claude Sonnet 4.5 3 15
Anthropic Claude Haiku 4 0.80 4
OpenAI GPT-5 15 60
OpenAI GPT-5-mini 0.30 1.20
Google Gemini 2.5 Pro 3.50 10.50
Google Gemini 2.5 Flash 0.30 2.50

Preços caem ~30-50% ao ano desde 2023. Calcular sempre com preço atual, não com cotação antiga.

3.2 Cálculo realista por interação

Cenário Team Studio (atendimento WhatsApp típico):

Conversa de 5 turnos (cliente pergunta, agente responde, 5 vezes). - Cada turno: ~500 tokens de contexto (histórico + system prompt) + 200 tokens de resposta - 5 turnos: 5 × (500 + 200) = 3.500 tokens total - Mas contexto cresce a cada turno (carrega histórico anterior): - Turno 1: 700 in + 200 out - Turno 5: ~2.500 in + 200 out (histórico acumulado) - Total estimado: ~8.000 input + 1.000 output

Custo por conversa de 5 turnos: - Com Claude Haiku 4 (USD 0.80 in / 4 out): 8.000 × 0.80/1M + 1.000 × 4/1M = USD 0.0064 + 0.004 = USD 0.0104 - Com Claude Sonnet 4.5 (USD 3 in / 15 out): 8.000 × 3/1M + 1.000 × 15/1M = USD 0.024 + 0.015 = USD 0.039 - Com Claude Opus 4.7 (USD 15 in / 75 out): 8.000 × 15/1M + 1.000 × 75/1M = USD 0.12 + 0.075 = USD 0.195

Diferença de 20x entre Haiku e Opus pra mesma conversa.

Volume típico cliente PME (50 conversas/dia × 30 dias = 1.500 conversas/mês): - Haiku: USD 15.60/mês - Sonnet: USD 58.50/mês - Opus: USD 292.50/mês

Pra Team Studio, escolher modelo apropriado por caso de uso salva muito dinheiro: - Triagem inicial / classificação: Haiku - Resposta padrão de FAQ: Haiku ou Sonnet - Geração de conteúdo complexo: Sonnet - Análise estratégica / código: Opus

3.3 Caching agressivo

Prompt caching (Anthropic, OpenAI, Google) cacheia parte do prompt. Lê do cache custa 10% do preço normal.

Cenário: system prompt + base de conhecimento do cliente = 5.000 tokens fixos por conversa.

  • Sem caching: 1.500 conversas × 5.000 tokens × USD 3/1M = USD 22.50
  • Com caching (90% das conversas pegam cache): 5.000 tokens × USD 3/1M (primeira escrita) + 1.350 × 5.000 × USD 0.30/1M (90% cache hit) = USD 0.015 + USD 2.025 = USD 2.04

Economia: 91% só em prompt caching.

3.4 Token budget por feature

Antes de lançar feature, calcular token budget: quantos tokens essa feature consome por uso, multiplicado por uso esperado, multiplicado por custo unitário.

Exemplo: feature "resumo semanal pro CEO" - 1 cliente, 1 vez por semana - Input: 50.000 tokens (vai ler relatórios da semana) - Output: 2.000 tokens - Modelo: Sonnet (precisa qualidade pra CEO) - Custo por execução: 50k × 3/1M + 2k × 15/1M = USD 0.15 + 0.03 = USD 0.18

USD 0.18 × 52 semanas = USD 9.36/ano por cliente. Tranquilo.

Outro exemplo: feature "agente conversacional sempre ativo" - 1 cliente, 200 mensagens/dia - Cada mensagem: 5.000 tokens in + 500 out - Modelo: Sonnet - Custo por mensagem: 5k × 3/1M + 500 × 15/1M = USD 0.015 + 0.0075 = USD 0.0225 - Custo mensal: 200 × 30 × USD 0.0225 = USD 135/mês

Se Team Studio cobra R$ 800/mês desse cliente, USD 135 = R$ 720 = 90% da mensalidade só em LLM. Inviável sem otimizar.

Soluções: usar Haiku pra triagem (90% das mensagens), Sonnet só pra casos complexos, caching agressivo. Custo cai pra USD 20-30/mês = R$ 100-150. Margem volta a fazer sentido.


4. Modelos de pricing

Quatro modelos principais. Cada um tem caso onde brilha e caso onde queima.

4.1 Fixed (mensalidade fixa)

Cliente paga valor X todo mês, independente de uso.

Quando usar: - Cliente PME que quer previsibilidade - Feature core sem variabilidade alta de uso - Cliente que vai usar pouco (você ganha) ou muito (cliente ganha)

Quando evita: - Uso muito variável entre clientes (ou alguém ganha muito ou alguém perde muito) - Cliente grande com volume gigante (vai sangrar você)

Exemplo Team Studio: R$ 800/mês pra atendimento WhatsApp PME (até 500 conversas/mês). Acima disso, conversa pra upgrade.

4.2 Usage-based (cobrança por uso)

Cliente paga por unidade consumida (mensagem, conversa, token, hora, etc).

Quando usar: - Uso heterogêneo entre clientes - Cliente quer começar pequeno e crescer - Você quer alinhar custo seu com receita

Quando evita: - Cliente PME (variabilidade assusta) - Bill shock (final do mês com fatura inesperada queima relacionamento)

Exemplo: AWS, Twilio, Stripe. Funciona pra commodity ou infra.

4.3 Value-based (atrelado a valor entregue)

Cliente paga % do valor que Team Studio gera (vendas geradas, custos economizados).

Quando usar: - Você consegue medir valor inequívoco - Cliente confia em você (relacionamento maduro) - Margem grande quando dá certo

Quando evita: - Sem instrumentação clara de attribuição - Cliente desconfiado - Risco assumido alto

Exemplo: agência de growth cobrando % de receita gerada. Difícil de implementar em IA porque attribuição não é clara.

4.4 Hybrid (base + variável)

Mensalidade base + componente variável de uso. Mais comum em B2B SaaS moderno.

Quando usar: - Cliente quer previsibilidade (base) mas você quer alinhar com uso (variável) - Categoria com variabilidade média - Plataforma multi-feature

Exemplo: R$ 800/mês base (inclui 500 conversas) + R$ 1 por conversa adicional. Cliente conta R$ 800 sempre, mas se viralizar paga mais.

4.5 Tabela de comparação

Modelo Previsibilidade cliente Alinhamento receita-uso Risco cliente Risco fornecedor
Fixed Alta Baixo Médio (paga mais que deveria) Médio (cliente abusa do plano)
Usage Baixa Alto Alto (bill shock) Baixo
Value Variável Alto (se mensurável) Baixo Alto (se attribuição falha)
Hybrid Média-Alta Médio-Alto Médio Baixo-Médio

4.6 Como cliente brasileiro PME prefere

Em 2026, cliente brasileiro de PME (R$ 100k-5M/ano de faturamento) prefere:

  1. Fixed (50-60% dos casos) - previsibilidade vence
  2. Hybrid (30-35%) - quando entende e confia
  3. Usage-based (5-10%) - só cliente tech-forward
  4. Value-based (1-5%) - só com relacionamento maduro

Cliente B2B médio/grande (R$ 5M+ ARR) aceita mais hybrid e value-based.


5. Como precificar serviço de IA com margem

Cálculo realista. Vou pelo bottom-up.

5.1 Custos diretos (variáveis por cliente)

Por cliente PME com Team Studio rodando:

  • LLM: USD 30-60/mês otimizado (caching + modelo apropriado)
  • Infraestrutura adicional: USD 5-15/mês (parcela do Supabase, VPS, monitoring)
  • APIs externas: WhatsApp Business API USD 0.005/mensagem × volume típico = USD 5-20/mês
  • Total custo direto: USD 40-95/mês = R$ 200-470/mês

5.2 Custos indiretos (overhead alocado)

Custos da operação Team Studio divididos entre clientes:

  • Suporte WhatsApp ao cliente: 30-60 min/mês × custo da hora (R$ 200) = R$ 100-200
  • Evolução do produto: parcela do desenvolvimento alocada por cliente = R$ 100-300
  • Reuniões trimestrais de acompanhamento: 1h × 4/ano × R$ 200 / 12 = R$ 67/mês
  • Setup amortizado (R$ 5.000 setup ÷ 24 meses de retenção esperada) = R$ 208/mês primeira metade do contrato
  • Total indireto: R$ 475-775/mês

5.3 Custos de risco (churn, inadimplência)

  • Churn: 20% dos clientes saem em 12 meses = preço efetivo recebido é menor
  • Inadimplência: 5-10% PME atrasa ou nunca paga
  • Ajuste: multiplicar preço por 1.15-1.25 pra absorver

5.4 Margem alvo

Padrão B2B SaaS saudável: - Margem bruta (receita - custos diretos) / receita: 70-80% - Margem líquida (depois de tudo): 15-25% pra empresa solo, 5-15% pra empresa com time

5.5 Cálculo Team Studio PME

Custo total por cliente: R$ 200-470 (direto) + R$ 475-775 (indireto) = R$ 675-1.245/mês

Multiplicando por 1.20 (risco): R$ 810-1.494/mês

Pra margem líquida 15-25%: preço final R$ 950-1.870.

Faixa Team Studio PME publicada: R$ 800-1.500/mês. Bate.

5.6 Erros comuns de pricing

  1. Esquecer custos indiretos: vendedor calcula só LLM e infra, esquece suporte e evolução. Margem some no primeiro mês de problema.
  2. Não precificar setup: cliente paga setup como parte da mensalidade, fornecedor sangra primeiros 3-6 meses.
  3. Subestimar churn: precificar pra retenção de 36 meses quando média do mercado é 18 meses.
  4. Não ajustar preço: LLM ficou 30% mais barato em 2024 mas preço cliente continua. Boa pra margem, mas competitivo entrega.

6. Quando dar desconto, quando não dar

Desconto é ferramenta de negociação, não generosidade. Princípio: toda concessão tem que ter contrapartida.

6.1 Razões legítimas pra dar desconto

  1. Volume: cliente fecha 5 contratos em vez de 1
  2. Prazo: cliente paga 12 meses antecipado (você ganha cash flow)
  3. Parceria: cliente vira referência ativa (case + indicações)
  4. Pioneirismo: primeiro cliente de uma categoria (você ganha track record)
  5. Risco compartilhado: você cobra menos no início e mais quando ROI provado

6.2 Razões ruins pra dar desconto

  1. Sem alternativa (concorrente mais barato): geralmente concorrente é mais barato porque não entrega o mesmo
  2. Medo de perder venda: cliente que só fecha com desconto não valoriza serviço, vai churnar
  3. Pressão emocional ("ah vai, é fácil pra você"): nunca
  4. Acordo informal sem contrapartida: você lembra, cliente esquece

6.3 Como negociar com elegância

Cliente: "R$ 1.500 tá caro. Dá pra R$ 1.000?"

Resposta ruim: "Tudo bem, R$ 1.000." Resposta péssima: "Só por ser você, R$ 1.200."

Resposta certa: "Posso fazer R$ 1.200 se você fechar 12 meses agora (em vez de mensal) ou R$ 1.000 se fechar 24 meses. Mensalidade mensal tradicional mantém R$ 1.500."

Cliente entende: concessão existe, mas com contrapartida (commitment maior). Quem aceitar é cliente sério. Quem não aceitar não era cliente sério.

6.4 Quando dizer "esse preço não cabe pra você"

Se cliente PME tem mensalidade ofertada R$ 800 e diz "só consigo R$ 300": não desça. Diz claramente "esse pacote não cabe no orçamento atual. Posso recomendar X ou Y de menor porte, ou voltamos quando o orçamento cresce."

Cliente que entra forçado por R$ 300 vai exigir o atendimento de R$ 800 e churnar irritado em 3 meses. Pior do que não ter fechado.


7. Como Team Studio precifica em 2026

Estado atual da política de pricing:

Tier 1 - PME (~R$ 800-1.500/mês)

Cliente típico: empresa com 5-30 funcionários, faturamento R$ 500k-5M/ano, sem time tech.

Inclui: - 1-3 agentes core (atendimento WhatsApp, geração de conteúdo, etc) - Até 500 conversas/mês no atendimento - Setup R$ 5.000 cobrado uma vez - Suporte WhatsApp diurno - 1 reunião trimestral de acompanhamento (1h) - SLA 99.5% uptime mensal

Modelo: Fixed mensalidade + setup à parte.

Tier 2 - Média empresa (~R$ 3.000-6.000/mês)

Cliente típico: empresa com 30-200 funcionários, faturamento R$ 5-50M/ano, time tech pequeno.

Inclui: - 5-10 agentes em produção - Volume conversas até 5.000/mês (R$ 1 por adicional) - Setup R$ 15.000 cobrado uma vez - Suporte WhatsApp business hours + email priority - 1 reunião mensal (1h) + 4 trimestrais (2h) - Failover LLM (Anthropic backup Sonnet pra OpenAI) - SLA 99.9% uptime mensal

Modelo: Hybrid (fixed + variable por volume).

Tier 3 - Enterprise (sob negociação)

Cliente típico: empresa com 200+ funcionários, faturamento R$ 50M+/ano, time tech estruturado.

Inclui: - Custom agentes conforme escopo - Volume negociado - Setup negociado (R$ 30-100k típico) - SLA 99.95% uptime mensal - Multi-region + LLM failover - Pentest + auditoria SOC 2 Type II (quando disponível) - Contrato dedicado com SCCs GDPR se aplicável - TCO 24-36 meses apresentado em proposta

Modelo: Negociável (fixed/hybrid/value-based dependendo do caso).

Como decide tier

3 dimensões: 1. Faturamento do cliente: até R$ 5M = Tier 1, R$ 5-50M = Tier 2, R$ 50M+ = Tier 3 2. Complexidade técnica: 1-3 agentes = Tier 1, 5-10 = Tier 2, custom = Tier 3 3. Exigência operacional: SLA padrão = T1, SLA 99.9% = T2, SLA enterprise = T3

Quando dimensões discordam, vence a maior exigência. Cliente PME que exige SLA 99.95% é Tier 3.


8. 5 perguntas pra reunião sobre custo

1. "Qual é o orçamento que vocês tinham mentalmente pra esse projeto?"

Por que: cliente bom responde com faixa. Cliente que não tem orçamento mental ainda não decidiu se vai contratar. Antes de pitchar preço, calibrar contra realidade do cliente economiza horas.

2. "Vocês têm CFO ou área financeira que vai aprovar a contratação? Qual o processo?"

Por que: revela complexidade do ciclo de aprovação. CFO formal = mais documentação + TCO + projeções. CEO solo = mais ágil mas pode reverter depois.

3. "Modelo de pricing preferido de vocês: fixed mensal, usage-based, ou hybrid?"

Por que: cliente que tem preferência tem maturidade B2B. Cliente que pergunta "como é que funciona?" é educável (e oportunidade pra você ancorar no modelo melhor pra você).

4. "Qual o TCO esperado pra esse projeto em 24-36 meses?"

Por que: cliente que pensa em TCO de longo prazo é cliente sofisticado. Cliente que pensa só na mensalidade ainda está em fase inicial de avaliação. Define profundidade da conversa.

5. "Há outras propostas competindo? Qual a diferença essencial entre nós?"

Por que: cliente honesto responde. Cliente que mente ("não, vocês são os únicos") está sendo vago de propósito. Permite você posicionar Team Studio explicitamente vs concorrentes citados.


9. Exercício prático: proposta pra rede de franquias

Cenário: Rede de franquias de pizzarias (Pizza Mãe, 200 unidades pelo Brasil, R$ 280M/ano de faturamento) quer Team Studio pra: - Atendimento WhatsApp pra delivery 24h em todas as franquias (cada franquia recebe ~80 pedidos/dia) - Geração de conteúdo pras redes sociais centralizada - Análise de dados de venda pra cada franqueado mensalmente

Diretor de Marketing, Marcos, manda email:

"Adoramos a apresentação. Pra fechar, precisamos de proposta detalhada com TCO 24 meses, justificativa de cada item, e como vocês precificam considerando que somos 200 unidades."

Sua tarefa: estruturar a proposta com lógica de pricing transparente.

Resposta esperada (passo a passo)

Passo 1: Calcular volume real

200 franquias × 80 pedidos/dia × 30 dias = 480.000 pedidos/mês.

Mesmo se 50% interagem com WhatsApp, são 240.000 conversas/mês. Volume enterprise.

Passo 2: Estimar custos diretos

LLM (Haiku pra triagem + Sonnet pra resposta complexa): - Por conversa: ~3.000 tokens média = USD 0.005 com mix Haiku/Sonnet - Por mês: 240.000 × USD 0.005 = USD 1.200 = ~R$ 6.000

WhatsApp Business API: - USD 0.005 por mensagem × 240.000 = USD 1.200 = ~R$ 6.000

Infraestrutura adicional (multi-region pra resiliência, monitoring premium): - ~R$ 4.000/mês

Total custos diretos: ~R$ 16.000/mês

Passo 3: Estimar custos indiretos

  • Suporte dedicado: pessoa-foco no Team Studio (não é solo George operando), 30% FTE alocado = R$ 4.500
  • Evolução custom pra 200 franquias (templates, integrações, dashboards): 20% FTE = R$ 3.000
  • Reuniões mensais + trimestrais com Marcos + reuniões com franqueados quando necessário: ~R$ 1.000
  • Setup amortizado (R$ 60.000 ÷ 24 meses) = R$ 2.500

Total indireto: ~R$ 11.000/mês

Passo 4: Custo total + margem

Custo: R$ 16.000 + R$ 11.000 = R$ 27.000/mês

Margem alvo 30% (enterprise, valor agregado alto): R$ 27.000 / 0.70 = R$ 38.500/mês

Adicionando risco (1.10x pra absorver incertezas): R$ 42.000/mês

Passo 5: Estruturar proposta

Proposta Team Studio - Pizza Mãe (200 unidades)

Tier: Enterprise customizado

Setup inicial (uma vez): R$ 60.000
  - Configuração de 200 instâncias WhatsApp Business
  - Integração com sistema atual de pedidos
  - Templates customizados por franquia
  - Treinamento de 10 franqueados-chave + Marcos

Mensalidade: R$ 42.000/mês
  - Atendimento WhatsApp 24h em todas as 200 franquias
  - Volume incluído: até 250.000 conversas/mês (R$ 0.50 por adicional)
  - Geração de conteúdo central pra redes sociais (20 posts/semana)
  - Análise mensal de vendas por franquia (200 dashboards gerados)
  - SLA 99.9% uptime mensal
  - Suporte dedicado em business hours + escalation 24h
  - Reuniões mensais com diretoria + trimestrais com franqueados
  - Multi-region AWS + failover LLM
  - Pentest anual contratado por vocês

TCO 24 meses:
  - Setup: R$ 60.000
  - Mensalidade: R$ 42.000 × 24 = R$ 1.008.000
  - Total: R$ 1.068.000

TCO 36 meses:
  - Setup: R$ 60.000
  - Mensalidade: R$ 42.000 × 36 = R$ 1.512.000
  - Total: R$ 1.572.000

ROI estimado (cliente calcula):
  - 200 franquias × economia X/mês = receita ou economia gerada
  - Ponto de equilíbrio em mês Y

Política de revisão de preço:
  - Anual, baseado em IPCA + custo LLM real
  - Sem reajuste acima de IPCA + 5% no primeiro ano

Política de saída:
  - 60 dias de aviso prévio
  - Export completo de dados em 7 dias úteis
  - Sem multa de rescisão após mês 12

Resultado esperado

Cliente sério vê: 1. Transparência (sabe pra onde vai o dinheiro) 2. Margem honesta (não é roubo, é negócio saudável) 3. TCO claro (não tem surpresa em mês 18) 4. Política de saída (cliente não fica refém)

Cliente que aceita = parceria longa. Cliente que recua = não era cliente, era curioso.


Resumo de uma frase

Pricing bom é matemática transparente + margem realista + TCO honesto declarado desde o início, não jogo de adivinhação onde vendedor inflama e cliente regateia até alguém quebrar - quem mostra a conta inteira fecha contrato com cliente sério e dorme bem, quem esconde custos sangra silenciosamente até churnar.


Próxima semana

A Semana 15 cobre Reuniões com TI corporativo - táticas e armadilhas práticas em ambiente técnico de cliente: roteiro de primeira reunião, vocabulário pra usar vs evitar, como identificar sinais de TI hostil vs aliado, como pedir acessos sem parecer ameaça à segurança, e que prova técnica realmente convence (demo vs slide). Continua o Bloco F.


Glossário rápido (termos novos desta semana)

  • TCO (Total Cost of Ownership): custo total ao longo da vida útil, incluindo aquisição + operação + manutenção + descomissionamento
  • FinOps: disciplina de gerenciar custo cloud como produto, com visibilidade, responsabilidade, otimização e forecasting
  • Egress: saída de dados da cloud pra internet, geralmente cobrada
  • Idle resources: recursos provisionados sem uso ativo, principal fonte de waste cloud
  • Bill shock: surpresa negativa de fatura inesperadamente alta em modelo usage-based
  • Token (LLM): unidade de texto que LLM processa, ~3-4 caracteres em português, base de billing dos provedores
  • Prompt caching: técnica de reaproveitar parte do prompt entre chamadas, reduzindo custo em até 90%
  • Token budget: estimativa de tokens consumidos por feature multiplicado por uso esperado e custo unitário
  • Fixed pricing: mensalidade independente de uso, prioriza previsibilidade
  • Usage-based pricing: cobrança por unidade consumida, prioriza alinhamento receita-uso
  • Value-based pricing: cobrança como % do valor entregue ao cliente, exige attribuição mensurável
  • Hybrid pricing: combinação de base fixa + componente variável de uso
  • Rightsizing: ajuste de recursos cloud pra usar exatamente o que precisa, prática FinOps
  • Reserved Instances: comprometimento de uso de longo prazo (1-3 anos) em troca de desconto cloud (40-70%)
  • Savings Plans: compromisso de spending mensal em troca de desconto, mais flexível que RI
  • Margem bruta: (receita - custos diretos variáveis) / receita, padrão B2B SaaS 70-80%
  • Margem líquida: lucro depois de todos custos (diretos + indiretos + impostos) / receita
  • Churn: % de clientes que cancelam contrato em período
  • CAC (Customer Acquisition Cost): custo de adquirir um cliente novo
  • LTV (Lifetime Value): receita esperada de um cliente ao longo de toda relação
  • LTV/CAC ratio: indicador de saúde de negócio SaaS, ideal acima de 3x