IA de Atendimento — Como o Assistente do DunaHub Responde Seus Clientes em Todos os Canais

Como a IA integrada responde mensagens no WhatsApp, webchat, SMS e chamadas perdidas. Setup, canais, palavras de transferência, limites mensais, fallback e custo.

O que a IA de Atendimento faz

Quando alguém manda mensagem para sua empresa em qualquer canal suportado — WhatsApp, webchat, SMS ou uma chamada perdida — o assistente de IA lê o histórico da conversa, responde em cerca de dois segundos e cria um lead no seu CRM se ainda não existir. Ele usa o contexto do negócio que você configurou (serviços, preços, horários) para que as respostas pareçam vindas de você, não de um chatbot genérico.

A funcionalidade está inclusa em todos os planos. O que varia é apenas o limite mensal de respostas.

Ativar a IA de Atendimento

  1. Abra Configurações → Assistente IA no seu dashboard.
  2. Ative o toggle Ativar Assistente IA.
  3. Selecione os Canais em que a IA deve responder — qualquer combinação de whatsapp, webchat, sms, phone.
  4. Configure o Contexto do negócio (system prompt) — descreva seus serviços, preços, horários e qualquer outra informação que a IA precise saber.
  5. Ajuste as Palavras-chave de transferência e o Período de pausa se quiser valores diferentes do padrão.

O toggle é por organização. Se você gerencia múltiplas orgs, configure cada uma separadamente.

Como cada canal funciona

WhatsApp — A IA responde no WhatsApp via Evolution API. Mensagens enviadas com privacidade do WhatsApp (o novo endereçamento @lid) são resolvidas para o telefone real através do campo remoteJidAlt da Evolution, então a IA consegue cruzar o contato com o histórico de SMS/voz.

Webchat — Quando um visitante manda mensagem no widget do site, a IA responde inline. Como o webchat é anônimo até o visitante deixar contato, a IA tenta oferecer respostas úteis sem forçar a captura imediata do telefone.

SMS — Quando um cliente envia SMS para o seu número DunaHub, a IA responde automaticamente. O fluxo da IA roda dentro de waitUntil, então o webhook retorna 200 rapidamente para a Twilio e a resposta da IA é despachada em background.

Chamada perdida (phone) — Quando uma ligação não é atendida (no-answer / busy / failed / canceled), a IA gera uma resposta SMS para quem ligou. Isso substitui o texto-de-volta estático quando a IA está ativa e 'phone' está na lista de canais. Se a IA estiver desativada ou o canal não habilitado, o texto-de-volta estático ainda dispara.

Transferência para humano

Duas formas de assumir uma conversa:

Transferência por palavra-chave. Quando o lead escreve uma das suas palavras-chave configuradas (padrão: falar com atendente, gerente, humano, etc.), a IA registra um evento ai_handoff e para de responder naquele lead. O lead fica sinalizado para você priorizar.

Período de pausa. Se você (ou alguém da sua equipe) responder pessoalmente, a IA pausa pelo tempo configurado (padrão 60 minutos). Isso impede que a IA fale por cima de você quando estiver no meio de uma conversa. A pausa é resetada cada vez que um humano responde.

Limites mensais

| Plano | Respostas IA por mês | | ------- | -------------------- | | Free | 50 | | Starter | 500 | | Pro | 2.000 | | Growth | Ilimitado |

O contador zera no primeiro dia de cada mês UTC. O uso é rastreado em ai_usage_monthly e exposto no admin/dashboard.

O que acontece quando você estoura o limite

A IA bloqueia o fluxo antes de chamar o modelo de linguagem — assim que a cota do mês acaba, nenhuma chamada de LLM é feita (sem custos surpresa). Três coisas ainda acontecem:

  1. O lead recebe uma mensagem de cortesia: "Obrigado pela mensagem! Recebemos e retornaremos em breve." (Enviada pelo canal que o lead usou.) Limitada a uma vez por lead a cada 24h para evitar spam.
  2. Uma entrada é gravada em ai_handoffs com reason: 'monthly_limit' — você consegue ver no log de auditoria quais leads foram afetados.
  3. O primeiro estouro do mês dispara um email para o dono da organização com resumo de uma linha e link de upgrade. Estouros seguintes no mesmo mês são silenciosos (email é uma vez por mês).

Para retomar as respostas da IA: ou faça upgrade do plano, ou espere o próximo mês UTC zerar o contador.

Auditoria e rastreio de custo

Cada execução da IA grava uma linha em ai_conversation_runs com:

  • model — atualmente deepseek-chat (DeepSeek-V3.x).
  • prompt_tokens, completion_tokens — contagem de tokens da execução.
  • cost_usd — calculado em USD pela tarifa publicada do provider (≈ $0,0008 por resposta em tamanhos típicos).
  • latency_ms — latência ponta-a-ponta do LLM.
  • delivery_statussent ou failed. Se o LLM respondeu mas o envio na plataforma (Twilio SMS ou Evolution WhatsApp) falhou, fica como failed e delivery_error carrega a causa.

A auditoria é por org e visível no dashboard. Use para monitorar uso e detectar problemas de entrega cedo.

Provider e custo

O DunaHub usa DeepSeek como provider de LLM. O custo típico por resposta é de cerca de US$ 0,01 — muito abaixo do preço por mensagem de qualquer SaaS que revende IA como add-on. Nós absorvemos esse custo dentro do seu plano; você não paga nada a mais.