← Voltar ao blog

API OCR para documentos brasileiros: guia completo

Aprenda a extrair dados de certidões de nascimento com a API DocsOCR. Guia completo com exemplos de código.

O que é OCR de documentos e por que é importante?

OCR (Optical Character Recognition) é a tecnologia que transforma texto em imagens — como documentos escaneados, fotos e PDFs — em dados digitais editáveis e pesquisáveis. Para empresas brasileiras que lidam com grandes volumes de documentos, o OCR é a diferença entre processar centenas de documentos por dia ou ficar preso em digitação manual.

No Brasil, a digitalização de processos tem acelerado significativamente. Cartórios, fintechs, escritórios de advocacia e empresas de RH precisam extrair dados de documentos como certidões de nascimento, RGs e CNHs em escala. O problema? A maioria das soluções de OCR genéricas não foi projetada para lidar com as particularidades dos documentos brasileiros.

Como o DocsOCR funciona

O DocsOCR é uma API REST especializada em documentos brasileiros. Diferente de soluções genéricas, nosso sistema foi treinado especificamente com milhares de documentos reais do Brasil, o que resulta em precisão significativamente superior.

Arquitetura de alta disponibilidade

O sistema utiliza dois motores de IA com fallback automático:

  • Large (Preciso): Motor otimizado para máxima precisão na extração de campos
  • Mini (Rápido): Motor otimizado para velocidade, usado como fallback automático

Quando o motor primário encontra dificuldades com um documento específico, o sistema automaticamente tenta com o motor alternativo. Isso garante que seus documentos sejam processados com sucesso, sem necessidade de intervenção manual.

Fluxo de processamento

  1. Envio: Você envia a imagem do documento via API (URL ou Base64)
  2. Classificação: A IA identifica automaticamente o tipo de documento
  3. Extração: Campos relevantes são extraídos com validação em tempo real
  4. Resposta: JSON estruturado é retornado em 2-8 segundos

Documentos suportados

Atualmente, o DocsOCR oferece extração completa para certidões de nascimento brasileiras, incluindo:

  • Nome completo do registrado
  • Data de nascimento
  • Local de nascimento (cidade e estado)
  • Nomes dos pais
  • Número do registro e matrícula
  • Nome do cartório emissor
  • Data de emissão
  • Dados complementares (avós, observações)

Novos tipos de documentos estão sendo adicionados continuamente. O sistema de classificação automática já identifica diversos tipos, facilitando a expansão futura.

Primeiros passos com a API

Começar a usar o DocsOCR é simples e leva menos de 3 minutos:

1. Crie sua conta

Acesse o painel administrativo e crie uma conta gratuita. Você receberá créditos de boas-vindas para testar a API imediatamente — sem necessidade de cartão de crédito.

2. Gere uma chave de API

No painel, navegue até a seção de chaves de API e gere sua primeira chave. Guarde-a em local seguro.

3. Faça sua primeira chamada

Aqui está um exemplo usando Python:

import requests

url = "https://api.docsocr.com/api/v1/documents/process"
headers = {
    "Authorization": "Bearer SUA_CHAVE_API",
    "Content-Type": "application/json"
}
payload = {
    "imageUrl": "https://exemplo.com/certidao.jpg"
}

response = requests.post(url, json=payload, headers=headers)
data = response.json()

print(data["data"]["documento"]["tipo"])
# "Certidão de Nascimento"

print(data["data"]["registrado"]["nome"])
# "João Silva Santos"

E usando cURL:

curl -X POST https://api.docsocr.com/api/v1/documents/process \
  -H "Authorization: Bearer SUA_CHAVE_API" \
  -H "Content-Type: application/json" \
  -d '{"imageUrl": "https://exemplo.com/certidao.jpg"}'

A resposta inclui todos os campos extraídos em formato JSON estruturado, pronto para ser integrado ao seu sistema.

Formatos aceitos

O DocsOCR aceita os seguintes formatos de arquivo:

  • PDF — documentos digitais ou escaneados
  • JPG/JPEG — fotos e digitalizações
  • PNG — imagens com ou sem transparência
  • HEIC — formato nativo de câmeras de iPhone

O tamanho máximo por arquivo é de 10MB. Você pode enviar o documento como URL pública ou codificado em Base64 no corpo da requisição.

Preços e créditos gratuitos

O DocsOCR utiliza um modelo de créditos pay-as-you-go:

  • Cada documento processado consome uma quantidade de créditos baseada no plano contratado
  • Contas novas recebem créditos gratuitos para testar com documentos reais
  • Não é necessário cartão de crédito para começar
  • Planos mensais e anuais disponíveis, com descontos progressivos por volume

O modelo pay-as-you-go garante que você pague apenas pelo que usar, sem custos fixos elevados ou surpresas na fatura.

Segurança e conformidade

A segurança dos dados é prioridade máxima:

  • LGPD, GDPR e CCPA: 100% compatível com as principais legislações de proteção de dados
  • Processamento em tempo real: Documentos não são armazenados após a extração
  • Criptografia TLS: Toda comunicação é criptografada em trânsito
  • Autenticação robusta: Chaves de API com escopos configuráveis

Próximos passos

Pronto para automatizar o processamento de documentos na sua empresa?

  1. Crie sua conta gratuita e receba créditos de boas-vindas
  2. Explore a documentação interativa com exemplos em múltiplas linguagens
  3. Teste com documentos reais usando os créditos gratuitos
  4. Integre ao seu sistema e comece a escalar

O DocsOCR foi construído para empresas brasileiras que precisam de OCR que simplesmente funciona. Sem configuração complexa, sem projetos longos de integração — apenas uma API simples que transforma documentos em dados estruturados.