Transforme PDFs em dados estruturados em grande escala. Alimentado por modelos de OCR abertos de fronteira com um TypeScript SDK de tipo seguro.
- O melhor OCR da categoria – PaddleOCR-VL-0.9B para extração precisa de texto
- Extração estruturada – Definir esquemas, recuperar JSON
- Construído para escala – Processamento baseado em fila para milhares de documentos
- SDK de tipo seguro – Suporte completo a TypeScript com ganchos React
- Atualizações em tempo real – Notificações WebSocket para progresso do trabalho
- Auto-hospedável – Execute em sua própria infraestrutura
import { createOCRBaseClient } from "@ocrbase/sdk";
const client = createOCRBaseClient({ baseUrl: "https://your-instance.com" });
// Process a document
const job = await client.jobs.create({ file: document, type: "parse" });
const result = await client.jobs.get(job.id);
console.log(result.markdownResult);Consulte a documentação do SDK para ganchos React e uso avançado.
Consulte o Guia de auto-hospedagem para obter instruções de implantação.
Requisitos: Docker, Bun, GPU CUDA com 12 GB + VRAM
MIT – Consulte LICENÇA para obter detalhes.
Para acesso à API, implantação local ou dúvidas: adammajcher20@gmail.com
Fonte: theverge

