majcheradam/ocrbase: 📄 PDF ->.MD/.JSON OCR de documento e API de extração de dados estruturados. Análise baseada em PaddleOCR + LLM. Atualizações WebSocket em tempo real. SDK TypeScript seguro com ganchos React. Auto-hospedado.

PUBLICIDADE

majcheradam/ocrbase: 📄 PDF ->.MD/.JSON OCR de documento e API de extração de dados estruturados. Análise baseada em PaddleOCR + LLM. Atualizações WebSocket em tempo real. SDK TypeScript seguro com ganchos React. Auto-hospedado.

Transforme PDFs em dados estruturados em grande escala. Alimentado por modelos de OCR abertos de fronteira com um TypeScript SDK de tipo seguro.

  • O melhor OCR da categoria – PaddleOCR-VL-0.9B para extração precisa de texto
  • Extração estruturada – Definir esquemas, recuperar JSON
  • Construído para escala – Processamento baseado em fila para milhares de documentos
  • SDK de tipo seguro – Suporte completo a TypeScript com ganchos React
  • Atualizações em tempo real – Notificações WebSocket para progresso do trabalho
  • Auto-hospedável – Execute em sua própria infraestrutura
import { createOCRBaseClient } from "@ocrbase/sdk";

const client = createOCRBaseClient({ baseUrl: "https://your-instance.com" });

// Process a document
const job = await client.jobs.create({ file: document, type: "parse" });
const result = await client.jobs.get(job.id);

console.log(result.markdownResult);

Consulte a documentação do SDK para ganchos React e uso avançado.

Consulte o Guia de auto-hospedagem para obter instruções de implantação.

Requisitos: Docker, Bun, GPU CUDA com 12 GB + VRAM

MIT – Consulte LICENÇA para obter detalhes.

Para acesso à API, implantação local ou dúvidas: adammajcher20@gmail.com

Fonte: theverge

Mais recentes

PUBLICIDADE

WP Twitter Auto Publish Powered By : XYZScripts.com