Extração de Dados de Documentos API API ID: 3606

Otimize seus fluxos de trabalho com nossa API de Extração de Dados de Documentos projetada para transformar qualquer documento estruturado ou não estruturado em dados estruturados e acionáveis

Use esta API do seu agente de IA via MCP

Funciona com OpenClaw, Claude Code/Desktop, Cursor, Windsurf, Cline e qualquer cliente de IA compatível com MCP.

Docs e configuração

Crie uma skill envolvendo este MCP: https://mcp.zylalabs.com/mcp?apikey=YOUR_ZYLA_API_KEY

Eleve suas capacidades de manuseio de dados com a API de Extração de Dados de Documentos da Extracta.ai Nossa solução inovadora capacita seus sistemas a extrair automaticamente dados estruturados de uma infinidade de documentos - sejam imagens digitalizadas, PDFs, e-mails, faturas, contratos ou qualquer formato de arquivo digital que você possa imaginar Adaptada para atender às necessidades de várias indústrias nossa API facilita a automação perfeita de fluxos de trabalho reduzindo significativamente os esforços manuais e aumentando a eficiência geral

Características:

Compatibilidade Universal: Processar documentos em qualquer formato - PDF DOCX TXT JPG PNG e mais
Alta Precisão e Velocidade: Aproveite a tecnologia de ponta que não requer pré-treinamento garantindo extração rápida com precisão superior
Extração de Dados Personalizável: Defina critérios de extração específicos para atender às suas necessidades comerciais exclusivas desde a extração de seções específicas de texto até pontos de dados complexos
Integração Fácil: Com documentação de API amigável para desenvolvedores integre nosso serviço suavemente em seu software ou fluxo de trabalho existente
Escalabilidade: De alguns documentos a milhares nossa API pode lidar com lotes de qualquer tamanho de forma eficiente
Segurança: A privacidade e segurança dos seus dados são fundamentais Garantimos que suas informações nunca sejam usadas para fins de treinamento e são tratadas com a mais alta confidencialidade

Se você é um desenvolvedor de software um analista de negócios ou um cientista de dados nossa API de Extração de Dados de Documentos foi projetada para simplificar suas tarefas de processamento de dados permitindo que você se concentre no que realmente importa - impulsionar seu negócio para frente Comece com a Extracta.ai hoje e transforme a maneira como você lida com documentos para sempre

Documentação da API

Endpoints

Documento de Processo Endpoint ID: 4000

Estruture sua solicitação com parâmetros obrigatórios: 'nome', 'idioma', 'campos' e 'arquivo'. Cada campo requer uma 'chave', sendo 'descrição' e 'exemplo' opcionais. O documento deve ser fornecido como 'base64String' ou um 'fileUrl'.

## Documentação da API
Esta seção fornece diretrizes para estruturar suas solicitações da API de Análise de Documentos para a Extracta.ai. Certifique-se de seguir o formato abaixo para uma extração de dados bem-sucedida:

## Formato da Solicitação
```
{
"detalhesDaExtração": {
"nome": "Nome da Extração", // obrigatório - Nomeie seu processo de extração
"idioma": "Idioma Suportado", // obrigatório - Escolha entre os idiomas suportados
"campos": [
{
"chave": "Chave do Campo", // obrigatório - Defina a chave para a extração de dados
"descrição": "Descrição do Campo", // opcional - Descreva o campo
"exemplo": "Exemplo do Campo" // opcional - Forneça um valor de exemplo
},
...
]
},
"arquivo": "base64String ou URL do arquivo" // obrigatório - Forneça o documento no formato base64String ou como uma URL
}
```
## Formato Avançado
Além do formato básico descrito nas seções anteriores, a Extracta.ai também suporta estruturas de dados mais complexas para necessidades de extração especializadas. Este formato avançado permite a definição de **objetos e arrays aninhados**, atendendo a uma gama mais ampla de representação de dados.

### Tipo `objeto`
O tipo **objeto** representa um objeto estruturado com múltiplas **propriedades**. Cada propriedade é definida como um objeto dentro de um array e pode incluir sua própria **chave**, **descrição**, **tipo** e **exemplo**.
```
{
"chave": "informações_pessoais",
"descrição": "Informações pessoais da pessoa", // opcional
"tipo": "objeto",
"propriedades": [
{
"chave": "nome",
"descrição": "Nome da pessoa", // opcional
"exemplo": "Alex Smith", // opcional
"tipo": "string" // opcional
},
{
"chave": "email",
"descrição": "Email da pessoa",
"exemplo": "[email protected]",
"tipo": "string"
},
.....
]
}
```

### Tipo `array`
O tipo **array** é usado para listas de **itens**, como uma coleção de experiências de trabalho. A chave items contém um objeto definindo a estrutura de cada item no array.
```
{
"chave": "experiencia_de_trabalho",
"descrição": "Experiência de trabalho da pessoa", // opcional
"tipo": "array",
"itens": {
"tipo": "objeto",
"propriedades": [
{
"chave": "titulo",
"descrição": "Título do trabalho", // opcional
"exemplo": "Engenheiro de Software", // opcional
"tipo": "string" // opcional
},
{
"chave": "data_inicio",
"descrição": "Data de início do trabalho",
"exemplo": "2022",
"tipo": "string"
},
...
]
}
}
```

### Observações sobre o Uso | API de Análise de Documentos
- Para os tipos `objeto` e `array`, o parâmetro `exemplo` é aplicável apenas para suas propriedades/item internos.
- Ao definir campos, se nenhum `tipo` for especificado, o padrão será `string`.
- Para os tipos `objeto` e `array`, os campos internos só podem ser do tipo `string`. Isso significa que cada propriedade dentro de um objeto ou cada item dentro de um array deve ser do tipo string, garantindo consistência e simplicidade na representação de dados.
- Esses tipos de campo avançados permitem uma representação de dados mais detalhada e estruturada, aprimorando as capacidades do processo de extração de dados da Extracta.ai.

## Tipos de Arquivo Suportados

A Extracta.ai é capaz de processar documentos nos formatos **imagem (JPG, PNG), PDF e DOCX**. Essa melhoria permite uma maior variedade de tipos de documentos que podem ser enviados para extração.

## Idiomas Suportados

A Extracta.ai atualmente suporta a extração de documentos nos seguintes idiomas: **Romeno, Inglês, Francês, Espanhol, Árabe, Português, Alemão, Italiano**. Suporte adicional para mais 20 idiomas está planejado.

**Nota**: Se um idioma não suportado for especificado, a API retornará uma mensagem de erro indicando uma escolha de idioma inválida. Mantenha-se atualizado com nossa documentação da API para novas adições de idiomas.

                                                                            
POST https://pr137-testing.zylalabs.com/api/3606/document+data+extraction+api/4000/process+document

Documento de Processo - Recursos do endpoint

Objeto	Descrição
`Corpo da requisição`	[Obrigatório] Json

Corpo da requisição

{
	"extractionDetails": {
		"name": "CV - Extraction",
		"language": "English",
		"fields": [
			{
				"key": "name",
				"description": "the name of the person in the CV",
				"example": "Johan Smith"
			},
			{
				"key": "email",
				"description": "the email of the person in the CV",
				"example": "johan@gmail.com"
			},
			{
				"key": "phone",
				"description": "the phone number of the person",
				"example": "123 333 4445"
			},
			{
				"key": "address",
				"description": "the compelte address of the person",
				"example": "1234 Main St, New York, NY 10001"
			},
			{
				"key": "soft_skills",
				"description": "the soft skills of the person",
				"example": ""
			},
			{
				"key": "hard_skills",
				"description": "the hard skills of the person",
				"example": ""
			},
			{
				"key": "last_job",
				"description": "the last job of the person",
				"example": "Software Engineer"
			},
			{
				"key": "years_of_experience",
				"description": "the years of experience of last job",
				"example": "5"
			}
		]
	},
	"file": "https://deveatery.com/extracta/cv.png"
}

Testar endpoint

RESPOSTA DE EXEMPLO DA API

       
                                                                                                        
                                                                                                                                                                                                                                                                                                                                        {
	"name": "Darren Charles",
	"email": "[email protected]",
	"phone": "+1-709-680-9033",
	"address": "9 Corpus Christi, Texas",
	"soft_skills": "highly motivated, ability to translate business strategies, learn new things",
	"hard_skills": "Matlab, MeVisLab, Keras, CUDA, Git, DataStage, MQTT",
	"last_job": "Trainee With English Communications",
	"years_of_experience": "Ongoing"
}

Documento de Processo - TRECHOS DE CÓDIGO


curl --location --request POST 'https://zylalabs.com/api/3606/document+data+extraction+api/4000/process+document' --header 'Authorization: Bearer YOUR_API_KEY' 

--data-raw '{
	"extractionDetails": {
		"name": "CV - Extraction",
		"language": "English",
		"fields": [
			{
				"key": "name",
				"description": "the name of the person in the CV",
				"example": "Johan Smith"
			},
			{
				"key": "email",
				"description": "the email of the person in the CV",
				"example": "[email protected]"
			},
			{
				"key": "phone",
				"description": "the phone number of the person",
				"example": "123 333 4445"
			},
			{
				"key": "address",
				"description": "the compelte address of the person",
				"example": "1234 Main St, New York, NY 10001"
			},
			{
				"key": "soft_skills",
				"description": "the soft skills of the person",
				"example": ""
			},
			{
				"key": "hard_skills",
				"description": "the hard skills of the person",
				"example": ""
			},
			{
				"key": "last_job",
				"description": "the last job of the person",
				"example": "Software Engineer"
			},
			{
				"key": "years_of_experience",
				"description": "the years of experience of last job",
				"example": "5"
			}
		]
	},
	"file": "https://deveatery.com/extracta/cv.png"
}'

Chave de acesso à API e autenticação

Após se cadastrar, cada desenvolvedor recebe uma chave de acesso à API pessoal, uma combinação única de letras e dígitos para acessar nosso endpoint de API. Para autenticar com a Extração de Dados de Documentos API basta incluir seu token Bearer no cabeçalho Authorization.

Cabeçalhos

Cabeçalho	Descrição
`Authorization`	[Obrigatório] Deve ser `Bearer access_key`. Veja "Sua chave de acesso à API" acima quando você estiver inscrito.

Perguntas

Preços simples e transparentes

Sem compromisso de longo prazo. Faça upgrade, downgrade ou cancele a qualquer momento. O teste gratuito inclui até 50 requisições.

Mensal Anual

(Economize 2 meses com cobrança anual 🎉)