Eleve suas capacidades de manuseio de dados com a API de Extração de Dados de Documentos da Extracta.ai Nossa solução inovadora capacita seus sistemas a extrair automaticamente dados estruturados de uma infinidade de documentos - sejam imagens digitalizadas, PDFs, e-mails, faturas, contratos ou qualquer formato de arquivo digital que você possa imaginar Adaptada para atender às necessidades de várias indústrias nossa API facilita a automação perfeita de fluxos de trabalho reduzindo significativamente os esforços manuais e aumentando a eficiência geral
Características:
Se você é um desenvolvedor de software um analista de negócios ou um cientista de dados nossa API de Extração de Dados de Documentos foi projetada para simplificar suas tarefas de processamento de dados permitindo que você se concentre no que realmente importa - impulsionar seu negócio para frente Comece com a Extracta.ai hoje e transforme a maneira como você lida com documentos para sempre
Estruture sua solicitação com parâmetros obrigatórios: 'nome', 'idioma', 'campos' e 'arquivo'. Cada campo requer uma 'chave', sendo 'descrição' e 'exemplo' opcionais. O documento deve ser fornecido como 'base64String' ou um 'fileUrl'.
## Documentação da API
Esta seção fornece diretrizes para estruturar suas solicitações da API de Análise de Documentos para a Extracta.ai. Certifique-se de seguir o formato abaixo para uma extração de dados bem-sucedida:
## Formato da Solicitação
```
{
"detalhesDaExtração": {
"nome": "Nome da Extração", // obrigatório - Nomeie seu processo de extração
"idioma": "Idioma Suportado", // obrigatório - Escolha entre os idiomas suportados
"campos": [
{
"chave": "Chave do Campo", // obrigatório - Defina a chave para a extração de dados
"descrição": "Descrição do Campo", // opcional - Descreva o campo
"exemplo": "Exemplo do Campo" // opcional - Forneça um valor de exemplo
},
...
]
},
"arquivo": "base64String ou URL do arquivo" // obrigatório - Forneça o documento no formato base64String ou como uma URL
}
```
## Formato Avançado
Além do formato básico descrito nas seções anteriores, a Extracta.ai também suporta estruturas de dados mais complexas para necessidades de extração especializadas. Este formato avançado permite a definição de **objetos e arrays aninhados**, atendendo a uma gama mais ampla de representação de dados.
### Tipo `objeto`
O tipo **objeto** representa um objeto estruturado com múltiplas **propriedades**. Cada propriedade é definida como um objeto dentro de um array e pode incluir sua própria **chave**, **descrição**, **tipo** e **exemplo**.
```
{
"chave": "informações_pessoais",
"descrição": "Informações pessoais da pessoa", // opcional
"tipo": "objeto",
"propriedades": [
{
"chave": "nome",
"descrição": "Nome da pessoa", // opcional
"exemplo": "Alex Smith", // opcional
"tipo": "string" // opcional
},
{
"chave": "email",
"descrição": "Email da pessoa",
"exemplo": "[email protected]",
"tipo": "string"
},
.....
]
}
```
### Tipo `array`
O tipo **array** é usado para listas de **itens**, como uma coleção de experiências de trabalho. A chave items contém um objeto definindo a estrutura de cada item no array.
```
{
"chave": "experiencia_de_trabalho",
"descrição": "Experiência de trabalho da pessoa", // opcional
"tipo": "array",
"itens": {
"tipo": "objeto",
"propriedades": [
{
"chave": "titulo",
"descrição": "Título do trabalho", // opcional
"exemplo": "Engenheiro de Software", // opcional
"tipo": "string" // opcional
},
{
"chave": "data_inicio",
"descrição": "Data de início do trabalho",
"exemplo": "2022",
"tipo": "string"
},
...
]
}
}
```
### Observações sobre o Uso | API de Análise de Documentos
- Para os tipos `objeto` e `array`, o parâmetro `exemplo` é aplicável apenas para suas propriedades/item internos.
- Ao definir campos, se nenhum `tipo` for especificado, o padrão será `string`.
- Para os tipos `objeto` e `array`, os campos internos só podem ser do tipo `string`. Isso significa que cada propriedade dentro de um objeto ou cada item dentro de um array deve ser do tipo string, garantindo consistência e simplicidade na representação de dados.
- Esses tipos de campo avançados permitem uma representação de dados mais detalhada e estruturada, aprimorando as capacidades do processo de extração de dados da Extracta.ai.
## Tipos de Arquivo Suportados
A Extracta.ai é capaz de processar documentos nos formatos **imagem (JPG, PNG), PDF e DOCX**. Essa melhoria permite uma maior variedade de tipos de documentos que podem ser enviados para extração.
## Idiomas Suportados
A Extracta.ai atualmente suporta a extração de documentos nos seguintes idiomas: **Romeno, Inglês, Francês, Espanhol, Árabe, Português, Alemão, Italiano**. Suporte adicional para mais 20 idiomas está planejado.
**Nota**: Se um idioma não suportado for especificado, a API retornará uma mensagem de erro indicando uma escolha de idioma inválida. Mantenha-se atualizado com nossa documentação da API para novas adições de idiomas.
Documento de Processo - Recursos do endpoint
| Objeto | Descrição |
|---|---|
Corpo da requisição |
[Obrigatório] Json |
{
"name": "Darren Charles",
"email": "[email protected]",
"phone": "+1-709-680-9033",
"address": "9 Corpus Christi, Texas",
"soft_skills": "highly motivated, ability to translate business strategies, learn new things",
"hard_skills": "Matlab, MeVisLab, Keras, CUDA, Git, DataStage, MQTT",
"last_job": "Trainee With English Communications",
"years_of_experience": "Ongoing"
}
curl --location --request POST 'https://zylalabs.com/api/3606/document+data+extraction+api/4000/process+document' --header 'Authorization: Bearer YOUR_API_KEY'
--data-raw '{
"extractionDetails": {
"name": "CV - Extraction",
"language": "English",
"fields": [
{
"key": "name",
"description": "the name of the person in the CV",
"example": "Johan Smith"
},
{
"key": "email",
"description": "the email of the person in the CV",
"example": "[email protected]"
},
{
"key": "phone",
"description": "the phone number of the person",
"example": "123 333 4445"
},
{
"key": "address",
"description": "the compelte address of the person",
"example": "1234 Main St, New York, NY 10001"
},
{
"key": "soft_skills",
"description": "the soft skills of the person",
"example": ""
},
{
"key": "hard_skills",
"description": "the hard skills of the person",
"example": ""
},
{
"key": "last_job",
"description": "the last job of the person",
"example": "Software Engineer"
},
{
"key": "years_of_experience",
"description": "the years of experience of last job",
"example": "5"
}
]
},
"file": "https://deveatery.com/extracta/cv.png"
}'
| Cabeçalho | Descrição |
|---|---|
Authorization
|
[Obrigatório] Deve ser Bearer access_key. Veja "Sua chave de acesso à API" acima quando você estiver inscrito. |
Sem compromisso de longo prazo. Faça upgrade, downgrade ou cancele a qualquer momento. O teste gratuito inclui até 50 requisições.
Somos capazes de lidar com uma ampla gama de documentos, abrangendo tanto formatos estruturados quanto não estruturados, como PDFs, documentos Word, arquivos de texto e imagens digitalizadas (nos formatos PNG, JPG), empregando tecnologia OCR conforme necessário
A API retorna dados estruturados extraídos de documentos, incluindo campos principais como nome, e-mail, telefone, endereço e habilidades. Esses dados são organizados em um formato JSON, facilitando a integração em aplicativos
Os usuários podem personalizar solicitações definindo critérios de extração específicos no parâmetro 'fields'. Cada campo pode incluir uma 'chave', 'descrição' e 'exemplo', permitindo a extração de dados personalizada com base nas necessidades comerciais exclusivas
Os dados de resposta geralmente incluem campos como "nome", "email", "telefone", "endereço", "habilidades_suaves", "habilidades_duras", "último_emprego" e "anos_de_experiência" Esses campos fornecem insights abrangentes sobre o conteúdo do documento extraído
Os dados da resposta estão estruturados em um formato JSON onde cada chave corresponde a uma peça específica de informação extraída Essa organização permite uma análise e integração diretas em várias aplicações
A API pode extrair uma ampla variedade de informações, incluindo detalhes pessoais, informações de contato, habilidades, experiência de trabalho e formação educacional de vários tipos de documentos, como currículos e faturas
A precisão dos dados é mantida através de algoritmos de extração avançados que aproveitam a tecnologia de ponta A API não requer pré-treinamento garantindo extração rápida e precisa de diversos formatos de documentos
O endpoint aceita parâmetros como 'name' (nome da extração), 'language' (idiomas suportados) e 'fields' (chaves de dados específicas). Os usuários devem fornecer um documento válido no formato 'base64String' ou 'fileUrl'
Casos de uso típicos incluem a automação da inserção de dados a partir de currículos, faturas, contratos e outros documentos, a otimização dos fluxos de trabalho nos setores de RH, finanças e jurídicos, e a melhoria da eficiência do processamento de dados em várias indústrias
Nível de serviço:
100%
Tempo de resposta:
1.945ms
Nível de serviço:
100%
Tempo de resposta:
1.812ms
Nível de serviço:
100%
Tempo de resposta:
1.344ms
Nível de serviço:
100%
Tempo de resposta:
1.429ms
Nível de serviço:
100%
Tempo de resposta:
1.586ms
Nível de serviço:
100%
Tempo de resposta:
737ms
Nível de serviço:
100%
Tempo de resposta:
1.245ms
Nível de serviço:
100%
Tempo de resposta:
794ms
Nível de serviço:
100%
Tempo de resposta:
857ms
Nível de serviço:
100%
Tempo de resposta:
0ms
Nível de serviço:
100%
Tempo de resposta:
436ms
Nível de serviço:
100%
Tempo de resposta:
634ms
Nível de serviço:
100%
Tempo de resposta:
1.882ms
Nível de serviço:
100%
Tempo de resposta:
396ms
Nível de serviço:
100%
Tempo de resposta:
561ms
Nível de serviço:
100%
Tempo de resposta:
295ms
Nível de serviço:
100%
Tempo de resposta:
1.424ms
Nível de serviço:
100%
Tempo de resposta:
1.029ms
Nível de serviço:
100%
Tempo de resposta:
825ms
Nível de serviço:
100%
Tempo de resposta:
2.121ms