Eleva tus capacidades de manejo de datos con la API de Extracción de Datos de Documentos de Extracta.ai. Nuestra solución de vanguardia permite a tus sistemas extraer automáticamente datos estructurados de una multitud de documentos, ya sean imágenes escaneadas, PDFs, correos electrónicos, facturas, contratos o cualquier formato de archivo digital que puedas imaginar. Diseñada para satisfacer las necesidades de diversas industrias, nuestra API facilita la automatización sin esfuerzo de los flujos de trabajo, reduciendo significativamente los esfuerzos manuales y mejorando la eficiencia general.
Características:
Ya seas un desarrollador de software, un analista de negocios o un científico de datos, nuestra API de Extracción de Datos de Documentos está diseñada para simplificar tus tareas de procesamiento de datos, permitiéndote centrarte en lo que realmente importa: impulsar tu negocio hacia adelante. Comienza con Extracta.ai hoy y transforma la forma en que manejas documentos para siempre.
Estructura tu solicitud con parámetros obligatorios: 'name', 'language', 'fields' y 'file'. Cada campo requiere una 'key', siendo 'description' y 'example' opcionales. El documento debe proporcionarse como 'base64String' o una 'fileUrl'.
## Documentación de la API
Esta sección proporciona directrices para estructurar tus solicitudes a la API de Análisis de Documentos de Extracta.ai. Asegúrate de seguir el formato a continuación para una extracción de datos exitosa:
## Formato de Solicitud
```
{
"extractionDetails": {
"name": "Nombre de la Extracción", // obligatorio - Nombra tu proceso de extracción
"language": "Idioma Soportado", // obligatorio - Elige de los idiomas soportados
"fields": [
{
"key": "Clave del Campo", // obligatorio - Define la clave para la extracción de datos
"description": "Descripción del Campo", // opcional - Describe el campo
"example": "Ejemplo del Campo" // opcional - Proporciona un valor de ejemplo
},
...
]
},
"file": "base64String o URL del archivo" // obligatorio - Proporciona el documento en formato base64String o como una URL
}
```
## Formato Avanzado
Además del formato básico descrito en las secciones anteriores, Extracta.ai también soporta estructuras de datos más complejas para necesidades de extracción especializadas. Este formato avanzado permite la definición de **objetos y arreglos anidados**, atendiendo a un rango más amplio de representación de datos.
### Tipo `object`
El tipo **object** representa un objeto estructurado con múltiples **propiedades**. Cada propiedad se define como un objeto dentro de un arreglo, y puede incluir su propia **key**, **description**, **type** y **example**.
```
{
"key": "informacion_personal",
"description": "Información personal de la persona", // opcional
"type": "object",
"properties": [
{
"key": "name",
"description": "Nombre de la persona", // opcional
"example": "Alex Smith", // opcional
"type": "string" // opcional
},
{
"key": "email",
"description": "Email de la persona",
"example": "[email protected]",
"type": "string"
},
.....
]
}
```
### Tipo `array`
El tipo **array** se utiliza para listas de **elementos**, como una colección de experiencias laborales. La clave items contiene un objeto que define la estructura de cada elemento en el arreglo.
```
{
"key": "experiencia_laboral",
"description": "Experiencia laboral de la persona", // opcional
"type": "array",
"items": {
"type": "object",
"properties": [
{
"key": "title",
"description": "Título del trabajo", // opcional
"example": "Ingeniero de Software", // opcional
"type": "string" // opcional
},
{
"key": "start_date",
"description": "Fecha de inicio del trabajo",
"example": "2022",
"type": "string"
},
...
]
}
}
```
### Notas sobre el Uso | API de Análisis de Documentos
- Para los tipos `object` y `array`, el parámetro `example` es aplicable solo para sus propiedades/items internas.
- Al definir campos, si no se especifica un `type`, por defecto es `string`.
- Para los tipos `object` y `array`, los campos internos solo pueden ser de tipo `string`. Esto significa que cada propiedad dentro de un objeto o cada elemento dentro de un arreglo debe ser de tipo string, asegurando consistencia y simplicidad en la representación de datos.
- Estos tipos de campo avanzados permiten una representación de datos más detallada y estructurada, mejorando las capacidades del proceso de extracción de datos de Extracta.ai.
## Tipos de Archivo Soportados
Extracta.ai es capaz de procesar documentos en **formatos de imagen (JPG, PNG), PDF y DOCX**. Esta mejora permite una gama más amplia de tipos de documentos para ser enviados para extracción.
## Idiomas Soportados
Extracta.ai actualmente soporta la extracción de documentos en los siguientes idiomas: **Rumano, Inglés, Francés, Español, Árabe, Portugués, Alemán, Italiano**. Se planea soporte adicional para 20 idiomas más.
**Nota**: Si se especifica un idioma no soportado, la API devolverá un mensaje de error indicando una elección de idioma inválida. Mantente actualizado con nuestra documentación de API para nuevas adiciones de idiomas.
Documento de Proceso - Características del Endpoint
| Objeto | Descripción |
|---|---|
Cuerpo de la Solicitud |
[Requerido] Json |
{
"name": "Darren Charles",
"email": "[email protected]",
"phone": "+1-709-680-9033",
"address": "9 Corpus Christi, Texas",
"soft_skills": "highly motivated, ability to translate business strategies, learn new things",
"hard_skills": "Matlab, MeVisLab, Keras, CUDA, Git, DataStage, MQTT",
"last_job": "Trainee With English Communications",
"years_of_experience": "Ongoing"
}
curl --location --request POST 'https://zylalabs.com/api/3606/document+data+extraction+api/4000/process+document' --header 'Authorization: Bearer YOUR_API_KEY'
--data-raw '{
"extractionDetails": {
"name": "CV - Extraction",
"language": "English",
"fields": [
{
"key": "name",
"description": "the name of the person in the CV",
"example": "Johan Smith"
},
{
"key": "email",
"description": "the email of the person in the CV",
"example": "[email protected]"
},
{
"key": "phone",
"description": "the phone number of the person",
"example": "123 333 4445"
},
{
"key": "address",
"description": "the compelte address of the person",
"example": "1234 Main St, New York, NY 10001"
},
{
"key": "soft_skills",
"description": "the soft skills of the person",
"example": ""
},
{
"key": "hard_skills",
"description": "the hard skills of the person",
"example": ""
},
{
"key": "last_job",
"description": "the last job of the person",
"example": "Software Engineer"
},
{
"key": "years_of_experience",
"description": "the years of experience of last job",
"example": "5"
}
]
},
"file": "https://deveatery.com/extracta/cv.png"
}'
| Encabezado | Descripción |
|---|---|
Autorización
|
[Requerido] Debería ser Bearer access_key. Consulta "Tu Clave de Acceso a la API" arriba cuando estés suscrito. |
Sin compromiso a largo plazo. Mejora, reduce o cancela en cualquier momento. La Prueba Gratuita incluye hasta 50 solicitudes.
Somos capaces de manejar un amplio espectro de documentos, que abarcan tanto formatos estructurados como no estructurados, como PDFs, documentos de Word, archivos de texto e imágenes escaneadas (en formatos PNG, JPG), utilizando tecnología OCR según sea necesario.
La API devuelve datos estructurados extraídos de documentos, incluidos campos clave como nombre, correo electrónico, teléfono, dirección y habilidades. Estos datos están organizados en un formato JSON, lo que facilita su integración en aplicaciones.
Los usuarios pueden personalizar las solicitudes definiendo criterios de extracción específicos en el parámetro 'fields'. Cada campo puede incluir una 'clave', 'descripción' y 'ejemplo', lo que permite una extracción de datos adaptada a las necesidades comerciales únicas.
Los datos de respuesta suelen incluir campos como "nombre", "correo electrónico", "teléfono", "dirección", "habilidades blandas", "habilidades duras", "último trabajo" y "años de experiencia". Estos campos proporcionan información completa sobre el contenido del documento extraído.
Los datos de respuesta están estructurados en un formato JSON, donde cada clave corresponde a una pieza específica de información extraída. Esta organización permite un análisis e integración sencillos en varias aplicaciones.
La API puede extraer una amplia gama de información, incluyendo detalles personales, información de contacto, habilidades, experiencia laboral y antecedentes educativos de varios tipos de documentos, como currículos e facturas.
La precisión de los datos se mantiene a través de algoritmos de extracción avanzados que aprovechan la tecnología de vanguardia. La API no requiere preentrenamiento, lo que garantiza una extracción rápida y precisa de diversos formatos de documentos.
El endpoint acepta parámetros como 'name' (nombre de la extracción), 'language' (idiomas soportados) y 'fields' (claves de datos específicas). Los usuarios deben proporcionar un documento válido en formato 'base64String' o 'fileUrl'.
Los casos de uso típicos incluyen la automatización de la entrada de datos a partir de currículos, facturas, contratos y otros documentos, la optimización de flujos de trabajo en los sectores de recursos humanos, finanzas y legal, y la mejora de la eficiencia en el procesamiento de datos en diversas industrias.
Nivel de Servicio:
100%
Tiempo de Respuesta:
1.945ms
Nivel de Servicio:
100%
Tiempo de Respuesta:
1.344ms
Nivel de Servicio:
100%
Tiempo de Respuesta:
1.812ms
Nivel de Servicio:
100%
Tiempo de Respuesta:
1.429ms
Nivel de Servicio:
100%
Tiempo de Respuesta:
1.586ms
Nivel de Servicio:
100%
Tiempo de Respuesta:
737ms
Nivel de Servicio:
100%
Tiempo de Respuesta:
1.245ms
Nivel de Servicio:
100%
Tiempo de Respuesta:
794ms
Nivel de Servicio:
100%
Tiempo de Respuesta:
857ms
Nivel de Servicio:
91%
Tiempo de Respuesta:
2.513ms
Nivel de Servicio:
100%
Tiempo de Respuesta:
7.384ms
Nivel de Servicio:
100%
Tiempo de Respuesta:
15ms
Nivel de Servicio:
100%
Tiempo de Respuesta:
15ms
Nivel de Servicio:
100%
Tiempo de Respuesta:
15ms
Nivel de Servicio:
100%
Tiempo de Respuesta:
15ms
Nivel de Servicio:
100%
Tiempo de Respuesta:
3.502ms
Nivel de Servicio:
100%
Tiempo de Respuesta:
6.052ms
Nivel de Servicio:
100%
Tiempo de Respuesta:
8.361ms
Nivel de Servicio:
100%
Tiempo de Respuesta:
3.783ms
Nivel de Servicio:
100%
Tiempo de Respuesta:
6.185ms