Extracción de Datos del Documento API API ID: 3606

Optimiza tus flujos de trabajo con nuestra API de Extracción de Datos de Documentos, diseñada para transformar cualquier documento estructurado o no estructurado en datos estructurados y procesables.

Usa esta API desde tu agente de IA vía MCP

Funciona con OpenClaw, Claude Code/Desktop, Cursor, Windsurf, Cline y cualquier cliente de IA compatible con MCP.

Docs y configuración

Crea un skill envolviendo este MCP: https://mcp.zylalabs.com/mcp?apikey=YOUR_ZYLA_API_KEY

Eleva tus capacidades de manejo de datos con la API de Extracción de Datos de Documentos de Extracta.ai. Nuestra solución de vanguardia permite a tus sistemas extraer automáticamente datos estructurados de una multitud de documentos, ya sean imágenes escaneadas, PDFs, correos electrónicos, facturas, contratos o cualquier formato de archivo digital que puedas imaginar. Diseñada para satisfacer las necesidades de diversas industrias, nuestra API facilita la automatización sin esfuerzo de los flujos de trabajo, reduciendo significativamente los esfuerzos manuales y mejorando la eficiencia general.

Características:

Compatibilidad Universal: Procesa documentos en cualquier formato: PDF, DOCX, TXT, JPG, PNG, y más.
Alta Precisión y Velocidad: Aprovecha la tecnología de última generación que no requiere preentrenamiento, asegurando una extracción rápida con una precisión superior.
Extracción de Datos Personalizada: Define criterios de extracción específicos para satisfacer tus necesidades comerciales únicas, desde la extracción de secciones de texto específicas hasta puntos de datos complejos.
Fácil Integración: Con documentación de API amigable para desarrolladores, integra nuestro servicio sin problemas en tu software o flujo de trabajo existente.
Escalabilidad: Desde unos pocos documentos hasta miles, nuestra API puede manejar lotes de cualquier tamaño de manera eficiente.
Seguridad: La privacidad y seguridad de tus datos son primordiales. Nos aseguramos de que tu información nunca se utilice con fines de entrenamiento y se maneje con la máxima confidencialidad.

Ya seas un desarrollador de software, un analista de negocios o un científico de datos, nuestra API de Extracción de Datos de Documentos está diseñada para simplificar tus tareas de procesamiento de datos, permitiéndote centrarte en lo que realmente importa: impulsar tu negocio hacia adelante. Comienza con Extracta.ai hoy y transforma la forma en que manejas documentos para siempre.

Documentación de la API

Endpoints

Documento de Proceso Endpoint ID: 4000

Estructura tu solicitud con parámetros obligatorios: 'name', 'language', 'fields' y 'file'. Cada campo requiere una 'key', siendo 'description' y 'example' opcionales. El documento debe proporcionarse como 'base64String' o una 'fileUrl'.

## Documentación de la API
Esta sección proporciona directrices para estructurar tus solicitudes a la API de Análisis de Documentos de Extracta.ai. Asegúrate de seguir el formato a continuación para una extracción de datos exitosa:

## Formato de Solicitud
```
{
"extractionDetails": {
"name": "Nombre de la Extracción", // obligatorio - Nombra tu proceso de extracción
"language": "Idioma Soportado", // obligatorio - Elige de los idiomas soportados
"fields": [
{
"key": "Clave del Campo", // obligatorio - Define la clave para la extracción de datos
"description": "Descripción del Campo", // opcional - Describe el campo
"example": "Ejemplo del Campo" // opcional - Proporciona un valor de ejemplo
},
...
]
},
"file": "base64String o URL del archivo" // obligatorio - Proporciona el documento en formato base64String o como una URL
}
```
## Formato Avanzado
Además del formato básico descrito en las secciones anteriores, Extracta.ai también soporta estructuras de datos más complejas para necesidades de extracción especializadas. Este formato avanzado permite la definición de **objetos y arreglos anidados**, atendiendo a un rango más amplio de representación de datos.

### Tipo `object`
El tipo **object** representa un objeto estructurado con múltiples **propiedades**. Cada propiedad se define como un objeto dentro de un arreglo, y puede incluir su propia **key**, **description**, **type** y **example**.
```
{
"key": "informacion_personal",
"description": "Información personal de la persona", // opcional
"type": "object",
"properties": [
{
"key": "name",
"description": "Nombre de la persona", // opcional
"example": "Alex Smith", // opcional
"type": "string" // opcional
},
{
"key": "email",
"description": "Email de la persona",
"example": "[email protected]",
"type": "string"
},
.....
]
}
```

### Tipo `array`
El tipo **array** se utiliza para listas de **elementos**, como una colección de experiencias laborales. La clave items contiene un objeto que define la estructura de cada elemento en el arreglo.
```
{
"key": "experiencia_laboral",
"description": "Experiencia laboral de la persona", // opcional
"type": "array",
"items": {
"type": "object",
"properties": [
{
"key": "title",
"description": "Título del trabajo", // opcional
"example": "Ingeniero de Software", // opcional
"type": "string" // opcional
},
{
"key": "start_date",
"description": "Fecha de inicio del trabajo",
"example": "2022",
"type": "string"
},
...
]
}
}
```

### Notas sobre el Uso | API de Análisis de Documentos
- Para los tipos `object` y `array`, el parámetro `example` es aplicable solo para sus propiedades/items internas.
- Al definir campos, si no se especifica un `type`, por defecto es `string`.
- Para los tipos `object` y `array`, los campos internos solo pueden ser de tipo `string`. Esto significa que cada propiedad dentro de un objeto o cada elemento dentro de un arreglo debe ser de tipo string, asegurando consistencia y simplicidad en la representación de datos.
- Estos tipos de campo avanzados permiten una representación de datos más detallada y estructurada, mejorando las capacidades del proceso de extracción de datos de Extracta.ai.

## Tipos de Archivo Soportados

Extracta.ai es capaz de procesar documentos en **formatos de imagen (JPG, PNG), PDF y DOCX**. Esta mejora permite una gama más amplia de tipos de documentos para ser enviados para extracción.

## Idiomas Soportados

Extracta.ai actualmente soporta la extracción de documentos en los siguientes idiomas: **Rumano, Inglés, Francés, Español, Árabe, Portugués, Alemán, Italiano**. Se planea soporte adicional para 20 idiomas más.

**Nota**: Si se especifica un idioma no soportado, la API devolverá un mensaje de error indicando una elección de idioma inválida. Mantente actualizado con nuestra documentación de API para nuevas adiciones de idiomas.

                                                                            
POST https://pr137-testing.zylalabs.com/api/3606/document+data+extraction+api/4000/process+document

Documento de Proceso - Características del Endpoint

Objeto	Descripción
`Cuerpo de la Solicitud`	[Requerido] Json

Cuerpo de la Solicitud

{
	"extractionDetails": {
		"name": "CV - Extraction",
		"language": "English",
		"fields": [
			{
				"key": "name",
				"description": "the name of the person in the CV",
				"example": "Johan Smith"
			},
			{
				"key": "email",
				"description": "the email of the person in the CV",
				"example": "johan@gmail.com"
			},
			{
				"key": "phone",
				"description": "the phone number of the person",
				"example": "123 333 4445"
			},
			{
				"key": "address",
				"description": "the compelte address of the person",
				"example": "1234 Main St, New York, NY 10001"
			},
			{
				"key": "soft_skills",
				"description": "the soft skills of the person",
				"example": ""
			},
			{
				"key": "hard_skills",
				"description": "the hard skills of the person",
				"example": ""
			},
			{
				"key": "last_job",
				"description": "the last job of the person",
				"example": "Software Engineer"
			},
			{
				"key": "years_of_experience",
				"description": "the years of experience of last job",
				"example": "5"
			}
		]
	},
	"file": "https://deveatery.com/extracta/cv.png"
}

Probar Endpoint

RESPUESTA DE EJEMPLO DE LA API

       
                                                                                                        
                                                                                                                                                                                                                                                                                                                                        {
	"name": "Darren Charles",
	"email": "[email protected]",
	"phone": "+1-709-680-9033",
	"address": "9 Corpus Christi, Texas",
	"soft_skills": "highly motivated, ability to translate business strategies, learn new things",
	"hard_skills": "Matlab, MeVisLab, Keras, CUDA, Git, DataStage, MQTT",
	"last_job": "Trainee With English Communications",
	"years_of_experience": "Ongoing"
}

Documento de Proceso - CÓDIGOS DE EJEMPLO


curl --location --request POST 'https://zylalabs.com/api/3606/document+data+extraction+api/4000/process+document' --header 'Authorization: Bearer YOUR_API_KEY' 

--data-raw '{
	"extractionDetails": {
		"name": "CV - Extraction",
		"language": "English",
		"fields": [
			{
				"key": "name",
				"description": "the name of the person in the CV",
				"example": "Johan Smith"
			},
			{
				"key": "email",
				"description": "the email of the person in the CV",
				"example": "[email protected]"
			},
			{
				"key": "phone",
				"description": "the phone number of the person",
				"example": "123 333 4445"
			},
			{
				"key": "address",
				"description": "the compelte address of the person",
				"example": "1234 Main St, New York, NY 10001"
			},
			{
				"key": "soft_skills",
				"description": "the soft skills of the person",
				"example": ""
			},
			{
				"key": "hard_skills",
				"description": "the hard skills of the person",
				"example": ""
			},
			{
				"key": "last_job",
				"description": "the last job of the person",
				"example": "Software Engineer"
			},
			{
				"key": "years_of_experience",
				"description": "the years of experience of last job",
				"example": "5"
			}
		]
	},
	"file": "https://deveatery.com/extracta/cv.png"
}'

Clave de Acceso a la API y Autenticación

Después de registrarte, a cada desarrollador se le asigna una clave de acceso a la API personal, una combinación única de letras y dígitos proporcionada para acceder a nuestro endpoint de la API. Para autenticarte con el Extracción de Datos del Documento API simplemente incluye tu token de portador en el encabezado de Autorización.

Encabezados

Encabezado	Descripción
`Autorización`	[Requerido] Debería ser `Bearer access_key`. Consulta "Tu Clave de Acceso a la API" arriba cuando estés suscrito.

Preguntas

Precios Simples y Transparentes

Sin compromiso a largo plazo. Mejora, reduce o cancela en cualquier momento. La Prueba Gratuita incluye hasta 50 solicitudes.

Mensual Anual

(Ahorra 2 meses pagando anualmente 🎉)