提取 API 使用人工智能从非结构化文本中提取关键信息,例如名字、电子邮件、日期、金额等。只需发送一段文本和您想要提取的字段列表 — API 将返回干净、结构化的 JSON。
该 API 基于 FastAPI 和 OpenAI 构建,理想用于自动化文档处理、表单填写、客户关系管理增强等。
它支持灵活的字段定义,并适用于从电子邮件和信息到收据和报告的各种情况。无论您是提取一个字段还是多个字段,响应都快速、准确,并准备好集成到您的应用程序中。
无需训练任何模型 — 智能内置于其中。
使用人工智能从原始文本中提取特定字段,如姓名、电子邮件、日期、金额或任何自定义键值。发送一段文本和您想提取的字段列表,API将返回结构化的JSON。
提取 - 端点功能
| 对象 | 描述 |
|---|---|
text |
[必需] The unstructured text to extract information from |
fields |
[必需] A list of field names to extract (e.g. name, email, amount) |
请求体 |
[必需] Json |
{
"message": "Data extracted successfully",
"data": {
"name": "Jane Doe",
"email": "[email protected]",
"amount": "$300",
"date": "May 12th"
}
}
curl --location --request POST 'https://zylalabs.com/api/8379/ai+data+extraction+api/14640/extract?text="John Doe lives at 123 Main St, NYC, phone: (555) 123-4567"&fields="name,address,phone"' --header 'Authorization: Bearer YOUR_API_KEY'
--data-raw '{
"text": "John Doe lives at 123 Main St, NYC, phone: (555) 123-4567",
"fields": "name,address,phone"
}'
此端点分析一段文本并使用人工智能将其分类为一个或多个预定义类别(标签)您提供输入文本和可能标签的列表,然后API返回最能描述该内容的标签这对于自动标记支持票据用户反馈评论或任何非结构化文本非常有用
错误 - 端点功能
| 对象 | 描述 |
|---|---|
text |
[必需] The text you want to classify (e.g., a support message or user feedback). |
labels |
[必需] An array of possible categories (labels) to classify the text into. The API will return the most relevant ones based on the text. |
请求体 |
[必需] Json |
{
"message": "Data classified successfully",
"data": {
"labels": [
"Bug",
"Feature Request"
]
}
curl --location --request POST 'https://zylalabs.com/api/8379/ai+data+extraction+api/14847/classify?text="The app crashes when I try to upload a file. Also, I think it would be nice to have dark mode."&labels="Bug, Feature Request, Login Issue"' --header 'Authorization: Bearer YOUR_API_KEY'
--data-raw '{
"text": "The app crashes when I try to upload a file. Also, I think it would be nice to have dark mode.",
"labels": ["Bug", "Feature Request", "Login Issue"]
}'
该API端点使用OpenAI的GPT模型从非结构化文本输入中提取多个结构化记录。它支持包含一个或多个记录的文本,并返回一致、结构良好的JSON数据以便于使用。
根据文本长度自动切换提取模式:
如果文本长度≤2000个字符,使用单次提取。
如果文本长度>2000个字符,将文本拆分为块并从每个块中提取记录。
验证输入文本非空且小于最大长度(5000个字符)。
在失败时返回详细错误消息。
请求:
响应:
提取多个记录 - 端点功能
| 对象 | 描述 |
|---|---|
text |
[必需] The unstructured text to extract information from |
fields |
可选 A list of fields names to extract (e.g. name, email, amount) |
请求体 |
[必需] Json |
{
"message": "Records extracted successfully",
"data": [
{"from": "John", "amount": "$50", "to": "Alice"},
{"from": "Bob", "amount": "$40", "to": "Sarah"},
{"from": "Chris", "amount": "$80", "to": "Megan"}
]
}
curl --location --request POST 'https://zylalabs.com/api/8379/ai+data+extraction+api/14848/extract+multiple+records?text=Required' --header 'Authorization: Bearer YOUR_API_KEY'
--data-raw '{
"text": "Order #123: Pizza $15, delivered to 123 Main St. Order #124: Burger $12, delivered to 456 Oak Ave.",
"fields": ["order_id", "item", "price", "address"]
}'
| 标头 | 描述 |
|---|---|
授权
|
[必需] 应为 Bearer access_key. 订阅后,请查看上方的"您的 API 访问密钥"。 |
无长期承诺。随时升级、降级或取消。 免费试用包括最多 50 个请求。
提取端点以 JSON 格式返回结构化数据,包括提取自提供文本的姓名、电子邮件、金额和日期等关键信息。
响应数据中的关键字段通常包括“姓名”、“电子邮件”、“金额”和“日期”。根据用户需求也可以指定额外的自定义字段
用户可以通过指定他们想要从输入文本中提取的字段列表来定制他们的数据请求。这允许根据特定需求进行量身定制的数据提取
响应数据以JSON结构组织,包含一个表示成功的“message”字段和一个保存提取的键值对的“data”字段
典型的用例包括自动化文档处理 丰富客户关系管理系统 填写表格 以及从电子邮件 收据和报告中提取信息
通过使用内置的先进人工智能算法来保持数据的准确性,确保从非结构化文本中进行可靠的提取,而无需用户培训
标准数据模式包括可识别的名称、电子邮件、日期和货币金额格式 用户可以期待在各种文本类型中获得一致的提取结果
提取端点可以从非结构化文本中提取多种类型的信息,包括个人识别信息(姓名、电子邮件)、财务数据(金额)和时间数据(日期)
服务级别:
100%
响应时间:
830ms
服务级别:
100%
响应时间:
1,585ms
服务级别:
100%
响应时间:
10,154ms
服务级别:
100%
响应时间:
573ms
服务级别:
100%
响应时间:
4,485ms
服务级别:
100%
响应时间:
723ms
服务级别:
100%
响应时间:
6,629ms
服务级别:
100%
响应时间:
1,814ms
服务级别:
100%
响应时间:
106ms
服务级别:
100%
响应时间:
11,307ms
服务级别:
100%
响应时间:
2,242ms
服务级别:
100%
响应时间:
4,239ms
服务级别:
100%
响应时间:
4,745ms
服务级别:
100%
响应时间:
3,038ms
服务级别:
100%
响应时间:
4,065ms
服务级别:
100%
响应时间:
309ms
服务级别:
100%
响应时间:
1,895ms
服务级别:
50%
响应时间:
4,885ms
服务级别:
50%
响应时间:
5,061ms
服务级别:
100%
响应时间:
2,930ms