文档内容抓取 API 提供了一种先进的解决方案,旨在从扫描或拍照的文档中提取信息。该工具采用最先进的光学字符识别技术,允许您以高精度识别、处理和结构化数据。当图像或数字文件作为输入时,API 以机器可读格式返回结构化结果,准备集成到验证、文档管理或自动分析系统中。 它可以提取的数据包括全名、地址、出生日期、身份证件、许可证、护照、参考代码、序列号、联系信息和其他重要字段。这种多功能性使其可以应用于多个行业:从金融行业进行身份验证和防止欺诈,到需要自动处理表单或交货单的物流公司。 其可扩展的设计确保以实时方式处理大量文档,提供速度和可靠性。此外,API 识别不同语言和文档格式,适应多样的全球需求。结构化数据的返回促进了与现有系统的直接集成,降低了运营成本和处理时间。 即使在低质量图像、复杂背景或色彩变化下,准确的文本检测也使得该 API 成为应对苛刻环境的强大解决方案。它还具备定位和提取特定区域的能力,如照片、签名或印章,在需要多层验证的过程中增添价值。 总之,文档内容抓取 API 是一种全面的工具,用于将物理或数字文档转化为结构化、可靠和可用的信息。有了它,公司可以简化工作流程,确保信息准确性,并优化客户验证和入职流程。
Document - 端点功能
| 对象 | 描述 |
|---|---|
inputurl |
[必需] |
{"code":"200","status":"SUCCESS","data":{"position":{"left":0,"bottom":0,"right":383,"top":241},"countryName":"United States","documentName":"Driving License","errorCode":0,"nation":{"authority":"","givenNames":"JELANI","name":"SAMPLE JELANI","nationality":"","placeOfBirth":"","sex":"M","surname":"SAMPLE","surnameOfSpouse":""},"ocr":{"name":"SAMPLE JELANI","documentStatus":"SPECIMEN","surname":"SAMPLE","dateOfExpiry":"2018-2-1","addressPostalCode":"85007","addressCity":"PHOENIX","dLClass":"D","eyesColor":"BROWN","height":"172 CM","sex":"M","issuingStateCode":"USA","addressState":"ARIZONA","addressJurisdictionCode":"AZ","veteran":"1","addressStreet":"123 MAIN STREET","address":"123 MAIN STREET\nPHOENIX, AZ 85007","hairColor":"BROWN","weight":"84 KG","dLEndorsed":"NONE","dLRestrictionCode":"NONE","documentDiscriminator":"1234567890123456","documentNumber":"D12345678","dateOfBirth":"1957-2-1","dateOfIssue":"2013-1-10","givenNames":"JELANI","donor":"1"},"portrait_rect":{"bottom":347,"left":31,"right":230,"top":81}},"_note":"Response truncated for documentation purposes"}
curl --location --request POST 'https://zylalabs.com/api/10522/document+content+scraper+api/20083/document?inputurl=https://seaout.oss-us-west-1.aliyuncs.com/sample/IMG_3629.jpg' --header 'Authorization: Bearer YOUR_API_KEY'
| 标头 | 描述 |
|---|---|
授权
|
[必需] 应为 Bearer access_key. 订阅后,请查看上方的"您的 API 访问密钥"。 |
无长期承诺。随时升级、降级或取消。 免费试用包括最多 50 个请求。
API返回从文档中提取的结构化数据,包括个人信息如全名、地址、出生日期、身份证件、许可证、护照、参考代码、序列号和联系信息
响应数据中的关键字段通常包括“姓名”“地址”“出生日期”“证件类型”“序列号”和“联系信息”允许针对各种应用进行全面的数据提取
返回的数据以机器可读的JSON格式结构化,组织为键值对,以便于现有系统的验证和自动化集成
该API可以提取广泛的信息,包括个人身份详细信息、日期、数字和格式化文本,使其适用于身份验证、文档管理和自动分析
响应数据以层次结构组织,每个键表示一个特定的数据字段。这种结构使用户能够轻松地访问和利用提取的信息以满足他们的特定需求
数据准确性是通过先进的光学字符识别技术来维护的,其中包括旨在检测低质量图像和复杂背景中的文本的算法,确保可靠的提取
典型的用例包括金融服务中的身份验证 物流中交付单的自动处理 以及各行业客户入职信息的提取
用户可以通过指定参数如文档类型或文档中特定的兴趣区域来自定义他们的数据请求,从而根据他们的需求进行有针对性的提取
服务级别:
100%
响应时间:
737ms
服务级别:
100%
响应时间:
1,945ms
服务级别:
100%
响应时间:
1,344ms
服务级别:
100%
响应时间:
1,429ms
服务级别:
100%
响应时间:
1,812ms
服务级别:
100%
响应时间:
4,048ms
服务级别:
100%
响应时间:
3,382ms
服务级别:
100%
响应时间:
3,168ms
服务级别:
100%
响应时间:
0ms
服务级别:
100%
响应时间:
1,374ms
服务级别:
100%
响应时间:
3,023ms
服务级别:
100%
响应时间:
3,767ms
服务级别:
100%
响应时间:
1,026ms
服务级别:
100%
响应时间:
1,567ms
服务级别:
100%
响应时间:
5,474ms
服务级别:
100%
响应时间:
2,519ms
服务级别:
100%
响应时间:
667ms
服务级别:
100%
响应时间:
8,724ms
服务级别:
82%
响应时间:
2,073ms
服务级别:
100%
响应时间:
998ms