页面加载中...
使用阿里云百炼 OCR 解析海关税单 PDF,自动提取合同号、报关单号、关税和增值税,按税种汇总并输出结构化 JSON 结果。专为外贸和财务团队设计。
快速安装
确保已安装 clawhub CLI
clawhub install yx-tax-batch-parser使用阿里云百炼 OCR 自动解析海关税单 PDF,提取关键字段并按税种汇总输出结构化 JSON。
clawhub install yx-tax-batch-parser
export ALIYUN_BAILIAN_API_KEY=your-api-key
{ "file": "tax_invoice_001.pdf", "output": "result_001.json" }
输出示例:
{ "contractNo": "2026-SH-00142", "declarationNo": "220120260001", "taxes": { "customs": {"items": 3, "total": 12580.00}, "vat": {"items": 3, "total": 8680.50} }, "grandTotal": 21260.50 }
{ "directory": "/data/tax-invoices/2026-04/", "output": "/data/parsed-results/", "recursive": true, "skipErrors": true }
参照 ineos-batch-parser 的结构设计,采用「扫描→识别→提取→汇总」四阶段流水线。每个阶段独立可配置,支持自定义 OCR 模型和字段映射规则。批量模式下自动生成处理报告,包含成功/失败/跳过统计。
⚠️ 注意:阿里云百炼 OCR 有调用频率限制,批量处理大量文件时建议配置请求间隔。扫描件质量较差时识别精度可能下降,建议配合人工抽检。
版本
v1.0.0
作者
yuxiang2025
平台
发布时间
2026年5月6日
MCP 官方浏览器自动化服务器,基于 Puppeteer 驱动 Chrome。为 Agent 提供网页导航、截图、表单交互和 JavaScript 执行能力。