CN114419637A - 基于ai的跨境供应链表单生成方法及相关装置 - Google Patents

基于ai的跨境供应链表单生成方法及相关装置 Download PDF

Info

Publication number
CN114419637A
CN114419637A CN202111057372.4A CN202111057372A CN114419637A CN 114419637 A CN114419637 A CN 114419637A CN 202111057372 A CN202111057372 A CN 202111057372A CN 114419637 A CN114419637 A CN 114419637A
Authority
CN
China
Prior art keywords
anchor point
processed
information
supply chain
cross
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202111057372.4A
Other languages
English (en)
Inventor
黄晓莲
卢光永
黄金宝
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Guangzhou Wuyue Information Technology Co ltd
Original Assignee
Guangzhou Wuyue Information Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Guangzhou Wuyue Information Technology Co ltd filed Critical Guangzhou Wuyue Information Technology Co ltd
Priority to CN202111057372.4A priority Critical patent/CN114419637A/zh
Publication of CN114419637A publication Critical patent/CN114419637A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/22Matching criteria, e.g. proximity measures

Landscapes

  • Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Artificial Intelligence (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Character Input (AREA)

Abstract

本申请涉及跨境供应链业务领域,尤其涉及一种基于AI的跨境供应链表单生成方法及相关装置。所述方法包括:应用OCR(Optical Character Recognition,光学字符识别)技术对跨境供应业链业务的各类表单及信息进行识别,获取到待处理原始表单图像后,通过表单管理系统进行锚点设置及模板训练,利用框选固定锚点技术及锚点识别算法,对获取到的表单图像中锚点信息进行智能识别、智能提取、智能校验及转换输出。采用本方法能够提高表单处理效率,减少人工成本。

Description

基于AI的跨境供应链表单生成方法及相关装置
技术领域
本发明涉及跨境供应链业务领域,尤其涉及一种基于AI的跨境供应链表单生成方法及相关装置。
背景技术
在跨境进出口贸易日常业务过程中,供应链企业及跨境物流企业人员需要处理大量的各类表单,而由于不同国家间贸易习惯、使用语言、信息化管理等方面存在较大的差异,相关表单的信息非常复杂,所涉及的文件格式也各不相同,如图片、传真、PDF、邮件、标签、手写纸张、电子表格等。
由于表单信息复杂及格式多样,企业在进行表单信息的识别、读取、分析、较验、传输等处理时,主要依赖人工操作,工作效率低下,容易出错,且所需的人工成本较高。尽管有的企业已经实施了电子化操作,但大量的表单信息在进入信息系统时,仍需通过人工进行加工及输入,并不能真正有效地提升工作效率。
目前人工智能表单领域已有的方法、装置尚不能支持用户对自定义的多格式类型文件进行智能识别、智能比对及智能较验。
发明内容
鉴于上述问题,本发明的目的在于提供一种基于人工智能(英文:AI)的跨境供应链表单生成方法及相关装置。
第一方面,本发明提供了一种基于AI的跨境供应链表单生成方法,所述方法包括:原始表单图像识别,用于获取待处理的原始表单图像;锚点定义,用于设定待处理输出表单项在所述原始表单图像中的像素点标识、坐标位置及应用作用域;锚点框选及信息提取,利用锚点标识算法,在原始表单图像中查找并提取所有符合锚点参数的唯一特征标识的信息,并将信息自动填入所述待处理输出表单项中。
结合本公开提供的任一实施方式,所述原始表单识别是通过应用OCR(OpticalCharacter Recognition,光学字符识别)技术将待处理的原始表单转换成统一格式的原始表单图像,所述表单图像包含相关的字符、文本像素点及其对应的物理位置等相关信息。
结合本公开提供的任一实施方式,所述锚点是待处理输出表单中项的字段标识,通过锚点定义,设定待处理输出表单项在所述原始表单图像中的像素点标识、坐标位置及应用作用域,建立待处理输出表单项与所述原始表图像的对应关系,以便于进行锚点框选处理。
结合本公开提供的任一实施方式,所述锚点框选是通过框选固定锚点标识算法,在所述原始表单图像中查找所有符合锚点参数唯一特征标识的图像信息,利用定义锚点在所述原始表单图像的应用作用域 ({page,xMin,xMax},{yMin,yMax}),以确定每一个锚点在所述原始表单图像中的坐标位置及覆盖范围,通过锚点标识算法自动计算锚点左边的内容及区域范围。
结合本公开提供的任一实施方式, 通过锚点的像素点坐标位置查找锚点所对应的应用作用域内所有符合锚点参数的唯一特征标识的像素点信息;判断查找出的内容是否有null值并智能的作出一下步的处理方法;通过设计的坐标值范围判断框选区内容的有效性并智能的自动计算在一定偏移度内的内容;通过设置分页标识,利用锚点坐标计算跨页内容的位置(坐标);再次利用正则表达式来匹配所需要的内容或过滤掉不需要的内容,并将获取到的信息自动填入所述待处理输出表单项中。
第二方面,本发明提供一供种基于AI的跨境供应链表单处理相关装置,所述相关装置包括:模板训练单元; 获取传输单元; 数据分析单元; 智能处理单元; 数据接口单元。
在其中一个实施例中,模板训练单元用于设定及存储所述待处理输出表单样式,进行定义锚点及表单模板训练,包括组织构架管理模块、模板配置管理模块、自定义模板训练模块。
在其中一个实施例中,获取传输单元用于获取待处理原始表单信息,并将原始表单传输至云平台,通过OCR识别将原始表单转换成所述待处理原始表单图像,包括本地计算终端、图像获取设备、网络传输设施、云平台模块。
在其中一个实施例中,数据分析单元用于统计、查询、校验所述待处理表单项相关信息,包括数据统计模块、数据查询模块、数据较验模块。
在其中一个实施例中,智能处理单元用于表单图像信息识别、纠错、提取、存储及转换输出,包括表单识别模块、AI提取模块。
在其中一个实施例中,数据接口单元用于管理及对接各种信息系统接口,自动获取或传输表单数据及信息。
与现有技术相比,本发明的优点在于:
精准度更高。通过表单设置和锚点标识坐标算法,将表单图像中跟业务相关的每一个字符/元素进行全面检索,并过滤掉与目标业务处理没有帮助的字符/元素,从而实现表格内容的精准定位和有效范围的有效内容集中,大大降低了无效信息对算法的干扰,从而提高了识别的精准度。
成本更低。通过AI操作来减少人工处理,大提高了企业人员的工作效率,有利于降低企业人工成本支出。
可扩展性高。本发明通过提供API接口对接系统,可与其他的系统进行集成。当需要处理更加复杂的表单时,可通过对核心算法进行调整或接入新算法的方式增强算力。
应用范围广。本发明应用的范围非常广泛,任何跟表单处理的业务场景都可以应用上本发明的技术和算法。
应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本公开。
附图说明
此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本说明书的实施例,并与说明书一起用于解释本说明书的原理。
] 图1为本发明示出的一种基于AI的跨境供应链表单生成方法的流程图。
图2为本发明示出的一种基于AI的跨境供应链表单模板设置结果图。
图3为本发明示出的其中一例表单模板训练流程图。
图4为本发明示出的数据统计功能界面图。
图5为本发明示出的数据查询、校验功能界面图。
图6为本发明示出的一种基于AI的跨境供应链表单生成装置的示意图。
图7为本发明示出的一种基于AI的跨境供应链表单生成装置系统功能界面图。
图8为本发明示出的一种基于AI的跨境供应链表单系统功能结构图。
具体实施方式
为了使本申请的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本申请进行进一步详细说明。应当理解,此处描述的具体实施例仅用以解释本申请,并不用于限定本申请。
在如图1所示的一种实施例中,本发明提供了一种基于AI的跨境供应链表单生成方法,所述方法包括步骤101~步骤106。
在步骤101中,设置待处理表单模板。
所述待处理表单模板包括基于用户输入设定的各类待处理表样式、表单类型、相关表单项的锚点及锚点对应各项参数。
所述锚点是待处理表单模板中相关表单项的关键字段(key)标识。通过锚点定义,设定所述待处理表单项的关键字段(key)与所述待处理表单图像中文本特征信息的键值(value)关联对应关系,即K-V对设置。
通过智能表单模板训练单元设定相关表单项的锚点,配置锚点参数及其应用作用域,将定义锚点及锚点参数后的待处理表单存储为表单模板。图2示出本公开实施例其中一个待处理表单模板的设置结果。
在步骤102中,获取原始表单图像。
所述原始表单图像包括跨境贸易环节中的所需处理的各类原始表单,如采购单、供应商装箱单、供应商发票、运输单等。
优选地,获取原始表单图像可通过扫描仪或者手持拍摄设备拍摄所需处理的原始表单图像,并将所述原始表单图像存储在本地计算终端中。
所述原始表单可以为图片、数据表格、PDF等文件格式。
在步骤103中,将所述原始表单图像通过网络传输至云平台。
在步骤104中,识别原始表单图像,得到待处理表单图像。
应用OCR(Optical Character Recognition,光学字符识别)技术对上传至云平台的原始表单图像进行识别,得到所述待处理表单图像。
所述待处理表单图像包含待处理的文本特征信息、视觉特征信息及位置特征信息。
在步骤105中,选择待处理表单模板进行模板训练。
通过智能表单模板训练单元,根据OCR识别后的待处理表单图像选择所需处理表单模板,进行表单模板训练。
所述表单模板训练包括锚点选择、作用域定义、框选锚点及锚点提取。图3示出了本公开实施例其中一例表单模板训练流程图。
如图3所示,表单模板训练的实现方法包括:锚点选择、框选锚点、作用域定义、锚点提取。
3a锚点选择,在所述表单模板中选择已定义的锚点(EA)及锚点所对应的标识算法程序。
3b框选锚点,通过设定的锚点正则表达式结合对应的锚点标识算法寻找所有符合锚点(EA)唯一特征标识的文本。
3c作用域定义,以锚点所在待处理表单图像上的坐标为原点,定义表格的应用作用域{page,xMin,xMax},{yMin,yMax}。
所述表格的应用作用域{page,xMin,xMax},{yMin,yMax}中,page表示待处理表单图像的页面;xMin表示在所述待处理表单图像页面上锚点坐标的x轴最小取值;xMax表示在所述待处理表单图像页面上锚点坐标的x轴最大取值;yMin在所述待处理表单图像页面上锚点坐标的y轴最小取值; yMax在所述待处理表单图像页面上锚点坐标的y轴最大取值。
通过定义表格的应用作用域,以确定表单图像中的每一个锚点及其覆盖范围,通过锚点算法自动计算锚点左边的内容及区域范围。
3d锚点提取,通过框选固定锚点标识算法,在所述待处理表单图像上查找选定的锚点,并将光标精准定位在所述待处理表单图像上的锚点所在像素点的位置;判断查找出的锚点对应信息内容是否有null值;通过设计的坐标值范围判断框选区内容的有效性并智能的自动计算在一定偏移度内的内容;设置分页标识,利用锚点坐标计算跨页内容的位置(坐标);再次利用正则表达式来匹配所需要的内容或过滤掉不需要的内容,并将获取到的所需锚点对应信息自动填入所述待处理表单中并存储在对应表单模板中,完成所述待处理表单模板的信息提取。
在步骤106中,进行数据分析及应用。所述数据分析包括数据统计、数据查阅、数据校验及数据输出。
如图4所示,通过数据统计功能对各表单模板训练结果及待处理表单图像进行统计,可统计对应表单图像的份数、页数,表单模板训练的次数以及表单训练的错误率。
如图5所示,通过数据查阅功能对各表单模板获取后到的进行查看、校验及格式化传输。
第二方面,本发明提供一供种基于AI的跨境供应链表单处理相关装置,如图6所示所述相关装置包括:模板训练单元、获取传输单元、数据分析单元、智能处理单元、数据接口单元。
201模板训练单元,用于配置及存储各类目标输出表单模板,进行表单智能训练,包括组织构架管理模块、模板配置管理模块、自定义模板训练模块。
202获取传输单元,用于获取待处理原始表单信息,并将原始表单传输至云平台,通过OCR识别将原始表单转换成待处理的表单图像,包括本地计算终端、图像获取设备、网络传输设施、云平台模块。
203数据分析单元,用于统计、查询、较验表单相关信息,包括数据统计模块、数据查询模块、数据较验模块。
204智能处理单元,用于表单图像信息识别、纠错、提取、存储及转换输出,包括表单识别模块、AI提取模块。
205数据接口单元,用于管理及对接各种信息系统接口,自动获取或传输表单数据及信息。

Claims (11)

1.一种基于AI的跨境供应链表单生成方法,其特征在于,其包括:
原始表单图像识别,用于获取待处理的原始表单图像;锚点定义,用于设定待处理输出表单项在所述原始表单图像中的像素点标识、坐标位置及应用作用域;锚点框选及信息提取,利用锚点标识算法,在原始表单图像中查找并提取所有符合锚点参数的唯一特征标识的信息,并将信息自动填入所述待处理输出表单项。
2.根据权利要求1所述的一种基于AI的跨境供应链表单生成方法,其特征在于,所述原始表单图像识别利用OCR( Optical Character Recognition,光学字符识别)技术将待处理的原始表单转换成统一格式的原始表单图像,所述表单图像包含相关的字符、文本像素点及其对应的物理位置等相关信息。
3.根据权利要求2所述的一种基于AI的跨境供应链表单生成方法,其特征在于,所述锚点是待处理输出表单中项的字段标识,通过锚点定义,设定待处理输出表单项在所述原始表单图像中的像素点标识、坐标位置及应用作用域,建立待处理输出表单项与所述原始表图像的对应关系,以便于进行锚点框选处理。
4.根据权利要求3所述的一种基于AI的跨境供应链表单生成方法,其特征在于,所述锚点框选是通过框选固定锚点标识算法,在所述原始表单图像中查找所有符合锚点参数唯一特征标识的图像信息,利用定义锚点在所述原始表单图像的应用作用域 ({page,xMin,xMax},{yMin,yMax}),以确定每一个锚点在所述原始表单图像中的坐标位置及覆盖范围,通过锚点标识算法自动计算锚点左边的内容及区域范围。
5.根据权利要求4所述的一种基于AI的跨境供应链表单生成方法,其特征在于,所述锚点提取是通过锚点的像素点坐标位置查找锚点所对应的应用作用域内所有符合锚点参数的唯一特征标识的像素点信息;判断查找出的内容是否有null值并智能的作出一下步的处理方法;通过设计的坐标值范围判断框选区内容的有效性并智能的自动计算在一定偏移度内的内容;通过设置分页标识,利用锚点坐标计算跨页内容的位置(坐标);再次利用正则表达式来匹配所需要的内容或过滤掉不需要的内容,并将获取到的信息自动填入所述待处理输出表单项中。
6.一供种基于AI的跨境供应链表单处理相关装置,其特征在于,所述相关装置包括:模板训练单元、获取传输单元、数据分析单元、智能处理单元、数据接口单元。
7.一供种基于AI的跨境供应链表单处理相关装置,其特征在于,所述模板训练单元,用于配置及存储各类目标输出表单模板,进行表单智能训练,包括组织构架管理模块、模板配置管理模块、自定义模板训练模块。
8.一供种基于AI的跨境供应链表单处理相关装置,其特征在于,所述获取传输单元,用于获取待处理原始表单信息,并将原始表单传输至云平台,通过OCR识别将原始表单转换成待处理的表单图像,包括本地计算终端、图像获取设备、网络传输设施、云平台模块。
9.一供种基于AI的跨境供应链表单处理相关装置,其特征在于,所述数据分析单元,用于统计、查询、较验表单相关信息,包括数据统计模块、数据查询模块、数据较验模块。
10.一供种基于AI的跨境供应链表单处理相关装置,其特征在于,所述智能处理单元,用于表单图像信息识别、纠错、提取、存储及转换输出,包括表单识别模块、AI提取模块。
11.一供种基于AI的跨境供应链表单处理相关装置,其特征在于,所述数据接口单元,用于管理及对接各种信息系统接口,自动获取或传输表单数据及信息。
CN202111057372.4A 2021-09-09 2021-09-09 基于ai的跨境供应链表单生成方法及相关装置 Pending CN114419637A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202111057372.4A CN114419637A (zh) 2021-09-09 2021-09-09 基于ai的跨境供应链表单生成方法及相关装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202111057372.4A CN114419637A (zh) 2021-09-09 2021-09-09 基于ai的跨境供应链表单生成方法及相关装置

Publications (1)

Publication Number Publication Date
CN114419637A true CN114419637A (zh) 2022-04-29

Family

ID=81260606

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202111057372.4A Pending CN114419637A (zh) 2021-09-09 2021-09-09 基于ai的跨境供应链表单生成方法及相关装置

Country Status (1)

Country Link
CN (1) CN114419637A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117709856A (zh) * 2024-02-06 2024-03-15 成都铭亿嘉科技有限公司 供应链对接优化方法

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117709856A (zh) * 2024-02-06 2024-03-15 成都铭亿嘉科技有限公司 供应链对接优化方法
CN117709856B (zh) * 2024-02-06 2024-04-26 成都铭亿嘉科技有限公司 供应链对接优化方法

Similar Documents

Publication Publication Date Title
CN106814982B (zh) 标签打印处理装置、系统和方法
CN108536459B (zh) 金融产品的更新方法、装置、设备和计算机存储介质
CN112418813B (zh) 基于智能解析识别的aeo资质智能评级管理系统、方法及存储介质
CN112418812A (zh) 分布式全链路自动化智能通关系统、方法及存储介质
CN112631586B (zh) 一种应用开发方法、装置、电子设备和存储介质
CN110471892B (zh) Revit文件数据收集方法和相关装置
US20150278248A1 (en) Personal Information Management Service System
CN105139149B (zh) 一种快速盘点服务器资产配置信息的方法
CN113780229A (zh) 文本识别方法及装置
US20080147687A1 (en) Information Management System and Document Information Management Method
CN112232352A (zh) 一种智能识别pcb图纸自动计价系统和方法
CN114419637A (zh) 基于ai的跨境供应链表单生成方法及相关装置
CN114283416A (zh) 车险理赔图片的处理方法和装置
CN114529933A (zh) 一种合同数据差异性的比对方法、装置、设备和介质
CN113515799A (zh) 一种建筑信息模型的设备模型批量布置方法及装置
CN112801086A (zh) 凭证分类的方法、装置、电子设备和存储介质
CN116343210B (zh) 档案数字化的管理方法及装置
CN116798061A (zh) 一种票据审核识别方法、装置、终端和存储介质
CN110853115B (zh) 一种开发流程页面的创建方法及设备
US10699329B2 (en) Systems and methods for document to order conversion
CN110472121A (zh) 名片信息搜索方法、装置、电子设备以及计算机可读存储介质
CN115858695A (zh) 一种信息处理方法及装置、存储介质
CN114936927A (zh) 跨境汇款单据验证方法及装置
CN115063784A (zh) 票据图像的信息提取方法和装置、存储介质及电子设备
CN113971810A (zh) 文档生成方法、装置、平台、电子设备以及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination