CN112862409A - 提运单核验方法及装置 - Google Patents
提运单核验方法及装置 Download PDFInfo
- Publication number
- CN112862409A CN112862409A CN202110259014.5A CN202110259014A CN112862409A CN 112862409 A CN112862409 A CN 112862409A CN 202110259014 A CN202110259014 A CN 202110259014A CN 112862409 A CN112862409 A CN 112862409A
- Authority
- CN
- China
- Prior art keywords
- bill
- shipping
- verification
- note
- information
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 58
- 238000012795 verification Methods 0.000 title claims description 96
- 238000012545 processing Methods 0.000 claims description 29
- 230000015654 memory Effects 0.000 claims description 19
- 230000009467 reduction Effects 0.000 claims description 17
- 238000000605 extraction Methods 0.000 claims description 14
- 238000004590 computer program Methods 0.000 claims description 12
- 238000010200 validation analysis Methods 0.000 claims 1
- 238000003058 natural language processing Methods 0.000 description 7
- 238000012549 training Methods 0.000 description 7
- BUGBHKTXTAQXES-UHFFFAOYSA-N Selenium Chemical compound [Se] BUGBHKTXTAQXES-UHFFFAOYSA-N 0.000 description 5
- 238000010586 diagram Methods 0.000 description 5
- 238000005516 engineering process Methods 0.000 description 5
- 230000008569 process Effects 0.000 description 5
- 229910052711 selenium Inorganic materials 0.000 description 5
- 239000011669 selenium Substances 0.000 description 5
- VYZAMTAEIAYCRO-UHFFFAOYSA-N Chromium Chemical compound [Cr] VYZAMTAEIAYCRO-UHFFFAOYSA-N 0.000 description 3
- 238000004891 communication Methods 0.000 description 2
- 230000006870 function Effects 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 239000007787 solid Substances 0.000 description 2
- 238000004458 analytical method Methods 0.000 description 1
- 238000003491 array Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 230000010365 information processing Effects 0.000 description 1
- 238000002372 labelling Methods 0.000 description 1
- 238000010801 machine learning Methods 0.000 description 1
- 239000000463 material Substances 0.000 description 1
- 238000010295 mobile communication Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/08—Logistics, e.g. warehousing, loading or distribution; Inventory or stock management
- G06Q10/083—Shipping
- G06Q10/0832—Special goods or special handling procedures, e.g. handling of hazardous or fragile goods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N20/00—Machine learning
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/06—Buying, selling or leasing transactions
- G06Q30/0601—Electronic shopping [e-shopping]
- G06Q30/0609—Buyer or seller confidence or verification
Landscapes
- Business, Economics & Management (AREA)
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Economics (AREA)
- General Physics & Mathematics (AREA)
- Development Economics (AREA)
- Strategic Management (AREA)
- General Business, Economics & Management (AREA)
- Marketing (AREA)
- Software Systems (AREA)
- Finance (AREA)
- Accounting & Taxation (AREA)
- Artificial Intelligence (AREA)
- Mathematical Physics (AREA)
- Evolutionary Computation (AREA)
- Medical Informatics (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Computing Systems (AREA)
- General Engineering & Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Entrepreneurship & Innovation (AREA)
- Human Resources & Organizations (AREA)
- Operations Research (AREA)
- Quality & Reliability (AREA)
- Tourism & Hospitality (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明公开了一种提运单核验方法及装置,可用于金融领域或其他技术领域,该提运单核验方法包括:获取目标提运单的文本信息;采用预设的提运单要素识别模型识别出所述文本信息中的提运单要素信息;获取根据所述目标提运单的提单号从所述目标提运单对应的船运公司的官方网站中查询到的所述目标提运单的官网信息;基于所述官网信息对所述提运单要素信息进行核验,得到第一核验结果。本发明实现了准确和高效的对提运单进行审核,解决了现有技术人工对提运单进行审核的方法效率较低并且准确性难以保证的技术问题。
Description
技术领域
本发明涉及信息处理技术领域,具体而言,涉及一种提运单核验方法及装置。
背景技术
提运单是国际贸易中核心的物权单据和物流单据,国际单证业务中客户将提运单的正副本交给开证行,开证行业务人员将纸质提运单扫描成电子影像,由后台专业部门根据提运单信息到对应船运公司官网核实物流信息,进而根据提运单中的商品信息、贸易参与方到制裁黑名单库中做合规性核对。这种人工对提运单进行审核的方法效率较低并且准确性难以保证。现有技术缺少一种更为准确和高效的对提运单进行审核的方法。
发明内容
本发明为了解决上述背景技术中的技术问题,提出了一种提运单核验方法及装置。
为了实现上述目的,根据本发明的一个方面,提供了一种提运单核验方法,该方法包括:
获取目标提运单的文本信息;
采用预设的提运单要素识别模型识别出所述文本信息中的提运单要素信息;
获取根据所述目标提运单的提单号从所述目标提运单对应的船运公司的官方网站中查询到的所述目标提运单的官网信息;
基于所述官网信息对所述提运单要素信息进行核验,得到第一核验结果。
可选的,该提运单核验方法,还包括:
获取从制裁黑名单风险数据库中查询到的所述目标提运单的贸易参与方对应的黑名单查询结果以及所述船运公司对应的黑名单查询结果;
根据所述贸易参与方对应的黑名单查询结果确定所述贸易参与方的风险等级,以及,根据所述船运公司对应的黑名单查询结果确定所述船运公司的风险等级;
根据所述贸易参与方的风险等级以及所述船运公司的风险等级生成第二核验结果。
可选的,该提运单核验方法,还包括:
根据所述第一核验结果以及所述第二核验结果生成核验报告,并将所述核验报告发送给预设的业务操作人员。
可选的,所述采用预设的提运单要素识别模型识别出所述文本信息中的提运单要素信息,具体包括:
若存在所述船运公司对应的提运单要素提取模板,则采用所述提运单要素提取模板从所述文本信息中提取出提运单要素信息;
若不存在所述船运公司对应的提运单要素提取模板,则采用预设的提运单要素识别模型识别出所述文本信息中的提运单要素信息。
可选的,该提运单核验方法,还包括:
获取所述目标提运单的提运单图像;
对所述提运单图像进行降噪及二值化处理得到处理后的提运单图像;
根据预设的文字识别模型从所述处理后的提运单图像中识别出所述文本信息。
可选的,所述对所述提运单图像进行降噪及二值化处理得到处理后的提运单图像,具体包括:
对所述提运单图像进行降噪处理,得到降噪后的提运单图像;
对所述降噪后的提运单图像做二值化处理,得到提运单的二值化图像;
对所述提运单的二值化图像做去噪点及干扰线操作,得到处理后的提运单图像。
可选的,所述提运单要素信息包括:船运公司名称、提单号、贸易参与方名称、航班号、集装箱号、装货港口、卸货港口以及集装箱物流信息中的至少一个。
为了实现上述目的,根据本发明的另一方面,提供了一种提运单核验装置,该装置包括:
文本信息获取模块,用于获取目标提运单的文本信息;
提运单要素信息获取模块,用于采用预设的提运单要素识别模型识别出所述文本信息中的提运单要素信息;
官网信息获取模块,用于获取根据所述目标提运单的提单号从所述目标提运单对应的船运公司的官方网站中查询到的所述目标提运单的官网信息;
第一核验模块,用于基于所述官网信息对所述提运单要素信息进行核验,得到第一核验结果。
可选的,该提运单核验装置,还包括:
黑名单查询结果获取模块,用于获取从制裁黑名单风险数据库中查询到的所述目标提运单的贸易参与方对应的黑名单查询结果以及所述船运公司对应的黑名单查询结果;
风险等级确定模块,用于根据所述贸易参与方对应的黑名单查询结果确定所述贸易参与方的风险等级,以及,根据所述船运公司对应的黑名单查询结果确定所述船运公司的风险等级;
第二核验模块,用于根据所述贸易参与方的风险等级以及所述船运公司的风险等级生成第二核验结果。
可选的,该提运单核验装置,还包括:
核验报告发送模块,用于根据所述第一核验结果以及所述第二核验结果生成核验报告,并将所述核验报告发送给预设的业务操作人员。
为了实现上述目的,根据本发明的另一方面,还提供了一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现上述提运单核验方法中的步骤。
为了实现上述目的,根据本发明的另一方面,还提供了一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序在计算机处理器中执行时实现上述提运单核验方法中的步骤。
本发明的有益效果为:本发明根据预设的提运单要素识别模型从提运单的文本信息中提取出提运单要素信息,并从船运公司的官方网站中查询到的所述目标提运单的官网信息,进而基于所述官网信息自动对所述提运单要素信息进行核验,得到核验结果,实现了准确和高效的对提运单进行审核,解决了现有技术人工对提运单进行审核的方法效率较低并且准确性难以保证的技术问题。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。在附图中:
图1是本发明实施例提运单核验方法的第一流程图;
图2是本发明实施例提运单核验方法的第二流程图;
图3是本发明实施例获取提运单要素信息的流程图;
图4是本发明实施例得到提运单的文本信息的流程图;
图5是本发明实施例对提运单图像进行处理的流程图;
图6是本发明实施例提运单核验装置的第一结构框图;
图7是本发明实施例提运单核验装置的第二结构框图;
图8是本发明实施例计算机设备示意图。
具体实施方式
为了使本技术领域的人员更好地理解本发明方案,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分的实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本发明保护的范围。
本领域内的技术人员应明白,本发明的实施例可提供为方法、系统、或计算机程序产品。因此,本发明可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本发明可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
需要说明的是,本发明的说明书和权利要求书及上述附图中的术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
需要说明的是,在不冲突的情况下,本发明中的实施例及实施例中的特征可以相互组合。下面将参考附图并结合实施例来详细说明本发明。
需要说明的是,本发明的提运单核验方法及装置可用于金融领域,也可以用于其他技术领域。
本发明为降低贸易背景不真实、商品信息、贸易参与方受到制裁等情况带来的欺诈风险,因此提出了一种提运单的智能多维度核验方法,通过使用OCR图像识别、NLP自然语言处理、基于Selenium动态爬虫等技术,实现自动对提运单进行审核。
图1是本发明实施例提运单核验方法的第一流程图,如图1所示,在本发明一个实施例中,本发明的提运单核验方法包括步骤S101至步骤S104。
步骤S101,获取目标提运单的文本信息。
在本发明实施例中,目标提运单的文本信息可以为目标提运单中的文字内容。在本发明一个实施例中,目标提运单的文本信息可以为通过预设的文字识别模型从目标提运单的提运单图像中识别得出的。
步骤S102,采用预设的提运单要素识别模型识别出所述文本信息中的提运单要素信息。
由于各家船运公司在提运单影像中展示“船公司名称”、“航班号”、“集装箱”等信息的区域以及关键字存在一定差异,在得到提运单的文本信息后,还需要对这些文本信息做分析处理,得到其中的提运单要素信息。
在本发明一个实施例中,本发明的提运单要素信息具体包括:船运公司名称、提单号、贸易参与方名称、航班号、集装箱号、装货港口、卸货港口以及集装箱物流信息中的至少一个。
在本发明一个实施例中,本发明可以通过自然语言处理技术,通过训练出提运单要素识别模型,根据提运单要素识别模型识别出目标提运单的文本信息中的提运单要素信息。在本发明一个实施例中,本发明的提运单要素识别模型可以采用现有技术任意一种可用的机器学习算法训练得出,例如可以采用FastText等。
本发明训练提运单要素识别模型的具体流程可以以下步骤1至步骤4。
步骤1):从存量提运单图像中提取出文本信息,作为模型训练的样本数据。
步骤2):处理和修正样本数据,提取样本数据特征值,做特征降维、特征空值处理、目标值转换处理。同时对样本数据做打标签处理,如“B/L No”、“Booking No”标记为提单号。
步骤3):模型训练,本发明需要使用自然语言处理技术做语义分析。FastText是当前业界主流的自然语言处理训练模型,因此本发明选择FastText模型。将每一个词输入FastText模型,根据训练的结果,输出这个词所属不同标签的概率。
步骤4):模型评估:使用验证集的样本在训练好的模型上进行预测,验证模型预测的准确率是否满足要求,若不满足再进行迭代调优。
步骤S103,获取根据所述目标提运单的提单号从所述目标提运单对应的船运公司的官方网站中查询到的所述目标提运单的官网信息。
在本发明一个实施例中,本步骤根据目标提运单中的“船公司名称”、“提单号”通过Python+Selenium驱动Chrome的无头浏览器访问对应船运公司官网。进而根据对应船运公司梳理出的所需解析数据的坐标,通过XPath规则解析获取对应的数据并按统一规则重新封装成统一JSON格式的报文,得到所述官网信息。
在本发明实施例中,所述官网信息中至少包含了每一项提运单要素信息。
步骤S104,基于所述官网信息对所述提运单要素信息进行核验,得到第一核验结果。
在本发明实施例中,本步骤将步骤S102中得到的提运单要素信息与步骤S103中从船运公司官网查回后整合后的JSON报文(即官网信息)逐一比对核验,得到第一核验结果。
在本发明一个实施例中,本步骤的核验具体可以为核验是否存在与官网不匹配项,若不存在,则第一核验结果为核验通过,若存在,则第一核验结果为核验不通过并给出具体的不匹配项。
由此可见,本发明根据预设的提运单要素识别模型从提运单的文本信息中提取出提运单要素信息,并从船运公司的官方网站中查询到的所述目标提运单的官网信息,进而基于所述官网信息自动对所述提运单要素信息进行核验,得到核验结果,实现了准确和高效的对提运单进行审核,解决了现有技术人工对提运单进行审核的方法效率较低并且准确性难以保证的技术问题。
图2是本发明实施例提运单核验方法的第二流程图,如图2所示,在本发明一个实施例中,本发明的提运单核验方法还包括步骤S201至步骤S203。
步骤S201,获取从制裁黑名单风险数据库中查询到的所述目标提运单的贸易参与方对应的黑名单查询结果以及所述船运公司对应的黑名单查询结果。
在本发明实施例中,本步骤具体可以通过Python+Selenium驱动Chrome的无头浏览器访问制裁黑名单风险数据库。通过XPath定位到搜索框,通过Selenium驱动Chrome无头浏览器在输入框中分别输入“贸易参与方名称”、“船公司名称”进行检索,得到贸易参与方对应的黑名单查询结果以及船运公司对应的黑名单查询结果。
步骤S202,根据所述贸易参与方对应的黑名单查询结果确定所述贸易参与方的风险等级,以及,根据所述船运公司对应的黑名单查询结果确定所述船运公司的风险等级。
步骤S203,根据所述贸易参与方的风险等级以及所述船运公司的风险等级生成第二核验结果。
在本发明一个实施例中,本步骤具体判断所述贸易参与方的风险等级以及所述船运公司的风险等级是否超过预设阈值,若均未超过阈值,则第二核验结果为核验通过,若至少一个超过阈值,则第二核验结果为核验不通过,并给出具体的超过阈值的项。
在本发明一个实施例中,在上述步骤S203得到第二核验结果之后,本发明还根据所述第一核验结果以及所述第二核验结果生成核验报告,并将所述核验报告发送给预设的业务操作人员。在本发明一个实施例中,本发明预先针对每种核验结果设置了对应的提示信息,本步骤具体可以先分别获取第一核验结果和第二核验结果对应的提示信息,进而结合第一核验结果对应的提示信息以及第二核验结果对应的提示信息生成核验报告。
在本发明一个可选实施例中,本发明的核验报告具体可以以下表的形式。
图3是本发明实施例获取提运单要素信息的流程图,如图3所示,在本发明的一个实施例中,上述步骤S102的采用预设的提运单要素识别模型识别出所述文本信息中的提运单要素信息,具体包括步骤S301和步骤S302。
步骤S301,若存在所述船运公司对应的提运单要素提取模板,则采用所述提运单要素提取模板从所述文本信息中提取出提运单要素信息。
本发明结合行内业务常用的提单影像,发现实际业务所涉及的船运公司基本都是在航运业务量在市场份额占比排名前20的船运公司,因此针对这20家船运公司的提运单归档了提运单要素提取模板,通过提运单要素提取模板,这20家船运公司可快速解析获取提运单要素信息。
步骤S302,若不存在所述船运公司对应的提运单要素提取模板,则采用预设的提运单要素识别模型识别出所述文本信息中的提运单要素信息。
图4是本发明实施例得到提运单的文本信息的流程图,如图4所示,上述步骤S101中的文本信息具体为通过步骤S401至步骤S403得到的。
步骤S401,获取所述目标提运单的提运单图像。
步骤S402,对所述提运单图像进行降噪及二值化处理得到处理后的提运单图像。
步骤S403,根据预设的文字识别模型从所述处理后的提运单图像中识别出所述文本信息。
在本发明一个实施例中,本发明的文字识别模型可以基于OpenCV+tesseract实现。在本发明一个实施例中,本发明可以根据tesseract训练出所述文字识别模型。由于各家船运公司的提运单格式存在一定差异,本发明需要针对对不同船运公司的提运单进行不断的文本识别训练,提升文字识别模型的识别准确率。
图5是本发明实施例对提运单图像进行处理的流程图,如图5所示,上述步骤S402的对所述提运单图像进行降噪及二值化处理得到处理后的提运单图像,具体包括步骤S501至步骤S503。
步骤S501,对所述提运单图像进行降噪处理,得到降噪后的提运单图像。
在本发明实施例中,本步骤具体去除提运单图像的底纹、背景等噪音,仅将文字区域保留,得到降噪后的提运单图像。
步骤S502,对所述降噪后的提运单图像做二值化处理,得到提运单的二值化图像。
步骤S503,对所述提运单的二值化图像做去噪点及干扰线操作,得到处理后的提运单图像。
在本发明实施例中,本步骤具体对提运单的二值化图像做去噪点及干扰线操作,排除其对文字区域的干扰,得到去干扰后的提运单图像,即处理后的提运单图像。
由以上实施例可以看出,本发明通过OCR图像识别、NLP自然语言处理、Python+selenium爬虫技术,自动快速核验贸易合规性,通过多维度的智能检测确保通过银行办理结算的国际贸易业务真实合规。减少开证行人力成本,提升核验效率。
需要说明的是,在附图的流程图示出的步骤可以在诸如一组计算机可执行指令的计算机系统中执行,并且,虽然在流程图中示出了逻辑顺序,但是在某些情况下,可以以不同于此处的顺序执行所示出或描述的步骤。
基于同一发明构思,本发明实施例还提供了一种提运单核验装置,可以用于实现上述实施例所描述的提运单核验方法,如下面的实施例所述。由于提运单核验装置解决问题的原理与提运单核验方法相似,因此提运单核验装置的实施例可以参见提运单核验方法的实施例,重复之处不再赘述。以下所使用的,术语“单元”或者“模块”可以实现预定功能的软件和/或硬件的组合。尽管以下实施例所描述的装置较佳地以软件来实现,但是硬件,或者软件和硬件的组合的实现也是可能并被构想的。
图6是本发明实施例提运单核验装置的第一结构框图,如图6所示,在本发明一个实施例中,本发明的提运单核验装置包括:
文本信息获取模块1,用于获取目标提运单的文本信息;
提运单要素信息获取模块2,用于采用预设的提运单要素识别模型识别出所述文本信息中的提运单要素信息;
官网信息获取模块3,用于获取根据所述目标提运单的提单号从所述目标提运单对应的船运公司的官方网站中查询到的所述目标提运单的官网信息;
第一核验模块4,用于基于所述官网信息对所述提运单要素信息进行核验,得到第一核验结果。
图7是本发明实施例提运单核验装置的第二结构框图,如图7所示,在本发明一个实施例中,本发明的提运单核验装置还包括:
黑名单查询结果获取模块5,用于获取从制裁黑名单风险数据库中查询到的所述目标提运单的贸易参与方对应的黑名单查询结果以及所述船运公司对应的黑名单查询结果;
风险等级确定模块6,用于根据所述贸易参与方对应的黑名单查询结果确定所述贸易参与方的风险等级,以及,根据所述船运公司对应的黑名单查询结果确定所述船运公司的风险等级;
第二核验模块7,用于根据所述贸易参与方的风险等级以及所述船运公司的风险等级生成第二核验结果。
在本发明一个实施例中,本发明的提运单核验装置还包括:
报告发送模块,用于根据所述第一核验结果以及所述第二核验结果生成核验报告,并将所述核验报告发送给预设的业务操作人员。
在本发明一个实施例中,所示提运单要素信息获取模块2具体包括:
第一处理单元,用于若存在所述船运公司对应的提运单要素提取模板,则采用所述提运单要素提取模板从所述文本信息中提取出提运单要素信息;
第二处理单元,用于若不存在所述船运公司对应的提运单要素提取模板,则采用预设的提运单要素识别模型识别出所述文本信息中的提运单要素信息。
在本发明一个实施例中,本发明的提运单核验装置还包括:
图像获取模块,用于获取所述目标提运单的提运单图像;
图像处理模块,用于对所述提运单图像进行降噪及二值化处理得到处理后的提运单图像;
文本信息识别模块,用于根据预设的文字识别模型从所述处理后的提运单图像中识别出所述文本信息。
在本发明一个实施例中,所述图像处理模块,具体包括:
降噪处理单元,用于对所述提运单图像进行降噪处理,得到降噪后的提运单图像;
二值化处理单元,用于对所述降噪后的提运单图像做二值化处理,得到提运单的二值化图像;
去除噪点处理单元,用于对所述提运单的二值化图像做去噪点及干扰线操作,得到处理后的提运单图像。
为了实现上述目的,根据本申请的另一方面,还提供了一种计算机设备。如图8所示,该计算机设备包括存储器、处理器、通信接口以及通信总线,在存储器上存储有可在处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现上述实施例方法中的步骤。
处理器可以为中央处理器(Central Processing Unit,CPU)。处理器还可以为其他通用处理器、数字信号处理器(Digital Signal Processor,DSP)、专用集成电路(Application Specific Integrated Circuit,ASIC)、现场可编程门阵列(Field-Programmable Gate Array,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等芯片,或者上述各类芯片的组合。
存储器作为一种非暂态计算机可读存储介质,可用于存储非暂态软件程序、非暂态计算机可执行程序以及单元,如本发明上述方法实施例中对应的程序单元。处理器通过运行存储在存储器中的非暂态软件程序、指令以及模块,从而执行处理器的各种功能应用以及作品数据处理,即实现上述方法实施例中的方法。
存储器可以包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需要的应用程序;存储数据区可存储处理器所创建的数据等。此外,存储器可以包括高速随机存取存储器,还可以包括非暂态存储器,例如至少一个磁盘存储器件、闪存器件、或其他非暂态固态存储器件。在一些实施例中,存储器可选包括相对于处理器远程设置的存储器,这些远程存储器可以通过网络连接至处理器。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。
所述一个或者多个单元存储在所述存储器中,当被所述处理器执行时,执行上述实施例中的方法。
上述计算机设备具体细节可以对应参阅上述实施例中对应的相关描述和效果进行理解,此处不再赘述。
为了实现上述目的,根据本申请的另一方面,还提供了一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序在计算机处理器中执行时实现上述提运单核验方法中的步骤。本领域技术人员可以理解,实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的程序可存储于一计算机可读取存储介质中,该程序在执行时,可包括如上述各方法的实施例的流程。其中,所述存储介质可为磁碟、光盘、只读存储记忆体(Read-Only Memory,ROM)、随机存储记忆体(RandomAccessMemory,RAM)、快闪存储器(Flash Memory)、硬盘(Hard Disk Drive,缩写:HDD)或固态硬盘(Solid-State Drive,SSD)等;所述存储介质还可以包括上述种类的存储器的组合。
显然,本领域的技术人员应该明白,上述的本发明的各模块或各步骤可以用通用的计算装置来实现,它们可以集中在单个的计算装置上,或者分布在多个计算装置所组成的网络上,可选地,它们可以用计算装置可执行的程序代码来实现,从而,可以将它们存储在存储装置中由计算装置来执行,或者将它们分别制作成各个集成电路模块,或者将它们中的多个模块或步骤制作成单个集成电路模块来实现。这样,本发明不限制于任何特定的硬件和软件结合。
以上所述仅为本发明的优选实施例而已,并不用于限制本发明,对于本领域的技术人员来说,本发明可以有各种更改和变化。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。
Claims (12)
1.一种提运单核验方法,其特征在于,包括:
获取目标提运单的文本信息;
采用预设的提运单要素识别模型识别出所述文本信息中的提运单要素信息;
获取根据所述目标提运单的提单号从所述目标提运单对应的船运公司的官方网站中查询到的所述目标提运单的官网信息;
基于所述官网信息对所述提运单要素信息进行核验,得到第一核验结果。
2.根据权利要求1所述的提运单核验方法,其特征在于,还包括:
获取从制裁黑名单风险数据库中查询到的所述目标提运单的贸易参与方对应的黑名单查询结果以及所述船运公司对应的黑名单查询结果;
根据所述贸易参与方对应的黑名单查询结果确定所述贸易参与方的风险等级,以及,根据所述船运公司对应的黑名单查询结果确定所述船运公司的风险等级;
根据所述贸易参与方的风险等级以及所述船运公司的风险等级生成第二核验结果。
3.根据权利要求2所述的提运单核验方法,其特征在于,还包括:
根据所述第一核验结果以及所述第二核验结果生成核验报告,并将所述核验报告发送给预设的业务操作人员。
4.根据权利要求1所述的提运单核验方法,其特征在于,所述采用预设的提运单要素识别模型识别出所述文本信息中的提运单要素信息,具体包括:
若存在所述船运公司对应的提运单要素提取模板,则采用所述提运单要素提取模板从所述文本信息中提取出提运单要素信息;
若不存在所述船运公司对应的提运单要素提取模板,则采用预设的提运单要素识别模型识别出所述文本信息中的提运单要素信息。
5.根据权利要求1所述的提运单核验方法,其特征在于,还包括:
获取所述目标提运单的提运单图像;
对所述提运单图像进行降噪及二值化处理得到处理后的提运单图像;
根据预设的文字识别模型从所述处理后的提运单图像中识别出所述文本信息。
6.根据权利要求5所述的提运单核验方法,其特征在于,所述对所述提运单图像进行降噪及二值化处理得到处理后的提运单图像,具体包括:
对所述提运单图像进行降噪处理,得到降噪后的提运单图像;
对所述降噪后的提运单图像做二值化处理,得到提运单的二值化图像;
对所述提运单的二值化图像做去噪点及干扰线操作,得到处理后的提运单图像。
7.根据权利要求1所述的提运单核验方法,其特征在于,所述提运单要素信息包括:船运公司名称、提单号、贸易参与方名称、航班号、集装箱号、装货港口、卸货港口以及集装箱物流信息中的至少一个。
8.一种提运单核验装置,其特征在于,包括:
文本信息获取模块,用于获取目标提运单的文本信息;
提运单要素信息获取模块,用于采用预设的提运单要素识别模型识别出所述文本信息中的提运单要素信息;
官网信息获取模块,用于获取根据所述目标提运单的提单号从所述目标提运单对应的船运公司的官方网站中查询到的所述目标提运单的官网信息;
第一核验模块,用于基于所述官网信息对所述提运单要素信息进行核验,得到第一核验结果。
9.根据权利要求8所述的提运单核验装置,其特征在于,还包括:
黑名单查询结果获取模块,用于获取从制裁黑名单风险数据库中查询到的所述目标提运单的贸易参与方对应的黑名单查询结果以及所述船运公司对应的黑名单查询结果;
风险等级确定模块,用于根据所述贸易参与方对应的黑名单查询结果确定所述贸易参与方的风险等级,以及,根据所述船运公司对应的黑名单查询结果确定所述船运公司的风险等级;
第二核验模块,用于根据所述贸易参与方的风险等级以及所述船运公司的风险等级生成第二核验结果。
10.根据权利要求9所述的提运单核验装置,其特征在于,还包括:
核验报告发送模块,用于根据所述第一核验结果以及所述第二核验结果生成核验报告,并将所述核验报告发送给预设的业务操作人员。
11.一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求1至7任一项所述的方法。
12.一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,其特征在于,所述计算机程序在计算机处理器中执行时实现如权利要求1至7任意一项所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110259014.5A CN112862409A (zh) | 2021-03-10 | 2021-03-10 | 提运单核验方法及装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110259014.5A CN112862409A (zh) | 2021-03-10 | 2021-03-10 | 提运单核验方法及装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN112862409A true CN112862409A (zh) | 2021-05-28 |
Family
ID=75993807
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110259014.5A Pending CN112862409A (zh) | 2021-03-10 | 2021-03-10 | 提运单核验方法及装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112862409A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113610447A (zh) * | 2021-10-09 | 2021-11-05 | 北京奇虎科技有限公司 | 贸易合规检测方法、设备、存储介质及装置 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2017182457A (ja) * | 2016-03-30 | 2017-10-05 | 株式会社アドバンスト・メディア | 情報処理システム、サーバ、端末装置、情報処理方法及びプログラム |
CN111079709A (zh) * | 2019-12-31 | 2020-04-28 | 广州市昊链信息科技股份有限公司 | 一种电子单据的生成方法、装置、计算机设备和存储介质 |
CN111914835A (zh) * | 2020-07-04 | 2020-11-10 | 中信银行股份有限公司 | 票据要素提取方法、装置、电子设备及可读存储介质 |
-
2021
- 2021-03-10 CN CN202110259014.5A patent/CN112862409A/zh active Pending
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2017182457A (ja) * | 2016-03-30 | 2017-10-05 | 株式会社アドバンスト・メディア | 情報処理システム、サーバ、端末装置、情報処理方法及びプログラム |
CN111079709A (zh) * | 2019-12-31 | 2020-04-28 | 广州市昊链信息科技股份有限公司 | 一种电子单据的生成方法、装置、计算机设备和存储介质 |
CN111914835A (zh) * | 2020-07-04 | 2020-11-10 | 中信银行股份有限公司 | 票据要素提取方法、装置、电子设备及可读存储介质 |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113610447A (zh) * | 2021-10-09 | 2021-11-05 | 北京奇虎科技有限公司 | 贸易合规检测方法、设备、存储介质及装置 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109887153B (zh) | 一种财税处理方法和处理系统 | |
CA3027038C (en) | Document field detection and parsing | |
US9256783B2 (en) | Systems and methods for tax data capture and use | |
US11455784B2 (en) | System and method for classifying images of an evidence | |
CA3225621A1 (en) | Ai-augmented auditing platform including techniques for automated document processing | |
CN111353491B (zh) | 一种文字方向确定方法、装置、设备及存储介质 | |
CN110909123B (zh) | 一种数据提取方法、装置、终端设备及存储介质 | |
CN110634223A (zh) | 票据校验方法及装置 | |
CN111738979A (zh) | 证件图像质量自动检查方法及系统 | |
CN114511866A (zh) | 数据稽核方法、装置、系统、处理器及机器可读存储介质 | |
CN114463767A (zh) | 信用证识别方法、装置、计算机设备和存储介质 | |
CN112862409A (zh) | 提运单核验方法及装置 | |
EP4244761A1 (en) | Fraud detection via automated handwriting clustering | |
CN111462388A (zh) | 一种票据检验方法、装置、终端设备及存储介质 | |
US20190057456A1 (en) | System and methods thereof for associating electronic documents to evidence | |
CN115359302A (zh) | 硬币识别方法、系统及存储介质 | |
CN115294593A (zh) | 一种图像信息抽取方法、装置、计算机设备及存储介质 | |
CN113807256A (zh) | 票据数据处理方法、装置、电子设备和存储介质 | |
CN113239126A (zh) | 一种基于bor方法的业务活动信息标准化方案 | |
CN115983956B (zh) | 一种投标文件检测方法及系统 | |
US20230140546A1 (en) | Randomizing character corrections in a machine learning classification system | |
CN117132244B (zh) | 用于智慧合规管理系统的分类处理方法、装置及存储介质 | |
KR102272023B1 (ko) | 수출입 선적 서류 심사 방법 및 이를 실행하는 서버 | |
CN117934142A (zh) | 一种基于用户意图的催收策略方法、装置、设备及介质 | |
CN116311292A (zh) | 单据图像信息提取方法、装置、计算机设备和存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |