CN111461072B - 一种快速的识别导入表格数据的ai识别导入方法 - Google Patents

一种快速的识别导入表格数据的ai识别导入方法 Download PDF

Info

Publication number
CN111461072B
CN111461072B CN202010374143.4A CN202010374143A CN111461072B CN 111461072 B CN111461072 B CN 111461072B CN 202010374143 A CN202010374143 A CN 202010374143A CN 111461072 B CN111461072 B CN 111461072B
Authority
CN
China
Prior art keywords
knowledge base
data
customs
customs declaration
identification
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202010374143.4A
Other languages
English (en)
Other versions
CN111461072A (zh
Inventor
洪军
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shenzhen Huitongguan Network Technology Co ltd
Original Assignee
Shenzhen Huitongguan Network Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shenzhen Huitongguan Network Technology Co ltd filed Critical Shenzhen Huitongguan Network Technology Co ltd
Priority to CN202010374143.4A priority Critical patent/CN111461072B/zh
Publication of CN111461072A publication Critical patent/CN111461072A/zh
Application granted granted Critical
Publication of CN111461072B publication Critical patent/CN111461072B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/40Document-oriented image-based pattern recognition
    • G06V30/41Analysis of document content
    • G06V30/412Layout analysis of documents structured with printed lines or input boxes, e.g. business forms or tables
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/10Services
    • G06Q50/26Government or public services
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/20Image preprocessing
    • G06V10/22Image preprocessing by selection of a specific region containing or referencing a pattern; Locating or processing of specific regions to guide the detection or recognition

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Business, Economics & Management (AREA)
  • Physics & Mathematics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Software Systems (AREA)
  • Multimedia (AREA)
  • Artificial Intelligence (AREA)
  • Tourism & Hospitality (AREA)
  • General Engineering & Computer Science (AREA)
  • Economics (AREA)
  • Medical Informatics (AREA)
  • Mathematical Physics (AREA)
  • Evolutionary Computation (AREA)
  • Development Economics (AREA)
  • Educational Administration (AREA)
  • Data Mining & Analysis (AREA)
  • Health & Medical Sciences (AREA)
  • Computing Systems (AREA)
  • General Health & Medical Sciences (AREA)
  • Human Resources & Organizations (AREA)
  • Marketing (AREA)
  • Primary Health Care (AREA)
  • Strategic Management (AREA)
  • General Business, Economics & Management (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明涉及表格数据识别技术领域,且公开了一种快速的识别导入表格数据的AI识别导入方法,包括如下步骤:建立用于判断识别报关单的AI配置知识库,使得AI配置知识库由初始常规知识库、监督学习知识库、评估标准知识库和自动逻辑知识库四个部分组成;配置AI识别导入知识库模块到云报关系统,并在报关制单操作中添加AI识别导入功能;客户操作导入表格数据,根据初始常规知识库、监督学习知识库和自动逻辑知识库信息判断识别导入数据sheet页中的主报关单和次报关单及区分主报关单和次报关单的表头和表体。该快速的识别导入表格数据的AI识别导入方法,具备依托AI智能识别导入制单申报,降低成本及差错率,极大提升工作效率的优点。

Description

一种快速的识别导入表格数据的AI识别导入方法
技术领域
本发明涉及表格数据识别技术领域,具体为一种快速的识别导入表格数据的AI识别导入方法。
背景技术
随着2014年10月8日海关总署发布225号令《中华人民共和国海关企业信用管理暂行办法》,明确为了推进社会信用体系建设,建立企业进出口信用管理制度,保障贸易安全与便利,海关根据企业信用状况将企业认定为高级认证企业、一般认证企业、一般信用企业、失信企业。按照诚信守法便利、失信违法惩戒原则管理。中国海关依法开展与其他国家或者地区海关的AEO互认,并给予互认AEO企业相应通关便利措施并且海关根据社会信用体系建设和国际合作需要,与国家有关部门以及其他国家或者地区海关建立合作机制,推进信息互换、监管互认、执法互助。其中海关对报关企业认定要求极其严格,比如高级认证企业要求1年内违反海关监管规定行为的次数不超过上年度代理申报报关单及进出境备案清单总票数的万分之一,且处罚金额累计3万元以下。(企业自查发现并主动向海关报明,被海关处以警告以及1万元以下罚款的除外)且连续4个季度单季报关差错率不超过同期全国平均报关差错率,这也就要求报关企业在制单向海关申报过程中必须降低差错率甚至不能出错。
目前行业竞争力强,市场透明,企业生存空间被挤压。而报关行业面对上游企业协同性较差,沟通成本增加。日常客户提供报关资料和数据来源纷繁复杂,沟通机制不顺畅,依靠人工录入报关资料申报工作效率低下,错误率高。虽然目前市场上也有提供识别导入报关资料功能来提高数据准确率,但都是针对每个客户表格的每个字段进行自定义设置识别,设置耗时,成本增加,如果客户后续表格发生变化,系统表格设置也需同步调整。因此报关行业想要降低成本,提高自身竞争力,在向海关制单申报过程中必须简化录入。
发明内容
(一)解决的技术问题
针对现有技术的不足,本发明提供了一种快速的识别导入表格数据的AI识别导入方法,具备依托AI智能识别导入制单申报,降低成本及差错率,极大提升工作效率的优点,解决了目前市场上也有提供识别导入报关资料功能来提高数据准确率,但都是针对每个客户表格的每个字段进行自定义设置识别,设置耗时,成本增加,如果客户后续表格发生变化,系统表格设置也需同步调整。因此报关行业想要降低成本,提高自身竞争力,在向海关制单申报过程中必须简化录入的问题。
(二)技术方案
为实现依托AI智能识别导入制单申报,降低成本及差错率,极大提升工作效率的目的,本发明提供如下技术方案:一种快速的识别导入表格数据的AI识别导入方法,包括如下步骤:
步骤一:建立用于判断识别报关单的AI配置知识库并对AI配置知识库进行分类,使得AI配置知识库由初始常规知识库、监督学习知识库、评估标准知识库和自动逻辑知识库四个部分组成;
步骤二:配置AI识别导入知识库模块到云报关系统,并在报关制单操作中添加AI识别导入功能;
步骤三:客户操作导入表格数据,根据初始常规知识库、监督学习知识库和自动逻辑知识库信息判断识别导入数据sheet页中的主报关单和次报关单及区分主报关单和次报关单的表头和表体;
步骤四:根据步骤三中区分的主报关单和次报关单的表头和表体加上评估标准知识库与自动逻辑知识库判断识别出报关单数据大类内容;
步骤五:根据步骤四中判断识别出的报关单数据大类内容加上评估标准知识库与自动逻辑知识库判断识别出报关单数据小类内容,并对应报关单具体每一个字段;
步骤六:根据步骤五中判断识别出的报关单数据小类内容加上评估标准知识库与自动逻辑知识库识别生成完整准确的报关单数据;
步骤七:根据识别生成标准的报关单数据加上导入原始数据对比自动反馈到监督学习知识库进行自主学习,通过这种导入数据的不断积累,不断反馈,不断的更新,完善监督学习知识库;
步骤八:结束表格数据的识别导入。
优选的,所述初始常规知识库、监督学习知识库、评估标准知识库和自动逻辑知识库包含表格有报关值别名库、报关标题别名库、商品标题别名库、商品名称别名库、商品要素别名库、企业固定值、要素分类、要素键及要素整体观。
优选的,所述初始常规知识库组成报关单数据所需要的较为固定部分,按照海关对报关单字段填制要求所组成的原始数据。
优选的,所述监督学习知识库附有系统基础数据且伴随识别导入表格不断学习和完善数据库。
优选的,所述评估标准知识库按照报关单填制规范及对应的导入表格数据对比,设置评分标准,含有正整数分和负整数分。
优选的,所述自动逻辑知识库根据报关单填制规范的逻辑,个性化自定义逻辑多种方式设置,比如报关单表头净重不能大于毛重。
优选的,所述步骤三中导入表格占有报关单表头后,根据表体字段信息多少判断出主报关单和次报关单,再分析其结构,表头字段占有较多的为报关单表头,含有海关商品编码行级别数据的为表体信息。
优选的,所述步骤四中的大类内容包括表头大类和表体大类,其中表头大类包括收发货人10位编码识别、收发货人18位编码识别、收发货人名称、备案号、口岸、运输方式、贸易方式、数量级别的数据及表头标题类;表体大类包括柜号、商品编码、商品名称、要素类、币种类及数值类。
优选的,所述步骤五中表头大类中口岸对应小类中含有申报口岸,进出口岸和离境口岸3个具体字段,表体大类数值类对应小类中含有毛重,净重,单价,总价4个具体字段。
(三)有益效果
与现有技术相比,本发明提供了一种快速的识别导入表格数据的AI识别导入方法,具备以下有益效果:
该快速的识别导入表格数据的AI识别导入方法,通过对海关报关单填制规范要求不断更新AI知识库,能够准确快速的识别导入报关制单表格数据,相对于传统的人工录入数据,明显降低了报关数据录入的差错率,极大提高了报关制单环节的工作效率;相对于当前市场报关辅助系统需按每个客户逐个字段对应设置后识别导入,AI识别导入更加灵活,更加便捷,也节省设置导入的时间和人工成本,带来了极大的制单便捷性,依托AI智能识别导入制单申报,降低成本及差错率,极大提升工作效率。
附图说明
图1为本发明提出的一种快速的识别导入表格数据的AI识别导入方法的流程示意图。
具体实施方式
下面将对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
请参阅图1,一种快速的识别导入表格数据的AI识别导入方法,包括如下步骤:
步骤一:建立用于判断识别报关单的AI配置知识库并对AI配置知识库进行分类,使得AI配置知识库由初始常规知识库、监督学习知识库、评估标准知识库和自动逻辑知识库四个部分组成;
步骤二:配置AI识别导入知识库模块到云报关系统,并在报关制单操作中添加AI识别导入功能;
步骤三:客户操作导入表格数据,根据初始常规知识库、监督学习知识库和自动逻辑知识库信息判断识别导入数据sheet页中的主报关单和次报关单及区分主报关单和次报关单的表头和表体;
步骤四:根据步骤三中区分的主报关单和次报关单的表头和表体加上评估标准知识库与自动逻辑知识库判断识别出报关单数据大类内容;
步骤五:根据步骤四中判断识别出的报关单数据大类内容加上评估标准知识库与自动逻辑知识库判断识别出报关单数据小类内容,并对应报关单具体每一个字段;
步骤六:根据步骤五中判断识别出的报关单数据小类内容加上评估标准知识库与自动逻辑知识库识别生成完整准确的报关单数据;
步骤七:根据识别生成标准的报关单数据加上导入原始数据对比自动反馈到监督学习知识库进行自主学习,通过这种导入数据的不断积累,不断反馈,不断的更新,完善监督学习知识库;
步骤八:结束表格数据的识别导入。
初始常规知识库、监督学习知识库、评估标准知识库和自动逻辑知识库包含表格有报关值别名库、报关标题别名库、商品标题别名库、商品名称别名库、商品要素别名库、企业固定值、要素分类、要素键及要素整体观。
初始常规知识库组成报关单数据所需要的较为固定部分,按照海关对报关单字段填制要求所组成的原始数据。
监督学习知识库附有系统基础数据且伴随识别导入表格不断学习和完善数据库。
评估标准知识库按照报关单填制规范及对应的导入表格数据对比,设置评分标准,含有正整数分,负整数分。
自动逻辑知识库根据报关单填制规范的逻辑,个性化自定义逻辑等多种方式设置,比如报关单表头净重不能大于毛重。
步骤三中导入表格占有报关单表头后,根据表体字段信息多少判断出主报关单和次报关单,再分析其结构,表头字段占有较多的为报关单表头,含有海关商品编码行级别数据的为表体信息。
步骤四中的大类内容包括表头大类和表体大类,其中表头大类包括收发货人10位编码识别、收发货人18位编码识别、收发货人名称、备案号、口岸、运输方式、贸易方式、数量级别的数据及表头标题类;表体大类包括柜号、商品编码、商品名称、要素类、币种类及数值类。
步骤五中表头大类中口岸对应小类中含有申报口岸,进出口岸和离境口岸3个具体字段,表体大类数值类对应小类中含有毛重,净重,单价,总价4个具体字段。
综上所述,该快速的识别导入表格数据的AI识别导入方法,通过对海关报关单填制规范要求不断更新AI知识库,能够准确快速的识别导入报关制单表格数据,相对于传统的人工录入数据,明显降低了报关数据录入的差错率,极大提高了报关制单环节的工作效率;相对于当前市场报关辅助系统需按每个客户逐个字段对应设置后识别导入,AI识别导入更加灵活,更加便捷,也节省设置导入的时间和人工成本,带来了极大的制单便捷性,依托AI智能识别导入制单申报,降低成本及差错率,极大提升工作效率。
需要说明的是,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
尽管已经示出和描述了本发明的实施例,对于本领域的普通技术人员而言,可以理解在不脱离本发明的原理和精神的情况下可以对这些实施例进行多种变化、修改、替换和变型,本发明的范围由所附权利要求及其等同物限定。

Claims (5)

1.一种快速的识别导入表格数据的AI识别导入方法,其特征在于:包括如下步骤:
步骤一:建立用于判断识别报关单的AI配置知识库并对AI配置知识库进行分类,使得AI配置知识库由初始常规知识库、监督学习知识库、评估标准知识库和自动逻辑知识库四个部分组成,所述初始常规知识库组成报关单数据所需要的较为固定部分,按照海关对报关单字段填制要求所组成的原始数据,所述监督学习知识库附有系统基础数据且伴随识别导入表格不断学习和完善数据库,所述评估标准知识库按照报关单填制规范及对应的导入表格数据对比,设置评分标准,含有正整数分和负整数分,所述自动逻辑知识库根据报关单填制规范的逻辑,个性化自定义逻辑;
步骤二:配置AI识别导入知识库模块到云报关系统,并在报关制单操作中添加AI识别导入功能;
步骤三:客户操作导入表格数据,根据初始常规知识库、监督学习知识库和自动逻辑知识库信息判断识别导入数据sheet页中的主报关单和次报关单及区分主报关单和次报关单的表头和表体;
步骤四:根据步骤三中区分的主报关单和次报关单的表头和表体加上评估标准知识库与自动逻辑知识库判断识别出报关单数据大类内容;
步骤五:根据步骤四中判断识别出的报关单数据大类内容加上评估标准知识库与自动逻辑知识库判断识别出报关单数据小类内容,并对应报关单具体每一个字段;
步骤六:根据步骤五中判断识别出的报关单数据小类内容加上评估标准知识库与自动逻辑知识库识别生成完整准确的报关单数据;
步骤七:根据识别生成标准的报关单数据加上导入原始数据对比自动反馈到监督学习知识库进行自主学习,通过这种导入数据的不断积累,不断反馈,不断的更新,完善监督学习知识库;
步骤八:结束表格数据的识别导入。
2.根据权利要求1所述的一种快速的识别导入表格数据的AI识别导入方法,其特征在于:所述初始常规知识库、监督学习知识库、评估标准知识库和自动逻辑知识库包含表格有报关值别名库、报关标题别名库、商品标题别名库、商品名称别名库、商品要素别名库、企业固定值、要素分类、要素键及要素整体观。
3.根据权利要求1所述的一种快速的识别导入表格数据的AI识别导入方法,其特征在于:所述步骤三中导入表格占有报关单表头后,根据表体字段信息多少判断出主报关单和次报关单,再分析其结构,表头字段占有较多的为报关单表头,含有海关商品编码行级别数据的为表体信息。
4.根据权利要求1所述的一种快速的识别导入表格数据的AI识别导入方法,其特征在于:所述步骤四中的大类内容包括表头大类和表体大类,其中表头大类包括收发货人10位编码识别、收发货人18位编码识别、收发货人名称、备案号、口岸、运输方式、贸易方式、数量级别的数据及表头标题类;表体大类包括柜号、商品编码、商品名称、要素类、币种类及数值类。
5.根据权利要求1所述的一种快速的识别导入表格数据的AI识别导入方法,其特征在于:所述步骤五中表头大类中口岸对应小类中含有申报口岸,进出口岸和离境口岸3个具体字段,表体大类数值类对应小类中含有毛重,净重,单价,总价4个具体字段。
CN202010374143.4A 2020-05-06 2020-05-06 一种快速的识别导入表格数据的ai识别导入方法 Active CN111461072B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010374143.4A CN111461072B (zh) 2020-05-06 2020-05-06 一种快速的识别导入表格数据的ai识别导入方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010374143.4A CN111461072B (zh) 2020-05-06 2020-05-06 一种快速的识别导入表格数据的ai识别导入方法

Publications (2)

Publication Number Publication Date
CN111461072A CN111461072A (zh) 2020-07-28
CN111461072B true CN111461072B (zh) 2023-04-18

Family

ID=71681089

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010374143.4A Active CN111461072B (zh) 2020-05-06 2020-05-06 一种快速的识别导入表格数据的ai识别导入方法

Country Status (1)

Country Link
CN (1) CN111461072B (zh)

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1534526A (zh) * 2003-03-29 2004-10-06 鸿富锦精密工业(深圳)有限公司 Edi报关管理申报系统及方法
CN110471917A (zh) * 2019-07-10 2019-11-19 北京交通大学 一种基于历史数据挖掘的海关报关单智能填报方法

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
GB0004976D0 (en) * 2000-03-01 2000-04-19 Tatis International Trade and transport information system
US11281850B2 (en) * 2017-12-28 2022-03-22 A9.Com, Inc. System and method for self-filing customs entry forms

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1534526A (zh) * 2003-03-29 2004-10-06 鸿富锦精密工业(深圳)有限公司 Edi报关管理申报系统及方法
CN110471917A (zh) * 2019-07-10 2019-11-19 北京交通大学 一种基于历史数据挖掘的海关报关单智能填报方法

Also Published As

Publication number Publication date
CN111461072A (zh) 2020-07-28

Similar Documents

Publication Publication Date Title
AU2004214247B2 (en) Horizontal enterprise planning in accordance with an enterprise planning model
CN109858762A (zh) 一种企业风险预测方法及装置
CN112184484B (zh) 一种电力用户差异化服务方法及系统
CN114266492A (zh) 一种基于数据挖掘的企业融资基金匹配方法
CN115423289A (zh) 智能板材加工车间数据处理方法及终端
CN114372848A (zh) 一种基于机器学习的烟草行业智能营销系统
Luo et al. Supply Chain Flexibility Evaluation Based on Matter‐Element Extension
CN111461072B (zh) 一种快速的识别导入表格数据的ai识别导入方法
CN117273400A (zh) 企业资源计划智能合并升级预警方法和系统
CN109165868A (zh) 一种基于历史数据建立的风险监控模型
CN113191867A (zh) 一种大型企业财务会计管理系统
CN112232724A (zh) 用于人员能力的量化评测方法、系统、设备和存储介质
CN117114812A (zh) 一种针对企业的金融产品推荐方法及装置
CN117113154A (zh) 一种识别套牌空壳企业团伙的方法及系统
CN116308494A (zh) 供应链需求预测方法
KISELEVA et al. Decision-making modeling in the context of risk and uncertainty caused by social and political processes
CN110659882A (zh) 一种人力资源综合管理大数据监管服务系统
CN116797069A (zh) 一种区域高层次人才需求分析及预测综合管理系统
WO2002084563A1 (en) Method for automatically managing agribusiness supply inventory
US20020152088A1 (en) Method for automatically developing a strategic agribusiness plan
CN113361911A (zh) 一种基于资产风控的新媒体内容投放方法及设备
CN111401737A (zh) 一种企业财务管理风险识别系统
Zhu [Retracted] Resilience Assessment and Risk Prediction in Supply Chain Management Based on Network Analysis
CN112686484A (zh) 一种自动检测绩效工资的方法
US20240086819A1 (en) Machine Learning Based Expense Report Anomaly Detection

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant