CN114169301A - 电子面单汇聚取号方法、装置、设备及存储介质 - Google Patents

电子面单汇聚取号方法、装置、设备及存储介质 Download PDF

Info

Publication number
CN114169301A
CN114169301A CN202111444857.9A CN202111444857A CN114169301A CN 114169301 A CN114169301 A CN 114169301A CN 202111444857 A CN202111444857 A CN 202111444857A CN 114169301 A CN114169301 A CN 114169301A
Authority
CN
China
Prior art keywords
target
data
express
bill
preset
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202111444857.9A
Other languages
English (en)
Inventor
杨周龙
卢志伟
徐童
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Dongpu Software Co Ltd
Original Assignee
Dongpu Software Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Dongpu Software Co Ltd filed Critical Dongpu Software Co Ltd
Priority to CN202111444857.9A priority Critical patent/CN114169301A/zh
Publication of CN114169301A publication Critical patent/CN114169301A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/10Text processing
    • G06F40/166Editing, e.g. inserting or deleting
    • G06F40/177Editing, e.g. inserting or deleting of tables; using ruled lines
    • G06F40/18Editing, e.g. inserting or deleting of tables; using ruled lines of spreadsheets
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/25Integrating or interfacing systems involving database management systems
    • G06F16/252Integrating or interfacing systems involving database management systems between a Database Management System and a front-end application
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/10Text processing
    • G06F40/166Editing, e.g. inserting or deleting
    • G06F40/174Form filling; Merging
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/08Logistics, e.g. warehousing, loading or distribution; Inventory or stock management
    • G06Q10/083Shipping

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Business, Economics & Management (AREA)
  • Economics (AREA)
  • General Health & Medical Sciences (AREA)
  • Computational Linguistics (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Artificial Intelligence (AREA)
  • Health & Medical Sciences (AREA)
  • Operations Research (AREA)
  • Human Resources & Organizations (AREA)
  • Marketing (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Quality & Reliability (AREA)
  • Strategic Management (AREA)
  • Tourism & Hospitality (AREA)
  • General Business, Economics & Management (AREA)
  • Development Economics (AREA)
  • Data Mining & Analysis (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明涉及物流技术领域,公开了一种电子面单汇聚取号方法、装置、设备及存储介质。本方法包括:对获取的源数据表进行字段提取,并对字段进行清洗,得到目标字段数据;在检测到数据汇聚请求时,根据该数据汇聚请求对应导入文件和目标字段数据生成主表;接收单号生成请求,并从快递单号生成请求中获取快递基本数据;调用物流公司的下单接口,根据主表和快递基本数据进行下单,生成目标快递单号;生成与目标快递单号对应的目标图形码,并将目标图形码输入预设面单信息识别模型进行识别,得到目标面单图像的面单信息。本发明通过数据汇聚实现多平台取号,获取电子面单的面单信息,解决了客户方需要对接多方平台面单取号接口的技术问题。

Description

电子面单汇聚取号方法、装置、设备及存储介质
技术领域
本发明涉及物流技术领域,尤其涉及一种电子面单汇聚取号方法、装置、设备及存储介质。
背景技术
目前大多数的物流及快递公司在接收用户的寄件单时,都需要快递员去现场手动填写运单号。快递员填写好运单号后,该寄件单才能够生效。由于现在越来越多的人使用快递寄件,现有的运单号填写方式导致快递员的工作量较大,致使用户的寄件单可能无法及时处理,进而给用户带来不好的体验。
快递单号是快递包裹的唯一标识符,用于快递公司、发件人以及收件人实时查询快件的相关信息。目前,业内的快递单号对快递公司而言只是一个查询数据库时的主键,快递单号上并未承载相关的快递信息,即使部分快递公司的快递单号上携带了相关的快递信息,但由于编码系统各成体系,无法实现全面的数据共享和多平台或者多承运商取号,取号过程复杂繁琐。因此如何提高取号效率成了本领域技术人员需要解决的技术问题。
发明内容
本发明的主要目的在于通过数据汇聚,实现了全面的数据共享和多平台或者多承运商取号,解决了取号过程复杂繁琐的技术问题。
本发明第一方面提供了电子面单汇聚取号方法,包括:获取源数据表,并对所述源数据表进行字段提取,得到所述源数据表中的字段;对所述字段进行清洗,得到所述源数据表中的目标字段数据;在检测到数据汇聚请求时,获取所述数据汇聚请求对应的导入文件,并根据所述导入文件和所述目标字段数据生成目标主表;接收快递单号生成请求,并从所述快递单号生成请求中获取快递基本数据;调用预设物流公司开放平台的下单接口,根据所述目标主表和所述快递基本数据进行取号,生成目标快递单号。
可选地,在本发明第一方面的第一种实现方式中,所述在检测到数据汇聚请求时,获取所述数据汇聚请求对应的导入文件,并根据所述导入文件和所述目标字段数据生成目标主表包括:在检测到数据汇聚请求时,获取该数据汇聚请求对应的导入文件;当所述导入文件不符合预设格式时,根据预设规则导入所述导入文件,得到目标文件;根据所述目标文件和所述目标字段数据生成目标主表。
可选地,在本发明第一方面的第二种实现方式中,所述接收快递单号生成请求,并从所述快递单号生成请求中获取快递基本数据包括:当检测到有快递单号生成请求时,提取所述快递单号生成请求中的请求参数;校验所述请求参数中的数据类型是否符合预设存储规则;当所述请求参数中的数据类型符合预设存储规则时,将所述请求参数作为关键词检索预设物流信息数据库,得到快递基本数据。
可选地,在本发明第一方面的第三种实现方式中,所述调用预设物流公司开放平台的下单接口,根据所述目标主表和所述快递基本数据进行取号,生成目标快递单号包括:调用预设物流公司开放平台的下单接口,根据所述快递基本信息和所述目标主表,生成多段快递单号编码,其中,所述快递单号编码包括快递公司代号编码段、发件方地址编码段、收件方地址编码段、邮编版本编码段;将所述多段快递单号编码进行拼接,得到目标快递单号。
可选地,在本发明第一方面的第四种实现方式中,在所述将所述多段快递单号编码进行拼接,得到目标快递单号之后,还包括:当下单失败或者获取对应的运单号失败时,查找是否存在与当前运单类型对应的已存储运单号;若存在与当前运单类型对应的已存储运单号,将所述已存储运单号返回给所述派单终端。
可选地,在本发明第一方面的第五种实现方式中,在所述调用预设物流公司开放平台的下单接口,根据所述目标主表和所述快递基本数据进行取号,生成目标快递单号之后,还包括:根据所述目标快递单号,生成与所述目标快递单号对应的目标图形码;确定与所述目标图形码确定对应的面单图像,并获取所述面单图像的面单结构数据;基于所述目标图形码和所述面单结构数据,确定所述面单图像中面单信息所在的图像区域;将所述图像区域输入预设面单信息识别模型进行识别,得到所述目标图形码对应目标面单图像的面单信息。
可选地,在本发明第一方面的第六种实现方式中,所述将所述目标图形码输入预设面单信息识别模型进行识别,得到所述目标图形码对应目标面单图像的面单信息包括:获取标准面单图像的面单结构数据;基于所述目标面单图像的目标图形码和所述标准面单图像的面单结构数据,确定所述目标面单图像中面单信息所在的图像区域;将所述图像区域输入预设面单信息识别模型进行识别,得到所述目标图形码对应目标面单图像的面单信息。
本发明第二方面提供了一种电子面单汇聚取号装置,包括:字段提取模块,用于获取源数据表,并对所述源数据表进行字段提取,得到所述源数据表中的字段;清洗模块,用于对所述字段进行清洗,得到所述源数据表中的目标字段数据;第一生成模块,用于在检测到数据汇聚请求时,获取所述数据汇聚请求对应的导入文件,并根据所述导入文件和所述目标字段数据生成目标主表;接收模块,用于接收快递单号生成请求,并从所述快递单号生成请求中获取快递基本数据;取号模块,用于调用预设物流公司开放平台的下单接口,根据所述目标主表和所述快递基本数据进行取号,生成目标快递单号。
可选地,在本发明第二方面的第一种实现方式中,第一生成模块具体用于:在检测到数据汇聚请求时,获取该数据汇聚请求对应的导入文件;当所述导入文件不符合预设格式时,根据预设规则导入所述导入文件,得到目标文件;根据所述目标文件和所述目标字段数据生成目标主表。
可选地,在本发明第二方面的第二种实现方式中,所述接收模块具体用于:当检测到有快递单号生成请求时,提取所述快递单号生成请求中的请求参数;校验所述请求参数中的数据类型是否符合预设存储规则;当所述请求参数中的数据类型符合预设存储规则时,将所述请求参数作为关键词检索预设物流信息数据库,得到快递基本数据。
可选地,在本发明第二方面的第三种实现方式中,所述取号模块包括:生成单元,用于调用预设物流公司开放平台的下单接口,根据所述快递基本信息和所述目标主表,生成多段快递单号编码,其中,所述快递单号编码包括快递公司代号编码段、发件方地址编码段、收件方地址编码段、邮编版本编码段;拼接单元,用于将所述多段快递单号编码进行拼接,得到目标快递单号。
可选地,在本发明第二方面的第四种实现方式中,所述电子面单汇聚取号装置还包括:查找单元,用于当下单失败或者获取对应的运单号失败时,查找是否存在与当前运单类型对应的已存储运单号;若存在与当前运单类型对应的已存储运单号,将所述已存储运单号返回给所述派单终端。
可选地,在本发明第二方面的第五种实现方式中,所述电子面单汇聚取号装置还包括:第二生成模块,用于根据所述目标快递单号,生成与所述目标快递单号对应的目标图形码;确定模块,用于确定与所述目标图形码确定对应的面单图像,并获取所述面单图像的面单结构数据;基于所述目标图形码和所述面单结构数据,确定所述面单图像中面单信息所在的图像区域;识别模块,用于将所述图像区域输入预设面单信息识别模型进行识别,得到所述目标图形码对应目标面单图像的面单信息。
可选地,在本发明第二方面的第六种实现方式中,所述电子面单汇聚取号装置还包括:构建模块,用于构建初始训练模型的初始骨干网络;特征提取模块,用于获取预设训练样本数据和历史面单标注数据,通过所述待训练模型对所述预设训练样本数据进行特征提取,得到多个尺寸的文字特征图像信息;分割模块,用于提取所述训练样本数据中的历史面单标注数据,并采用预设裁剪算法对所述历史面单标注数据进行分割,得到预设数量个切片信息;训练模块,用于根据所述文字特征图像信息和所述预设数量个切片信息对所述初始训练模型的初始骨干网络进行训练,得到面单信息识别模型。
本发明第三方面提供了电子面单汇聚取号设备,包括:存储器和至少一个处理器,所述存储器中存储有指令,所述存储器和所述至少一个处理器通过线路互连;
所述至少一个处理器调用所述存储器中的所述指令,以使得所述电子面单汇聚取号设备执行上述的电子面单汇聚取号方法的步骤。
本发明的第四方面提供了一种计算机可读存储介质,所述计算机可读存储介质中存储有指令,当其在计算机上运行时,使得计算机执行上述的电子面单汇聚取号方法的步骤。
本发明提供的技术方案中,通过对获取的源数据表进行字段提取,得到源数据表中的字段;对字段进行清洗,得到源数据表中的目标字段数据;在检测到数据汇聚请求时,获取数据汇聚请求对应的导入文件,并根据导入文件和目标字段数据生成目标主表;接收快递单号生成请求,并从快递单号生成请求中获取快递基本数据;调用预设物流公司开放平台的下单接口,根据目标主表和快递基本数据进行取号,生成目标快递单号;根据目标快递单号,生成与目标快递单号对应的目标图形码,并将目标图形码输入预设面单信息识别模型进行识别,得到目标图形码对应目标面单图像的面单信息。本发明通过数据汇聚实现多平台或者多承运商取号,并获取电子面单的面单信息,解决了客户方需要对接多方平台面单取号接口的技术问题,提高了取号效率。
附图说明
图1为本发明提供的电子面单汇聚取号方法的第一个实施例示意图;
图2为本发明提供的电子面单汇聚取号方法的第二个实施例示意图;
图3为本发明提供的电子面单汇聚取号方法的第三个实施例示意图;
图4为本发明提供的电子面单汇聚取号方法的第四个实施例示意图;
图5为本发明提供的电子面单汇聚取号方法的第五个实施例示意图;
图6为本发明提供的电子面单汇聚取号装置的第一个实施例示意图;
图7为本发明提供的电子面单汇聚取号装置的第二个实施例示意图;
图8为本发明提供的电子面单汇聚取号设备的一个实施例示意图。
具体实施方式
本发明实施例提供的电子面单汇聚取号方法、装置、设备及存储介质,先通过对获取的源数据表进行字段提取,得到源数据表中的字段;对字段进行清洗,得到源数据表中的目标字段数据;在检测到数据汇聚请求时,获取数据汇聚请求对应的导入文件,并根据导入文件和目标字段数据生成目标主表;接收快递单号生成请求,并从快递单号生成请求中获取快递基本数据;调用预设物流公司开放平台的下单接口,根据目标主表和快递基本数据进行取号,生成目标快递单号;根据目标快递单号,生成与目标快递单号对应的目标图形码,并将目标图形码输入预设面单信息识别模型进行识别,得到目标图形码对应目标面单图像的面单信息。本发明通过数据汇聚实现多平台或者多承运商取号,并获取电子面单的面单信息,解决了客户方需要对接多方平台面单取号接口的技术问题,提高了取号效率。
本发明的说明书和权利要求书及上述附中的术语“第一”、“第二”、“第三”、“第四”等(如果存在)是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的实施例能够以除了在这里图示或描述的内容以外的顺序实施。此外,术语“包括”或“具有”及其任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
为便于理解,下面对本发明实施例的具体流程进行描述,请参阅图1,本发明实施例中电子面单汇聚取号方法的第一个实施例包括:
101、获取源数据表,并对源数据表进行字段提取,得到源数据表中的字段;
本实施例中,从源数据库中获取源数据表,并对源数据表进行字段提取。其中,表中的每一行叫做一个“记录”,每一个记录包含这行中的所有信息,就像在通讯录数据库中某个人全部的信息,但记录在数据库中并没有专门的记录名,常常用它所在的行数表示这是第几个记录。字段是比记录更小的单位,字段集合组成记录,每个字段描述文献的某一特征,即数据项,并有唯一的供计算机识别的字段标识符。
具体地,一个成员,它表示与对象或类关联的变量。在数据库中,大多数时,表的“列”称为“字段”,每个字段包含某一专题的信息。就像“通讯录”数据库中,“姓名”、“联系电话”这些都是表中所有行共有的属性,所以把这些列称为“姓名”字段和“联系电话”字段。同时,字段也不是表中的列,比如用as将列的内容经计算,“存入”另一个字段。
102、对字段进行清洗,得到源数据表中的目标字段数据;
本实施例中,清洗是指发现并纠正数据文件中可识别的错误的最后一道程序,包括检查数据一致性,处理无效值和缺失值等。与问卷审核不同,录入后的数据清理一般是由计算机而不是人工完成。
清洗(Data cleaning)–对数据进行重新审查和校验的过程,目的在于删除重复信息、纠正存在的错误,并提供数据一致性。
清洗从名字上也看的出就是把“脏”的“洗掉”,指发现并纠正数据文件中可识别的错误的最后一道程序,包括检查数据一致性,处理无效值和缺失值等。因为数据仓库中的数据是面向某一主题的数据的集合,这些数据从多个业务系统中抽取而来而且包含历史数据,这样就避免不了有的数据是错误数据、有的数据相互之间有冲突,这些错误的或有冲突的数据显然是我们不想要的,称为“脏数据”。我们要按照一定的规则把“脏数据”“洗掉”,这就是清洗。而清洗的任务是过滤那些不符合要求的数据,将过滤的结果交给业务主管部门,确认是否过滤掉还是由业务单位修正之后再进行抽取。不符合要求的数据主要是有不完整的数据、错误的数据、重复的数据三大类。
其中,清洗原理:利用有关技术如数理统计、数据挖掘或预定义的清理规则将脏数据转化为满足数据质量要求的数据。
103、在检测到数据汇聚请求时,获取数据汇聚请求对应的导入文件,并根据导入文件和目标字段数据生成目标主表;
本实施例中,预设格式指后端系统进行数据处理时对数据的格式要求,通过读取导入文件的格式判断其是否符合预设格式。若导入文件符合预设格式,则直接将导入文件传输到后端系统,以供后端系统基于所述目标文件。
若所述导入文件不符合预设格式,则在将导入文件导入客服系统的过程中,根据预设规则对所述导入文件执行导入操作,实现对导入文件格式的调整,使得导入后的目标文件符合预设格式,再将该目标文件发送至后端系统。
本实施例中的预设规则,指数据汇聚终端/装置预先定义的数据导入规则,通过预设规则,将导入文件中数据的存储结构改变为预设规则对应的存储结构,使得导入文件在导入到数据汇聚终端/装置后,生成符合预设格式的目标主表。
在一实施例中,通过读取所述导入文件中的数据,并确定该数据所对应的目标属性;将所述目标属性与预设字段库中的字段进行对比,判断所述预设字段库中是否存在与该目标属性对应的目标字段;若所述预设字段库中存在与所述目标属性对应的所述目标字段,则将所述导入文件中的数据存储到所述目标字段的字段存储位置。字段库中的字段具有各自的字段存储位置,通过将导入文件中的数据存储到对应字段的字段存储位置,改变导入文件的数据格式,使其符合预设格式。
104、接收快递单号生成请求,并从快递单号生成请求中获取快递基本数据;
本实施例中,服务器接收终端发送的快递单号生成请求,并提取快递单号生成请求中的多个请求参数;服务器分别校验各请求参数中的数据类型是否符合预置的数据类型存储条件;若全部请求参数中的数据类型符合数据类型存储条件,则将多个请求参数存储到预置快递信息数据库,得到快递基本信息,快递基本信息包括快递公司信息、发件方地址信息以及收件方地址信息;若至少一个请求参数中的数据类型不符合数据类型存储条件,则将数据类型存储条件返回终端,并输出异常提示信息。
本可选实施例中,服务器接收到终端发送的快递单号生成请求之后,需要解析快递单号生成请求中的多个请求参数,也就是解析快递单号生成请求所传递过来的url字符串或者json对象。由于多个请求参数一般是采用键值对的方式传递,因此,服务器在解析的过程中只需识别键值对格式中特定的符号即可提取到相应的请求参数,例如通过快递单号生成请求所传递的携带姓名name和年龄age的url字符串为:name=“Lily”&age=29,那么,服务器通过预置的正则表达式,识别字符串中的等号和&符号,就能提取到请求参数name和age,以及name和age分别对应的参数值为Lily和29。
本可选实施例中,为了便于对快递基本信息进行统一编码,服务器在将用户提交的快递基本信息存入数据库之前,对用户提交的快递基本信息进行数据类型校验,以确定用户提交的快递基本信息符合数据库的存储条件,避免了后续进行统一编码时出现数据类型不符合的情况而导致的乱码,其中,数据类型一般包括:数值型、字符串型和日期时刻型,用户提交的快递基本信息一般为字符串型,那么,服务器则校验用户提交的快递基本信息是否为字符串即可确定快递基本信息是否符合目的数据库的数据类型存储条件。
105、调用预设物流公司开放平台的下单接口,根据目标主表和快递基本数据进行取号,生成目标快递单号。
本实施例中,调用预设物流公司开放平台的下单接口,根据目标主表和快递基本数据进行下单,将生成的多段快递单号编码拼接成目标快递单号,例如,假设快递公司代号编码段为08,发件方地址编码段为241204,收件方地址编码段为241425,邮编版本编码段为12,自定义编码段为145,日期编码段为0407,序列编码段为2,再按照快递公司代号编码段、发件方地址编码段、收件方地址编码段、邮编版本编码段、自定义编码段、日期编码段以及序列编码段的顺序依次拼接多段快递单号编码,最后得到的目标快递单号为082412042414251214504072,需要说明的是,本例子并不限定具体的目标快递单号的长度和内容,只是对快递单号编码的拼接方式进行举例说明。
本可选实施例中,由于目标快递单号上携带了较多的信息,因此,服务器还可以对快递单号进行加密处理,可选的预置加密算法包括但不限于:高级加密标准算法(advancedencryption standard,AES)、数据加密标准算法(data encryption standard,DES)、三重数据加密算法(triple DES,3DES)、RSA加密算法(RSA algorithm,RSA)、数字签名算法(digital signature algorithm,DSA)、椭圆曲线密码编码学(ellipticcurvescryptography,ECC)、信息摘要算法(md5 message-digest algorithm,md5)、安全散列算法1(secure hash algorithm 1,SHA1)、哈希运算消息认证码(hash-basedmessageauthentication code,HMAC)。
面单信息识别模型是用于对包含文本的图像进行分类和识别的神经网络模型。具体地,计算机设备获取服务器训练好的面单信息识别模型,并通过该面单信息识别模型对文本图像进行特征提取,得到与文本图像对应的特征图。
在一个实施例中,计算机设备可选取VGG(Visual Geometry Group Network,视觉几何群网络)或者Resnet(Residual Network,残差网络)等神经网络作为特征提取的网络,本申请实施例对此不做限定。比如,计算机设备采用Resnet神经网络的两个残差模块作为卷积层进行底层的特征提取,从而在文本图像中提取到特征图。
在一个实施例中,当计算机设备在文本图像中提取到特征图后,可通过面单信息识别模型中对应的通道对该特征图进行语种分类处理和文本识别处理。比如,计算机设备通过面单信息识别模型中的分类通道对该特征图进行语种分类处理;计算机设备通过面单信息识别模型中的文本识别通道对该特征图进行文本识别处理。
本发明实施例中,通过对获取的源数据表进行字段提取,得到源数据表中的字段;对字段进行清洗,得到源数据表中的目标字段数据;在检测到数据汇聚请求时,获取数据汇聚请求对应的导入文件,并根据导入文件和目标字段数据生成目标主表;接收快递单号生成请求,并从快递单号生成请求中获取快递基本数据;调用预设物流公司开放平台的下单接口,根据目标主表和快递基本数据进行取号,生成目标快递单号;根据目标快递单号,生成与目标快递单号对应的目标图形码,并将目标图形码输入预设面单信息识别模型进行识别,得到目标图形码对应目标面单图像的面单信息。本发明通过数据汇聚实现多平台或者多承运商取号,并获取电子面单的面单信息,解决了客户方需要对接多方平台面单取号接口的技术问题,提高了取号效率。
请参阅图2,本发明实施例中电子面单汇聚取号方法的第二个实施例包括:
201、获取源数据表,并对源数据表进行字段提取,得到源数据表中的字段;
202、对字段进行清洗,得到源数据表中的目标字段数据;
203、在检测到数据汇聚请求时,获取该数据汇聚请求对应的导入文件;
本实施例中,导入文件指数据汇聚终端检测到的数据汇聚请求对应的文件,可以指通过USB或无线传输或网络通信等方式从其他终端/服务器传输到数据汇聚终端的导入文件,也可以指将存储于终端本地的导入文件导入到终端上配置的目标系统,例如,将本地的客户资料导入到终端上配置的OA系统、催款系统、客服系统等。导入文件为表格形式的数据,如Excel表格或CSV表格。
为便于理解本发明,提出数据汇聚方法的一应用场景示例,将本发明数据汇聚方法应用于客服系统,所述数据汇聚终端承载客服系统进行数据汇聚操作,该客服系统对接委案客户和催款系统,客服系统需要将来自不同客户的内容/格式不同的数据汇聚成统一格式后传输到催款系统,并将来自催款系统的有关各委案客户催款情况的数据以报表形式提供给对应客户。在这一应用场景中,客服系统所在终端为数据汇聚终端,客服系统的操作人员为数据汇聚终端的用户。
预设格式指后端系统进行数据处理时对数据的格式要求,通过读取导入文件的格式判断其是否符合预设格式。若导入文件符合预设格式,则直接将导入文件传输到后端系统,以供后端系统基于所述目标主表生成导入文件。
204、当导入文件不符合预设格式时,根据预设规则导入导入文件,得到目标文件;
本实施例中,为减少人工对数据的整理,或者减少后端系统在数据处理之前对数据格式的整理,本实施例中,若所述导入文件不符合预设格式,则在将导入文件导入客服系统的过程中,根据预设规则对所述导入文件执行导入操作,实现对导入文件格式的调整,使得导入后的目标文件符合预设格式,再将该目标文件发送至后端系统。
本实施例中的预设规则,指数据汇聚终端/装置预先定义的数据导入规则,通过预设规则,将导入文件中数据的存储结构改变为预设规则对应的存储结构,使得导入文件在导入到数据汇聚终端/装置后,生成符合预设格式的目标文件。
在一实施例中,通过读取所述导入文件中的数据,并确定该数据所对应的目标属性;将所述目标属性与预设字段库中的字段进行对比,判断所述预设字段库中是否存在与该目标属性对应的目标字段;若所述预设字段库中存在与所述目标属性对应的所述目标字段,则将所述导入文件中的数据存储到所述目标字段的字段存储位置。字段库中的字段具有各自的字段存储位置,通过将导入文件中的数据存储到对应字段的字段存储位置,改变导入文件的数据格式,使其符合预设格式。
205、根据目标文件和目标字段数据生成目标主表;
本实施例中,根据目标客户查询预置模板库,判断预置模板库中是否存在目标客户对应的模板,若预置模板库中存在目标客户对应的模板,则直接获取目标客户对应的模板,若预置模板库中不存在目标客户对应的模板,则根据案件数据生成目标客户对应的模板。
获取目标客户对应的模板中的字段,从所述案件数据中获取与所述目标模板中各字段关联的数据,将从所述案件数据中获取的数据导出到对应字段的位置,生成目标主表,并将目标主表提供给所述目标客户。
本实施例通过在检测到数据汇聚请求时,获取数据汇聚请求对应的导入文件,判断所述导入文件是否符合预设格式;若所述导入文件不符合预设格式,则根据预设规则导入所述导入文件,并将导入后得到的目标文件发送至后端系统,以供后端系统基于所述目标文件,可将来自不同客户的、不同格式的导入文件按照预设格式进行调整,使得其满足后端系统数据处理的格式要求;获取所述案件数据,并获得所述案件数据对应的目标客户;获取与所述目标客户对应的模板,根据该模板和所述案件数据生成目标主表。
206、接收快递单号生成请求,并从快递单号生成请求中获取快递基本数据;
207、调用预设物流公司开放平台的下单接口,根据目标主表和快递基本数据进行取号,生成目标快递单号。
本实施例中步骤201-202、206-207与第一实施例中的步骤101-102、104-105类似,此处不再赘述。
本发明实施例中,通过对获取的源数据表进行字段提取,得到源数据表中的字段;对字段进行清洗,得到源数据表中的目标字段数据;在检测到数据汇聚请求时,获取数据汇聚请求对应的导入文件,并根据导入文件和目标字段数据生成目标主表;接收快递单号生成请求,并从快递单号生成请求中获取快递基本数据;调用预设物流公司开放平台的下单接口,根据目标主表和快递基本数据进行取号,生成目标快递单号;根据目标快递单号,生成与目标快递单号对应的目标图形码,并将目标图形码输入预设面单信息识别模型进行识别,得到目标图形码对应目标面单图像的面单信息。本发明通过数据汇聚实现多平台或者多承运商取号,并获取电子面单的面单信息,解决了客户方需要对接多方平台面单取号接口的技术问题,提高了取号效率。
请参阅图3,本发明实施例中电子面单汇聚取号方法的第三个实施例包括:
301、获取源数据表,并对源数据表进行字段提取,得到源数据表中的字段;
302、对字段进行清洗,得到源数据表中的目标字段数据;
303、在检测到数据汇聚请求时,获取数据汇聚请求对应的导入文件,并根据导入文件和目标字段数据生成目标主表;
304、当检测到有快递单号生成请求时,提取快递单号生成请求中的请求参数;
本实施例中,服务器接收终端发送的快递单号生成请求,并提取快递单号生成请求中的多个请求参数;服务器分别校验各请求参数中的数据类型是否符合预置的数据类型存储条件;若全部请求参数中的数据类型符合数据类型存储条件,则将多个请求参数存储到预置快递信息数据库,得到快递基本信息,快递基本信息包括快递公司信息、发件方地址信息以及收件方地址信息;若至少一个请求参数中的数据类型不符合数据类型存储条件,则将数据类型存储条件返回终端,并输出异常提示信息。
305、校验请求参数中的数据类型是否符合预设存储规则;
本实施例中,服务器接收到终端发送的快递单号生成请求之后,需要解析快递单号生成请求中的多个请求参数,也就是解析快递单号生成请求所传递过来的url字符串或者json对象。由于多个请求参数一般是采用键值对的方式传递,因此,服务器在解析的过程中只需识别键值对格式中特定的符号即可提取到相应的请求参数,例如通过快递单号生成请求所传递的携带姓名name和年龄age的url字符串为:name=“Lily”&age=29,那么,服务器通过预置的正则表达式,识别字符串中的等号和&符号,就能提取到请求参数name和age,以及name和age分别对应的参数值为Lily和29。
306、当请求参数中的数据类型符合预设存储规则时,将请求参数作为关键词检索预设物流信息数据库,得到快递基本数据;
本实施例中,为了便于对快递基本信息进行统一编码,服务器在将用户提交的快递基本信息存入数据库之前,对用户提交的快递基本信息进行数据类型校验,以确定用户提交的快递基本信息符合数据库的存储条件,避免了后续进行统一编码时出现数据类型不符合的情况而导致的乱码,其中,数据类型一般包括:数值型、字符串型和日期时刻型,用户提交的快递基本信息一般为字符串型,那么,服务器则校验用户提交的快递基本信息是否为字符串即可确定快递基本信息是否符合目的数据库的数据类型存储条件。
307、调用预设物流公司开放平台的下单接口,根据目标主表和快递基本数据进行取号,生成目标快递单号。
本实施例中步骤301-303、307与第一实施例中的步骤101-103、105类似,此处不再赘述。
本发明实施例中,通过对获取的源数据表进行字段提取,得到源数据表中的字段;对字段进行清洗,得到源数据表中的目标字段数据;在检测到数据汇聚请求时,获取数据汇聚请求对应的导入文件,并根据导入文件和目标字段数据生成目标主表;接收快递单号生成请求,并从快递单号生成请求中获取快递基本数据;调用预设物流公司开放平台的下单接口,根据目标主表和快递基本数据进行取号,生成目标快递单号;根据目标快递单号,生成与目标快递单号对应的目标图形码,并将目标图形码输入预设面单信息识别模型进行识别,得到目标图形码对应目标面单图像的面单信息。本发明通过数据汇聚实现多平台或者多承运商取号,并获取电子面单的面单信息,解决了客户方需要对接多方平台面单取号接口的技术问题,提高了取号效率。
请参阅图4,本发明实施例中电子面单汇聚取号方法的第四个实施例包括:
401、获取源数据表,并对源数据表进行字段提取,得到源数据表中的字段;
402、对字段进行清洗,得到源数据表中的目标字段数据;
403、在检测到数据汇聚请求时,获取数据汇聚请求对应的导入文件,并根据导入文件和目标字段数据生成目标主表;
404、接收快递单号生成请求,并从快递单号生成请求中获取快递基本数据;
405、调用预设物流公司开放平台的下单接口,根据快递基本信息和目标主表,生成多段快递单号编码;
本实施例中,服务器从已对接下单接口的物流公司中查找是否存在物流公司与待生成运单号所对应的物流公司一致,以确定服务器是否能够直接通过调用下单接口来进行下单。
本实施例中,为了快速地检索快递信息,提高快递的分拣效率,通过将快递基本信息赋予到快递单号上,以增加快递单号的作用和意义,从而降低数据存储和数据分析的难度。通过本发明生成的快递单号,能够体现快递基本信息,并且能够直接对应到发件方地址和收件方地址的具体门户信息,大大地提高了末端集中分拣和集中派送的效率。其中,所述多段快递单号编码可以为七段码。
具体地,服务器按照快递公司信息,服务器查找预置快递公司代号库,得到快递公司代号编码段;服务器基于发件方地址信息和收件方地址信息,服务器分别查找预置的新型邮编地址库,得到发件方地址信息对应的发件方地址编码段,和收件方地址信息对应的收件方地址编码段;服务器提取新型邮编地址库对应的版本信息,并根据版本信息生成版本编码段;服务器基于收件方地址信息,服务器查找预置自定义地址库,得到自定义编码段;服务器根据快递单号生成请求对应的发送日期,生成日期编码段;服务器根据发件方地址信息、收件方地址信息以及发送日期,生成序列编码段;服务器将快递公司代号编码段、发件方地址编码段、收件方地址编码段、邮编版本编码段、自定义编码段、日期编码段以及序列编码段合并为多段快递单号编码。
本可选实施例中,新的快递公司通过本发明进行快递单号生成之前,需要先获取快递单号生成权限。服务器在接入新的快递公司之前,会先校验新的快递公司是否具有快递单号生成权限,若校验通过,则服务器开放快递单号生成功能给对应的快递公司,并分配一个唯一的快递公司代号给对应的快递公司,若校验不通过,则服务器确定对应的快递公司不具有快递单号生成权限,无法通过本发明进行快递单号生成。例如,快递公司代号库中已有快递公司A的代号,假设为01,现在,快递公司B欲通过本发明生成快递单号,那么,快递公司B可以提交快递单号生成权限请求,服务器通过快递单号生成权限请求的权限申请之后,分配一个唯一的快递公司代号给快递公司B,假设为02,那么,快递公司B就能通过本发明进行统一的快递单号生成,生成的快递单号中也会携带快递公司B的公司代号02。
本可选实施例中,预置自定义地址库为开放式的编码库,可以由不同的快递公司根据快递单号的实际使用情况自行编码,使生成的快递单号更灵活且更贴合具体应用场景。需要说明的是,为了统一目标快递单号的编码位数,服务器可以限定自定义编码段的具体位数,例如开放3位数编码用于自定义编码段,这样,就能避免不同快递公司不同的自定义标准影响最终生成的目标快递单号的统一性。
进一步的,服务器基于发件方地址信息和收件方地址信息,服务器分别查找预置的新型邮编地址库,得到发件方地址信息对应的发件方地址编码段,和收件方地址信息对应的收件方地址编码段的一可选实施例具体包括:服务器分别对发件方地址信息和收件方地址信息进行行政区域分级划分,得到发件方地址信息对应的第一分级信息,和收件方地址信息对应的第二分级信息;服务器分别将第一分级信息和第二分级信息设置为第一索引和第二索引,并按照第一索引和第二索引分别查找预置的新型邮编地址库,得到发件方地址信息对应的发件方地址编码段,和收件方地址信息对应的收件方地址编码段,其中,发件方地址编码段和收件方地址编码段为新型邮政编码。
406、将多段快递单号编码进行拼接,得到目标快递单号;
本实施例中,将生成的多段快递单号编码拼接成目标快递单号,例如,假设快递公司代号编码段为08,发件方地址编码段为241204,收件方地址编码段为241425,邮编版本编码段为12,自定义编码段为145,日期编码段为0407,序列编码段为2,再按照快递公司代号编码段、发件方地址编码段、收件方地址编码段、邮编版本编码段、自定义编码段、日期编码段以及序列编码段的顺序依次拼接多段快递单号编码,最后得到的目标快递单号为082412042414251214504072,需要说明的是,本例子并不限定具体的目标快递单号的长度和内容,只是对快递单号编码的拼接方式进行举例说明。通过上述例子可见,快递单号中包含了大量的快递基本信息,在分拣过程中,读码终端只需直接读取目标快递单号,通过本地解码就能获得目标快递单号中的快递基本信息,无需再访问数据库调取地址信息,免除了海量数据交换工作。
本实施例中,多段快递单号编码之间还可以通过拼接符号连接,其中,拼接符号可以是“空格符”,“-”,“/”“+”,“*”,“@”,“&”等的特殊符号,还可以是其他符号,具体此处不作限定,以“-”拼接符号为例,最终拼接得到的目标快递单号可以为“08-241204-241425-12-145-0407-2”。
407、当下单失败或者获取对应的运单号失败时,查找是否存在与当前运单类型对应的已存储运单号;
本实施例中,在服务器调用物流公司开放平台的下单接口进行下单之后,可能还会出现下单失败或者下单成功但获取运单号失败的情况,在这种情况下服务器无法获取到运单号,那么,服务器会从数据库的已存储运单号中查找是否存在与运单类型对应的运单号,如果存在,那么服务器就从查找到的与运单类型对应的已存储运单号中选择一个运单号作为生成运单号进行存储,并返回给用户。例如,测试人员选择AA快递,调用AA快递的下单接口失败后,服务器去查询数据库,如果数据库有AA快递的数据,运单号为:TT6600777015367,那么服务器就会把查询到的运单号作为生成运单号返回给派单平台,由派单平台展示给测试人员。
408、若存在与当前运单类型对应的已存储运单号,将已存储运单号返回给派单终端;
本实施例中,在验证某些功能时需要不同物流公司的运单号来进行测试操作,服务器对于已生成的运单号,都会在返回给派单平台的同时存储到数据库中,同样的,为了保证运单类型的多样性,在进行测试操作前,也需要管理员通过派单平台存储一些物流公司对应的运单号到数据库中,以增加运单号种类,增强真实性和有效性。也因此,上述已存储运单号可以包括:派单平台接收管理员编辑并发送给服务器存储的运单号;或者,服务器历史生成的运单号。
其中,服务器生成的运单号都会存储在数据库中,可以在服务器需要时进行调用。历史生成的运单号对于测试人员来说,可以作为已存储运单号被重复利用。
本实施例中步骤401-404与第一实施例中的步骤101-104类似,此处不再赘述。
在本发明实施例中,通过对获取的源数据表进行字段提取,得到源数据表中的字段;对字段进行清洗,得到源数据表中的目标字段数据;在检测到数据汇聚请求时,获取数据汇聚请求对应的导入文件,并根据导入文件和目标字段数据生成目标主表;接收快递单号生成请求,并从快递单号生成请求中获取快递基本数据;调用预设物流公司开放平台的下单接口,根据目标主表和快递基本数据进行取号,生成目标快递单号;根据目标快递单号,生成与目标快递单号对应的目标图形码,并将目标图形码输入预设面单信息识别模型进行识别,得到目标图形码对应目标面单图像的面单信息。本发明通过数据汇聚实现多平台或者多承运商取号,并获取电子面单的面单信息,解决了客户方需要对接多方平台面单取号接口的技术问题,提高了取号效率。
请参阅图5,本发明实施例中电子面单汇聚取号方法的第五个实施例包括:
501、获取源数据表,并对源数据表进行字段提取,得到源数据表中的字段;
502、对字段进行清洗,得到源数据表中的目标字段数据;
503、在检测到数据汇聚请求时,获取数据汇聚请求对应的导入文件,并根据导入文件和目标字段数据生成目标主表;
504、接收快递单号生成请求,并从快递单号生成请求中获取快递基本数据;
505、调用预设物流公司开放平台的下单接口,根据目标主表和快递基本数据进行取号,生成目标快递单号;
506、根据目标快递单号,生成与目标快递单号对应的目标图形码;
本实施例中,通过预置的图形码生成工具,将加密快递单号转化为初始图形码,其中,初始图形码为条形码或二维码;服务器压缩初始图形码的尺寸大小,得到目标快递单号对应的目标图形码,并打印目标图形码。
本实施例中,服务器根据目标快递单号生成的目标图形码,可以用于分拣时或派件时读码终端直接读取快递基本信息,读码终端可以通过预存在本地的读码规则进行离线解码,简化了分拣的运算难度,提高了运算速度和准确度,从而提高了分拣效率。
507、确定与目标图形码确定对应的面单图像,并获取面单图像的面单结构数据;
本实施例中,该参考面单图像的面单结构信息可以事先以TXT、XML等文件形式存储在图像采集设备中,因此,图像采集设备可以从TXT、XML等文件中获取该参考面单图像的面单结构信息。
其中,当图像采集设备在获取该参考面单图像的面单结构信息时,由于图像采集设备可以分别确定收件人地址所在图像区域的位置信息、收件人电话所在图像区域的位置信息、发件人信息所在图像区域的位置信息、图形码的编号所在图像区域的位置信息。因此,图像采集设备可以根据需求有选择的获取面单结构信息。比如,当需要获取收件人电话号码时,图像采集设备可以在参考面单图像中获取收件人电话号码所在图像区域的位置信息。
508、基于目标图形码和面单结构数据,确定面单图像中面单信息所在的图像区域;
本实施例中,基于该目标面单图像的图形码信息和参考面单图像的面单结构信息,确定第一最小外接图形的尺寸和预设点位置,该第一最小外接图形为该目标面单图像中面单信息的最小外接图形;将该第一最小外接图形的尺寸和预设点位置在该目标面单图像中所指示的区域确定为该目标面单图像中该面单信息所在的图像区域。
另外,由于在通常情况下,目标面单图像中的图形码可能与参考面单图像中的图形码方向不一致,也即是,目标面单图像中的图形码与参考面单图像中的图形码之间存在方向偏差。因此,为了提高获取目标面单图形中面单信息所在图像区域的准确性,图像采集设备还可以确定该第一最小外接图形的方向。具体地,该图像采集设备可以基于目标面单图像的图形码信息,确定第四最小外接图形的方向,并确定第二最小外接图形的方向与第四最小外接图形的方向之间的方向偏差,然后基于第三最小外接图形的方向和方向偏差确定第一最小外接图形的方向。之后,图形采集设备可以将第一最小外接图形的尺寸、方向和预设点位置在该目标面单图像中所指示的区域确定为该目标面单图像中该面单信息所在的图像区域。
509、构建初始训练模型的初始骨干网络;
本实施例中,使用深度可分离的卷积来构建轻量级的深层神经网络,可用于分类、目标检测和语义分割,具有反向残差结构,并且使用轻量级深度卷积过滤中间扩展层的特征。
进一步地,服务器可在神经网络框架tensorflow或者pytorch上搭建初始训练模型的初始骨干网络,并将初始骨干网络替换为轻量化网络结构mobilenet-v2,mobilenet-v2的网络模块为中间大两头小的结构。
可选的,在基于轻量化网络结构mobilenet-v2构建待训练模型的初始骨干网络之前,服务器获取初始样本图像数据,并对初始样本图像数据进行图像预处理,得到目标样本图像数据,例如,图像尺度变换、图像色彩或者饱和度调整,具体此处不做限定;服务器对目标样本图像数据按照预设比例进行划分,得到预设训练样本数据和预设测试样本数据,例如,服务器获取目标样本图像数据的数量为3000张,预设比例为3:1,则服务器获取预设训练样本数据的数量为2250张,预设测试样本数据的数量为750张;服务器对预设训练样本数据进行文字方框标注处理,得到历史面单标注数据,并存储历史面单标注数据。
510、获取预设训练样本数据和历史面单标注数据,通过待训练模型对预设训练样本数据进行特征提取,得到多个尺寸的文字特征图像信息;
本实施例中,采用待训练模型中的目标骨干网络对预设训练样本数据进行特征提取,得到初始特征图,然后,服务器采用待训练模型中的特征金字塔网络FPN对初始特征图进行特征分割,得到多个尺寸的文字特征图像信息,并将每个文字特征图像信息设置为n个核kernel,n个kernel为已按照不同尺度从小到大的顺序进行排列的卷积核。
需要说明的是,服务器在进行语义分割操作时,服务器通常对多个block的特征图进行融合,或者对block4进行空间池化金字塔的操作,以获取具有有丰富上下文信息和丰富语义信息的初始特征图,服务器对初始特征图进行激励函数softmax与上采样操作,得到多个尺寸的文字特征图像信息。其中,预设训练样本数据对应多个不同尺度的核kernel,每个kernel均与原始的整个文本实例共享相似的形状,并且它们都位于相同的中心点上,但是尺度比例不相同。
511、提取训练样本数据中的历史面单标注数据,并采用预设裁剪算法对历史面单标注数据进行分割,得到预设数量个切片信息;
本实施例中,在进行监督学习训练中,预设训练样本数据均是有标注的,可以以(x,t)的形式出现,其中,x是输入数据,t是标注信息,其中正确的标注信息t是真实值groundtruth。因为待训练模型输出有多个尺寸的文字特征图像信息,所以对于同一预设训练样本数据,groundtruth也要有相同的数量。例如,将预设训练样本数据中标定的文本框进行不同尺度的缩小得到n个切片信息。
进一步地,服务器可从预设训练样本数据中提取真实面单标注信息,并将真实面单标注信息设置为groundtruth;服务器采用预设裁剪算法对groundtruth进行随机分割,得到n个切片信息,其中,真实面单标注信息用于指示按照二维坐标形式正确标注的快递面单文本框信息。n个切片信息与n个kernel相对应,并且数量相等。其中,预设裁剪算法可以采用瓦蒂vatti裁剪算法,该裁剪算法采用可裁剪任意数量任意形状的剪辑多边形。预设裁剪算法还可以采用其他算法,具体此处不做限定。例如,服务器采用vatti裁剪算法将原始多边形的一个分割结果缩小预设数量的像素,最终得到的n个切片信息,该n个切片信息具有不同尺度,每个切片信息均可转换成一个0或1的二进制掩码。
512、根据文字特征图像信息和预设数量个切片信息对初始训练模型的初始骨干网络进行训练,得到面单信息识别模型;
本实施例中,由于待训练模型中的参数数据是由(x,y)的形式出现的。其中x为待训练模型的输入数据,y为待训练模型预测的值(n个kernel)。服务器会将标注信息(n个切片信息)和待训练模型预测的值(n个kernel)进行比较,也就是,服务器在损失函数中将y和t进行比较,从而计算损失(损失函数),直到损失降低到预置阈值时,得到面单信息识别模型。需要说明的是,当预测的值与实际值相等时,损失为0,当预测的值与实际值不相等时,损失为1。
可选的,服务器设置n个切片信息为Gi,其中,i的取值范围为大于或者等于1,并且小于或者等于n的整数;服务器设置n个kernel为Si,其中,i的取值范围为大于或者等于1,并且小于或者等于n的整数;服务器按照Gi、Si和预设系数公式计算骰子dice相似性系数D,预设系数公式为:其中,Sx,y为kernel中像素点x,y的值,Gx,y为切片信息中像素点x,y的值;服务器采用dice相似性系数D、Gi和Si计算损失函数L;按照预设迭代次数、损失函数L和预设阈值对待训练模型进行模型训练,得到面单信息识别模型。
可选的,服务器获取预设迭代次数和预设阈值;服务器判断损失函数L是否小于或者等于预设阈值;若损失函数L小于或者等于预设阈值,则服务器将损失函数L对应的待训练模型中的卷积网络设置为训练后的卷积网络,得到面单信息识别模型;若损失函数L大于预设阈值,则服务器采用梯度下降法对待训练模型中的卷积层参数进行更新与迭代训练,直到损失函数L小于或者等于预设阈值,或者实际迭代次数达到预设迭代次数时,得到面单信息识别模型。其中,预设迭代次数为正整数,实际迭代次数的初始值为0,模型迭代训练一次,实际迭代次数增加1,直到实际迭代数据小于或者等于预设迭代次数时,停止迭代训练。
513、将图像区域输入预设面单信息识别模型进行识别,得到目标图形码对应目标面单图像的面单信息。
本实施例中,参考面单图像中的面单结构信息可以事先设置,因此,当用户获取需要的面单信息时,可以有针对的选择参考面单图像中的面单结构信息,从而确定的图像区域为用户需要的面单信息所在的图像区域,在对该图像区域进行识别处理时能够有针对地选择识别方式,以得到面单信息,从而提高获取面单图像的准确度和效率。
比如,当确定的图像区域为收件人电话号码所在区域时,可以通过字符识别技术进行识别处理,当确定的图像区域为快递公司的商标信息时,可以通过标识识别技术进行识别处理。
进一步地,当图像采集设备对确定的图像区域进行识别处理,得到面单信息之后,如果该面单信息中包括图形码的编号,则可以对该目标面单图像中的图形码进行识别,得到字符信息;当该字符信息与该图形码的编号相同时,确定该目标面单图像中该面单信息识别正确。
当然,在实际应用中,图像采集设备在获取面单信息后,还可以根据获取的面单信息进行不同的处理,比如,当获取的面单信息为收件人电话号码时,可以给收件人打电话,或者发送语音信息,或者发送文本信息,以通知收件人处理当前面单对应的商品或包裹。或者,当该图像采集设备获取到面单信息后,可以将识别的面单信息进行存储。
本实施例中步骤501-505第一实施例中的步骤101-105类似,此处不再赘述。
本发明实施例中,通过对获取的源数据表进行字段提取,得到源数据表中的字段;对字段进行清洗,得到源数据表中的目标字段数据;在检测到数据汇聚请求时,获取数据汇聚请求对应的导入文件,并根据导入文件和目标字段数据生成目标主表;接收快递单号生成请求,并从快递单号生成请求中获取快递基本数据;调用预设物流公司开放平台的下单接口,根据目标主表和快递基本数据进行取号,生成目标快递单号;根据目标快递单号,生成与目标快递单号对应的目标图形码,并将目标图形码输入预设面单信息识别模型进行识别,得到目标图形码对应目标面单图像的面单信息。本发明通过数据汇聚实现多平台或者多承运商取号,并获取电子面单的面单信息,解决了客户方需要对接多方平台面单取号接口的技术问题,提高了取号效率。
上面对本发明实施例中电子面单汇聚取号方法进行了描述,下面对本发明实施例中电子面单汇聚取号装置进行描述,请参阅图6,本发明实施例中电子面单汇聚取号装置的第一个实施例包括:
字段提取模块601,用于获取源数据表,并对所述源数据表进行字段提取,得到所述源数据表中的字段;
清洗模块602,用于对所述字段进行清洗,得到所述源数据表中的目标字段数据;
第一生成模块603,用于在检测到数据汇聚请求时,获取所述数据汇聚请求对应的导入文件,并根据所述导入文件和所述目标字段数据生成目标主表;
接收模块604,用于接收快递单号生成请求,并从所述快递单号生成请求中获取快递基本数据;
取号模块605,用于调用预设物流公司开放平台的下单接口,根据所述目标主表和所述快递基本数据进行取号,生成目标快递单号;
识别模块606,用于根据所述目标快递单号,生成与所述目标快递单号对应的目标图形码,并将所述目标图形码输入预设面单信息识别模型进行识别,得到所述目标图形码对应目标面单图像的面单信息。
本发明实施例中,通过对获取的源数据表进行字段提取,得到源数据表中的字段;对字段进行清洗,得到源数据表中的目标字段数据;在检测到数据汇聚请求时,获取数据汇聚请求对应的导入文件,并根据导入文件和目标字段数据生成目标主表;接收快递单号生成请求,并从快递单号生成请求中获取快递基本数据;调用预设物流公司开放平台的下单接口,根据目标主表和快递基本数据进行取号,生成目标快递单号;根据目标快递单号,生成与目标快递单号对应的目标图形码,并将目标图形码输入预设面单信息识别模型进行识别,得到目标图形码对应目标面单图像的面单信息。本发明通过数据汇聚实现多平台或者多承运商取号,并获取电子面单的面单信息,解决了客户方需要对接多方平台面单取号接口的技术问题,提高了取号效率。
请参阅图7,本发明实施例中电子面单汇聚取号装置的第二个实施例,该电子面单汇聚取号装置具体包括:
字段提取模块601,用于获取源数据表,并对所述源数据表进行字段提取,得到所述源数据表中的字段;
清洗模块602,用于对所述字段进行清洗,得到所述源数据表中的目标字段数据;
第一生成模块603,用于在检测到数据汇聚请求时,获取所述数据汇聚请求对应的导入文件,并根据所述导入文件和所述目标字段数据生成目标主表;
接收模块604,用于接收快递单号生成请求,并从所述快递单号生成请求中获取快递基本数据;
取号模块605,用于调用预设物流公司开放平台的下单接口,根据所述目标主表和所述快递基本数据进行取号,生成目标快递单号。
在本实施例中,所述第一生成模块603具体用于:
在检测到数据汇聚请求时,获取该数据汇聚请求对应的导入文件;
当所述导入文件不符合预设格式时,根据预设规则导入所述导入文件,得到目标文件;
根据所述目标文件和所述目标字段数据生成目标主表。
在本实施例中,所述接收模块604具体用于:
当检测到有快递单号生成请求时,提取所述快递单号生成请求中的请求参数;
校验所述请求参数中的数据类型是否符合预设存储规则;
当所述请求参数中的数据类型符合预设存储规则时,将所述请求参数作为关键词检索预设物流信息数据库,得到快递基本数据。
在本实施例中,所述取号模块605包括:
生成单元6051,用于调用预设物流公司开放平台的下单接口,根据所述快递基本信息和所述目标主表,生成多段快递单号编码,其中,所述快递单号编码包括快递公司代号编码段、发件方地址编码段、收件方地址编码段、邮编版本编码段;
拼接单元6052,用于将所述多段快递单号编码进行拼接,得到目标快递单号。
在本实施例中,所述电子面单汇聚取号装置还包括:
查找单元6053,用于当下单失败或者获取对应的运单号失败时,查找是否存在与当前运单类型对应的已存储运单号;若存在与当前运单类型对应的已存储运单号,将所述已存储运单号返回给所述派单终端。
在本实施例中,所述电子面单汇聚取号装置还包括:
第二生成模块606,用于根据所述目标快递单号,生成与所述目标快递单号对应的目标图形码;
确定模块607,用于确定与所述目标图形码确定对应的面单图像,并获取所述面单图像的面单结构数据;基于所述目标图形码和所述面单结构数据,确定所述面单图像中面单信息所在的图像区域;
识别模块608,用于将所述图像区域输入预设面单信息识别模型进行识别,得到所述目标图形码对应目标面单图像的面单信息。
在本实施例中,所述电子面单汇聚取号装置还包括:
构建模块609,用于构建初始训练模型的初始骨干网络;
特征提取模块610,用于获取预设训练样本数据和历史面单标注数据,通过所述待训练模型对所述预设训练样本数据进行特征提取,得到多个尺寸的文字特征图像信息;
分割模块611,用于提取所述训练样本数据中的历史面单标注数据,并采用预设裁剪算法对所述历史面单标注数据进行分割,得到预设数量个切片信息;
训练模块612,用于根据所述文字特征图像信息和所述预设数量个切片信息对所述初始训练模型的初始骨干网络进行训练,得到面单信息识别模型。
本发明实施例中,通过对获取的源数据表进行字段提取,得到源数据表中的字段;对字段进行清洗,得到源数据表中的目标字段数据;在检测到数据汇聚请求时,获取数据汇聚请求对应的导入文件,并根据导入文件和目标字段数据生成目标主表;接收快递单号生成请求,并从快递单号生成请求中获取快递基本数据;调用预设物流公司开放平台的下单接口,根据目标主表和快递基本数据进行取号,生成目标快递单号;根据目标快递单号,生成与目标快递单号对应的目标图形码,并将目标图形码输入预设面单信息识别模型进行识别,得到目标图形码对应目标面单图像的面单信息。本发明通过数据汇聚实现多平台或者多承运商取号,并获取电子面单的面单信息,解决了客户方需要对接多方平台面单取号接口的技术问题,提高了取号效率。
上面图6和图7从模块化功能实体的角度对本发明实施例中的电子面单汇聚取号装置进行详细描述,下面从硬件处理的角度对本发明实施例中电子面单汇聚取号设备进行详细描述。
图8是本发明实施例提供的电子面单汇聚取号设备的结构示意图,该电子面单汇聚取号设备800可因配置或性能不同而产生比较大的差异,可以包括一个或一个以上处理器(central processing units,CPU)810(例如,一个或一个以上处理器)和存储器820,一个或一个以上存储应用程序833或数据832的存储介质830(例如一个或一个以上海量存储设备)。其中,存储器820和存储介质830可以是短暂存储或持久存储。存储在存储介质830的程序可以包括一个或一个以上模块(图示没标出),每个模块可以包括对电子面单汇聚取号设备800中的一系列指令操作。更进一步地,处理器810可以设置为与存储介质830通信,在电子面单汇聚取号设备800上执行存储介质830中的一系列指令操作,以实现上述各方法实施例提供的电子面单汇聚取号方法的步骤。
电子面单汇聚取号设备800还可以包括一个或一个以上电源840,一个或一个以上有线或无线网络接口850,一个或一个以上输入输出接口860,和/或,一个或一个以上操作系统831,例如Windows Serve,Mac OS X,Unix,Linux,FreeBSD等等。本领域技术人员可以理解,图8示出的电子面单汇聚取号设备结构并不构成对本申请提供的电子面单汇聚取号设备的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置。
本发明还提供一种计算机可读存储介质,该计算机可读存储介质可以为非易失性计算机可读存储介质,该计算机可读存储介质也可以为易失性计算机可读存储介质,所述计算机可读存储介质中存储有指令,当所述指令在计算机上运行时,使得计算机执行上述电子面单汇聚取号方法的步骤。
所述领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的系统,装置和单元的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(read-only memory,ROM)、随机存取存储器(random access memory,RAM)、磁碟或者光盘等各种可以存储程序代码的介质。
以上所述,以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。

Claims (10)

1.一种电子面单汇聚取号方法,其特征在于,所述电子面单汇聚取号方法包括:
获取源数据表,并对所述源数据表进行字段提取,得到所述源数据表中的字段;
对所述字段进行清洗,得到所述源数据表中的目标字段数据;
在检测到数据汇聚请求时,获取所述数据汇聚请求对应的导入文件,并根据所述导入文件和所述目标字段数据生成目标主表;
接收快递单号生成请求,并从所述快递单号生成请求中获取快递基本数据;
调用预设物流公司开放平台的下单接口,根据所述目标主表和所述快递基本数据进行取号,生成目标快递单号。
2.根据权利要求1所述的电子面单汇聚取号方法,其特征在于,所述在检测到数据汇聚请求时,获取所述数据汇聚请求对应的导入文件,并根据所述导入文件和所述目标字段数据生成目标主表包括:
在检测到数据汇聚请求时,获取该数据汇聚请求对应的导入文件;
当所述导入文件不符合预设格式时,根据预设规则导入所述导入文件,得到目标文件;
根据所述目标文件和所述目标字段数据生成目标主表。
3.根据权利要求2所述的电子面单汇聚取号方法,其特征在于,所述接收快递单号生成请求,并从所述快递单号生成请求中获取快递基本数据包括:
当检测到有快递单号生成请求时,提取所述快递单号生成请求中的请求参数;
校验所述请求参数中的数据类型是否符合预设存储规则;
当所述请求参数中的数据类型符合预设存储规则时,将所述请求参数作为关键词检索预设物流信息数据库,得到快递基本数据。
4.根据权利要求1所述的电子面单汇聚取号方法,其特征在于,所述调用预设物流公司开放平台的下单接口,根据所述目标主表和所述快递基本数据进行取号,生成目标快递单号包括:
调用预设物流公司开放平台的下单接口,根据所述快递基本信息和所述目标主表,生成多段快递单号编码,其中,所述快递单号编码包括快递公司代号编码段、发件方地址编码段、收件方地址编码段、邮编版本编码段;
将所述多段快递单号编码进行拼接,得到目标快递单号。
5.根据权利要求4所述的电子面单汇聚取号方法,其特征在于,在所述将所述多段快递单号编码进行拼接,得到目标快递单号之后,还包括:
当下单失败或者获取对应的运单号失败时,查找是否存在与当前运单类型对应的已存储运单号;
若存在与当前运单类型对应的已存储运单号,将所述已存储运单号返回给所述派单终端。
6.根据权利要求1所述的电子面单汇聚取号方法,其特征在于,在所述调用预设物流公司开放平台的下单接口,根据所述目标主表和所述快递基本数据进行取号,生成目标快递单号之后,还包括:
根据所述目标快递单号,生成与所述目标快递单号对应的目标图形码;
确定与所述目标图形码确定对应的面单图像,并获取所述面单图像的面单结构数据;
基于所述目标图形码和所述面单结构数据,确定所述面单图像中面单信息所在的图像区域;
将所述图像区域输入预设面单信息识别模型进行识别,得到所述目标图形码对应目标面单图像的面单信息。
7.根据权利要求6所述的电子面单汇聚取号方法,其特征在于,在所述将所述图像区域输入预设面单信息识别模型进行识别,得到所述目标图形码对应目标面单图像的面单信息之前,还包括:
构建初始训练模型的初始骨干网络;
获取预设训练样本数据和历史面单标注数据,通过所述待训练模型对所述预设训练样本数据进行特征提取,得到多个尺寸的文字特征图像信息;
提取所述训练样本数据中的历史面单标注数据,并采用预设裁剪算法对所述历史面单标注数据进行分割,得到预设数量个切片信息;
根据所述文字特征图像信息和所述预设数量个切片信息对所述初始训练模型的初始骨干网络进行训练,得到面单信息识别模型。
8.一种电子面单汇聚取号装置,其特征在于,所述电子面单汇聚取号装置包括:
字段提取模块,用于获取源数据表,并对所述源数据表进行字段提取,得到所述源数据表中的字段;
清洗模块,用于对所述字段进行清洗,得到所述源数据表中的目标字段数据;
第一生成模块,用于在检测到数据汇聚请求时,获取所述数据汇聚请求对应的导入文件,并根据所述导入文件和所述目标字段数据生成目标主表;
接收模块,用于接收快递单号生成请求,并从所述快递单号生成请求中获取快递基本数据;
取号模块,用于调用预设物流公司开放平台的下单接口,根据所述目标主表和所述快递基本数据进行取号,生成目标快递单号。
9.一种电子面单汇聚取号设备,其特征在于,所述电子面单汇聚取号设备包括:存储器和至少一个处理器,所述存储器中存储有指令,所述存储器和所述至少一个处理器通过线路互连;
所述至少一个处理器调用所述存储器中的所述指令,以使得所述电子面单汇聚取号设备执行如权利要求1-7中任一项所述的电子面单汇聚取号方法的步骤。
10.一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1-7中任一项所述的电子面单汇聚取号方法的步骤。
CN202111444857.9A 2021-11-30 2021-11-30 电子面单汇聚取号方法、装置、设备及存储介质 Pending CN114169301A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202111444857.9A CN114169301A (zh) 2021-11-30 2021-11-30 电子面单汇聚取号方法、装置、设备及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202111444857.9A CN114169301A (zh) 2021-11-30 2021-11-30 电子面单汇聚取号方法、装置、设备及存储介质

Publications (1)

Publication Number Publication Date
CN114169301A true CN114169301A (zh) 2022-03-11

Family

ID=80481776

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202111444857.9A Pending CN114169301A (zh) 2021-11-30 2021-11-30 电子面单汇聚取号方法、装置、设备及存储介质

Country Status (1)

Country Link
CN (1) CN114169301A (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115965900A (zh) * 2023-03-09 2023-04-14 杭州也得智能有限公司 一种快件识别搜寻系统及方法
CN117520421A (zh) * 2023-11-08 2024-02-06 国家邮政局邮政业安全中心 快递的分拣方法、装置、电子设备以及存储介质
CN117910907A (zh) * 2024-03-20 2024-04-19 中外运创新科技有限公司 一种快递单安全接入系统

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115965900A (zh) * 2023-03-09 2023-04-14 杭州也得智能有限公司 一种快件识别搜寻系统及方法
CN117520421A (zh) * 2023-11-08 2024-02-06 国家邮政局邮政业安全中心 快递的分拣方法、装置、电子设备以及存储介质
CN117910907A (zh) * 2024-03-20 2024-04-19 中外运创新科技有限公司 一种快递单安全接入系统
CN117910907B (zh) * 2024-03-20 2024-05-31 中外运创新科技有限公司 一种快递单安全接入系统

Similar Documents

Publication Publication Date Title
CN114169301A (zh) 电子面单汇聚取号方法、装置、设备及存储介质
US10402163B2 (en) Intelligent data extraction
US11243990B2 (en) Dynamic document clustering and keyword extraction
CN104881770A (zh) 一种快递单信息识别系统和方法
CN112613917A (zh) 基于用户画像的信息推送方法、装置、设备及存储介质
CN113837151B (zh) 表格图像处理方法、装置、计算机设备及可读存储介质
CN108363943A (zh) 基于智能化识别技术的通关机器人
CN112580108B (zh) 签名和印章完整性验证方法及计算机设备
US11023720B1 (en) Document parsing using multistage machine learning
JP2019204535A (ja) 会計支援システム
CN106682022A (zh) 一种日志查询方法和装置
CN113191121B (zh) 快递单号生成方法、装置、设备及存储介质
CN115221453B (zh) 媒体资源管理方法、装置、服务器、介质
CN111061779A (zh) 一种基于大数据平台的数据处理方法及装置
CN111047261A (zh) 一种仓储物流委托单识别方法及系统
CN116485413A (zh) 基于区块链的物流信息检索与风险度评测方法
CN115114073A (zh) 告警信息的处理方法及装置、存储介质、电子设备
CN109919811B (zh) 基于大数据的保险代理人培养方案生成方法及相关设备
CN117171158B (zh) 一种基于数字凭证的业务处理系统和方法
CN109800433A (zh) 基于邮件二分类模型的建档方法、装置、电子设备及介质
CN113806600B (zh) 业务数据的家庭关系网络构建方法、装置、设备及介质
CN114663903B (zh) 文本资料的分类方法、装置、设备及存储介质
CN118246830A (zh) 购物平台收件地址校验方法、装置、设备及存储介质
CN116304457B (zh) 一种网页多重信息属性的标记方法
CN115456514A (zh) 物流异常预警方法、装置、设备及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination