CN111475491A - 一种物流数据整合处理方法和装置 - Google Patents

一种物流数据整合处理方法和装置 Download PDF

Info

Publication number
CN111475491A
CN111475491A CN202010398945.9A CN202010398945A CN111475491A CN 111475491 A CN111475491 A CN 111475491A CN 202010398945 A CN202010398945 A CN 202010398945A CN 111475491 A CN111475491 A CN 111475491A
Authority
CN
China
Prior art keywords
information
logistics
field
address
user
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202010398945.9A
Other languages
English (en)
Inventor
刘旺
王志海
喻波
安鹏
王志华
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Wondersoft Technology Co Ltd
Original Assignee
Beijing Wondersoft Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Wondersoft Technology Co Ltd filed Critical Beijing Wondersoft Technology Co Ltd
Priority to CN202010398945.9A priority Critical patent/CN111475491A/zh
Publication of CN111475491A publication Critical patent/CN111475491A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/21Design, administration or maintenance of databases
    • G06F16/211Schema design and management
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/08Logistics, e.g. warehousing, loading or distribution; Inventory or stock management
    • G06Q10/083Shipping
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/20Image preprocessing
    • G06V10/22Image preprocessing by selection of a specific region containing or referencing a pattern; Locating or processing of specific regions to guide the detection or recognition
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/14Image acquisition
    • G06V30/148Segmentation of character regions
    • G06V30/153Segmentation of character regions using recognition of characters or words

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Physics & Mathematics (AREA)
  • Business, Economics & Management (AREA)
  • Economics (AREA)
  • Multimedia (AREA)
  • Databases & Information Systems (AREA)
  • Human Resources & Organizations (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Development Economics (AREA)
  • Marketing (AREA)
  • Operations Research (AREA)
  • Quality & Reliability (AREA)
  • Strategic Management (AREA)
  • Tourism & Hospitality (AREA)
  • General Business, Economics & Management (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Data Mining & Analysis (AREA)
  • General Engineering & Computer Science (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明提供了一种物流数据整合处理方法和装置,涉及到物流数据处理技术领域。方法包括:获取物流数据,确定物流数据所属的物流服务提供方;依据物流服务提供方确定对应的转换规则,按照转换规则对物流数据进行转换,得到对应的目标物流数据;从目标物流数据中获取各字段的字段信息,按照字段对应的类型,对字段信息进行分析,确定对应的物流信息记录并进行存储。此方案不需要各物流服务提供方信息共享时改变自身的数据格式,且能够便捷的整合从各物流服务提供方获取的物流数据,便于提供给监管部门或其他服务方使用。

Description

一种物流数据整合处理方法和装置
技术领域
本发明涉及物流数据处理技术领域,特别是涉及一种物流数据整合处理方法和装置。
背景技术
现如今,物流(也包括快递方式)的存在为人们的日常生活带来了极大的便利,促进了国家市场经济的发展,另外,物流数据存在着很大的价值,通过物流数据能够反映出一个地区的市场消费情况,从侧面反映人民的生活水平,为政府制定方案,提供一些参考。
但是,与此同时也存在着不法分子利用物流的方式进行违法犯罪活动,因此需要通过物流信息找到相关嫌疑信息,但市场上物流公司众多,每家都有自己的数据结构,并且存在各种信息不标准情况,不方便监管部门进行统一管理。
发明内容
鉴于上述问题,提出了本发明以便提供一种克服上述问题或者至少部分地解决上述问题的一种物流数据整合处理方法和装置。
依据本发明的第一方面,提供了一种物流数据整合处理方法,所述方法包括:
获取物流数据,确定所述物流数据所属的物流服务提供方;
依据所述物流服务提供方确定对应的转换规则,按照所述转换规则对所述物流数据进行转换,得到对应的目标物流数据;
从所述目标物流数据中获取各字段的字段信息,其中,所述字段的类型至少包括以下两种:地址字段、用户字段;
按照所述字段对应的类型,对所述字段信息进行分析,确定对应的物流信息记录并进行存储。
依据本发明的第二方面,提供了一种物流数据整合处理装置,该装置包括:
数据采集模块,用于获取物流数据,确定所述物流数据所属的物流服务提供方;
数据转换模块,用于依据所述物流服务提供方确定对应的转换规则,按照所述转换规则对所述物流数据进行转换,得到对应的目标物流数据;
数据提取模块,用于从所述目标物流数据中获取各字段的字段信息,其中,所述字段的类型至少包括以下两种:地址字段、用户字段;
数据分析模块,用于按照所述字段对应的类型,对所述字段信息进行分析,确定对应的物流信息记录并进行存储。
本发明方案中,将从各物流服务提供方获取到的物流数据进行了格式上的转换,基于此得到目标物流数据。并在此基础上获取不同字段的字段信息,按照字段的类型分别进行信息提取,从而,基于不同的物流服务提供方,使得相同类型字段对应的字段信息的内容格式统一化,将统一格式的字段信息,作为物流信息记录进行存储。这样就不需要各物流服务提供方信息共享时改变自身的数据格式,且能够便捷的整合从各物流服务提供方获取的物流数据,便于提供给监管部门或其他服务方使用。
上述说明仅是本发明技术方案的概述,为了能够更清楚了解本发明的技术手段,而可依照说明书的内容予以实施,并且为了让本发明的上述和其它目的、特征和优点能够更明显易懂,以下特举本发明的具体实施方式。
附图说明
通过阅读下文优选实施方式的详细描述,各种其他的优点和益处对于本领域普通技术人员将变得清楚明了。附图仅用于示出优选实施方式的目的,而并不认为是对本发明的限制。而且在整个附图中,用相同的参考符号表示相同的部件。
在附图中:
图1是本发明实施例提供的一种物流数据整合处理方法的步骤流程图;
图2是本发明实施例提供的另一种物流数据整合处理方法的步骤流程图;
图3是本发明实施例提供的确定目标地址信息的方法步骤流程图;
图4是本发明实施例提供的确定目标用户信息的方法步骤流程图;
图5是本发明实施例提供的确定物流信息记录并存储的方法步骤流程图;
图6是本发明实施例提供的一种物流数据整合处理装置的框图。
具体实施方式
下面将参照附图更详细地描述本发明的示例性实施例。虽然附图中显示了本发明的示例性实施例,然而应当理解,可以以各种形式实现本发明而不应被这里阐述的实施例所限制。相反,提供这些实施例是为了能够更透彻地理解本发明,并且能够将本发明的范围完整的传达给本领域的技术人员。
参照图1,示出了本发明实施例的一种物流数据整合处理方法的步骤流程图,如图1所示,所述方法可以包括:
步骤101、获取物流数据,确定所述物流数据所属的物流服务提供方。
本发明实施例中,可以通过与各物流服务提供方建立物流信息的共享方式,从物流服务提供方的服务器获取物流数据。因此,针对所获取的物流数据,可以确定其所属的物流服务提供方。
其中,物流服务提供方指的是提供物流服务的处理方,如物流公司、快递公司等。由于不同物流服务提供方的物流数据具有不同的格式等,因此要确定出物流数据所属的物流服务提供方,以便针对不同物流服务提供方的物流数据执行相应的处理。
步骤102、依据所述物流服务提供方确定对应的转换规则,按照所述转换规则对所述物流数据进行转换,得到对应的目标物流数据。
本发明实施例中,由于不同物流服务提供方的物流数据往往对应不同的格式等内容,但基本包含寄件人和收件人姓名、联系信息、寄件地址、单位、物品名称、时间等关键信息。为了便于对不同物流服务提供方的数据进行分析以及存储,可以设置物流数据的指定格式,例如在指定格式中可以规定物流数据所包含的字段类型、数量以及各类型字段的顺序等,例如地址字段、用户字段、联系方式字段等等,其顺序可以依次是用户字段、联系方式字段、地址字段等等。
相应可以解析各物流服务提供方对应物流数据的格式等信息,并依据指定格式,生成该物流服务提供方的物流数据和指定格式的物流数据的转换规则,使得各物流服务提供方的物流数据可依据相应的转换规则转换为指定格式的物流数据。因此在得到物流数据后,根据该物流数据所属的物流服务提供方,可以确定该物流服务提供方对应的转换规则,然后按照该转换规则对该物流数据进行转换,得到指定格式的物流数据,作为目标物流数据。从而,针对各个物流服务提供方处所获取的物流数据,可以转换为指定格式的目标物流数据,便于后续处理。
步骤103、从所述目标物流数据中获取各字段的字段信息,其中,所述字段的类型至少包括以下两种:地址字段、用户字段。
本发明实施例中,可以对指定格式的目标物流数据进行分析,确定目标物流数据所包含的字段,从各字段中提取相应的字段信息。其中,所述字段的类型至少包括以下两种:地址字段、用户字段,所述地址字段用于存储地址信息,如邮寄地址等,所述用户字段用于存储用户信息,如用户名、姓名、联系信息等,从而能够确定出各用户的地址和联系信息,便于管理物流数据。
步骤104、按照所述字段对应的类型,对所述字段信息进行分析,确定对应的物流信息记录并进行存储。
本发明实施例中,可以分别对地址字段、用户字段进行字段信息的分析,并按照一定的约束条件进行处理,得到相应的信息内容。例如地址字段的约束条件为字段内容为代码、中文字符等,基于地址字段对应的约束条件处理地址字段,得到相应的地址信息。例如用户字段的约束条件为字段内容为数字、字母、中文字符、其他字符中的一种或多种类型等。基于用户字段对应的约束条件处理用户字段,得到相应的用户信息。根据处理后的地址信息、用户信息,可以生成一条物流记录,将该物流记录作为物流信息记录,并传送至数据存储介质或是数据存储服务器中存储。根据不同物流服务提供方的物流数据,相应提取到的同一字段中的信息内容具有不同的格式等,因此通过约束条件对各字段对应的字段信息进行处理,从而根据处理得到的相应字段信息生成统一格式的物流记录,将将各物流记录作为物流信息记录管理存储,便于管理物流数据。
综上所述,将从各物流服务提供方获取到的物流数据进行了格式上的转换,基于此得到目标物流数据。并在此基础上获取不同字段的字段信息,按照字段的类型分别对字段信息进行分析,从而,基于不同的物流服务提供方,使得同一类型字段对应的字段信息的内容格式统一化,并将相应的字段信息,作为物流信息记录进行存储。这样就不需要各物流服务提供方信息共享时改变自身的数据格式,且能够便捷的整合从各物流服务提供方获取的物流数据,便于提供给监管部门或其他服务方使用。
参照图2,示出了本发明实施例提供的另一种物流数据整合处理方法的步骤流程图,如图2所示,所述方法可以包括:
步骤201、获取物流数据,确定所述物流数据所属的物流服务提供方。
本发明实施例中,可以通过与各物流服务提供方建立物流信息的共享方式,从物流服务提供方的服务器获取物流数据。因此,针对所获取的物流数据,可以确定其所属的物流服务提供方。
其中,物流服务提供方指的是提供物流服务的处理方,如物流公司、快递公司等。由于不同物流服务提供方的物流数据具有不同的格式等,因此要确定出物流数据所属的物流服务提供方,以便针对不同物流服务提供方的物流数据执行相应的处理。
步骤202、依据所述物流服务提供方确定对应的转换规则,按照所述转换规则对所述物流数据进行转换,得到对应的目标物流数据。
本发明实施例中,由于不同物流服务提供方的物流数据往往对应不同的格式等内容,为了便于对不同物流服务提供方的数据进行分析以及存储,可以设置物流数据的指定格式,例如在指定格式中可以规定物流数据所包含的字段类型、数量以及各类型字段的顺序等,例如地址字段、用户字段、联系方式字段等等,其顺序可以依次是用户字段、联系方式字段、地址字段等等。
相应可以解析各物流服务提供方对应物流数据的格式等信息,并依据指定格式,生成该物流服务提供方的物流数据和指定格式的物流数据的转换规则,使得各物流服务提供方的物流数据可依据相应的转换规则转换为指定格式的物流数据。因此在得到物流数据后,根据该物流数据所属的物流服务提供方,可以确定该物流服务提供方对应的转换规则,然后按照该转换规则对该物流数据进行转换,得到指定格式的物流数据,作为目标物流数据。从而,针对各个物流服务提供方处所获取的物流数据,可以转换为指定格式的目标物流数据,便于后续处理。
步骤203、从所述目标物流数据中获取各字段的字段信息,其中,所述字段的类型至少包括以下两种:地址字段、用户字段。
本发明实施例中,可以对指定格式的目标物流数据进行分析,确定目标物流数据所包含的字段,从各字段中提取相应的字段信息。其中,所述字段的类型至少包括以下两种:地址字段、用户字段,所述地址字段用于存储地址信息,如邮寄地址等,所述用户字段用于存储用户信息,如用户名、姓名、联系信息等,从而能够确定出各用户的地址和联系信息,便于管理物流数据。
按照所述字段对应的类型,对所述字段信息进行分析,确定对应的物流信息记录并进行存储,如以下步骤:204-206。
步骤204、对所述地址字段中的地址信息进行分析,确定对应的目标地址信息。
本发明实施例中,针对地址字段对应的地址信息,可以采用地址字段对应的约束条件进行信息的处理,例如地址字段对应的约束条件为字段内容为代码、中文字符等,基于地址字段对应的约束条件处理地址字段,得到相应的地址信息,将该地址信息作为目标地址信息。根据不同物流服务提供方的物流数据,相应提取到的地址字段的字段内容具有不同的格式等,通过约束条件对地址字段对应的地址信息进行处理,得到目标地址信息,便于统一各物流服务提供方的地址信息。
一般用户针对地址字段查询都会优先查询行政区域信息,再查询详细地址信息。基于查询需求,也可将地址字段拆分为存储行政区域信息的第一地址字段和存储详细地址信息的第二地址字段。
因此,一种可选地实施例,所述步骤204可以包括:
从所述地址字段的地址信息中提取行政区域信息,作为第一地址信息。
本发明实施例中,针对所述地址字段的地址信息,可以根据区划信息,匹配出该地址信息中与区划信息对应的行政区域信息,将该行政区域信息作为第一地址信息,并在第一地址字段中存储。
其中,行政区域信息指的是省市区(县)信息,可以是对应的区划代码或对应的行政区域文本。区划信息指的是区划代码、以及与区划代码对应的行政区域文本。区划代码也可以被称为行政代码,对应国家标准《中华人民共和国行政区划代码》(GB/T2260-2007)和《县以下行政区划代码编制规则》(GB/T10114-2003)。
参照图3,一种可选地实施例,从所述地址字段的地址信息中提取行政区域信息,作为第一地址信息,包括如下步骤:步骤S31-S34。
步骤S31、从所述地址字段的地址信息中提取行政区域信息。
本发明实施例中,针对所述地址字段的地址信息,可以根据区划信息,匹配出地址信息中与区划信息对应的地址信息,将匹配到的地址信息作为行政区域信息。区划信息指的是区划代码、以及与区划代码对应的行政区域文本。区划代码也可以被称为行政代码,对应国家标准《中华人民共和国行政区划代码》(GB/T2260-2007)和《县以下行政区划代码编制规则》(GB/T10114-2003)。
步骤S32、若所述行政区域信息为区划代码,则执行步骤S33。
步骤S33、将所述区划代码转换为行政区域文本。
本发明实施例中,可以对行政区域信息进行分析,并按照一定的约束条件,确定映射关系。例如依据约束条件确定行政区域信息为文字信息,则依据区划信息,可确定区划代码向行政区域文本转换的映射关系。因此,基于约束条件,将该区划代码匹配为相应的行政区域文本。
步骤S34、将所述行政区域文本作为第一地址信息。
本发明实施例中,将匹配到的行政区域文本作为第一地址信息,并在第一地址字段中存储。
步骤S35、从所述地址字段的地址信息中提取详细地址信息,作为第二地址信息。
本发明实施例中,针对地址字段的地址信息,提取不包含行政区域信息的其他地址信息内容,将提取到的地址信息作为详细地址信息,将该详细地址作为第二地址信息,并在第二地址字段中存储。
步骤S36、将所述第一地址信息和第二地址信息,确定为目标地址信息。
本发明实施例中,将得到的第一地址信息和第二地址信息,作为目标地址信息。其中,目标地址信息为“省市区(县)信息文本+详细地址信息文本”。由此,基于各物流服务提供方的物流数据,可以统一目标地址信息对应的内容格式,便于管理物流数据。
步骤205、对所述用户字段中的用户信息进行分析,确定对应的目标用户信息。
本发明实施例中,针对用户字段对应的用户信息,可以采用用户字段对应的约束条件进行信息的处理,例如用户字段对应的约束条件为字段内容为数字、字母、中文字符、其他字符中的一种或多种类型等。基于用户字段对应的约束条件处理用户字段,得到相应的用户信息,将该用户信息作为目标用户信息。根据不同物流服务提供方的物流数据,相应提取到的用户字段的字段内容具有不同的格式等,通过约束条件对用户字段对应的用户信息进行处理,生成目标地址信息。便于统一各物流服务提供方的用户信息。
本发明实施例中,针对用户字段对应的用户信息,可以采用用户字段对应的约束条件进行信息的处理,用户信息一般都包括用户名、联系信息等。基于各物流服务提供方获取到的用户名、联系信息中常常存在各种各样的格式,例如联系信息中可包含手机号码、座机号码等,且获取到的手机号码前面可能包含前缀,也可能不包含前缀,为了便于统一用户信息的格式,可以对用户信息匹配,实现标准化。由此,参照图4,一种可选地实施例,所述步骤205可以包括:
依据正则匹配规则对所述用户字段的用户信息进行匹配,确定对应的用户联系信息,包括如下步骤:步骤S41-S43。
步骤S41、采用约束条件来处理用户信息,确定用户信息对应的联系信息。
步骤S42、依据正则匹配规则解析联系信息,对该联系信息去除干扰项。
步骤S43、将提取到的联系信息,作为用户联系信息。
本发明实施例中,针对用户字段对应的用户信息,例如用户名、联系信息等,可以采用约束条件来处理用户信息,例如用户字段的约束条件为数字、连字符等,将用户字段对应的用户信息,根据该约束条件处理得到的用户信息,作为联系信息。由此,可以依据正则匹配规则解析联系信息,对该联系信息去除干扰项。
正则匹配规则指的是对字符串操作的一种逻辑公式,是用预设好的一些字符、及这些字符的组合,组成一个规则字符串,规则字符串指的是对字符串的一种过滤逻辑。联系信息的干扰项可以为手机号码的前缀等。基于干扰项对应的内容,可预设规则字符串“+86”,基于该规则字符串形成正则匹配规则。因此,根据该正则匹配规则提取联系信息,若检测到用户信息中包含该规则字符串,则跳过该规则字符串,继续提取用户信息中的其他信息,以此去除联系信息对应的干扰项,将提取到的联系信息,作为用户联系信息。
步骤S44、从所述用户字段的用户信息中提取用户名。
本发明实施例中,对用户字段对应的用户信息,例如用户名、联系信息等,可以采用约束条件来处理用户名,例如用户字段的约束条件为字段内容为中文字符、其他符号等,将用户字段对应的用户信息,根据该约束条件处理得到的用户信息,作为用户名。
步骤S45、将所述用户联系信息和用户名,确定对应的目标用户信息。
本发明实施例中,基于相应约束条件,将得到的用户联系信息和用户名,作为目标用户信息。
步骤206、依据所述目标地址信息和目标用户信息,确定物流信息记录并进行存储。
本发明实施例中,依据得到的目标地址信息、目标用户信息,可以生成一条物流记录,将该物流记录作为物流信息记录,且传送至数据存储介质或是数据存储服务器中存储。
一种可选地实施例,所述步骤206可以包括:
检测所述目标用户信息的完整度,确定对应的完整度标识,包括如下步骤:步骤S51-S57。
步骤S51、基于正则匹配规则,检测目标用户信息中对应的用户名、用户联系信息的完整度。
步骤S52、若用户名中匹配到对应的规则字符串,确定用户名信息完整,执行步骤S53;否则确定用户名信息缺失,执行步骤S54。
执行步骤S53、若在用户联系信息中匹配到到对应的规则字符串,确定用户联系信息完整,执行步骤S55;否则,确定用户联系信息缺失,执行步骤S56。
步骤S54、若用户联系信息中匹配到对应的规则字符串,确定用户联系信息完整,执行步骤S56;否则执行步骤S57。
步骤S55、采用表示信息完整的完整度标识,标记目标用户信息。
步骤S56、采用表示信息缺失的完整度标识,标记目标用户信息。
步骤S57、采用表示信息无效的完整度标识,标记目标用户信息。
本发明实施例中,可以基于正则匹配规则分别检测用户名和用户联系信息,来确定用户信息的完整度。匹配用户名时,预设的匹配用户名对应的规则字符串可以是全中文字符类型、预设的字符长度等。若该用户名信息中均能匹配到对应的规则字符串,则用户名信息完整;否则,该用户名信息缺失。匹配用户联系信息时,预设的匹配用户联系信息对应的规则字符串可以是预设的字符串长度、全数字类型等。若该用户联系信息中均能匹配到对应的规则字符串,则用户联系信息完整,否则,该用户联系信息缺失。
因此,可以根据用户名、用户联系信息的缺失或是完整,来确定目标用户信息的完整度,例如用户名和用户联系信息均完整,确定目标用户信息完整,采用完整度标识例如“完整信息”标记目标用户信息。用户名和用户联系信息均缺失,确定目标用户信息无效,采用完整度标识例如“无效信息”标记目标用户信息。否则确定目标用户信息缺失,采用完整度标识例如“缺失信息”标记目标用户信息。
步骤S58、将所述目标地址信息、目标用户信息和完整度标识,确定为物流信息记录。
本发明实施例中,可以基于目标地址信息、目标用户信息和完整度标识,生成一条物流记录,将该物流记录作为物流信息记录。
步骤S59、对所述物流信息记录进行存储。
本发明实施例中,将得到的物流信息记录传送至数据存储介质或是数据存储服务器中存储。由此根据不同物流服务提供方的物流数据,最后整合为格式统一以及带有分类标记的物流信息记录,便于物流数据的管理和查询,便于提供给监管部门或其他服务方使用。
综上所述,将从各物流服务提供方获取到的物流数据进行了格式上的转换,基于此得到目标物流数据。并在此基础上获取不同字段的字段信息,按照字段的类型分别进行信息提取,从而,基于不同的物流服务提供方,使得相同类型字段对应的字段信息的内容格式统一化,将统一格式的字段信息,根据相应的字段信息的完整度,添加完整度标识对相应的字段信息建立一个分类标记,基于对应字段信息、完整度标识,生成一条物流记录,将该物流记录作为物流信息记录进行存储。这样就不需要各物流服务提供方信息共享时改变自身的数据格式,在便捷的整合从各物流服务提供方获取的物流数据的同时,增加信息完整度的分类标记,有利于物流数据管理,且便于提供给监管部门或其他服务方使用。
参照图6,示出了本发明实施例提供的一种物流数据整合处理装置,如图3所示,所述装置可以包括:
数据采集模块601,用于获取物流数据,确定所述物流数据所属的物流服务提供方;
数据转换模块602,用于依据所述物流服务提供方确定对应的转换规则,按照所述转换规则对所述物流数据进行转换,得到对应的目标物流数据;
数据提取模块603,用于从所述目标物流数据中获取各字段的字段信息,其中,所述字段的类型至少包括以下两种:地址字段、用户字段;
数据分析模块604,用于按照所述字段对应的类型,对所述字段信息进行分析,确定对应的物流信息记录并进行存储。
一种可选地实施例,所述数据分析模块可以包括:
信息解析子模块,用于对所述地址字段中的地址信息进行分析,确定对应的目标地址信息;
对所述用户字段中的用户信息进行分析,确定对应的目标用户信息;
信息存储子模块,用于依据所述目标地址信息和目标用户信息,确定物流信息记录并进行存储。
一种可选地实施例,所述信息解析子模块包括:
地址提取单元,用于从所述地址字段的地址信息中提取行政区域信息,作为第一地址信息;
从所述地址字段的地址信息中提取详细地址信息,作为第二地址信息;
地址确定单元,用于将所述第一地址信息和第二地址信息,确定为目标地址信息。
一种可选地实施例,所述地址提取单元包括:
地址检测子单元,用于从所述地址字段的地址信息中提取行政区域信息;
若所述行政区域信息为区划代码,则将所述区划代码转换为行政区域文本;
将所述行政区域文本作为第一地址信息。
一种可选地实施例,所述信息解析子模块包括:
用户信息匹配单元,用于依据正则匹配规则对所述用户字段的用户信息进行匹配,确定对应的用户联系信息;
用户信息提取单元,用于从所述用户字段的用户信息中提取用户名;
将所述用户联系信息和用户名,确定对应的目标用户信息。
一种可选地实施例,所述信息存储子模块包括:
标识匹配单元,用于检测所述目标用户信息的完整度,确定对应的完整度标识;
将所述目标地址信息、目标用户信息和完整度标识,确定为物流信息记录;
对所述物流信息记录进行存储。
综上所述,将从各物流服务提供方获取到的物流数据进行了格式上的转换,基于此得到目标物流数据。并在此基础上获取不同字段的字段信息,按照字段的类型分别进行信息提取,从而,基于不同的物流服务提供方,使得相同类型字段对应的字段信息的内容格式统一化,将统一格式的字段信息,根据相应的字段信息的完整度,添加完整度标识对相应的字段信息建立一个分类标记,基于对应字段信息、完整度标识,生成一条物流记录,将该物流记录作为物流信息记录进行存储。这样就不需要各物流服务提供方信息共享时改变自身的数据格式,在便捷的整合从各物流服务提供方获取的物流数据的同时,增加信息完整度的分类标记,有利于物流数据管理,且便于提供给监管部门或其他服务方使用。
本说明书中的各个实施例均采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似的部分互相参见即可。
本领域技术人员易于想到的是:上述各个实施例的任意组合应用都是可行的,故上述各个实施例之间的任意组合都是本发明的实施方案,但是由于篇幅限制,本说明书在此就不一一详述了。
在此处所提供的说明书中,说明了大量具体细节。然而,能够理解,本发明的实施例可以在没有这些具体细节的情况下实践。在一些实例中,并未详细示出公知的方法、结构和技术,以便不模糊对本说明书的理解。
类似地,应当理解,为了精简本发明并帮助理解各个发明方面中的一个或多个,在上面对本发明的示例性实施例的描述中,本发明的各个特征有时被一起分组到单个实施例、图、或者对其的描述中。然而,并不应将该公开的方法解释成反映如下意图:即所要求保护的本发明要求比在每个权利要求中所明确记载的特征更多的特征。更确切地说,如权利要求书所反映的那样,发明方面在于少于前面公开的单个实施例的所有特征。因此,遵循具体实施方式的权利要求书由此明确地并入该具体实施方式,其中每个权利要求本身都作为本发明的单独实施例。
本领域那些技术人员可以理解,可以对实施例中的设备中的模块进行自适应性地改变并且把它们设置在与该实施例不同的一个或多个设备中。可以把实施例中的模块或单元或组件组合成一个模块或单元或组件,以及此外可以把它们分成多个子模块或子单元或子组件。除了这样的特征和/或过程或者单元中的至少一些是相互排斥之外,可以采用任何组合对本说明书(包括伴随的权利要求、摘要和附图)中公开的所有特征以及如此公开的任何方法或者设备的所有过程或单元进行组合。除非另外明确陈述,本说明书(包括伴随的权利要求、摘要和附图)中公开的每个特征可以由提供相同、等同或相似目的的替代特征来代替。
一种电子设备,包括:
一个或多个处理器;
存储器;
一个或多个程序,其中所述一个或多个程序被存储在所述存储器中并被配置为由所述一个或多个处理器执行,所述一个或多个程序配置用于执行上述实施例所述的方法。
一种计算机可读存储介质,存储与电子设备结合使用的计算机程序,所述计算机程序可被处理器执行以完成上述实施例的基于语音的输入方法。
本领域内的技术人员应明白,本发明实施例的实施例可提供为方法、装置、或计算机程序产品。因此,本发明实施例可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本发明实施例可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本发明实施例是参照根据本发明实施例的方法、终端设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理终端设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理终端设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理终端设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理终端设备上,使得在计算机或其他可编程终端设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程终端设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
尽管已描述了本发明实施例的优选实施例,但本领域内的技术人员一旦得知了基本创造性概念,则可对这些实施例做出另外的变更和修改。所以,所附权利要求意欲解释为包括优选实施例以及落入本发明实施例范围的所有变更和修改。
最后,还需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者终端设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者终端设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者终端设备中还存在另外的相同要素。
以上对本发明所提供的一种物流数据整合处理方法和一种物流数据整合处理装置,进行了详细介绍,本文中应用了具体个例对本发明的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本发明的方法及其核心思想;同时,对于本领域的一般技术人员,依据本发明的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本发明的限制。

Claims (14)

1.一种物流数据整合处理方法,其特征在于,所述方法包括:
获取物流数据,确定所述物流数据所属的物流服务提供方;
依据所述物流服务提供方确定对应的转换规则,按照所述转换规则对所述物流数据进行转换,得到对应的目标物流数据;
从所述目标物流数据中获取各字段的字段信息,其中,所述字段的类型至少包括以下两种:地址字段、用户字段;
按照所述字段对应的类型,对所述字段信息进行分析,确定对应的物流信息记录并进行存储。
2.根据权利要求1所述的方法,其特征在于,所述按照所述字段对应的类型,对所述字段信息进行分析,确定对应的物流信息记录并进行存储,包括:
对所述地址字段中的地址信息进行分析,确定对应的目标地址信息;
对所述用户字段中的用户信息进行分析,确定对应的目标用户信息;
依据所述目标地址信息和目标用户信息,确定物流信息记录并进行存储。
3.根据权利要求2所述的方法,其特征在于,所述对所述地址字段中的地址信息进行分析,确定对应的目标地址信息,包括:
从所述地址字段的地址信息中提取行政区域信息,作为第一地址信息;
从所述地址字段的地址信息中提取详细地址信息,作为第二地址信息;
将所述第一地址信息和第二地址信息,确定为目标地址信息。
4.根据权利要求3所述的方法,其特征在于,所述从所述地址字段的地址信息中提取行政区域信息,作为第一地址信息,包括:
从所述地址字段的地址信息中提取行政区域信息;
若所述行政区域信息为区划代码,则将所述区划代码转换为行政区域文本;
将所述行政区域文本作为第一地址信息。
5.根据权利要求2所述的方法,其特征在于,所述对所述用户字段中的用户信息进行分析,确定对应的目标用户信息,包括:
依据正则匹配规则对所述用户字段的用户信息进行匹配,确定对应的用户联系信息;
从所述用户字段的用户信息中提取用户名;
将所述用户联系信息和用户名,确定对应的目标用户信息。
6.根据权利要求2所述的方法,其特征在于,所述依据所述目标地址信息和目标用户信息,确定物流信息记录并进行存储,包括:
检测所述目标用户信息的完整度,确定对应的完整度标识;
将所述标地址信息、目标用户信息和完整度标识,确定为物流信息记录;
对所述物流信息记录进行存储。
7.一种物流数据整合处理装置,其特征在于,所述装置包括:
数据采集模块,用于获取物流数据,确定所述物流数据所属的物流服务提供方;
数据转换模块,用于依据所述物流服务提供方确定对应的转换规则,按照所述转换规则对所述物流数据进行转换,得到对应的目标物流数据;
数据提取模块,用于从所述目标物流数据中获取各字段的字段信息,其中,所述字段的类型至少包括以下两种:地址字段、用户字段;
数据分析模块,用于按照所述字段对应的类型,对所述字段信息进行分析,确定对应的物流信息记录并进行存储。
8.根据权利要求7所述的装置,其特征在于,所述数据分析模块包括:
信息解析子模块,用于对所述地址字段中的地址信息进行分析,确定对应的目标地址信息;
对所述用户字段中的用户信息进行分析,确定对应的目标用户信息;
信息存储子模块,用于依据所述目标地址信息和目标用户信息,确定物流信息记录并进行存储。
9.根据权利要求8所述的装置,其特征在于,所述信息解析子模块包括:
地址提取单元,用于从所述地址字段的地址信息中提取行政区域信息,作为第一地址信息;
从所述地址字段的地址信息中提取详细地址信息,作为第二地址信息;
地址确定单元,用于将所述第一地址信息和第二地址信息,确定为目标地址信息。
10.根据权利要求9所述的装置,其特征在于,所述地址提取单元包括:
地址检测子单元,用于从所述地址字段的地址信息中提取行政区域信息;
若所述行政区域信息为区划代码,则将所述区划代码转换为行政区域文本;
将所述行政区域文本作为第一地址信息。
11.根据权利要求8所述的装置,其特征在于,所述信息解析子模块包括:
用户信息匹配单元,用于依据正则匹配规则对所述用户字段的用户信息进行匹配,确定对应的用户联系信息;
用户信息提取单元,用于从所述用户字段的用户信息中提取用户名;
将所述用户联系信息和用户名,确定对应的目标用户信息。
12.根据权利要求8所述的装置,其特征在于,所述信息存储子模块包括:
标识匹配单元,用于检测所述目标用户信息的完整度,确定对应的完整度标识;
将所述目标地址信息、目标用户信息和完整度标识,确定为物流信息记录;
对所述物流信息记录进行存储。
13.一种电子设备,包括:
一个或多个处理器;
存储器;
一个或多个程序,其中所述一个或多个程序被存储在所述存储器中并被配置为由所述一个或多个处理器执行,所述一个或多个程序配置用于执行权利要求1-6中任一所述的方法。
14.一种计算机可读存储介质,存储与电子设备结合使用的计算机程序,所述计算机程序可被处理器执行以完成权利要求1-6中任一所述的方法。
CN202010398945.9A 2020-05-12 2020-05-12 一种物流数据整合处理方法和装置 Pending CN111475491A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010398945.9A CN111475491A (zh) 2020-05-12 2020-05-12 一种物流数据整合处理方法和装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010398945.9A CN111475491A (zh) 2020-05-12 2020-05-12 一种物流数据整合处理方法和装置

Publications (1)

Publication Number Publication Date
CN111475491A true CN111475491A (zh) 2020-07-31

Family

ID=71764545

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010398945.9A Pending CN111475491A (zh) 2020-05-12 2020-05-12 一种物流数据整合处理方法和装置

Country Status (1)

Country Link
CN (1) CN111475491A (zh)

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1700224A (zh) * 2005-05-20 2005-11-23 重庆邮电学院 实现第三方物流配送信息共享的方法和系统
CN103309907A (zh) * 2012-03-16 2013-09-18 上海安捷力信息系统有限公司 对不同来源的业务数据进行规范化处理的方法及系统
CN104484789A (zh) * 2014-12-26 2015-04-01 河南信安通信技术有限公司 实时寄递信息快速采集方法
CN109033086A (zh) * 2018-08-03 2018-12-18 银联数据服务有限公司 一种地址解析、匹配的方法及装置
CN109886618A (zh) * 2019-01-17 2019-06-14 江苏苏宁物流有限公司 一种优化物流作业的方法及装置

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1700224A (zh) * 2005-05-20 2005-11-23 重庆邮电学院 实现第三方物流配送信息共享的方法和系统
CN103309907A (zh) * 2012-03-16 2013-09-18 上海安捷力信息系统有限公司 对不同来源的业务数据进行规范化处理的方法及系统
CN104484789A (zh) * 2014-12-26 2015-04-01 河南信安通信技术有限公司 实时寄递信息快速采集方法
CN109033086A (zh) * 2018-08-03 2018-12-18 银联数据服务有限公司 一种地址解析、匹配的方法及装置
CN109886618A (zh) * 2019-01-17 2019-06-14 江苏苏宁物流有限公司 一种优化物流作业的方法及装置

Similar Documents

Publication Publication Date Title
US7796309B2 (en) Integrating analog markups with electronic documents
US20170118163A1 (en) Organizing messages in a messaging system using social network information
Mullan et al. Forensic source identification using JPEG image headers: The case of smartphones
US20080317346A1 (en) Character and Object Recognition with a Mobile Photographic Device
TW201018298A (en) Data access based on content of image recorded by a mobile device
CN107767253B (zh) 一种税务信息管理平台、方法及系统
Boehm et al. Introducing iyouit
US20150278248A1 (en) Personal Information Management Service System
US20190303384A1 (en) Method and system for consolidating data retrieved from different sources
US20190188224A1 (en) Method and apparatus for obtaining picture public opinions, computer device and storage medium
KR102133950B1 (ko) 지오로케이트된 이미지를 이용한 사업체 앵커링
US20140091139A1 (en) Semantic note taking system
JP5242202B2 (ja) 携帯通信端末
TWI575391B (zh) 社群資料篩選系統、方法及其非揮發性電腦可讀取紀錄媒體
CN111475491A (zh) 一种物流数据整合处理方法和装置
US10503773B2 (en) Tagging of documents and other resources to enhance their searchability
CN112015773B (zh) 知识库的检索方法、装置、电子设备以及存储介质
CN115146583A (zh) 一种术语自主结构化提取及关联方法、装置及存储介质
JP4217132B2 (ja) コミュニティ位置インデックスサーバ
US20170169454A1 (en) Identifying business online social presence with name and address using spatial filters
CN113297488A (zh) 一种基于大数据及人工智能的数据处理方法及系统
KR100737998B1 (ko) 사용자가 제공한 정보를 메타 정보와 함께 체계화시키는방법 및 장치
US20200065332A1 (en) Method and System for Retrieving Data from Different Sources that Relates to a Single Entity
CN111639280A (zh) 一种信息分享方法及装置
JP2014052427A (ja) 辞書更新装置、音声認識システム、辞書更新方法、音声認識方法、および、コンピュータ・プログラム

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20200731