CN115471148A - 数据处理方法、装置、设备及存储介质 - Google Patents

数据处理方法、装置、设备及存储介质 Download PDF

Info

Publication number
CN115471148A
CN115471148A CN202210898726.6A CN202210898726A CN115471148A CN 115471148 A CN115471148 A CN 115471148A CN 202210898726 A CN202210898726 A CN 202210898726A CN 115471148 A CN115471148 A CN 115471148A
Authority
CN
China
Prior art keywords
express
complaint
waybill
abnormal
data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202210898726.6A
Other languages
English (en)
Inventor
陈龙
杨周龙
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Dongpu Software Co Ltd
Original Assignee
Dongpu Software Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Dongpu Software Co Ltd filed Critical Dongpu Software Co Ltd
Priority to CN202210898726.6A priority Critical patent/CN115471148A/zh
Publication of CN115471148A publication Critical patent/CN115471148A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/08Logistics, e.g. warehousing, loading or distribution; Inventory or stock management
    • G06Q10/083Shipping
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/35Clustering; Classification
    • G06F16/355Class or cluster creation or modification
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/10Text processing
    • G06F40/166Editing, e.g. inserting or deleting
    • G06F40/177Editing, e.g. inserting or deleting of tables; using ruled lines
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/01Customer relationship services
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/06Buying, selling or leasing transactions
    • G06Q30/0601Electronic shopping [e-shopping]
    • G06Q30/0633Lists, e.g. purchase orders, compilation or processing
    • G06Q30/0635Processing of requisition or of purchase orders

Landscapes

  • Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Economics (AREA)
  • Marketing (AREA)
  • Strategic Management (AREA)
  • Accounting & Taxation (AREA)
  • Development Economics (AREA)
  • Finance (AREA)
  • General Business, Economics & Management (AREA)
  • General Engineering & Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Artificial Intelligence (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Human Resources & Organizations (AREA)
  • Operations Research (AREA)
  • Quality & Reliability (AREA)
  • Tourism & Hospitality (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明涉及快递物流领域,公开了一种数据处理方法、装置、设备及存储介质。该方法包括:从第三方物流接口中获取待处理的初始快递运单集合;基于预置的异常数据过滤规则对初始快递运单集合进行数据过滤,得到异常快递运单集合;获取异常快递运单集合中各异常快递运单的物流信息;若异常快递运单的物流信息中包含签收信息,则生成虚假签收投诉工单;若异常快递运单的物流信息中不包含签收信息,则生成普通快递投诉工单;统计虚假签收投诉工单和普通快递投诉工单,以生成快递投诉报表。本发明通过过滤出异常快递运单,并根据运单的物流信息中是否包括签收信息,从而生成不同类型的投诉工单,提升了异常数据的处理效率。

Description

数据处理方法、装置、设备及存储介质
技术领域
本发明涉及快递物流领域,尤其涉及一种数据处理方法、装置、设备及存储介质。
背景技术
随着网络购物走进千家万户,人们的生产生活越来越离不开快递服务。快递服务的定义为在承诺的时限内快速完成的寄递服务。快递是物流的一个重要分支,是供应链的重要环节。我国快递物流行业近些年的增长势头格外令人瞩目;然而随着我国经济的发展和人民生活水平的提高,快递服务企业仅仅追求时效性已经不能满足消费者的需求。消费者对服务质量的期待越来越高,在这样的背景下,一些制约快递企业提升服务水平的问题逐渐得到了社会的关注。
在现有的技术中对于包裹存放至代收点后要求送货上门体验不佳、站点上门服务能力较差物流超时等异常数据问题,通常等待人工查看后手动处理,其数据处理效率低下。
发明内容
本发明的主要目的在于解决现有技术数据处理效率低下的问题。
本发明第一方面提供了一种数据处理方法,包括:
从第三方物流接口中获取待处理的初始快递运单集合,其中,所述初始快递运单集合中包括多件快递运单;
基于预置的异常数据过滤规则对所述初始快递运单集合进行数据过滤,得到异常快递运单集合;
获取所述异常快递运单集合中各异常快递运单的物流信息;
若所述异常快递运单的物流信息中包含签收信息,则生成虚假签收投诉工单;
若所述异常快递运单的物流信息中不包含签收信息,则生成普通快递投诉工单;
统计所述虚假签收投诉工单和所述普通快递投诉工单,以生成快递投诉报表。
可选的,在本发明第一方面的第一种实现方式中,所述基于预置的异常数据过滤规则对所述初始快递运单集合进行数据过滤,得到异常快递运单集合包括:
获取所述初始快递运单集合中每件快递运单的预警级别,并将目标预警级别的快递运单从所述初始快递运单集合中移除,得到第一快递运单集合;
获取所述第一快递运单集合中每个快递运单的运单类型,并将目标运单类型的快递运单从所述第一快递运单集合中移除,得到第二快递运单集合;
获取所述第二快递运单集合中每个快递运单所属的网络平台,并将目标网络平台的快递运单从所述第二快递运单集合中移除,得到异常快递运单集合。
可选的,在本发明第一方面的第二种实现方式中,所述若所述异常快递运单的物流信息中不包含签收信息,则生成普通快递投诉工单包括:
若所述异常快递运单的物流信息中不包含签收信息,则获取所述异常快递运单的运单详情数据;
将所述异常快递运单的运单详情数据输入至预置的投诉分类模型中以识别所述异常快递运单对应的目标投诉类型;
获取与所述目标投诉类型对应的罚金数据,并根据所述目标投诉类型以及所述罚金数据生成普通快递投诉工单。
可选的,在本发明第一方面的第三种实现方式中,所述将所述异常快递运单的运单详情数据输入至预置的投诉分类模型中以识别所述异常快递运单对应的目标投诉类型之前,还包括:
获取多件历史投诉快递运单的运单详情数据以构建训练数据集;
获取每件历史投诉快递运单对应的投诉类型,并根据所述投诉类型对所述训练数据集中每件历史投诉快递运单的运单详情数据进行数据标注;
基于所述训练数据集对预置的初始网络模型执行分类训练,得到投诉分类模型。
可选的,在本发明第一方面的第四种实现方式中,所述初始网络模型包括特征提取网络、全连接网络以及归一化网络,所述基于所述训练数据集对预置的初始网络模型执行分类训练,得到投诉分类模型包括:
调用所述特征提取网络,提取目标训练数据的文本特征,其中,所述目标训练数据为所述训练数据集中任意一件历史投诉快递运单的运单详情数据;
调用所述全连接网络,计算所述文本特征对应的匹配得分分布,其中,所述匹配得分分布用于表示所述文本特征与每种所述投诉类型之间的匹配得分;
调用所述归一化网络,对每个匹配得分进行归一化处理,得到所述目标训练数据的匹配概率分布,其中,所述匹配概率分布用于表示所述目标训练数据与每种所述投诉类型之间的匹配概率;
基于预置的损失函数和数据标注的结果,计算所述匹配概率分布对应的损失值;
根据所述匹配概率分布对应的损失值调整所述初始网络模型的网络参数,得到投诉分类模型。
可选的,在本发明第一方面的第五种实现方式中,所述根据所述匹配概率分布对应的损失值调整所述初始网络模型的网络参数,得到投诉分类模型包括:
将所述匹配概率分布对应的损失值由所述初始网络模型的输出层向隐藏层反向传播;
当所述损失值被传播至所述隐藏层时,根据所述损失值,并采用随机梯度下降算法迭代更新所述初始网络模型的网络参数;
当所述初始网络模型的网络收敛时,确定当前网络参数为目标网络参数,得到投诉分类模型。
可选的,在本发明第一方面的第六种实现方式中,所述统计所述虚假签收投诉工单和所述普通快递投诉工单,以生成快递投诉报表包括:
按照各投诉工单对应快递运单的发件地址和发件时间,对所述虚假签收投诉工单和所述普通快递投诉工单进行分类,得到投诉工单分类数据;
基于预置的输入输出流将投诉工单分类数据输出至预置的报表模板中,得到快递投诉报表。
本发明第二方面提供了一种数据处理装置,包括:
运单集合获取模块,用于从第三方物流接口中获取待处理的初始快递运单集合,其中,所述初始快递运单集合中包括多件快递运单;
异常运单确定模块,用于基于预置的异常数据过滤规则对所述初始快递运单集合进行数据过滤,得到异常快递运单集合;
物流信息获取模块,用于获取所述异常快递运单集合中各异常快递运单的物流信息;
第一工单生成模块,用于若所述异常快递运单的物流信息中包含签收信息,则生成虚假签收投诉工单;
第二工单生成模块,用于若所述异常快递运单的物流信息中不包含签收信息,则生成普通快递投诉工单;
投诉报表生成模块,用于统计所述虚假签收投诉工单和所述普通快递投诉工单,以生成快递投诉报表。
可选的,在本发明第二方面的第一种实现方式中,所述异常运单确定模块包括:
第一过滤单元,用于获取所述初始快递运单集合中每件快递运单的预警级别,并将目标预警级别的快递运单从所述初始快递运单集合中移除,得到第一快递运单集合;
第二过滤单元,用于获取所述第一快递运单集合中每个快递运单的运单类型,并将目标运单类型的快递运单从所述第一快递运单集合中移除,得到第二快递运单集合;
第三过滤单元,用于获取所述第二快递运单集合中每个快递运单所属的网络平台,并将目标网络平台的快递运单从所述第二快递运单集合中移除,得到异常快递运单集合。
可选的,在本发明第二方面的第二种实现方式中,所述第二工单生成模块包括:
运单详情获取单元,用于若所述异常快递运单的物流信息中不包含签收信息,则获取所述异常快递运单的运单详情数据;
投诉类型识别单元,用于将所述异常快递运单的运单详情数据输入至预置的投诉分类模型中以识别所述异常快递运单对应的目标投诉类型;
工单生成单元,用于获取与所述目标投诉类型对应的罚金数据,并根据所述目标投诉类型以及所述罚金数据生成普通快递投诉工单。
可选的,在本发明第二方面的第三种实现方式中,所述第二工单生成模块包括:
数据集构建单元,用于获取多件历史投诉快递运单的运单详情数据以构建训练数据集;
投诉类型标注单元,用于获取每件历史投诉快递运单对应的投诉类型,并根据所述投诉类型对所述训练数据集中每件历史投诉快递运单的运单详情数据进行数据标注;
模型分类训练单元,用于基于所述训练数据集对预置的初始网络模型执行分类训练,得到投诉分类模型;
运单详情获取单元,用于若所述异常快递运单的物流信息中不包含签收信息,则获取所述异常快递运单的运单详情数据;
投诉类型识别单元,用于将所述异常快递运单的运单详情数据输入至预置的投诉分类模型中以识别所述异常快递运单对应的目标投诉类型;
工单生成单元,用于获取与所述目标投诉类型对应的罚金数据,并根据所述目标投诉类型以及所述罚金数据生成普通快递投诉工单。
可选的,在本发明第二方面的第四种实现方式中,所述初始网络模型包括特征提取网络、全连接网络以及归一化网络,所述模型分类训练单元具体用于:
调用所述特征提取网络,提取目标训练数据的文本特征,其中,所述目标训练数据为所述训练数据集中任意一件历史投诉快递运单的运单详情数据;
调用所述全连接网络,计算所述文本特征对应的匹配得分分布,其中,所述匹配得分分布用于表示所述文本特征与每种所述投诉类型之间的匹配得分;
调用所述归一化网络,对每个匹配得分进行归一化处理,得到所述目标训练数据的匹配概率分布,其中,所述匹配概率分布用于表示所述目标训练数据与每种所述投诉类型之间的匹配概率;
基于预置的损失函数和数据标注的结果,计算所述匹配概率分布对应的损失值;
根据所述匹配概率分布对应的损失值调整所述初始网络模型的网络参数,得到投诉分类模型。
可选的,在本发明第二方面的第五种实现方式中,所述模型分类训练单元具体用于:
调用所述特征提取网络,提取目标训练数据的文本特征,其中,所述目标训练数据为所述训练数据集中任意一件历史投诉快递运单的运单详情数据;
调用所述全连接网络,计算所述文本特征对应的匹配得分分布,其中,所述匹配得分分布用于表示所述文本特征与每种所述投诉类型之间的匹配得分;
调用所述归一化网络,对每个匹配得分进行归一化处理,得到所述目标训练数据的匹配概率分布,其中,所述匹配概率分布用于表示所述目标训练数据与每种所述投诉类型之间的匹配概率;
基于预置的损失函数和数据标注的结果,计算所述匹配概率分布对应的损失值;
将所述匹配概率分布对应的损失值由所述初始网络模型的输出层向隐藏层反向传播;
当所述损失值被传播至所述隐藏层时,根据所述损失值,并采用随机梯度下降算法迭代更新所述初始网络模型的网络参数;
当所述初始网络模型的网络收敛时,确定当前网络参数为目标网络参数,得到投诉分类模型。
可选的,在本发明第二方面的第六种实现方式中,所述投诉报表生成模块包括:
分类单元,用于按照各投诉工单对应快递运单的发件地址和发件时间,对所述虚假签收投诉工单和所述普通快递投诉工单进行分类,得到投诉工单分类数据;
输出单元,用于基于预置的输入输出流将投诉工单分类数据输出至预置的报表模板中,得到快递投诉报表。
本发明第三方面提供了一种数据处理设备,包括:存储器和至少一个处理器,所述存储器中存储有指令;所述至少一个处理器调用所述存储器中的所述指令,以使得所述数据处理设备执行上述的数据处理方法的各个步骤。
本发明的第四方面提供了一种计算机可读存储介质,所述计算机可读存储介质中存储有指令,当其在计算机上运行时,使得计算机执行上述的数据处理方法的各个步骤。
本发明提供的技术方案中,通过从第三方物流接口中获取待处理的初始快递运单集合,从该初始快递运单集合中过滤出异常快递运单;获取每个异常快递运单的物流信息,若物流信息中包含签收信息,则生成虚假签收投诉工单,否则生成普通快递投诉工单,进而统计虚假签收投诉工单和普通快递投诉工单以生成快递投诉报表。本发明通过过滤出异常快递运单,并根据运单的物流信息中是否包括签收信息,从而生成不同类型的投诉工单,提升了快递物流领域中异常快递件的处理效率。
附图说明
图1为本发明实施例中数据处理方法的第一个实施例示意图;
图2为本发明实施例中数据处理方法的第二个实施例示意图;
图3为本发明实施例中数据处理方法的第三个实施例示意图;
图4为本发明实施例中数据处理装置的一个实施例示意图;
图5为本发明实施例中数据处理装置的另一个实施例示意图;
图6为本发明实施例中数据处理设备的一个实施例示意图。
具体实施方式
本发明实施例提供了一种数据处理方法、装置、设备及存储介质,对异常快递件的处理效率更高。
本发明的说明书和权利要求书及上述附图中的术语“第一”、“第二”、“第三”、“第四”等(如果存在)是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的实施例能够以除了在这里图示或描述的内容以外的顺序实施。此外,术语“包括”或“具有”及其任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
可以理解的是,本发明的执行主体可以为数据处理装置,还可以是终端或者服务器,具体此处不做限定。本发明实施例以服务器为执行主体为例进行说明。
本申请实施例可以基于人工智能技术对相关的数据进行获取和处理。其中,人工智能(Artificial Intelligence,AI)是利用数字计算机或者数字计算机控制的机器模拟、延伸和扩展人的智能,感知环境、获取知识并使用知识获得最佳结果的理论、方法、技术及应用系统。
人工智能基础技术一般包括如传感器、专用人工智能芯片、云计算、分布式存储、大数据处理技术、操作/交互系统、机电一体化等技术。人工智能软件技术主要包括计算机视觉技术、机器人技术、生物识别技术、语音处理技术、自然语言处理技术以及机器学习/深度学习等几大方向。
为便于理解,下面对本发明实施例的具体流程进行描述,请参阅图1,本发明实施例中数据处理方法的第一个实施例包括:
101、从第三方物流接口中获取待处理的初始快递运单集合,其中,初始快递运单集合中包括多件快递运单;
可以理解的是,物流快递企业通常加入第三方物流公共平台提供的商业生态圈中从而为更多用户提供物流快递的服务支持,两者之间基于第三方物流接口实现数据交互:用户在第三方物流公共平台下单,选择所需要的物流品牌服务以生成快递运单,而第三方物流公共平台将所生成的快递运单通过该第三方物流接口推送至该物流品牌方平台。
102、基于预置的异常数据过滤规则对初始快递运单集合进行数据过滤,得到异常快递运单集合;
可以理解的是,数据过滤的具体方式取决于对于异常快递运单的定义,例如运单配送时间过长的快递运单为异常快递运单、长时间未签收的快递运单为异常快递运单,本实施例中对其不做具体的限定。
可选的,在一实施例中,服务器还可根据该异常快递运单集合中各异常快递运单的标识信息,获取每件异常快递运单的运单详情数据;基于孤立点检测算法从每件异常快递运单的运单详情数据中检测出孤立的异常快递运单群体,从而得到异常快递运单集合。该孤立点检测算法例如反向近邻算法(Outlier Detection K-NearestNeighbor,ODRNN)、Fraudar算法等,本实施例对其不做限定。
103、获取异常快递运单集合中各异常快递运单的物流信息;
可以理解的是,异常快递运单集合中存储的是各异常快递运单的运单编号,服务器可根据该运单编号从第三方物流公共平台提供的数据库中获取到每件异常快递运单的物流信息,该物流信息可包括运单运输途中依次经过的各中转网点、抵达各中转网点的时间信息、配送人员的个人信息和联系号码等信息,当运单被签收人签收后还包括签收信息。
104、若异常快递运单的物流信息中包含签收信息,则生成虚假签收投诉工单;
可以理解的是,服务器依次对各异常快递运单的物流信息进行检测,具体检测方式可采用关键字匹配或模糊匹配,若检测到异常快递运单的物流信息中包括签收信息,则确定该异常快递运单为虚假签收运单,并进一步自动为客户生成虚假签收投诉工单。
可选的,该签收信息可包括签收人姓名、签收时间、签收地点等,本实施例对其不做限定。
可选的,该投诉工单中可包括投诉来源信息、投诉类型以及投诉原因等信息,本实施例对其不做限定。
105、若异常快递运单的物流信息中不包含签收信息,则生成普通快递投诉工单;
可以理解的是,若检测到异常快递运单的物流信息中不包括签收信息,则确定该异常快递运单为存在其他类型(非虚假签收)投诉的快递运单,并进一步自动为客户生成普通快递投诉工单。
可选的,若异常快递运单的物流信息中不包含签收信息,服务器还获取到异常快递运单对应的运单详情信息,该运单详情信息的形式可包括文本和图片(例如贵重物品运输前的包装图像以及签收时的包装图像),进而根据运单详情信息识别对应的投诉类型,例如长时间未签收、运输时间过长、运单损坏等,本实施例对该投诉类型的识别方式不做具体限定。
106、统计虚假签收投诉工单和普通快递投诉工单,以生成快递投诉报表。
可以理解的是,本实施例按照预置的报表模板对虚假签收投诉工单和普通快递投诉工单进行统计,从而生成快递投诉报表。
可选的,服务器可按照各投诉工单对应快递运单的发件地址和发件时间,对虚假签收投诉工单和普通快递投诉工单进行分类,得到投诉工单分类数据;基于预置的输入输出流(Input/Out,IO)将投诉工单分类数据输出至预置的报表模板中,得到快递投诉报表。
本发明实施例中,通过过滤出异常快递运单,并根据运单的物流信息中是否包括签收信息,从而生成不同类型的投诉工单,提升了快递物流领域中异常快递件的处理效率。
请参阅图2,本发明实施例中数据处理方法的第二个实施例包括:
201、从第三方物流接口中获取待处理的初始快递运单集合,其中,初始快递运单集合中包括多件快递运单;
其中,步骤201与上述步骤101的执行步骤类似,具体此处不再赘述。
202、获取初始快递运单集合中每件快递运单的预警级别,并将目标预警级别的快递运单从初始快递运单集合中移除,得到第一快递运单集合;
可以理解的是,第三方物流公共平台根据每件快递运单的物流信息从而确定了每件快递运单的预警级别,当一个快递运单的预警级别越高时,表示该快递运单存在潜在问题的可能性越大,例如运输时间较长等,该目标预警级别即低于某个预警级别阈值。
203、获取第一快递运单集合中每个快递运单的运单类型,并将目标运单类型的快递运单从第一快递运单集合中移除,得到第二快递运单集合;
可以理解的是,快递运单通常可分为普通件和理赔件,可通过不同的字段分别表示这两种类型的快递运单,而理赔件均不属于异常快递运单,即目标运单类型为理赔件,因此服务器从第一快递运单集合中过滤出理赔件。
204、获取第二快递运单集合中每个快递运单所属的网络平台,并将目标网络平台的快递运单从第二快递运单集合中移除,得到异常快递运单集合;
可以理解的是,当部分网络平台的快递运单规定为非异常快递运单时,服务器可将其从第二快递运单集合中移除。
205、获取异常快递运单集合中各异常快递运单的物流信息;
206、若异常快递运单的物流信息中包含签收信息,则生成虚假签收投诉工单;
207、若异常快递运单的物流信息中不包含签收信息,则生成普通快递投诉工单;
208、统计虚假签收投诉工单和普通快递投诉工单,以生成快递投诉报表。
其中,步骤205-208与上述步骤103-106的执行步骤类似,具体此处不再赘述。
本发明实施例中,详细描述了过滤异常快递运单的过程,通过从多个维度将正常的快递运单从原初始快递运单中移除,从而准确地保留异常快递运单。
请参阅图3,本发明实施例中数据处理方法的第三个实施例包括:
301、从第三方物流接口中获取待处理的初始快递运单集合,其中,初始快递运单集合中包括多件快递运单;
302、基于预置的异常数据过滤规则对初始快递运单集合进行数据过滤,得到异常快递运单集合;
303、获取异常快递运单集合中各异常快递运单的物流信息;
304、若异常快递运单的物流信息中包含签收信息,则生成虚假签收投诉工单;
其中,步骤301-304与上述步骤101-104的执行步骤类似,具体此处不再赘述。
305、若异常快递运单的物流信息中不包含签收信息,则获取异常快递运单的运单详情数据;
可以理解的是,运单详情数据包括但不限于运单价格、寄件人信息、收件人信息、物流信息、保价信息等,本实施例对其不做限定。
306、将异常快递运单的运单详情数据输入至预置的投诉分类模型中以识别异常快递运单对应的目标投诉类型;
可以理解的是,本实施例基于自然语言处理(Natural Language Processing,NLP)从而识别各异常快递运单对应的投诉类型。
具体的,服务器获取多件历史投诉快递运单的运单详情数据以构建训练数据集;获取每件历史投诉快递运单对应的投诉类型,并根据投诉类型对所述训练数据集中每件历史投诉快递运单的运单详情数据进行数据标注;基于训练数据集对预置的初始网络模型执行分类训练,从而得到该投诉分类模型。
该初始网络模型可以为基于各类投诉信息训练后的预训练模型,从而直接进行学习迁移,也可以为传统的NLP网络模型,例如Bert模型、朴素贝叶斯模型、循环神经网络模型等,本实施例对其不做限定。
可选的,初始网络模型包括特征提取网络、全连接网络以及归一化网络,该特征提取网络即为初始网络模型的主干网络,优选由卷积网络和循环网络层间交替组成的,本实施例对其不做限定。可选,当该特征提取网络的网络深度较大时,可在网络层间加入残差网络,从而解决随网络深度的加深所带来的梯度消失问题,归一化网络用于将特征收敛至[0,1]区间内,可采用softmax进行多个分类的归一化处理。
可选的,基于训练数据集对预置的初始网络模型执行分类训练,从而得到该投诉分类模型具体包括:
调用特征提取网络提取目标训练数据的文本特征,目标训练数据为所述训练数据集中任意一件历史投诉快递运单的运单详情数据;
调用全连接网络计算文本特征对应的匹配得分分布,匹配得分分布用于表示该文本特征与每种投诉类型之间的匹配得分;
调用归一化网络对每个匹配得分进行归一化处理,得到目标训练数据的匹配概率分布,匹配概率分布用于表示目标训练数据与每种投诉类型之间的匹配概率;
基于预置的损失函数和数据标注的结果,计算该匹配概率分布对应的损失值,本实施例对该损失函数的类型不做具体限定,优选采用交叉熵损失函数;
根据匹配概率分布对应的损失值调整初始网络模型的网络参数,得到投诉分类模型,本实施例对根据损失值调整网络参数的方式不做具体限定,例如可采用随机梯度下降算法等。
307、获取与目标投诉类型对应的罚金数据,并根据目标投诉类型以及罚金数据生成普通快递投诉工单;
308、统计虚假签收投诉工单和普通快递投诉工单,以生成快递投诉报表。
其中,步骤308与上述步骤106的执行步骤类似,具体此处不再赘述。
本发明实施例中,详细描述了生成普通快递投诉工单的过程,通过基于深度学习的投诉分类模型识别出异常快递运单对应的目标投诉类型,从而获取对应投诉罚金数据,进而准确地生成相应普通快递投诉工单。
上面对本发明实施例中数据处理方法进行了描述,下面对本发明实施例中数据处理装置进行描述,请参阅图4,本发明实施例中数据处理装置一个实施例包括:
运单集合获取模块401,用于从第三方物流接口中获取待处理的初始快递运单集合,其中,所述初始快递运单集合中包括多件快递运单;
异常运单确定模块402,用于基于预置的异常数据过滤规则对所述初始快递运单集合进行数据过滤,得到异常快递运单集合;
物流信息获取模块403,用于获取所述异常快递运单集合中各异常快递运单的物流信息;
第一工单生成模块404,用于若所述异常快递运单的物流信息中包含签收信息,则生成虚假签收投诉工单;
第二工单生成模块405,用于若所述异常快递运单的物流信息中不包含签收信息,则生成普通快递投诉工单;
投诉报表生成模块406,用于统计所述虚假签收投诉工单和所述普通快递投诉工单,以生成快递投诉报表。
本发明实施例中,通过过滤出异常快递运单,并根据运单的物流信息中是否包括签收信息,从而生成不同类型的投诉工单,提升了快递物流领域中异常快递件的处理效率。
请参阅图5,本发明实施例中数据处理装置的另一个实施例包括:
运单集合获取模块401,用于从第三方物流接口中获取待处理的初始快递运单集合,其中,所述初始快递运单集合中包括多件快递运单;
异常运单确定模块402,用于基于预置的异常数据过滤规则对所述初始快递运单集合进行数据过滤,得到异常快递运单集合;
物流信息获取模块403,用于获取所述异常快递运单集合中各异常快递运单的物流信息;
第一工单生成模块404,用于若所述异常快递运单的物流信息中包含签收信息,则生成虚假签收投诉工单;
第二工单生成模块405,用于若所述异常快递运单的物流信息中不包含签收信息,则生成普通快递投诉工单;
投诉报表生成模块406,用于统计所述虚假签收投诉工单和所述普通快递投诉工单,以生成快递投诉报表。
可选的,所述异常运单确定模块402包括:
第一过滤单元4021,用于获取所述初始快递运单集合中每件快递运单的预警级别,并将目标预警级别的快递运单从所述初始快递运单集合中移除,得到第一快递运单集合;
第二过滤单元4022,用于获取所述第一快递运单集合中每个快递运单的运单类型,并将目标运单类型的快递运单从所述第一快递运单集合中移除,得到第二快递运单集合;
第三过滤单元4023,用于获取所述第二快递运单集合中每个快递运单所属的网络平台,并将目标网络平台的快递运单从所述第二快递运单集合中移除,得到异常快递运单集合。
可选的,所述第二工单生成模块405包括:
数据集构建单元4051,用于获取多件历史投诉快递运单的运单详情数据以构建训练数据集;
投诉类型标注单元4052,用于获取每件历史投诉快递运单对应的投诉类型,并根据所述投诉类型对所述训练数据集中每件历史投诉快递运单的运单详情数据进行数据标注;
模型分类训练单元4053,用于基于所述训练数据集对预置的初始网络模型执行分类训练,得到投诉分类模型;
运单详情获取单元4054,用于若所述异常快递运单的物流信息中不包含签收信息,则获取所述异常快递运单的运单详情数据;
投诉类型识别单元4055,用于将所述异常快递运单的运单详情数据输入至预置的投诉分类模型中以识别所述异常快递运单对应的目标投诉类型;
工单生成单元4056,用于获取与所述目标投诉类型对应的罚金数据,并根据所述目标投诉类型以及所述罚金数据生成普通快递投诉工单。
可选的,所述初始网络模型包括特征提取网络、全连接网络以及归一化网络,所述模型分类训练单元4053具体用于:
调用所述特征提取网络,提取目标训练数据的文本特征,其中,所述目标训练数据为所述训练数据集中任意一件历史投诉快递运单的运单详情数据;
调用所述全连接网络,计算所述文本特征对应的匹配得分分布,其中,所述匹配得分分布用于表示所述文本特征与每种所述投诉类型之间的匹配得分;
调用所述归一化网络,对每个匹配得分进行归一化处理,得到所述目标训练数据的匹配概率分布,其中,所述匹配概率分布用于表示所述目标训练数据与每种所述投诉类型之间的匹配概率;
基于预置的损失函数和数据标注的结果,计算所述匹配概率分布对应的损失值;
将所述匹配概率分布对应的损失值由所述初始网络模型的输出层向隐藏层反向传播;
当所述损失值被传播至所述隐藏层时,根据所述损失值,并采用随机梯度下降算法迭代更新所述初始网络模型的网络参数;
当所述初始网络模型的网络收敛时,确定当前网络参数为目标网络参数,得到投诉分类模型。
可选的,投诉报表生成模块406包括:
分类单元4061,用于按照各投诉工单对应快递运单的发件地址和发件时间,对所述虚假签收投诉工单和所述普通快递投诉工单进行分类,得到投诉工单分类数据;
输出单元4062,用于基于预置的输入输出流将投诉工单分类数据输出至预置的报表模板中,得到快递投诉报表。
本发明实施例中,模块化的设计让临床路径的构建装置各部位的硬件专注于某一功能的实现,最大化实现了硬件的性能,同时模块化的设计也降低了装置的模块之间的耦合性,更加方便维护。
上面图4和图5从模块化功能实体的角度对本发明实施例中的数据处理装置进行详细描述,下面从硬件处理的角度对本发明实施例中数据处理设备进行详细描述。
图6是本发明实施例提供的一种数据处理设备的结构示意图,该数据处理设备600可因配置或性能不同而产生比较大的差异,可以包括一个或一个以上处理器610(例如,一个或一个以上处理器)和存储器620,一个或一个以上存储应用程序633或数据632的存储介质630(例如一个或一个以上海量存储设备)。其中,存储器620和存储介质630可以是短暂存储或持久存储。存储在存储介质630的程序可以包括一个或一个以上模块(图示没标出),每个模块可以包括对数据处理设备600中的一系列指令操作。更进一步地,处理器610可以设置为与存储介质630通信,在数据处理设备600上执行存储介质630中的一系列指令操作。
数据处理设备600还可以包括一个或一个以上电源640,一个或一个以上有线或无线网络接口650,一个或一个以上输入输出接口660,和/或,一个或一个以上操作系统631,例如Windows Serve,Mac OS X,Unix,Linux,FreeBSD等等。本领域技术人员可以理解,图6示出的数据处理设备结构并不构成对数据处理设备的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置。
本发明还提供一种数据处理设备,所述计算机设备包括存储器和处理器,存储器中存储有计算机可读指令,计算机可读指令被处理器执行时,使得处理器执行上述各实施例中的所述数据处理方法的各个步骤。
本发明还提供一种计算机可读存储介质,该计算机可读存储介质可以为非易失性计算机可读存储介质,该计算机可读存储介质也可以为易失性计算机可读存储介质,所述计算机可读存储介质中存储有指令,当所述指令在计算机上运行时,使得计算机执行所述数据处理方法的各个步骤。
所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的系统,装置和单元的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(read-only memory,ROM)、随机存取存储器(random access memory,RAM)、磁碟或者光盘等各种可以存储程序代码的介质。
本申请可用于众多通用或专用的计算机系统环境或配置中。例如:个人计算机、服务器计算机、手持设备或便携式设备、平板型设备、多处理器系统、基于微处理器的系统、置顶盒、可编程的消费电子设备、网络PC、小型计算机、大型计算机、包括以上任何系统或设备的分布式计算环境等等。本申请可以在由计算机执行的计算机可执行指令的一般上下文中描述,例如程序模块。一般地,程序模块包括执行特定任务或实现特定抽象数据类型的例程、程序、对象、组件、数据结构等等。也可以在分布式计算环境中实践本申请,在这些分布式计算环境中,由通过通信网络而被连接的远程处理设备来执行任务。在分布式计算环境中,程序模块可以位于包括存储设备在内的本地和远程计算机存储介质中。
以上所述,以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。

Claims (10)

1.一种数据处理方法,其特征在于,所述数据处理方法包括:
从第三方物流接口中获取待处理的初始快递运单集合,其中,所述初始快递运单集合中包括多件快递运单;
基于预置的异常数据过滤规则对所述初始快递运单集合进行数据过滤,得到异常快递运单集合;
获取所述异常快递运单集合中各异常快递运单的物流信息;
若所述异常快递运单的物流信息中包含签收信息,则生成虚假签收投诉工单;
若所述异常快递运单的物流信息中不包含签收信息,则生成普通快递投诉工单;
统计所述虚假签收投诉工单和所述普通快递投诉工单,以生成快递投诉报表。
2.根据权利要求1所述的数据处理方法,其特征在于,所述基于预置的异常数据过滤规则对所述初始快递运单集合进行数据过滤,得到异常快递运单集合包括:
获取所述初始快递运单集合中每件快递运单的预警级别,并将目标预警级别的快递运单从所述初始快递运单集合中移除,得到第一快递运单集合;
获取所述第一快递运单集合中每个快递运单的运单类型,并将目标运单类型的快递运单从所述第一快递运单集合中移除,得到第二快递运单集合;
获取所述第二快递运单集合中每个快递运单所属的网络平台,并将目标网络平台的快递运单从所述第二快递运单集合中移除,得到异常快递运单集合。
3.根据权利要求1所述的数据处理方法,其特征在于,所述若所述异常快递运单的物流信息中不包含签收信息,则生成普通快递投诉工单包括:
若所述异常快递运单的物流信息中不包含签收信息,则获取所述异常快递运单的运单详情数据;
将所述异常快递运单的运单详情数据输入至预置的投诉分类模型中以识别所述异常快递运单对应的目标投诉类型;
获取与所述目标投诉类型对应的罚金数据,并根据所述目标投诉类型以及所述罚金数据生成普通快递投诉工单。
4.根据权利要求3所述的数据处理方法,其特征在于,所述将所述异常快递运单的运单详情数据输入至预置的投诉分类模型中以识别所述异常快递运单对应的目标投诉类型之前,还包括:
获取多件历史投诉快递运单的运单详情数据以构建训练数据集;
获取每件历史投诉快递运单对应的投诉类型,并根据所述投诉类型对所述训练数据集中每件历史投诉快递运单的运单详情数据进行数据标注;
基于所述训练数据集对预置的初始网络模型执行分类训练,得到投诉分类模型。
5.根据权利要求4所述的数据处理方法,其特征在于,所述初始网络模型包括特征提取网络、全连接网络以及归一化网络,所述基于所述训练数据集对预置的初始网络模型执行分类训练,得到投诉分类模型包括:
调用所述特征提取网络,提取目标训练数据的文本特征,其中,所述目标训练数据为所述训练数据集中任意一件历史投诉快递运单的运单详情数据;
调用所述全连接网络,计算所述文本特征对应的匹配得分分布,其中,所述匹配得分分布用于表示所述文本特征与每种所述投诉类型之间的匹配得分;
调用所述归一化网络,对每个匹配得分进行归一化处理,得到所述目标训练数据的匹配概率分布,其中,所述匹配概率分布用于表示所述目标训练数据与每种所述投诉类型之间的匹配概率;
基于预置的损失函数和数据标注的结果,计算所述匹配概率分布对应的损失值;
根据所述匹配概率分布对应的损失值调整所述初始网络模型的网络参数,得到投诉分类模型。
6.根据权利要求5所述的数据处理方法,其特征在于,所述根据所述匹配概率分布对应的损失值调整所述初始网络模型的网络参数,得到投诉分类模型包括:
将所述匹配概率分布对应的损失值由所述初始网络模型的输出层向隐藏层反向传播;
当所述损失值被传播至所述隐藏层时,根据所述损失值,并采用随机梯度下降算法迭代更新所述初始网络模型的网络参数;
当所述初始网络模型的网络收敛时,确定当前网络参数为目标网络参数,得到投诉分类模型。
7.根据权利要求1-6中任一项所述的数据处理方法,其特征在于,所述统计所述虚假签收投诉工单和所述普通快递投诉工单,以生成快递投诉报表包括:
按照各投诉工单对应快递运单的发件地址和发件时间,对所述虚假签收投诉工单和所述普通快递投诉工单进行分类,得到投诉工单分类数据;
基于预置的输入输出流将投诉工单分类数据输出至预置的报表模板中,得到快递投诉报表。
8.一种数据处理装置,其特征在于,所述数据处理装置包括:
运单集合获取模块,用于从第三方物流接口中获取待处理的初始快递运单集合,其中,所述初始快递运单集合中包括多件快递运单;
异常运单确定模块,用于基于预置的异常数据过滤规则对所述初始快递运单集合进行数据过滤,得到异常快递运单集合;
物流信息获取模块,用于获取所述异常快递运单集合中各异常快递运单的物流信息;
第一工单生成模块,用于若所述异常快递运单的物流信息中包含签收信息,则生成虚假签收投诉工单;
第二工单生成模块,用于若所述异常快递运单的物流信息中不包含签收信息,则生成普通快递投诉工单;
投诉报表生成模块,用于统计所述虚假签收投诉工单和所述普通快递投诉工单,以生成快递投诉报表。
9.一种数据处理设备,其特征在于,所述数据处理设备包括:存储器和至少一个处理器,所述存储器中存储有指令;
所述至少一个处理器调用所述存储器中的所述指令,以使得所述数据处理设备执行如权利要求1-7中任一项所述的数据处理方法的各个步骤。
10.一种计算机可读存储介质,所述计算机可读存储介质上存储有指令,其特征在于,所述指令被处理器执行时实现如权利要求1-7中任一项所述数据处理方法的各个步骤。
CN202210898726.6A 2022-07-28 2022-07-28 数据处理方法、装置、设备及存储介质 Pending CN115471148A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210898726.6A CN115471148A (zh) 2022-07-28 2022-07-28 数据处理方法、装置、设备及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210898726.6A CN115471148A (zh) 2022-07-28 2022-07-28 数据处理方法、装置、设备及存储介质

Publications (1)

Publication Number Publication Date
CN115471148A true CN115471148A (zh) 2022-12-13

Family

ID=84365917

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210898726.6A Pending CN115471148A (zh) 2022-07-28 2022-07-28 数据处理方法、装置、设备及存储介质

Country Status (1)

Country Link
CN (1) CN115471148A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116468341A (zh) * 2023-04-03 2023-07-21 上海乾臻信息科技有限公司 仲裁工单的处理方法、装置、系统及存储介质

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116468341A (zh) * 2023-04-03 2023-07-21 上海乾臻信息科技有限公司 仲裁工单的处理方法、装置、系统及存储介质
CN116468341B (zh) * 2023-04-03 2024-04-09 上海乾臻信息科技有限公司 仲裁工单的处理方法、装置、系统及存储介质

Similar Documents

Publication Publication Date Title
CN109522556B (zh) 一种意图识别方法及装置
CN112184525B (zh) 通过自然语义分析实现智能匹配推荐的系统及方法
Tsui et al. Knowledge-based extraction of intellectual capital-related information from unstructured data
CN110020660A (zh) 使用人工智能(ai)技术的非结构化过程的完整性评估
CN116468460B (zh) 基于人工智能的消费金融客户画像识别系统及其方法
CN112487794B (zh) 行业分类方法、装置、终端设备及存储介质
US20210174150A1 (en) Automated Classification Engine with Human Augmentation
CN110955690A (zh) 一种基于大数据技术的自助数据标签平台及自助数据标签方法
CN110046648A (zh) 基于至少一个业务分类模型进行业务分类的方法及装置
CN113706291A (zh) 欺诈风险预测方法、装置、设备及存储介质
CN113722617A (zh) 企业实际办公地址的识别方法、装置及电子设备
CN113051380A (zh) 信息生成方法、装置、电子设备和存储介质
CN115471148A (zh) 数据处理方法、装置、设备及存储介质
CN113779276A (zh) 用于检测评论的方法和装置
CN111325495B (zh) 异常件分类方法及系统
CN116823164A (zh) 一种业务审批方法、装置、设备及存储介质
CN109213873B (zh) 一种为待售专利自动匹配潜在买方的专利匹配方法和匹配系统
CN111353728A (zh) 一种风险分析方法和系统
Lo et al. An emperical study on application of big data analytics to automate service desk business process
CN115099680A (zh) 风险管理方法、装置、设备及存储介质
CN113822477A (zh) 快件拦截处理方法、装置、设备及存储介质
Punde et al. Fake product review monitoring & removal and sentiment analysis of genuine reviews
CN111080463B (zh) 一种关键通讯节点识别方法、装置及介质
CN113888265A (zh) 产品推荐方法、装置、设备及计算机可读存储介质
CN114006986A (zh) 外呼合规预警方法、装置、设备及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination