CN108170759B - 投诉案件处理的方法、装置、计算机设备及存储介质 - Google Patents

投诉案件处理的方法、装置、计算机设备及存储介质 Download PDF

Info

Publication number
CN108170759B
CN108170759B CN201711409014.9A CN201711409014A CN108170759B CN 108170759 B CN108170759 B CN 108170759B CN 201711409014 A CN201711409014 A CN 201711409014A CN 108170759 B CN108170759 B CN 108170759B
Authority
CN
China
Prior art keywords
complaint
node
case
field information
information
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201711409014.9A
Other languages
English (en)
Other versions
CN108170759A (zh
Inventor
孙兰
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ping An Pension Insurance Corp
Original Assignee
Ping An Pension Insurance Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ping An Pension Insurance Corp filed Critical Ping An Pension Insurance Corp
Priority to CN201711409014.9A priority Critical patent/CN108170759B/zh
Publication of CN108170759A publication Critical patent/CN108170759A/zh
Application granted granted Critical
Publication of CN108170759B publication Critical patent/CN108170759B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/80Information retrieval; Database structures therefor; File system structures therefor of semi-structured data, e.g. markup language structured data such as SGML, XML or HTML
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q40/00Finance; Insurance; Tax strategies; Processing of corporate or income taxes
    • G06Q40/08Insurance

Landscapes

  • Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Theoretical Computer Science (AREA)
  • Finance (AREA)
  • Accounting & Taxation (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Development Economics (AREA)
  • Economics (AREA)
  • Marketing (AREA)
  • Strategic Management (AREA)
  • Technology Law (AREA)
  • General Business, Economics & Management (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明提出了一种投诉案件处理的方法,该方法包括:接收上传的投诉案件,读取投诉案件的根节点信息,根节点信息包括投诉案件编号和案件类型,读取投诉案件的二级节点,根据二级节点的个数分配相应的保存容器,将三级节点的数据保存到相应二级节点对应的保存容器中,查找与案件类型匹配的处理模板,获取处理模板中包含的字段信息,获取与每个字段信息匹配的保存容器,从保存容器中提取与每个字段信息对应的数据,将提取到的数据与相应的字段信息、以及与所述投诉案件编号关联存储到数据库,完成投诉案件的录入,该投诉案件处理的方法大大提高了录入的效率。此外,还提出了一种投诉案件处理的装置、计算机设备及存储介质。

Description

投诉案件处理的方法、装置、计算机设备及存储介质
技术领域
本发明涉及计算机处理领域,特别是涉及一种投诉案件处理的方法、装置、计算机设备及存储介质。
背景技术
保险行业作为一个服务行业,为了给客户更满意的服务,开通了接收投诉案件的通道。为了便于管理分配投诉案件,需要将投诉案件录入到投诉管理系统。传统的接收到投诉案件后,需要工作人员根据投诉案件的字段信息人工录入到投诉管理系统。由于投诉案件涉及到的内容非常多,导致投诉案件录入的非常慢,不但耗时耗力,而且容易出错。
发明内容
基于此,有必要针对上述问题,提出一种省时省力且效率高的一种投诉案件处理的方法、装置、计算机设备及存储介质。
一种投诉案件处理的方法,所述方法包括:
接收上传的投诉案件,所述投诉案件是以XML格式存在的;
读取所述投诉案件的根节点信息,所述根节点信息包括投诉案件编号和案件类型;
读取所述投诉案件的二级节点,为每个二级节点分配一个保存容器;
获取每个二级节点对应的三级节点,将所述三级节点包含的数据保存到相应二级节点对应的保存容器中,其中,每个三级节点对应一个字段信息;
查找与所述案件类型匹配的处理模板,获取所述处理模板包含的字段信息;
通过字段匹配的方式获取与每个字段信息匹配的三级节点,从所述三级节点对应的二级节点的保存容器中提取与每个字段信息对应的数据;
将提取到的数据与相应的字段信息、以及与所述投诉案件编号关联存储到数据库,完成投诉案件的录入。
在其中一个实施例中,所述读取所述投诉案件的二级节点,为每个二级节点分配一个保存容器的步骤包括:当所述二级节点的个数大于已有的保存容器的个数时,则动态创建新的保存容器,以使二级节点与保存容器一一对应;获取二级节点名称,为每个二级节点分配一个保存容器,将所述保存容器与所述二级节点名称进行映射保存。
在其中一个实施例中,在所述通过字段匹配的方式获取与每个字段信息匹配的保存容器,从所述保存容器中提取与每个字段信息对应的数据的步骤之后还包括:获取与每个字段信息对应的验证规则,根据所述验证规则对提取的数据进行校验,若验证通过,则进入将提取到的数据与相应的字段信息进行关联保存到数据库的步骤。
在其中一个实施例中,所述方法还包括:获取所述投诉案件中投诉内容字段对应的投诉内容信息,提取所述投诉内容信息中的投诉关键字;分别计算所述投诉关键字与不同投诉类型对应的预留关键字之间的相似度,根据所述相似度确定与所述投诉内容信息匹配的投诉类型;根据匹配到的投诉类型将所述投诉案件进行归类。
在其中一个实施例中,所述计算所述投诉关键字与不同投诉类型对应的预留关键字之间的相似度,根据所述相似度确定与所述投诉内容信息匹配的投诉类型的步骤包括:获取所述投诉关键字对应的词向量,获取所述预留关键字对应的词向量;根据所述投诉关键字对应的词向量和所述预留关键字对应的词向量采用皮尔森相关系数算法分别计算所述投诉关键字与不同投诉类型对应的预留关键字之间的相似度。
一种投诉案件处理的装置,所述装置包括:
接收模块,用于接收上传的投诉案件,所述投诉案件是以XML格式存在的;
根节点读取模块,用于读取所述投诉案件的根节点信息,所述根节点信息包括投诉案件编号和案件类型;
分配模块,用于读取所述投诉案件的二级节点,为每个二级节点分配一个保存容器;
保存模块,用于获取每个二级节点对应的三级节点,将所述三级节点包含的数据保存到相应二级节点对应的保存容器中,其中,每个三级节点对应一个字段信息;
查找模块,用于查找与所述案件类型匹配的处理模板,获取所述处理模板包含的字段信息;
匹配模块,用于通过字段匹配的方式获取与每个字段信息匹配的三级节点,从所述三级节点对应的二级节点的保存容器中提取与每个字段信息对应的数据;
录入模块,用于将提取到的数据与相应的字段信息、以及与所述投诉案件编号关联存储到数据库,完成投诉案件的录入。
在其中一个实施例中,所述分配模块还用于当所述二级节点的个数大于已有的保存容器的个数时,则动态创建新的保存容器,以使二级节点与保存容器一一对应,获取二级节点名称,为每个二级节点分配一个保存容器,将所述保存容器与所述二级节点名称进行映射保存。
在其中一个实施例中,所述装置还包括:验证模块,用于获取与每个字段信息对应的验证规则,根据所述验证规则对提取的数据进行校验,若验证通过,则通知录入模块将提取到的数据与相应的字段信息进行关联保存到数据库。
在其中一个实施例中,所述装置还包括:关键字提取模块,用于获取所述投诉案件中投诉内容字段对应的投诉内容信息,提取所述投诉内容信息中的投诉关键字;计算模块,用于分别计算所述投诉关键字与不同投诉类型对应的预留关键字之间的相似度,根据所述相似度确定与所述投诉内容信息匹配的投诉类型;归类模块,用于根据匹配到的投诉类型将所述投诉案件进行归类。
在其中一个实施例中,所述计算模块还用于获取所述投诉关键字对应的词向量,获取所述预留关键字对应的词向量,根据所述投诉关键字对应的词向量和所述预留关键字对应的词向量采用皮尔森相关系数算法分别计算所述投诉关键字与不同投诉类型对应的预留关键字之间的相似度。
一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,所述计算机程序被所述处理器执行时,使得所述处理器执行上述投诉案件处理的方法。
一种计算机可读存储介质,存储有计算机程序,所述计算机程序被处理器执行时,使得所述处理器执行上述投诉案件处理的方法。
上述投诉案件处理的方法、装置、计算机设备及存储介质,通过对XML格式的投诉案件进行解析,读取投诉案件的根节点信息,根节点信息包括投诉案件编号和案件类型,读取投诉案件的二级节点,根据二级节点信息的个数分配相应的保存容器,获取每个二级节点对应的三级节点,将三级节点对应的数据保存到相应二级节点对应的保存容器中,其中,每个三级节点对应一个字段信息,然后获取与案件类型匹配的处理模板,获取处理模板包含的字段信息,通过字段匹配的方式获取与每个字段信息匹配的三级节点,从所述三级节点对应的二级节点的保存容器中提取与每个字段信息对应的数据,将提取的数据与相应的字段信息、投诉案件编号关联保存到数据库,这样就完成了投诉案件的自动录入。该投诉案件的处理方法,通过对投诉案件进行解析,自动将相应的数据录入到投诉案件管理系统,不需要人工参与,大大提高了录入效率,且省时省力,同时避免了人工录入的出错率。
附图说明
图1为一个实施例中投诉案件处理的方法的应用环境图;
图2为一个实施例中投诉案件处理的方法流程图;
图3为另一个实施例中投诉案件处理的方法流程图;
图4为一个实施例中计算投诉关键字与预留关键字相似度的方法流程图;
图5为一个实施例中投诉案件处理的装置结构框图;
图6为另一个实施例中投诉案件处理的装置结构框图;
图7为又一个实施例中投诉案件处理的装置结构框图;
图8为一个实施例中计算机设备的内部结构示意图。
具体实施方式
为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
如图1为一个实施例中投诉案件处理的方法的应用环境图。参照图1,该投诉案件处理的方法应用于投诉案件处理的系统。该投诉案件处理的系统包括终端110和服务器120。终端110与服务器120通过网络连接。终端110具体可以是台式终端或移动终端,移动终端具体可以手机、平板电脑、笔记本电脑等中的至少一种。服务器120可以用独立的服务器或者是多个服务器组成的服务器集群来实现。首先,终端110向服务器120上传投案案件,服务器120接收终端110上传的投诉案件,投诉案件是以XML格式存在的,读取投诉案件的根节点信息,根节点信息包括投诉案件编号和案件类型,读取投诉案件的二级节点,为每个二级节点分配一个保存容器,获取每个二级节点对应的三级节点,将三级节点的数据保存到相应二级节点对应的保存容器中,其中,每个三级节点对应一个字段信息,查找与案件类型匹配的处理模板,获取处理模板包含的字段信息,通过字段匹配的方式获取与每个字段信息匹配的三级节点,从三级节点对应的二级节点的保存容器中提取与每个字段信息对应的数据,将提取到的数据与相应的字段信息、以及与所述投诉案件编号关联存储到数据库,完成投诉案件的录入。
如图2所示,在一个实施例中,提出了一种投诉案件处理的方法,该方法包括:
步骤202,接收上传的投诉案件,投诉案件是以XML格式存在的。
其中,投诉案件是指记载了投诉信息的案件。XML(Extensible Markup Language,可扩展标记语言)是一种数据存储语言。XML格式的投诉案件是以树状结构存在的,包括根节点以及二级节点、三级节点等。具体地,服务器接收终端上传的或者监管部门发过来的投诉案件,投诉案件是以XML格式存在的。为了对投诉案件进行处理,需要将投诉案件录入到服务器中的投诉管理系统,这样便于后续的查找和分配。
步骤204,读取投诉案件的根节点信息,根节点信息包括投诉案件编号和案件类型。
其中,由于投诉案件是以树状结构存在的,所以在对投诉案件进行解析时,先读取投诉案件的根节点信息,根节点信息中包括投诉案件编号和案件类型。投诉案件编号用于唯一标识一个投诉案件。在一个实施例中,案件类型是根据投诉案件当前所处的状态来确定的。比如,根据投诉案件的状态将投诉案件分为了转送件、审结件、延期审批件、备注件和督办件等多种案件类型。
步骤206,读取投诉案件的二级节点,为每个二级节点分配一个保存容器。
其中,通过读取投诉案件的二级节点,可以获取到每个二级节点的名称和总的二级节点的个数。不同类型的投诉案件的二级节点的个数和名称不尽相同。比如,转送类案件,二级节点包括:投诉人信息、投诉对象信息、投诉内容信息、保险合同信息、投诉备注信息等。而对于延期审批案件,二级节点包括延期审批信息、备注信息等。其中,每个二级节点对应一个类别。每个二级节点都代表了相应的类别信息,而且二级节点的名称可以直接作为该类信息的名称。比如,投诉人信息这个二级节点就代表了投诉人这个类别。获取到投诉案件的二级节点后,为每个二级节点分配一个保存容器,即为每个二级节点分配相应的存储空间,保存容器用于存储数据。
步骤208,获取每个二级节点对应的三级节点,将三级节点包含的数据保存到相应二级节点对应的保存容器中,其中,每个三级节点对应一个字段信息。
其中,每个二级节点都对应有相应的三级节点,其中,三级节点是二级节点的子节点,是二级节点这个类别下具体的信息,每个三级节点对应一个字段信息,该三级节点中存储了与该字段信息对应的具体数据,比如,在投诉人信息这个二级节点下,包括:投诉人姓名、投诉人性别、投诉人年龄、投诉人职业等4个三级节点,每个三级节点对应的是一个字段信息,比如,投诉人姓名就是三级节点对应的字段信息,该字段信息下包括了具体的姓名,比如,张三。获取三级节点对应的数据,然后将相应的数据保存到相应二级节点对应的保存容器中。二级节点对应的是各个类别,每个二级节点下都包含有一个或多个三级节点,即包含一个或多个字段信息,而三级节点包含了相应字段信息下的具体数据,将获取到的三级节点的数据保存到相应二级节点对应的保存容器中。比如,假设二级节点名称为投诉人信息,那么三级节点中就存储了具体的投诉人信息,比如,存储了具体的姓名、年龄、职业等,所以获取三级节点的数据就是获取具体的投诉案件所包含的内容。
步骤210,查找与案件类型匹配的处理模板,获取处理模板包含的字段信息。
其中,预先设置了不同案件类型对应的处理模板,由于不同案件类型包含的字段信息不同,所以相应的处理模板不同。处理模板用于获取与各个字段信息对应的数据,然后保存到数据库,从而完成相应数据的录入。具体地,首先根据案件类型获取与之匹配的处理模板,然后提取该处理模板中包含的字段信息。处理模板中包含了对应投诉案件的各个字段信息。
步骤212,通过字段匹配的方式获取与每个字段信息匹配的三级节点,从三级节点对应的二级节点的保存容器中提取与每个字段信息对应的数据。
其中,获取到处理模板中包含的各个字段信息后,根据字段信息采用字段匹配的方式获取与每个字段信息匹配的三级节点,由于每个三级节点对应一个字段信息,通过字段匹配的方式就可以获取与每个字段信息对应的三级节点,而三级节点都对应有唯一的二级节点,二级节点又对应有相应的保存容器。所以获取到与字段信息匹配的三级节点就获取到了与该字段信息匹配的保存容器,从该保存容器中提取与每个字段信息对应的数据。。比如,一个保存容器与投诉人信息(二级节点的名称)对应,其中,投诉人信息包括投诉人姓名、身份证号等字段信息(三级节点)。即每个保存容器中存储了相应二级节点下的三级节点的所有数据。所以当获取到字段信息后,需要从相应的保存容器中提取相应的数据。
在另一个实施例中,获取字段信息所属的二级节点,从二级节点对应的保存容器中提取与字段信息对应的数据。比如,投诉人姓名属于投诉人信息这个二级节点。具体地,预先设置每个字段信息所属的类别,由于每个二级节点对应一个类别,根据字段信息所属的类别就可以获取相应的二级节点,继而获取到匹配的保存容器。
步骤214,将提取到的数据与相应的字段信息、以及与投诉案件编号关联存储到数据库,完成投诉案件的录入。
其中,提取到数据后,将该提取到的数据与相应的字段信息、投诉案件编号进行关联保存到数据库,比如,如果提取的信息为投诉人的姓名:张三,将张三与投诉人姓名这个字段信息进行关联,同时将张三与相应的投诉案件编号关联,然后保存到数据库。保存到数据库的过程就是录入到投诉管理系统的过程。这样后续根据投诉案件编号就可以获取到投诉案件中各个字段信息对应的内容。当所有的数据都保存到数据库后,即完成了投诉案件的自动录入。
上述投诉案件处理的方法,通过对XML格式的投诉案件进行解析,读取投诉案件的根节点信息,根节点信息包括投诉案件编号和案件类型,读取投诉案件的二级节点,根据二级节点信息的个数分配相应的保存容器,获取每个二级节点对应的三级节点,将三级节点对应的数据保存到相应二级节点对应的保存容器中,其中,每个三级节点对应一个字段信息,然后获取与案件类型匹配的处理模板,获取处理模板包含的字段信息,通过字段匹配的方式获取与每个字段信息匹配的三级节点,从所述三级节点对应的二级节点的保存容器中提取与每个字段信息对应的数据,将提取的数据与相应的字段信息、投诉案件编号关联保存到数据库,这样就完成了投诉案件的自动录入。该投诉案件的处理方法,通过对投诉案件进行解析,自动将相应的数据录入到投诉案件管理系统,不需要人工参与,大大提高了录入效率,且省时省力,同时避免了人工录入的出错率。
在一个实施例中,读取投诉案件的二级节点,根据二级节点的个数分配相应的保存容器的步骤包括:当二级节点的个数大于已有的保存容器的个数时,则动态创建新的保存容器,以使二级节点与保存容器一一对应;获取二级节点名称,为每个二级节点分配一个保存容器,将保存容器与二级节点名称进行映射保存。
具体地,由于不同案件类型所对应的二级节点的个数和名称都不同。为了不浪费保存容器,一般不会提前准备太多的保存容器,因为保存容器是占用存储空间的,一旦创建了保存容器那么相应的存储空间就被占用了,所以一般只是预先准备了一般情况下使用的保存容器的个数。当发现二级节点的个数大于已有的保存容器的个数时,则动态创建新的保存容器,保证每个二级节点都对应一个保存容器,即二级节点与保存容器是一一对应的关系。然后获取二级节点的名称,为每个二级节点分配一个保存容器后,将保存容器与二级节点名称进行映射保存,便于后续查找与字段匹配的保存容器,然后从保存容器中获取相应的数据。
在一个实施例中,在通过字段匹配的方式获取与每个字段信息匹配的保存容器,从保存容器中提取与每个字段信息对应的数据的步骤之后还包括:获取与每个字段信息对应的验证规则,根据验证规则对提取的数据进行校验,若验证通过,则进入将提取到的数据与相应的字段信息进行关联保存到数据库的步骤。
具体地,从保存容器中提取到与每个字段信息对应的数据后,为了保证录入到系统的数据是准确的,还需要对获取到的数据进行校验,每个字段信息对应的校验规则不同,预先存储了与每个字段信息对应的校验规则。所以获取到数据后,根据字段信息获取相应的验证规则,然后根据验证规则对提取的数据进行校验,若校验通过,则将相应的数据保存到数据库,若校验失败,则返回失败的提示。举个例子,对于投诉人身份证信息的校验,可以设置校验身份证号的位数,如果少于或多于18位,则返回提示错误。此外,还可以进行交叉验证,比如,获取投诉人的性别,然后根据投诉人性别与身份证号中表示性别的数字进行校验,若两者不一致,则返回校验失败,返回提示错误。校验的规则可以根据实际需要预先设置。
如图3所示,在一个实施例中,上述投诉案件处理的方法还包括:
步骤216,获取投诉内容字段对应的投诉内容信息,提取投诉内容信息中的投诉关键字。
其中,不管是哪种类型的投诉案件,里面都包含有投诉内容字段,即都包含有投诉内容信息。因为既然是投诉案件,必然会涉及到具体的投诉内容。为了便于后续有针对性地对投诉案件进行处理,需要根据具体投诉内容信息对投诉进行投诉类型的识别,预先根据投诉内容所针对的对象或所处的环节将投案内容分为多个投诉类型,比如,可以根据服务、价格、诚信等方面的因素分为服务投诉、价格投诉、诚信投诉。根据投诉类型将相应的投诉案件进行细分归类,有利于后续根据投诉类型自动将相应的投诉案件进行分配,便于针对性处理。具体地,投诉类型的识别方式可以采用关键字匹配的方式。首先,提取投诉内容信息中的投诉关键字。具体地,首先对投诉内容信息进行预处理,去除一些没有意义的词,比如,的、得、地等停用词,然后对预处理后的投诉内容信息进行切词处理得到一元词,二元词,三元词等,其中,一元词是指只包含有一个字的词,二元词是指包含有两个字的词等。然后获取预设的投诉词,通过词语匹配的方式提取出该投诉内容信息中的投诉关键词。在另一个实施例中,也可以直接设置在投诉内容中投诉关键字选项,即投诉案件中本身里面包含有投诉关键字,这样就可以直接获取投诉关键字。
步骤218,分别计算投诉关键字与不同投诉类型对应的预留关键字之间的相似度,根据相似度确定与投诉内容信息匹配的投诉类型。
其中,获取到投诉内容信息中的投诉关键字后,还需要获取不同投诉类型对应的预留关键字。预先根据投诉内容不同分为多种投诉类型,然后每种投诉类预先设置相应的预留关键字。计算投诉关键字与不同投诉类型对应的预留关键字之间的相似度,然后根据相似度确定与投诉内容信息匹配的投诉类型。具体地,可以首先采用word2vec方法将投诉关键字表示为向量的形式,word2vec是一个将单词转换成向量形式的工具,可以把文本内容的处理简化为向量空间的向量运算。同时获取预留关键字对应的向量表示,然后根据向量计算投诉关键字与预留关键字的相似度来确定投诉内容属于哪个分类,自动根据投诉类型进行归类,便于后续自动分配相应的投诉案件。相似度的计算可以采用多种方法,比如,欧式距离,皮尔森相关系数算法。
步骤220,根据匹配到的投诉类型将投诉案件进行归类。
具体地,获取到与投诉内容信息匹配的投诉类型后,将相应的投诉案件根据投诉类型进行归类。即将投诉案件标记为匹配到的投诉类型。这样便于后续根据投诉类型自动将该投诉案件进行分配。比如,首先根据投诉案件的案件类型将该投诉案件分配到相应的机构部分,然后根据投诉类型分配到具体的工作人员。对于一个部门来说往往主要负责同一案件类型的案件,然后每个工作人员主要负责某一种投诉类型的案件。通过明确分工有助于提高工作效率。
如图4所示,在一个实施例中,计算投诉关键字与不同投诉类型对应的预留关键字之间的相似度,根据相似度确定与投诉内容信息匹配的投诉类型的步骤218包括:
步骤218A,获取投诉关键字对应的词向量,获取预留关键字对应的词向量。
其中,投诉关键字对应的词向量是指投诉关键字的向量表示,即将投诉关键字转化为向量的表示形式。同样地,预留关键字对应的词向量是指预留关键字的向量表示。具体地,可以采用word2vec方法来获取相应的向量表示。其中,word2vec是一个将单词转换成向量形式的工具,可以把文本内容的处理简化为向量空间的向量运算。
步骤218B,根据投诉关键字对应的词向量和预留关键字对应的词向量采用皮尔森相关系数算法分别计算投诉关键字与不同投诉类型对应的预留关键字之间的相似度。
其中,在确定了投诉关键字对应的词向量以及各个预留关键字对应的词向量后,通过皮尔森相关系数算法来计算投诉关键字与不同投诉类型对应的预留关键字之间的相似度。具体地,假设预设关键字的向量表示为:W=(w1,w2,…,wn),任一预留关键字的词向量表示为X=(x1,x2,…,xn),那么它们之间的相似度s(W,X)为:
Figure BDA0001520910300000121
其中,i表示词向量中的第i个词向量特征。如果投诉关键字有多个,分别计算每个投诉关键字与预留关键字的相似度,然后通过加权求和得到投诉关键词与每个投诉类型的相似度,将相似度最高的投诉类型作为匹配的投诉类型。
在投诉案件的处理过程中,为了将自动录入到系统的投诉案件进行归类处理,通过获取能够代表投诉内容信息的投诉关键字,然后计算投诉关键字与各个投诉类型对应的预留关键字之间的相似度,然后将计算得到的相似度度最大的投诉类型作为与投诉案件匹配的投诉类型,将该投诉案件归类到该投诉类型,便于分类存储以及后续的根据投诉类型将投诉案件进行分配。其中,相似度的计算采用的是皮尔森相关系数计算算法,通过将该相似度的算法运用到投诉案件中的分类中,实现了自动识别投诉案件的投诉类型,然后进行归类的目的。不仅省时省力,而且大大节约了人工成本。
如图5所示,在一个实施例中,提出了一种投诉案件处理的装置,该装置包括:
接收模块502,用于接收上传的投诉案件,所述投诉案件是以XML格式存在的;
根节点读取模块504,用于读取所述投诉案件的根节点信息,所述根节点信息包括投诉案件编号和案件类型;
分配模块506,用于读取所述投诉案件的二级节点,为每个二级节点分配一个保存容器;
保存模块508,用于获取每个二级节点对应的三级节点,将所述三级节点包含的数据保存到相应二级节点对应的保存容器中,其中,每个三级节点对应一个字段信息;
查找模块510,用于查找与所述案件类型匹配的处理模板,获取所述处理模板包含的字段信息;
匹配模块512,用于通过字段匹配的方式获取与每个字段信息匹配的三级节点,从所述三级节点对应的二级节点的保存容器中提取与每个字段信息对应的数据;
录入模块514,用于将提取到的数据与相应的字段信息、以及与所述投诉案件编号关联存储到数据库,完成投诉案件的录入。
在一个实施例中,分配模块506还用于当所述二级节点的个数大于已有的保存容器的个数时,则动态创建新的保存容器,以使二级节点与保存容器一一对应,获取二级节点名称,根据所述二级节点名称为每个二级节点分配一个保存容器,将所述保存容器与所述二级节点名称进行映射保存。
如图6所示,在一个实施例中,上述投诉案件处理的装置还包括:
验证模块513,用于获取与每个字段信息对应的验证规则,根据所述验证规则对提取的数据进行校验,若验证通过,则通知录入模块将提取到的数据与相应的字段信息进行关联保存到数据库。
如图7所示,在一个实施例中,上述投诉案件处理的装置还包括:
关键字提取模块516,用于获取所述投诉案件中投诉内容字段对应的投诉内容信息,提取所述投诉内容信息中的投诉关键字;
计算模块518,用于分别计算所述投诉关键字与不同投诉类型对应的预留关键字之间的相似度,根据所述相似度确定与所述投诉内容信息匹配的投诉类型;
归类模块520,用于根据匹配到的投诉类型将所述投诉案件进行归类。
在一个实施例中,计算模块518还用于获取所述投诉关键字对应的词向量,获取所述预留关键字对应的词向量,根据所述投诉关键字对应的词向量和所述预留关键字对应的词向量采用皮尔森相关系数算法分别计算所述投诉关键字与不同投诉类型对应的预留关键字之间的相似度。
上述投诉案件处理的装置可以实现为一种计算机程序的形式,计算机程序可以在如图8所示的计算机设备上运行。
如图8所示,为一个实施例中计算机设备的内部结构示意图。该计算机设备是服务器,服务器可以是独立的服务器,也可以是服务器集群。参照图8,该计算机设备包括通过系统总线连接的处理器、非易失性存储介质、内存储器和网络接口。其中,该计算机设备的处理器用于提供计算和控制能力,支撑整个计算机设备的运行。该计算机设备的非易失性存储介质可存储操作系统和计算机程序,该内存储器为非易失性存储介质中的操作系统和计算机程序的运行提供环境。该计算机设备的网络接口用于与外部的终端通过网络连接通信。该计算机程序被执行时,可使得处理器执行一种投诉案件处理的方法。本领域技术人员可以理解,图8中示出的结构,仅仅是与本申请方案相关的部分结构的框图,并不构成对本申请方案所应用于其上的计算机设备的限定,具体的计算机设备可以包括比图中所示更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。
一种计算机设备,所述计算机设备包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现以下步骤:接收上传的投诉案件,所述投诉案件是以XML格式存在的;读取所述投诉案件的根节点信息,所述根节点信息包括投诉案件编号和案件类型;读取所述投诉案件的二级节点,为每个二级节点分配一个保存容器;获取每个二级节点对应的三级节点,将所述三级节点的数据保存到相应二级节点对应的保存容器中,其中,每个三级节点对应一个字段信息;查找与所述案件类型匹配的处理模板,获取所述处理模板中包含的字段信息;通过字段匹配的方式获取与每个字段信息匹配的三级节点,从所述三级节点对应的二级节点的保存容器中提取与每个字段信息对应的数据;将提取到的数据与相应的字段信息、以及与所述投诉案件编号关联存储到数据库,完成投诉案件的录入。
在一个实施例中,所述读取所述投诉案件的二级节点,根据所述二级节点的个数分配相应的保存容器的步骤包括:当所述二级节点的个数大于已有的保存容器的个数时,则动态创建新的保存容器,以使二级节点与保存容器一一对应;获取二级节点名称,根据所述二级节点名称为每个二级节点分配一个保存容器,将所述保存容器与所述二级节点名称进行映射保存。
在一个实施例中,所述处理器在执行所述通过字段匹配的方式获取与每个字段信息匹配的保存容器,从所述保存容器中提取与每个字段信息对应的数据的步骤之后,还用于执行以下步骤:获取与每个字段信息对应的验证规则,根据所述验证规则对提取的数据进行校验,若验证通过,则进入将提取到的数据与相应的字段信息进行关联保存到数据库的步骤。
在一个实施例中,所述处理器还用于执行以下步骤:获取所述投诉案件中投诉内容字段对应的投诉内容信息,提取所述投诉内容信息中的投诉关键字;计算所述投诉关键字与不同投诉类型对应的预留关键字之间的相似度,根据所述相似度确定与所述投诉内容信息匹配的投诉类型;根据匹配到的投诉类型将所述投诉案件进行归类。
在一个实施例中,所述计算所述投诉关键字与不同投诉类型对应的预留关键字之间的相似度,根据所述相似度确定与所述投诉内容信息匹配的投诉类型的步骤包括:获取所述投诉关键字对应的词向量,获取所述预留关键字对应的词向量;根据所述投诉关键字对应的词向量和所述预留关键字对应的词向量采用皮尔森相关系数算法分别计算所述投诉关键字与不同投诉类型对应的预留关键字之间的相似度。
一种计算机可读存储介质,存储有计算机程序,所述计算机程序被处理器执行时,使得所述处理器执行以下步骤:接收上传的投诉案件,所述投诉案件是以XML格式存在的;读取所述投诉案件的根节点信息,所述根节点信息包括投诉案件编号和案件类型;读取所述投诉案件的二级节点,为每个二级节点分配一个保存容器;获取每个二级节点对应的三级节点,将所述三级节点的数据保存到相应二级节点对应的保存容器中,其中,每个三级节点对应一个字段信息;查找与所述案件类型匹配的处理模板,获取所述处理模板中包含的字段信息;通过字段匹配的方式获取与每个字段信息匹配的三级节点,从所述三级节点对应的二级节点的保存容器中提取与每个字段信息对应的数据;将提取到的数据与相应的字段信息、以及与所述投诉案件编号关联存储到数据库,完成投诉案件的录入。
在一个实施例中,所述读取所述投诉案件的二级节点信息,根据所述二级节点的个数分配相应的保存容器的步骤包括:当所述二级节点的个数大于已有的保存容器的个数时,则动态创建新的保存容器,以使二级节点与保存容器一一对应;获取二级节点名称,根据所述二级节点名称为每个二级节点分配一个保存容器,将所述保存容器与所述二级节点名称进行映射保存。
在一个实施例中,所述处理器在执行所述通过字段匹配的方式获取与每个字段信息匹配的保存容器,从所述保存容器中提取与每个字段信息对应的数据的步骤之后,还用于执行以下步骤:获取与每个字段信息对应的验证规则,根据所述验证规则对提取的数据进行校验,若验证通过,则进入将提取到的数据与相应的字段信息进行关联保存到数据库的步骤。
在一个实施例中,所述处理器还用于执行以下步骤:获取所述投诉案件中投诉内容字段对应的投诉内容信息,提取所述投诉内容信息中的投诉关键字;计算所述投诉关键字与不同投诉类型对应的预留关键字之间的相似度,根据所述相似度确定与所述投诉内容信息匹配的投诉类型;根据匹配到的投诉类型将所述投诉案件进行归类。
在一个实施例中,所述计算所述投诉关键字与不同投诉类型对应的预留关键字之间的相似度,根据所述相似度确定与所述投诉内容信息匹配的投诉类型的步骤包括:获取所述投诉关键字对应的词向量,获取所述预留关键字对应的词向量;根据所述投诉关键字对应的词向量和所述预留关键字对应的词向量采用皮尔森相关系数算法分别计算所述投诉关键字与不同投诉类型对应的预留关键字之间的相似度。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,该计算机程序可存储于一计算机可读取存储介质中,该程序在执行时,可包括如上述各方法的实施例的流程。其中,前述的存储介质可为磁碟、光盘、只读存储记忆体(Read-Only Memory,ROM)等非易失性存储介质,或随机存储记忆体(Random Acce Memory,RAM)等。
以上所述实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。
以上所述实施例仅表达了本发明的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对发明专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本发明构思的前提下,还可以做出若干变形和改进,这些都属于本发明的保护范围。因此,本发明专利的保护范围应以所附权利要求为准。

Claims (10)

1.一种投诉案件处理的方法,其特征在于,所述方法包括:
接收上传的投诉案件,所述投诉案件是以XML格式存在的;
读取所述投诉案件的根节点信息,所述根节点信息包括投诉案件编号和案件类型;
读取所述投诉案件的二级节点,为每个二级节点分配一个保存容器;包括:当所述二级节点的个数大于已有的保存容器的个数时,则动态创建新的保存容器,以使二级节点与保存容器一一对应;获取二级节点名称,为每个二级节点分配一个保存容器,将所述保存容器与所述二级节点名称进行映射保存;
获取每个二级节点对应的三级节点,将所述三级节点包含的数据保存到相应二级节点对应的保存容器中,其中,每个三级节点对应一个字段信息;
查找与所述案件类型匹配的处理模板,获取所述处理模板包含的字段信息;
通过字段匹配的方式获取与每个字段信息匹配的三级节点,从所述三级节点对应的二级节点的保存容器中提取与每个字段信息对应的数据;
将提取到的数据与相应的字段信息、以及与所述投诉案件编号关联存储到数据库,完成投诉案件的录入。
2.根据权利要求1所述的方法,其特征在于,通过读取投诉案件的二级节点,获取每个二级节点的名称和总的二级节点的个数。
3.根据权利要求1所述的方法,其特征在于,在所述通过字段匹配的方式获取与每个字段信息匹配的保存容器,从所述保存容器中提取与每个字段信息对应的数据的步骤之后还包括:
获取与每个字段信息对应的验证规则,根据所述验证规则对提取的数据进行校验,若验证通过,则进入将提取到的数据与相应的字段信息进行关联保存到数据库的步骤。
4.根据权利要求1所述的方法,其特征在于,所述方法还包括:
获取所述投诉案件中投诉内容字段对应的投诉内容信息,提取所述投诉内容信息中的投诉关键字;
分别计算所述投诉关键字与不同投诉类型对应的预留关键字之间的相似度,根据所述相似度确定与所述投诉内容信息匹配的投诉类型;
根据匹配到的投诉类型将所述投诉案件进行归类。
5.根据权利要求4所述的方法,其特征在于,所述计算所述投诉关键字与不同投诉类型对应的预留关键字之间的相似度,根据所述相似度确定与所述投诉内容信息匹配的投诉类型的步骤包括:
获取所述投诉关键字对应的词向量,获取所述预留关键字对应的词向量;
根据所述投诉关键字对应的词向量和所述预留关键字对应的词向量采用皮尔森相关系数算法分别计算所述投诉关键字与不同投诉类型对应的预留关键字之间的相似度。
6.一种投诉案件处理的装置,其特征在于,所述装置包括:
接收模块,用于接收上传的投诉案件,所述投诉案件是以XML格式存在的;
根节点读取模块,用于读取所述投诉案件的根节点信息,所述根节点信息包括投诉案件编号和案件类型;
分配模块,用于读取所述投诉案件的二级节点,为每个二级节点分配一个保存容器;所述分配模块还用于当所述二级节点的个数大于已有的保存容器的个数时,则动态创建新的保存容器,以使二级节点与保存容器一一对应,获取二级节点名称,为每个二级节点分配一个保存容器,将所述保存容器与所述二级节点名称进行映射保存;
保存模块,用于获取每个二级节点对应的三级节点,将所述三级节点包含的数据保存到相应二级节点对应的保存容器中,其中,每个三级节点对应一个字段信息;
查找模块,用于查找与所述案件类型匹配的处理模板,获取所述处理模板包含的字段信息;
匹配模块,用于通过字段匹配的方式获取与每个字段信息匹配的三级节点,从所述三级节点对应的二级节点的保存容器中提取与每个字段信息对应的数据;
录入模块,用于将提取到的数据与相应的字段信息、以及与所述投诉案件编号关联存储到数据库,完成投诉案件的录入。
7.根据权利要求6所述的装置,其特征在于,通过读取投诉案件的二级节点,获取每个二级节点的名称和总的二级节点的个数。
8.根据权利要求6所述的装置,其特征在于,所述装置还包括:
验证模块,用于获取与每个字段信息对应的验证规则,根据所述验证规则对提取的数据进行校验,若验证通过,则通知录入模块将提取到的数据与相应的字段信息进行关联保存到数据库。
9.一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,其特征在于,所述计算机程序被所述处理器执行时,使得所述处理器执行如权利要求1至5中任一项所述方法的步骤。
10.一种计算机可读存储介质,存储有计算机程序,其特征在于,所述计算机程序被处理器执行时,使得所述处理器执行如权利要求1至5中任一项所述方法的步骤。
CN201711409014.9A 2017-12-22 2017-12-22 投诉案件处理的方法、装置、计算机设备及存储介质 Active CN108170759B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201711409014.9A CN108170759B (zh) 2017-12-22 2017-12-22 投诉案件处理的方法、装置、计算机设备及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201711409014.9A CN108170759B (zh) 2017-12-22 2017-12-22 投诉案件处理的方法、装置、计算机设备及存储介质

Publications (2)

Publication Number Publication Date
CN108170759A CN108170759A (zh) 2018-06-15
CN108170759B true CN108170759B (zh) 2020-10-23

Family

ID=62523686

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201711409014.9A Active CN108170759B (zh) 2017-12-22 2017-12-22 投诉案件处理的方法、装置、计算机设备及存储介质

Country Status (1)

Country Link
CN (1) CN108170759B (zh)

Families Citing this family (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109460732B (zh) * 2018-11-05 2020-11-10 泰康保险集团股份有限公司 基于图像识别的投保信息处理方法、装置及可读存储介质
CN109710568A (zh) * 2018-12-18 2019-05-03 深圳壹账通智能科技有限公司 理赔文件格式标准化处理的方法、装置、介质及电子设备
CN109816399A (zh) * 2019-01-07 2019-05-28 平安科技(深圳)有限公司 投诉件的管理方法、装置、计算机设备和存储介质
CN109753535A (zh) * 2019-01-11 2019-05-14 深圳讼融通网络科技有限公司 案件数据的录入方法、设备及计算机可读存储介质
CN109697605A (zh) * 2019-01-11 2019-04-30 深圳讼融通网络科技有限公司 财产保全数据记录的生成方法、系统及可读存储介质
CN109961214A (zh) * 2019-02-13 2019-07-02 平安科技(深圳)有限公司 投诉对接处理人分配方法、装置、计算机设备及存储介质
CN110390000A (zh) * 2019-07-30 2019-10-29 同方赛威讯信息技术有限公司 一种法律文书自动识别、生成系统及其方法
CN111553817A (zh) * 2020-04-24 2020-08-18 北京北大软件工程股份有限公司 一种投诉举报案件及处理部门的吻合度的分析方法和系统
CN112925911B (zh) * 2021-02-25 2022-08-12 平安普惠企业管理有限公司 基于多模态数据的投诉分类方法及其相关设备

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101067814A (zh) * 2007-05-10 2007-11-07 浪潮集团山东通用软件有限公司 数据访问层Xml格式数据与关系数据间的映射转换方法
CN102456053A (zh) * 2010-11-02 2012-05-16 江苏大学 一种xml文档到数据库的映射方法
CN103679461A (zh) * 2012-09-03 2014-03-26 中国银联股份有限公司 一种基于xml的电子票据处理方法和系统
CN104112004A (zh) * 2014-07-15 2014-10-22 浪潮通用软件有限公司 一种用户界面上智能拷贝数据的方法
CN104361018A (zh) * 2014-10-17 2015-02-18 李名选 电子档案信息整编方法及装置

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20040153968A1 (en) * 2002-10-24 2004-08-05 Jennie Ching Method and system for user customizable asset metadata generation in a web-based asset management system

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101067814A (zh) * 2007-05-10 2007-11-07 浪潮集团山东通用软件有限公司 数据访问层Xml格式数据与关系数据间的映射转换方法
CN102456053A (zh) * 2010-11-02 2012-05-16 江苏大学 一种xml文档到数据库的映射方法
CN103679461A (zh) * 2012-09-03 2014-03-26 中国银联股份有限公司 一种基于xml的电子票据处理方法和系统
CN104112004A (zh) * 2014-07-15 2014-10-22 浪潮通用软件有限公司 一种用户界面上智能拷贝数据的方法
CN104361018A (zh) * 2014-10-17 2015-02-18 李名选 电子档案信息整编方法及装置

Also Published As

Publication number Publication date
CN108170759A (zh) 2018-06-15

Similar Documents

Publication Publication Date Title
CN108170759B (zh) 投诉案件处理的方法、装置、计算机设备及存储介质
WO2022078346A1 (zh) 文本意图识别方法、装置、电子设备及存储介质
CN107833603B (zh) 电子病历文档分类方法、装置、电子设备及存储介质
CN109872162B (zh) 一种处理用户投诉信息的风控分类识别方法及系统
CN110795919A (zh) 一种pdf文档中的表格抽取方法、装置、设备及介质
CN109189888B (zh) 电子装置、侵权分析的方法及存储介质
CN108305050B (zh) 报案信息及服务需求信息的提取方法、装置、设备及介质
WO2021043076A1 (zh) 网络发布数据处理方法、装置、计算机设备和存储介质
CN112667805B (zh) 一种工单类别确定方法、装置、设备及介质
CN112330214A (zh) 合同审阅方法、装置及可读存储介质
CN109947903B (zh) 一种成语查询方法及装置
JP2019169126A (ja) 人工知能に基づく三元組チェック方法、装置及びコンピュータプログラム
CN115935344A (zh) 一种异常设备的识别方法、装置及电子设备
CN113641794A (zh) 简历文本的评估方法、装置及服务器
CN114357174B (zh) 基于ocr和机器学习的代码分类系统及方法
CN110532449B (zh) 一种业务文档的处理方法、装置、设备和存储介质
CN116796726A (zh) 简历解析方法、装置、终端设备及介质
CN110532229B (zh) 证据文件检索方法、装置、计算机设备和存储介质
CN111444718A (zh) 一种保险产品需求文档处理方法、装置及电子设备
CN111563429A (zh) 一种图纸校对方法、装置、电子设备及存储介质
CN107943881B (zh) 题库生成方法、服务器及计算机可读存储介质
CN110533381B (zh) 案件管辖权审核方法、装置、计算机设备和存储介质
CN113569996B (zh) 病案信息的分类方法、装置、设备以及存储介质
CN113642291B (zh) 上市公司报告的逻辑结构树构建方法、系统、存储介质及终端
CN115687136A (zh) 一种脚本程序处理方法、系统、计算机设备及介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant