CN112307157A - 申诉意见挖掘方法和装置 - Google Patents
申诉意见挖掘方法和装置 Download PDFInfo
- Publication number
- CN112307157A CN112307157A CN201910687958.5A CN201910687958A CN112307157A CN 112307157 A CN112307157 A CN 112307157A CN 201910687958 A CN201910687958 A CN 201910687958A CN 112307157 A CN112307157 A CN 112307157A
- Authority
- CN
- China
- Prior art keywords
- complaint
- information
- characteristic
- words
- feature
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 33
- 238000005065 mining Methods 0.000 title claims abstract description 31
- 238000004458 analytical method Methods 0.000 claims abstract description 19
- 238000000605 extraction Methods 0.000 claims abstract description 17
- 238000012545 processing Methods 0.000 claims description 51
- 238000012549 training Methods 0.000 claims description 33
- 230000002996 emotional effect Effects 0.000 claims description 21
- 238000012360 testing method Methods 0.000 claims description 16
- 239000013598 vector Substances 0.000 claims description 10
- 238000004590 computer program Methods 0.000 claims description 9
- 230000036651 mood Effects 0.000 claims description 8
- 230000011218 segmentation Effects 0.000 claims description 6
- 238000007418 data mining Methods 0.000 claims description 4
- 239000000284 extract Substances 0.000 abstract description 8
- 238000010586 diagram Methods 0.000 description 8
- 206010012186 Delayed delivery Diseases 0.000 description 7
- 238000004891 communication Methods 0.000 description 5
- 230000010365 information processing Effects 0.000 description 4
- 238000002372 labelling Methods 0.000 description 4
- 238000011156 evaluation Methods 0.000 description 3
- 238000003058 natural language processing Methods 0.000 description 3
- 230000003287 optical effect Effects 0.000 description 2
- 230000009466 transformation Effects 0.000 description 2
- 230000008451 emotion Effects 0.000 description 1
- 230000014509 gene expression Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000005192 partition Methods 0.000 description 1
- 238000003672 processing method Methods 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/3331—Query processing
- G06F16/334—Query execution
- G06F16/3344—Query execution using natural language analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/35—Clustering; Classification
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/01—Customer relationship services
- G06Q30/015—Providing customer assistance, e.g. assisting a customer within a business location or via helpdesk
- G06Q30/016—After-sales
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Physics & Mathematics (AREA)
- Databases & Information Systems (AREA)
- Business, Economics & Management (AREA)
- General Engineering & Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Development Economics (AREA)
- Artificial Intelligence (AREA)
- Accounting & Taxation (AREA)
- Computational Linguistics (AREA)
- Economics (AREA)
- Finance (AREA)
- Marketing (AREA)
- Strategic Management (AREA)
- General Business, Economics & Management (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明实施例提供一种申诉意见挖掘方法和装置。所述方法包括:获取申诉者的申诉信息;对所述申诉信息进行语义分析和特征提取,得到有效的申诉特征词;将所述有效的申诉特征词与申诉意见数据库中的信息进行匹配,抽取出多维度的申诉意见;其中,所述申诉意见数据库包括申诉者特征模型、申诉单特征模型、企业特征模型和监管者特征模型。本发明实施例通过提取出申诉意见的特征词,将申诉特征词与申诉意见数据库进行匹配,得到申诉信息的多维度意见信息,申诉意见全面且准确性高。
Description
技术领域
本发明涉及自然语言处理领域,尤其涉及一种申诉意见挖掘方法和装置。
背景技术
自然语言处理是通过技术分析手段对人类的自然语言进行处理,达到识别语义、理解语言情绪的目的。技术分析手段运用了推测学、机率、统计的方法,尤其是针对容易高度模糊的长串句子,当套用实际文法进行分析产生出成千上万笔可能性时所引发之难题。
意见挖掘是当前自然语言处理研究的热点,其目标是从评价文本中自动抽取出主观意见(简称意见)。意见是一个特定的信息单元,它涵盖了意见目标和意见情感表达,并蕴含了特定观点极性。例如申诉系统中,涉及大量申诉案件相关信息化数据,包含如下几类信息:1、案件关联各方的基本信息,如名称、地址、联系方式等;2、案件案情相关的特征信息,如丢包裹、态度恶劣、延迟投递等;3、案件申诉方情绪特征信息,如生气、稳定等。
对于上述信息,当前的处理方法是通过人工主观判断的方法,将其转变为分类的结构化信息。这种方法不但造成大量的人工负担,而且会受到主观判断的差异,而影响结果的准确性。
发明内容
针对现有技术问题,本发明实施例提供一种申诉意见挖掘方法和装置。
本发明实施例提供一种申诉意见挖掘方法,所述方法包括:
获取申诉者的申诉信息;
对所述申诉信息进行语义分析和特征提取,得到有效的申诉特征词;
将所述有效的申诉特征词与申诉意见数据库中的信息进行匹配,抽取出多维度的申诉意见;
其中,所述申诉意见数据库包括申诉者特征模型、申诉单特征模型、企业特征模型和监管者特征模型。
本发明实施例提供一种申诉意见挖掘装置,所述装置包括:
第一获取单元,用于获取申诉者的申诉信息;
处理单元,用于对所述申诉信息进行语义分析和特征提取,得到有效的申诉特征词;
抽取单元,用于将所述有效的申诉特征词与申诉意见数据库中的信息进行匹配,抽取出多维度的申诉意见;
其中,所述申诉意见数据库包括申诉者特征模型、申诉单特征模型、企业特征模型和监管者特征模型。
本发明实施例还提供一种电子设备,包括存储器、处理器以及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现上述申诉意见挖掘方法。
本发明实施例还提供一种非暂态计算机可读存储介质,其上存储有计算机程序,所述程序被处理器执行时实现上述申诉意见挖掘方法。
本发明实施例提供的申诉意见挖掘方法和装置,通过提取出申诉意见的特征词,将申诉特征词与申诉意见数据库进行匹配,得到申诉信息的多维度意见信息,申诉意见全面且准确性高。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作一简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明一实施例提供的申诉意见挖掘系统的结构示意图;
图2为本发明一实施例提供的申诉意见挖掘方法的流程示意图;
图3为本发明一实施例提供的申诉意见数据库的构建方法的流程示意图;
图4为本发明一实施例提供的申诉意见挖掘装置的结构示意图;
图5为本发明一实施例提供的构建申诉意见数据库的装置的结构示意图;
图6为本发明一实施例提供的电子设备的结构示意图。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
首先介绍本发明实施例应用的申诉意见挖掘系统。
图1示出了本发明实施例提供的申诉意见挖掘系统的结构示意图。
如图1所示,所述系统包括申诉系统用户操作界面、申诉系统信息处理服务端以及申诉意见数据库。申诉系统用户操作界面包括申诉内容采集模块和身份信息采集模块,用于采集消费者的身份信息、申诉单信息。申诉系统信息处理服务端包括语义分析模块、数据处理模块和意见挖掘模块,用于对采集的申诉信息进行语义分析、处理,并结合申诉意见数据库进行意见挖掘。
图2示出了本发明实施例提供的一种申诉意见挖掘方法的流程示意图。
如图2所示,所述方法具体包括以下步骤:
S11、获取申诉者的申诉信息;
具体地,用户登录申诉系统用户操作界面输入身份信息和申诉单数据。
S12、对所述申诉信息进行语义分析和特征提取,得到有效的申诉特征词;
具体地,申诉系统信息处理服务端通过对申诉单进行语义分析、同义词转化等处理,提取出有效的申诉特征词向量。
S13、将所述有效的申诉特征词与申诉意见数据库中的信息进行匹配,抽取出多维度的申诉意见;
其中,所述申诉意见数据库包括申诉者特征模型、申诉单特征模型、企业特征模型和监管者特征模型。
具体地,本发明实施例提供的申诉意见数据库中包括多个维度的意见模型,如申诉者特征模型、申诉单特征模型、企业特征模型和监管者特征模型。其中每个模型中包括该模型的特征词数据集,如申诉者特征模型包括申诉者的基本信息、情绪特征信息。申诉单特征模型包括案件案情相关的特征信息,如丢包裹、态度恶劣、延迟投递等。
本发明实施例通过将用户提交的申诉单与申诉意见数据库中的信息进行匹配,能够将当前申诉单的特征词提取出来,从而得到该申诉单关于申诉者的信息、案件相关信息或邮政监管者的相关信息等多维度的申诉意见。
本发明实施例提供的申诉意见挖掘方法,通过提取出申诉意见的特征词,将申诉特征词与申诉意见数据库进行匹配,得到申诉信息的多维度意见信息,申诉意见全面且准确性高。
图3示出了本发明实施例提供的申诉意见数据库的构建方法的流程示意图。
如图3所示,所述方法具体包括以下步骤:
S21、获取预先采集的申诉信息及特征词数据集,根据指定的比例划分出训练集与测试集,所述特征词数据集是根据历史已有的申诉信息确定的申诉领域的分类标签,包括申诉者特征词、申诉单特征词、企业特征词和监管者特征词;
具体地,本发明实施例采集大量的申诉信息及申诉领域的特征词进行训练,申诉领域的特征词包括根据历史申诉信息确定的不同类别的特征词,包括申诉者特征词、申诉单特征词、企业特征词和监管者特征词,每一类特征词对应一个分类标签。
S22、根据所述申诉信息的申诉特征词选择相应的数据挖掘算法对所述训练集进行分类训练,并通过测试集对训练结果进行测试,得到与所述分类标签对应的申诉特征词;
具体地,将采集的申诉信息及特征词数据集划分为训练集和测试集,训练集用于提取出训练集中不同类别的特征词,测试集用于对分类出的特征词进行测评,根据测评结果进行反馈、调整训练参数,如此循环训练最终得到准确性高的分类结果。
S23、将所述分类特征词按照不同分类标签进行分类存储,得到所述申诉意见数据库。
具体地,将分类出的特征词分别存储在不同的模型中,例如申诉者特征词存储在申诉者特征模型中,申诉单特征词存储在申诉单特征模型中等等,各模型组成申诉意见数据库。
本发明实施例提供的构建申诉意见数据库的方法,通过采集大量申诉意见进行训练,能够快速构建出不同申诉意见模型,组成申诉意见数据库,模型的稳定性和准确度高。
在上述实施例的基础上,所述申诉者特征模型包括:申诉者基本信息和申诉者情绪信息;其中,所述申诉者基本信息包括:姓名、学历、年龄、身份证号码和性别;所述申诉者情绪信息包括:申诉负面情绪指数和申诉正面情绪指数;
所述申诉单特征模型包括:申诉单基本信息、申诉原因和申诉单处理信息;其中,所述申诉单基本信息包括创建日期、申诉类型、所属区域、申诉企业信息和申诉者信息;所述申诉原因包括快递延误、快递丢失和投递服务;所述申诉单处理信息包括处理结果、处理时限和服务态度;
所述企业特征模型包括:企业所属区域、处理时长和满意度;
所述监管者特征模型包括:处理人员、处理时长和服务态度。
具体地,每个申诉意见模型包括与该模型匹配的申诉特征词,如申诉者特征模型包括申诉者的基本信息、情绪特征信息。申诉单特征模型包括案件案情相关的特征信息,如丢包裹、态度恶劣、延迟投递等。这里不再赘述。
在上述实施例的基础上,步骤S13包括:
将所述申诉特征词与所述申诉者特征模型中的特征词进行匹配,得到申诉者特征词;所述申诉者特征词包括:申诉者基本信息和申诉者情绪信息;
将所述申诉特征词与所述申诉单特征模型中的特征词进行匹配,得到申诉单特征词;所述申诉单特征词包括:申诉单基本信息、申诉原因和申诉单处理信息;
将所述申诉特征词与所述企业特征模型中的特征词进行匹配,得到企业特征词;所述企业特征词包括:企业所属区域、处理时长和满意度;
将所述申诉特征词与所述监管者特征模型中的特征词进行匹配,得到监管者特征词;所述监管者特征词包括:处理人员、处理时长和服务态度。
具体地,将当前用户提交申诉单的申诉特征词与申诉意见数据库中的各个模型进行匹配,能够关联出该申诉单中属于各个模型的特征词。如与申诉者特征模型匹配,关联出申诉者的基本信息、情绪特征信息。与申诉单特征模型匹配,关联出案件案情相关的特征信息,如丢包裹、态度恶劣、延迟投递等。
在上述实施例的基础上,步骤S12包括:
对所述申诉信息的内容进行分词和词性标注;
按照业务类型对标注好词性的内容进行实体命名,并确定词汇间的依存关系;
根据词汇语义和关系对实体词进行编码得到词特征向量;并对同义词进行转化;
抽取有效的实体词的特征向量,得到所述有效的申诉特征词。
具体地,在获取到用户的申诉信息后,首先进行分词处理,获取申诉信息词性。然后使用词性标注算法对语言结构体的词性进行标注。对标注好的语言结构体,按业务类型进行实体命名标记。基于词汇语义和关系,对词语进行编码,并转换成词向量模型,其中,对同义词近义词进行分析和转化。分析申诉信息句法结构、词汇间的依存关系,为语义分析、情感倾向打基础。申诉系统中的重点同义词如表1所示。
表1
图4示出了本发明实施例提供的一种申诉意见挖掘装置的结构示意图。
如图4所示,所述装置包括:第一获取单元11、处理单元12和抽取单元13,其中:
所述第一获取单元11,用于获取申诉者的申诉信息;
具体地,用户登录申诉系统用户操作界面输入身份信息和申诉单数据。
所述处理单元12,用于对所述申诉信息进行语义分析和特征提取,得到有效的申诉特征词;
具体地,申诉系统信息处理服务端通过对申诉单进行语义分析、同义词转化等处理,提取出有效的申诉特征词向量。
所述抽取单元13,用于将所述有效的申诉特征词与申诉意见数据库中的信息进行匹配,抽取出多维度的申诉意见;
其中,所述申诉意见数据库包括申诉者特征模型、申诉单特征模型、企业特征模型和监管者特征模型。
具体地,本发明实施例提供的申诉意见数据库中包括多个维度的意见模型,如申诉者特征模型、申诉单特征模型、企业特征模型和监管者特征模型。其中每个模型中包括该模型的特征词数据集,如申诉者特征模型包括申诉者的基本信息、情绪特征信息。申诉单特征模型包括案件案情相关的特征信息,如丢包裹、态度恶劣、延迟投递等。
本发明实施例通过将用户提交的申诉单与申诉意见数据库中的信息进行匹配,能够将当前申诉单的特征词提取出来,从而得到该申诉单关于申诉者的信息、案件相关信息或邮政监管者的相关信息等多维度的申诉意见。
本发明实施例提供的申诉意见挖掘装置,通过提取出申诉意见的特征词,将申诉特征词与申诉意见数据库进行匹配,得到申诉信息的多维度意见信息,申诉意见全面且准确性高。
图5示出了本发明实施例提供的一种构建申诉意见数据库装置的结构示意图。
如图5所示,所述装置包括:第二获取单元21、训练单元22和存储单元23,其中:
第二获取单元21,用于获取预先采集的申诉信息及特征词数据集,根据指定的比例划分出训练集与测试集,所述特征词数据集是根据历史已有的申诉信息确定的申诉领域的分类标签,包括申诉者特征词、申诉单特征词、企业特征词和监管者特征词;
具体地,本发明实施例采集大量的申诉信息及申诉领域的特征词进行训练,申诉领域的特征词包括根据历史申诉信息确定的不同类别的特征词,包括申诉者特征词、申诉单特征词、企业特征词和监管者特征词,每一类特征词对应一个分类标签。
训练单元22,用于根据所述申诉信息的申诉特征词选择相应的数据挖掘算法对所述训练集进行分类训练,并通过测试集对训练结果进行测试,得到与所述分类标签对应的申诉特征词;
具体地,将采集的申诉信息及特征词数据集划分为训练集和测试集,训练集用于提取出训练集中不同类别的特征词,测试集用于对分类出的特征词进行测评,根据测评结果进行反馈、调整训练参数,如此循环训练最终得到准确性高的分类结果。
存储单元23,用于将所述分类特征词按照不同分类标签进行分类存储,得到所述申诉意见数据库。
具体地,将分类出的特征词分别存储在不同的模型中,例如申诉者特征词存储在申诉者特征模型中,申诉单特征词存储在申诉单特征模型中等等,各模型组成申诉意见数据库。
本发明实施例提供的构建申诉意见数据库的装置,通过采集大量申诉意见进行训练,能够快速构建出不同申诉意见模型,组成申诉意见数据库,模型的稳定性和准确度高。
在上述实施例的基础上,所述申诉者特征模型包括:申诉者基本信息和申诉者情绪信息;其中,所述申诉者基本信息包括:姓名、学历、年龄、身份证号码和性别;所述申诉者情绪信息包括:申诉负面情绪指数和申诉正面情绪指数;
所述申诉单特征模型包括:申诉单基本信息、申诉原因和申诉单处理信息;其中,所述申诉单基本信息包括创建日期、申诉类型、所属区域、申诉企业信息和申诉者信息;所述申诉原因包括快递延误、快递丢失和投递服务;所述申诉单处理信息包括处理结果、处理时限和服务态度;
所述企业特征模型包括:企业所属区域、处理时长和满意度;
所述监管者特征模型包括:处理人员、处理时长和服务态度。
具体地,每个申诉意见模型包括与该模型匹配的申诉特征词,如申诉者特征模型包括申诉者的基本信息、情绪特征信息。申诉单特征模型包括案件案情相关的特征信息,如丢包裹、态度恶劣、延迟投递等。这里不再赘述。
在上述实施例的基础上,所述抽取单元13包括:
第一匹配模块,用于将所述申诉特征词与所述申诉者特征模型中的特征词进行匹配,得到申诉者特征词;所述申诉者特征词包括:申诉者基本信息和申诉者情绪信息;
第二匹配模块,用于将所述申诉特征词与所述申诉单特征模型中的特征词进行匹配,得到申诉单特征词;所述申诉单特征词包括:申诉单基本信息、申诉原因和申诉单处理信息;
第三匹配模块,用于将所述申诉特征词与所述企业特征模型中的特征词进行匹配,得到企业特征词;所述企业特征词包括:企业所属区域、处理时长和满意度;
第四匹配模块,用于将所述申诉特征词与所述监管者特征模型中的特征词进行匹配,得到监管者特征词;所述监管者特征词包括:处理人员、处理时长和服务态度。
具体地,将当前用户提交申诉单的申诉特征词与申诉意见数据库中的各个模型进行匹配,能够关联出该申诉单中属于各个模型的特征词。如与申诉者特征模型匹配,关联出申诉者的基本信息、情绪特征信息。与申诉单特征模型匹配,关联出案件案情相关的特征信息,如丢包裹、态度恶劣、延迟投递等。
在上述实施例的基础上,处理单元12具体包括:
分词及标注模块,用于对所述申诉信息的内容进行分词和词性标注;
实体命名模块,用于按照业务类型对标注好词性的内容进行实体命名,并确定词汇间的依存关系;
编码模块,用于根据词汇语义和关系对实体词进行编码得到词特征向量;并对同义词进行转化;
抽取模块,用于抽取有效的实体词的特征向量,得到所述有效的申诉特征词。
具体地,在获取到用户的申诉信息后,首先进行分词处理,获取申诉信息词性。然后使用词性标注算法对语言结构体的词性进行标注。对标注好的语言结构体,按业务类型进行实体命名标记。基于词汇语义和关系,对词语进行编码,并转换成词向量模型,其中,对同义词近义词进行分析和转化。分析申诉信息句法结构、词汇间的依存关系,为语义分析、情感倾向打基础。
图6示例了一种服务器的实体结构示意图,如图6所示,该服务器可以包括:处理器(processor)31、通信接口(Communications Interface)32、存储器(memory)33和通信总线34,其中,处理器31,通信接口32,存储器33通过通信总线34完成相互间的通信。处理器31可以调用存储器33中的逻辑指令,以执行如下方法:
获取申诉者的申诉信息;
对所述申诉信息进行语义分析和特征提取,得到有效的申诉特征词;
将所述有效的申诉特征词与申诉意见数据库中的信息进行匹配,抽取出多维度的申诉意见;
其中,所述申诉意见数据库包括申诉者特征模型、申诉单特征模型、企业特征模型和监管者特征模型。
此外,上述的存储器33中的逻辑指令可以通过软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。
另一方面,本发明实施例还提供一种非暂态计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现以执行上述各实施例提供的方法,例如包括:
获取申诉者的申诉信息;
对所述申诉信息进行语义分析和特征提取,得到有效的申诉特征词;
将所述有效的申诉特征词与申诉意见数据库中的信息进行匹配,抽取出多维度的申诉意见;
其中,所述申诉意见数据库包括申诉者特征模型、申诉单特征模型、企业特征模型和监管者特征模型。
以上所描述的装置实施例仅仅是示意性的,其中所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。本领域普通技术人员在不付出创造性的劳动的情况下,即可以理解并实施。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到各实施方式可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件。基于这样的理解,上述技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品可以存储在计算机可读存储介质中,如ROM/RAM、磁碟、光盘等,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行各个实施例或者实施例的某些部分所述的方法。
最后应说明的是:以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。
Claims (10)
1.一种申诉意见挖掘方法,其特征在于,所述方法包括:
获取申诉者的申诉信息;
对所述申诉信息进行语义分析和特征提取,得到有效的申诉特征词;
将所述有效的申诉特征词与申诉意见数据库中的信息进行匹配,抽取出多维度的申诉意见;
其中,所述申诉意见数据库包括申诉者特征模型、申诉单特征模型、企业特征模型和监管者特征模型。
2.根据权利要求1所述的申诉意见挖掘方法,其特征在于,所述方法还包括:
获取预先采集的申诉信息及特征词数据集,根据指定的比例划分出训练集与测试集,所述特征词数据集是根据历史申诉信息确定的申诉领域的分类标签,包括申诉者特征词、申诉单特征词、企业特征词和监管者特征词;
根据所述申诉信息的申诉特征词选择相应的数据挖掘算法对所述训练集进行分类训练,并通过测试集对训练结果进行测试,得到与所述分类标签对应的申诉特征词;
将所述分类特征词按照不同分类标签进行分类存储,得到所述申诉意见数据库。
3.根据权利要求1所述的申诉意见挖掘方法,其特征在于,
所述申诉者特征模型包括:申诉者基本信息和申诉者情绪信息;其中,所述申诉者基本信息包括:姓名、学历、年龄、身份证号码和性别;所述申诉者情绪信息包括:申诉负面情绪指数和申诉正面情绪指数;
所述申诉单特征模型包括:申诉单基本信息、申诉原因和申诉单处理信息;其中,所述申诉单基本信息包括创建日期、申诉类型、所属区域、申诉企业信息和申诉者信息;所述申诉原因包括快递延误、快递丢失和投递服务;所述申诉单处理信息包括处理结果、处理时限和服务态度;
所述企业特征模型包括:企业所属区域、处理时长和满意度;
所述监管者特征模型包括:处理人员、处理时长和服务态度。
4.根据权利要求3所述的申诉意见挖掘方法,其特征在于,所述将所述有效的申诉特征词与申诉意见数据库中的信息进行匹配,抽取出多维度的申诉意见包括:
将所述申诉特征词与所述申诉者特征模型中的特征词进行匹配,得到申诉者特征词;所述申诉者特征词包括:申诉者基本信息和申诉者情绪信息;
将所述申诉特征词与所述申诉单特征模型中的特征词进行匹配,得到申诉单特征词;所述申诉单特征词包括:申诉单基本信息、申诉原因和申诉单处理信息;
将所述申诉特征词与所述企业特征模型中的特征词进行匹配,得到企业特征词;所述企业特征词包括:企业所属区域、处理时长和满意度;
将所述申诉特征词与所述监管者特征模型中的特征词进行匹配,得到监管者特征词;所述监管者特征词包括:处理人员、处理时长和服务态度。
5.根据权利要求1所述的申诉意见挖掘方法,其特征在于,所述对所述申诉信息进行语义分析和特征提取,得到有效的申诉特征词包括:
对所述申诉信息的内容进行分词和词性标注;
按照业务类型对标注好词性的内容进行实体命名,并确定词汇间的依存关系;
根据词汇语义和关系对实体词进行编码得到词特征向量;并对同义词进行转化;
抽取有效的实体词的特征向量,得到所述有效的申诉特征词。
6.一种申诉意见挖掘装置,其特征在于,所述装置包括:
第一获取单元,用于获取申诉者的申诉信息;
处理单元,用于对所述申诉信息进行语义分析和特征提取,得到有效的申诉特征词;
抽取单元,用于将所述有效的申诉特征词与申诉意见数据库中的信息进行匹配,抽取出多维度的申诉意见;
其中,所述申诉意见数据库包括申诉者特征模型、申诉单特征模型、企业特征模型和监管者特征模型。
7.根据权利要求6所述的申诉意见挖掘装置,其特征在于,所述装置还包括:
第二获取单元,用于获取预先采集的申诉信息及特征词数据集,根据指定的比例划分出训练集与测试集,所述特征词数据集是根据历史已有的申诉信息确定的申诉领域的分类标签,包括申诉者特征词、申诉单特征词、企业特征词和监管者特征词;
训练单元,用于根据所述申诉信息的申诉特征词选择相应的数据挖掘算法对所述训练集进行分类训练,并通过测试集对训练结果进行测试,得到与所述分类标签对应的申诉特征词;
存储单元,用于将所述分类特征词按照不同分类标签进行分类存储,得到所述申诉意见数据库。
8.根据权利要求6所述的申诉意见挖掘装置,其特征在于,
所述申诉者特征模型包括:申诉者基本信息和申诉者情绪信息;其中,所述申诉者基本信息包括:姓名、学历、年龄、身份证号码和性别;所述申诉者情绪信息包括:申诉负面情绪指数和申诉正面情绪指数;
所述申诉单特征模型包括:申诉单基本信息、申诉原因和申诉单处理信息;其中,所述申诉单基本信息包括创建日期、申诉类型、所属区域、申诉企业信息和申诉者信息;所述申诉原因包括快递延误、快递丢失和投递服务;所述申诉单处理信息包括处理结果、处理时限和服务态度;
所述企业特征模型包括:企业所属区域、处理时长和满意度;
所述监管者特征模型包括:处理人员、处理时长和服务态度。
9.一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述程序时实现如权利要求1至5任一项所述申诉意见挖掘方法的步骤。
10.一种非暂态计算机可读存储介质,其上存储有计算机程序,其特征在于,该计算机程序被处理器执行时实现如权利要求1至5任一项所述申诉意见挖掘方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910687958.5A CN112307157B (zh) | 2019-07-29 | 2019-07-29 | 申诉意见挖掘方法和装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910687958.5A CN112307157B (zh) | 2019-07-29 | 2019-07-29 | 申诉意见挖掘方法和装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN112307157A true CN112307157A (zh) | 2021-02-02 |
CN112307157B CN112307157B (zh) | 2024-08-02 |
Family
ID=74328901
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910687958.5A Active CN112307157B (zh) | 2019-07-29 | 2019-07-29 | 申诉意见挖掘方法和装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112307157B (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114219623A (zh) * | 2021-12-16 | 2022-03-22 | 中国农业银行股份有限公司 | 一种征信异议的处理方法、装置、设备及存储介质 |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107578092A (zh) * | 2017-09-01 | 2018-01-12 | 广州智慧城市发展研究院 | 一种基于情绪和意见挖掘的情感复合分析方法及系统 |
CN107832421A (zh) * | 2017-11-11 | 2018-03-23 | 北京信息科技大学 | 一种自适应的组合数据挖掘模型系统及方法 |
US20180253663A1 (en) * | 2017-03-06 | 2018-09-06 | Wipro Limited | Method and system for extracting relevant entities from a text corpus |
CN108563791A (zh) * | 2018-04-29 | 2018-09-21 | 华中科技大学 | 一种建筑质量投诉文本分类的方法和系统 |
CN109739986A (zh) * | 2018-12-28 | 2019-05-10 | 合肥工业大学 | 一种基于深度集成学习的投诉短文本分类方法 |
CN109992653A (zh) * | 2019-03-27 | 2019-07-09 | 京东数字科技控股有限公司 | 信息处理方法和处理系统 |
-
2019
- 2019-07-29 CN CN201910687958.5A patent/CN112307157B/zh active Active
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20180253663A1 (en) * | 2017-03-06 | 2018-09-06 | Wipro Limited | Method and system for extracting relevant entities from a text corpus |
CN107578092A (zh) * | 2017-09-01 | 2018-01-12 | 广州智慧城市发展研究院 | 一种基于情绪和意见挖掘的情感复合分析方法及系统 |
CN107832421A (zh) * | 2017-11-11 | 2018-03-23 | 北京信息科技大学 | 一种自适应的组合数据挖掘模型系统及方法 |
CN108563791A (zh) * | 2018-04-29 | 2018-09-21 | 华中科技大学 | 一种建筑质量投诉文本分类的方法和系统 |
CN109739986A (zh) * | 2018-12-28 | 2019-05-10 | 合肥工业大学 | 一种基于深度集成学习的投诉短文本分类方法 |
CN109992653A (zh) * | 2019-03-27 | 2019-07-09 | 京东数字科技控股有限公司 | 信息处理方法和处理系统 |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114219623A (zh) * | 2021-12-16 | 2022-03-22 | 中国农业银行股份有限公司 | 一种征信异议的处理方法、装置、设备及存储介质 |
Also Published As
Publication number | Publication date |
---|---|
CN112307157B (zh) | 2024-08-02 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109522556B (zh) | 一种意图识别方法及装置 | |
CN109635117B (zh) | 一种基于知识图谱识别用户意图方法及装置 | |
CN112632989B (zh) | 一种合同文本中风险信息的提示方法、装置及设备 | |
CN107886231B (zh) | 客服的服务质量评价方法与系统 | |
CN104834651B (zh) | 一种提供高频问题回答的方法和装置 | |
CN107833059B (zh) | 客服的服务质量评价方法与系统 | |
CN110321549B (zh) | 基于序列化学习、关系挖掘、时序分析的新概念挖掘方法 | |
CN113807103B (zh) | 基于人工智能的招聘方法、装置、设备及存储介质 | |
CN113297365B (zh) | 一种用户意向判定方法、装置、设备及存储介质 | |
CN110929007A (zh) | 一种电力营销知识体系平台及应用方法 | |
CN113627797A (zh) | 入职员工画像生成方法、装置、计算机设备及存储介质 | |
CN113570380A (zh) | 基于语义分析的业务投诉处理方法、装置、设备及计算机可读存储介质 | |
CN109508367A (zh) | 自动提取问答语料的方法、在线智能客服系统及电子设备 | |
CN111782793A (zh) | 智能客服处理方法和系统及设备 | |
CN112579666A (zh) | 智能问答系统和方法及相关设备 | |
CN110727764A (zh) | 一种话术生成方法、装置及话术生成设备 | |
CN110287495A (zh) | 一种电力营销专业词识别方法及系统 | |
CN113095723A (zh) | 优惠券的推荐方法及装置 | |
CN112989053A (zh) | 一种期刊推荐方法及装置 | |
CN112307157B (zh) | 申诉意见挖掘方法和装置 | |
CN117076607A (zh) | 大语言模型用于建立逻辑表达式的方法、装置及查询系统 | |
CN111104422A (zh) | 一种数据推荐模型的训练方法、装置、设备及存储介质 | |
CN110287396A (zh) | 文本匹配方法及装置 | |
CN107886232B (zh) | 客服的服务质量评价方法和系统 | |
CN113254623B (zh) | 数据处理方法、装置、服务器、介质及产品 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |