CN116955445A - 基于信息抽取的投诉事件数据挖掘分析方法及系统 - Google Patents
基于信息抽取的投诉事件数据挖掘分析方法及系统 Download PDFInfo
- Publication number
- CN116955445A CN116955445A CN202310748991.0A CN202310748991A CN116955445A CN 116955445 A CN116955445 A CN 116955445A CN 202310748991 A CN202310748991 A CN 202310748991A CN 116955445 A CN116955445 A CN 116955445A
- Authority
- CN
- China
- Prior art keywords
- complaint
- data mining
- event
- early warning
- information
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000007418 data mining Methods 0.000 title claims abstract description 57
- 238000004458 analytical method Methods 0.000 title claims abstract description 44
- 238000000605 extraction Methods 0.000 title claims abstract description 41
- 230000000007 visual effect Effects 0.000 claims abstract description 13
- 238000000034 method Methods 0.000 claims abstract description 12
- 238000004590 computer program Methods 0.000 claims description 13
- 238000012549 training Methods 0.000 claims description 8
- 230000008569 process Effects 0.000 claims description 6
- 238000010276 construction Methods 0.000 claims description 5
- 238000007405 data analysis Methods 0.000 claims description 3
- 238000005065 mining Methods 0.000 claims description 2
- 238000004806 packaging method and process Methods 0.000 claims description 2
- 238000010586 diagram Methods 0.000 description 7
- 230000008451 emotion Effects 0.000 description 3
- 238000002372 labelling Methods 0.000 description 3
- 238000013508 migration Methods 0.000 description 3
- 230000005012 migration Effects 0.000 description 3
- 238000012545 processing Methods 0.000 description 3
- 238000013461 design Methods 0.000 description 2
- 238000005538 encapsulation Methods 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 230000006870 function Effects 0.000 description 2
- 238000012216 screening Methods 0.000 description 2
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 230000010485 coping Effects 0.000 description 1
- 230000005284 excitation Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000012544 monitoring process Methods 0.000 description 1
- 238000002360 preparation method Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/24—Querying
- G06F16/245—Query processing
- G06F16/2458—Special types of queries, e.g. statistical queries, fuzzy queries or distributed queries
- G06F16/2462—Approximate or statistical queries
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/24—Querying
- G06F16/245—Query processing
- G06F16/2458—Special types of queries, e.g. statistical queries, fuzzy queries or distributed queries
- G06F16/2465—Query processing support for facilitating data mining operations in structured databases
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/24—Querying
- G06F16/248—Presentation of query results
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/25—Integrating or interfacing systems involving database management systems
- G06F16/254—Extract, transform and load [ETL] procedures, e.g. ETL data flows in data warehouses
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/31—Indexing; Data structures therefor; Storage structures
- G06F16/313—Selection or weighting of terms for indexing
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/02—Marketing; Price estimation or determination; Fundraising
- G06Q30/0201—Market modelling; Market analysis; Collecting market data
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F2216/00—Indexing scheme relating to additional aspects of information retrieval not explicitly covered by G06F16/00 and subgroups
- G06F2216/03—Data mining
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02D—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
- Y02D10/00—Energy efficient computing, e.g. low power processors, power management or thermal management
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Databases & Information Systems (AREA)
- General Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- General Engineering & Computer Science (AREA)
- Business, Economics & Management (AREA)
- Computational Linguistics (AREA)
- Software Systems (AREA)
- Strategic Management (AREA)
- Finance (AREA)
- Probability & Statistics with Applications (AREA)
- Accounting & Taxation (AREA)
- Development Economics (AREA)
- Entrepreneurship & Innovation (AREA)
- Fuzzy Systems (AREA)
- Mathematical Physics (AREA)
- Game Theory and Decision Science (AREA)
- Economics (AREA)
- Marketing (AREA)
- General Business, Economics & Management (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本公开提供了基于信息抽取的投诉事件数据挖掘分析方法及系统,涉及数据挖掘技术领域,方法包括获取投诉工单,提取投诉工单的文本信息,导入excel批量输入;构建数据挖掘模型,将文本信息作为模型输入,对文本信息进行实体抽取,输出涉事的主体以及关键词;获取预警词库,将输出的关键词与预警词库进行比对分析,确定投诉类型;将比对的结果进行存储,同时对涉事主体进行分组统计,获取主体单位历史的投诉次数统计、投诉事件类型统计,构建可视图;对言论过激投诉单独进行预警展示;对投诉工单识别出的涉事主体、投诉人、投诉事件类型进行三级关系联动,构建关系图谱,完成对投诉事件的数据挖掘分析。本公开提高了对投诉事件识别的效率。
Description
技术领域
本公开涉及数据挖掘技术领域,具体涉及基于信息抽取的投诉事件数据挖掘分析方法及系统。
背景技术
本部分的陈述仅仅是提供了与本公开相关的背景技术信息,不必然构成在先技术。
现在对于投诉事件是通过数据挖掘技术理论,对消费者投诉数据进行分析,探讨消费者投诉的涉事主体,涉事原因,从而总结出引起消费者投诉的热点。。
现有的事件分析方案中,涉及舆情监测、投诉事件、网络媒体转发热点事件等数据的挖掘,舆情监测是一项交叉了社会科学和数据科学的复杂技术,需要在舆情发生初期对事件有个初步的预判,充分做好应对准备。针对舆情事件的描述,主要来自网络媒体上的新闻文本和类似新浪微博的社交平台,人们通过阅读、转发、评论等,直接告知他人或者从他人那里间接了解到舆情事件的相关信息;针对投诉事件,也是直接进行一般的人工主观识别,判定是否定性为投诉事件;另外,利用图像中的文字数据,进行识别关键词,但是无法从文字中主动提出涉事主体、事件关键词等信息,实际上是对文本进行分词,然后与关键词进行匹配,无法识别事件的主体信息。
发明内容
本公开为了解决上述问题,提出了基于信息抽取的投诉事件数据挖掘分析方法及系统,引用UIE(Universal Information Extraction,通用信息抽取)实现实体抽取、关系抽取、事件抽取以及情感分析任务的统一建模,使不同任务间具备良好的迁移和泛化能力。
根据一些实施例,本公开采用如下技术方案:
基于信息抽取的投诉事件数据挖掘分析方法,包括:
获取投诉工单,提取投诉工单的文本信息,导入excel批量输入;
构建数据挖掘模型,将文本信息作为模型输入,对文本信息进行实体抽取,输出涉事的主体以及关键词;
获取预警词库,将输出的关键词与预警词库进行比对分析,确定投诉类型;
将比对的结果进行存储,同时对涉事主体进行分组统计,获取主体单位历史的投诉次数统计、投诉事件类型统计,构建可视图;对言论过激投诉单独进行预警展示;
对投诉工单识别出的涉事主体、投诉人、投诉事件类型进行三级关系联动,构建关系图谱,完成对投诉事件的数据挖掘分析。
根据一些实施例,本公开采用如下技术方案:
基于信息抽取的投诉事件数据挖掘分析系统,包括:
数据获取模块,用于获取投诉工单,提取投诉工单的文本信息,导入excel批量输入;
数据分析模块,用于构建数据挖掘模型,将文本信息作为模型输入,对文本信息进行实体抽取,输出涉事的主体以及关键词;
获取预警词库,将输出的关键词与预警词库进行比对分析,确定投诉类型;
将比对的结果进行存储,同时对涉事主体进行分组统计,获取主体单位历史的投诉次数统计、投诉事件类型统计,构建可视图;对言论过激投诉单独进行预警展示;
关系构建模块,用于对投诉工单识别出的涉事主体、投诉人、投诉事件类型进行三级关系联动,构建关系图谱,完成对投诉事件的数据挖掘分析。
根据一些实施例,本公开采用如下技术方案:
一种非暂态计算机可读存储介质,所述非暂态计算机可读存储介质用于存储计算机指令,所述计算机指令被处理器执行时,实现所述的基于信息抽取的投诉事件数据挖掘分析方法。
根据一些实施例,本公开采用如下技术方案:
一种电子设备,包括:处理器、存储器以及计算机程序;其中,处理器与存储器连接,计算机程序被存储在存储器中,当电子设备运行时,所述处理器执行所述存储器存储的计算机程序,以使电子设备执行实现所述的基于信息抽取的投诉事件数据挖掘分析方法。
与现有技术相比,本公开的有益效果为:
本公开提出的基于信息抽取的投诉事件数据挖掘分析方法中,引用了UIE(Universal Information Extraction)(通用信息抽取统一框架)该框架实现了实体抽取、关系抽取、事件抽取、情感分析等任务的统一建模,识别涉事主体提取和投诉事件关键词提取。采用paddlleNlp开源算法进行数据标注和模型训练,生成可调用的算法模型文件,算法接口封装和预警词库预警比对设计。通过Python Flask框架对算法模型调用识别接口进行封装处理,并增加词库预警比对逻辑,提供可对外调用的服务接口;对涉事主体-投诉人员-事件类型三级关系图谱联动设计;每一级都可互相拓展出关联数据,对涉事主体和投诉人员可以很直观的展示出历史投诉信息以及统计信息,便于客户统筹管理,发现热点集中的事件类型、主体或人员,使得不同任务间具备良好的迁移和泛化能力。
附图说明
构成本公开的一部分的说明书附图用来提供对本公开的进一步理解,本公开的示意性实施例及其说明用于解释本公开,并不构成对本公开的不当限定。
图1为本公开实施例的投诉事件数据挖掘分析方法流程图;
图2为本公开实施例的数据挖掘分析模型构建流程图;
图3为本公开实施例的三级关系联动图谱构建示意图。
具体实施方式
下面结合附图与实施例对本公开作进一步说明。
应该指出,以下详细说明都是例示性的,旨在对本公开提供进一步的说明。除非另有指明,本文使用的所有技术和科学术语具有与本公开所属技术领域的普通技术人员通常理解的相同含义。
需要注意的是,这里所使用的术语仅是为了描述具体实施方式,而非意图限制根据本公开的示例性实施方式。如在这里所使用的,除非上下文另外明确指出,否则单数形式也意图包括复数形式,此外,还应当理解的是,当在本说明书中使用术语“包含”和/或“包括”时,其指明存在特征、步骤、操作、器件、组件和/或它们的组合。
实施例1
本公开的一种实施例中提供了一种基于信息抽取的投诉事件数据挖掘分析方法,包括:
步骤一:获取投诉工单,提取投诉工单的文本信息,导入excel批量输入;
步骤二:构建数据挖掘模型,将文本信息作为模型输入,对文本信息进行实体抽取,输出涉事的主体以及关键词;
获取预警词库,将输出的关键词与预警词库进行比对分析,确定投诉类型;
将比对的结果进行存储,同时对涉事主体进行分组统计,获取主体单位历史的投诉次数统计、投诉事件类型统计,构建可视图;对言论过激投诉单独进行预警展示;
步骤三:对投诉工单识别出的涉事主体、投诉人、投诉事件类型进行三级关系联动,构建关系图谱,完成对投诉事件的数据挖掘分析。
作为一种实施例,本公开的基于信息抽取的投诉事件数据挖掘分析方法的具体实施过程为:
步骤1:获取投诉工单,提取投诉工单的文本信息,导入excel批量输入;
步骤2:构建数据挖掘模型,将文本信息作为模型输入,对文本信息进行实体抽取,输出涉事的主体以及关键词;
获取预警词库,将输出的关键词与预警词库进行比对分析,确定投诉类型;
将比对的结果进行存储,同时对涉事主体进行分组统计,获取主体单位历史的投诉次数统计、投诉事件类型统计,构建可视图;对言论过激投诉单独进行预警展示;
步骤3:对投诉工单识别出的涉事主体、投诉人、投诉事件类型进行三级关系联动,构建关系图谱,完成对投诉事件的数据挖掘分析。
具体的,搭建UIE框架,该框架实现了实体抽取、关系抽取、事件抽取、情感分析等任务的统一建模,并使得不同任务间具备良好的迁移和泛化能力。
在步骤2中,构建数据挖掘模型的方法具体为:获取历史投诉工单信息,对工单信息进行涉事主体标注,进行数据挖掘模型训练,,最后将数据挖掘模型导出。
所述数据挖掘模型的训练过程为:
收集大量的投诉事件,对每一个事件描述信息人工筛选出主体描述字段,最终的目的是生成一份样本,在样本中标注哪些描述内容是实体。再通过开源算法对样本数据进行反复学习、训练和优化,最终生成最优的模型。通过改模型,可以将一段文本信息输入进行解析,最终得到文本中识别的主体信息。
输入一段文本信息,经算法解析出文本中包含的实体,实体包括投诉单位、小区、企业、门店等名称。比如“某位先生反映:在2月26日,发现某住户门口私自加建台阶,比旁边的店面台阶探出来一米多,投诉已让其拆过一次,属于公共区域,要求给予解决。”标红即为要抽取的实体。可以是描述事件发生的地点或标识场所。
采用开源PaddleNLP算法,对文本内容进行实体抽取。该过程需要收集历史投诉工单信息,对信息进行主体标注,再进行模型定制训练,最后把模型导出。算法调用层通过Python的flask框架进行接口封装,文本信息作为接口参数输入,涉事主体作为结果进行输出。
进一步的,获取预警词库,将输出的关键词与预警词库进行比对分析,确定投诉类型;包括:将输出的关键词与预警词库进行比对分析,判断该投诉工单是否属于过激言论投诉,若是比对成功,则该投诉类型为过激言论投诉。
将获取的比对的结果进行存储,采用mysql数据库对挖掘分析和预警比对的结果进行存储。
将比对的结果进行存储,同时对涉事主体进行分组统计,获取主体单位历史的投诉次数统计、投诉事件类型统计,构建可视图;对言论过激投诉单独进行预警展示;包括:
获取主体单位历史的投诉次数统计、投诉事件类型统计,构建可视图,所述可视图为大屏一览图,展示投诉的最多涉事主体以及事件类型。
最后,对投诉工单识别出的涉事主体、投诉人、投诉事件类型进行三级关系联动,构建关系图谱,完成对投诉事件的数据挖掘分析。
具体的:三级关系联动包括涉事主体、投诉人以及投诉事件类型,每一级中互相拓展出关联数据,对涉事主体和投诉人展示出历史投诉信息以及统计信息,将投诉事件中的事件类型、涉及主体以及投诉人进行级别关联。
如图1所示,本公开的具体流程为:
S1文本信息输入,可以把投诉工单导入excel批量输入,也可以单文本信息输入;
S2算法分析,采用开源PaddleNLP算法,对文本内容进行实体抽取。该过程需要收集历史投诉工单信息,对信息进行主体标注,再进行数据挖掘模型定制训练,最后把数据挖掘模型导出。算法调用层通过Python的flask框架进行接口封装,文本信息作为接口参数输入,涉事主体作为结果进行输出。
S3过激言论筛选,获取预警词库,通过S2中的关键词和词库进行比对分析,匹配中,则该条投诉单属于过激言论,作为预警结果输出到S6。
S4数据落库,采用mysql数据库对算法分析和预警比对的结果进行存储。
S5时间分组统计,对涉事主体进行分组统计,获取主体单位历年来的投诉次数统计、投诉事件类型统计等,形成一张大屏一览图,直观的展示投诉最多的主体或事件类型。
S6过激言论预警,展示S3研判比对分析出的预警投诉单,对这些投诉单单独预警展示。
S7关系图谱。对投诉工单识别出的投诉主体、投诉人、投诉事件进行三级关系联动。可以由主体拓展出该涉事主体下历史所有投诉人信息和投诉事件类型;可以由投诉人拓展出该投诉人员历史所有投诉的所有涉事主体信息以及事件类型。这种三级联动的动态展示,可以很直观的帮助客户进行事件分析,反应投诉权重变化等信息。具体关系如图3,包括:
权重变化,以一个事件为中心,拓展出该事件涉及到的主体单位,和相关的投诉人员数量;同理,再以涉事主体单位为中心拓展出其涉及到的事件,如果一个主体单位有很多个投诉事件,那么这个主体单位应当给予重点关注。
实施例2
本公开的一种实施例中提供了一种基于信息抽取的投诉事件数据挖掘分析系统,包括:
数据获取模块,用于获取投诉工单,提取投诉工单的文本信息,导入excel批量输入;
数据分析模块,用于构建数据挖掘模型,将文本信息作为模型输入,对文本信息进行实体抽取,输出涉事的主体以及关键词;
获取预警词库,将输出的关键词与预警词库进行比对分析,确定投诉类型;
将比对的结果进行存储,同时对涉事主体进行分组统计,获取主体单位历史的投诉次数统计、投诉事件类型统计,构建可视图;对言论过激投诉单独进行预警展示;
关系构建模块,用于对投诉工单识别出的涉事主体、投诉人、投诉事件类型进行三级关系联动,构建关系图谱,完成对投诉事件的数据挖掘分析。
实施例3
本公开的一种实施例中提供了一种非暂态计算机可读存储介质,所述非暂态计算机可读存储介质用于存储计算机指令,所述计算机指令被处理器执行时,实现所述的基于信息抽取的投诉事件数据挖掘分析方法。
实施例4
本公开的一种实施例中提供了一种电子设备,包括:处理器、存储器以及计算机程序;其中,处理器与存储器连接,计算机程序被存储在存储器中,当电子设备运行时,所述处理器执行所述存储器存储的计算机程序,以使电子设备执行实现所述的基于信息抽取的投诉事件数据挖掘分析方法。
本公开是参照根据本公开实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
上述虽然结合附图对本公开的具体实施方式进行了描述,但并非对本公开保护范围的限制,所属领域技术人员应该明白,在本公开的技术方案的基础上,本领域技术人员不需要付出创造性劳动即可做出的各种修改或变形仍在本公开的保护范围以内。
Claims (10)
1.基于信息抽取的投诉事件数据挖掘分析方法,其特征在于,包括:
获取投诉工单,提取投诉工单的文本信息,导入excel批量输入;
构建数据挖掘模型,将文本信息作为模型输入,对文本信息进行实体抽取,输出涉事的主体以及关键词;
获取预警词库,将输出的关键词与预警词库进行比对分析,确定投诉类型;
将比对的结果进行存储,同时对涉事主体进行分组统计,获取主体单位历史的投诉次数统计、投诉事件类型统计,构建可视图;对言论过激投诉单独进行预警展示;
对投诉工单识别出的涉事主体、投诉人、投诉事件类型进行三级关系联动,构建关系图谱,完成对投诉事件的数据挖掘分析。
2.如权利要求1所述的基于信息抽取的投诉事件数据挖掘分析方法,其特征在于,所述数据挖掘模型的构建方法为:获取历史投诉工单信息,对工单信息进行涉事主体标注,进行数据挖掘模型训练,最后将数据挖掘模型导出。
3.如权利要求2所述的基于信息抽取的投诉事件数据挖掘分析方法,其特征在于,数据挖掘模型训练过程中,调用算法,在算法调用层通过Python的flask框架进行接口封装,将文本信息作为接口参数输入,涉事主体作为结果进行输出。
4.如权利要求1所述的基于信息抽取的投诉事件数据挖掘分析方法,其特征在于,判断投诉类型的方法包括:获取预警词库,将输出的关键词与预警词库进行比对分析,判断该投诉工单是否属于过激言论投诉,若是比对成功,则该投诉类型为过激言论投诉。
5.如权利要求1所述的基于信息抽取的投诉事件数据挖掘分析方法,其特征在于,采用mysql数据库对挖掘分析和预警比对的结果进行存储。
6.如权利要求1所述的基于信息抽取的投诉事件数据挖掘分析方法,其特征在于,获取主体单位历史的投诉次数统计、投诉事件类型统计,构建可视图,所述可视图为大屏一览图,展示投诉的最多涉事主体以及事件类型。
7.如权利要求1所述的基于信息抽取的投诉事件数据挖掘分析方法,其特征在于,所述三级关系联动包括涉事主体、投诉人以及投诉事件类型,每一级中互相拓展出关联数据,对涉事主体和投诉人展示出历史投诉信息以及统计信息,将投诉事件中的事件类型、涉及主体以及投诉人进行级别关联。
8.基于信息抽取的投诉事件数据挖掘分析系统,其特征在于,包括:
数据获取模块,用于获取投诉工单,提取投诉工单的文本信息,导入excel批量输入;
数据分析模块,用于构建数据挖掘模型,将文本信息作为模型输入,对文本信息进行实体抽取,输出涉事的主体以及关键词;
获取预警词库,将输出的关键词与预警词库进行比对分析,确定投诉类型;
将比对的结果进行存储,同时对涉事主体进行分组统计,获取主体单位历史的投诉次数统计、投诉事件类型统计,构建可视图;对言论过激投诉单独进行预警展示;
关系构建模块,用于对投诉工单识别出的涉事主体、投诉人、投诉事件类型进行三级关系联动,构建关系图谱,完成对投诉事件的数据挖掘分析。
9.一种非暂态计算机可读存储介质,其特征在于,所述非暂态计算机可读存储介质用于存储计算机指令,所述计算机指令被处理器执行时,实现如权利要求1-7任一项所述的基于信息抽取的投诉事件数据挖掘分析方法。
10.一种电子设备,其特征在于,包括:处理器、存储器以及计算机程序;其中,处理器与存储器连接,计算机程序被存储在存储器中,当电子设备运行时,所述处理器执行所述存储器存储的计算机程序,以使电子设备执行实现如权利要求1-7任一项所述的基于信息抽取的投诉事件数据挖掘分析方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310748991.0A CN116955445A (zh) | 2023-06-21 | 2023-06-21 | 基于信息抽取的投诉事件数据挖掘分析方法及系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310748991.0A CN116955445A (zh) | 2023-06-21 | 2023-06-21 | 基于信息抽取的投诉事件数据挖掘分析方法及系统 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN116955445A true CN116955445A (zh) | 2023-10-27 |
Family
ID=88452039
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202310748991.0A Pending CN116955445A (zh) | 2023-06-21 | 2023-06-21 | 基于信息抽取的投诉事件数据挖掘分析方法及系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN116955445A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117609338A (zh) * | 2024-01-22 | 2024-02-27 | 交通运输部公路科学研究所 | 一种基于公路运输中危货运输工单的数据挖掘方法 |
-
2023
- 2023-06-21 CN CN202310748991.0A patent/CN116955445A/zh active Pending
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117609338A (zh) * | 2024-01-22 | 2024-02-27 | 交通运输部公路科学研究所 | 一种基于公路运输中危货运输工单的数据挖掘方法 |
CN117609338B (zh) * | 2024-01-22 | 2024-04-19 | 交通运输部公路科学研究所 | 一种基于公路运输中危货运输工单的数据挖掘方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN107657267B (zh) | 产品潜在用户挖掘方法及装置 | |
WO2020073727A1 (zh) | 风险预测方法、装置、计算机设备和存储介质 | |
CN109472626B (zh) | 一种面向手机租赁业务的智能金融风险控制方法及系统 | |
CN110689385A (zh) | 一种基于知识图谱的电力客服用户画像构建方法 | |
CN116955445A (zh) | 基于信息抽取的投诉事件数据挖掘分析方法及系统 | |
CN112613569A (zh) | 图像识别方法、图像分类模型的训练方法及装置 | |
CN116739836B (zh) | 一种基于知识图谱的餐饮数据分析方法及系统 | |
CN115392805B (zh) | 一种交易型合同合规风险诊断方法及系统 | |
CN117391440A (zh) | 一种企业信息侦察平台及方法 | |
CN113159118A (zh) | 物流数据指标的处理方法、装置、设备及存储介质 | |
CN115293603A (zh) | 任务分配方法、装置、电子设备及计算机可读存储介质 | |
US10762089B2 (en) | Open ended question identification for investigations | |
CN115757660A (zh) | 一种自动生成数据库表间关联关系的方法、系统、电子设备及程序产品 | |
CN113553431B (zh) | 用户标签提取方法、装置、设备及介质 | |
CN114420168A (zh) | 情绪识别方法、装置、设备及存储介质 | |
CN113706172A (zh) | 基于客户行为的投诉解决方法、装置、设备及存储介质 | |
CN117333217A (zh) | 基于模型训练的产品销量分析方法、装置、设备及介质 | |
CN111861801A (zh) | 酒店满房预测方法、系统、设备及存储介质 | |
CN113706207B (zh) | 基于语义解析的订单成交率分析方法、装置、设备及介质 | |
CN115718807A (zh) | 人员关系分析方法、装置、设备及存储介质 | |
CN114780688A (zh) | 基于规则匹配的文本质检方法、装置、设备及存储介质 | |
CN113627692A (zh) | 投诉量预测方法、装置、设备及存储介质 | |
CN113111089A (zh) | 一种信息采集管理系统及方法 | |
CN114548825B (zh) | 投诉工单失真检测方法、装置、设备及存储介质 | |
CN113688924B (zh) | 异常订单检测方法、装置、设备及介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |