CN112989825B - 社区事务汇聚和任务派发方法、装置、设备及存储介质 - Google Patents
社区事务汇聚和任务派发方法、装置、设备及存储介质 Download PDFInfo
- Publication number
- CN112989825B CN112989825B CN202110521695.8A CN202110521695A CN112989825B CN 112989825 B CN112989825 B CN 112989825B CN 202110521695 A CN202110521695 A CN 202110521695A CN 112989825 B CN112989825 B CN 112989825B
- Authority
- CN
- China
- Prior art keywords
- event
- events
- appeal
- model
- word vector
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 27
- 238000003860 storage Methods 0.000 title claims abstract description 10
- 230000002776 aggregation Effects 0.000 claims abstract description 62
- 238000004220 aggregation Methods 0.000 claims abstract description 62
- 239000013598 vector Substances 0.000 claims abstract description 55
- 238000012549 training Methods 0.000 claims abstract description 42
- 239000011159 matrix material Substances 0.000 claims abstract description 19
- 230000004927 fusion Effects 0.000 claims abstract description 14
- 238000012360 testing method Methods 0.000 claims description 11
- 238000004364 calculation method Methods 0.000 claims description 8
- 238000007781 pre-processing Methods 0.000 claims description 7
- 101100153581 Bacillus anthracis topX gene Proteins 0.000 claims description 5
- 101150041570 TOP1 gene Proteins 0.000 claims description 5
- 230000004931 aggregating effect Effects 0.000 claims description 2
- 230000008030 elimination Effects 0.000 abstract 1
- 238000003379 elimination reaction Methods 0.000 abstract 1
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 5
- 230000002457 bidirectional effect Effects 0.000 description 3
- 238000010586 diagram Methods 0.000 description 3
- 238000012545 processing Methods 0.000 description 3
- 101100136092 Drosophila melanogaster peng gene Proteins 0.000 description 2
- 238000013527 convolutional neural network Methods 0.000 description 2
- 230000007613 environmental effect Effects 0.000 description 2
- 238000003058 natural language processing Methods 0.000 description 2
- 230000008569 process Effects 0.000 description 2
- 230000011218 segmentation Effects 0.000 description 2
- 241001622623 Coeliadinae Species 0.000 description 1
- 238000009825 accumulation Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000013145 classification model Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000003958 fumigation Methods 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000011176 pooling Methods 0.000 description 1
- 238000005070 sampling Methods 0.000 description 1
- 238000003911 water pollution Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/279—Recognition of textual entities
- G06F40/289—Phrasal analysis, e.g. finite state techniques or chunking
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/22—Matching criteria, e.g. proximity measures
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/241—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
- G06F18/2415—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on parametric or probabilistic models, e.g. based on likelihood ratio or false acceptance rate versus a false rejection rate
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/06—Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
- G06Q10/063—Operations research, analysis or management
- G06Q10/0631—Resource planning, allocation, distributing or scheduling for enterprises or organisations
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/10—Services
- G06Q50/26—Government or public services
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Business, Economics & Management (AREA)
- General Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Artificial Intelligence (AREA)
- General Engineering & Computer Science (AREA)
- Human Resources & Organizations (AREA)
- Life Sciences & Earth Sciences (AREA)
- General Health & Medical Sciences (AREA)
- Health & Medical Sciences (AREA)
- Evolutionary Computation (AREA)
- Economics (AREA)
- Computational Linguistics (AREA)
- Strategic Management (AREA)
- Tourism & Hospitality (AREA)
- Computing Systems (AREA)
- Entrepreneurship & Innovation (AREA)
- Molecular Biology (AREA)
- Evolutionary Biology (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Bioinformatics & Computational Biology (AREA)
- Development Economics (AREA)
- Educational Administration (AREA)
- Biophysics (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Marketing (AREA)
- General Business, Economics & Management (AREA)
- Biomedical Technology (AREA)
- Primary Health Care (AREA)
- Probability & Statistics with Applications (AREA)
- Game Theory and Decision Science (AREA)
- Operations Research (AREA)
- Quality & Reliability (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明提供一种社区事务汇聚和任务派发方法、装置、设备及存储介质,包括:将训练数据集通过BERT模型计算得到结合上下文的词向量;将训练数据集通过LDA主题模型计算得到融合主题的词向量;将两者级联得到词向量矩阵并输入TextCNN模型进行训练,得到训练好的事件汇聚模型;将诉求事件输入训练好的事件汇聚模型,识别得到诉求事件的事件类型;并计算同一类型的诉求事件的相似度,将相似度高于阈值的诉求事件归为一小类作为重复诉求事件进行去重;并结合事件发生地的标准地址确定事件办理部门,进行任务派发。本发明对社区诉求事件进行分类、汇聚和自动派发。提高了社区事务的办理效率。
Description
技术领域
本发明涉及多元社区治理领域,尤其涉及一种社区事务汇聚和任务派发方法、装置、设备及存储介质。
背景技术
智慧社区综合治理平台是一个面向多元社区治理主体的协同应用平台,平台工作流程:社区居民通过12345热线、城市留言板、网格平台、环保业务系统、水务业务系统、电力业务系统、城管业务系统、信访等渠道上报诉求事件,社区办事员受理各渠道诉求事件后根据事件类型、事件发生地等将其派发给社区民警、社区妇联专干、社区工会专干、社区城管专干、社区残疾专干、社区劳保专干、物业公司、楼栋长、志愿者组织等多元社区治理主体单位。各社区治理主体单位接收诉求事件后,对职责范围内的事件进行处置再将结果反馈给社区,社区再将结果反馈给各渠道核查和结案。
平台现有群众诉求事件是由社区办事员逐条查看后派发给各多元社区治理主体单位。由于事件经常会被多人多次多渠道重复上报,平台缺乏有效的技术手段对重复事件进行识别,导致一件事到社区往往变成了多件事,社区处置完成后还需要多次重复向上反馈办理结果。
平台现有群众诉求事件任务的派发完全依靠人工操作,派发过程要求社区办事员对所有的事件类型和对应办理单位之间的关系都了解得非常清楚,对社区办事员的要求较高。现阶段社区人员不是很稳定,派发错误率较高。如果派发错误,办理单位会将不属于本单位办理的事件退回社区重新派发。社区居民诉求事务比较繁杂,事件类型包括物业纠纷、积水问题、生活噪音问题、生活垃圾、水污染问题、行道树损坏等。所有事件完全依靠社区办事员人工判断事件类别确定办理单位,工作量非常大。
发明内容
本发明提供一种社区事务汇聚和任务派发方法、装置、设备及存储介质,旨在解决上述存在的两个技术问题:一是事件分类依靠人工处理效率低、易出错;二是同一事件多人多渠道重复上报导致事件重复处理。
为了实现上述目的,本发明提出了一种社区事务汇聚和任务派发方法,所述社区事务汇聚和任务派发方法包括以下步骤:
将训练数据集通过BERT模型计算得到结合上下文的词向量;
将训练数据集通过LDA主题模型计算得到融合主题的词向量;
将所述结合上下文的词向量和所述融合主题的词向量级联得到词向量矩阵;
将所述词向量矩阵输入TextCNN模型进行训练,得到训练好的事件汇聚模型;
将诉求事件输入所述训练好的事件汇聚模型,识别得到所述诉求事件的事件类型;计算同一类型的诉求事件的相似度,将相似度高于阈值的诉求事件汇聚为一小类重复诉求事件;
结合所述事件类型和事件发送地的标准地址确定事件办理部门,进行任务派发。
优选地,在将相似度高于阈值的诉求事件汇聚为一小类重复诉求事件的步骤之后,还包括:
将每一小类重复诉求事件的投诉文本拼接生成长文本,采用textRank算法对所述长文本进行摘要计算,抽取结果集top1的句子作为摘要,以实现任务派发前的判重去重。
优选地,在将训练数据集通过BERT模型计算得到结合上下文的词向量的步骤之前,还包括:
对历史事件进行预处理,构建训练数据集和测试数据集。
优选地,所述对历史事件进行预处理,构建训练数据集和测试数据集的步骤包括:
明确类型数据标签:对历史事件选择一定量的数据标签,剔除无明显文本特征的数据标签,去除文本中特殊字符,包括换行符,空格,系统产生的固定话术,得到预处理后的历史事件;
将所述预处理后的历史事件进行划分,得到训练数据集和测试数据集。
优选地,在将所述词向量矩阵输入TextCNN模型进行训练,得到训练好的事件汇聚模型的步骤之后,还包括:
通过所述测试数据集对所述训练好的事件汇聚模型进行测试并优化,得到优化后的事件汇聚模型;
将所述优化后的事件汇聚模型结合统一地址库。
此外,为了实现上述目的,本发明还提供了一种社区事务汇聚和任务派发装置,所述社区事务汇聚和任务派发装置包括:
第一计算模块,用于将训练数据集通过BERT模型计算得到结合上下文的词向量;
第二计算模块,用于将训练数据集通过LDA主题模型计算得到融合主题的词向量;
级联模块,用于将所述结合上下文的词向量和所述融合主题的词向量级联得到词向量矩阵;
训练模块,用于将所述词向量矩阵输入TextCNN模型进行训练,得到训练好的事件汇聚模型;
分类汇聚模块,用于将诉求事件输入所述训练好的事件汇聚模型,识别得到所述诉求事件的事件类型;计算同一类型的诉求事件的相似度,将所述相似度高于阈值的诉求事件归为一小类重复诉求事件;
任务派发模块,用于结合所述事件类型和事件发送地的标准地址确定事件办理部门,进行任务派发。
此外,为了实现上述目的,本发明还提供了一种社区事务汇聚和任务派发设备,所述社区事务汇聚和任务派发设备包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的社区事务汇聚和任务派发程序,所述社区事务汇聚和任务派发程序被所述处理器执行时实现所述的社区事务汇聚和任务派发方法的步骤。
此外,为了实现上述目的,本发明还提供了一种存储介质,所述存储介质上存储有社区事务汇聚和任务派发程序,所述社区事务汇聚和任务派发程序被处理器执行时实现所述的社区事务汇聚和任务派发方法的步骤。
本发明基于其技术方案所具有的有益效果在于:
1、本发明基于自然语言处理对重复的事件按照时间、地点、上报人、事件内容等多维度构建模型,实现对诉求事件进行自动智能判重。系统平台对判定重复的事件进行合并办理,大量减少了需要办理的事件数量,提高了事件有效率和办理人员的工作效率。
2、本发明基于自然语言处理对事件内容、事件发生地进行分类识别,智能判断事件的末端办理单位,自动完成事件派发任务。社区办事员只需要办理疑难、新类型、突发等事件,其它的都由平台自动智能派发办理,进一步减小社区办事员的工作量、提高工作效率。
附图说明
图1是本发明社区事务汇聚和任务派发方法示意图;
图2是本发明社区事务汇聚分类流程图。
具体实施方式
为了使本发明的目的、技术方案和效果更加清楚的理解,现将结合附图对本发明实施方式作进一步的描述。
请参考图1,图1是本发明社区事务汇聚和任务派发方法示意图;
本发明具体实施例中,社区事务汇聚和任务派发方法具体为:社区居民诉求事件从12345热线、城市留言板、网格平台、环保业务系统、水务业务系统、电力业务系统、城管业务系统、信访等渠道上报后。平台首先对历史诉求事件数据进行分词等预办理,去除脏数据后选择合适的数据集、数据量进行事件汇聚模型训练。然后通过训练好的模型计算事件描述相似度,根据相似度阈值参数对事件类别划分和判重。再将同一事件的投诉文本拼接生成长文本,利用textRank算法从长文本中抽取top1的句子作为摘要。最后基于事件类别、事件发生地判定事件办理单位后对事件任务进行自动派发。
请参考图2,图2是本发明社区事务汇聚分类流程图;
社区事务汇聚分类流程如下:
S1、对历史事件进行预处理(分词、去停用词等),构建训练数据集和测试数据集。
在本实施例中,步骤S1具体包括:
选择适量的数据标签,通常类型标签的数量越多模型的准确率越低。以智慧社区治理平台的事件为例,在几百个事件小类中,最终只选择了114个使用频率高的事件类型标签。然后剔除没有明显文本特征的标签,如“待分类事件”、“其他事件”等,训练数据中的标注要尽可能保证正确。去除文本中特殊字符包括换行符,空格,系统产生的固定话术等。在训练数据集的选择中,要尽量保持各数据标签的数据量差值均衡。
S2、将训练数据集通过BERT模型计算得到结合上下文的词向量。
在本实施例中,步骤S2具体包括:
采用BERT模型对训练数据集进行双向预训练生成词向量,BERT模型先屏蔽掉输入词汇的 15%,通过深度双向的 Transformer 编码器运行整个序列,预测屏蔽的词语,经过微调生成结合上下文的词向量。
S3、将训练数据集通过LDA主题模型计算得到融合主题的词向量。
在本实施例中,S3具体包括:
采用LDA主题模型对训练数据集进行训练生成词向量,根据先验的文档主题分布选择一个主题,后根据主题的词语分布生成融合主题的词向量。
S4、将所述结合上下文的词向量和所述融合主题的词向量级联得到词向量矩阵。
S5、将所述词向量矩阵输入TextCNN模型进行训练,得到训练好的事件汇聚模型。
在本实施例中,步骤S4-S5具体包括:
将所述结合上下文的词向量和所述融合主题的词向量级联得到词向量矩阵,将词向量矩阵作为2个通道输入TextCNN模型的输入层。卷积层用若干个可学习的卷积核与生成的词向量矩阵进行卷积。最大池化层是对卷积层输出的特征进行最大抽样操作,提取最大特征。最后一层是全连接层,将所有提取的特征全部连接在一起,并通过softmax函数输出每个类别的概率,最终得到训练好的事件汇聚模型。
S6、将诉求事件输入所述训练好的事件汇聚模型,识别得到所述诉求事件的事件类型;计算同一类型的诉求事件的相似度,将相似度高于阈值的诉求事件归为一小类重复诉求事件;
在本实施例中,步骤S6具体包括:
基于上述训练好的事件汇聚模型,对新增事务进行判重聚合处理。如下列事件:
居民龚先生通过网格平台反映:南山区南山街道向南村三坊17号和23号交界处的过道上化粪池堵塞,都溢出来了,臭味熏天,其表示该现象存在半年了,一直无人处理,现来电投诉希望相关部门尽快处理该处化粪池堵塞问题。(需要加急处理)
居民彭女士通过民意通反映:南山区南山街道向南社区南新路193号和195号之间的巷子有一个化粪池溢出,无人进行清理,臭味非常扰民,来电投诉该处化粪池溢出无人清理的问题,市民表示不满,要求尽快处理其之前反映的问题。(市民无法提供更多信息)
居民龚先生通过12345市长热线反映:南山区南山街道向南村三坊17号和23号交界处的过道上化粪池堵塞,都溢出来了,臭味熏天,其表示该现象存在半年了,一直无人处理,现来电投诉希望相关部门尽快处理该处化粪池堵塞问题,市民称:“如果在2021年3月14日之前还没来处理,我就找第一现场曝光。”现来电要求相关部门尽快处理其反映的问题
居民彭女士通过12345市长热线反映:2021年1月31日,南山区南山街道向南社区南新路193号和195号之间的巷子有一个化粪池溢出,无人进行清理,臭味非常扰民,来电投诉该处化粪池溢出无人清理的问题。至2021年3月6日,市民反映的问题仍没有得到解决。
首先利用事件汇聚模型计算出事件的类型为环境保护/水体污染类,然后根据模型计算出的相似度将这些事件归为一个小类作为重复事件处理。
在本实施例中,将同一事件(重复诉求事件)的投诉文本拼接生成长文本,利用textRank算法从长文本中抽取top1的句子作为摘要。为了提高摘要的可读性,利用词性标注和正则匹配对句子进行删减。例如,对上一步骤得到的4个重复事件进行处理得到top1的句子“南山区南山街道向南村三坊17号和23号交界处的过道上化粪池堵塞,都溢出来了,臭味熏天”,分词及词性标注结果为:[('南山区','ns'),('南山','ns'),('街道','n'),('向','p'),('南村','ns'),('三坊','Ag'),('17','Bg'),('号','n'),('和','c'),('23','h'),('号','n'),('交界处','n'),('的','u'),('过道','n'),('上化','Tg'),('粪池','Tg'),('堵塞','v'),(',','Tg'),('都溢','Tg'),('出来','v'),('了','u'),(',','o'),('臭味','e'),('熏天','e')],找到词性含‘v’且前面有词性含‘n’或‘r’的下标进行截取,最后的摘要结果:“南山区南山街道向南村三坊17号和23号交界处的过道上化粪池堵塞都溢出来了臭味熏天”,从而可以将多个重复诉求事件进行判重得到一个事件进行派发。
S8、结合所述事件类型和事件发生地的标准地址确定事件办理部门,进行任务派发。
在本实施例中,S8具体包括:
通过训练好的事件汇聚模型结合统一地址库(包括各类型事件的办理部门地址),根据诉求事件的文本内容判断该事件的事件类型,结合事件类型和事件发生的标准地址可以确定事件办理部门,从而实现事件任务自动派发。如事件的内容为:“南山区南山街道向南村三坊17号和23号交界处的过道上化粪池堵塞都溢出来了臭味熏天”,事件汇聚模型可以根据这个事件内容自动识别事件类型为环境保护水体污染类事件,结合事件发生地的标准地址“南山区南山街道向南社区南新路”,自动识别办理部门为社区城管专干,然后将该事件自动派发。
作为可选的实施方式,本实施例还提供了一种社区事务汇聚和任务派发装置,所述社区事务汇聚和任务派发装置包括:
第一计算模块,用于将训练数据集通过BERT模型计算得到结合上下文的词向量;
第二计算模块,用于将训练数据集通过LDA主题模型计算得到融合主题的词向量;
级联模块,用于将所述结合上下文的词向量和所述融合主题的词向量级联得到词向量矩阵;
训练模块,用于将所述词向量矩阵输入TextCNN模型进行训练,得到训练好的事件汇聚模型;
分类汇聚模块,用于将诉求事件输入所述训练好的事件汇聚模型,识别得到所述诉求事件的事件类型;计算同一类型的诉求事件的相似度,将所述相似度高于阈值的诉求事件归为一小类作为重复诉求事件;
任务派发模块,用于结合所述事件类型和事件发送地的标准地址确定事件办理部门,进行任务派发。
作为可选的实施方式,本实施例还提供了一种社区事务汇聚和任务派发设备,所述社区事务汇聚和任务派发设备包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的社区事务汇聚和任务派发程序,所述社区事务汇聚和任务派发程序被所述处理器执行时实现所述的社区事务汇聚和任务派发方法的步骤。
作为可选的实施方式,本实施例还提供一种存储介质,所述存储介质上存储有社区事务汇聚和任务派发程序,所述社区事务汇聚和任务派发程序被处理器执行时实现所述的社区事务汇聚和任务派发方法的步骤。
本发明具体实施例提出将BERT双向编码模型和LDA主题模型这2种预处理模型生成的词向量进行级联后同时输入卷积神经网络模型进行诉求事件特征抽象和分类学习,使得输入的词向量既能表现词语之间的语义信息又能体现事件的主题思想。提高了事件判重和识别的有效率,增强了事件摘要信息的可读性。
本发明具体实施例首次将基于TextCNN(卷积神经网络的文本分类模型)结合统一地址库实现了多元社区治理事务汇聚和任务自动派发。
在不冲突的情况下,本发明中上述实施例及实施例中的特征可以相互结合。
以上所述仅为本发明的较佳实施例,并不用以限制本发明,凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。
Claims (7)
1.一种社区事务汇聚和任务派发方法,其特征在于,所述社区事务汇聚和任务派发方法包括以下步骤:
将训练数据集通过BERT模型计算得到结合上下文的词向量;
将训练数据集通过LDA主题模型计算得到融合主题的词向量;
将所述结合上下文的词向量和所述融合主题的词向量级联得到词向量矩阵;
将所述词向量矩阵输入TextCNN模型进行训练,得到训练好的事件汇聚模型;
将诉求事件输入所述训练好的事件汇聚模型,识别得到所述诉求事件的事件类型;计算同一类型的诉求事件的相似度,将相似度高于阈值的诉求事件汇聚为一小类重复诉求事件;
在所述将相似度高于阈值的诉求事件汇聚为一小类重复诉求事件的步骤之后,还包括:
将每一小类重复诉求事件的投诉文本拼接生成长文本,采用textRank算法对所述长文本进行摘要计算,抽取结果集top1的句子作为摘要,以实现去除重复诉求事件;
结合所述事件类型和事件发生地的标准地址确定事件办理部门,进行任务派发。
2.如权利要求1所述的社区事务汇聚和任务派发方法,其特征在于,在所述将训练数据集通过BERT模型计算得到结合上下文的词向量的步骤之前,还包括:
对历史事件进行预处理,构建训练数据集和测试数据集。
3.如权利要求2所述的社区事务汇聚和任务派发方法,其特征在于,所述对历史事件进行预处理,构建训练数据集和测试数据集的步骤包括:
明确类型数据标签,对历史事件选择一定量的数据标签,剔除无明显文本特征的数据标签,去除文本中特殊字符,包括换行符,空格,系统产生的固定话术,得到预处理后的历史事件;
将所述预处理后的历史事件进行划分,得到训练数据集和测试数据集。
4.如权利要求2所述的社区事务汇聚和任务派发方法,其特征在于,在将所述词向量矩阵输入TextCNN模型进行训练,得到训练好的事件汇聚模型的步骤之后,还包括:
通过所述测试数据集对所述训练好的事件汇聚模型进行测试并优化,得到优化后的事件汇聚模型;
将所述优化后的事件汇聚模型结合统一地址库。
5.一种社区事务汇聚和任务派发装置,其特征在于,所述社区事务汇聚和任务派发装置包括:
第一计算模块,用于将训练数据集通过BERT模型计算得到结合上下文的词向量;
第二计算模块,用于将训练数据集通过LDA主题模型计算得到融合主题的词向量;
级联模块,用于将所述结合上下文的词向量和所述融合主题的词向量级联得到词向量矩阵;
训练模块,用于将所述词向量矩阵输入TextCNN模型进行训练,得到训练好的事件汇聚模型;
分类汇聚模块,用于将诉求事件输入所述训练好的事件汇聚模型,识别得到所述诉求事件的事件类型;计算同一类型的诉求事件的相似度,将相似度高于阈值的诉求事件汇聚为一小类重复诉求事件;
任务派发模块,用于结合所述事件类型和事件发生地的标准地址确定事件办理部门,进行任务派发。
6.一种社区事务汇聚和任务派发设备,其特征在于,所述社区事务汇聚和任务派发设备包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的社区事务汇聚和任务派发程序,所述社区事务汇聚和任务派发程序被所述处理器执行时实现如权利要求1至4中任一项所述的社区事务汇聚和任务派发方法的步骤。
7.一种存储介质,其特征在于,所述存储介质上存储有社区事务汇聚和任务派发程序,所述社区事务汇聚和任务派发程序被处理器执行时实现如权利要求1至4中任一项所述的社区事务汇聚和任务派发方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110521695.8A CN112989825B (zh) | 2021-05-13 | 2021-05-13 | 社区事务汇聚和任务派发方法、装置、设备及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110521695.8A CN112989825B (zh) | 2021-05-13 | 2021-05-13 | 社区事务汇聚和任务派发方法、装置、设备及存储介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN112989825A CN112989825A (zh) | 2021-06-18 |
CN112989825B true CN112989825B (zh) | 2021-08-03 |
Family
ID=76337666
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110521695.8A Active CN112989825B (zh) | 2021-05-13 | 2021-05-13 | 社区事务汇聚和任务派发方法、装置、设备及存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112989825B (zh) |
Families Citing this family (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113673839B (zh) * | 2021-07-30 | 2023-09-19 | 安徽商信政通信息技术股份有限公司 | 智能基层事件网格化自动派发方法和基层事件处理系统 |
CN115170053A (zh) * | 2022-05-24 | 2022-10-11 | 中睿信数字技术有限公司 | 一种基于聚类融合的事件分拨处置系统 |
CN116992026A (zh) * | 2023-07-12 | 2023-11-03 | 华南师范大学 | 一种文本聚类方法、装置、电子设备及存储介质 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104778209A (zh) * | 2015-03-13 | 2015-07-15 | 国家计算机网络与信息安全管理中心 | 一种针对千万级规模新闻评论的观点挖掘方法 |
CN110008311A (zh) * | 2019-04-04 | 2019-07-12 | 北京邮电大学 | 一种基于语义分析的产品信息安全风险监测方法 |
CN110377695A (zh) * | 2019-06-17 | 2019-10-25 | 广州艾媒数聚信息咨询股份有限公司 | 一种舆情主题数据聚类方法、装置及存储介质 |
Family Cites Families (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104850946A (zh) * | 2015-05-06 | 2015-08-19 | 智慧城市信息技术有限公司 | 紧急事件分发方法、装置及系统 |
CN109460938A (zh) * | 2018-11-23 | 2019-03-12 | 中国城市和小城镇改革发展中心 | 一种城市智能中心控制系统及其方法 |
US11763100B2 (en) * | 2019-05-22 | 2023-09-19 | Royal Bank Of Canada | System and method for controllable machine text generation architecture |
CN110728144B (zh) * | 2019-10-06 | 2023-04-07 | 湖北工业大学 | 一种基于上下文语义感知的抽取式文档自动摘要方法 |
CN111723202B (zh) * | 2020-05-19 | 2024-05-17 | 支付宝(杭州)信息技术有限公司 | 一种舆情数据的处理装置、方法和系统 |
-
2021
- 2021-05-13 CN CN202110521695.8A patent/CN112989825B/zh active Active
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104778209A (zh) * | 2015-03-13 | 2015-07-15 | 国家计算机网络与信息安全管理中心 | 一种针对千万级规模新闻评论的观点挖掘方法 |
CN110008311A (zh) * | 2019-04-04 | 2019-07-12 | 北京邮电大学 | 一种基于语义分析的产品信息安全风险监测方法 |
CN110377695A (zh) * | 2019-06-17 | 2019-10-25 | 广州艾媒数聚信息咨询股份有限公司 | 一种舆情主题数据聚类方法、装置及存储介质 |
Also Published As
Publication number | Publication date |
---|---|
CN112989825A (zh) | 2021-06-18 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN112989825B (zh) | 社区事务汇聚和任务派发方法、装置、设备及存储介质 | |
CN109446305A (zh) | 智能旅游客服系统的构建方法以及系统 | |
CN108241867B (zh) | 一种分类方法及装置 | |
CN114493377B (zh) | 一种工单派单方法及系统 | |
CN113434688B (zh) | 用于舆情分类模型训练的数据处理方法和装置 | |
CN114648393A (zh) | 一种应用于招投标的数据挖掘方法、系统及设备 | |
CN113064992A (zh) | 投诉工单结构化处理方法、装置、设备及存储介质 | |
CN114462556A (zh) | 企业关联产业链分类方法、训练方法、装置、设备和介质 | |
CN114936727A (zh) | 一种工单派发系统、方法及计算机设备 | |
CN114943462A (zh) | 酒店群数据处理方法、系统、设备及存储介质 | |
CN112541351B (zh) | 一种住建领域政务热线工单派发方法及系统 | |
CN114742366A (zh) | 一种基于大数据算法的工单智能派发方法 | |
CN113836898A (zh) | 一种电力系统自动派单方法 | |
CN113553431A (zh) | 用户标签提取方法、装置、设备及介质 | |
CN116431828A (zh) | 一种基于神经网络技术构建的电网中台数据资产知识图谱数据库的构建方法 | |
CN115952282A (zh) | 基于nlp技术的银行客户投诉智能分流处置方法和系统 | |
CN114780735B (zh) | 基于数据分析的政策匹配方法、系统和可读存储介质 | |
CN106407271B (zh) | 一种智能客服系统及其智能客服知识库的更新方法 | |
CN115660451A (zh) | 基于rpa的供应商风险预警方法、装置、设备及介质 | |
CN115309987A (zh) | 一种企业信息匹配系统 | |
KR20230059364A (ko) | 언어 모델을 이용한 여론조사 시스템 및 운영 방법 | |
JP2003036261A (ja) | 文章自動分類装置、文章自動分類プログラム、文章自動分類方法及び文章自動分類プログラムを記録したコンピュータ読取可能な記録媒体 | |
CN109460452A (zh) | 基于本体的智能客服系统 | |
CN116600053B (zh) | 一种基于ai大语言模型的客服系统 | |
CN112819205B (zh) | 工时预测方法、装置及系统 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant | ||
CP01 | Change in the name or title of a patent holder | ||
CP01 | Change in the name or title of a patent holder |
Address after: 430000 Wuda science and Technology Park, Jiangxia Avenue, Miaoshan District, Donghu Development Zone, Wuhan City, Hubei Province Patentee after: Geospace Information Technology Co., Ltd. Address before: 430000 Wuda science and Technology Park, Jiangxia Avenue, Miaoshan District, Donghu Development Zone, Wuhan City, Hubei Province Patentee before: WUDA GEOINFORMATICS Co.,Ltd. |