CN113157925A - 基于大数据的智慧政务分析系统 - Google Patents
基于大数据的智慧政务分析系统 Download PDFInfo
- Publication number
- CN113157925A CN113157925A CN202110496870.2A CN202110496870A CN113157925A CN 113157925 A CN113157925 A CN 113157925A CN 202110496870 A CN202110496870 A CN 202110496870A CN 113157925 A CN113157925 A CN 113157925A
- Authority
- CN
- China
- Prior art keywords
- appeal
- public
- event
- record
- records
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000004458 analytical method Methods 0.000 title claims abstract description 38
- 238000012544 monitoring process Methods 0.000 claims abstract description 44
- 230000007246 mechanism Effects 0.000 claims abstract description 16
- 238000000034 method Methods 0.000 claims abstract description 9
- 230000004043 responsiveness Effects 0.000 claims abstract description 8
- 230000008569 process Effects 0.000 claims abstract description 4
- 238000012546 transfer Methods 0.000 claims description 23
- 238000000605 extraction Methods 0.000 claims description 6
- 238000010276 construction Methods 0.000 claims description 4
- 230000008520 organization Effects 0.000 claims description 4
- 238000013468 resource allocation Methods 0.000 claims description 4
- 230000002776 aggregation Effects 0.000 claims description 3
- 238000004220 aggregation Methods 0.000 claims description 3
- 230000001364 causal effect Effects 0.000 claims description 3
- 238000004891 communication Methods 0.000 claims description 3
- 239000000284 extract Substances 0.000 claims description 3
- 230000004927 fusion Effects 0.000 claims description 3
- 238000013507 mapping Methods 0.000 claims description 3
- 239000000203 mixture Substances 0.000 claims description 3
- 239000003607 modifier Substances 0.000 claims description 3
- 239000002243 precursor Substances 0.000 claims description 3
- 238000004890 malting Methods 0.000 claims 1
- 230000009471 action Effects 0.000 description 7
- 238000006243 chemical reaction Methods 0.000 description 3
- 238000007726 management method Methods 0.000 description 3
- 238000012545 processing Methods 0.000 description 3
- 238000004364 calculation method Methods 0.000 description 2
- 239000000463 material Substances 0.000 description 2
- 230000004044 response Effects 0.000 description 2
- 238000006467 substitution reaction Methods 0.000 description 2
- 230000009466 transformation Effects 0.000 description 2
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 2
- 230000007547 defect Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 230000001105 regulatory effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/35—Clustering; Classification
- G06F16/353—Clustering; Classification into predefined classes
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/3331—Query processing
- G06F16/334—Query execution
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/06—Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
- G06Q10/063—Operations research, analysis or management
- G06Q10/0631—Resource planning, allocation, distributing or scheduling for enterprises or organisations
- G06Q10/06315—Needs-based resource requirements planning or analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/10—Services
- G06Q50/26—Government or public services
Landscapes
- Engineering & Computer Science (AREA)
- Business, Economics & Management (AREA)
- Theoretical Computer Science (AREA)
- Human Resources & Organizations (AREA)
- General Physics & Mathematics (AREA)
- Physics & Mathematics (AREA)
- Strategic Management (AREA)
- Tourism & Hospitality (AREA)
- Economics (AREA)
- General Engineering & Computer Science (AREA)
- Entrepreneurship & Innovation (AREA)
- Marketing (AREA)
- General Business, Economics & Management (AREA)
- Development Economics (AREA)
- Databases & Information Systems (AREA)
- Educational Administration (AREA)
- Data Mining & Analysis (AREA)
- Health & Medical Sciences (AREA)
- General Health & Medical Sciences (AREA)
- Primary Health Care (AREA)
- Game Theory and Decision Science (AREA)
- Operations Research (AREA)
- Quality & Reliability (AREA)
- Computational Linguistics (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明涉及一种基于大数据的智慧政务分析系统,其包括政务服务平台、诉求分析云平台和本地服务机构。诉求分析云平台包括数据获取模块、主题识别模块、事件识别模块、影响力分析模块和资源分配模块;诉求分析云平台基于获取到的公众诉求记录识别目标监测周期内的所有新增需求词汇,基于包含新增需求词汇的每个公众诉求记录对应的第一记录特征和第二记录特征对每个公众诉求记录进行二次聚类,并根据二次聚类结果识别对应公众诉求事件的诉求特征;基于所述诉求特征分析得到对应公众诉求事件的响应度,并为所述公众诉求事件生成相应的资源配置列表。本地服务机构根据接收到的资源配置列表对所述公众诉求事件进行事件处理。
Description
技术领域
本发明涉及智慧政务和大数据领域,尤其涉及一种基于大数据的智慧政务分析系统。
背景技术
智慧政务是电子政务发展的高级阶段,智慧政务的目的就是最大限度的实现数据资源的价值,实现信息共享和使用,实现单一管理向协作共享管理转型;依托智能平台形成线上和线下多种渠道并行的服务大格局,实现柜台式服务向自助式全天候服务转型;智能技术的预测、整合和分析功能引进公共服务中,针对性的对目标群体提供多项主动服务,实现被动响应服务向主动预见型服务转型,创新政务管理、监管和公共服务提供方式,提高行政效率以及更好地提供公共服务。
目前,智慧政务云平台通过网页和手机客户端覆盖了越来越多的网络客户,同时也积累了大量的使用数据。对于事务性工作,信息的便捷流通提高了办事和管理效率。然而对于非结构化的数据,例如公共平台的公众留言和建议,往往需要人为反馈和分析。因此,需要对公众反馈数据进行分析,以提高事件分析响应的效率。
发明内容
针对现有技术之不足,本发明提供了一种基于大数据的智慧政务分析系统,包括政务服务平台、诉求分析云平台和本地服务机构,诉求分析云平台分别与政务服务平台和本地服务机构之间具有通信连接;所述本地服务机构包括街道办事处和社区服务中心;
诉求分析云平台包括数据获取模块、主题识别模块、事件识别模块、影响力分析模块和资源分配模块;
数据获取模块获取目标监测周期内发布于政务服务平台上的若干公众诉求记录,基于每条公众诉求记录之间的内容相似度分析得到所述目标监测周期的文本信息熵,并将所述文本信息熵与预设信息熵阈值进行比较;
主题识别模块在确定所述文本信息熵小于预设信息熵阈值时,识别目标监测周期内的所有新增诉求词汇,基于包含新增诉求词汇的每个公众诉求记录对应的第一记录特征对所有包含新增诉求词汇的公众诉求记录进行聚类以得到第一聚类记录集;
事件识别模块提取第一聚类记录集中的每个公众诉求记录的第二记录特征以对第一聚类记录集中的每个公众诉求记录进行再次聚类得到第二聚类记录集,对第二聚类记录集中的所有公众诉求记录进行分析以识别每个第二聚类记录集对应的公众诉求事件的诉求特征;
影响力分析模块基于第二聚类记录集中每个公众诉求记录包含的地点名称确定对应公众诉求事件的事件影响范围,基于所述公众诉求事件的事件影响范围和所述公众诉求事件的诉求特征确定所述公众诉求事件的响应度;
资源分配模块为响应度大于预设响应度阈值的公众诉求事件生成相应的资源配置列表,并将所述公众诉求事件和资源配置列表发送至对应的本地服务机构;
本地服务机构根据接收到的资源配置列表对所述公众诉求事件进行事件处理。
根据一个优选实施方式,所述公众诉求记录为与民生相关的诉求数据,其包括社区停水、违建乱搭和因道路施工发生的拥堵事件。
根据一个优选实施方式,对第二聚类记录集中的所有公众诉求记录进行分析以识别每个第二聚类记录集对应的公众诉求事件的诉求特征包括:
基于对应公众诉求记录中包含的表征用户需求的特征词汇分析得到城市居民的显性诉求特征,基于每个事件元素词汇的上下文信息分析得到城市居民的隐性诉求特征。
根据一个优选实施方式,基于第二聚类记录集中每个公众诉求记录包含的地点名称确定对应公众诉求事件的事件影响范围包括:
提取第二聚类记录集中各个公众诉求记录包含的所有地点名称,基于每个地点名称的实际位置特征以及其在对应公众诉求记录中的文本位置对所有地点名称进行层级聚类以形成相应的地区结构树;
将地区结构树中的各个地点名称映射至城市空间中的相应位置点上,对每个地点名称映射的位置点依层级进行统计以得到每个公众诉求事件的多级地域分布特征,基于所述多级地域分布特征确定对应公众诉求事件的事件影响范围。
根据一个优选实施方式,将目标监测周期内获取到的所有公众诉求记录与历史监测周期内获取到的所有历史公众诉求记录进行比较以识别目标监测周期内的所有新增诉求词汇包括:
提取目标监测周期内获取到的每个公众诉求记录的第一核心诉求词汇组,提取历史监测周期内获取到的每个历史公众诉求记录的第二核心诉求词汇组,将第一核心诉求词汇组中的每个第一核心诉求词汇与第二核心诉求词汇组中的第二核心诉求词汇进行比较以得到每个第一核心诉求词汇出现的时间间隔周期;
基于每个第一核心诉求词汇出现的时间间隔周期和在对应时间间隔周期内出现的总次数确定每个第一核心诉求词汇服从的概率分布,基于每个第一核心诉求词汇服从的概率分布为每个第一核心诉求词汇构造相应的转移代价函数;
将出现在历史公众诉求记录中的所有第一核心诉求词汇的新颖状态值设置为0,基于所述转移代价函数对第一核心诉求词汇进行状态转移,获取转移代价为最小时对应第一核心诉求词汇的新颖状态值,并将所有新颖状态值为1的第一核心诉求词汇作为目标监测周期内的新增诉求词汇。
根据一个优选实施方式,基于包含新增诉求词汇的每个公众诉求记录对应的第一记录特征对所有包含新增诉求词汇的公众诉求记录进行聚类以得到第一聚类记录集包括:
对所有包含新增诉求词汇的公众诉求记录进行文档聚合以得到目标监测周期内的长文档集合,基于对应公众诉求记录中每个词汇之间的潜在语义关系识别对应公众诉求记录中的主题词汇;
对每个公众诉求记录中包含的所有主题词汇进行统计以得到对应公众诉求记录的第一主题词语分布概率,对长文档集合中的每个主题词汇进行统计以得到每个主题词汇的文档主题分布概率,并基于所述文档主题分布概率对相应公众诉求记录的第一主题词汇分布概率进行区间约束以得到所述公众诉求记录的第二主题词汇分布概率;
对所述第二主题词语分布概率中出现概率最高的主题词汇进行特征提取以得到对应公众诉求记录的第一记录特征,基于每个公众诉求记录的第一记录特征之间的特征相似度对所有公众诉求记录进行事件聚类。
根据一个优选实施方式,提取第一聚类记录集中的每个公众诉求记录的第二记录特征以对第一聚类记录集中的每个公众诉求记录进行再次聚类得到第二聚类记录集包括:
抽取第一聚类记录集中对应公众诉求记录的所有核心动词以及每个核心动词的前驱修饰词以得到对应公众诉求记录的第一事件元素集,遍历第一事件元素集中的每个事件元素词汇以判断对应事件元素词汇指示的事件属性是否为泛指事件属性,并剔除第一事件元素集中拥有泛指事件属性的事件元素词汇;
从所述公众诉求记录中抽取与所述第一事件元素集中的事件元素词汇具有事件语义关系的所有特征词汇作为所述公众诉求记录的第二事件元素集,对所述第一事件元素集和所述第二事件元素集进行特征提取以得到对应公众诉求记录的第二记录特征,其中,所述事件语义关系包括组成关系、因果关系、跟随关系和并发关系,所述第二记录特征包括事件类型特征、事件时间特征、事件地点特征、事件触发词类型特征、事件触发词语义特征和触发词距离特征;
基于第二记录特征的多维特征向量分析得到每个公众诉求记录在不同事件特征空间中的特征相似度,对每个公众诉求记录在不同事件特征空间中的特征相似度进行加权融合以得到每个公众诉求记录的多维事件特征相似度,对多维事件特征相似度大于预设相似度阈值的公众诉求记录进行聚类以得到第二聚类记录集。
根据一个优选实施方式,所述资源配置列表包括机构标识符、配置人员数量、配置人员类型以及软硬件设备类型和数量。
根据一个优选实施方式,所述基于每个第一核心需求词汇服从的概率分布为每个第一核心需求词汇构造相应的转移代价函数的计算公式包括:
P(st,st+1)=C(st,st+1)-lnF(st,st+1)
其中,P(st,st+1)为转移代价函数,t为时间索引,st为第一核心需求词汇在t时刻下的新颖状态值,st+1为第一核心需求词汇在t+1时刻下的新颖状态值,C(st,st+1)为第一核心需求词汇从st转移到st+1的转移代价, F(st,st+1)为第一核心需求词汇服从的概率分布。
本发明通过对政务服务平台上海量的公众诉求记录进行分析,识别目标监测周期内新增的公众诉求事件,以准确及时地检测出城市居民的公众诉求记录反映的突发民生需求,并将具有相同主题特征和事件特征的所有公众诉求记录聚类至同一集合中,以根据该集合中的各条反馈了同一公众诉求事件的公众诉求记录分析得到对应公众诉求事件的事件紧急程度,并对紧急程度较高的突发民生需求分配相应的物力、人力资源,然后将其发送至相应的本地服务机构进行处理,有助于加快服务型政务的智能化转变。
附图说明
图1为一示例性实施例提供的基于大数据的智慧政务分析系统的结构框图。
具体实施方式
为使本发明的实施例、技术方案和优点更加明显,下面将结合附图对本发明的技术方案进行清楚、完整的描述,显然,所述的实施例是本发明的一部分实施例,而不是全部实施例。本领域技术人员应当理解的是,这些实施方式仅仅用于解释本发明的技术原理,并非旨在限制本发明的保护范围。
如图1所示,在一个实施例中,本发明的基于大数据的智慧政务分析系统包括政务服务平台、诉求分析云平台和本地服务机构。诉求分析云平台分别与政务服务平台和本地服务机构之间具有通信连接。所述本地服务机构包括街道办事处、社区服务中心以及为公众提供服务的其它管理机构。
诉求分析云平台包括数据获取模块、主题识别模块、事件识别模块、影响力分析模块和资源分配模块。
数据获取模块用于获取目标监测周期内发布于政务服务平台上的若干公众诉求记录,基于每条公众诉求记录之间的内容相似度分析得到所述目标监测周期的文本信息熵,并将所述文本信息熵与预设信息熵阈值进行比较。
主题识别模块用于在确定所述文本信息熵小于预设信息熵阈值时,识别目标监测周期内的所有新增诉求词汇,基于包含新增诉求词汇的每个公众诉求记录对应的第一记录特征对所有包含新增诉求词汇的公众诉求记录进行聚类以得到第一聚类记录集。
事件识别模块用于提取第一聚类记录集中的每个公众诉求记录的第二记录特征以对第一聚类记录集中的每个公众诉求记录进行再次聚类得到第二聚类记录集,对第二聚类记录集中的所有公众诉求记录进行分析以识别每个第二聚类记录集对应的公众诉求事件的诉求特征。
影响力分析模块用于根据第二聚类记录集中每个公众诉求记录包含的地点名称确定对应公众诉求事件的事件影响范围,基于所述公众诉求事件的事件影响范围和所述公众诉求事件的诉求特征确定所述公众诉求事件的响应度;
资源分配模块用于为响应度大于预设响应度阈值的公众诉求事件生成相应的资源配置列表,并将所述公众诉求事件和资源配置列表发送至对应的本地服务机构。
在一个实施例中,基于大数据的智慧政务分析系统所执行的的工作方法可以包括:
数据获取模块获取目标监测周期内发布于政务服务平台上的若干公众诉求记录,基于每条公众诉求记录之间的内容相似度分析得到所述目标监测周期的文本信息熵,并将所述文本信息熵与预设信息熵阈值进行比较。
可选地,所述基于每条公众诉求记录之间的内容相似度分析得到所述目标监测周期的文本信息熵还包括:将每条公众诉求记录之间的内容相似度归一化至区间[0,1],并基于所述归一化后的内容相似度分析得到所述目标监测周期内的文本信息熵,其中,所述内容相似度由不同公众诉求记录包含的每个词汇之间的相似度分析所得。
具体地,所述文本信息熵的计算公式为:
其中,M为文本信息熵,i与j均为公众诉求记录的数据索引,Sij为第i个公众诉求记录与第j个公众诉求记录之间的归一化内容相似度,n为目标监测周期内的公众诉求记录的总条数。
上述公式表征目标监测周期内公众诉求记录之间的内容越相似,则文本信息熵越小;目标监测周期内公众诉求记录之间的内容越不相似,则文本信息熵越大。所述目标监测周期为系统预设的时间周期。
可选地,所述公众诉求记录为与民生相关的诉求数据,其包括社区停水、违建乱搭和因道路施工发生的拥堵事件。
接下来,主题识别模块在确定所述文本信息熵小于预设信息熵阈值时,识别目标监测周期内的所有新增诉求词汇,基于包含新增诉求词汇的每个公众诉求记录对应的第一记录特征对所有包含新增诉求词汇的公众诉求记录进行聚类以得到第一聚类记录集。
可选地,在确定所述文本信息熵小于预设信息熵阈值时,则表示目标监测周期内的若干公众诉求记录反馈了相似主题的公众诉求事件。所述预设信息熵阈值为系统预先设置用于判断目标监测周期内所有公众诉求记录的文本信息熵大小的数值。
具体地,将目标监测周期内获取到的所有公众诉求记录与历史监测周期内获取到的所有历史公众诉求记录进行比较以识别目标监测周期内的所有新增诉求词汇包括:
提取目标监测周期内获取到的每个公众诉求记录的第一核心诉求词汇组,提取历史监测周期内获取到的每个历史公众诉求记录的第二核心诉求词汇组,将第一核心诉求词汇组中的每个第一核心诉求词汇与第二核心诉求词汇组中的第二核心诉求词汇进行比较以得到每个第一核心诉求词汇出现的时间间隔周期;
基于每个第一核心诉求词汇出现的时间间隔周期和在对应时间间隔周期内出现的总次数确定每个第一核心诉求词汇服从的概率分布,基于每个第一核心诉求词汇服从的概率分布为每个第一核心诉求词汇构造相应的转移代价函数;
将出现在历史公众诉求记录中的所有第一核心诉求词汇的新颖状态值设置为0,基于所述转移代价函数对第一核心诉求词汇进行状态转移,获取转移代价为最小时对应第一核心诉求词汇的新颖状态值,并将所有新颖状态值为1的第一核心诉求词汇作为目标监测周期内的新增诉求词汇。
可选地,所述第一核心诉求词汇为对应公众诉求记录中用于表征对应公众诉求事件的事件类型的核心动词;所述第二核心诉求词汇为对应历史公众诉求记录中用于表征对应公众诉求事件的事件类型的核心动词。
可选地,基于每个第一核心诉求词汇服从的概率分布为每个第一核心诉求词汇构造相应的转移代价函数的计算公式包括:
P(st,st+1)=C(st,st+1)-lnF(st,st+1)
其中,P(st,st+1)为转移代价函数,t为时间索引,st为第一核心诉求词汇在t时刻下的新颖状态值,st+1为第一核心诉求词汇在t+1时刻下的新颖状态值,C(st,st+1)为第一核心诉求词汇从st转移到st+1的转移代价, F(st,st+1)为第一核心诉求词汇服从的概率分布。
第一核心诉求词汇从st转移到st+1的转移代价为:
其中,st为第一核心诉求词汇在t时刻下的新颖状态值,st+1为第一核心诉求词汇在t+1时刻下的新颖状态值,μ为系统预设的转移代价参数,Nc为对应时间间隔周期内第一核心诉求词汇c出现的总次数。
可选地,第一记录特征为对应公众诉求记录的主题层特征,其用于表征对应公众诉求事件的事件类型。
具体地,基于包含新增诉求词汇的每个公众诉求记录对应的第一记录特征对所有包含新增诉求词汇的公众诉求记录进行聚类以得到第一聚类记录集包括:
对所有包含新增诉求词汇的公众诉求记录进行文档聚合以得到目标监测周期内的长文档集合,基于对应公众诉求记录中每个词汇之间的潜在语义关系识别对应公众诉求记录中的主题词汇,其中,所述主题词汇为对应公众诉求记录中用于表征事件类型的核心动词;
对每个公众诉求记录中包含的所有主题词汇进行统计以得到对应公众诉求记录的第一主题词语分布概率,对长文档集合中的每个主题词汇进行统计以得到每个主题词汇的文档主题分布概率,并基于所述文档主题分布概率对相应公众诉求记录的第一主题词汇分布概率进行区间约束以得到所述公众诉求记录的第二主题词汇分布概率;
对所述第二主题词语分布概率中出现概率最高的主题词汇进行特征提取以得到对应公众诉求记录的第一记录特征,基于每个公众诉求记录的第一记录特征之间的特征相似度对所有公众诉求记录进行事件聚类。
接下来,事件识别模块提取第一聚类记录集中的每个公众诉求记录的第二记录特征以对第一聚类记录集中的每个公众诉求记录进行再次聚类得到第二聚类记录集,对第二聚类记录集中的所有公众诉求记录进行分析以识别每个第二聚类记录集对应的公众诉求事件的诉求特征。
可选地,所述诉求特征包括隐性诉求特征和显性诉求特征,所述第二记录特征为对应公众诉求记录的事件层特征,其包括对应公众诉求事件的事件发生主体、事件时间和事件地点。
具体地,提取第一聚类记录集中的每个公众诉求记录的第二记录特征以对第一聚类记录集中的每个公众诉求记录进行再次聚类得到第二聚类记录集包括:
抽取第一聚类记录集中对应公众诉求记录的所有核心动词以及每个核心动词的前驱修饰词以得到对应公众诉求记录的第一事件元素集,遍历第一事件元素集中的每个事件元素词汇以判断对应事件元素词汇指示的事件属性是否为泛指事件属性,并剔除第一事件元素集中拥有泛指事件属性的事件元素词汇;
从所述公众诉求记录中抽取与所述第一事件元素集中的事件元素词汇具有事件语义关系的所有特征词汇作为所述公众诉求记录的第二事件元素集,对所述第一事件元素集和所述第二事件元素集进行特征提取以得到对应公众诉求记录的第二记录特征,其中,所述事件语义关系包括组成关系、因果关系、跟随关系和并发关系,所述第二记录特征包括事件类型特征、事件时间特征、事件地点特征、事件触发词类型特征、事件触发词语义特征和触发词距离特征;
基于第二记录特征的多维特征向量分析得到每个公众诉求记录在不同事件特征空间中的特征相似度,对每个公众诉求记录在不同事件特征空间中的特征相似度进行加权融合以得到每个公众诉求记录的多维事件特征相似度,对多维事件特征相似度大于预设相似度阈值的公众诉求记录进行聚类以得到第二聚类记录集。
可选地,所述触发词距离特征为对应公众诉求记录中每个核心动词与表征对应公众诉求事件的事件主体的词汇之间的间隔词语数量。所述拥有泛指事件属性的事件元素词汇即为对应公众诉求记录中具有最上位类型概念的事件元素词汇,例如人、地点、国家和机构,该类事件元素词汇具有普遍性,不具参考价值。
可选地,所述预设相似度阈值为系统预先设置的用于判断每个公众诉求记录表征的公众诉求事件是否相同的数值。
具体地,对第二聚类记录集中的所有公众诉求记录进行分析以识别每个第二聚类记录集对应的公众诉求事件的诉求特征包括:
基于第二聚类记录集中每个公众诉求记录中包含的表征用户需求的特征词汇分析得到城市居民的显性诉求特征,基于每个事件元素词汇的上下文信息分析得到城市居民的隐性诉求特征,其中,所述显性诉求特征为对应公众诉求记录中直接记载的用户诉求特征,所述隐性诉求特征为通过每个事件元素词汇的上下文信息推测得到的用户诉求特征。表征用户需求的特征词汇可以是特定字词后的语句段中的词汇,例如“急需……”,“请求……”。
接下来,影响力分析模块基于第二聚类记录集中每个公众诉求记录包含的地点名称确定对应公众诉求事件的事件影响范围,基于所述公众诉求事件的事件影响范围和所述公众诉求事件的诉求特征确定所述公众诉求事件的响应度,其中,所述响应度用于表征对应公众诉求事件的事件紧急程度。
具体地,基于第二聚类记录集中每个公众诉求记录包含的地点名称确定对应公众诉求事件的事件影响范围包括:
提取第二聚类记录集中各个公众诉求记录包含的所有地点名称,基于每个地点名称的实际位置特征以及其在对应公众诉求记录中的文本位置对所有地点名称进行层级聚类以形成相应的地区结构树,其中,所述实际位置特征为对应地点名称的实际经纬度大小;
将地区结构树中的各个地点名称映射至城市空间中的相应位置点上,对每个地点名称映射的位置点依层级进行统计以得到每个公众诉求事件的多级地域分布特征,基于所述多级地域分布特征确定对应公众诉求事件的事件影响范围,其中,所述事件影响范围用于表征对应公众诉求事件的地理分布范围。
可选地,所述对每个地点名称映射的位置点依层级进行统计包括对各个位置点按照其所对应的区进行计数统计、按照其所对应的县进行计数统计、按照其所对应的街进行计数统计。
可选地,所述多级地域分布特征用于表征对应公众诉求事件集中发生的区域范围,其中,所述区域范围包括广域事件范围和局部事件范围。
在一个实施例中,系统可为事件影响范围较广、居民需求记录总数较多、事件类型较为紧急的居民需求事件设置较高的响应度。
接下来,资源分配模块为响应度大于预设响应度阈值的公众诉求事件生成相应的资源配置列表,并将所述公众诉求事件和资源配置列表发送至对应的本地服务机构。
可选地,所述预设响应度阈值为系统预先设置的用于判断对应公众诉求事件是否需要紧急处理的数值。所述资源配置列表包括机构标识符、配置人员数量、配置人员类型以及软硬件设备类型和数量。
接下来,本地服务机构根据接收到的资源配置列表对所述公众诉求事件进行事件处理。
本发明通过对政务服务平台上海量的公众诉求记录进行分析,识别目标监测周期内新增的公众诉求事件,以准确及时地检测出城市居民的公众诉求记录反映的突发民生需求,并将具有相同主题特征和事件特征的所有公众诉求记录聚类至同一集合中,以根据该集合中的各条反馈了同一公众诉求事件的公众诉求记录分析得到对应公众诉求事件的事件紧急程度,并对紧急程度较高的突发民生需求分配相应的物力、人力资源,然后将其发送至相应的本地服务机构进行处理,有助于加快服务型政务的智能化转变。
另外,虽然上面参考特定模块讨论了特定功能,但是应当注意,本文讨论的各个模块的功能可以分为多个模块,和/或多个模块的至少一些功能可以组合成单个模块。另外,本文讨论的特定模块执行动作包括该特定模块本身执行动作,或者替换地该特定模块调用或以其他方式访问执行该动作的另一个组件或模块(或结合该特定模块一起执行动作)。因此,执行动作的特定模块可以包括执行动作的特定模块本身和/或执行动作的该特定模块调用或以其他方式访问的另一模块。
至此,已经结合附图所示的优选实施方式描述了本发明的技术方案,但是,本领域技术人员容易理解的是,本发明的保护范围显然不局限于这些具体实施方式。在不偏离本发明的原理的前提下,本领域技术人员可以对相关技术特征做出等同的更改或替换,这些更改或替换之后的技术方案都将落入本发明的保护范围之内。
Claims (9)
1.一种基于大数据的智慧政务分析系统,其特征在于,其包括政务服务平台、诉求分析云平台和本地服务机构,诉求分析云平台分别与政务服务平台和本地服务机构之间具有通信连接;所述本地服务机构包括街道办事处和社区服务中心;
诉求分析云平台包括数据获取模块、主题识别模块、事件识别模块、影响力分析模块和资源分配模块;
数据获取模块获取目标监测周期内发布于政务服务平台上的若干公众诉求记录,基于每条公众诉求记录之间的内容相似度分析得到所述目标监测周期的文本信息熵,并将所述文本信息熵与预设信息熵阈值进行比较;
主题识别模块在确定所述文本信息熵小于预设信息熵阈值时,识别目标监测周期内的所有新增诉求词汇,基于包含新增诉求词汇的每个公众诉求记录对应的第一记录特征对所有包含新增诉求词汇的公众诉求记录进行聚类以得到第一聚类记录集;
事件识别模块提取第一聚类记录集中的每个公众诉求记录的第二记录特征以对第一聚类记录集中的每个公众诉求记录进行再次聚类得到第二聚类记录集,对第二聚类记录集中的所有公众诉求记录进行分析以识别每个第二聚类记录集对应的公众诉求事件的诉求特征;
影响力分析模块基于第二聚类记录集中每个公众诉求记录包含的地点名称确定对应公众诉求事件的事件影响范围,基于所述公众诉求事件的事件影响范围和所述公众诉求事件的诉求特征确定所述公众诉求事件的响应度;
资源分配模块为响应度大于预设响应度阈值的公众诉求事件生成相应的资源配置列表,并将所述公众诉求事件和资源配置列表发送至对应的本地服务机构;
本地服务机构根据接收到的资源配置列表对所述公众诉求事件进行事件处理。
2.根据权利要求1所述的系统,其特征在于,所述公众诉求记录为与民生相关的诉求数据,其包括社区停水、违建乱搭和因道路施工发生的拥堵事件。
3.根据权利要求1或2所述的系统,其特征在于,对第二聚类记录集中的所有公众诉求记录进行分析以识别每个第二聚类记录集对应的公众诉求事件的诉求特征包括:
基于对应公众诉求记录中包含的表征用户需求的特征词汇分析得到城市居民的显性诉求特征,基于每个事件元素词汇的上下文信息分析得到城市居民的隐性诉求特征。
4.根据权利要求3所述的系统,其特征在于,基于第二聚类记录集中每个公众诉求记录包含的地点名称确定对应公众诉求事件的事件影响范围包括:
提取第二聚类记录集中各个公众诉求记录包含的所有地点名称,基于每个地点名称的实际位置特征以及其在对应公众诉求记录中的文本位置对所有地点名称进行层级聚类以形成相应的地区结构树;
将地区结构树中的各个地点名称映射至城市空间中的相应位置点上,对每个地点名称映射的位置点依层级进行统计以得到每个公众诉求事件的多级地域分布特征,基于所述多级地域分布特征确定对应公众诉求事件的事件影响范围。
5.根据权利要求4所述的系统,其特征在于,将目标监测周期内获取到的所有公众诉求记录与历史监测周期内获取到的所有历史公众诉求记录进行比较以识别目标监测周期内的所有新增诉求词汇包括:
提取目标监测周期内获取到的每个公众诉求记录的第一核心诉求词汇组,提取历史监测周期内获取到的每个历史公众诉求记录的第二核心诉求词汇组,将第一核心诉求词汇组中的每个第一核心诉求词汇与第二核心诉求词汇组中的第二核心诉求词汇进行比较以得到每个第一核心诉求词汇出现的时间间隔周期;
基于每个第一核心诉求词汇出现的时间间隔周期和在对应时间间隔周期内出现的总次数确定每个第一核心诉求词汇服从的概率分布,基于每个第一核心诉求词汇服从的概率分布为每个第一核心诉求词汇构造相应的转移代价函数;
将出现在历史公众诉求记录中的所有第一核心诉求词汇的新颖状态值设置为0,基于所述转移代价函数对第一核心诉求词汇进行状态转移,获取转移代价为最小时对应第一核心诉求词汇的新颖状态值,并将所有新颖状态值为1的第一核心诉求词汇作为目标监测周期内的新增诉求词汇。
6.根据权利要求5所述的系统,其特征在于,基于包含新增诉求词汇的每个公众诉求记录对应的第一记录特征对所有包含新增诉求词汇的公众诉求记录进行聚类以得到第一聚类记录集包括:
对所有包含新增诉求词汇的公众诉求记录进行文档聚合以得到目标监测周期内的长文档集合,基于对应公众诉求记录中每个词汇之间的潜在语义关系识别对应公众诉求记录中的主题词汇;
对每个公众诉求记录中包含的所有主题词汇进行统计以得到对应公众诉求记录的第一主题词语分布概率,对长文档集合中的每个主题词汇进行统计以得到每个主题词汇的文档主题分布概率,并基于所述文档主题分布概率对相应公众诉求记录的第一主题词汇分布概率进行区间约束以得到所述公众诉求记录的第二主题词汇分布概率;
对所述第二主题词语分布概率中出现概率最高的主题词汇进行特征提取以得到对应公众诉求记录的第一记录特征,基于每个公众诉求记录的第一记录特征之间的特征相似度对所有公众诉求记录进行事件聚类。
7.根据权利要求6所述的系统,其特征在于,提取第一聚类记录集中的每个公众诉求记录的第二记录特征以对第一聚类记录集中的每个公众诉求记录进行再次聚类得到第二聚类记录集包括:
抽取第一聚类记录集中对应公众诉求记录的所有核心动词以及每个核心动词的前驱修饰词以得到对应公众诉求记录的第一事件元素集,遍历第一事件元素集中的每个事件元素词汇以判断对应事件元素词汇指示的事件属性是否为泛指事件属性,并剔除第一事件元素集中拥有泛指事件属性的事件元素词汇;
从所述公众诉求记录中抽取与所述第一事件元素集中的事件元素词汇具有事件语义关系的所有特征词汇作为所述公众诉求记录的第二事件元素集,对所述第一事件元素集和所述第二事件元素集进行特征提取以得到对应公众诉求记录的第二记录特征,其中,所述事件语义关系包括组成关系、因果关系、跟随关系和并发关系,所述第二记录特征包括事件类型特征、事件时间特征、事件地点特征、事件触发词类型特征、事件触发词语义特征和触发词距离特征;
基于第二记录特征的多维特征向量分析得到每个公众诉求记录在不同事件特征空间中的特征相似度,对每个公众诉求记录在不同事件特征空间中的特征相似度进行加权融合以得到每个公众诉求记录的多维事件特征相似度,对多维事件特征相似度大于预设相似度阈值的公众诉求记录进行聚类以得到第二聚类记录集。
8.根据权利要求1至7之一所述的系统,其特征在于,所述资源配置列表包括机构标识符、配置人员数量、配置人员类型以及软硬件设备类型和数量。
9.根据权利要求8所述的系统,其特征在于,所述基于每个第一核心需求词汇服从的概率分布为每个第一核心需求词汇构造相应的转移代价函数的计算公式包括:
P(st,st+1)=C(st,st+1)-lnF(st,st+1)
其中,P(st,st+1)为转移代价函数,t为时间索引,st为第一核心需求词汇在t时刻下的新颖状态值,st+1为第一核心需求词汇在t+1时刻下的新颖状态值,C(st,st+1)为第一核心需求词汇从st转移到st+1的转移代价,F(st,st+1)为第一核心需求词汇服从的概率分布。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110496870.2A CN113157925A (zh) | 2021-05-07 | 2021-05-07 | 基于大数据的智慧政务分析系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110496870.2A CN113157925A (zh) | 2021-05-07 | 2021-05-07 | 基于大数据的智慧政务分析系统 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN113157925A true CN113157925A (zh) | 2021-07-23 |
Family
ID=76873699
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110496870.2A Pending CN113157925A (zh) | 2021-05-07 | 2021-05-07 | 基于大数据的智慧政务分析系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113157925A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115914468A (zh) * | 2023-03-09 | 2023-04-04 | 成都秦川物联网科技股份有限公司 | 智慧燃气呼叫中心的反馈管理方法、物联网系统及介质 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104091054A (zh) * | 2014-06-26 | 2014-10-08 | 中国科学院自动化研究所 | 面向短文本的群体性事件预警方法和系统 |
CN109460938A (zh) * | 2018-11-23 | 2019-03-12 | 中国城市和小城镇改革发展中心 | 一种城市智能中心控制系统及其方法 |
CN110111084A (zh) * | 2019-05-16 | 2019-08-09 | 上饶市中科院云计算中心大数据研究院 | 一种政务服务热线分析方法及系统 |
CN112580350A (zh) * | 2020-12-30 | 2021-03-30 | 讯飞智元信息科技有限公司 | 一种诉求分析方法、装置、电子设备和存储介质 |
-
2021
- 2021-05-07 CN CN202110496870.2A patent/CN113157925A/zh active Pending
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104091054A (zh) * | 2014-06-26 | 2014-10-08 | 中国科学院自动化研究所 | 面向短文本的群体性事件预警方法和系统 |
CN109460938A (zh) * | 2018-11-23 | 2019-03-12 | 中国城市和小城镇改革发展中心 | 一种城市智能中心控制系统及其方法 |
CN110111084A (zh) * | 2019-05-16 | 2019-08-09 | 上饶市中科院云计算中心大数据研究院 | 一种政务服务热线分析方法及系统 |
CN112580350A (zh) * | 2020-12-30 | 2021-03-30 | 讯飞智元信息科技有限公司 | 一种诉求分析方法、装置、电子设备和存储介质 |
Non-Patent Citations (2)
Title |
---|
刘卓: "融合时空信息的社交媒体事件检测方法研究", 《中国优秀硕士学位论文 信息科技辑》 * |
麦丞程,陈玉婷,等: "公共服务热线中基于地域自适应的突发事件实时检测方法", 《计算机学报》 * |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115914468A (zh) * | 2023-03-09 | 2023-04-04 | 成都秦川物联网科技股份有限公司 | 智慧燃气呼叫中心的反馈管理方法、物联网系统及介质 |
CN115914468B (zh) * | 2023-03-09 | 2023-05-12 | 成都秦川物联网科技股份有限公司 | 智慧燃气呼叫中心的反馈管理方法、物联网系统及介质 |
US11870937B2 (en) | 2023-03-09 | 2024-01-09 | Chengdu Qinchuan Iot Technology Co., Ltd. | Methods for smart gas call center feedback management and Internet of things (IoT) systems thereof |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN107818133B (zh) | 一种基于大数据的居民区网络能力分析方法及系统 | |
CN106778253A (zh) | 基于大数据的威胁情景感知信息安全主动防御模型 | |
CN115271635B (zh) | 智慧社区服务平台系统 | |
Fu et al. | Identifying spatiotemporal urban activities through linguistic signatures | |
US9792334B2 (en) | Large-scale processing and querying for real-time surveillance | |
CN111708774B (zh) | 一种基于大数据的产业分析系统 | |
KR101982756B1 (ko) | 분산인메모리기반 복합형스트림 데이터처리시스템 및 방법 | |
CN107633022A (zh) | 人员画像分析方法、装置及存储介质 | |
CN112256682B (zh) | 一种多维异构数据的数据质量检测方法及装置 | |
CN111062562A (zh) | 一种社区网格服务联动处置控制方法及系统 | |
CN111858924A (zh) | 一种具有网络舆情监控及分析功能的系统 | |
CN113157925A (zh) | 基于大数据的智慧政务分析系统 | |
CN106886517A (zh) | 业务选址方法、装置以及系统 | |
CN114385609A (zh) | 基于标签的政务事件处理系统、方法、设备及存储介质 | |
CN117291428A (zh) | 一种基于企业管理app的数据后台管理系统 | |
CN113015171A (zh) | 一种具有网络舆情监控及分析功能的系统 | |
CN112231381A (zh) | 基于webgis的空间数据信息协作平台及其搭建方法 | |
CN106056515A (zh) | 一种社区网格事件聚类特征的提取方法 | |
CN110377757A (zh) | 一种实时知识图谱构建系统 | |
CN112799155B (zh) | 一种基于大数据的环境监测方法 | |
CN105205605B (zh) | 一种城市智能门户终端与电力营销终端的交互服务系统 | |
CN113157924A (zh) | 一种面向智慧城市的居民公共需求响应方法 | |
CN108259588A (zh) | 一种基于大数据的文化云平台的推送方法及装置 | |
CN111523758A (zh) | 一种监狱大数据分析系统 | |
CN112464653A (zh) | 一种基于通信短信的实时事件识别和匹配方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
WD01 | Invention patent application deemed withdrawn after publication | ||
WD01 | Invention patent application deemed withdrawn after publication |
Application publication date: 20210723 |