CN112581106B - 一种融合处置机构网格语义的政务事件自动派单方法 - Google Patents

一种融合处置机构网格语义的政务事件自动派单方法 Download PDF

Info

Publication number
CN112581106B
CN112581106B CN202110202001.4A CN202110202001A CN112581106B CN 112581106 B CN112581106 B CN 112581106B CN 202110202001 A CN202110202001 A CN 202110202001A CN 112581106 B CN112581106 B CN 112581106B
Authority
CN
China
Prior art keywords
event
grid
prediction
handling
vector
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202110202001.4A
Other languages
English (en)
Other versions
CN112581106A (zh
Inventor
刘秀
钱程扬
杨亚宁
冯赛
武汉
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Yuance Information Technology Co ltd
Original Assignee
Suzhou Industrial Park Surveying Mapping And Geoinformation Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Suzhou Industrial Park Surveying Mapping And Geoinformation Co ltd filed Critical Suzhou Industrial Park Surveying Mapping And Geoinformation Co ltd
Priority to CN202110202001.4A priority Critical patent/CN112581106B/zh
Publication of CN112581106A publication Critical patent/CN112581106A/zh
Application granted granted Critical
Publication of CN112581106B publication Critical patent/CN112581106B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/10Office automation; Time management
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/205Parsing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/30Semantic analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Systems or methods specially adapted for specific business sectors, e.g. utilities or tourism
    • G06Q50/10Services
    • G06Q50/26Government or public services

Abstract

本发明提供一种融合处置机构网格语义的政务事件自动派单方法,包括如下步骤:S10.政务事件历史数据集获取:S20.事件数据预处理与语义特征提取;S30.构建事件处置方式预测模型
Figure 383731DEST_PATH_IMAGE001
:以历史数据集和与历史数据对应的地理位置作为输入,以处置机构编码作为最终输出,采用深度神经网络方式构建并训练预测模型
Figure 717761DEST_PATH_IMAGE002
;S40.构建事件处置机构预测模型
Figure 591039DEST_PATH_IMAGE003
;S50.使用训练获得的预测模型
Figure 908887DEST_PATH_IMAGE004
和预测模型
Figure 158603DEST_PATH_IMAGE005
来进行预测,输出需要处理该事件的对应事件机构编码。本发明通过一种基于深度神经网络的模型来同时预测业务类型和处置机构所在网格,并能够通过处置机构预测模型来获得最终的处置机构编码。

Description

一种融合处置机构网格语义的政务事件自动派单方法
技术领域
本发明涉及政府热线事件的智能化处理技术领域,特别涉及一种融合处置机构网格语义的政务事件自动派单方法。
背景技术
随着互联网和大数据技术的发展,为加快建设服务型政府,提高社会治理的水平,建设12345等热线服务平台已成为“互联网+政务服务”体系建设的重要内容,这些平台普遍整合了包括电话、网站、微信、APP等在内的线上线下各类服务渠道,为政民互动提供了高效便捷的沟通桥梁。在一个中大规模的城市,政务热线每年可以产生数以百万计的事件数据,这些数据的主要内容以文本方式被记录在数据库中,而在派单和处理过程中是有派单人员和网格人员等基层执行者逐条进行处理。因此,迫切需要结合智能化手段来构建对政务事件数据的自动化语义理解能力,提高事项理解、派单和处理的效率。
事件的高效派发处置取决于两个关键因素:(1)直接依赖政务服务的责任清单和处置规则,根据事件类型和业务管理类型梳理责任清单是社会综合整理普遍需要的基础性工作,但各地市实际情况复杂多变,因此预测模型的普适性会面临较大挑战。(2)通常较多关注事件发生的地点,然而最终处置机构在纵向上可能位于不同精细程度(市级、区级、街道级、社区级等)的管理网格,在横向上可能涉及不同的业务管理条线,且这些业务条线也大多有各自的多层网格划分。
因此,事件究竟该由哪个级别的哪个机构来负责处置,同时涉及到业务类别和地理位置两类信息,且是一个综合了多级业务归口信息、多层空间网格信息之后的一个决策问题。已公开的大部分技术或偏重于文本分类型,以同一类别体系下的标签预测为目标;或是仅将地理空间信息用作事件位置标识,未将空间信息作为一种特征或规律用于模型的学习。
中国专利文献CN104008108A公开了一种GIS地图栅格化处理方法、装置及投诉处理方法、系统。该文件使用地理位置的方式是采用一种栅格化方法将全幅地图划分为多个网格,而这些网格的作用仅仅用于标识投诉文本所处的地理位置所在,其目的主要用于将客户投诉定位到对应的区域,用于分析和解决该区域的投诉问题。对于如何将文本事件所获取的地理坐标当做输入源之一,建立学习模型以实现同时从地理位置和业务信息中学习事件特征,从而解决事件派单预测问题方面,未见提及。
中国专利文献CN110543562A提出了一种基于事件图谱的城市治理事件自动分拨方法及系统,该文件公开了通过事件描述结合空间位置的自动分拨方法,进一步提高了转派效率。具体使用的方法是从事件信息中获取地址描述,并基于该地址所在空间位置确定事件处理单位,及其类别预测和空间位置的获取是两个独立的部分,分别确定类别和位置后再基于图谱确定处理机构,这种方法有区域局限性,若更换地区,原有图谱方案无法发挥作用,且其位置的确定是基于分词提取和POI关系库匹配,对于不在POI库中的地址,则无法得出结果。该文献未针对以下问题提出解决方案:(1)空间位置上的责任主体会因为业务分类、区域权责的不同而有差异;(2)事件分类预测模型的过程仅使用自然语言文本处理技术,未结合地理位置进行联合训练,即自动分派和地理定位是两个完全独立的过程,因此地理位置和业务分类隐含的深层特征没有进行进一步提取,难获得交叉。
中国专利文献CN109325116A提出了一种基于深度学习的城市事件自动分类派发方法及装置。该文献公布了一个基于卷积神经网络模型的分类模型,进行业务编码分类,相比于人工分类,实现了机器根据模型一次运算,有助于系统运行效率的提升。但对地理信息的使用仅限于从事件描述中提取地址信息进行事件定位,未对地址信息的深层语义进行提取,也未将业务分类和地理位置进行模型深度融合。
中国专利文献CN108573031A公开了一种基于内容的投诉分类方法和系统,尽管也是对于政务类热线文本的分类处理,但是只考虑了职能部门的分发处理。而实际中,结合我国条块融合管理的现状,实际中派发部门除了这种职能类的条线部门,还包括市-区-街道-社区-网格这些“块”,只考虑职能无法实现不同位置的派发,比如以该专利中的实例为例,其虽然具备确定“某某街有小贩乱摆摊行为。”的细分结果为城管大队的能力,但是无法确定具体为哪个街道的城市管理部门,因此一般需要层层下派,而更高效的方式应是明确派发至具体的处置单位。此外,该专利的分类方法采用的是朴素贝叶斯和决策树,是比较传统的机器学习方法。
综上所述,已有技术或部分解决了事件的业务分类问题,或在此基础上引入了事件发生的地理位置用于辅助判断。但对地理位置的关注局限于事件发生位置,并未涉及处理机构所处网格的预测判别。鉴于处置机构的最终判定是一个存在较高复杂性的决策过程,基于上述信息很难直接利用学习模型来完整判断和预测事件所对应的最终处置机构。此外,已有技术因为没有同时兼顾业务类别和空间位置的联合训练模型,自动派单方法在不同城市之间的通用性将受到限制。
针对现有技术中存在的问题,本发明公布了一种融合空间位置表征的政务事件派单预测模型,该模型将地理位置融合入最终派单机构的预测过程。
发明内容
为解决现有技术中存在的上述问题,本发明在关注事件发生位置作为输入项的同时,明确提出了事件处置机构所在的空间网格,应当作为模型预测输出的重要组成部分,并结合这项改进,进一步提升事件派单的处理效率。
本发明提供的具体技术方案如下:一种融合处置机构网格语义的政务事件自动派单方法,包括如下步骤:
S10. 政务事件历史数据集获取:政务事件历史数据的重要关键字段包括:事件类别,事件描述文本,网格编号、事件处置机构编码;其中,事件类别包括事件大类、事件中类、事件小类,事件大、中、小类取得相应的业务编码;事件处置机构为派单处置机构;事件描述文本为接线员根据热线电话信息记录下来的,与详细经过和用户诉求相关的完整文字描述;
S20. 事件数据预处理与语义特征提取:先对事件描述文本进行预处理,然后获取词向量矩阵
Figure 330591DEST_PATH_IMAGE001
,提取事件发生地点对应的地名地址信息,并获得地名地址向量
Figure 950928DEST_PATH_IMAGE002
S30. 构建事件处置方式预测模型
Figure 325802DEST_PATH_IMAGE003
:以步骤获取的S20词向量矩阵
Figure 816826DEST_PATH_IMAGE004
和地名地址向量
Figure 999546DEST_PATH_IMAGE005
作为输入,以事件类别的业务编码和网格编号作为最终输出,采用深度神经网络方式构建并训练事件处置方式预测模型
Figure 857911DEST_PATH_IMAGE006
S40. 构建事件处置机构预测模型
Figure 784279DEST_PATH_IMAGE007
:以事件类别对应的业务编码和网格编号作为输入,事件处置机构编码为输出,采用SVM 模型训练并构建事件处置机构预测模型
Figure 129810DEST_PATH_IMAGE008
S50.新发生事件的处置机构预测:使用训练获得的事件处置方式预测模型
Figure 732698DEST_PATH_IMAGE003
和事件处置机构预测模型
Figure 530890DEST_PATH_IMAGE009
来进行预测,输出需要处理该事件的对应事件处置机构编码。
具体地,步骤S50中的新事件的描述文本经过S20相同的预处理与语义特征提取后,输入到模型
Figure 260949DEST_PATH_IMAGE006
,通过S303的事件派单处置方式判定,获得新事件的各级事件类别的业务编码和网格编码,再将业务编码和网格编码输入到模型
Figure 460986DEST_PATH_IMAGE010
,获得最终机构编码。
优选地,S20步骤中所提及的预处理包括文本清洗与过滤、停用词处理、标点符号处理、文本分词等技术环节。在更优化条件下,可以引入用户自定义的政务服务与社会治理的领域词典,来提高文本分析的性能和准确性。
优选地,通过S20步骤中语义特征提取获得地名地址向量
Figure 736241DEST_PATH_IMAGE011
和词向量矩阵
Figure 21728DEST_PATH_IMAGE012
其中,地名地址向量
Figure 555478DEST_PATH_IMAGE013
获取步骤为:
S201.事件发生地点的解析:根据事件发生地点的文字描述获取与事件发生直接相关的地名地址信息,并对其进行标准化处理;
S202.通过获取词嵌入表征
Figure 610022DEST_PATH_IMAGE014
和经纬度向量
Figure 557642DEST_PATH_IMAGE015
,求得地名地址向量
Figure 330426DEST_PATH_IMAGE016
词向量矩阵
Figure 667867DEST_PATH_IMAGE017
的获取步骤为:
S2001.事件描述文本的语义特征提取:使用Word2Vec技术用于对分词后的文本序列进行词嵌入表征,获得事件描述文本的每一个词的预训练词向量;
S2002.事件描述文本的语义特征映射:基于事件中词序列的顺序结构,将事件描述文本序列转换为词向量矩阵
Figure 311338DEST_PATH_IMAGE017
,设置词序列的长度为定值a,超出部分截断,而不足的使用0补齐。
其中,本发明中事件描述文本的语义特征映射原理是对词序列进行截断后在映射到词向量矩阵,不是截断向量矩阵。
优选地,步骤S202中地名地址向量
Figure 459553DEST_PATH_IMAGE005
获取方法为包括如下步骤:
S2021.事件发生地点的地理编码:基于地理编码坐标的计算和推测方法,获得地名地址的经纬度坐标信息解算,以能获取的最高精度经纬度坐标为准,无法准确获得经纬度坐标的记录,则以获得的最小行政区域范围中心点为输出经纬度坐标;对所获得的经纬度坐标进行归一化处理,得到经纬度向量
Figure 188475DEST_PATH_IMAGE018
S2022.事件发生地点的语义特征提取:基于Word2Vec技术,通过预训练实现地址和地名信息的词嵌入表征
Figure 329606DEST_PATH_IMAGE019
,由于其主要表征地理位置,
Figure 93163DEST_PATH_IMAGE014
隐含了地理位置的语义特征;
S2023. 将词嵌入表征
Figure 645236DEST_PATH_IMAGE019
和经纬度向量
Figure 861454DEST_PATH_IMAGE015
拼接,获得地名地址向量
Figure 275117DEST_PATH_IMAGE020
,即:
Figure 424339DEST_PATH_IMAGE021
优选地,所述S30所述的构建事件处置方式预测模型
Figure 383199DEST_PATH_IMAGE003
,其包括如下步骤:
S301.事件派单处置方式建模:深层特征提取模块同时使用词向量矩阵
Figure 352292DEST_PATH_IMAGE004
和地名地址向量
Figure 304067DEST_PATH_IMAGE022
作为输入;
S302.派单方式预测的损失定义
Figure 42216DEST_PATH_IMAGE024
及训练事件处置方式预测模型
Figure 686824DEST_PATH_IMAGE025
过程:样本数据集按一定比例随机分割成训练集和验证集,损失定义L考虑了业务类型的预测损失
Figure 383692DEST_PATH_IMAGE026
和处置机构所处网格的预测损失
Figure 404737DEST_PATH_IMAGE027
,其中,
Figure 262972DEST_PATH_IMAGE028
由业务大、中、小各类预测损失构成;
Figure 829214DEST_PATH_IMAGE029
由各层网格预测局部损失和全局损失共同构成;其公式如下:
Figure 772899DEST_PATH_IMAGE030
每一轮迭代完成后均计算验证集的损失,当验证集损失连续十轮没有增加时,停止迭代,保留损失最小的模型参数;
S303.事件派单处置方式预测结果判定:将训练后的事件处置预测模型
Figure 332056DEST_PATH_IMAGE003
输入词向量矩阵
Figure 44797DEST_PATH_IMAGE017
和地名地址向量
Figure 280475DEST_PATH_IMAGE002
,输出获得事件分别在各级事件分类下的概率分布以及网格编码的全局概率分布,取各级事件分类下的最大概率对应的事件类别作为事件在该级分类下的预测类别;网格编码的全局概率分布,其每个值在0到1之间,表示事件落在该网格(含各级网格)的可能性,取超过阈值K 的为预测网格。
优选地,业务类型的预测损失
Figure 445878DEST_PATH_IMAGE031
和机构所处网格的预测损失
Figure 808726DEST_PATH_IMAGE032
计算方式如下:
Figure 392285DEST_PATH_IMAGE033
Figure 549597DEST_PATH_IMAGE034
为局部损失,
Figure 202295DEST_PATH_IMAGE035
为全局损失,
Figure 103255DEST_PATH_IMAGE036
为各层事业类别的业务编码的损失权重,c为事件类别,h为层数,H为最大层数,
Figure 308365DEST_PATH_IMAGE037
为各层网格编码损失权重,a 为网格编码;
Figure 636578DEST_PATH_IMAGE038
为样本个数,
Figure 776572DEST_PATH_IMAGE039
为多分类交叉熵函数,
Figure 215644DEST_PATH_IMAGE040
为二分类交叉函数,
Figure 508216DEST_PATH_IMAGE041
为第
Figure 7331DEST_PATH_IMAGE042
个样本在第h层所含业务类别的真实概率分布,
Figure 634621DEST_PATH_IMAGE043
为第
Figure 877383DEST_PATH_IMAGE044
个样本在第h层所含业务类别的预测概率分布,
Figure 522997DEST_PATH_IMAGE045
为第
Figure 927434DEST_PATH_IMAGE046
个样本在第h层所含网格类别的真实概率分布,
Figure 42020DEST_PATH_IMAGE047
为第
Figure 370365DEST_PATH_IMAGE048
个样本在第h层所含网格类别的预测概率分布,
Figure 621217DEST_PATH_IMAGE049
为第
Figure 462134DEST_PATH_IMAGE051
个样本所有网格类别的真实概率分布,
Figure 64017DEST_PATH_IMAGE052
为第
Figure 383003DEST_PATH_IMAGE054
个样本所有网格类别的预测概率分布。
优选地,步骤S301事件派单处置方式建模,具体包括:
S3011.事件类别预测模块:使用CNN结构的网络从词向量矩阵
Figure 271718DEST_PATH_IMAGE001
中提取业务语义特征,获得特征向量
Figure 283536DEST_PATH_IMAGE055
,特征向量
Figure 107136DEST_PATH_IMAGE056
经过隐层
Figure 229813DEST_PATH_IMAGE057
Figure 940411DEST_PATH_IMAGE058
最终获得
Figure 388710DEST_PATH_IMAGE059
,每个隐层
Figure 434026DEST_PATH_IMAGE060
由前一层级的隐层输出
Figure 360394DEST_PATH_IMAGE061
和当前的特征向量
Figure 705924DEST_PATH_IMAGE062
共同决定;其中,
Figure 308813DEST_PATH_IMAGE059
是通过
Figure 107005DEST_PATH_IMAGE063
的非线性变化得到,经过不同隐层分支输出得到大、中、小三个层级的事件类别的业务编码概率分布
Figure 837063DEST_PATH_IMAGE064
,其中i 表示层级,
Figure 37100DEST_PATH_IMAGE065
;h为隐层;
S3012.处置机构网格编号预测模块:将事件类别预测的最终隐层
Figure 312355DEST_PATH_IMAGE066
通过非线性变换得到
Figure 332264DEST_PATH_IMAGE067
,将
Figure 600434DEST_PATH_IMAGE068
和表征地理空间位置的向量
Figure 654978DEST_PATH_IMAGE069
进行拼接作为空间网格编码预测模块的输入,与事件类别预测模块类似,经过多个隐层得到全局输出,经过隐层分支分别得到每级网格编码的局部输出,每个隐层由前一隐层输出和输入向量共同决定,空间网格编码预测的最终输出由每级的局部输出和全局输出综合得到。
优选地,空间网格编码预测模块的最终输出计算公式为:
Figure 868178DEST_PATH_IMAGE070
其中,
Figure 640962DEST_PATH_IMAGE071
为处置机构所在空间网格编码预测的最终输出,
Figure 447244DEST_PATH_IMAGE072
为处置机构所在网格编码的全局预测概率,
Figure 621873DEST_PATH_IMAGE073
为局部网格预测概率,此外,
Figure 238930DEST_PATH_IMAGE074
为权重系数,用于调节全局预测概率和局部预测概率之间的权重,A为网格编码,H为最大层数。
优选地,步骤S3011中隐层
Figure 233431DEST_PATH_IMAGE075
通过如下公式计算得到,
Figure 108983DEST_PATH_IMAGE076
其中,
Figure 138119DEST_PATH_IMAGE077
为激活函数ReLU,
Figure 175345DEST_PATH_IMAGE078
为权重项,
Figure 906410DEST_PATH_IMAGE079
为偏置项;
步骤S3011中事件类别预测模块的最终输出
Figure 54494DEST_PATH_IMAGE080
通过如下公式计算得到,
Figure 938137DEST_PATH_IMAGE081
其中,
Figure 411843DEST_PATH_IMAGE082
为softmax函数,
Figure 131669DEST_PATH_IMAGE083
为权重项,
Figure 817865DEST_PATH_IMAGE084
为偏置项。
本发明基于自然语言处理技术和地理位置语义理解对政务事件描述文本进行解析,通过一种基于深度神经网络的模型来同时预测业务类型和处置机构所在网格,并能够通过处置机构预测模型来获得最终的处置机构编码。
与现有技术相对比,本发明的有益效果如下:
(1)考虑到不同业务类别的投诉,其处置机构可能对应不同行政级别这一特点,在预测模型中将事件类别信息和地理位置信息做了融合,使得神经网络能够从中学习获得两类信息的交互特征。
(2)本发明中对处置机构网格的预测过程不需要依赖于本地机构坐标信息,而使用一定程度缓解了地址坐标未登记完全的问题。
(3)本发明中分级预测的方式考虑了业务类别标签和网格编码标签的内部层级依赖关系。且派发起点可以是任意级别的行政层级,而预测结果可能是任意粒度的网格编码,这也符合政务事件处置的实际情况。
(4)本发明可用于自动确定处置机构,使派单流程自动化、智能化,有助于简化坐席人员进行事件登记派发时的人工判断和手动选取操作过程,降低坐席人员的工作量,提高事件整体处理效率。
(5)本发明是一种基于业务分类和地理位置的联合训练模型,因此已训练好的模型还可以应用于业务归口或网格划分模式不完全一致的其他城市或地区,仅需要基于当地的历史数据通过迁移学习的方式来对该模型进行优化训练即可。
(6)大部分现有技术偏重于文本分类型,其分类目标都是同一类别体系下的标签,确定文本属于该类别体系下的某个或多个标签。然而,本发明的特殊之处在于,针对事件描述文本需要分派的处置单位的确定为目标场景,即将最终目标确立为预测输出最终需要处置该事件的具体机构。这个目标与上述其他目标的主要复杂性与差异性在于,一个具体事件的处置机构一方面与负责该事件的业务管理条线相关,也与所处地理位置,以及伴随的政府机构设置情况有关。在城市核心区,这种处理分类大多更为清晰,然而在基层乡镇或区县中,实际分工可能根据实际情况变得更为精简。因此,不同的城市和区域在职责清单层面呈现出更多的个性化,即便是同样的事情,在不同的地方和管理层级,处置机构也很有可能不同。因此,从整体上看,事件的处置机构的确定不仅需要关注文本中与业务类别相关的信息量,而且需要同时关注事件发生的地理空间位置和处置机构所在位置。
(7)与现有技术(如专利文献CN110543562A)相比,本发明中的类别预测和网格预测不是独立进行,而是融合在一个模型中,支持任意级别行政区作为派发起点进行模型训练,对于具有相似事件分类结构的地区,可以通过迁移学习快速进行训练预测,本发明通过预训练模型获取位置实体的特征向量表示,并辅以坐标信息提高准确率,能缓解不在POI库中地址的问题。
(8)目前因为其中业务信息和空间信息的复杂性,想要高效地判定具体的派单对象,迫切需要减少对坐席工作人员不均衡的经验积累和人为判断能力的依赖,本发明基于以上现状,采用构建深度学习模型的方式,将业务信息和空间信息同时作为模型的输入数据,通过神经网络的非线性拟合能力来对事件处置和派单问题进行深层次特征提取和建模,以实现从文字段落式事件描述到明确判别最终处置机构的自动化机器预测模式。该方法在降低事件分派整体难度、提高城市治理的处置效率、节省大量消耗的人力资源,减少经验不均衡带来的错误风险等方面具有重要意义。
(9)本发明提供的预测模型
Figure 821593DEST_PATH_IMAGE085
考虑的损失,具体为业务类型的预测损失
Figure 200622DEST_PATH_IMAGE086
和机构所处网格的预测损失
Figure 391432DEST_PATH_IMAGE087
,从而进行模型训练,使得预测更加准确。
附图说明
图1为本发明提供的网格规划示意图。
图2是本发明中事件处置机构预测判定的流程图。
图3是本发明中事件处置方式预测模型
Figure 146898DEST_PATH_IMAGE088
的结构图。
附图标记如下:
a:社区;b:街道;c:区。
具体实施方式
下面结合附图,对本发明提供的一种融合处置机构网格语义的政务事件自动派单方法进行具体说明。
本发明针对事件描述文本需要分派的处置机构的确定为目标场景,即将最终目标确立为预测输出最终需要处理该事件的具体机构。这个目标与上述其他目标的主要复杂性与差异性在于,一个具体事件的处置机构一方面与负责该事件的业务管理条线相关,也与所处地理位置,以及伴随的政府机构设置情况有关。在城市核心区,这种处理分类大多更为清晰,然而在基层乡镇或区县中,实际分工可能根据实际情况变得更为精简。因此,不同的城市和区域在职责清单层面呈现出更多的个性化,即便是同样的事情,在不同的地方和管理层级,处置机构也很有可能不同。因此,从整体上看,事件的处置机构的确定不仅需要关注文本中与业务类别相关的信息量,而且需要同时关注事件发生的地理空间位置和处置机构所在位置。
如图1所示,处置机构分为三层:分别为社区a,街道b 和区c;以处置机构判定为目标,其难点是处置机构与业务类别并不是一一对应关系。比如判定了一条文本投诉为水问题,已经知道了业务类别,但仍然无法确定由哪个机构来处理,一是因为不同地区的授权处置机构不同,比如A区停水全部由某水务公司管理,而B街道的停水由街道集中管理;二是因为不同地区行政管理的下沉程度不同,比如C区停水由行政单位街道某下辖社区管理;因此,在发明中除了确定类别信息,还需要确定网格信息,且本专利中这个网格信息包含两个层次:首先,提取出来的位置属于哪个网格,如目标位置本身可以分派给1、12、121三种不同归属,记作(1,12,121);其次,属于哪一层的网格,即网格深度,假设为A区网格规划,停水处置机构为水务公司,其实际位置应截止到区(1),假设为B区网格规划,停水处置机构为某街道,则其实际位置应截止到街道(1,12),假设为C区网格规划,停水处置机构为某社区,则其实际位置应截止到社区(1,12,121),可知,同一类别在不同位置,会产生不同的位置路径。反之,不同类别在同一位置,也会产生不同的位置路径,如A区同位置的邻里纠纷事件由具体社区管理,则其实际位置路径为(1,12,121)。因此本专利中综合了类别信息和位置信息,并构建模型来联合预测业务类别和机构所处位置。在二者基础上,可通过另一个独立的分类算法(如SVM)来实现对处置机构的预测判定。
具体地,如图2-3所示,一种融合处置机构网格语义的政务事件自动派单方法,包括如下步骤:
S10. 政务事件历史数据集获取:政务事件历史数据的重要关键字段包括:事件类别,事件描述文本,网格编号、处置机构编码;其中,事件类别包括事件大类、事件中类、事件小类,事件大、中、小类应取得相应的业务编码;处置机构为派单处置机构;事件描述文本为接线员根据热线电话信息记录下来的,针对事件详细经过和用户诉求相关的完整文字描述;
其中,网格编码来源于每条投诉文本实际处置机构直属行政区域的地理编码,如对流动摊贩的处置机构为“唯亭街道执法大队”,则其直属行政区域“唯亭街道”的网格编码为“320571052”,假定以市级行政区为根节点,目标网格为包含区-街道-社区的三级网格,则抽取其标签为“71”、“71052”,其中“71”为 “工业园区”的区级网格编码,“71052”为“唯亭街道”的街道级网格编码。又如对无证无照的处置机构为“区市场监督管理局”,则其直属行政区域为园区,对应网格编码“320571”,抽取标签为“71”
S20. 事件数据预处理与语义特征提取:先对事件描述文本进行预处理,然后获取词向量矩阵
Figure 269049DEST_PATH_IMAGE004
,提取事件发生地点对应的地名地址信息,并获得地名地址信息的向量表示
Figure 818979DEST_PATH_IMAGE089
其中,本发明在获取词向量矩阵
Figure 762664DEST_PATH_IMAGE004
和地名地址向量之前均需要对事件描述文本进行预处理,其中,本发明提供的预处理包括文本清洗与过滤、停用词处理、标点符号处理、文本分词等技术环节。在更优化条件下,可以引入用户自定义的政务服务与社会治理的领域词典,来提高文本分析的性能和准确性。
其中,通过S20步骤中所提及的事件数据预处理与语义特征提取获得地名地址向量
Figure 56242DEST_PATH_IMAGE022
和词向量矩阵
Figure 503404DEST_PATH_IMAGE017
;其中,地名地址向量
Figure 974968DEST_PATH_IMAGE020
获取步骤为:
S201.事件发生地点的解析:根据事件发生地点的文字描述获取与事件发生直接相关的地名地址信息,并对其进行标准化处理;
S202.通过获取词嵌入表征
Figure 140370DEST_PATH_IMAGE090
和经纬度向量
Figure 237639DEST_PATH_IMAGE091
,求得地名地址向量
Figure 804887DEST_PATH_IMAGE092
词向量矩阵
Figure 696619DEST_PATH_IMAGE093
的获取步骤为:
S2001.事件描述文本的语义特征提取:使用Word2Vec技术用于对分词后的文本序列进行词嵌入表征,获得事件描述文本的每一个词的预训练词向量;
S2002.事件描述文本的语义特征映射:基于事件中词序列的顺序结构,将事件描述文本序列转换为词向量矩阵
Figure 598585DEST_PATH_IMAGE094
,设置词序列的长度为定值a,超出部分截断,而不足的用0补齐。其中,本发明中事件描述文本的语义特征映射原理是对词序列进行截断后在映射到词向量矩阵,不是截断向量矩阵。
具体地,步骤S202中地名地址向量
Figure 499545DEST_PATH_IMAGE069
获取方法为包括如下步骤:
S2021.事件发生地点的地理编码:基于地理编码坐标的计算和推测方法,获得地名地址的经纬度坐标信息解算,以能获取的最高精度经纬度坐标为准,无法准确获得经纬度坐标的记录,则以获得的最小行政区域范围中心点为输出经纬度坐标;对所获得的经纬度坐标进行归一化处理,得到经纬度向量
Figure 655720DEST_PATH_IMAGE015
S2022.事件发生地点的语义特征提取:基于Word2Vec技术,通过预训练实现地址和地名信息的词嵌入表征
Figure 983933DEST_PATH_IMAGE095
,由于其主要表征地理位置,
Figure 123927DEST_PATH_IMAGE096
隐含了地理位置的语义特征;
S2023. 将词嵌入表征
Figure 579310DEST_PATH_IMAGE014
和经纬度向量
Figure 855571DEST_PATH_IMAGE015
拼接,获得地名地址向量
Figure 354685DEST_PATH_IMAGE097
即:
Figure 981976DEST_PATH_IMAGE098
S30. 构建事件处置方式预测模型
Figure 476936DEST_PATH_IMAGE025
:以历史数据集中的事件描述文本和S20中获取的与历史数据对应的地理位置信息作为输入,以事件类别和网格编号作为最终输出,采用深度神经网络方式构建并训练预测模型
Figure 873282DEST_PATH_IMAGE099
其中,本发明提供的所述S30所述的构建事件处置方式预测模型
Figure 277718DEST_PATH_IMAGE099
,其包括如下步骤:
S301.事件派单处置方式建模:深层特征提取模块同时使用词向量矩阵
Figure 392305DEST_PATH_IMAGE100
和地名地址向量
Figure 907600DEST_PATH_IMAGE022
作为输入;
S302.派单方式预测的损失定义
Figure 174764DEST_PATH_IMAGE101
及训练事件处置方式预测模型
Figure 750102DEST_PATH_IMAGE102
过程:样本数据集按一定比例随机分割成训练集和验证集,损失定义
Figure 351985DEST_PATH_IMAGE024
考虑了业务类型的预测损失
Figure 936550DEST_PATH_IMAGE026
和处置机构所处网格的预测损失
Figure 307488DEST_PATH_IMAGE103
,其中,
Figure 568574DEST_PATH_IMAGE028
由业务大、中、小各类预测损失构成;
Figure 126595DEST_PATH_IMAGE032
由各层网格预测局部损失和全局损失函共同构成;其公式如下:
Figure 514851DEST_PATH_IMAGE104
每一轮迭代完成后均计算验证集的损失,当验证集损失连续十轮没有增加时,停止迭代,保留损失最小的模型参数;
其中,业务类型的预测损失
Figure 740296DEST_PATH_IMAGE028
和机构所处网格的预测损失
Figure 657436DEST_PATH_IMAGE105
计算方式如下:
Figure 984643DEST_PATH_IMAGE106
Figure 645432DEST_PATH_IMAGE107
为局部损失,
Figure 725383DEST_PATH_IMAGE108
为全局损失,
Figure 79004DEST_PATH_IMAGE109
为各层事业类别的业务编码的损失权重,c为事件类别,h 为层数,H为最大层数,
Figure 611617DEST_PATH_IMAGE110
为各层网格编码损失权重,a 为网格编码;N为样本个数,
Figure 593873DEST_PATH_IMAGE111
为多分类交叉熵函数,
Figure 262751DEST_PATH_IMAGE112
为二分类交叉函数,
Figure 52853DEST_PATH_IMAGE113
为第
Figure 72761DEST_PATH_IMAGE114
个样本在第h层所含业务类别的真实概率分布,
Figure 340932DEST_PATH_IMAGE115
为第
Figure 129896DEST_PATH_IMAGE048
个样本在第
Figure 576052DEST_PATH_IMAGE117
层所含业务类别的预测概率分布,
Figure 83257DEST_PATH_IMAGE118
为第
Figure 889539DEST_PATH_IMAGE048
个样本在第h层所含网格类别的真实概率分布,
Figure 64168DEST_PATH_IMAGE119
为第
Figure 930493DEST_PATH_IMAGE048
个样本在第h层所含网格类别的预测概率分布,
Figure 439841DEST_PATH_IMAGE120
为第
Figure 784234DEST_PATH_IMAGE048
个样本所有网格类别的真实概率分布,
Figure 813370DEST_PATH_IMAGE121
为第
Figure 850596DEST_PATH_IMAGE048
个样本所有网格类别的预测概率分布。
S303.事件派单处置方式预测结果判定:将训练后的事件处置预测模型
Figure 332393DEST_PATH_IMAGE122
输入词向量矩阵
Figure 496789DEST_PATH_IMAGE100
和地名地址向量
Figure 380432DEST_PATH_IMAGE022
,输出获得事件分别在各级事件分类下的概率分布以及网格编码的全局概率分布,取各级事件分类下的最大概率对应的事件类别作为事件在该级分类下的预测类别;网格编码的全局概率分布,其每个值在0到1之间,表示事件落在该网格(含各级网格)的可能性,取超过阈值K 的为预测网格。
步骤S301.事件派单处置方式建模,具体包括:
S3011.事件类别预测模块:使用CNN结构的网络从词向量矩阵
Figure 588559DEST_PATH_IMAGE004
中提取业务语义特征,获得特征向量
Figure 557652DEST_PATH_IMAGE123
,特征向量
Figure 761625DEST_PATH_IMAGE124
经过隐层
Figure 765353DEST_PATH_IMAGE125
Figure 144382DEST_PATH_IMAGE058
最终获得
Figure 335192DEST_PATH_IMAGE064
,每个隐层
Figure 90658DEST_PATH_IMAGE126
由前一层级的隐层输出
Figure 699625DEST_PATH_IMAGE127
和当前的特征向量
Figure 249555DEST_PATH_IMAGE123
共同决定;其中,
Figure 193240DEST_PATH_IMAGE064
是通过
Figure 486819DEST_PATH_IMAGE075
的非线性变化得到,经过不同隐层分支输出得到大、中、小三个层级的事件类别的业务编码概率分布
Figure 448827DEST_PATH_IMAGE059
,其中i 表示层级,
Figure 435238DEST_PATH_IMAGE128
;h为隐层;
其中所述卷积结构(CNN)包含卷积层和池化层,卷积层使用不同大小卷积核提取特征,如[2,3,4],激活函数为ReLU函数,池化层采用最大池化提取主要特征,最后将主要特征拼接成一维向量作为该投诉文本的特征向量;其中隐层指的是神经网格的中间层。所述隐层均为全连接结构,并加入Dropout防止过拟合。所述事件类别预测部分的输出激活函数均采用Softmax函数。
其中,隐层
Figure 866219DEST_PATH_IMAGE129
通过如下公式计算得到,
Figure 963488DEST_PATH_IMAGE130
其中,
Figure 281468DEST_PATH_IMAGE077
为激活函数ReLU,
Figure 173201DEST_PATH_IMAGE131
权重项,
Figure 91478DEST_PATH_IMAGE132
为偏置项;
其中,本发明提供的事件类别预测模块的最终输出
Figure 461280DEST_PATH_IMAGE064
通过如下公式计算得到,
Figure 148613DEST_PATH_IMAGE133
其中,
Figure 982884DEST_PATH_IMAGE134
为softmax函数,
Figure 857299DEST_PATH_IMAGE083
为权重项,
Figure 296371DEST_PATH_IMAGE135
为偏置项。
S3012.处置机构网格编号预测模块:将事件类别预测的最终隐层
Figure 838210DEST_PATH_IMAGE136
通过非线性变换得到
Figure 71746DEST_PATH_IMAGE137
,将
Figure 433457DEST_PATH_IMAGE138
和表征地理空间位置的向量
Figure 161372DEST_PATH_IMAGE139
进行拼接作为空间网格编码预测模块的输入,与事件类别预测模块类似,经过多个隐层得到全局输出,经过隐层分支分别得到每级网格编码的局部输出,每个隐层由前一隐层输出和输入向量共同决定,空间网格编码预测的最终输出由每级的局部输出和全局输出综合得到。所述网格编码预测部分的局部输出和全局输出激活函数均采用Sigmoid函数;具体地,空间网格编码预测模块的最终输出计算公式为:
Figure 557719DEST_PATH_IMAGE070
其中,
Figure 227734DEST_PATH_IMAGE140
为处置机构所在空间网格编码预测的最终输出,
Figure 342321DEST_PATH_IMAGE141
为处置机构所在网格编码的全局预测概率,
Figure 857616DEST_PATH_IMAGE142
为局部网格预测概率,此外,
Figure 623316DEST_PATH_IMAGE074
为权重系数,用于调节全局预测概率和局部预测概率之间的权重,A为网格编码,H为最大层数。
S40.构建事件处置机构预测模型
Figure 464233DEST_PATH_IMAGE143
:以事件类别对应的业务编码和网格编号作为输入,事件处置机构编码为输出,采用SVM 模型训练事件处置机构预测模型
Figure 800536DEST_PATH_IMAGE009
其中,S40在模型训练的时候输入不是S30中获得的事件类别对应的业务编码和网格编号,是原始工单中的业务编码和网格编码;只有在预测的时候,输入使用的才是S30获得的事件类别对应的业务编码和网格编号;
S50.新发生事件的处置机构预测:使用训练获得的处置方式预测模型
Figure 385101DEST_PATH_IMAGE099
和事件处置机构预测模型
Figure 506772DEST_PATH_IMAGE144
来进行预测,输出需要处理该事件的对应事件处置机构编码。
具体地,步骤S50中的新事件的描述文本经过S20相同的预处理与语义特征提取后,输入到模型
Figure 518590DEST_PATH_IMAGE145
,通过S303的预测判定方式,获得新事件的各级事件类别的业务编码和网格编码,再将业务编码和网格编码输入到模型
Figure 342190DEST_PATH_IMAGE146
,获得最终的机构编码。
本发明基于自然语言处理技术和地理位置语义理解对政务事件描述文本进行解析,通过一种基于深度神经网络的模型来同时预测业务类型和处置机构所在网格,并能够通过处置机构预测模型来获得最终的处置机构编码。
以上所述仅为本发明的优选实施例而已,并不用于限制本发明,对于本领域的技术人员来说,本发明可以有各种更改和变化。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均包含在本发明的保护范围之内。

Claims (9)

1.一种融合处置机构网格语义的政务事件自动派单方法,其特征在于,包括如下步骤:
S10. 政务事件历史数据集获取:政务事件历史数据的重要关键字段包括:事件类别、事件描述文本、网格编号、事件处置机构编码;其中,事件类别包括事件大类、事件中类、事件小类,事件大、中、小类取得相应的业务编码;事件处置机构为派单处置机构;事件描述文本为接线员根据热线电话信息记录下来的、与详细经过和用户诉求相关的完整文字描述;
S20. 事件数据预处理与语义特征提取:先对事件描述文本进行预处理,然后获取词向量矩阵t v ,提取事件发生地点对应的地名地址信息,并获得地名地址向量l v
S30. 构建事件处置方式预测模型 Md:以步骤S20获取的词向量矩阵t v 和地名地址向量l v 作为输入,以事件类别的业务编码和网格编号作为最终输出,采用深度神经网络方式构建并训练事件处置方式预测模型 Md
S40. 构建事件处置机构预测模型 Mo:以事件类别对应的业务编码和网格编号作为输入,事件处置机构编码为输出,采用SVM 模型训练并构建事件处置机构预测模型Mo
S50.新发生事件的处置机构预测:使用训练获得的事件处置方式预测模型 Md和事件处置机构预测模型Mo来进行预测,输出需要处理该新发生事件的对应事件处置机构编码;
所述步骤S30所述的构建事件处置方式预测模型Md,其包括如下步骤:
S301.事件派单处置方式建模:深层特征提取模块同时使用词向量矩阵t v 和地名地址向量l v 作为输入;
S302.派单方式预测的损失定义L及训练事件处置方式预测模型Md过程:样本数据集按比例随机分割成训练集和验证集,损失定义L考虑了业务类型的预测损失L class 和处置机构所处网格的预测损失L area ,其中,L class 由业务大、中、小各类预测损失构成;L area 由各层网格预测局部损失和全局损失共同构成;其公式如下:
L=L class+ L area
每一轮迭代完成后均计算验证集的损失,当验证集损失连续十轮没有增加时,停止迭代,保留损失最小的模型参数;
S303.事件派单处置方式预测结果判定:将训练后的事件处置方式预测模型Md输入词向量矩阵t v 和地名地址向量l v ,输出获得事件分别在各级事件分类下的概率分布以及网格编号的全局概率分布,取各级事件分类下的最大概率对应的事件类别的业务编码作为事件在各级分类下的预测类别;网格编号的全局概率分布,其每个值在0到1之间,表示事件落在该网格的可能性,取超过阈值K 的为预测网格。
2.如权利要求1所述的一种融合处置机构网格语义的政务事件自动派单方法,其特征在于,步骤S20中所述的对事件描述文本进行预处理包括文本清洗与过滤、停用词处理、标点符号处理、文本分词。
3.如权利要求1所述的一种融合处置机构网格语义的政务事件自动派单方法,其特征在于,通过步骤S20中所述的事件数据预处理与语义特征提取获得地名地址向量l v 和词向量矩阵t v
其中,地名地址向量l v 获取步骤为:
S201.事件发生地点的解析:根据事件发生地点的文字描述获取与事件发生直接相关的地名地址信息,并对其进行标准化处理;
S202.通过获取词嵌入表征l v1 和经纬度向量l v2 ,求得地名地址向量l v
词向量矩阵t v 的获取步骤为:
S2001.事件描述文本的语义特征提取:使用Word2Vec技术对分词后的文本序列进行词嵌入表征,获得事件描述文本的每一个词的预训练词向量;
S2002.事件描述文本的语义特征映射:基于事件中词序列的顺序结构,将事件描述文本序列转换为词向量矩阵t v ,设置词序列的长度为定值a,超出部分截断,而不足的使用0补齐。
4.如权利要求3所述的一种融合处置机构网格语义的政务事件自动派单方法,其特征在于,步骤S202中地名地址向量l v 获取方法为包括如下步骤:
S2021.事件发生地点的地理编码:基于地理编码坐标的计算和推测方法,获得地名地址的经纬度坐标信息解算,以能获取的最高精度经纬度坐标为准,无法准确获得经纬度坐标的记录,则以获得的最小行政区域范围中心点为输出经纬度坐标;对所获得的经纬度坐标进行归一化处理,得到经纬度向量l v2
S2022.事件发生地点的语义特征提取:基于Word2Vec技术,通过预训练实现地址和地名信息的词嵌入表征l v1 ,由于其表征地理位置,l v1 包含了地理位置的语义特征;
S2023. 将词嵌入表征l v1 和经纬度向量l v2 拼接,获得地名地址向量l v ,即:l v= l v1 l v2
5.如权利要求1所述的一种融合处置机构网格语义的政务事件自动派单方法,其特征在于,步骤S50中的新发生事件的事件描述文本经过步骤S20相同的事件数据预处理与语义特征提取后,输入到事件处置方式预测模型Md,通过步骤S303的事件派单处置方式预测结果判定,获得新发生事件的各级事件类别的业务编码和网格编号,再将业务编码和网格编号输入到事件处置机构预测模型Mo,获得最终事件处置机构编码。
6.如权利要求1所述的一种融合处置机构网格语义的政务事件自动派单方法,其特征在于,业务类型的预测损失L class 和事件处置机构所处网格的预测损失L area 计算方式如下:
L area= L L +L G
Figure 518105DEST_PATH_IMAGE001
Figure 778185DEST_PATH_IMAGE002
Figure 388158DEST_PATH_IMAGE003
L L 为局部损失,L G 为全局损失,
Figure 151715DEST_PATH_IMAGE004
为各层事业类别的业务编码的损失权重,c为事件类别,h 为层数,H为最大层数,
Figure 221564DEST_PATH_IMAGE005
为各层网格编号损失权重,a为网格编号;N为样本个数;mce(*)为多分类交叉熵函数,bce(*)为二分类交叉函数,y ci 为第i个样本在第h 层所含业务类别的真实概率分布,p ci 为第i个样本在第h 层所含业务类别的预测概率分布,y - l i 为第i个样本在第h层所含网格类别的真实概率分布,p - l i 为第i个样本在第h 层所含网格类别的预测概率分布,y - ɡ i 为第i个样本所有网格类别的真实概率分布,p - ɡ i 为第i个样本所有网格类别的预测概率分布。
7.如权利要求1所述的一种融合处置机构网格语义的政务事件自动派单方法,其特征在于,步骤S301事件派单处置方式建模,具体包括:
S3011.事件类别预测模块:使用CNN结构的网络从词向量矩阵t v 中提取业务语义特征,获得特征向量fc,特征向量fc经过隐层
Figure 437782DEST_PATH_IMAGE006
i=1,2,3 ,最终获得
Figure 851446DEST_PATH_IMAGE007
,每个隐层
Figure 469509DEST_PATH_IMAGE006
由前一层级的隐层输出
Figure 943215DEST_PATH_IMAGE008
和当前的特征向量fc共同决定;其中,
Figure 646729DEST_PATH_IMAGE007
是通过
Figure 598505DEST_PATH_IMAGE009
的非线性变化得到,经过不同隐层分支输出得到大、中、小三个层级的事件类别的业务编码概率分布
Figure 336654DEST_PATH_IMAGE007
,其中i表示层级,i=1,2,3 ,c为事件类别;
S3012.处置机构网格编号预测模块:将事件类别预测的最终隐层
Figure 981262DEST_PATH_IMAGE010
通过非线性变换得到
Figure 172072DEST_PATH_IMAGE011
,将
Figure 927538DEST_PATH_IMAGE011
和表征地理空间位置的地名地址向量l v 进行拼接作为处置机构网格编号预测模块的输入,经过多个隐层得到全局输出,经过隐层分支分别得到每级网格编号的局部输出,处置机构网格编号预测模块的最终输出由每级的局部输出和全局输出综合得到。
8.如权利要求7所述的一种融合处置机构网格语义的政务事件自动派单方法,其特征在于,处置机构网格编号预测模块的最终输出计算公式为:
Figure 753149DEST_PATH_IMAGE012
其中,
Figure 568658DEST_PATH_IMAGE013
为处置机构所在空间网格编号预测的最终输出,
Figure 246764DEST_PATH_IMAGE014
为处置机构所在网格编号的全局预测概率,
Figure 540343DEST_PATH_IMAGE015
为局部网格预测概率,此外,β为权重系数,用于调节全局预测概率和局部预测概率之间的权重,a为网格编号,H为最大层数。
9.如权利要求7所述的一种融合处置机构网格语义的政务事件自动派单方法,其特征在于,步骤S3011中隐层
Figure 253084DEST_PATH_IMAGE016
通过如下公式计算得到,
Figure 708336DEST_PATH_IMAGE017
其中,δ为激活函数ReLU,
Figure 139317DEST_PATH_IMAGE018
为权重项,
Figure 971007DEST_PATH_IMAGE019
为偏置项;
步骤S3011中事件类别预测模块的最终输出
Figure 803834DEST_PATH_IMAGE020
通过如下公式计算得到,
Figure 429987DEST_PATH_IMAGE021
其中,δ’为softmax函数,
Figure 348265DEST_PATH_IMAGE022
为权重项,
Figure 485110DEST_PATH_IMAGE023
为偏置项。
CN202110202001.4A 2021-02-23 2021-02-23 一种融合处置机构网格语义的政务事件自动派单方法 Active CN112581106B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110202001.4A CN112581106B (zh) 2021-02-23 2021-02-23 一种融合处置机构网格语义的政务事件自动派单方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110202001.4A CN112581106B (zh) 2021-02-23 2021-02-23 一种融合处置机构网格语义的政务事件自动派单方法

Publications (2)

Publication Number Publication Date
CN112581106A CN112581106A (zh) 2021-03-30
CN112581106B true CN112581106B (zh) 2021-05-28

Family

ID=75114004

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110202001.4A Active CN112581106B (zh) 2021-02-23 2021-02-23 一种融合处置机构网格语义的政务事件自动派单方法

Country Status (1)

Country Link
CN (1) CN112581106B (zh)

Families Citing this family (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113420015A (zh) * 2021-06-07 2021-09-21 浙江嘉兴数字城市实验室有限公司 基于神经网络的社会治理事件的自动分类方法
CN113673839B (zh) * 2021-07-30 2023-09-19 安徽商信政通信息技术股份有限公司 智能基层事件网格化自动派发方法和基层事件处理系统
CN113449111B (zh) * 2021-08-31 2021-12-07 苏州工业园区测绘地理信息有限公司 基于时空语义知识迁移的社会治理热点话题自动识别方法
CN113919811B (zh) * 2021-10-15 2023-01-06 长三角信息智能创新研究院 基于强化关联的热线事件分拨方法
CN115170053A (zh) * 2022-05-24 2022-10-11 中睿信数字技术有限公司 一种基于聚类融合的事件分拨处置系统
CN115169979A (zh) * 2022-08-08 2022-10-11 航天神舟智慧系统技术有限公司 一种基于语义分析的事件自动处置方法、装置及系统
CN115146488B (zh) * 2022-09-05 2022-11-22 山东鼹鼠人才知果数据科技有限公司 基于大数据的可变业务流程智能建模系统及其方法
CN115935245B (zh) * 2023-03-10 2023-05-26 吉奥时空信息技术股份有限公司 一种政务热线案件自动分类分拨方法
CN117171455B (zh) * 2023-11-01 2024-01-26 中鑫融信(北京)科技有限公司 基于网格的高关注度事件识别方法和系统

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107302564A (zh) * 2017-05-25 2017-10-27 广东建邦计算机软件股份有限公司 事件信息处理方法、装置、计算机设备和存储介质
CN108108352A (zh) * 2017-12-18 2018-06-01 广东广业开元科技有限公司 一种基于机器学习文本挖掘技术的企业投诉风险预警方法
CN109325116A (zh) * 2018-08-23 2019-02-12 武大吉奥信息技术有限公司 一种基于深度学习的城市事件自动分类派发方法及装置

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107302564A (zh) * 2017-05-25 2017-10-27 广东建邦计算机软件股份有限公司 事件信息处理方法、装置、计算机设备和存储介质
CN108108352A (zh) * 2017-12-18 2018-06-01 广东广业开元科技有限公司 一种基于机器学习文本挖掘技术的企业投诉风险预警方法
CN109325116A (zh) * 2018-08-23 2019-02-12 武大吉奥信息技术有限公司 一种基于深度学习的城市事件自动分类派发方法及装置

Also Published As

Publication number Publication date
CN112581106A (zh) 2021-03-30

Similar Documents

Publication Publication Date Title
CN112581106B (zh) 一种融合处置机构网格语义的政务事件自动派单方法
Li et al. Research trend of the application of information technologies in construction and demolition waste management
Xu et al. Real-time prediction of taxi demand using recurrent neural networks
Du et al. Deep irregular convolutional residual LSTM for urban traffic passenger flows prediction
Kuller et al. A planning-support tool for spatial suitability assessment of green urban stormwater infrastructure
Mehmood et al. Smart infrastructure and applications
Hillel et al. Recreating passenger mode choice-sets for transport simulation: A case study of London, UK
CN106127360A (zh) 一种基于用户特性分析的多模型负荷预测方法
CN113222328B (zh) 基于路段污染相似性的空气质量监测设备布点选址方法
Sandoval‐Solis et al. Collaborative modeling to evaluate water management scenarios in the Rio Grande Basin
Ouma et al. MCDA-GIS integrated approach for optimized landfill site selection for growing urban regions: an application of neighborhood-proximity analysis
CN113570867B (zh) 一种城市交通状态预测方法、装置、设备及可读存储介质
CN113204718A (zh) 一种顾及时空语义及驾驶状态的车辆轨迹目的地预测方法
CN109389270A (zh) 一种物流对象确定方法、装置和机器可读介质
CN115605903A (zh) 用于快速组成、启动和配置具有内置审计和监测结构的可定制的第二层级转移结构的系统及其方法
Danfeng et al. Subway passenger flow forecasting with multi-station and external factors
Cho et al. Estimation of route choice behaviors of bike-sharing users as first-and last-mile trips for introduction of mobility-as-a-service (MaaS)
Diallo et al. Agent-based simulation from anonymized data: An application to Lille metropolis
Baza-Solares et al. Traffic simulation with open-source and commercial traffic microsimulators: a case study
Lin et al. Insights into Travel Pattern Analysis and Demand Prediction: A Data-Driven Approach in Bike-Sharing Systems
Ramadan et al. New environmental prediction model using fuzzy logic and neural networks
Shan et al. Predicting duration of traffic accidents based on ensemble learning
CN113657091A (zh) 基于事件提取和权责清单的政务热线工单分拨方法
Asadollahfardi et al. Predicting atmospheric concentrations of benzene in the southeast of Tehran using artificial neural network
Liu The use of GIS-based genetic algorithm in water pollution control planning

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
CB03 Change of inventor or designer information
CB03 Change of inventor or designer information

Inventor after: Qian Chengyang

Inventor after: Liu Xiu

Inventor after: Yang Yaning

Inventor after: Feng Sai

Inventor after: Wu Han

Inventor before: Liu Xiu

Inventor before: Qian Chengyang

Inventor before: Yang Yaning

Inventor before: Feng Sai

Inventor before: Wu Han

CP01 Change in the name or title of a patent holder
CP01 Change in the name or title of a patent holder

Address after: 215000 No. 101, Suhong Middle Road, Suzhou Industrial Park, Suzhou City, Jiangsu Province

Patentee after: Yuance Information Technology Co.,Ltd.

Address before: 215000 No. 101, Suhong Middle Road, Suzhou Industrial Park, Suzhou City, Jiangsu Province

Patentee before: SUZHOU INDUSTRIAL PARK SURVEYING MAPPING AND GEOINFORMATION Co.,Ltd.