CN112581106A - 一种融合处置机构网格语义的政务事件自动派单方法 - Google Patents

一种融合处置机构网格语义的政务事件自动派单方法 Download PDF

Info

Publication number
CN112581106A
CN112581106A CN202110202001.4A CN202110202001A CN112581106A CN 112581106 A CN112581106 A CN 112581106A CN 202110202001 A CN202110202001 A CN 202110202001A CN 112581106 A CN112581106 A CN 112581106A
Authority
CN
China
Prior art keywords
event
grid
prediction
handling
loss
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202110202001.4A
Other languages
English (en)
Other versions
CN112581106B (zh
Inventor
刘秀
钱程扬
杨亚宁
冯赛
武汉
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Yuance Information Technology Co ltd
Original Assignee
Suzhou Industrial Park Surveying Mapping And Geoinformation Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Suzhou Industrial Park Surveying Mapping And Geoinformation Co ltd filed Critical Suzhou Industrial Park Surveying Mapping And Geoinformation Co ltd
Priority to CN202110202001.4A priority Critical patent/CN112581106B/zh
Publication of CN112581106A publication Critical patent/CN112581106A/zh
Application granted granted Critical
Publication of CN112581106B publication Critical patent/CN112581106B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/10Office automation; Time management
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/205Parsing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/30Semantic analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Systems or methods specially adapted for specific business sectors, e.g. utilities or tourism
    • G06Q50/10Services
    • G06Q50/26Government or public services

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Business, Economics & Management (AREA)
  • General Physics & Mathematics (AREA)
  • General Health & Medical Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Computational Linguistics (AREA)
  • General Engineering & Computer Science (AREA)
  • Human Resources & Organizations (AREA)
  • Tourism & Hospitality (AREA)
  • Data Mining & Analysis (AREA)
  • Strategic Management (AREA)
  • Software Systems (AREA)
  • General Business, Economics & Management (AREA)
  • Computing Systems (AREA)
  • Molecular Biology (AREA)
  • Evolutionary Computation (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Biophysics (AREA)
  • Economics (AREA)
  • Biomedical Technology (AREA)
  • Marketing (AREA)
  • Mathematical Physics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Primary Health Care (AREA)
  • Educational Administration (AREA)
  • Development Economics (AREA)
  • Operations Research (AREA)
  • Quality & Reliability (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明提供一种融合处置机构网格语义的政务事件自动派单方法,包括如下步骤:S10.政务事件历史数据集获取:S20.事件数据预处理与语义特征提取;S30.构建事件处置方式预测模型
Figure 383731DEST_PATH_IMAGE001
:以历史数据集和与历史数据对应的地理位置作为输入,以处置机构编码作为最终输出,采用深度神经网络方式构建并训练预测模型
Figure 717761DEST_PATH_IMAGE002
;S40.构建事件处置机构预测模型
Figure 591039DEST_PATH_IMAGE003
;S50.使用训练获得的预测模型
Figure 908887DEST_PATH_IMAGE004
和预测模型
Figure 158603DEST_PATH_IMAGE005
来进行预测,输出需要处理该事件的对应事件机构编码。本发明通过一种基于深度神经网络的模型来同时预测业务类型和处置机构所在网格,并能够通过处置机构预测模型来获得最终的处置机构编码。

Description

一种融合处置机构网格语义的政务事件自动派单方法
技术领域
本发明涉及政府热线事件的智能化处理技术领域,特别涉及一种融合处置机构网格语义的政务事件自动派单方法。
背景技术
随着互联网和大数据技术的发展,为加快建设服务型政府,提高社会治理的水平,建设12345等热线服务平台已成为“互联网+政务服务”体系建设的重要内容,这些平台普遍整合了包括电话、网站、微信、APP等在内的线上线下各类服务渠道,为政民互动提供了高效便捷的沟通桥梁。在一个中大规模的城市,政务热线每年可以产生数以百万计的事件数据,这些数据的主要内容以文本方式被记录在数据库中,而在派单和处理过程中是有派单人员和网格人员等基层执行者逐条进行处理。因此,迫切需要结合智能化手段来构建对政务事件数据的自动化语义理解能力,提高事项理解、派单和处理的效率。
事件的高效派发处置取决于两个关键因素:(1)直接依赖政务服务的责任清单和处置规则,根据事件类型和业务管理类型梳理责任清单是社会综合整理普遍需要的基础性工作,但各地市实际情况复杂多变,因此预测模型的普适性会面临较大挑战。(2)通常较多关注事件发生的地点,然而最终处置机构在纵向上可能位于不同精细程度(市级、区级、街道级、社区级等)的管理网格,在横向上可能涉及不同的业务管理条线,且这些业务条线也大多有各自的多层网格划分。
因此,事件究竟该由哪个级别的哪个机构来负责处置,同时涉及到业务类别和地理位置两类信息,且是一个综合了多级业务归口信息、多层空间网格信息之后的一个决策问题。已公开的大部分技术或偏重于文本分类型,以同一类别体系下的标签预测为目标;或是仅将地理空间信息用作事件位置标识,未将空间信息作为一种特征或规律用于模型的学习。
中国专利文献CN104008108A公开了一种GIS地图栅格化处理方法、装置及投诉处理方法、系统。该文件使用地理位置的方式是采用一种栅格化方法将全幅地图划分为多个网格,而这些网格的作用仅仅用于标识投诉文本所处的地理位置所在,其目的主要用于将客户投诉定位到对应的区域,用于分析和解决该区域的投诉问题。对于如何将文本事件所获取的地理坐标当做输入源之一,建立学习模型以实现同时从地理位置和业务信息中学习事件特征,从而解决事件派单预测问题方面,未见提及。
中国专利文献CN110543562A提出了一种基于事件图谱的城市治理事件自动分拨方法及系统,该文件公开了通过事件描述结合空间位置的自动分拨方法,进一步提高了转派效率。具体使用的方法是从事件信息中获取地址描述,并基于该地址所在空间位置确定事件处理单位,及其类别预测和空间位置的获取是两个独立的部分,分别确定类别和位置后再基于图谱确定处理机构,这种方法有区域局限性,若更换地区,原有图谱方案无法发挥作用,且其位置的确定是基于分词提取和POI关系库匹配,对于不在POI库中的地址,则无法得出结果。该文献未针对以下问题提出解决方案:(1)空间位置上的责任主体会因为业务分类、区域权责的不同而有差异;(2)事件分类预测模型的过程仅使用自然语言文本处理技术,未结合地理位置进行联合训练,即自动分派和地理定位是两个完全独立的过程,因此地理位置和业务分类隐含的深层特征没有进行进一步提取,难获得交叉。
中国专利文献CN109325116A提出了一种基于深度学习的城市事件自动分类派发方法及装置。该文献公布了一个基于卷积神经网络模型的分类模型,进行业务编码分类,相比于人工分类,实现了机器根据模型一次运算,有助于系统运行效率的提升。但对地理信息的使用仅限于从事件描述中提取地址信息进行事件定位,未对地址信息的深层语义进行提取,也未将业务分类和地理位置进行模型深度融合。
中国专利文献CN108573031A公开了一种基于内容的投诉分类方法和系统,尽管也是对于政务类热线文本的分类处理,但是只考虑了职能部门的分发处理。而实际中,结合我国条块融合管理的现状,实际中派发部门除了这种职能类的条线部门,还包括市-区-街道-社区-网格这些“块”,只考虑职能无法实现不同位置的派发,比如以该专利中的实例为例,其虽然具备确定“某某街有小贩乱摆摊行为。”的细分结果为城管大队的能力,但是无法确定具体为哪个街道的城市管理部门,因此一般需要层层下派,而更高效的方式应是明确派发至具体的处置单位。此外,该专利的分类方法采用的是朴素贝叶斯和决策树,是比较传统的机器学习方法。
综上所述,已有技术或部分解决了事件的业务分类问题,或在此基础上引入了事件发生的地理位置用于辅助判断。但对地理位置的关注局限于事件发生位置,并未涉及处理机构所处网格的预测判别。鉴于处置机构的最终判定是一个存在较高复杂性的决策过程,基于上述信息很难直接利用学习模型来完整判断和预测事件所对应的最终处置机构。此外,已有技术因为没有同时兼顾业务类别和空间位置的联合训练模型,自动派单方法在不同城市之间的通用性将受到限制。
针对现有技术中存在的问题,本发明公布了一种融合空间位置表征的政务事件派单预测模型,该模型将地理位置融合入最终派单机构的预测过程。
发明内容
为解决现有技术中存在的上述问题,本发明在关注事件发生位置作为输入项的同时,明确提出了事件处置机构所在的空间网格,应当作为模型预测输出的重要组成部分,并结合这项改进,进一步提升事件派单的处理效率。
本发明提供的具体技术方案如下:一种融合处置机构网格语义的政务事件自动派单方法,包括如下步骤:
S10. 政务事件历史数据集获取:政务事件历史数据的重要关键字段包括:事件类别,事件描述文本,网格编号、事件处置机构编码;其中,事件类别包括事件大类、事件中类、事件小类,事件大、中、小类应取得相应的业务编码;事件处置机构为派单处置机构;事件描述文本为接线员根据热线电话信息记录下来的,与详细经过和用户诉求相关的完整文字描述;
S20. 事件数据预处理与语义特征提取:先对事件描述文本进行预处理,然后获取词向量矩阵
Figure 327372DEST_PATH_IMAGE001
,提取事件发生地点对应的地名地址信息,并获得地名地址向量
Figure 157925DEST_PATH_IMAGE002
S30. 构建事件处置方式预测模型
Figure 603950DEST_PATH_IMAGE003
:以步骤获取的S20词向量矩阵
Figure 203558DEST_PATH_IMAGE004
和地名地址向量
Figure 76836DEST_PATH_IMAGE005
作为输入,以事件类别的业务编码和网格编号作为最终输出,采用深度神经网络方式构建并训练事件处置方式预测模型
Figure 394685DEST_PATH_IMAGE006
S40. 构建事件处置机构预测模型
Figure 378822DEST_PATH_IMAGE007
:以事件类别对应的业务编码和网格编号作为输入,事件处置机构编码为输出,采用SVM 模型训练并构建事件处置机构预测模型
Figure 98516DEST_PATH_IMAGE008
S50.新发生事件的处置机构预测:使用训练获得的事件处置方式预测模型
Figure 142696DEST_PATH_IMAGE003
和事件处置机构预测模型
Figure 947841DEST_PATH_IMAGE009
来进行预测,输出需要处理该事件的对应事件处置机构编码。
具体地,步骤S50中的新事件的描述文本经过S20相同的预处理与语义特征提取后,输入到模型
Figure 735668DEST_PATH_IMAGE006
,通过S303的事件派单处置方式判定,获得新事件的各级事件类别的业务编码和网格编码,再将业务编码和网格编码输入到模型
Figure 309869DEST_PATH_IMAGE010
,获得最终机构编码。
优选地,S20步骤中所提及的预处理包括文本清洗与过滤、停用词处理、标点符号处理、文本分词等技术环节。在更优化条件下,可以引入用户自定义的政务服务与社会治理的领域词典,来提高文本分析的性能和准确性。
优选地,通过S20步骤中语义特征提取获得地名地址向量
Figure 524949DEST_PATH_IMAGE011
和词向量矩阵
Figure 551811DEST_PATH_IMAGE012
其中,地名地址向量
Figure 143330DEST_PATH_IMAGE013
获取步骤为:
S201.事件发生地点的解析:根据事件发生地点的文字描述获取与事件发生直接相关的地名地址信息,并对其进行标准化处理;
S202.通过获取词嵌入表征
Figure 572037DEST_PATH_IMAGE014
和经纬度向量
Figure 958019DEST_PATH_IMAGE015
,求得地名地址向量
Figure 737756DEST_PATH_IMAGE016
词向量矩阵
Figure 867386DEST_PATH_IMAGE017
的获取步骤为:
S2001.事件描述文本的语义特征提取:使用Word2Vec技术用于对分词后的文本序列进行词嵌入表征,获得事件描述文本的每一个词的预训练词向量;
S2002.事件描述文本的语义特征映射:基于事件中词序列的顺序结构,将事件描述文本序列转换为词向量矩阵
Figure 416179DEST_PATH_IMAGE017
,设置词序列的长度为定值a,超出部分截断,而不足的使用0补齐。
其中,本发明中事件描述文本的语义特征映射原理是对词序列进行截断后在映射到词向量矩阵,不是截断向量矩阵。
优选地,步骤S202中地名地址向量
Figure 238642DEST_PATH_IMAGE005
获取方法为包括如下步骤:
S2021.事件发生地点的地理编码:基于地理编码坐标的计算和推测方法,获得地名地址的经纬度坐标信息解算,以能获取的最高精度经纬度坐标为准,无法准确获得经纬度坐标的记录,则以获得的最小行政区域范围中心点为输出经纬度坐标;对所获得的经纬度坐标进行归一化处理,得到经纬度向量
Figure 974516DEST_PATH_IMAGE018
S2022.事件发生地点的语义特征提取:基于Word2Vec技术,通过预训练实现地址和地名信息的词嵌入表征
Figure 907837DEST_PATH_IMAGE019
,由于其主要表征地理位置,
Figure 45558DEST_PATH_IMAGE014
隐含了地理位置的语义特征;
S2023. 将词嵌入表征
Figure 38921DEST_PATH_IMAGE019
和经纬度向量
Figure 527672DEST_PATH_IMAGE015
拼接,获得地名地址向量
Figure 999104DEST_PATH_IMAGE020
,即:
Figure 256910DEST_PATH_IMAGE021
优选地,所述S30所述的构建事件处置方式预测模型
Figure 421175DEST_PATH_IMAGE003
,其包括如下步骤:
S301.事件派单处置方式建模:深层特征提取模块同时使用词向量矩阵
Figure 131642DEST_PATH_IMAGE004
和地名地址向量
Figure 406766DEST_PATH_IMAGE022
作为输入;
S302.派单方式预测的损失定义
Figure 772939DEST_PATH_IMAGE024
及训练事件处置方式预测模型
Figure 842526DEST_PATH_IMAGE025
过程:样本数据集按一定比例随机分割成训练集和验证集,损失定义L考虑了业务类型的预测损失
Figure 305868DEST_PATH_IMAGE026
和处置机构所处网格的预测损失
Figure 119104DEST_PATH_IMAGE027
,其中,
Figure 351502DEST_PATH_IMAGE028
由业务大、中、小各类预测损失构成;
Figure 591990DEST_PATH_IMAGE029
由各层网格预测局部损失和全局损失函共同构成;其公式如下:
Figure 542629DEST_PATH_IMAGE030
每一轮迭代完成后均计算验证集的损失,当验证集损失连续十轮没有增加时,停止迭代,保留损失最小的模型参数;
S303.事件派单处置方式预测结果判定:将训练后的事件处置预测模型
Figure 159555DEST_PATH_IMAGE003
输入词向量矩阵
Figure 246460DEST_PATH_IMAGE017
和地名地址向量
Figure 923429DEST_PATH_IMAGE002
,输出获得事件分别在各级事件分类下的概率分布以及网格编码的全局概率分布,取各级事件分类下的最大概率对应的事件类别作为事件在该级分类下的预测类别;网格编码的全局概率分布,其每个值在0到1之间,表示事件落在该网格(含各级网格)的可能性,取超过阈值K 的为预测网格。
优选地,业务类型的预测损失
Figure 95784DEST_PATH_IMAGE031
和机构所处网格的预测损失
Figure 250822DEST_PATH_IMAGE032
计算方式如下:
Figure 457812DEST_PATH_IMAGE033
Figure 774524DEST_PATH_IMAGE034
为局部损失,
Figure 699755DEST_PATH_IMAGE035
为全局损失,
Figure 658484DEST_PATH_IMAGE036
为各层事业类别的业务编码的损失权重,c为事件类别,h为层数,H为最大层数,
Figure 719980DEST_PATH_IMAGE037
为各层网格编码损失权重,a 为网格编码;
Figure 738752DEST_PATH_IMAGE038
为样本个数,
Figure 885700DEST_PATH_IMAGE039
为多分类交叉熵函数,
Figure 382540DEST_PATH_IMAGE040
为二分类交叉函数,
Figure 298543DEST_PATH_IMAGE041
为第
Figure 488216DEST_PATH_IMAGE042
个样本在第h层所含业务类别的真实概率分布,
Figure 122460DEST_PATH_IMAGE043
为第
Figure 422991DEST_PATH_IMAGE044
个样本在第h层所含业务类别的预测概率分布,
Figure 193501DEST_PATH_IMAGE045
为第
Figure 554075DEST_PATH_IMAGE046
个样本在第h层所含网格类别的真实概率分布,
Figure 675615DEST_PATH_IMAGE047
为第
Figure 514258DEST_PATH_IMAGE048
个样本在第h层所含网格类别的预测概率分布,
Figure 404854DEST_PATH_IMAGE049
为第
Figure 936329DEST_PATH_IMAGE051
个样本所有网格类别的真实概率分布,
Figure 279586DEST_PATH_IMAGE052
为第
Figure 187499DEST_PATH_IMAGE054
个样本所有网格类别的预测概率分布。
优选地,步骤S301事件派单处置方式建模,具体包括:
S3011.事件类别预测模块:使用CNN结构的网络从词向量矩阵
Figure 932601DEST_PATH_IMAGE001
中提取业务语义特征,获得特征向量
Figure 634978DEST_PATH_IMAGE055
,特征向量
Figure 465531DEST_PATH_IMAGE056
经过隐层
Figure 645976DEST_PATH_IMAGE057
Figure 511164DEST_PATH_IMAGE058
最终获得
Figure 384442DEST_PATH_IMAGE059
,每个隐层
Figure 702291DEST_PATH_IMAGE060
由前一层级的隐层输出
Figure 686428DEST_PATH_IMAGE061
和当前的特征向量
Figure 406122DEST_PATH_IMAGE062
共同决定;其中,
Figure 450301DEST_PATH_IMAGE059
是通过
Figure 255446DEST_PATH_IMAGE063
的非线性变化得到,经过不同隐层分支输出得到大、中、小三个层级的事件类别的业务编码概率分布
Figure 43274DEST_PATH_IMAGE064
,其中i 表示层级,
Figure 617474DEST_PATH_IMAGE065
;h为隐层;
S3012.处置机构网格编号预测模块:将事件类别预测的最终隐层
Figure 832555DEST_PATH_IMAGE066
通过非线性变换得到
Figure 859417DEST_PATH_IMAGE067
,将
Figure 450935DEST_PATH_IMAGE068
和表征地理空间位置的向量
Figure 879643DEST_PATH_IMAGE069
进行拼接作为空间网格编码预测模块的输入,与事件类别预测模块类似,经过多个隐层得到全局输出,经过隐层分支分别得到每级网格编码的局部输出,每个隐层由前一隐层输出和输入向量共同决定,空间网格编码预测的最终输出由每级的局部输出和全局输出综合得到。
优选地,空间网格编码预测模块的最终输出计算公式为:
Figure 265625DEST_PATH_IMAGE070
其中,
Figure 45362DEST_PATH_IMAGE071
为处置机构所在空间网格编码预测的最终输出,
Figure 174992DEST_PATH_IMAGE072
为处置机构所在网格编码的全局预测概率,
Figure 458206DEST_PATH_IMAGE073
为局部网格预测概率,此外,
Figure 280668DEST_PATH_IMAGE074
为权重系数,用于调节全局预测概率和局部预测概率之间的权重,A为网格编码,H为最大层数。
优选地,步骤S3011中隐层
Figure 282122DEST_PATH_IMAGE075
通过如下公式计算得到,
Figure 949864DEST_PATH_IMAGE076
其中,
Figure 353163DEST_PATH_IMAGE077
为激活函数ReLU,
Figure 346527DEST_PATH_IMAGE078
为权重项,
Figure 569698DEST_PATH_IMAGE079
为偏置项;
步骤S3011中事件类别预测模块的最终输出
Figure 41131DEST_PATH_IMAGE080
通过如下公式计算得到,
Figure 564516DEST_PATH_IMAGE081
其中,
Figure 463202DEST_PATH_IMAGE082
为softmax函数,
Figure 439248DEST_PATH_IMAGE083
为权重项,
Figure 714372DEST_PATH_IMAGE084
为偏置项。
本发明基于自然语言处理技术和地理位置语义理解对政务事件描述文本进行解析,通过一种基于深度神经网络的模型来同时预测业务类型和处置机构所在网格,并能够通过处置机构预测模型来获得最终的处置机构编码。
与现有技术相对比,本发明的有益效果如下:
(1)考虑到不同业务类别的投诉,其处置机构可能对应不同行政级别这一特点,在预测模型中将事件类别信息和地理位置信息做了融合,使得神经网络能够从中学习获得两类信息的交互特征。
(2)本发明中对处置机构网格的预测过程不需要依赖于本地机构坐标信息,而使用一定程度缓解了地址坐标未登记完全的问题。
(3)本发明中分级预测的方式考虑了业务类别标签和网格编码标签的内部层级依赖关系。且派发起点可以是任意级别的行政层级,而预测结果可能是任意粒度的网格编码,这也符合政务事件处置的实际情况。
(4)本发明可用于自动确定处置机构,使派单流程自动化、智能化,有助于简化坐席人员进行事件登记派发时的人工判断和手动选取操作过程,降低坐席人员的工作量,提高事件整体处理效率。
(5)本发明是一种基于业务分类和地理位置的联合训练模型,因此已训练好的模型还可以应用于业务归口或网格划分模式不完全一致的其他城市或地区,仅需要基于当地的历史数据通过迁移学习的方式来对该模型进行优化训练即可。
(6)大部分现有技术偏重于文本分类型,其分类目标都是同一类别体系下的标签,确定文本属于该类别体系下的某个或多个标签。然而,本发明的特殊之处在于,针对事件描述文本需要分派的处置单位的确定为目标场景,即将最终目标确立为预测输出最终需要处置该事件的具体机构。这个目标与上述其他目标的主要复杂性与差异性在于,一个具体事件的处置机构一方面与负责该事件的业务管理条线相关,也与所处地理位置,以及伴随的政府机构设置情况有关。在城市核心区,这种处理分类大多更为清晰,然而在基层乡镇或区县中,实际分工可能根据实际情况变得更为精简。因此,不同的城市和区域在职责清单层面呈现出更多的个性化,即便是同样的事情,在不同的地方和管理层级,处置机构也很有可能不同。因此,从整体上看,事件的处置机构的确定不仅需要关注文本中与业务类别相关的信息量,而且需要同时关注事件发生的地理空间位置和处置机构所在位置。
(7)与现有技术(如专利文献CN110543562A)相比,本发明中的类别预测和网格预测不是独立进行,而是融合在一个模型中,支持任意级别行政区作为派发起点进行模型训练,对于具有相似事件分类结构的地区,可以通过迁移学习快速进行训练预测,本发明通过预训练模型获取位置实体的特征向量表示,并辅以坐标信息提高准确率,能缓解不在POI库中地址的问题。
(8)目前因为其中业务信息和空间信息的复杂性,想要高效地判定具体的派单对象,迫切需要减少对坐席工作人员不均衡的经验积累和人为判断能力的依赖,本发明基于以上现状,采用构建深度学习模型的方式,将业务信息和空间信息同时作为模型的输入数据,通过神经网络的非线性拟合能力来对事件处置和派单问题进行深层次特征提取和建模,以实现从文字段落式事件描述到明确判别最终处置机构的自动化机器预测模式。该方法在降低事件分派整体难度、提高城市治理的处置效率、节省大量消耗的人力资源,减少经验不均衡带来的错误风险等方面具有重要意义。
(9)本发明提供的预测模型
Figure 561105DEST_PATH_IMAGE085
考虑的损失,具体为业务类型的预测损失
Figure 896271DEST_PATH_IMAGE086
和机构所处网格的预测损失
Figure 94034DEST_PATH_IMAGE087
,从而进行模型训练,使得预测更加准确。
附图说明
图1为本发明提供的网格规划示意图。
图2是本发明中事件处置机构预测判定的流程图。
图3是本发明中事件处置方式预测模型
Figure 172849DEST_PATH_IMAGE088
的结构图。
附图标记如下:
a:社区;b:街道;c:区。
具体实施方式
下面结合附图,对本发明提供的一种融合处置机构网格语义的政务事件自动派单方法进行具体说明。
本发明针对事件描述文本需要分派的处置机构的确定为目标场景,即将最终目标确立为预测输出最终需要处理该事件的具体机构。这个目标与上述其他目标的主要复杂性与差异性在于,一个具体事件的处置机构一方面与负责该事件的业务管理条线相关,也与所处地理位置,以及伴随的政府机构设置情况有关。在城市核心区,这种处理分类大多更为清晰,然而在基层乡镇或区县中,实际分工可能根据实际情况变得更为精简。因此,不同的城市和区域在职责清单层面呈现出更多的个性化,即便是同样的事情,在不同的地方和管理层级,处置机构也很有可能不同。因此,从整体上看,事件的处置机构的确定不仅需要关注文本中与业务类别相关的信息量,而且需要同时关注事件发生的地理空间位置和处置机构所在位置。
如图1所示,处置机构分为三层:分别为社区a,街道b 和区c;以处置机构判定为目标,其难点是处置机构与业务类别并不是一一对应关系。比如判定了一条文本投诉为水问题,已经知道了业务类别,但仍然无法确定由哪个机构来处理,一是因为不同地区的授权处置机构不同,比如A区停水全部由某水务公司管理,而B街道的停水由街道集中管理;二是因为不同地区行政管理的下沉程度不同,比如C区停水由行政单位街道某下辖社区管理;因此,在发明中除了确定类别信息,还需要确定网格信息,且本专利中这个网格信息包含两个层次:首先,提取出来的位置属于哪个网格,如下图目标位置本身可以分派给1、12、121三种不同归属,记作(1,12,121);其次,属于哪一层的网格,即网格深度,假设下图为A区网格规划,停水处置机构为水务公司,其实际位置应截止到区(1),假设下图为B区网格规划,停水处置机构为某街道,则其实际位置应截止到街道(1,12),假设下图为C区网格规划,停水处置机构为某社区,则其实际位置应截止到社区(1,12,121),可知,同一类别在不同位置,会产生不同的位置路径。反之,不同类别在同一位置,也会产生不同的位置路径,如A区同位置的邻里纠纷事件由具体社区管理,则其实际位置路径为(1,12,121)。因此本专利中综合了类别信息和位置信息,并构建模型来联合预测业务类别和机构所处位置。在二者基础上,可通过另一个独立的分类算法(如SVM)来实现对处置机构的预测判定。
具体地,如图2-3所示,一种融合处置机构网格语义的政务事件自动派单方法,包括如下步骤:
S10. 政务事件历史数据集获取:政务事件历史数据的重要关键字段包括:事件类别,事件描述文本,网格编号、处置机构编码;其中,事件类别包括事件大类、事件中类、事件小类,事件大、中、小类应取得相应的业务编码;处置机构为派单处置机构;事件描述文本为接线员根据热线电话信息记录下来的,针对事件详细经过和用户诉求相关的完整文字描述;
其中,网格编码来源于每条投诉文本实际处置机构直属行政区域的地理编码,如对流动摊贩的处置机构为“唯亭街道执法大队”,则其直属行政区域“唯亭街道”的网格编码为“320571052”,假定以市级行政区为根节点,目标网格为包含区-街道-社区的三级网格,则抽取其标签为“71”、“71052”,其中“71”为 “工业园区”的区级网格编码,“71052”为“唯亭街道”的街道级网格编码。又如对无证无照的处置机构为“区市场监督管理局”,则其直属行政区域为园区,对应网格编码“320571”,抽取标签为“71”
S20. 事件数据预处理与语义特征提取:先对事件描述文本进行预处理,然后获取词向量矩阵
Figure 405247DEST_PATH_IMAGE004
,提取事件发生地点对应的地名地址信息,并获得地名地址信息的向量表示
Figure 645736DEST_PATH_IMAGE089
其中,本发明在获取词向量矩阵
Figure 596374DEST_PATH_IMAGE004
和地名地址向量之前均需要对事件描述文本进行预处理,其中,本发明提供的预处理包括文本清洗与过滤、停用词处理、标点符号处理、文本分词等技术环节。在更优化条件下,可以引入用户自定义的政务服务与社会治理的领域词典,来提高文本分析的性能和准确性。
其中,通过S20步骤中所提及的事件数据预处理与语义特征提取获得地名地址向量
Figure 213300DEST_PATH_IMAGE022
和词向量矩阵
Figure 300205DEST_PATH_IMAGE017
;其中,地名地址向量
Figure 711595DEST_PATH_IMAGE020
获取步骤为:
S201.事件发生地点的解析:根据事件发生地点的文字描述获取与事件发生直接相关的地名地址信息,并对其进行标准化处理;
S202.通过获取词嵌入表征
Figure 883950DEST_PATH_IMAGE090
和经纬度向量
Figure 304567DEST_PATH_IMAGE091
,求得地名地址向量
Figure 245978DEST_PATH_IMAGE092
词向量矩阵
Figure 93849DEST_PATH_IMAGE093
的获取步骤为:
S2001.事件描述文本的语义特征提取:使用Word2Vec技术用于对分词后的文本序列进行词嵌入表征,获得事件描述文本的每一个词的预训练词向量;
S2002.事件描述文本的语义特征映射:基于事件中词序列的顺序结构,将事件描述文本序列转换为词向量矩阵
Figure 753500DEST_PATH_IMAGE094
,设置词序列的长度为定值a,超出部分截断,而不足的用0补齐。其中,本发明中事件描述文本的语义特征映射原理是对词序列进行截断后在映射到词向量矩阵,不是截断向量矩阵。
具体地,步骤S202中地名地址向量
Figure 712229DEST_PATH_IMAGE069
获取方法为包括如下步骤:
S2021.事件发生地点的地理编码:基于地理编码坐标的计算和推测方法,获得地名地址的经纬度坐标信息解算,以能获取的最高精度经纬度坐标为准,无法准确获得经纬度坐标的记录,则以获得的最小行政区域范围中心点为输出经纬度坐标;对所获得的经纬度坐标进行归一化处理,得到经纬度向量
Figure 773726DEST_PATH_IMAGE015
S2022.事件发生地点的语义特征提取:基于Word2Vec技术,通过预训练实现地址和地名信息的词嵌入表征
Figure 792497DEST_PATH_IMAGE095
,由于其主要表征地理位置,
Figure 673866DEST_PATH_IMAGE096
隐含了地理位置的语义特征;
S2023. 将词嵌入表征
Figure 436285DEST_PATH_IMAGE014
和经纬度向量
Figure 352289DEST_PATH_IMAGE015
拼接,获得地名地址向量
Figure 541962DEST_PATH_IMAGE097
即:
Figure 176205DEST_PATH_IMAGE098
S30. 构建事件处置方式预测模型
Figure 476737DEST_PATH_IMAGE025
:以历史数据集中的事件描述文本和S20中获取的与历史数据对应的地理位置信息作为输入,以事件类别和网格编号作为最终输出,采用深度神经网络方式构建并训练预测模型
Figure 247246DEST_PATH_IMAGE099
其中,本发明提供的所述S30所述的构建事件处置方式预测模型
Figure 607821DEST_PATH_IMAGE099
,其包括如下步骤:
S301.事件派单处置方式建模:深层特征提取模块同时使用词向量矩阵
Figure 463781DEST_PATH_IMAGE100
和地名地址向量
Figure 568003DEST_PATH_IMAGE022
作为输入;
S302.派单方式预测的损失定义
Figure 458599DEST_PATH_IMAGE101
及训练事件处置方式预测模型
Figure 990075DEST_PATH_IMAGE102
过程:样本数据集按一定比例随机分割成训练集和验证集,损失定义
Figure 333331DEST_PATH_IMAGE024
考虑了业务类型的预测损失
Figure 710086DEST_PATH_IMAGE026
和处置机构所处网格的预测损失
Figure 455188DEST_PATH_IMAGE103
,其中,
Figure 157565DEST_PATH_IMAGE028
由业务大、中、小各类预测损失构成;
Figure 988118DEST_PATH_IMAGE032
由各层网格预测局部损失和全局损失函共同构成;其公式如下:
Figure 434142DEST_PATH_IMAGE104
每一轮迭代完成后均计算验证集的损失,当验证集损失连续十轮没有增加时,停止迭代,保留损失最小的模型参数;
其中,业务类型的预测损失
Figure 299330DEST_PATH_IMAGE028
和机构所处网格的预测损失
Figure 172608DEST_PATH_IMAGE105
计算方式如下:
Figure 224878DEST_PATH_IMAGE106
Figure 474594DEST_PATH_IMAGE107
为局部损失,
Figure 194288DEST_PATH_IMAGE108
为全局损失,
Figure 238467DEST_PATH_IMAGE109
为各层事业类别的业务编码的损失权重,c为事件类别,h 为层数,H为最大层数,
Figure 778033DEST_PATH_IMAGE110
为各层网格编码损失权重,a 为网格编码;N为样本个数,
Figure 565861DEST_PATH_IMAGE111
为多分类交叉熵函数,
Figure 140061DEST_PATH_IMAGE112
为二分类交叉函数,
Figure 355142DEST_PATH_IMAGE113
为第
Figure 647583DEST_PATH_IMAGE114
个样本在第h层所含业务类别的真实概率分布,
Figure 973522DEST_PATH_IMAGE115
为第
Figure 667809DEST_PATH_IMAGE048
个样本在第
Figure 53791DEST_PATH_IMAGE117
层所含业务类别的预测概率分布,
Figure 567949DEST_PATH_IMAGE118
为第
Figure 431999DEST_PATH_IMAGE048
个样本在第h层所含网格类别的真实概率分布,
Figure 980792DEST_PATH_IMAGE119
为第
Figure 803255DEST_PATH_IMAGE048
个样本在第h层所含网格类别的预测概率分布,
Figure 804709DEST_PATH_IMAGE120
为第
Figure 738030DEST_PATH_IMAGE048
个样本所有网格类别的真实概率分布,
Figure 141329DEST_PATH_IMAGE121
为第
Figure 869114DEST_PATH_IMAGE048
个样本所有网格类别的预测概率分布。
S303.事件派单处置方式预测结果判定:将训练后的事件处置预测模型
Figure 357864DEST_PATH_IMAGE122
输入词向量矩阵
Figure 94876DEST_PATH_IMAGE100
和地名地址向量
Figure 352682DEST_PATH_IMAGE123
,输出获得事件分别在各级事件分类下的概率分布以及网格编码的全局概率分布,取各级事件分类下的最大概率对应的事件类别作为事件在该级分类下的预测类别;网格编码的全局概率分布,其每个值在0到1之间,表示事件落在该网格(含各级网格)的可能性,取超过阈值K 的为预测网格。
步骤S301.事件派单处置方式建模,具体包括:
S3011.事件类别预测模块:使用CNN结构的网络从词向量矩阵
Figure 251368DEST_PATH_IMAGE004
中提取业务语义特征,获得特征向量
Figure 973554DEST_PATH_IMAGE124
,特征向量
Figure 248677DEST_PATH_IMAGE125
经过隐层
Figure 360990DEST_PATH_IMAGE126
Figure 696156DEST_PATH_IMAGE058
最终获得
Figure 893919DEST_PATH_IMAGE064
,每个隐层
Figure 972734DEST_PATH_IMAGE127
由前一层级的隐层输出
Figure 939553DEST_PATH_IMAGE128
和当前的特征向量
Figure 445620DEST_PATH_IMAGE124
共同决定;其中,
Figure 130680DEST_PATH_IMAGE064
是通过
Figure 747606DEST_PATH_IMAGE075
的非线性变化得到,经过不同隐层分支输出得到大、中、小三个层级的事件类别的业务编码概率分布
Figure 834511DEST_PATH_IMAGE059
,其中i 表示层级,
Figure 511479DEST_PATH_IMAGE129
;h为隐层;
其中所述卷积结构(CNN)包含卷积层和池化层,卷积层使用不同大小卷积核提取特征,如[2,3,4],激活函数为ReLU函数,池化层采用最大池化提取主要特征,最后将主要特征拼接成一维向量作为该投诉文本的特征向量;其中隐层指的是神经网格的中间层。所述隐层均为全连接结构,并加入Dropout防止过拟合。所述事件类别预测部分的输出激活函数均采用Softmax函数。
其中,隐层
Figure 683835DEST_PATH_IMAGE130
通过如下公式计算得到,
Figure 104452DEST_PATH_IMAGE131
其中,
Figure 45863DEST_PATH_IMAGE077
为激活函数ReLU,
Figure 893733DEST_PATH_IMAGE132
权重项,
Figure 553385DEST_PATH_IMAGE133
为偏置项;
其中,本发明提供的事件类别预测模块的最终输出
Figure 512114DEST_PATH_IMAGE064
通过如下公式计算得到,
Figure 573610DEST_PATH_IMAGE134
其中,
Figure 326803DEST_PATH_IMAGE135
为softmax函数,
Figure 739330DEST_PATH_IMAGE083
为权重项,
Figure 236170DEST_PATH_IMAGE136
为偏置项。
S3012.处置机构网格编号预测模块:将事件类别预测的最终隐层
Figure 152173DEST_PATH_IMAGE137
通过非线性变换得到
Figure 341846DEST_PATH_IMAGE138
,将
Figure 710511DEST_PATH_IMAGE139
和表征地理空间位置的向量
Figure 11042DEST_PATH_IMAGE140
进行拼接作为空间网格编码预测模块的输入,与事件类别预测模块类似,经过多个隐层得到全局输出,经过隐层分支分别得到每级网格编码的局部输出,每个隐层由前一隐层输出和输入向量共同决定,空间网格编码预测的最终输出由每级的局部输出和全局输出综合得到。所述网格编码预测部分的局部输出和全局输出激活函数均采用Sigmoid函数;具体地,空间网格编码预测模块的最终输出计算公式为:
Figure 47131DEST_PATH_IMAGE070
其中,
Figure 407705DEST_PATH_IMAGE141
为处置机构所在空间网格编码预测的最终输出,
Figure 263666DEST_PATH_IMAGE142
为处置机构所在网格编码的全局预测概率,
Figure 367888DEST_PATH_IMAGE143
为局部网格预测概率,此外,
Figure 258484DEST_PATH_IMAGE074
为权重系数,用于调节全局预测概率和局部预测概率之间的权重,A为网格编码,H为最大层数。
S40.构建事件处置机构预测模型
Figure 524380DEST_PATH_IMAGE144
:以事件类别对应的业务编码和网格编号作为输入,事件处置机构编码为输出,采用SVM 模型训练事件处置机构预测模型
Figure 867637DEST_PATH_IMAGE009
其中,S40在模型训练的时候输入不是S30中获得的事件类别对应的业务编码和网格编号,是原始工单中的业务编码和网格编码;只有在预测的时候,输入使用的才是S30获得的事件类别对应的业务编码和网格编号;
S50.新发生事件的处置机构预测:使用训练获得的处置方式预测模型
Figure 509971DEST_PATH_IMAGE099
和事件处置机构预测模型
Figure 255073DEST_PATH_IMAGE145
来进行预测,输出需要处理该事件的对应事件处置机构编码。
具体地,步骤S50中的新事件的描述文本经过S20相同的预处理与语义特征提取后,输入到模型
Figure 957450DEST_PATH_IMAGE146
,通过S303的预测判定方式,获得新事件的各级事件类别的业务编码和网格编码,再将业务编码和网格编码输入到模型
Figure 788002DEST_PATH_IMAGE147
,获得最终的机构编码。
本发明基于自然语言处理技术和地理位置语义理解对政务事件描述文本进行解析,通过一种基于深度神经网络的模型来同时预测业务类型和处置机构所在网格,并能够通过处置机构预测模型来获得最终的处置机构编码。
以上所述仅为本发明的优选实施例而已,并不用于限制本发明,对于本领域的技术人员来说,本发明可以有各种更改和变化。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均包含在本发明的保护范围之内。

Claims (10)

1.一种融合处置机构网格语义的政务事件自动派单方法,其特征在于,包括如下步骤:
S10. 政务事件历史数据集获取:政务事件历史数据的重要关键字段包括:事件类别、事件描述文本、网格编号、事件处置机构编码;其中,事件类别包括事件大类、事件中类、事件小类,事件大、中、小类应取得相应的业务编码;事件处置机构为派单处置机构;事件描述文本为接线员根据热线电话信息记录下来的,与详细经过和用户诉求相关的完整文字描述;
S20. 事件数据预处理与语义特征提取:先对事件描述文本进行预处理,然后获取词向量矩阵
Figure 422368DEST_PATH_IMAGE001
,提取事件发生地点对应的地名地址信息,并获得地名地址向量
Figure 354552DEST_PATH_IMAGE002
S30. 构建事件处置方式预测模型
Figure 433366DEST_PATH_IMAGE003
:以步骤获取的S20词向量矩阵
Figure 400185DEST_PATH_IMAGE004
和地名地址向量
Figure 906253DEST_PATH_IMAGE005
作为输入,以事件类别的业务编码和网格编号作为最终输出,采用深度神经网络方式构建并训练事件处置方式预测模型
Figure 591312DEST_PATH_IMAGE006
S40. 构建事件处置机构预测模型
Figure 208238DEST_PATH_IMAGE007
:以事件类别对应的业务编码和网格编号作为输入,事件处置机构编码为输出,采用SVM 模型训练并构建事件处置机构预测模型
Figure 295143DEST_PATH_IMAGE008
S50.新发生事件的处置机构预测:使用训练获得的事件处置方式预测模型
Figure 972112DEST_PATH_IMAGE009
和事件处置机构预测模型
Figure 144467DEST_PATH_IMAGE010
来进行预测,输出需要处理该事件的对应事件处置机构编码。
2.如权利要求1所述的一种融合处置机构网格语义的政务事件自动派单方法,其特征在于,S20步骤中所提及的预处理包括文本清洗与过滤、停用词处理、标点符号处理、文本分词。
3.如权利要求1所述的一种融合处置机构网格语义的政务事件自动派单方法,其特征在于,通过S20步骤中所提及的事件数据预处理与语义特征提取获得地名地址向量
Figure 565084DEST_PATH_IMAGE011
和词向量矩阵
Figure 506495DEST_PATH_IMAGE012
其中,地名地址向量
Figure 354366DEST_PATH_IMAGE005
获取步骤为:
S201.事件发生地点的解析:根据事件发生地点的文字描述获取与事件发生直接相关的地名地址信息,并对其进行标准化处理;
S202.通过获取词嵌入表征
Figure 14017DEST_PATH_IMAGE013
和经纬度向量
Figure 972746DEST_PATH_IMAGE014
,求得地名地址向量
Figure 34243DEST_PATH_IMAGE002
词向量矩阵
Figure 787435DEST_PATH_IMAGE015
的获取步骤为:
S2001.事件描述文本的语义特征提取:使用Word2Vec技术用于对分词后的文本序列进行词嵌入表征,获得事件描述文本的每一个词的预训练词向量;
S2002.事件描述文本的语义特征映射:基于事件中词序列的顺序结构,将事件描述文本序列转换为词向量矩阵
Figure 934383DEST_PATH_IMAGE001
,设置词序列的长度为定值a,超出部分截断,而不足的使用0补齐。
4.如权利要求3所述的一种融合处置机构网格语义的政务事件自动派单方法,其特征在于,步骤S202中地名地址向量
Figure 696802DEST_PATH_IMAGE016
获取方法为包括如下步骤:
S2021.事件发生地点的地理编码:基于地理编码坐标的计算和推测方法,获得地名地址的经纬度坐标信息解算,以能获取的最高精度经纬度坐标为准,无法准确获得经纬度坐标的记录,则以获得的最小行政区域范围中心点为输出经纬度坐标;对所获得的经纬度坐标进行归一化处理,得到经纬度向量
Figure 612806DEST_PATH_IMAGE017
S2022.事件发生地点的语义特征提取:基于Word2Vec技术,通过预训练实现地址和地名信息的词嵌入表征
Figure 802479DEST_PATH_IMAGE018
,由于其主要表征地理位置,
Figure 171143DEST_PATH_IMAGE019
隐含了地理位置的语义特征;
S2023. 将词嵌入表征
Figure 471674DEST_PATH_IMAGE020
和经纬度向量
Figure 507764DEST_PATH_IMAGE021
拼接,获得地名地址向量
Figure 868338DEST_PATH_IMAGE011
,即:
Figure 724298DEST_PATH_IMAGE022
5.如权利要求1所述的一种融合处置机构网格语义的政务事件自动派单方法,其特征在于,所述S30所述的构建事件处置方式预测模型
Figure 828521DEST_PATH_IMAGE023
,其包括如下步骤:
S301.事件派单处置方式建模:深层特征提取模块同时使用词向量矩阵
Figure 719116DEST_PATH_IMAGE024
和地名地址向量
Figure 250592DEST_PATH_IMAGE005
作为输入;
S302.派单方式预测的损失定义
Figure 593848DEST_PATH_IMAGE026
及训练事件处置方式预测模型
Figure 236182DEST_PATH_IMAGE003
过程:样本数据集按一定比例随机分割成训练集和验证集,损失定义
Figure 981284DEST_PATH_IMAGE026
考虑了业务类型的预测损失
Figure 683661DEST_PATH_IMAGE027
和处置机构所处网格的预测损失
Figure 779793DEST_PATH_IMAGE028
,其中,
Figure 225818DEST_PATH_IMAGE029
由业务大、中、小各类预测损失构成;
Figure 825427DEST_PATH_IMAGE030
由各层网格预测局部损失和全局损失函共同构成;其公式如下:
Figure 433125DEST_PATH_IMAGE031
每一轮迭代完成后均计算验证集的损失,当验证集损失连续十轮没有增加时,停止迭代,保留损失最小的模型参数;
S303.事件派单处置方式预测结果判定:将训练后的处置方式预测模型
Figure 750974DEST_PATH_IMAGE032
输入词向量矩阵
Figure 690DEST_PATH_IMAGE033
和地名地址向量
Figure 720384DEST_PATH_IMAGE034
,输出获得事件分别在各级事件分类下的概率分布以及网格编码的全局概率分布,取各级事件分类下的最大概率对应的事件类别的业务编码作为事件在该级分类下的预测类别;网格编码的全局概率分布,其每个值在0到1之间,表示事件落在该网格的可能性,取超过阈值K 的为预测网格。
6.如权利要求5所述的一种融合处置机构网格语义的政务事件自动派单方法,其特征在于,步骤S50中的新事件的描述文本经过S20相同的预处理与语义特征提取后,输入到事件处置方式预测模型
Figure 764564DEST_PATH_IMAGE003
,通过S303的事件派单处置方式判定,获得新事件的各级事件类别的业务编码和网格编码,再将业务编码和网格编码输入到事件处置机构预测模型
Figure 569709DEST_PATH_IMAGE035
,获得最终事件处置机构编码。
7.如权利要求5所述的一种融合处置机构网格语义的政务事件自动派单方法,其特征在于,业务类型的预测损失
Figure 357536DEST_PATH_IMAGE036
和机构所处网格的预测损失
Figure 666158DEST_PATH_IMAGE037
计算方式如下:
Figure 881238DEST_PATH_IMAGE038
Figure 173679DEST_PATH_IMAGE039
为局部损失,
Figure 499619DEST_PATH_IMAGE040
为全局损失,
Figure 928326DEST_PATH_IMAGE041
为各层事业类别的业务编码的损失权重,c为事件类别,h 为层数,H为最大层数,
Figure 579887DEST_PATH_IMAGE042
为各层网格编码损失权重,a 为网格编码;
Figure 94045DEST_PATH_IMAGE044
为样本个数,
Figure 489254DEST_PATH_IMAGE045
为多分类交叉熵函数,
Figure 38047DEST_PATH_IMAGE046
为二分类交叉函数,
Figure 594931DEST_PATH_IMAGE047
为第
Figure 596385DEST_PATH_IMAGE048
个样本在第h 层所含业务类别的真实概率分布,
Figure 529706DEST_PATH_IMAGE049
为第
Figure 933005DEST_PATH_IMAGE050
个样本在第h 层所含业务类别的预测概率分布,
Figure 660790DEST_PATH_IMAGE051
为第
Figure 883961DEST_PATH_IMAGE050
个样本在第h 层所含网格类别的真实概率分布,
Figure 355393DEST_PATH_IMAGE052
为第
Figure 613199DEST_PATH_IMAGE050
个样本在第h 层所含网格类别的预测概率分布,
Figure 777464DEST_PATH_IMAGE053
为第
Figure 753511DEST_PATH_IMAGE050
个样本所有网格类别的真实概率分布,
Figure 763055DEST_PATH_IMAGE054
为第
Figure 406526DEST_PATH_IMAGE050
个样本所有网格类别的预测概率分布。
8.如权利要求5所述的一种融合处置机构网格语义的政务事件自动派单方法,其特征在于,步骤S301事件派单处置方式建模,具体包括:
S3011.事件类别预测模块:使用CNN结构的网络从词向量矩阵
Figure 476113DEST_PATH_IMAGE055
中提取业务语义特征,获得特征向量
Figure 939455DEST_PATH_IMAGE056
,特征向量
Figure 752691DEST_PATH_IMAGE057
经过隐层
Figure 985089DEST_PATH_IMAGE058
Figure 225577DEST_PATH_IMAGE059
最终获得
Figure 910636DEST_PATH_IMAGE060
,每个隐层
Figure 527563DEST_PATH_IMAGE061
由前一层级的隐层输出
Figure 880047DEST_PATH_IMAGE062
和当前的特征向量
Figure 557016DEST_PATH_IMAGE063
共同决定;其中,
Figure 729371DEST_PATH_IMAGE064
是通过
Figure 618829DEST_PATH_IMAGE065
的非线性变化得到,经过不同隐层分支输出得到大、中、小三个层级的事件类别的业务编码概率分布
Figure 91399DEST_PATH_IMAGE066
,其中i 表示层级,
Figure 939269DEST_PATH_IMAGE067
S3012.处置机构网格编号预测模块:将事件类别预测的最终隐层
Figure 598921DEST_PATH_IMAGE068
通过非线性变换得到
Figure 292070DEST_PATH_IMAGE069
,将
Figure 87988DEST_PATH_IMAGE070
和表征地理空间位置的地名地址向量
Figure 106760DEST_PATH_IMAGE071
进行拼接作为空间网格编码预测模块的输入,与事件类别预测模块类似,经过多个隐层得到全局输出,经过隐层分支分别得到每级网格编码的局部输出,每个隐层由前一隐层输出和输入向量共同决定,空间网格编码预测的最终输出由每级的局部输出和全局输出综合得到。
9.如权利要求8所述的一种融合处置机构网格语义的政务事件自动派单方法,其特征在于,空间网格编码预测模块的最终输出计算公式为:
Figure 253707DEST_PATH_IMAGE072
其中,
Figure 16127DEST_PATH_IMAGE073
为处置机构所在空间网格编码预测的最终输出,
Figure 932130DEST_PATH_IMAGE074
为处置机构所在网格编码的全局预测概率,
Figure 856224DEST_PATH_IMAGE075
为局部网格预测概率,此外,
Figure 490468DEST_PATH_IMAGE076
为权重系数,用于调节全局预测概率和局部预测概率之间的权重,A为网格编码,H为最大层数。
10.如权利要求8所述的一种融合处置机构网格语义的政务事件自动派单方法,其特征在于,步骤S3011中隐层
Figure 790999DEST_PATH_IMAGE077
通过如下公式计算得到,
Figure 827088DEST_PATH_IMAGE078
其中,
Figure 933802DEST_PATH_IMAGE079
为激活函数ReLU,
Figure 55342DEST_PATH_IMAGE080
为权重项,
Figure 159564DEST_PATH_IMAGE081
为偏置项;
步骤S3011中事件类别预测模块的最终输出
Figure 784580DEST_PATH_IMAGE066
通过如下公式计算得到,
Figure 316056DEST_PATH_IMAGE082
其中,
Figure 659312DEST_PATH_IMAGE083
为softmax函数,
Figure 832805DEST_PATH_IMAGE084
为权重项,
Figure 577907DEST_PATH_IMAGE085
为偏置项。
CN202110202001.4A 2021-02-23 2021-02-23 一种融合处置机构网格语义的政务事件自动派单方法 Active CN112581106B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110202001.4A CN112581106B (zh) 2021-02-23 2021-02-23 一种融合处置机构网格语义的政务事件自动派单方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110202001.4A CN112581106B (zh) 2021-02-23 2021-02-23 一种融合处置机构网格语义的政务事件自动派单方法

Publications (2)

Publication Number Publication Date
CN112581106A true CN112581106A (zh) 2021-03-30
CN112581106B CN112581106B (zh) 2021-05-28

Family

ID=75114004

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110202001.4A Active CN112581106B (zh) 2021-02-23 2021-02-23 一种融合处置机构网格语义的政务事件自动派单方法

Country Status (1)

Country Link
CN (1) CN112581106B (zh)

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113420015A (zh) * 2021-06-07 2021-09-21 浙江嘉兴数字城市实验室有限公司 基于神经网络的社会治理事件的自动分类方法
CN113449111A (zh) * 2021-08-31 2021-09-28 苏州工业园区测绘地理信息有限公司 基于时空语义知识迁移的社会治理热点话题自动识别方法
CN113673839A (zh) * 2021-07-30 2021-11-19 安徽商信政通信息技术股份有限公司 智能基层事件网格化自动派发方法和基层事件处理系统
CN113919811A (zh) * 2021-10-15 2022-01-11 长三角信息智能创新研究院 基于强化关联的热线事件分拨方法
CN115146488A (zh) * 2022-09-05 2022-10-04 山东鼹鼠人才知果数据科技有限公司 基于大数据的可变业务流程智能建模系统及其方法
CN115170053A (zh) * 2022-05-24 2022-10-11 中睿信数字技术有限公司 一种基于聚类融合的事件分拨处置系统
CN115169979A (zh) * 2022-08-08 2022-10-11 航天神舟智慧系统技术有限公司 一种基于语义分析的事件自动处置方法、装置及系统
CN115935245A (zh) * 2023-03-10 2023-04-07 吉奥时空信息技术股份有限公司 一种政务热线案件自动分类分拨方法
CN117171455A (zh) * 2023-11-01 2023-12-05 中鑫融信(北京)科技有限公司 基于网格的高关注度事件识别方法和系统

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107302564A (zh) * 2017-05-25 2017-10-27 广东建邦计算机软件股份有限公司 事件信息处理方法、装置、计算机设备和存储介质
CN108108352A (zh) * 2017-12-18 2018-06-01 广东广业开元科技有限公司 一种基于机器学习文本挖掘技术的企业投诉风险预警方法
CN109325116A (zh) * 2018-08-23 2019-02-12 武大吉奥信息技术有限公司 一种基于深度学习的城市事件自动分类派发方法及装置

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107302564A (zh) * 2017-05-25 2017-10-27 广东建邦计算机软件股份有限公司 事件信息处理方法、装置、计算机设备和存储介质
CN108108352A (zh) * 2017-12-18 2018-06-01 广东广业开元科技有限公司 一种基于机器学习文本挖掘技术的企业投诉风险预警方法
CN109325116A (zh) * 2018-08-23 2019-02-12 武大吉奥信息技术有限公司 一种基于深度学习的城市事件自动分类派发方法及装置

Cited By (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113420015A (zh) * 2021-06-07 2021-09-21 浙江嘉兴数字城市实验室有限公司 基于神经网络的社会治理事件的自动分类方法
CN113673839A (zh) * 2021-07-30 2021-11-19 安徽商信政通信息技术股份有限公司 智能基层事件网格化自动派发方法和基层事件处理系统
CN113673839B (zh) * 2021-07-30 2023-09-19 安徽商信政通信息技术股份有限公司 智能基层事件网格化自动派发方法和基层事件处理系统
CN113449111A (zh) * 2021-08-31 2021-09-28 苏州工业园区测绘地理信息有限公司 基于时空语义知识迁移的社会治理热点话题自动识别方法
CN113919811A (zh) * 2021-10-15 2022-01-11 长三角信息智能创新研究院 基于强化关联的热线事件分拨方法
CN113919811B (zh) * 2021-10-15 2023-01-06 长三角信息智能创新研究院 基于强化关联的热线事件分拨方法
CN115170053A (zh) * 2022-05-24 2022-10-11 中睿信数字技术有限公司 一种基于聚类融合的事件分拨处置系统
CN115169979A (zh) * 2022-08-08 2022-10-11 航天神舟智慧系统技术有限公司 一种基于语义分析的事件自动处置方法、装置及系统
CN115146488A (zh) * 2022-09-05 2022-10-04 山东鼹鼠人才知果数据科技有限公司 基于大数据的可变业务流程智能建模系统及其方法
CN115935245A (zh) * 2023-03-10 2023-04-07 吉奥时空信息技术股份有限公司 一种政务热线案件自动分类分拨方法
CN117171455A (zh) * 2023-11-01 2023-12-05 中鑫融信(北京)科技有限公司 基于网格的高关注度事件识别方法和系统
CN117171455B (zh) * 2023-11-01 2024-01-26 中鑫融信(北京)科技有限公司 基于网格的高关注度事件识别方法和系统

Also Published As

Publication number Publication date
CN112581106B (zh) 2021-05-28

Similar Documents

Publication Publication Date Title
CN112581106B (zh) 一种融合处置机构网格语义的政务事件自动派单方法
Li et al. Research trend of the application of information technologies in construction and demolition waste management
Kuller et al. A planning-support tool for spatial suitability assessment of green urban stormwater infrastructure
Ghosh et al. Urban ecological security assessment and forecasting using integrated DEMATEL-ANP and CA-Markov models: A case study on Kolkata Metropolitan Area, India
Xu et al. Real-time prediction of taxi demand using recurrent neural networks
Hillel et al. Recreating passenger mode choice-sets for transport simulation: A case study of London, UK
CN106127360A (zh) 一种基于用户特性分析的多模型负荷预测方法
Sandoval‐Solis et al. Collaborative modeling to evaluate water management scenarios in the Rio Grande Basin
Ouma et al. MCDA-GIS integrated approach for optimized landfill site selection for growing urban regions: an application of neighborhood-proximity analysis
CN113570867B (zh) 一种城市交通状态预测方法、装置、设备及可读存储介质
CN113204718A (zh) 一种顾及时空语义及驾驶状态的车辆轨迹目的地预测方法
Kumar et al. Mixed integer linear programming approaches for land use planning that limit urban sprawl
AlFanatseh Land suitability analysis of urban development in the Aqaba area, Jordan, using a GIS-based analytic hierarchy process
CN115668265A (zh) 为操纵和调整承保标的的风险驱动组合提供前瞻和后顾度量的风险转移配置器和模拟引擎及其方法
Tran et al. Factors affecting intelligent transport systems towards a smart city: A critical review
Diallo et al. Agent-based simulation from anonymized data: An application to Lille metropolis
Hassan et al. Modelling of urban growth and planning: A critical review
Lin et al. Insights into Travel Pattern Analysis and Demand Prediction: A Data-Driven Approach in Bike-Sharing Systems
Liao et al. River environmental decision support system development for Suzhou Creek in Shanghai
Ramadan et al. New environmental prediction model using fuzzy logic and neural networks
Cohen et al. Pedestrian Traffic flow prediction based on ANN model and OSM data
Asadollahfardi et al. Predicting atmospheric concentrations of benzene in the southeast of Tehran using artificial neural network
Aeeni et al. An assessment model for challenges of urban management system in Iranian new towns, based on interpretive structural modeling (ISM) approach
Liu The use of GIS-based genetic algorithm in water pollution control planning
Li et al. The application of fuzzy neural network in distribution center location

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
CB03 Change of inventor or designer information
CB03 Change of inventor or designer information

Inventor after: Qian Chengyang

Inventor after: Liu Xiu

Inventor after: Yang Yaning

Inventor after: Feng Sai

Inventor after: Wu Han

Inventor before: Liu Xiu

Inventor before: Qian Chengyang

Inventor before: Yang Yaning

Inventor before: Feng Sai

Inventor before: Wu Han

CP01 Change in the name or title of a patent holder
CP01 Change in the name or title of a patent holder

Address after: 215000 No. 101, Suhong Middle Road, Suzhou Industrial Park, Suzhou City, Jiangsu Province

Patentee after: Yuance Information Technology Co.,Ltd.

Address before: 215000 No. 101, Suhong Middle Road, Suzhou Industrial Park, Suzhou City, Jiangsu Province

Patentee before: SUZHOU INDUSTRIAL PARK SURVEYING MAPPING AND GEOINFORMATION Co.,Ltd.