CN115203361A - 事件分拨方法及装置、存储介质、终端 - Google Patents

事件分拨方法及装置、存储介质、终端 Download PDF

Info

Publication number
CN115203361A
CN115203361A CN202210663427.4A CN202210663427A CN115203361A CN 115203361 A CN115203361 A CN 115203361A CN 202210663427 A CN202210663427 A CN 202210663427A CN 115203361 A CN115203361 A CN 115203361A
Authority
CN
China
Prior art keywords
event
target
persons
address
category
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202210663427.4A
Other languages
English (en)
Other versions
CN115203361B (zh
Inventor
姚昱材
于祥雨
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Huayuan Computing Technology Shanghai Co ltd
Original Assignee
Huayuan Computing Technology Shanghai Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Huayuan Computing Technology Shanghai Co ltd filed Critical Huayuan Computing Technology Shanghai Co ltd
Priority to CN202210663427.4A priority Critical patent/CN115203361B/zh
Publication of CN115203361A publication Critical patent/CN115203361A/zh
Application granted granted Critical
Publication of CN115203361B publication Critical patent/CN115203361B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/3331Query processing
    • G06F16/334Query execution
    • G06F16/3344Query execution using natural language analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/35Clustering; Classification
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/30Semantic analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/06Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
    • G06Q10/063Operations research, analysis or management
    • G06Q10/0631Resource planning, allocation, distributing or scheduling for enterprises or organisations
    • G06Q10/06311Scheduling, planning or task assignment for a person or group
    • G06Q10/063118Staff planning in a project environment

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Human Resources & Organizations (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Artificial Intelligence (AREA)
  • Computational Linguistics (AREA)
  • Data Mining & Analysis (AREA)
  • Health & Medical Sciences (AREA)
  • Strategic Management (AREA)
  • General Health & Medical Sciences (AREA)
  • Databases & Information Systems (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Economics (AREA)
  • Educational Administration (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Game Theory and Decision Science (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Marketing (AREA)
  • Operations Research (AREA)
  • Quality & Reliability (AREA)
  • Tourism & Hospitality (AREA)
  • General Business, Economics & Management (AREA)
  • Development Economics (AREA)
  • Biomedical Technology (AREA)
  • Biophysics (AREA)
  • Evolutionary Computation (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

一种事件分拨方法及装置、存储介质、终端,所述方法包括:获取待分拨事件的事件文本;根据所述事件文本确定目标地址和目标类别,其中,目标地址为所述待分拨事件的发生地址,所述目标类别为所述待分拨事件所属的类别;根据所述目标地址和目标类别,确定所述待分拨事件的目标部门;读取归属于所述目标部门的多个可选人员的用户画像,所述用户画像包括:所述可选人员与各种类别的匹配度;根据所述目标类别和所述多个可选人员的用户画像,从所述多个可选人员中确定与所述待分拨事件匹配的目标人员,并将所述待分拨事件分拨至所述目标人员绑定的终端。采用上述方案,可以更加高效、精准地对事件进行分拨。

Description

事件分拨方法及装置、存储介质、终端
技术领域
本发明涉及数据处理技术领域,尤其涉及一种事件分拨方法及装置、存 储介质、终端。
背景技术
近年来,随着大数据技术的快速发展及人工智能算法的落地,数字化 赋能各行各业。
对诉求人反映的事件进行高效、准确的处理是基层治理体系中的重要一 环。因此,亟需一种事件分拨方法,能够更加高效、精准地对事件进行分拨。
对诉求人反映的事件进行高效、准确的处理是基层治理体系中的重要一 环。因此,亟需一种事件分拨方法,能够更加高效、精准地对事件进行分拨。
发明内容
本发明解决的技术问题是如何更加高效、精准地对事件进行分拨。
为解决上述技术问题,本发明实施例提供一种事件分拨方法,所述方法 包括:获取待分拨事件的事件文本;根据所述事件文本确定目标地址和目标 类别,其中,目标地址为所述待分拨事件的发生地址,所述目标类别为所述 待分拨事件所属的类别;根据所述目标地址和目标类别,确定所述待分拨事 件的目标部门;读取归属于所述目标部门的多个可选人员的用户画像,所述 用户画像包括:所述可选人员与各种类别的匹配度;根据所述目标类别和所 述多个可选人员的用户画像,从所述多个可选人员中确定与所述待分拨事件匹配的目标人员,并将所述待分拨事件分拨至所述目标人员绑定的终端。
可选的,所述可选人员与每种类别的匹配度是根据多个第一指标的数值 计算得到的,所述第一指标包括以下一项或多项:单位时长内解决属于该类 别的历史事件的数量;解决属于该类别的历史事件的评分,其中,所述评分 用于指示所述历史事件的诉求人的满意程度;解决属于该类别的历史事件所 用的平均时长;解决该类别的事件的总数。
可选的,读取所述多个可选人员的用户画像之前,所述方法还包括:针 对每种类别,根据所述多个第一指标对应的隶属函数和所述多个第一指标的 数值,确定所述可选人员对于该种类别的多个第一指标的分值;对所述多个 第一指标的分值进行计算,以得到所述可选人员与该种类别的匹配度。
可选的,所述匹配度是对所述多个第一指标的分值进行加权计算得到的, 所述方法还包括:按照预设时间间隔采用熵权法更新所述多个第一指标的权 重;当更新后的权重小于或等于第一预设阈值和/或更新前后所述权重的差异 大于第二预设阈值,则向管理用户终端发送校验提醒,所述校验提醒用于提 醒审核所述更新后的权重。
可选的,所述用户画像还包括:历史诉求人的属性特征,其中,所述历 史诉求人是指所述可选人员解决的历史事件的诉求人,根据所述目标类别和 所述多个可选人员的用户画像,从所述多个可选人员中确定与所述待分拨事 件匹配的目标人员包括:将当前诉求人的信息和所述历史诉求人的属性特征 进行匹配,确定所述可选人员和所述当前诉求人的匹配度,其中,所述当前 诉求人为所述待分拨事件的诉求人;根据第一匹配度和所述第二匹配度,从 所述多个可选人员中确定所述目标人员,其中,所述第一匹配度为所述可选人员和所述目标类别的匹配度,所述第二匹配度为所述可选人员和所述当前 诉求人的匹配度。
可选的,所述属性特征包括以下一项或多项:平均年龄、占比最高的学 历水平、性别分布和偏好的解决方式。
可选的,所述用户画像还包括:所述可选人员的第三匹配度,其中,所 述第三匹配度是根据所述可选人员的工龄和/或所述可选人员最近一次接收事 件的时间确定的,根据所述目标类别和所述多个可选人员的用户画像,从所 述多个可选人员中确定与所述待分拨事件匹配的目标人员包括:根据第一匹 配度和所述第三匹配度,从所述多个可选人员中确定所述目标人员,其中, 所述第一匹配度为所述可选人员和所述目标类别的匹配度。
可选的,所述方法还包括:计算所述待分拨事件和多个历史事件的相似 度;根据所述相似度从所述多个历史事件中确定至少一个相似事件;将所述 至少一个相似事件及其解决方案发送至所述目标人员绑定的终端。
可选的,计算所述待分拨事件和多个历史事件的相似度之前,所述方法 还包括:判断所述目标人员和所述待分拨事件的匹配度是否小于或等于第三 预设阈值,如果是,则计算所述待分拨事件和多个历史事件的相似度。
可选的,根据所述事件文本确定目标地址包括:对所述事件文本进行语 义识别,以提取所述事件文本中的地址信息;将所述地址信息与预设的地址 数据库进行匹配;如果在所述地址数据库中唯一确定与所述地址信息匹配的 地址,则将该地址作为所述目标地址;如果在所述地址数据库中不存在与所 述地址信息匹配的地址,或者,在所述地址数据库中查找到多个与所述地址 信息匹配的地址,则读取当前诉求人的信息,其中,所述当前诉求人为所述 待分拨事件的诉求人;提取所述当前诉求人的信息中的地址信息;根据所述当前诉求人的信息中的地址信息,确定所述目标地址。
本发明实施例还提供一种事件分拨装置,所述装置包括:获取模块,用 于获取待分拨事件的事件文本;第一确定模块,用于根据所述事件文本确定 目标地址和目标类别,其中,目标地址为所述待分拨事件的发生地址,所述 目标类别为所述待分拨事件所属的类别;第二确定模块,用于根据所述目标 地址和目标类别,确定所述待分拨事件的目标部门;读取模块,用于读取归 属于所述目标部门的多个可选人员的用户画像,所述用户画像包括:所述可 选人员与各种类别的匹配度;分拨模块,用于根据所述目标类别和所述多个 可选人员的用户画像,从所述多个可选人员中确定与所述待分拨事件匹配的 目标人员,并将所述待分拨事件分拨至所述目标人员绑定的终端。
本发明实施例还提供一种存储介质,其上存储有计算机程序,所述计算 机程序被处理器运行时,执行上述的事件分拨方法的步骤。
本发明实施例还提供一种终端,包括存储器和处理器,所述存储器上存 储有可在所述处理器上运行的计算机程序,所述处理器运行所述计算机程序 时执行上述的事件分拨方法的步骤。
与现有技术相比,本发明实施例的技术方案具有以下有益效果:
在本发明实施例的方案中,根据事件文本确定目标地址和目标类别,然 后根据目标地址和目标类别确定待分拨事件的目标部门。进一步,读取归属 于目标部门的多个可选人员的用户画像,由于用户画像包括可选人员和各种 类别的匹配度,因此可以根据目标类别和多个可选人员的用户画像,从多个 可选人员中确定与待分拨事件匹配的目标人员,并将待分拨事件分拨至目标 人员绑定的终端。采用这样的方案,能够直接将待分拨事件分拨至具体的人 员,因此,分拨的效率更高。另外,由于目标人员是根据人员的用户画像和 待分拨事件的目标类别匹配得到的,因此能够确保目标人员和待分拨事件之 间具有较高的适配度,因此,分拨的精准度更高。由上,本发明实施例提供 的方案能够更加高效、精准地对事件进行分拨。
进一步,在本发明实施例的方案中,用户画像还包括历史诉求人的属性 特征,在确定目标人员时,既考虑可选人员和目标类别的匹配度,还考虑可 选人员和当前诉求人的匹配度,也即,可选人员是否擅长和当前诉求人沟通。 采用这样的方案,能够更加精准地确定目标人员。
进一步,在本发明实施例的方案中,用户画像还包括可选人员的第三匹 配度,第三匹配度是根据可选人员的工龄和/或所述可选人员最近一次接收事 件的时间确定的。结合第三匹配度确定目标人员的方案,有利于考量可选人 员当前是否适合接收事件,从而能够更加精准地确定目标人员,有利于避免 确定的目标人员自身无法对待分拨事件进行处理的情况。
进一步,本发明实施例的方案中,当事件文本中的地址信息和地址数据 库中的地址匹配失败时,根据当前诉求人的信息中的地址信息确定目标地址。 相较于直接将匹配失败时直接对事件文本进行人为分拨的方案,采用上述方 案,可以减少因事件文本中地址信息描述不清楚而无法准确确定目标地址的 情况,有利于提高分拨的效率。
附图说明
图1是本发明实施例中一种事件分拨方法的流程示意图;
图2是图1中步骤S12的一种具体实施方式的部分流程示意图;
图3是图1中步骤S12的另一种具体实施方式的部分流程示意图;
图4是本发明实施例中一种事件分拨系统的架构示意图;
图5是本发明实施例中一种事件分拨装置的结构示意图。
具体实施方式
如背景技术所述,亟需一种事件分拨方法,能够更加高效、精准地对事 件进行分拨。
现有技术中,通常仅将事件分拨至部门,然后人为地确定部门中处理该 事件的目标人员,这样的分拨方法效率和精确度均有待提高。一方面,基层 治理应用场景中待分拨事件的数量通常较多,人为地确定为每个事件确定目 标人员的效率较低。另一方面,容易受主观因素影响,导致诉求类似的事件 分拨至不同的人员,或者确定的目标人员对类似诉求的事件并不熟悉,容易 影响处理效果,因此分拨的精确度较差。
为了解决上述技术问题,本发明实施例提供一种事件分拨方法,
在本发明实施例的方案中,根据事件文本确定目标地址和目标类别,然 后根据目标地址和目标类别确定待分拨事件的目标部门。进一步,读取归属 于目标部门的多个可选人员的用户画像,由于用户画像包括可选人员和各种 类别的匹配度,因此可以根据目标类别和多个可选人员的用户画像,从多个 可选人员中确定与待分拨事件匹配的目标人员,并将待分拨事件分拨至目标 人员绑定的终端。采用这样的方案,能够直接将待分拨事件分拨至具体的人 员,因此,分拨的效率更高。另外,由于目标人员是根据人员的用户画像和 待分拨事件的目标类别匹配得到的,因此能够确保目标人员和待分拨事件之 间具有较高的适配度,因此,分拨的精准度更高。由上,本发明实施例提供 的方案能够更加高效、精准地对事件进行分拨。
为使本发明的上述目的、特征和有益效果能够更为明显易懂,下面结合 附图对本发明的具体实施例做详细的说明。
参照图1,图1是本发明实施例中一种事件分拨方法的流程示意图。所述 方法可以由终端执行,所述终端可以是现有的各种具有数据接收和数据处理 能力的终端设备,例如,可以是手机、计算机、物联网设备和服务器等,但 并不限于此。图1示出的事件分拨方法可以包括以下:
步骤S11:获取待分拨事件的事件文本;
步骤S12:根据所述事件文本确定目标地址和目标类别,其中,目标地址 为所述待分拨事件的发生地址,所述目标类别为所述待分拨事件所属的类别;
步骤S13:根据所述目标地址和目标类别,确定所述待分拨事件的目标部 门;
步骤S14:读取归属于所述目标部门的多个可选人员的用户画像,所述用 户画像包括:所述可选人员与各种类别的匹配度;
步骤S15:根据所述目标类别和所述多个可选人员的用户画像,从所述多 个可选人员中确定与所述待分拨事件匹配的目标人员,并将所述待分拨事件 分拨至所述目标人员绑定的终端。
在具体S11的具体实施中,事件文本可以是从外部终端实时获取的,其 中,所述外部终端可以是执行本发明实施例的事件分拨方法的终端以外的其 他终端;事件文本还可以是预先存储在执行本发明实施例的事件分拨方法的 终端的存储器中的,还可以是从执行本发明实施例的事件分拨方法的终端耦 接的数据库中读取的,本实施例对此并不进行限制。本实施例对于事件文本 的存储形式并不进行限制,例如可以是以MySQL、Hive、HDFS等数据仓库 支持的数据格式进行存储。
具体而言,事件文本是对待分拨事件进行描述的文本。
需要说明的是,本实施例对于事件文本的格式并不进行限制,所述事件 文本可以是文档(Document,DOC)格式,也可以可携带文档(Portable Document Format,PDF)格式等,还可以是文本(Text,TXT)格式,但并不 限于此。
还需要说明的是,事件文本可以是包含任意一种或多种类型的文字,例 如,中文、英文等,本实施例对此并不进行限制。另外,本实施例对于事件 文本可以是短文本,所述短文本是指事件文本的字数小于预设字数阈值的文 本。
在步骤S12的具体实施中,一方面,可以根据事件文本确定待分拨事件 所属的类别,并记为目标类别。更具体地,根据事件文本从多个预设的类别 中确定目标类别。另一方面,可以根据事件文本确定待分拨事件的发生地址, 并记为目标地址。需要说明的是,本发明实施例对于确定目标地址和目标类 别的先后顺序并不进行限制。
参照图2,图2是步骤S12的一种具体实施方式的部分流程示意图。下面 结合图2对确定目标类别的具体过程进行非限制性的说明。图2示出的步骤 S12可以包括以下步骤:
步骤S21:对事件文本进行分词处理,以得到多个分词结果;
步骤S22:根据多个分词结果和预设的特征词集合,生成事件文本的编码 向量;
步骤S23:根据编码向量和各个分词结果的词向量,确定目标类别。
在步骤S21的具体实施中,可以对事件文本进行分词处理,以得到多个 初始分词结果。具体而言,可以预先构建自定义词袋,所述自定义词袋包括 多个词。进一步地,基于自定义词袋对事件文本进行分词处理,以得到多个 初始分词结果。
在一个具体的例子中,可以采用词频-逆向文件频率(Term Frequency-InverseDocument Frequency,TF-IDF)算法计算多个样本文本中的 各个词的权重,并选取权重大于预设的权重阈值的词,由此得到自定义词袋。 其中,样本文本可以是历史事件的文本,词的权重可以是指词在多个样本文 本中的词频(Term Frequency)。
需要说明的是,相较于直接采用通用的词袋对事件文本进行分词处理, 采用这样的方案,可以使分词结果更加准确,有利于提高特定领域的文本表 示的准确性,从而有利于提高确定目标类别的准确性。
进一步地,可以从多个初始分词结果中剔除干扰信息,以得到多个分词 结果,其中,干扰信息可以包括以下一项或多项:数字、预设的停用词(Stop Words)、字数小于等于预设字数阈值的分词结果和标点符号。其中,字数小 于等于预设字数阈值的分词结果可以是指单字,也即,可以剔除单字。
在基层治理的应用场景中,文本中包含的数字通常为身份证号码、手机 号码、时间日期、钱财金额、重量、数量等,这些数字对于文本的类别缺乏 指导作用,因此将数字作为干扰信息能够在不影响模型性能的前提下降低模 型学习的复杂度。
采用这样的方案,可以尽可能地过滤事件文本中与类别无关的干扰信息, 有利于后续更加准确地确定目标类别。
下面以事件文本“2017年7月以来,大场镇健康一路和健康二路的路口 每天傍晚5点左右经常出现交通拥堵的情况。”为例,对步骤S21的处理过 程进行进一步说明。
可以对该事件文本进行分词处理,以得到多个初步分词结果:
'2017','年','7','月','以','来',',','大场镇','健康一路','健康二路','的', '路口','每天','傍晚','5','点','左右','经常','出现','交通','拥堵','的', '情况','。'。
进一步地,可以剔除其中的数字、停用词、标点符号和单字,以得到该 事件文本的多个分词结果:'大场镇','健康一路','健康二路','路口','每天', '傍晚','出现','交通','拥堵'。
在步骤S22的具体实施中,可以读取预设的特征词集合,所述预设的特 征词集合也可以是预先定义的,特征词集合可以包括多个特征词。其中,特 征词可以是指对于事件所属的类别具有高表征效果的词。在具体实施中,特 征词集合中的多个特征词可以选自上述的自定义词袋。
在一个具体的例子中,对于多个样本文本,可以分别采用多种算法确定 多个自定义词袋,然后将多个自定义词袋中均存在的词作为特征词,以得到 特征词集合。所述多种算法可以包括以下任意多项的组合:TF-IDF算法、BM25 算法以及信息熵等算法。其中,可以采用每种算法计算多个样本文本中各个 词的权重,并选取权重大于预设的权重阈值的词,以得到该种算法得到的自 定义词袋。
进一步地,根据预设的特征词集合和事件文本的多个分词结果,可以生 成事件文本的编码向量。
具体而言,编码向量的维度的数量与特征词集合中特征词的数量相同, 且编码向量的维度与特征词集合中的特征词一一对应。进一步地,对于每个 特征词,如果事件文本的多个分词结果中包含该特征词,则该特征词对应的 维度的值为1,否则为0,由此可以得到事件文本的编码向量。
更具体地,多个特征词在特征词集合中顺序排列,每个特征词具有唯一 的序号。如果事件文本的多个分词结果中包含序号为i的特征词,则编码向量 中第i维度的值为1,否则第i维度的值为0。其中,i为正整数。
以预设的特征词集合包含1000个特征词为例,编码向量的维度的数量为 1000,对事件文本“2017年7月以来,大场镇健康一路和健康二路的路口每 天傍晚5点左右经常出现交通拥堵的情况”执行步骤S21之后,可以得到该 事件文本剔除干扰信息之后的多个分词结果为:'大场镇','健康一路','健康二 路','路口','每天','傍晚','出现','交通','拥堵'。其中,包含的特征词有:' 路口','交通'和'拥堵',且对应的序号依次为695、208和149,则该事件文本 的编码向量中第149维、第208维和第695维的值为1,其他维度的值为0。
在其他实施例中,对于每个特征词,如果事件文本的多个分词结果中包 含该特征词,则该特征词对应的维度的值为该特征词的权重;如果事件文本 的多个分词结果中不包含该特征词,则该特征词对应的维度的值为0。其中, 特征词的权重可以是指包含该特征词的样本文本的数量占所有样本文本的数 量的比值。
由上,可以通过事件文本的编码向量体现事件文本包含的特征词和未包 含的特征词,由于特征词是对于类别具有高表征效果的词,因此,编码向量 能够以数值化的形式充分有效且准确地表征事件文本的类别信息。
进一步地,在执行步骤S23之前,可以先构建并训练得到事件分类模型, 所述事件分类模型用于根据事件文本的多个分词结果和编码向量,确定目标 类别。其中,事件分类模型可以包括:第一特征提取模块、第二特征提取模 块、融合模块和分类模块。
在具体实施中,可以获取样本文本和样本文本的类别标签,类别标签用 于指示样本文本描述的历史事件所属的类别。
进一步地,可以对样本文本进行分词处理,以得到样本文本的多个分词 结果,记为多个样本分词结果。关于对样本文本进行分词处理的更多内容可 以参照上文关于步骤S21的具体描述,在此不再赘述。
进一步地,可以将多个样本分词结果输入至第一特征提取模块,以得到 第一特征提取模块输出的样本文本的第一特征向量,记为第一样本特征向量。
具体而言,所述第一特征提取模块可以包括:嵌入层和至少一个第一全 连接层。在训练过程中,嵌入层的输入为多个样本分词结果,嵌入层可以用 于基于每个样本分词结果生成该样本分词结果的词向量,其中,样本分词结 果的词向量是样本分词结果的嵌入(Embedding)表示。
进一步地,嵌入层还可以用于确定各个样本分词结果的权重,并根据各 个样本分词结果的权重和词向量,进行加权求和,以得到样本文本的嵌入向 量。在具体实施中,可以采用TF-IDF算法计算各个样本分词结果的权重,但 并不限于此。
进一步地,可以将样本文本的嵌入向量输入至第一全连接层,在训练阶 段,第一全连接层用于对样本文本的嵌入向量进行特征提取,以得到第一样 本特征向量。其中,第一全连接层的输出即为第一特征提取模块的输出。
在一个具体的例子中,第一特征提取模块包含1个第一全连接层,其中, 该第一全连接层的神经元数量可以为256,但并不限于此。
进一步地,可以根据多个样本分词结果和预设的特征词集合,生成样本 文本的编码向量,记为样本编码向量。关于生成样本编码向量的具体内容可 以参照上文关于步骤S22的相关描述,在此不再赘述。
进一步地,可以将样本编码向量输入至第二特征提取模块,以得到第二 特征提取模块输出的第二样本特征向量。
具体而言,第二特征提取模块可以包括:多个第二全连接层,在训练阶 段,多个第二全连接层用于对样本编码向量进行特征提取,以得到第二样本 特征向量。其中,第一个第二全连接层的输入为样本编码向量,自第二个第 二全连接层开始,输入为上一个第二全连接层的输出,最后一个第二全连接 层的输出即为第二特征提取模块的输出。
在一个具体的例子中,第二特征提取模块包含2个第二全连接层,其中, 第一个第二全连接层的神经元数量可以为512,第二个第二全连接层的神经元 数量可以为256,但并不限于此。
进一步地,可以将第一样本特征向量和第二样本特征向量输入至融合模 块,以得到融合模块输出的融合后的样本特征向量。
具体而言,融合模块可以包括:拼接子模块和第三全连接层,在训练阶 段,所述拼接子模块用于将第一样本特征向量和第二样本特征向量进行拼接, 以得到拼接后的样本特征向量,然后将拼接后的样本特征向量输入至第三全 连接层,以得到第三全连接层输出的融合后的样本特征向量,也即,第三全 连接层的输出即为融合模块的输出。更具体地,第三全连接层的神经元数量 与预设的类别的数量相同。
进一步地,可以将融合后的样本特征向量输入至分类模块,以得到分类 模块输出的预测类别。所述分类模块可以是现有的各种适当的分类器 (Classifier),本实施例对此并不进行限制。
进一步地,可以根据预测类别和类别标签,计算预测损失,更具体地, 可以根据预测类别、类别标签和预设的损失函数,确定预测损失。其中,损 失函数可以是Softmax函数,但并不限于此。
进一步地,可以根据预测损失更新事件分类模型,直至满足预设的训练 停止条件。其中,更新分类模型可以包括:更新分类模型中各个全连接层中 神经元之间的连接权重等,预设的训练停止条件可以包括以下一项或多项: 更新的次数达到第五预设阈值、预测损失小于第六预设阈值、正确率达到第 七预设阈值,但并不限于此。由此,可以得到本发明实施例中的事件分类模 型。
在一个非限制性的例子中,在生成样本文本的编码向量之前,还可以对 预设的特征词集合中多个特征词的顺序进行随机打乱,以得到更新后的特征 词集合。进一步地,可以根据多个样本分词结果和更新后的特征词集合,生 成样本编码向量。可以理解的是,对于同样的样本文本,基于更新前的特征 词集合生成的样本编码向量,与基于更新后的特征词集合生成的样本编码向 量是不同的,但类别标签是相同的。采用这样的方案,可以使分类模型不易 陷入局部最优,分类模型更容易达到收敛。
由此可以得到用于确定目标类别的事件分类模型。
在步骤S23的具体实施中,可以将多个分词结果和编码向量输入至事件 分类模型,以得到事件分类模型输出的目标类别。
具体而言,一方面,可以将事件文本的多个分词结果输入至第一特征提 取模块,以得到第一特征提取模块输出的第一特征向量。
更具体地,第一特征提取模块计算第一特征向量的具体过程可以包括: 计算事件文本中各个分词结果的词向量,并确定各个分词结果的权重值,然 后可以根据各个分词结果的词向量和权重值进行加权求和处理,以得到事件 文本的嵌入向量。进一步地,可以对事件文本的嵌入向量进行特征提取,以 得到事件文本的第一特征向量。
另一方面,可以将事件文本的编码向量输入至第二特征提取模块,以对 编码向量进行特征提取,从而得到事件文本的第二特征向量。
进一步地,可以采用融合模块,对第一特征向量和第二特征向量进行融 合处理,以得到事件文本的总特征向量。在一个具体的例子中,对第一特征 向量和第二特征向量进行融合处理可以包括:对第一特征向量和第二特征向 量进行拼接处理,以得到拼接后的特征向量;然后将拼接后的特征向量的维 度的数量转化为预设的类别的数量,以得到事件文本的总特征向量。进一步 地,可以采用分类模块,根据事件文本的总特征向量确定目标类别。
由上,可以准确地确定目标类别。
参照图3,图3是步骤S12的另一种具体方式的部分流程示意图。下面结 合图3对确定目标地址的具体过程进行非限制性的说明。如图3所示,步骤 S12可以包括以下步骤:
步骤S31:对事件文本进行语义识别,以提取事件文本中的地址信息;
步骤S32:将地址信息与预设的地址数据库进行匹配;
步骤S33:如果匹配成功,则将匹配得到的地址作为目标地址,如果匹配 失败,则根据当前诉求人的信息中的地址信息确定目标地址。
在步骤S31的具体实施中,可以将事件文本输入至预先训练得到的地址 提取模型,以得到地址提取模型输出的地址信息。为便于描述,可以将从事 件文本中提取到的地址信息记为第一事件信息。
下面对地址提取模型的训练过程进行非限制性的说明。
首先可以对样本文本进行标注,以得到标注后的样本文本。在具体实施 中,可以采用BIO标注体系进行逐字标注,在标注时可以采用预设字符对样 本文本中的每个字进行标注。具体而言,预设字符包括:地点开头字符B-LOC, 地点中间或结尾字符I-LOC以及其他字符O。
例如,样本文本为“反映万航渡路103号路上有污渍大堆呕吐物”,则标 注后的样本文本为:Dict1={'反':O,'映':O,'万':B-LOC,'航':I-LOC,'渡':I-LOC, '路':I-LOC,'1':I-LOC,'0':I-LOC,'3':I-LOC,'号':I-LOC,'路':I-LOC,′上':O,'有':O, '污':O,'渍':O,'大':O,'堆':O,'呕':O,'吐':O,'物':O}
进一步地,可以采用标注后的样本文本对预设模型进行训练,以得到地 址提取模型。在一个具体的例子中,预设模型为双向长短时记忆(Bidirectional Long Short-TermMemory,BiLSTM)网络+条件随机场(Conditional Random Field,CRF)网络的模型。
具体而言,BiLSTM网络在计算过程中,可以对于输入的每个字随机生成 一个长度为预设维度(例如,300维度)的初始的字向量,每个字的字向量会 在训练过程中不断更新,通过模型自主学习向量空间。进一步地,BiLSTM网 络包含前向LSTM网络和后向LSTM网络,通过将输入的多个字的字向量分 别接入前向LSTM网络和后向LSTM网络,然后将两个网络隐藏层输出的向 量进行拼接以得到拼接后的向量。进一步地,可以对拼接后的向量进行随机 丢弃(drop out)处理,并将处理后的拼接向量传输至单个全连接层,最终将 该全连接层输出的向量作为BiLSTM网络的输出向量。BiLSTM网络的输出 可以连接CRF网络的输入,也即,可以将BiLSTM网络的输出向量输入至 CRF网络中。
具体而言,CRF网络是一种判别式的概率模型,在一个具体的例子中, CRF网络可以采用线性链条件随机场。与BIO标注体系向对应,可以预先设 置有三种预设状态:{B-LOC,I-LOC,O}。在具体实施中,每个字的得分为 当前的状态得分和状态转移得分之和,条件随机场可以通过维特比算法寻找 得分最高的状态转移路径,确定每个字对应的预设状态。
在具体实施中,可以将标注后的样本文本输入至预设模型,标注后的样 本文本中每个字的状态得分由BiLSTM网络中最后的全连接层给出。此外, 可以随机初始化一个3×3的转移状态矩阵A,其中,A[m][n]表示从状态m 转移到状态n的状态转移得分。其中,转移状态矩阵A中的参数会在模型训 练时不断更新。
在具体实施中,可以将地址字符串数据(也即,标注后的样本文本)输 入至预设模型。更具体地,可以预先设定最大文本长度max_len,对于长度小 于max_len的样本文本进行补齐,对于长度大于max_len的样本文本可以进行 截取。设定参数64为批处理数据的大小,进一步地,可以将样本文本中的每 一个字生成一个300维的初始向量。由此,预设模型的输入向量可以表示为 shape1=(max_len,64,300)。进一步地,可以将该输入向量输入至BiLSTM 网络。
在本发明实施例的方案中,前向LSTM网络和后向LSTM网络的隐藏层 均可以为300维。可以将上述的输入向量分别输入至前向LSTM网络和后向 LSTM网络,以分别获得每个LSTM输出的向量shape2=(max_len,64,300)。 进一步地,可以将前向LSTM网络和后向LSTM网络输出的向量进行拼接, 以得到拼接后的向量shape3=(max_len,64,600)。
进一步地,可以对拼接后的向量进行比例为0.5的drop out处理,并将处 理后的向量输入至全连接层,该全连接层的神经元数量为3,由此可以得到该 全连接层输出的3维向量shape4=(max_len,64,3)。其中,参数3对应维 度的数值即为每个字属于3个预设状态(B-LOC,I-LOC和O)的状态得分。 进一步地,可以通过CRF模型确定输入序列的最优状态路径,对应状态即为 输入序列中每个字的预测状态。
进一步地,可以采用计算预测状态和真实状态之间的交叉熵损失,并采 用Adam优化器优化损失,并更新模型的参数。当满足预设的训练停止条件 时,可以得到地址提取模型。
进一步地,可以将事件文本输入至地址提取模型中,以得到地址提取模 型输出的第一地址信息。例如,事件文本为“东白湖镇湖山村村民张三私建 小房子”,则第一地址信息即为“白湖镇湖山村”。
在步骤S32的具体实施中,可以将第一地址信息和预设的地址数据库进 行匹配。其中,预设的地址数据库可以包括预设范围内多个预设地址。在实 际应用中,可以根据实际应用场景和应用需求确定预设范围,例如,预设范 围可以是全市、也可以是全省等,本实施例对预设范围并不进行限制。
其中,地址数据库中的预设地址可以是结构化数据。更具体地,预设地 址可以包括多个层级的地址,其中,地址的层级越高,地址对应的地域范围 越大。在一个具体的例子中,预设地址中多个层级的地址从高到低依次为: 省级地址、市级地址、区县级地址、街道(镇)级地址和社区级地址。也即, 社区级地址为层级最低的地址。例如,预设地址可以为:上海市浦东新区A 街道B小区。
相应的,第一地址信息中也通常包括一个或多个层级的地址。
在具体实施中,可以先将第一地址信息中层级最低的地址与地址数据库 中多个预设地址中层级最低的地址进行匹配。也即,先对层级最低的地址进 行匹配。例如,可以将第一地址信息中的社区级地址与多个预设地址中的社 区级地址进行匹配,如果唯一确定社区级地址和第一地址信息中社区级地址 相同的预设地址,则可以确定匹配成功,此时可以不再匹配其他层级的地址, 并将匹配到的预设地址作为目标地址。
在步骤S33的具体实施中,考虑到在实际应用场景中,容易出现匹配失 败的场景。例如,诉求人容易出现不按照结构化数据的要求在事件文本中描 述地址信息;又例如,第一地址信息中可能存在错别字的情况等;又例如, 第一地址信息中可能未包含明确的地址信息,如仅描述为“家中”,而并没有 描述清楚家的位置。
需要说明的是,匹配失败可以是指不存在唯一匹配的预设地址,或者, 查找到多个与第一地址信息匹配的预设地址。更具体地,可以是不存在社区 级地址唯一匹配的预设地址,或者,查找到多个社区级地址匹配的预设地址。
为了应对匹配失败的情况,本发明实施例的方案中可以采用下述任一种 方式进一步确定目标地址:
方式一:如果匹配失败,则可以提取当前诉求人的信息中的地址信息, 并根据当前诉求人的信息中的地址信息确定目标地址。例如,可以直接将当 前诉求人的信息中的地址作为目标地址。其中,当前诉求人是指待分拨事件 的诉求人。
具体而言,可以在数据库中读取当前诉求人的信息,当前诉求人的信息 和事件文本是一一对应的。其中,当前诉求人的信息也包括地址信息,记为 第二地址信息。进一步地,将第二地址信息和预设的地址数据库进行匹配, 并将匹配得到的预设地址作为目标地址。关于将第二地址信息和地址数据库 进行匹配的具体过程可以参照上文将第一地址信息和地址数据库进行匹配的 相关描述,在此不再赘述。
在实际应用场景中,第二地址信息通常为当前诉求人的居住地信息,由 于待分拨事件的发生地址并不必然和当前诉求人的居住地相同,因此,本发 明实施例的方案中,仅在第一地址信息匹配失败时对第二地址信进行匹配。
方式二:考虑到也可能出现第二地址信息匹配失败的情况,为此,本发 明实施例的方案中,可以采用逐级匹配的方式对第一地址信息继续进行匹配。
也即,优先对更低层级的地址进行匹配,如果匹配失败,则匹配上一层 级的地址,直至匹配上。具体而言,如果社区级地址匹配失败,则可以匹配 更高层级的地址(例如,街道级地址)。其中,所述更高层级的地址是指第一 地址信息包含的社区级地址的上一级地址。需要说明的是,所述更高层级的 地址并不必然是街道级地址,也可以是区县级地址,这取决于第一地址信息 的具体内容。
进一步地,可以将第一地址信息中更高层级的地址与地址数据库中相应 层级的地址进行匹配,并将匹配到的相应层级的地址作为目标地址。例如, 第一地址信息为“白湖镇湖山村”,如果在地址数据库中未查找到“湖山村”, 则可以进一步在地址数据库中查找“白湖镇”,如果查找到“白湖镇”这一地 址,则目标地址即为“白湖镇”。
进一步地,在第二地址信息匹配失败的情况下,在执行步骤S15时,还 可以一并向目标人员绑定的终端发送提醒信息,所述提醒信息用于提醒目标 人员收集、录入当前诉求人的地址(也即,居住地地址),以避免后续再发生 无法匹配的情况。
继续参考图1,在步骤S13的具体实施中,可以根据目标地址和目标类别, 确定待分拨事件的目标部门。
在具体实施中,一方面,可以根据目标类别确定待分拨事件对应的部门 类别。其中,可以根据预先设置类别和部门类别之间的映射关系,确定待分 拨事件对应的部门类别。另一方面,可以根据目标地址确定从属于对应的部 门类别的多个部门中确定目标部门,换言之,目标部门为管辖目标地址且与 目标类别相匹配的部门。
例如,目标类别为环保绿化,则部门类别可以为环保部门,进一步地, 目标地址为B街道B小区,则可以确定目标部门为管辖B街道B小区的环保 部门。
在一个非限制性的例子中,考虑到对于待分拨事件可能会需要多个部门 的人员协同处理。为此,可以根据目标类别确定多个对应的部门类别,并进 一步在每个部门类别中确定目标部门,以得到多个目标部门。进一步地,还 可以分别针对每个目标部门确定目标人员。
在步骤S14的具体实施中,可以读取归属于目标部门的多个可选人员的 用户画像。其中,可选人员的用户画像是预先构建的。下面对用户画像及其 构建过程进行描述。
在本发明的第一个实施例中,用户画像可以包括:可选人员与每种类别 的匹配度。具体而言,可以预先设置有多个第一指标,可选人员和每种类别 的匹配度可以是根据可选人员针对该种类别的多个第一指标的数值计算得到 的。
其中,多个第一指标可以用于刻画可选人员对于事件的处理能力。更具 体地,多个第一指标可以包括以下一项或多项:单位时长内解决属于该类别 的历史事件的数量;解决属于该类别的历史事件的评分,其中,所述评分用 于指示所述历史事件的诉求人的满意程度;解决属于该类别的历史事件所用 的平均时长;解决该类别的事件的总数。其中,单位时间可以是预先设置的, 例如,1个月,也即,该第一指标为:月平均解决属于该类别的历史事件的数 量。上述评分也可以是解决属于该类别的历史事件的平均评分。
在具体实施中,针对每个可选人员,可以先确定该可选人员对于每种类 别的多个第一指标的数值。进一步地,每种第一指标具有对应的隶属函数, 计算可选人员和每种类别的匹配度时,可以先根据第一指标对应的隶属函数 和第一指标的数值,确定可选人员对于该种类别的多个第一指标的分值。
进一步地,对于每种类别,可以对多个第一指标的分值进行计算,以得 到可选人员和该种类别的匹配度。在一个具体的例子中,对于每种类别,可 以对多个第一指标的分值进行加权求和,并将所述加权求和的结果作为可选 人员和该种类别的匹配度。
在另一个具体的例子中,对于每种类别,可以采用如下公式计算可选人 员和该种类别的匹配度:
Figure BDA0003692054450000181
其中,SCORE1j为可选人员和第j种类别的匹配度,score1j为可选人员对 于第j种类别的多个第一指标的分值进行加权求和的结果,N为类别的数量, j为正整数,1≤j≤N。采用这样的方案能够直观地表征出可选人员对于擅长 事件类别的倾向。
在本发明的第二个实施例中,用户画像还可以包括:历史诉求人的属性 特征。其中,历史诉求人是指可选人员解决的历史事件的诉求人。
具体而言,属性特征可以包括以下一项或多项:平均年龄、占比最高的 学历水平、性别分布和偏好的解决方式。在具体实施中,可以对每个可选人 员对应的历史诉求人的属性信息的分布进行统计,以得到该可选人员的属性 特征。
更具体地,可以对历史事件中诉求人的性别进行统计,以得到历史诉求 人的性别分布,所述性别分布可以选自:男性偏多、女性偏多和无明显偏好。
进一步地,还可以对历史诉求人的学历水平进行统计,并确定占比最高 的学历水平。例如,占比最高的学历水平可以选自:小学及以下、小学以上 大学以下、大学及以上。
进一步地,还可以对历史诉求人的年龄进行统计,以确定历史诉求人的 平均年龄。更具体的,可以是确定历史诉求人的平均年龄所属的年龄段。所 述年龄段可以选自:25岁以下、25岁~45岁、45岁~65岁和65岁以上。
进一步地,还可以对历史诉求人对历史事件选择的解决方式进行统计, 以得到该可选人员处理历史事件时历史诉求人偏好的解决方式。例如,偏好 的解决方式可以选自:人情化解、法条化解等。
通过构建历史诉求人的属性特征,可以体现可选人员擅长沟通的诉求人 的特点,有利于后续更加精准地确定目标人员。
在本发明的第三个实施例中,用户画像还可以包括:可选人员的第三匹 配度,其中,第三匹配度可以是根据可选人员的第二指标的分值计算得到的, 其中,第二指标可以包括:可选人员的工龄和/或可选人员最近一次接收事件 的时间。
在具体实施中,可以采用隶属函数计算工龄对应的第二指标的分值。
更具体地,可以采用隶属函数
Figure BDA0003692054450000191
来量化可选人员的工龄。
其中,x为可选人员的工龄,y为工龄对应的第二指标的分值,b和C均 为预设值。由此可知,可选人员的工龄越长,表明可选人员的经验能力越丰 富,第二指标的分值越大。
进一步地,可以采用隶属函数
Figure BDA0003692054450000201
来量化可选人员最近一次接收 事件的时间。
其中,x为距离可选人员最近一次接收事件的时长,y为可选人员最近一 次接收事件的时间对应的第二指标的分值。由此可知,距离可选人员最近一 次接收事件的时长越长,则说明可选人员休息时间越久,第二指标的分值越 大,成为目标人员的可能性越大。
进一步地,可以对多个第二指标的分值进行加权求和,以得到可选人员 的第三匹配度。通过第三匹配度可以表征可选人员自身接收事件的倾向,有 利于后续更加精准地确定目标人员。
由上,可以得到预先构建的用户画像。
在步骤S15的具体实施中,可以根据目标类别和多个可选人员的用户画 像,从归属于目标部门的多个可选人员中确定与待分拨事件匹配的目标人员, 并将待分拨事件分拨至目标人员绑定的终端。
在具体实施中,可以根据用户画像确定可选人员与待分拨事件的匹配度, 然后将与待分拨事件的匹配度最高的可选人员作为目标人员,也可以将第一 预设数量个与待分拨事件的匹配度最高的可选人员作为目标人员。
在本发明的第一个实施例中,可以确定每个可选人员和目标类别的匹配 度,然后直接将可选人员和目标类别的匹配度作为该可选人员和待分拨事件 的匹配度。
在本发明的第二个实施例中,针对每个可选人员,可以将当前诉求人的 信息和历史诉求人的属性特征进行匹配,以得到该可选人员的第二匹配度。
在具体实施中,针对每个可选人员,可以根据当前诉求人的信息和每个 属性特征的匹配程度,确定该属性特征的分值。进一步地,可以对多个属性 特征的分值进行加权求和,以得到第二匹配度。其中,属性特征的匹配程度, 属性特征的分值也不同,匹配程度越高,属性特征的分值也越高。在具体实 施中,匹配程度对应的分值可以是预先设置的。
例如,当前诉求人的年龄为47岁,若可选人员的平均年龄所处的年龄段 为“25-45岁”,则该平均年龄对应的分值为0.8,若可选人员的平均年龄所处 的年龄段为“45-65岁”,则平均年龄对应的分值为1。
进一步地,可以对第一匹配度和第二匹配度进行加权求和,以得到可选 人员和待分拨事件的匹配度。
在本发明的第三个实施例中,可以对每个可选人员的第一匹配度、第二 匹配度和第三匹配度进行加权求和,以得到该可选人员和待分拨事件的匹配 度。
进一步地,还可以计算待分拨事件和多个历史事件的相似度,并根据相 似度确定相似事件,然后将相似事件及其解决方案发送至目标人员绑定的终 端。
在具体实施中,可以读取多个历史事件的特征向量,并根据步骤S23中 得到的事件文本的总特征向量和多个历史事件的特征向量,计算待分拨事件 和多个历史事件的相似度。进一步地,可以根据相似度从多个历史事件中确 定至少一个相似事件,例如,可以确定第二预设数量个相似度最高的历史事 件作为相似事件。
更具体地,可以先根据目标类别对多个历史事件进行筛选,如果筛选出 的属于目标类别的多个历史事件的数量大于预设数量阈值,则可以在属于目 标类别的多个历史事件中确定相似事件。采用这样的方案能够减小多个历史 事件的范围,有利于快速地确定相似事件。
进一步地,可以将至少一个相似事件及其解决方案发送至目标人员绑定 的终端。在具体实施中,计算待分拨事件和多个历史事件的相似度之前,还 可以先判断目标人员和待分拨事件的匹配度是否小于或等于第三预设阈值, 若果是,则可以继续确定相似事件,并一并发送相似事件及其解决方案。若 否,则可以仅将待分拨事件发送至目标人员绑定的终端,而并不发送相似事 件及其解决方法。采用这样的方案,有利于提高事件分拨的效率。
进一步地,本发明实施例的方案中,可以按照预设时间间隔采用熵权法 更新上述方案中涉及的权重,以更新用户画像。例如,可以更新多个第一指 标的权重,但并不限于此。采用定期更新用户画像的方案,能够应对人员流 动频繁的问题,有利于精准地确定目标人员。
进一步地,考虑到熵权法对于数据的依赖性较高,且如果某一类指标的 数值波动不大,则采用熵权法确定的权重可能会偏低,但在实际应用场景中 该类指标的参考性较强,应当赋予较大的权重。为此,本发明实施例的方案 中,对于每个权重,如果更新后的权重小于或等于第一预设阈值,和/或,更 新前后权重的差异大于第二预设阈值,则可以向管理用户终端发送校验提醒, 所述校验提醒用于提醒所述管理用户审核所述更新后的权重,以便管理用户 可以在权重不恰当时进行微调。采用这样的方案,能够提高用户画像的准确性,从而有利于更加精准地确定目标人员。
参照图4,图4是本发明实施例中一种事件分拨系统的架构示意图。所述 事件分拨系统可以用于执行上述的事件分拨方法。
如图4所示,事件分拨系统可以包括:地址提取模块、事件分类模块、 文本特征化模块和画像构建模块。
具体而言,地址提取模块可以用于从事件文本提取目标地址。关于地址 提取模块的更多内容可以参照上文关于图3的相关描述,在此不再赘述。
进一步地,事件分类模块可以用于确定待分拨事件的目标类别。关于地 址提取模块的更多内容可以参照上文关于图2的相关描述,在此不再赘述。
进一步地,画像构建模块基于可选人员相关的历史数据和专家建议等, 构建能够量化人员能力的用户画像。其中,可选人员相关的历史数据可以包 括:解决过的历史事件的信息及其历史诉求人的信息。历史事件的信息可以 包括:事件类别、处理耗时、处理方式、诉求人员评价和处理是否成功等。 关于画像构建模块的内容可以参照上文关于图1的相关描述,在此不再赘述。
进一步地,画像构建模块还可以用于定期更新用户画像,以使得用户画 像能够具有自适应、动态变化的效果。
进一步地,文本特征化模块用于计算待分拨事件和历史事件的相似性, 给出已解决的历史事件中的相似案件的解决方案,用于辅助目标人员高效地 解决待分拨事件。
进一步地,事件分拨模块可以根据目标地址、目标类别、用户画像和诉 求人信息确定目标人员,并将事件文本、相似案件及其解决方案一并传输至 目标人员绑定的终端,由此完成事件的分拨
在实际应用中,可以采用利用Python编程语言的Django框架来实现。具 体而言,Django是开放源码的WEB应用框架,采用MTV框架模式,可以 快速开发出安全高、可维护强的系统平台。采用Django框架可以有效避免不 必要的兼容性问题。
参照图5,图5是本发明实施例中一种事件分拨装置的结构示意图。图5 示出的装置可以包括:
获取模块51,用于获取待分拨事件的事件文本;
第一确定模块52,用于根据所述事件文本确定目标地址和目标类别,其 中,目标地址为所述待分拨事件的发生地址,所述目标类别为所述待分拨事 件所属的类别;
第二确定模块53,用于根据所述目标地址和目标类别,确定所述待分拨 事件的目标部门;
读取模块54,用于读取归属于所述目标部门的多个可选人员的用户画像, 所述用户画像包括:所述可选人员与各种类别的匹配度;
分拨模块55,用于根据所述目标类别和所述多个可选人员的用户画像, 从所述多个可选人员中确定与所述待分拨事件匹配的目标人员,并将所述待 分拨事件分拨至所述目标人员绑定的终端。
在具体实施中,上述事件分拨装置可以对应于终端内具有数据处理功能 的芯片;或者对应于终端中具有数据处理功能的芯片模组,或者对应于终端, 又或者对应的上述的事件分拨系统。
关于图5示出的事件分拨装置的工作原理、工作方式和有益效果等更多 内容,可以参照上文关于图1至图4的相关描述,在此不再赘述。
本发明实施例还提供一种存储介质,其上存储有计算机程序,所述计算 机程序被处理器运行时,执行上述的对话内容的生成方法的步骤。所述存储 介质可以包括ROM、RAM、磁盘或光盘等。所述存储介质还可以包括非挥发 性存储器(non-volatile)或者非瞬态(non-transitory)存储器等。
本发明实施例还提供一种终端,包括存储器和处理器,所述存储器上存 储有可在所述处理器上运行的计算机程序,所述处理器运行所述计算机程序 时执行上述的事件分拨方法的步骤。所述终端可以是手机、计算机、电脑和 物联网设备等。应理解,本申请实施例中,所述处理器可以为中央处理单元 (central processing unit,简称CPU),该处理器还可以是其他通用处理器、数 字信号处理器(digital signal processor,简称DSP)、专用集成电路(application specific integrated circuit,简称ASIC)、现成可编程门阵列(field programmable gate array,简称FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器 件、分立硬件组件等。通用处理器可以是微处理器或者该处理器也可以是任 何常规的处理器等。
还应理解,本申请实施例中的存储器可以是易失性存储器或非易失性存 储器,或可包括易失性和非易失性存储器两者。其中,非易失性存储器可以 是只读存储器(read-only memory,简称ROM)、可编程只读存储器 (programmable ROM,简称PROM)、可擦除可编程只读存储器(erasable PROM,简称EPROM)、电可擦除可编程只读存储器(electricallyEPROM, 简称EEPROM)或闪存。易失性存储器可以是随机存取存储器(random accessmemory,简称RAM),其用作外部高速缓存。通过示例性但不是限制性说明, 许多形式的随机存取存储器(random access memory,简称RAM)可用,例 如静态随机存取存储器(staticRAM,简称SRAM)、动态随机存取存储器 (DRAM)、同步动态随机存取存储器(synchronousDRAM,简称SDRAM)、 双倍数据速率同步动态随机存取存储器(double data rate SDRAM,简称DDR SDRAM)、增强型同步动态随机存取存储器(enhanced SDRAM,简称 ESDRAM)、同步连接动态随机存取存储器(synchlink DRAM,简称SLDRAM) 和直接内存总线随机存取存储器(direct rambus RAM,简称DR RAM)。
上述实施例,可以全部或部分地通过软件、硬件、固件或其他任意组合 来实现。当使用软件实现时,上述实施例可以全部或部分地以计算机程序产 品的形式实现。所述计算机程序产品包括一个或多个计算机指令或计算机程 序。在计算机上加载或执行所述计算机指令或计算机程序时,全部或部分地 产生按照本申请实施例所述的流程或功能。所述计算机可以为通用计算机、 专用计算机、计算机网络、或者其他可编程装置。所述计算机程序可以存储 在计算机可读存储介质中,或者从一个计算机可读存储介质向另一个计算机 可读存储介质传输,例如,所述计算机程序可以从一个网站站点、计算机、 服务器或数据中心通过有线或无线方式向另一个网站站点、计算机、服务器 或数据中心进行传输。
在本申请所提供的几个实施例中,应该理解到,所揭露的方法、装置和 系统,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示 意性的;例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可 以有另外的划分方式;例如多个单元或组件可以结合或者可以集成到另一个 系统,或一些特征可以忽略,或不执行。所述作为分离部件说明的单元可以 是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不 是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可 以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目 的。
另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元中, 也可以是各个单元单独物理包括,也可以两个或两个以上单元集成在一个单 元中。上述集成的单元既可以采用硬件的形式实现,也可以采用硬件加软件 功能单元的形式实现。例如,对于应用于或集成于芯片的各个装置、产品, 其包含的各个模块/单元可以都采用电路等硬件的方式实现,或者,至少部分 模块/单元可以采用软件程序的方式实现,该软件程序运行于芯片内部集成的 处理器,剩余的(如果有)部分模块/单元可以采用电路等硬件方式实现;对 于应用于或集成于芯片模组的各个装置、产品,其包含的各个模块/单元可以 都采用电路等硬件的方式实现,不同的模块/单元可以位于芯片模组的同一组 件(例如芯片、电路模块等)或者不同组件中,或者,至少部分模块/单元可 以采用软件程序的方式实现,该软件程序运行于芯片模组内部集成的处理器, 剩余的(如果有)部分模块/单元可以采用电路等硬件方式实现;对于应用于 或集成于终端的各个装置、产品,其包含的各个模块/单元可以都采用电路等 硬件的方式实现,不同的模块/单元可以位于终端内同一组件(例如,芯片、电路模块等)或者不同组件中,或者,至少部分模块/单元可以采用软件程序 的方式实现,该软件程序运行于终端内部集成的处理器,剩余的(如果有) 部分模块/单元可以采用电路等硬件方式实现。
应理解,本文中术语“和/或”,仅仅是一种描述关联对象的关联关系,表 示可以存在三种关系,例如,A和/或B,可以表示:单独存在A,同时存在 A和B,单独存在B这三种情况。另外,本文中字符“/”,表示前后关联对象 是一种“或”的关系。
本申请实施例中出现的“多个”是指两个或两个以上。
本申请实施例中出现的第一、第二等描述,仅作示意与区分描述对象之 用,没有次序之分,也不表示本申请实施例中对设备个数的特别限定,不能 构成对本申请实施例的任何限制。
虽然本发明披露如上,但本发明并非限定于此。任何本领域技术人员, 在不脱离本发明的精神和范围内,均可作各种更动与修改,因此本发明的保 护范围应当以权利要求所限定的范围为准。

Claims (13)

1.一种事件分拨方法,其特征在于,所述方法包括:
获取待分拨事件的事件文本;
根据所述事件文本确定目标地址和目标类别,其中,目标地址为所述待分拨事件的发生地址,所述目标类别为所述待分拨事件所属的类别;
根据所述目标地址和目标类别,确定所述待分拨事件的目标部门;
读取归属于所述目标部门的多个可选人员的用户画像,所述用户画像包括:
所述可选人员与各种类别的匹配度;
根据所述目标类别和所述多个可选人员的用户画像,从所述多个可选人员中确定与所述待分拨事件匹配的目标人员,并将所述待分拨事件分拨至所述目标人员绑定的终端。
2.根据权利要求1所述的事件分拨方法,其特征在于,所述可选人员与每种类别的匹配度是根据多个第一指标的数值计算得到的,所述第一指标包括以下一项或多项:
单位时长内解决属于该类别的历史事件的数量;
解决属于该类别的历史事件的评分,其中,所述评分用于指示所述历史事件的诉求人的满意程度;
解决属于该类别的历史事件所用的平均时长;
解决该类别的事件的总数。
3.根据权利要求2所述的事件分拨方法,其特征在于,读取所述多个可选人员的用户画像之前,所述方法还包括:
针对每种类别,根据所述多个第一指标对应的隶属函数和所述多个第一指标的数值,确定所述可选人员对于该种类别的多个第一指标的分值;
对所述多个第一指标的分值进行计算,以得到所述可选人员与该种类别的匹配度。
4.根据权利要求3所述的事件分拨方法,其特征在于,所述匹配度是对所述多个第一指标的分值进行加权计算得到的,所述方法还包括:
按照预设时间间隔采用熵权法更新所述多个第一指标的权重;
当更新后的权重小于或等于第一预设阈值和/或更新前后所述权重的差异大于第二预设阈值,则向管理用户终端发送校验提醒,所述校验提醒用于提醒审核所述更新后的权重。
5.根据权利要求1所述的事件分拨方法,其特征在于,所述用户画像还包括:
历史诉求人的属性特征,其中,所述历史诉求人是指所述可选人员解决的历史事件的诉求人,根据所述目标类别和所述多个可选人员的用户画像,从所述多个可选人员中确定与所述待分拨事件匹配的目标人员包括:
将当前诉求人的信息和所述历史诉求人的属性特征进行匹配,确定所述可选人员和所述当前诉求人的匹配度,其中,所述当前诉求人为所述待分拨事件的诉求人;
根据第一匹配度和第二匹配度,从所述多个可选人员中确定所述目标人员,其中,所述第一匹配度为所述可选人员和所述目标类别的匹配度,所述第二匹配度为所述可选人员和所述当前诉求人的匹配度。
6.根据权利要求5所述的事件分拨方法,其特征在于,所述属性特征包括以下一项或多项:平均年龄、占比最高的学历水平、性别分布和偏好的解决方式。
7.根据权利要求1所述的事件分拨方法,其特征在于,所述用户画像还包括:
所述可选人员的第三匹配度,其中,所述第三匹配度是根据所述可选人员的工龄和/或所述可选人员最近一次接收事件的时间确定的,根据所述目标类别和所述多个可选人员的用户画像,从所述多个可选人员中确定与所述待分拨事件匹配的目标人员包括:
根据第一匹配度和所述第三匹配度,从所述多个可选人员中确定所述目标人员,其中,所述第一匹配度为所述可选人员和所述目标类别的匹配度。
8.根据权利要求1所述的事件分拨方法,其特征在于,所述方法还包括:
计算所述待分拨事件和多个历史事件的相似度;
根据所述相似度从所述多个历史事件中确定至少一个相似事件;
将所述至少一个相似事件及其解决方案发送至所述目标人员绑定的终端。
9.根据权利要求8所述的事件分拨方法,其特征在于,计算所述待分拨事件和多个历史事件的相似度之前,所述方法还包括:
判断所述目标人员和所述待分拨事件的匹配度是否小于或等于第三预设阈值,如果是,则计算所述待分拨事件和多个历史事件的相似度。
10.根据权利要求1所述的事件分拨方法,其特征在于,根据所述事件文本确定目标地址包括:
对所述事件文本进行语义识别,以提取所述事件文本中的地址信息;
将所述地址信息与预设的地址数据库进行匹配;
如果在所述地址数据库中唯一确定与所述地址信息匹配的地址,则将该地址作为所述目标地址;
如果在所述地址数据库中不存在与所述地址信息匹配的地址,或者,在所述地址数据库中查找到多个与所述地址信息匹配的地址,则读取当前诉求人的信息,其中,所述当前诉求人为所述待分拨事件的诉求人;
提取所述当前诉求人的信息中的地址信息;
根据所述当前诉求人的信息中的地址信息,确定所述目标地址。
11.一种事件分拨装置,其特征在于,所述装置包括:
获取模块,用于获取待分拨事件的事件文本;
第一确定模块,用于根据所述事件文本确定目标地址和目标类别,其中,目标地址为所述待分拨事件的发生地址,所述目标类别为所述待分拨事件所属的类别;
第二确定模块,用于根据所述目标地址和目标类别,确定所述待分拨事件的目标部门;
读取模块,用于读取归属于所述目标部门的多个可选人员的用户画像,所述用户画像包括:所述可选人员与各种类别的匹配度;
分拨模块,用于根据所述目标类别和所述多个可选人员的用户画像,从所述多个可选人员中确定与所述待分拨事件匹配的目标人员,并将所述待分拨事件分拨至所述目标人员绑定的终端。
12.一种存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器运行时,执行权利要求1至10中任一项所述的事件分拨方法的步骤。
13.一种终端,包括存储器和处理器,所述存储器上存储有可在所述处理器上运行的计算机程序,其特征在于,所述处理器运行所述计算机程序时执行权利要求1至10中任一项所述的事件分拨方法的步骤。
CN202210663427.4A 2022-06-13 2022-06-13 事件分拨方法及装置、存储介质、终端 Active CN115203361B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210663427.4A CN115203361B (zh) 2022-06-13 2022-06-13 事件分拨方法及装置、存储介质、终端

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210663427.4A CN115203361B (zh) 2022-06-13 2022-06-13 事件分拨方法及装置、存储介质、终端

Publications (2)

Publication Number Publication Date
CN115203361A true CN115203361A (zh) 2022-10-18
CN115203361B CN115203361B (zh) 2024-04-02

Family

ID=83575499

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210663427.4A Active CN115203361B (zh) 2022-06-13 2022-06-13 事件分拨方法及装置、存储介质、终端

Country Status (1)

Country Link
CN (1) CN115203361B (zh)

Citations (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20150092928A1 (en) * 2013-09-27 2015-04-02 Anne-Marie Jensen Emergency incident categorization and alerting
US20180013846A1 (en) * 2015-09-29 2018-01-11 Tencent Technology (Shenzhen) Company Limited Event information push method, event information push apparatus, and storage medium
JP2018067045A (ja) * 2016-10-17 2018-04-26 株式会社リコー コンテンツ配布システム、携帯端末、方法およびプログラム
CN110543562A (zh) * 2019-08-19 2019-12-06 武大吉奥信息技术有限公司 一种基于事件图谱的城市治理事件自动分拨方法及系统
CN112328760A (zh) * 2020-11-03 2021-02-05 中国联合网络通信集团有限公司 服务提供方法、装置和系统
WO2021027540A1 (zh) * 2019-08-13 2021-02-18 深圳壹账通智能科技有限公司 走失人员信息匹配方法、装置、计算机设备和存储介质
CN113077196A (zh) * 2021-06-07 2021-07-06 泰豪信息技术有限公司 纠纷事件处理方法、装置、可读存储介质及计算机设备
CN113535959A (zh) * 2021-07-29 2021-10-22 长三角信息智能创新研究院 面向基层治理的事件自动分拨方法
CN113850666A (zh) * 2021-09-22 2021-12-28 平安银行股份有限公司 业务调度的方法、装置、设备及存储介质
CN114446287A (zh) * 2022-01-28 2022-05-06 山东福生佳信科技股份有限公司 一种基于nlp和gis的城市事件分拨方法及系统
CN114492663A (zh) * 2022-02-15 2022-05-13 平安国际智慧城市科技股份有限公司 事件智能分拨方法、装置、设备及存储介质

Patent Citations (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20150092928A1 (en) * 2013-09-27 2015-04-02 Anne-Marie Jensen Emergency incident categorization and alerting
US20180013846A1 (en) * 2015-09-29 2018-01-11 Tencent Technology (Shenzhen) Company Limited Event information push method, event information push apparatus, and storage medium
JP2018067045A (ja) * 2016-10-17 2018-04-26 株式会社リコー コンテンツ配布システム、携帯端末、方法およびプログラム
WO2021027540A1 (zh) * 2019-08-13 2021-02-18 深圳壹账通智能科技有限公司 走失人员信息匹配方法、装置、计算机设备和存储介质
CN110543562A (zh) * 2019-08-19 2019-12-06 武大吉奥信息技术有限公司 一种基于事件图谱的城市治理事件自动分拨方法及系统
CN112328760A (zh) * 2020-11-03 2021-02-05 中国联合网络通信集团有限公司 服务提供方法、装置和系统
CN113077196A (zh) * 2021-06-07 2021-07-06 泰豪信息技术有限公司 纠纷事件处理方法、装置、可读存储介质及计算机设备
CN113535959A (zh) * 2021-07-29 2021-10-22 长三角信息智能创新研究院 面向基层治理的事件自动分拨方法
CN113850666A (zh) * 2021-09-22 2021-12-28 平安银行股份有限公司 业务调度的方法、装置、设备及存储介质
CN114446287A (zh) * 2022-01-28 2022-05-06 山东福生佳信科技股份有限公司 一种基于nlp和gis的城市事件分拨方法及系统
CN114492663A (zh) * 2022-02-15 2022-05-13 平安国际智慧城市科技股份有限公司 事件智能分拨方法、装置、设备及存储介质

Also Published As

Publication number Publication date
CN115203361B (zh) 2024-04-02

Similar Documents

Publication Publication Date Title
CN113822494B (zh) 风险预测方法、装置、设备及存储介质
US20220405480A1 (en) Text sentiment analysis method based on multi-level graph pooling
CN108351986B (zh) 学习系统及装置和方法、训练数据生成装置及生成方法
CN110728541B (zh) 信息流媒体广告创意推荐方法及装置
CN112084383A (zh) 基于知识图谱的信息推荐方法、装置、设备及存储介质
CN114330354B (zh) 一种基于词汇增强的事件抽取方法、装置及存储介质
CN110175857B (zh) 优选业务确定方法及装置
CN110263160A (zh) 一种计算机问答系统中的问句分类方法
CN110866124A (zh) 基于多数据源的医学知识图谱融合方法及装置
CN111723569A (zh) 一种事件抽取方法、装置和计算机可读存储介质
CN109767312A (zh) 一种信用评估模型训练、评估方法与装置
CN108509484A (zh) 分类器构建及智能问答方法、装置、终端及可读存储介质
CN111951050B (zh) 理财产品推荐方法及装置
CN112364170A (zh) 数据情感分析方法、装置、电子设备及介质
CN108550065A (zh) 评论数据处理方法、装置及设备
CN112231485A (zh) 文本推荐方法、装置、计算机设备及存储介质
CN109582788A (zh) 垃圾评论训练、识别方法、装置、设备及可读存储介质
CN114661861B (zh) 文本匹配方法及装置、存储介质、终端
CN115114409B (zh) 一种基于软参数共享的民航不安全事件联合抽取方法
CN116578717A (zh) 用于电力营销场景的多源异构知识图谱构建方法
CN116127013A (zh) 一种个人敏感信息知识图谱查询方法和装置
CN116701584A (zh) 基于电力用户画像的智能问答方法、装置以及电子设备
CN114817467A (zh) 一种意图识别响应方法、装置、设备及存储介质
CN112905787B (zh) 文本信息处理方法、短信处理方法、电子设备及可读介质
CN115203361A (zh) 事件分拨方法及装置、存储介质、终端

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant