CN116091004A - 一种举报信息处理方法、装置、存储介质及电子设备 - Google Patents

一种举报信息处理方法、装置、存储介质及电子设备 Download PDF

Info

Publication number
CN116091004A
CN116091004A CN202310164788.9A CN202310164788A CN116091004A CN 116091004 A CN116091004 A CN 116091004A CN 202310164788 A CN202310164788 A CN 202310164788A CN 116091004 A CN116091004 A CN 116091004A
Authority
CN
China
Prior art keywords
information
report information
word
reporting
user
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202310164788.9A
Other languages
English (en)
Inventor
吴星
王维强
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Alipay Hangzhou Information Technology Co Ltd
Original Assignee
Alipay Hangzhou Information Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Alipay Hangzhou Information Technology Co Ltd filed Critical Alipay Hangzhou Information Technology Co Ltd
Priority to CN202310164788.9A priority Critical patent/CN116091004A/zh
Publication of CN116091004A publication Critical patent/CN116091004A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/10Office automation; Time management
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/205Parsing
    • G06F40/216Parsing using statistical methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/279Recognition of textual entities
    • G06F40/284Lexical analysis, e.g. tokenisation or collocates
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/01Customer relationship services
    • G06Q30/015Providing customer assistance, e.g. assisting a customer within a business location or via helpdesk
    • G06Q30/016After-sales
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q40/00Finance; Insurance; Tax strategies; Processing of corporate or income taxes
    • G06Q40/04Trading; Exchange, e.g. stocks, commodities, derivatives or currency exchange

Landscapes

  • Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Strategic Management (AREA)
  • General Business, Economics & Management (AREA)
  • Economics (AREA)
  • Marketing (AREA)
  • Finance (AREA)
  • Accounting & Taxation (AREA)
  • Development Economics (AREA)
  • Health & Medical Sciences (AREA)
  • Entrepreneurship & Innovation (AREA)
  • General Engineering & Computer Science (AREA)
  • Human Resources & Organizations (AREA)
  • General Health & Medical Sciences (AREA)
  • Computational Linguistics (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Artificial Intelligence (AREA)
  • Tourism & Hospitality (AREA)
  • Probability & Statistics with Applications (AREA)
  • Technology Law (AREA)
  • Operations Research (AREA)
  • Quality & Reliability (AREA)
  • Data Mining & Analysis (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本说明书公开了一种举报信息处理方法、装置、存储介质及电子设备。在本说明书提供的举报信息处理方法中,接收用户提交的举报信息;将所述举报信息输入预先训练的识别模型中,通过所述识别模型识别所述举报信息包含的业务要素;根据预设的必要要素以及所述举报信息包含的业务要素,确定所述举报信息缺失的必要要素;根据所述举报信息缺失的必要要素,向所述用户发送提示消息,使所述用户基于所述举报信息缺失的必要要素,对所述举报信息进行补充;将所述用户补充的补充信息以及所述举报信息,发送至审理设备,使所述审理设备根据所述补充信息以及所述举报信息进行举报审理。

Description

一种举报信息处理方法、装置、存储介质及电子设备
技术领域
本说明书涉及计算机技术领域,尤其涉及一种举报信息处理方法、装置、存储介质及电子设备。
背景技术
如今,用户可以在线上执行各种各样的业务,但用户在执行业务的过程中,可能会遇到业务发生异常的情况,导致用户的权益受损或隐私数据泄露。在这种情况下,用户往往会对异常业务进行举报。
现有技术中服务提供方在接收用户的举报信息后,通常会直接交由审理人员对用户的举报信息进行审理,并根据用户提交的举报信息的具体内容做出后续应对。然而,很多情况下用户提交的举报信息都较为简短,往往会缺少许多关键信息,从而导致审理人员很难对用户的举报做出最为正确的回应。
因此,如何合理地处理用户提交的举报信息是一个亟待解决的问题。
发明内容
本说明书提供一种举报信息处理方法、装置、存储介质及电子设备,以部分的解决现有技术存在的上述问题。
本说明书采用下述技术方案:
本说明书提供了一种举报信息处理方法,包括:
接收用户提交的举报信息;
将所述举报信息输入预先训练的识别模型中,通过所述识别模型识别所述举报信息包含的业务要素;
根据预设的必要要素以及所述举报信息包含的业务要素,确定所述举报信息缺失的必要要素;
根据所述举报信息缺失的必要要素,向所述用户发送提示消息,使所述用户基于所述举报信息缺失的必要要素,对所述举报信息进行补充;
将所述用户补充的补充信息以及所述举报信息,发送至审理设备,使所述审理设备根据所述补充信息以及所述举报信息进行举报审理。
可选地,根据预设的必要要素以及所述举报信息包含的业务要素,确定所述举报信息缺失的必要要素,具体包括:
针对预设的每个必要要素,判断所述举报信息包含的业务要素中是否存在该必要要素;
若不存在,则确定所述业务信息缺失该必要要素。
可选地,在向所述用户发送提示消息之前,所述方法还包括:
当所述举报信息不存在缺失的必要要素时,将所述举报信息,发送至审理设备,使所述审理设备根据所述举报信息进行举报审理。
可选地,在将所述用户补充的补充信息以及所述举报信息,发送至审理设备之前,所述方法还包括:
接收所述用户补充的补充信息;
将所述补充信息输入所述识别模型中,通过所述识别模型识别所述补充信息中包含的业务要素,并将所述补充信息中包含的识别要素补充进所述举报信息包含的业务要素中;
根据预设的必要要素以及所述举报信息包含的业务要素判断所述举报信息是否存在缺失的必要要素;
若是,则重新根据所述举报信息当前缺失的必要要素,向所述用户发送提示消息。
可选地,所述识别模型至少包括提取层、预测层、标签层、输出层;
通过所述识别模型识别所述举报信息包含的业务要素,具体包括:
通过所述提取层,提取所述举报信息中每个字的文本特征;
通过所述预测层,根据所述文本特征预测所述举报信息中每个字对应于各必要要素的概率;
通过所述标签层,根据所述概率确定所述举报信息中每个字的要素标签;
通过所述输出层,根据所述举报信息中每个字的要素标签,输出所述举报信息中包含的业务要素。
可选地,预先训练识别模型,具体包括:
确定样本举报信息以及所述样本举报信息的标注;
将所述样本举报信息输入待训练的识别模型中;
通过所述提取层,提取所述样本举报信息中每个字的文本特征;
通过所述预测层,根据所述文本特征预测所述样本举报信息中每个字对应于各必要要素的概率;
通过所述标签层,根据所述概率输出所述样本举报信息中每个字的要素标签;
以所述要素标签与所述标注之间的差异最小为优化目标,对所述识别模型进行训练。
可选地,确定所述样本举报信息的标注,具体包括:
针对所述举报信息中的每个字,确定该字的真实要素标签;
以所述要素标签与所述标注之间的差异最小为优化目标,对所述识别模型进行训练,具体包括:
以所述识别模型输出的样本举报信息中每个字的要素标签与该字的真实要素标签之间的差异最小为优化目标,对所述识别模型进行训练。
本说明书提供了一种举报信息处理装置,包括:
接收模块,用于接收用户提交的举报信息;
输入模块,用于将所述举报信息输入预先训练的识别模型中,通过所述识别模型识别所述举报信息包含的业务要素;
确定模块,用于根据预设的必要要素以及所述举报信息包含的业务要素,确定所述举报信息缺失的必要要素;
发送模块,用于根据所述举报信息缺失的必要要素,向所述用户发送提示消息,使所述用户基于所述举报信息缺失的必要要素,对所述举报信息进行补充;
审理模块,用于将所述用户补充的补充信息以及所述举报信息,发送至审理设备,使所述审理设备根据所述补充信息以及所述举报信息进行举报审理。
本说明书提供了一种计算机可读存储介质,所述存储介质存储有计算机程序,所述计算机程序被处理器执行时实现上述举报信息处理方法。
本说明书提供了一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现上述举报信息处理方法。
本说明书采用的上述至少一个技术方案能够达到以下有益效果:
在本说明书提供的举报信息处理方法中,接收用户提交的举报信息;将所述举报信息输入预先训练的识别模型中,通过所述识别模型识别所述举报信息包含的业务要素;根据预设的必要要素以及所述举报信息包含的业务要素,确定所述举报信息缺失的必要要素;根据所述举报信息缺失的必要要素,向所述用户发送提示消息,使所述用户基于所述举报信息缺失的必要要素,对所述举报信息进行补充;将所述用户补充的补充信息以及所述举报信息,发送至审理设备,使所述审理设备根据所述补充信息以及所述举报信息进行举报审理。
附图说明
此处所说明的附图用来提供对本说明书的进一步理解,构成本说明书的一部分,本说明书的示意性实施例及其说明用于解释本说明书,并不构成对本说明书的不当限定。在附图中:
图1为本说明书中提供的一种举报信息处理方法的流程示意图;
图2为本说明书提供的一种识别模型的结构示意图;
图3为本说明书提供的一种举报信息处理装置的示意图;
图4为本说明书提供的一种对应于图1的电子设备示意图。
具体实施方式
目前,在大多数提供业务的平台上,用户对业务进行举报的方式为通过提交举报信息的方式来进行举报。用户可在举报流程开始后以文本的形式输入并提交举报信息至平台方,由平台方对用户提交的举报信息进行审理。
但实际上,由于种种原因,例如用户没有时间或是贪图方便等,在输入举报信息时输入的内容都非常简短;同时,用户输入的举报信息通常非常主观,大多数用户并不了解对举报信息进行审理的流程,在输入举报信息时很可能无法抓住重点。综合上述情况,目前平台方所接收到的举报信息通常都没有包含足够的有效信息,导致审理时非常困难,无法做出合理的应对。
为了解决上述问题,本说明书提供了一种更加有效地举报信息处理方法。
为使本说明书的目的、技术方案和优点更加清楚,下面将结合本说明书具体实施例及相应的附图对本说明书技术方案进行清楚、完整地描述。显然,所描述的实施例仅是本说明书一部分实施例,而不是全部的实施例。基于本说明书中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本说明书保护的范围。
以下结合附图,详细说明本说明书各实施例提供的技术方案。
图1为本说明书中提供的一种举报信息处理方法的流程示意图,包括以下步骤:
S100:接收用户提交的举报信息。
在本说明书中,用于实现举报信息处理方法的执行主体,可以指服务器等设置于业务平台的指定设备,为了便于描述,本说明书仅以服务器是执行主体为例,对本说明书提供的一种举报信息处理方法进行说明。
在对举报信息进行处理的过程中,首先需要接收用户提交的举报信息。用户可通过业务平台提供的软件/硬件中的举报功能来触发举报信息的输入,其中,用户可通过多种方式进行输入,包括但不限于语音、图像、文字等输入方式。无论用户以何种方式进行输入,在用户完成输入后,业务平台可对用户输入的内容进行识别处理,将用户输入的信息转化为文本形式的举报信息。
最终,可接收文本形式的举报信息,用于后续步骤中。
S102:将所述举报信息输入预先训练的识别模型中,通过所述识别模型识别所述举报信息包含的业务要素。
在本说明书提供的举报信息处理方法中,通过业务要素来判断一个举报信息是否完整。可以认为,当一个举报信息中包含全部指定的业务要素时,该举报信息才是完整的,就可以对该举报信息做出合理的审理;而如果一个举报信息中并不包含全部指定的业务要素,那么便可以认为该举报信息并不完整,无法根据该举报信息做出合理的应对。
实际上,一个业务要素可以看作对业务一方面的有效描述信息。在用户针对一个业务提交的举报信息中,包含的各业务要素便是对对业务各方面地描述信息。可以想到的,举报信息中包含的业务要素越多,对用户所举报的业务的描述就越清晰,越有利于平台方做出正确的处理。当用户提交的举报信息中包含了所有指定的业务要素时,平台方就能够对举报信息做出最合理的应对。
S104:根据预设的必要要素以及所述举报信息包含的业务要素,确定所述举报信息缺失的必要要素。
在本说明书提供的举报信息处理方法中,预设的必要要素可以是审理一个业务信息所必要的所有业务要素,也就是一个完整的举报信息应该包含的所有业务要素。可以想到的,在用户所举报的业务不同时,审理对应的举报信息中所需要的必要要素也可以是不同的。因此,针对不同的业务,可以预设不同的必要要素。
举例来说,假如用户针对一次交易业务发起举报时,那么用户所提交的举报信息中包含的业务要素就应该是对该交易业务的各方面的描述。此时,预设的必要要素可至少包括交易对象、交易地点、交易目的、交流平台、高危操作等业务要素中的一种。同样的,针对其它不同的业务,也会预设其它不同的必要要素,在此不再进行一一举例。
在接收到用户提交的举报信息时,根据用户所举报的业务,便能够随之确定预设的必要要素。此时,根据预设的必要要素以及步骤S104中确定出的举报信息包含的业务要素,可以确定出举报信息中缺失的业务要素。具体的,可针对预设的每个必要要素,判断所述举报信息包含的业务要素中是否存在该必要要素;若不存在,则确定所述业务信息缺失该必要要素。
仍以交易业务为例,假设用户针对一项交易业务进行举报,该交易业务对应的预设的必要要素为交易对象、交易地点、交易目的。在接收到用户提交的举报信息后,通过识别模型识别出举报信息中包含了交易对象和交易地点这两个业务要素。此时,对预设的每个必要要素进行分别进行判断后,可以确定举报信息中存在交易对象和交易地点,但不存在交易目的。那么便能够得知业务信息中缺少交易目的这一业务要素。
S106:根据所述举报信息缺失的必要要素,向所述用户发送提示消息,使所述用户基于所述举报信息缺失的必要要素,对所述举报信息进行补充。
在用户提交的举报信息中存在缺失的业务要素的情况下,后续无法对举报信息进行有效的审理,因此需要用户对缺失的业务要素进行补充。根据步骤S104中确定出的业务信息中缺失的业务要素,可通过向用户发送提示消息的形式,提示用户对举报信息中缺失的业务要素进行补充。
向用户发送提示消息时,可采用多种不同的话术,达到使用户对业务要素进行补充的目的。例如,在上例中,用户提交的举报信息中缺失交易目的这一要素时,提示消息中包含的文本信息可以是“请您补充交易目的”。同样的,也可采用其它话术,结合举报信息中缺失的业务要素,达到提示用户对缺失的业务要素进行补充的目的,本说明书在此不再进行赘述。
在向用户发送提示消息后,用户的终端在接收提示消息并展示给用户的同时,还会向用户展示相应的输入窗口,使用户在输入窗口内输入针对缺失的业务要素进行补充的补充信息。在用户输入完毕并再次提交后,平台方可接收用户提交的补充信息,并将补充信息再次输入到识别模型中,使识别模型识别补充信息中包含的业务要素。随后,可将补充信息包含的业务要素作为一部分加入到举报信息包含的业务要素中,并重新根据预设的业务要素判断举报信息是否存在缺失的业务要素。
具体的,可接收所述用户补充的补充信息;将所述补充信息输入所述识别模型中,通过所述识别模型识别所述补充信息中包含的业务要素,并将所述补充信息中包含的识别要素补充进所述举报信息包含的业务要素中;根据预设的必要要素以及所述举报信息包含的业务要素判断所述举报信息是否存在缺失的必要要素;若是,则重新根据所述举报信息当前缺失的必要要素,向所述用户发送提示消息。
如果判断结果为是,也就是依然存在缺失的业务要素,那么便根据重新确定出的缺失的业务要素,再次给用户发送提示信息,重复上述步骤直到举报信息中不再存在缺失的业务要素为止;而当判断结果为否,也就是已经不存在缺失的业务要素后,便可以对举报信息进行后续的审理。
S108:将所述用户补充的补充信息以及所述举报信息,发送至审理设备,使所述审理设备根据所述补充信息以及所述举报信息进行举报审理。
在举报信息中包含了所有预设的业务要素后,可认为针对用户所举报的业务,用户提交的举报信息能够清晰地描述所有需要的业务信息。也就是说,可以根据用户提交的举报信息以及补充信息做出合理的举报审理。
通常情况下,提供业务的业务平台会额外设有用于对举报信息进行审理的审理设备,因此,当采用本说明书提供的举报信息处理方法判断用户提交的举报信息以及补充信息中不再缺失业务要素时,便可将用户提交的举报信息以及补充信息发送至审理设备,以使审理设备进行后续的审理。
值得一提的是,在对举报信息以及补充信息进行审理时,除了上述采用设备进行审理的方式,也可以采用人工审理的方式,本说明书对此不做具体限制。
在采用本说明书提供的举报信息处理方法对用户提交的举报信息进行处理时,可采用识别模型识别出举报信息中包含的业务要素,并判断举报信息是否存在缺失的业务要素,并以此向用户发送提示信息,使用户对缺失的业务要素做出补充。通过本说明书提供的举报信息处理方法可有效避免用户提交的举报信息中包含的有效信息过少的情况,使后续能够做出合理、准确的审理。
额外需要考虑的是,在实际应用中可能会出现在识别模型识别出用户提交的举报信息包含的业务要素后,判断出举报信息中并不存在任何缺失的业务要素的情况。此时,可认为用户提交的举报信息内容已经足够完整,无需进行任何补充。此时,可直接对举报信息进行审理。具体的,当所述举报信息不存在缺失的必要要素时,可将所述举报信息,发送至审理设备,使所述审理设备根据所述举报信息进行举报审理。
在本说明书提供的举报信息处理方法中,采用的识别模型可以是任何具有识别功能的模型。其中,识别模型中可至少包括提取层、预测层、标签层、输出层。识别模型的结构可如图2所示。
在采用识别模型识别举报信息中的业务要素时,可通过所述提取层,提取所述举报信息中每个字的文本特征;通过所述预测层,根据所述文本特征预测所述举报信息中每个字对应于各必要要素的概率;通过所述标签层,根据所述概率确定所述举报信息中每个字的要素标签;通过所述输出层,根据所述举报信息中每个字的要素标签,输出所述举报信息中包含的业务要素。
实际上,每个业务要素在文本信息中的表现形式均为一个实体,也就是一个具体的词。仍以交易业务的业务要素为例,在交易业务对应的各业务要素中,交易地点对应的实体可能是北京、上海、广州等词;交易目的对应的实体可能是租房、买车、抽奖、兼职等词;交易对象可以是个人或组织的名称等词。因此,识别模型识别举报信息中包含的业务要素,实际上就是识别模型在举报信息中寻找各业务要素对应的实体。
在本说明书提供的举报信息处理方法中,识别模型可根据举报信息中的每个字的文本特征来识别举报信息中包含的实体。在提取举报信息中每个字的文本特征时,提取层中的结构可根据需求进行任意设置,例如提取层可包含若干卷积层、双向长短期记忆(LongShort-Term Memory,LSTM)层等网络层,或可直接采用BERT模型作为提取层进行使用,本说明书对此不做限制。
在提取出各字的文本特征后,可通过识别模型中的预测层预测举报信息中每个字位于各业务要素对应的实体中不同位置的概率。在本说明书提供的举报信息处理方法采用的识别模型中,采用BIO三位标注的方式对模型进行训练,并相应的应用于实际预测中。针对每个字,预测层均会输出该字位于各业务要素对应的实体中不同位置的概率。其中,B(Begin)表示一个实体的开头,也就是一个实体的第一个字;I(Inside)实体内部,也就是一个实体中除第一个字以外的其它字;O(Outside)实体外部,也就是不属于任何实体的字。
值得一提的是,由于每个不同的业务所对应的业务要素也都是不同的,因此为了实现更好的识别效果,可针对每个业务训练出不同的识别模型,并应用于对应业务的举报信息包含的业务要素的识别中。
举例来说,假设预设的必要要素包括交易对象、交易地点、交易目的这三个业务要素,那么识别模型经过训练后,便能够在举报信息中分别识别交易对象、交易地点、交易目的这三个业务要素对应的实体。当识别模型完成对举报信息中每个字的文本特征的提取后,在预测层中,会分别输出每个字位于各交易对象、交易地点、交易目的对应的实体中不同位置的概率。在上述实施例中识别模型的预测层的输出可如表1所示。
表1为识别模型的预测层输出的举报信息中的一个字位于各业务要素对应的实体中不同位置的概率。可以看出,对于举报信息中的一个字,针对每个业务要素,预测层均会给出该字处于该业务要素对应的实体的开头以及内部的概率,并给出该字不属于任何业务要素对应的实体的概率。例如,在表1中,该字位于交易对象对应的实体的开头的概率为0.27,位于交易对象的实体的内部的概率为0.40;位于交易地点对应的实体的开头的概率为0.19,位于交易地点的实体的内部的概率为0.31;位于交易目的对应的实体的开头的概率为0.08,位于交易目的的实体的内部的概率为0.22;而该字不属于任何业务要素对应的实体的概率为0.65。
需要注意的是,预测层输出的各概率之间不存在任何关联关系,每个概率均为根据文本特征单独计算出的概率。
在确定出举报信息中的每个字位于各业务要素对应的实体中不同位置的概率后,识别模型的标签层可根据得到的概率来确定举报信息中每个字的要素标签。实际上,一个字要素标签所表达的就是该字所对应的业务要素以及在实体中的位置。要素标签的形式可表示为业务要素与BIO元素的组合,例如,在表1对应的实施例中,要素标签可以包括“B-交易对象”、“I-交易对象”、 “B-交易地点”、“I-交易地点”、 “B-交易目的”、“I-交易目的”、“O”。
在确定要素标签时,标签层针对举报信息中的每个字,在该字位于各业务要素对应的实体中不同位置的概率中,选取最高的概率所对应的要素标签,作为该字的要素标签。
可以看出,要素标签可以表达出一个字所属的业务要素对应的实体,以及该字在实体中的位置。由此,识别模型的输出层可根据举报信息中每个字的要素标签,识别出举报信息中与各业务要素对应的实体,进而确定出举报信息中包含的各业务要素。
具体的,输出层可针对每个业务要素,在举报信息中寻找是否存在与该要素对应的要素标签;当存在时,可认为举报信息中包含该业务要素。
额外的,本说明书所提供的举报信息处理方法中采用的识别模型可以预先进行训练。具体的,可确定样本举报信息以及所述样本举报信息的标注;将所述样本举报信息输入待训练的识别模型中;通过所述提取层,提取所述样本举报信息中每个字的文本特征;通过所述预测层,根据所述文本特征预测所述样本举报信息中每个字存在于各业务要素对应的实体中的概率;通过所述标签层,根据所述概率输出所述样本举报信息中每个字的要素标签;以所述要素标签与所述标注之间的差异最小为优化目标,对所述识别模型进行训练。
其中,样本举报信息可以是从用户提交的举报信息中选取的任意举报信息,而在确定样本举报信息对应的标注时,确定的为样本举报信息中每个字的要素标签。具体的,可针对所述举报信息中的每个字,确定该字的真实要素标签。在对识别模型进行训练时,可以所述识别模型输出的样本举报信息中每个字的要素标签与该字的真实要素标签之间的差异最小为优化目标,对所述识别模型进行训练。
值得一提的是,由于识别模型中的输出层为根据具体的规则来进行识别与输出的,因此可不参与训练,直接进行使用。当识别模型的标签层能够准确地确定出举报信息中每个字的要素标签时,输出层便能够准确地输出举报信息中包含的业务要素。
以上为本说明书的一个或多个实施举报信息处理的方法,基于同样的思路,本说明书还提供了相应的举报信息处理装置,如图3所示。
图3为本说明书提供的一种举报信息处理装置的示意图,包括:
接收模块200,用于接收用户提交的举报信息;
输入模块202,用于将所述举报信息输入预先训练的识别模型中,通过所述识别模型识别所述举报信息包含的业务要素;
确定模块204,用于根据预设的必要要素以及所述举报信息包含的业务要素,确定所述举报信息缺失的必要要素;
发送模块206,用于根据所述举报信息缺失的必要要素,向所述用户发送提示消息,使所述用户基于所述举报信息缺失的必要要素,对所述举报信息进行补充;
审理模块208,用于将所述用户补充的补充信息以及所述举报信息,发送至审理设备,使所述审理设备根据所述补充信息以及所述举报信息进行举报审理。
可选地,所述确定模块204,具体用于针对预设的每个必要要素,判断所述举报信息包含的业务要素中是否存在该必要要素;若不存在,则确定所述业务信息缺失该必要要素。
可选地,所述装置还包括直审模块210,具体用于当所述举报信息不存在缺失的必要要素时,将所述举报信息,发送至审理设备,使所述审理设备根据所述举报信息进行举报审理。
可选地,所述装置还包括判断模块212,具体用于接收所述用户补充的补充信息;将所述补充信息输入所述识别模型中,通过所述识别模型识别所述补充信息中包含的业务要素,并将所述补充信息中包含的识别要素补充进所述举报信息包含的业务要素中;根据预设的必要要素以及所述举报信息包含的业务要素判断所述举报信息是否存在缺失的必要要素;若是,则重新根据所述举报信息当前缺失的必要要素,向所述用户发送提示消息。
可选地,所述识别模型至少包括提取层、预测层、标签层、输出层;
所述输入模块202,具体用于通过所述提取层,提取所述举报信息中每个字的文本特征;通过所述预测层,根据所述文本特征预测所述举报信息中每个字对应于各必要要素的概率;通过所述标签层,根据所述概率确定所述举报信息中每个字的要素标签;通过所述输出层,根据所述举报信息中每个字的要素标签,输出所述举报信息中包含的业务要素。
可选地,所述装置还包括训练模块214,具体用于确定样本举报信息以及所述样本举报信息的标注;将所述样本举报信息输入待训练的识别模型中;通过所述提取层,提取所述样本举报信息中每个字的文本特征;通过所述预测层,根据所述文本特征预测所述样本举报信息中每个字对应于各必要要素的概率;通过所述标签层,根据所述概率输出所述样本举报信息中每个字的要素标签;以所述要素标签与所述标注之间的差异最小为优化目标,对所述识别模型进行训练。
可选地,所述训练模块214,具体用于针对所述举报信息中的每个字,确定该字的真实要素标签;以所述识别模型输出的样本举报信息中每个字的要素标签与该字的真实要素标签之间的差异最小为优化目标,对所述识别模型进行训练。
本说明书还提供了一种计算机可读存储介质,该存储介质存储有计算机程序,计算机程序可用于执行上述图1提供的一种举报信息处理方法。
本说明书还提供了图4所示的一种对应于图1的电子设备的示意结构图。如图4所述,在硬件层面,该电子设备包括处理器、内部总线、网络接口、内存以及非易失性存储器,当然还可能包括其他业务所需要的硬件。处理器从非易失性存储器中读取对应的计算机程序到内存中然后运行,以实现上述图1所述的举报信息处理方法。当然,除了软件实现方式之外,本说明书并不排除其他实现方式,比如逻辑器件抑或软硬件结合的方式等等,也就是说以下处理流程的执行主体并不限定于各个逻辑单元,也可以是硬件或逻辑器件。
在20世纪90年代,对于一个技术的改进可以很明显地区分是硬件上的改进(例如,对二极管、晶体管、开关等电路结构的改进)还是软件上的改进(对于方法流程的改进)。然而,随着技术的发展,当今的很多方法流程的改进已经可以视为硬件电路结构的直接改进。设计人员几乎都通过将改进的方法流程编程到硬件电路中来得到相应的硬件电路结构。因此,不能说一个方法流程的改进就不能用硬件实体模块来实现。例如,可编程逻辑器件(Programmable Logic Device, PLD)(例如现场可编程门阵列(Field Programmable GateArray,FPGA))就是这样一种集成电路,其逻辑功能由用户对器件编程来确定。由设计人员自行编程来把一个数字系统“集成”在一片PLD上,而不需要请芯片制造厂商来设计和制作专用的集成电路芯片。而且,如今,取代手工地制作集成电路芯片,这种编程也多半改用“逻辑编译器(logic compiler)”软件来实现,它与程序开发撰写时所用的软件编译器相类似,而要编译之前的原始代码也得用特定的编程语言来撰写,此称之为硬件描述语言(Hardware Description Language,HDL),而HDL也并非仅有一种,而是有许多种,如ABEL(Advanced Boolean Expression Language)、AHDL(Altera Hardware DescriptionLanguage)、Confluence、CUPL(Cornell University Programming Language)、HDCal、JHDL(Java Hardware Description Language)、Lava、Lola、MyHDL、PALASM、RHDL(RubyHardware Description Language)等,目前最普遍使用的是VHDL(Very-High-SpeedIntegrated Circuit Hardware Description Language)与Verilog。本领域技术人员也应该清楚,只需要将方法流程用上述几种硬件描述语言稍作逻辑编程并编程到集成电路中,就可以很容易得到实现该逻辑方法流程的硬件电路。
控制器可以按任何适当的方式实现,例如,控制器可以采取例如微处理器或处理器以及存储可由该(微)处理器执行的计算机可读程序代码(例如软件或固件)的计算机可读介质、逻辑门、开关、专用集成电路(Application Specific Integrated Circuit,ASIC)、可编程逻辑控制器和嵌入微控制器的形式,控制器的例子包括但不限于以下微控制器:ARC 625D、Atmel AT91SAM、Microchip PIC18F26K20 以及Silicone Labs C8051F320,存储器控制器还可以被实现为存储器的控制逻辑的一部分。本领域技术人员也知道,除了以纯计算机可读程序代码方式实现控制器以外,完全可以通过将方法步骤进行逻辑编程来使得控制器以逻辑门、开关、专用集成电路、可编程逻辑控制器和嵌入微控制器等的形式来实现相同功能。因此这种控制器可以被认为是一种硬件部件,而对其内包括的用于实现各种功能的装置也可以视为硬件部件内的结构。或者甚至,可以将用于实现各种功能的装置视为既可以是实现方法的软件模块又可以是硬件部件内的结构。
上述实施例阐明的系统、装置、模块或单元,具体可以由计算机芯片或实体实现,或者由具有某种功能的产品来实现。一种典型的实现设备为计算机。具体的,计算机例如可以为个人计算机、膝上型计算机、蜂窝电话、相机电话、智能电话、个人数字助理、媒体播放器、导航设备、电子邮件设备、游戏控制台、平板计算机、可穿戴设备或者这些设备中的任何设备的组合。
为了描述的方便,描述以上装置时以功能分为各种单元分别描述。当然,在实施本说明书时可以把各单元的功能在同一个或多个软件和/或硬件中实现。
本领域内的技术人员应明白,本说明书的实施例可提供为方法、系统、或计算机程序产品。因此,本说明书可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本说明书可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本说明书是参照根据本说明书实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
在一个典型的配置中,计算设备包括一个或多个处理器(CPU)、输入/输出接口、网络接口和内存。
内存可能包括计算机可读介质中的非永久性存储器,随机存取存储器(RAM)和/或非易失性内存等形式,如只读存储器(ROM)或闪存(flash RAM)。内存是计算机可读介质的示例。
计算机可读介质包括永久性和非永久性、可移动和非可移动媒体可以由任何方法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序的模块或其他数据。计算机的存储介质的例子包括,但不限于相变内存(PRAM)、静态随机存取存储器(SRAM)、动态随机存取存储器(DRAM)、其他类型的随机存取存储器(RAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、快闪记忆体或其他内存技术、只读光盘只读存储器(CD-ROM)、数字多功能光盘(DVD)或其他光学存储、磁盒式磁带,磁带磁磁盘存储或其他磁性存储设备或任何其他非传输介质,可用于存储可以被计算设备访问的信息。按照本文中的界定,计算机可读介质不包括暂存电脑可读媒体(transitory media),如调制的数据信号和载波。
还需要说明的是,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、商品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、商品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、商品或者设备中还存在另外的相同要素。
本领域技术人员应明白,本说明书的实施例可提供为方法、系统或计算机程序产品。因此,本说明书可采用完全硬件实施例、完全软件实施例或结合软件和硬件方面的实施例的形式。而且,本说明书可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本说明书可以在由计算机执行的计算机可执行指令的一般上下文中描述,例如程序模块。一般地,程序模块包括执行特定任务或实现特定抽象数据类型的例程、程序、对象、组件、数据结构等等。也可以在分布式计算环境中实践本说明书,在这些分布式计算环境中,由通过通信网络而被连接的远程处理设备来执行任务。在分布式计算环境中,程序模块可以位于包括存储设备在内的本地和远程计算机存储介质中。
本说明书中的各个实施例均采用递进的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。尤其,对于系统实施例而言,由于其基本相似于方法实施例,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
以上所述仅为本说明书的实施例而已,并不用于限制本说明书。对于本领域技术人员来说,本说明书可以有各种更改和变化。凡在本说明书的精神和原理之内所作的任何修改、等同替换、改进等,均应包含在本说明书的权利要求范围之内。

Claims (16)

1.一种举报信息处理方法,包括:
接收用户提交的举报信息;
将所述举报信息输入预先训练的识别模型中,通过所述识别模型识别所述举报信息包含的业务要素;
根据预设的必要要素以及所述举报信息包含的业务要素,确定所述举报信息缺失的必要要素;
根据所述举报信息缺失的必要要素,向所述用户发送提示消息,使所述用户基于所述举报信息缺失的必要要素,对所述举报信息进行补充;
将所述用户补充的补充信息以及所述举报信息,发送至审理设备,使所述审理设备根据所述补充信息以及所述举报信息进行举报审理。
2.如权利要求1所述的方法,根据预设的必要要素以及所述举报信息包含的业务要素,确定所述举报信息缺失的必要要素,具体包括:
针对预设的每个必要要素,判断所述举报信息包含的业务要素中是否存在该必要要素;
若不存在,则确定所述业务信息缺失该必要要素。
3.如权利要求1所述的方法,在向所述用户发送提示消息之前,所述方法还包括:
当所述举报信息不存在缺失的必要要素时,将所述举报信息,发送至审理设备,使所述审理设备根据所述举报信息进行举报审理。
4.如权利要求1所述的方法,在将所述用户补充的补充信息以及所述举报信息,发送至审理设备之前,所述方法还包括:
接收所述用户补充的补充信息;
将所述补充信息输入所述识别模型中,通过所述识别模型识别所述补充信息中包含的业务要素,并将所述补充信息中包含的识别要素补充进所述举报信息包含的业务要素中;
根据预设的必要要素以及所述举报信息包含的业务要素判断所述举报信息是否存在缺失的必要要素;
若是,则重新根据所述举报信息当前缺失的必要要素,向所述用户发送提示消息。
5.如权利要求1所述的方法,所述识别模型至少包括提取层、预测层、标签层、输出层;
通过所述识别模型识别所述举报信息包含的业务要素,具体包括:
通过所述提取层,提取所述举报信息中每个字的文本特征;
通过所述预测层,根据所述文本特征预测所述举报信息中每个字对应于各必要要素的概率;
通过所述标签层,根据所述概率确定所述举报信息中每个字的要素标签;
通过所述输出层,根据所述举报信息中每个字的要素标签,输出所述举报信息中包含的业务要素。
6.如权利要求5所述的方法,预先训练识别模型,具体包括:
确定样本举报信息以及所述样本举报信息的标注;
将所述样本举报信息输入待训练的识别模型中;
通过所述提取层,提取所述样本举报信息中每个字的文本特征;
通过所述预测层,根据所述文本特征预测所述样本举报信息中每个字对应于各必要要素的概率;
通过所述标签层,根据所述概率输出所述样本举报信息中每个字的要素标签;
以所述要素标签与所述标注之间的差异最小为优化目标,对所述识别模型进行训练。
7.如权利要求6所述的方法,确定所述样本举报信息的标注,具体包括:
针对所述举报信息中的每个字,确定该字的真实要素标签;
以所述要素标签与所述标注之间的差异最小为优化目标,对所述识别模型进行训练,具体包括:
以所述识别模型输出的样本举报信息中每个字的要素标签与该字的真实要素标签之间的差异最小为优化目标,对所述识别模型进行训练。
8.一种举报信息处理装置,包括:
接收模块,用于接收用户提交的举报信息;
输入模块,用于将所述举报信息输入预先训练的识别模型中,通过所述识别模型识别所述举报信息包含的业务要素;
确定模块,用于根据预设的必要要素以及所述举报信息包含的业务要素,确定所述举报信息缺失的必要要素;
发送模块,用于根据所述举报信息缺失的必要要素,向所述用户发送提示消息,使所述用户基于所述举报信息缺失的必要要素,对所述举报信息进行补充;
审理模块,用于将所述用户补充的补充信息以及所述举报信息,发送至审理设备,使所述审理设备根据所述补充信息以及所述举报信息进行举报审理。
9.如权利要求8所述的装置,所述确定模块,具体用于针对预设的每个必要要素,判断所述举报信息包含的业务要素中是否存在该必要要素;若不存在,则确定所述业务信息缺失该必要要素。
10.如权利要求8所述的装置,所述装置还包括直审模块,具体用于当所述举报信息不存在缺失的必要要素时,将所述举报信息,发送至审理设备,使所述审理设备根据所述举报信息进行举报审理。
11.如权利要求8所述的装置,所述装置还包括判断模块,具体用于接收所述用户补充的补充信息;将所述补充信息输入所述识别模型中,通过所述识别模型识别所述补充信息中包含的业务要素,并将所述补充信息中包含的识别要素补充进所述举报信息包含的业务要素中;根据预设的必要要素以及所述举报信息包含的业务要素判断所述举报信息是否存在缺失的必要要素;若是,则重新根据所述举报信息当前缺失的必要要素,向所述用户发送提示消息。
12.如权利要求8所述的装置,所述识别模型至少包括提取层、预测层、标签层、输出层;
所述输入模块,具体用于通过所述提取层,提取所述举报信息中每个字的文本特征;通过所述预测层,根据所述文本特征预测所述举报信息中每个字对应于各必要要素的概率;通过所述标签层,根据所述概率确定所述举报信息中每个字的要素标签;通过所述输出层,根据所述举报信息中每个字的要素标签,输出所述举报信息中包含的业务要素。
13.如权利要求12所述的装置,所述装置还包括训练模块,具体用于确定样本举报信息以及所述样本举报信息的标注;将所述样本举报信息输入待训练的识别模型中;通过所述提取层,提取所述样本举报信息中每个字的文本特征;通过所述预测层,根据所述文本特征预测所述样本举报信息中每个字对应于各必要要素的概率;通过所述标签层,根据所述概率输出所述样本举报信息中每个字的要素标签;以所述要素标签与所述标注之间的差异最小为优化目标,对所述识别模型进行训练。
14.如权利要求13所述的装置,所述训练模块,具体用于针对所述举报信息中的每个字,确定该字的真实要素标签;以所述识别模型输出的样本举报信息中每个字的要素标签与该字的真实要素标签之间的差异最小为优化目标,对所述识别模型进行训练。
15.一种计算机可读存储介质,所述存储介质存储有计算机程序,所述计算机程序被处理器执行时实现上述权利要求1~7任一项所述的方法。
16.一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现上述权利要求1~7任一项所述的方法。
CN202310164788.9A 2023-02-13 2023-02-13 一种举报信息处理方法、装置、存储介质及电子设备 Pending CN116091004A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202310164788.9A CN116091004A (zh) 2023-02-13 2023-02-13 一种举报信息处理方法、装置、存储介质及电子设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202310164788.9A CN116091004A (zh) 2023-02-13 2023-02-13 一种举报信息处理方法、装置、存储介质及电子设备

Publications (1)

Publication Number Publication Date
CN116091004A true CN116091004A (zh) 2023-05-09

Family

ID=86206440

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202310164788.9A Pending CN116091004A (zh) 2023-02-13 2023-02-13 一种举报信息处理方法、装置、存储介质及电子设备

Country Status (1)

Country Link
CN (1) CN116091004A (zh)

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108920460A (zh) * 2018-06-26 2018-11-30 武大吉奥信息技术有限公司 一种多类型实体识别的多任务深度学习模型的训练方法及装置
CN111930288A (zh) * 2020-08-14 2020-11-13 中国工商银行股份有限公司 交互式业务处理方法及系统
CN113064992A (zh) * 2021-03-22 2021-07-02 平安银行股份有限公司 投诉工单结构化处理方法、装置、设备及存储介质
CN114238622A (zh) * 2021-12-20 2022-03-25 浙江大华技术股份有限公司 关键信息的提取方法和装置、存储介质及电子装置

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108920460A (zh) * 2018-06-26 2018-11-30 武大吉奥信息技术有限公司 一种多类型实体识别的多任务深度学习模型的训练方法及装置
CN111930288A (zh) * 2020-08-14 2020-11-13 中国工商银行股份有限公司 交互式业务处理方法及系统
CN113064992A (zh) * 2021-03-22 2021-07-02 平安银行股份有限公司 投诉工单结构化处理方法、装置、设备及存储介质
CN114238622A (zh) * 2021-12-20 2022-03-25 浙江大华技术股份有限公司 关键信息的提取方法和装置、存储介质及电子装置

Similar Documents

Publication Publication Date Title
CN109841212B (zh) 分析具有多个意图的命令的语音识别系统和语音识别方法
CN115033676B (zh) 一种意图识别模型训练及用户意图识别方法及装置
CN110415679B (zh) 语音纠错方法、装置、设备和存储介质
CN113221555B (zh) 一种基于多任务模型的关键词识别方法、装置及设备
CN112036162A (zh) 文本纠错的适配方法、装置、电子设备及存储介质
CN115545002B (zh) 一种模型训练和业务处理的方法、装置、存储介质及设备
CN109299276B (zh) 一种将文本转化为词嵌入、文本分类方法和装置
CN115203394A (zh) 一种模型训练的方法、业务执行的方法及装置
CN112417093B (zh) 一种模型训练的方法及装置
CN115759122A (zh) 一种意图识别方法、装置、设备及可读存储介质
CN115578570A (zh) 图像处理方法、装置、可读介质及电子设备
CN112380876A (zh) 基于多语言机器翻译模型的翻译方法、装置、设备和介质
CN115455166A (zh) 一种智能对话系统异常检测的方法、装置、介质及设备
CN112735407B (zh) 一种对话处理方法及装置
CN117093862A (zh) 一种模型训练的方法、装置、电子设备及存储介质
CN116541494A (zh) 模型训练方法、回复信息的方法、装置、设备及介质
CN116091004A (zh) 一种举报信息处理方法、装置、存储介质及电子设备
CN117035695B (zh) 一种信息预警的方法、装置、可读存储介质以及电子设备
CN116340852B (zh) 一种模型训练、业务风控的方法及装置
CN115658891B (zh) 一种意图识别的方法、装置、存储介质及电子设备
CN117313739A (zh) 一种语言模型的训练方法、装置、设备及存储介质
CN115730233B (zh) 一种数据处理方法、装置、可读存储介质以及电子设备
CN117076650B (zh) 一种基于大语言模型的智能对话方法、装置、介质及设备
CN114385779B (zh) 一种应急调度指令执行方法、装置及电子设备
CN116578877B (zh) 一种模型训练及二次优化打标的风险识别的方法及装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination