CN112508311A - 用于危险性预测的数据处理方法及装置 - Google Patents
用于危险性预测的数据处理方法及装置 Download PDFInfo
- Publication number
- CN112508311A CN112508311A CN202110157302.XA CN202110157302A CN112508311A CN 112508311 A CN112508311 A CN 112508311A CN 202110157302 A CN202110157302 A CN 202110157302A CN 112508311 A CN112508311 A CN 112508311A
- Authority
- CN
- China
- Prior art keywords
- corpus data
- corpus
- query
- risk
- robot
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000003672 processing method Methods 0.000 title claims abstract description 22
- 238000000034 method Methods 0.000 claims description 27
- 238000002372 labelling Methods 0.000 claims description 24
- 230000015654 memory Effects 0.000 claims description 17
- 238000012545 processing Methods 0.000 claims description 15
- 238000012549 training Methods 0.000 claims description 9
- 238000004364 calculation method Methods 0.000 claims description 8
- 230000004044 response Effects 0.000 claims description 8
- 238000004590 computer program Methods 0.000 claims description 5
- 230000008569 process Effects 0.000 description 9
- 230000003993 interaction Effects 0.000 description 6
- 206010010144 Completed suicide Diseases 0.000 description 4
- 238000007418 data mining Methods 0.000 description 4
- 238000005516 engineering process Methods 0.000 description 4
- 239000000463 material Substances 0.000 description 4
- 238000012544 monitoring process Methods 0.000 description 4
- 238000004891 communication Methods 0.000 description 2
- 238000010586 diagram Methods 0.000 description 2
- 230000006870 function Effects 0.000 description 2
- 230000006872 improvement Effects 0.000 description 2
- 230000010365 information processing Effects 0.000 description 2
- 238000005065 mining Methods 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 239000007787 solid Substances 0.000 description 2
- 238000003491 array Methods 0.000 description 1
- 238000004140 cleaning Methods 0.000 description 1
- 230000000052 comparative effect Effects 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 230000000994 depressogenic effect Effects 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 230000008451 emotion Effects 0.000 description 1
- 239000000835 fiber Substances 0.000 description 1
- 230000009191 jumping Effects 0.000 description 1
- 238000010295 mobile communication Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000005215 recombination Methods 0.000 description 1
- 230000006798 recombination Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/04—Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/332—Query formulation
- G06F16/3329—Natural language query formulation or dialogue systems
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/30—Semantic analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/10—Services
- G06Q50/26—Government or public services
Landscapes
- Engineering & Computer Science (AREA)
- Business, Economics & Management (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Tourism & Hospitality (AREA)
- Economics (AREA)
- Human Resources & Organizations (AREA)
- Strategic Management (AREA)
- General Engineering & Computer Science (AREA)
- Mathematical Physics (AREA)
- Computational Linguistics (AREA)
- Marketing (AREA)
- General Business, Economics & Management (AREA)
- General Health & Medical Sciences (AREA)
- Development Economics (AREA)
- Artificial Intelligence (AREA)
- Health & Medical Sciences (AREA)
- Entrepreneurship & Innovation (AREA)
- Primary Health Care (AREA)
- Educational Administration (AREA)
- Human Computer Interaction (AREA)
- Quality & Reliability (AREA)
- Operations Research (AREA)
- Data Mining & Analysis (AREA)
- Databases & Information Systems (AREA)
- Game Theory and Decision Science (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本公开一种用于危险性预测的数据处理方法及装置,首先服务端在接收到机器人发送的危险性预测请求之后,向机器人发送与服刑相关的问询语料数据,以使机器人在向服刑人员播报所述问询语料数据时,接收服刑人员输入的与问询语料数据相对应的答复语料数据;在获取到与问询语料数据相对应的答复语料数据后,将答复语料数据输入至预先训练的语义识别网络模型中,以使语义识别网络模型识别得到包含目标特征信息的目标答复语料数据;基于为问询语料预配置的权重值、以及目标答复语料数据中目标特征信息预关联的数值,确定服刑人员在各个预设危险性指标下危险性的数值。能够对服刑人员的危险性进行实时、快速预测提高了预测效率以及提高了预测准确度。
Description
技术领域
本公开涉及数据处理技术领域,具体涉及到一种用于危险性预测的数据处理方法及装置。
背景技术
危险性预测,指对服刑人员在未来一段时间内发生危机事件的可能性大小进行预测。例如,对服刑人员在未来一段时间内发生暴力、逃脱或自杀的可能性大小进行预测。
危险服刑人员,未来一段时间发生危机事件可能性大的服刑人员。
相关技术中,对服刑人员危险性预测效率低,且危险性预测不准确,造成无法对潜在的危险服刑人员及时发现。
发明内容
本公开的主要目的在于提供一种用于危险性预测的数据处理方法及装置,以解决对服刑人员危险性预测效率低,且危险性性预测不准确的技术问题。
为了实现上述目的,根据本公开的第一方面,提供了一种用于危险性预测的数据处理方法,包括:服务端在接收到机器人发送的危险性预测请求之后,向所述机器人发送与服刑相关的问询语料数据,以使所述机器人在向服刑人员播报所述问询语料数据时,接收服刑人员输入的与所述问询语料数据相对应的答复语料数据;在获取到与所述问询语料数据相对应的答复语料数据后,将所述答复语料数据输入至预先训练的语义识别网络模型中,以使所述语义识别网络模型识别得到包含目标特征信息的目标答复语料数据;基于为所述问询语料预配置的权重值、以及所述目标答复语料数据中目标特征信息预关联的数值,确定所述服刑人员在各个预设危险性指标下危险性的数值。
可选地,服务端在接收到机器人发送的危险性预测请求之后,向所述机器人发送与服刑相关的问询语料数据,以使所述机器人在向服刑人员播报所述问询语料数据时,接收服刑人员输入的与所述问询语料相对应的答复语料数据包括:服务端在接收到所述机器人发送的危险性预测请求之后,向所述机器人发送与服刑相关的第一问询语料,以使所述机器人在向服刑人员播报所述第一问询语料数据时,接收服刑人员输入的与所述第一问询语料相对应的第一答复语料数据;在接收到所述机器人发送的所述第一答复语料数据后,利用所述预先训练的语义识别网络模型,对所述第一答复语料数据进行语义识别,得到语义识别结果;如果所述语义识别结果满足预设条件,确定与所述语义识别结果相匹配的与服刑相关的第二问询语料数据;向所述机器人发送所述与服刑相关的第二问询语料数据,以使所述机器人在向服刑人员播报所述第二问询语料数据时,接收服刑人员输入的与所述第二问询语料数据相对应的第二答复语料数据。
可选地,根据以下步骤训练所述语义识别网络模型:对待训练语料数据进行标注,得到标注待训练语料,其中,所述对待训练语料数据进行标注包括:对所述待训练语料数据中可用于预测所述危险性大小的特征词进行标注;对所述待训练语料数据中的语序进行标注;基于所述标注待训练语料对所述语义识别网络进行训练。
可选地,在所述基于为所述问询语料预配置的权重值、以及所述目标答复语料数据中目标特征信息预关联的数值,确定所述服刑人员在多个预设危险性指标下危险性的数值之后,所述方法还包括:将所述服刑人员在各个预设危险性指标下危险性的数值加和,得到危险性的总值;将所述总值与预设的常模分数进行比对,得到比对结果;基于所述比对结果,确定所述服刑人员的危险性等级信息。
可选地,所述方法还包括方法还包括:发送所述危险性等级信息至目标用户端。
根据本公开的第二方面,提供了一种用于危险性预测的数据处理装置,包括:发送单元,被配置成服务端在接收到机器人发送的危险性预测请求之后,向所述机器人发送与服刑相关的问询语料数据,以使所述机器人在向服刑人员播报所述问询语料数据时,接收服刑人员输入的与所述问询语料数据相对应的答复语料数据;处理单元,被配置成在获取到与所述问询语料数据相对应的答复语料数据后,将所述答复语料数据输入至预先训练的语义识别网络模型中,以使所述语义识别网络模型识别得到包含目标特征信息的目标答复语料数据;确定单元,被配置成基于为所述问询语料预配置的权重值、以及所述目标答复语料数据中目标特征信息预关联的数值,确定所述服刑人员在各个预设危险性指标下危险性的数值。
可选地,根据以下步骤训练所述语义识别网络模型:对待训练语料数据进行标注,得到标注待训练语料,其中,所述对待训练语料数据进行标注包括:对所述待训练语料数据中可用于预测所述危险性大小的特征词进行标注;对所述待训练语料数据中的语序进行标注;基于所述标注待训练语料对所述语义识别网络进行训练。
可选地,装置还包括:计算单元,被配置成将所述服刑人员在各个预设危险性指标下危险性的数值加和,得到危险性的总值;比对单元,被配置成将所述总值与预设的常模分数进行比对,得到比对结果;危险性等级确定单元,被配置成基于所述比对结果,确定所述服刑人员的危险性等级信息。
根据本公开的第三方面,提供了一种计算机可读存储介质,存储有计算机指令,所述计算机指令用于使所述计算机执行权利要求第一方面任意一项实施例所述的用于危险性预测的数据处理方法。
根据本公开的第四方面,提供了一种电子设备,包括:至少一个处理器;以及与所述至少一个处理器通信连接的存储器;其中,所述存储器存储有可被所述至少一个处理器执行的计算机程序,所述计算机程序被所述至少一个处理器执行,以使所述至少一个处理器执行第一方面任意一项实施例所述的用于危险性预测的数据处理方法。
在本公开实施例用于危险性预测的数据处理方法及装置,服务端在接收到机器人发送的危险性预测请求之后,向机器人发送与服刑相关的问询语料数据,以使机器人在向服刑人员播报所述问询语料数据时,接收服刑人员输入的与问询语料数据相对应的答复语料数据;在获取到与问询语料数据相对应的答复语料数据后,将答复语料数据输入至预先训练的语义识别网络模型中,以使语义识别网络模型识别得到包含目标特征信息的目标答复语料数据;基于为问询语料预配置的权重值、以及目标答复语料数据中目标特征信息预关联的数值,确定服刑人员在各个预设危险性指标下危险性的数值。通过语音交互的方式获取服刑人员的答复语料,而后基于答复语料确定危险性数值,能够对服刑人员的危险性进行实时、快速预测,且通过利用语义识别网络结合预设计算策略,能够提高危险性预测的准确性。进而能够使管理人员对危险性大的服刑人员进行及时发现和干预。
附图说明
为了更清楚地说明本公开具体实施方式或现有技术中的技术方案,下面将对具体实施方式或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本公开的一些实施方式,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是根据根据本公开实施例的用于危险性预测的数据处理方法流程图;
图2是根据本公开实施例的用于危险性预测的数据处理装置的示意图;
图3是根据本公开实施例的电子设备的示意图。
具体实施方式
为了使本技术领域的人员更好地理解本公开方案,下面将结合本公开实施例中的附图,对本公开实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本公开一部分的实施例,而不是全部的实施例。基于本公开中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本公开保护的范围。
需要说明的是,本公开的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本公开的实施例。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
需要说明的是,在不冲突的情况下,本公开中的实施例及实施例中的特征可以相互组合。下面将参考附图并结合实施例来详细说明本公开。
适用于本公开实施例用于危险性预测的数据处理方法的系统架构可以包括机器人,网络、以及服务器。网络用以在终端设备和服务器之间提供通信链路的介质。网络可以包括各种连接类型,例如有线、无线通信链路或者光纤电缆等等。
机器人通过网络与服务器连接,以接收或发送消息等。机器人可以是任意类型的终端设备,终端设备可以以监区为单位进行设置,终端设备可以是具有音频输入接口和音频输出接口并支持互联网访问的各种电子设备,包括但不限于语音交互机器人、平板电脑等,其上可安装有提供各种服务类的应用,包括但是不限于音频交互类应用。
服务器可以是为危险性大小的预测提供支持的服务器,服务器可以在接收机器人发送的危险性预测请求之后,向机器人发送与服刑相关的问询语料数据,以使机器人在向服刑人员播报问询语料数据时,接收服刑人员输入的与问询语料数据相对应的答复语料数据,以最终实现对服刑人员的危险性大小预测的。
需要说明的是,本申请实施例所提供的用于预测服刑人员危险性的信息处理方法可以由服务器执行,相应地,用于预测服刑人员危险性的信息处理装置可以设置于服务器中。应该理解,可以具有任意数目的机器人、网络、服务器。
根据本公开实施例,提供了一种用于危险性预测的数据处理方法,如图1所示,该方法包括如下的步骤101至步骤103:
步骤101:服务端在接收到机器人发送的危险性预测请求之后,向所述机器人发送与服刑相关的问询语料数据,以使所述机器人在向服刑人员播报所述问询语料数据时,接收服刑人员输入的与所述问询语料数据相对应的答复语料数据。
在本实施例中, 服务端在接收到机器人发送的对服刑人员的危险性进行预测的请求之后,可以向机器人发送与服刑相关的问询语料数据。问询语料数据可以是经过计算机编码后的与服刑相关的问询文本。与服刑相关的问询语料数据可以是与服刑人员在监狱服刑相关联的问询内容,包括与各个服刑环节相关的问询内容,例如,服刑人员的刑罚类型的问询内容、入监后的劳动改造过程信息问询内容、服刑期间服刑人员生活相关问询内容,如,基于有关服刑期间性格问题的对话场景中的问询内容,基于有关思念亲人情绪的对话场景中的问询内容,基于有关探监会见事件的场景中的问询内容,基于有关服刑犯人亲人离世事件的对话场景中的问询内容等、及出监后的社会支持相关信息的问询内容,如,“你跟你同一监室的狱友相处关系怎么样,最近有没有一起去参加劳动”,“未来出监后,你对你的工作有什么计划”、“你打算利用劳动改造过程中获得的技能做什么”、“明天你的家人来探监,你有什么想和他们说的”、“目前哪些在监犯人跟你有矛盾”等。
服务端向机器人发送与服刑相关的问询语料数据之后,机器人接收该问询语料数据,并通过硬件设备进行语音提问,以使服刑人员基于问询语料数据语音输入与其对应的答复语料数据,机器人接收到服刑人员的语音后,可以同自动语音识别技术将语音转换成答复语料数据(文本数据)将答复语料数据发送至服务端。答复语料数据可以最终用于预测该服刑人员的危险性大小。
具体地,问询语料数据的确定过程可以包括:通过大数据挖掘技术在大量服刑人员的台账中获取预设危险性指标下的文本信息,而后对该文本信息进行数据处理,生成问询语料数据。台账可以是第三方数据库中存储的对大量服刑人员的进行问询的所有档案或者还可包括大量服刑人员的档案信息。大数据挖掘可以以预设危险性指标为目标进行数据挖掘,例如,以“暴力”,“自杀”,“逃脱”为危险性指标,在各个指标下进行数据挖掘,以“暴力”为目标危险性指标为例,在该指标下可以挖掘得到“犯罪类型”相关的信息、“暴力相关的既往史”相关的信息,“性格特征”相关的信息等等,“犯罪类型”相关的信息可以包括与“暴力犯罪”类型相关的信息(可以包括暴力犯罪的内容、暴力犯罪的对象、暴力犯罪的刑期等等)、与“偷窃犯罪”类型相关的信息等十余种类型的信息。在挖掘得到上述信息后,可以对上述信息进行数据清洗和数据重组,生成各个维度下的问询语料数据,例如,在“暴力”危险性指标下,挖掘得到的“犯罪类型”维度的目标信息,可以生成的问询语料数据可以包括“你入狱是因为持刀行凶吗”“你是杀人未遂入狱还是过失杀人入狱”,“你偷东西了吗”“你偷的东西价值是多少钱”“你偷东西是入室偷窃吗”“偷东西有没有得手”,“偷东西被发现后有没有与人斗殴”等等。
作为本实施例一种可选的实现方式,服务端在接收到机器人发送的危险性预测请求之后,向所述机器人发送与服刑相关的问询语料数据,以使所述机器人在向服刑人员播报所述问询语料数据时,接收服刑人员输入的与所述问询语料相对应的答复语料数据包括:服务端在接收到所述机器人发送的危险性预测请求之后,向所述机器人发送与服刑相关的第一问询语料,以使所述机器人在向服刑人员播报所述第一问询语料数据时,接收服刑人员输入的与所述第一问询语料相对应的第一答复语料数据;在接收到所述机器人发送的所述第一答复语料数据后,利用所述预先训练的语义识别网络模型,对所述第一答复语料数据进行语义识别,得到语义识别结果;如果所述语义识别结果满足预设条件,确定与所述语义识别结果相匹配的与服刑相关的第二问询语料数据;向所述机器人发送所述与服刑相关的第二问询语料数据,以使所述机器人在向服刑人员播报所述第二问询语料数据时,接收服刑人员输入的与所述第二问询语料数据相对应的第二答复语料数据。
在本实施例中,服务器在接收到第一答复语料数据后,可以对第一答复语料数据进行识别,以确定包含具有预设特征的目标答复语料数据,而后确定与目标答复语料数据包含的预设特征,根据预设的问询语料数据的逻辑跳转规则,确定与该预设特征相匹配的第二问询语料,向机器人发送第二问询语料,机器人向服刑人员播报第二问询语料数据,并接收服刑人员的第二答复语料,以此类推,直到所有的问询语料数据被执行完毕。例如,第一问询语料是“你是否在监禁机构收到过处罚”,机器人接收到的答复语料是“是”、“收到过”或“对”等等,由于预先设定了如果该第一问询语料下包含肯定性特征的特征词,则跳转至程序中第二问询语料位置处执行第二问询语料数据发送的语句,则语义识别网络模型识别得到在第一答复语料中包含了预设特征词“是”等其他肯定性特征的词时,将第二问询语料数据发送至机器人;如果 “不是”则跳转至程序中其他问询语料位置处执行程序语句,将其他问询语料数据发送至机器人。第二问询语料可以是 “你在监禁机构内受过什么样的处罚”如果机器人接收到答复语料数据“之前因为跟狱友犯了几次事,我打他了,警告过一次,严管过一次,关禁闭两次”,由于预先设定了如果该第二问询语料下包含处罚类型相关的特征信息,则跳转至第三问询语料或者其他问询语料,因此语义识别网络模型识别得到“我被警告、严管、禁闭”后,跳转至第三问询语料。以此类推,直到问询完毕。
采用该过程实现了自动化的语音交互,最后基于问询语料和答复语料确定危险性数值,能够对服刑人员潜在的危险性进行实时预测,提高了预测效率及预测精度,克服了无法实时预测、预测效率及预测精度低的技术缺陷。
步骤102:在获取到与所述问询语料数据相对应的答复语料数据后,将所述答复语料数据输入至预先训练的语义识别网络模型中,以使所述语义识别网络模型识别得到包含目标特征信息的目标答复语料数据。
在本实施例中,危险性预测的准确性取决于答复语料的语义是否被准确识别,如果无法对服刑人员的答复语料进行准确地识别,就无法提高危险性预测的准确性,因此可基于预先建立针对服刑环境下答复语料的语义识别网络,实现对答复语料的准确识别。具体为服务端在接收到与问询语料数据对应的答复语料数据之后,可以将答复语料数据输入至预先训练的语义识别网络模型中,语义识别网络模型可以对答复语料的文本数据进行语义识别,得到包含目标特征信息的目标答复语料数据,答复语料数据的目标特征信息与问询语料相关联。例如,在问询语料“你在监禁机构内受过什么样的处罚”中,需要识别的目标特征信息是与“处罚类型”相关联的特征信息,在答复语料中“之前因为跟狱友犯了几次事,我打他了,警告过一次,严管过一次,关禁闭两次,后续我没再犯事了”,语义识别网络模型可以识别得到“我被警告、严管、禁闭”,即目标特征信息不仅包括与“处罚类型”相关联的特征词,还包括的答复语料数据中的“主谓宾的主次关系”,例如,如果“之前因为跟狱友犯了几次事,他打我了,他被警告过一次,严管过一次,关禁闭两次”,语义识别网络可不对该识别结果输出。
作为本实施例一种可选的实现方式,根据以下步骤训练所述语义识别网络模型:对待训练语料数据进行标注,得到标注待训练语料,其中,所述对待训练语料数据进行标注包括:对所述待训练语料数据中用于表示所述危险性大小的特征词句进行标注;对所述待训练语料数据中的语序进行标;对所述标注待训练语料进行训练。
在本实施例中,在对语义识别网络模型进行训练时,待训练语料数据作为样本,可以首先对其进行标注,标注特征词(特征词可用于预测危险性的大小),例如处罚类型里的特征词“警告、严管、禁闭”,还可以对待训练语料数据中的语序(包括主谓宾关系)进行标注,例如“我打他”,“我被打”。在标注完成后,可以利用标注后的样本对语义识别网络模型进行训练。通过针对对服刑环境下,对大量与服刑相关的语料进行特征词和特征语序的标注,能够提高服刑环境下,服刑相关语料的语义识别的精度,在得到该准确识别的语义的前提下,就能够进一步提高危险性预测准确性。
步骤103:基于为所述问询语料预配置的权重值、以及所述目标答复语料数据中目标特征信息预关联的数值,确定所述服刑人员在各个预设危险性指标下危险性的数值。
在本实施例中,预设危险性指标是用于对服刑人员的危险性进行预测的维度,通过计算预设危险性指标下的危险性数值,可以实现对服刑人员危险性的大小进行预测。预设危险性指标可以包括但是不限于“暴力”指标、“逃脱”指标和“自杀”指标。可以预先对问询语料进行分类,得到归属于各个预设危险性指标下的问询语料数据,分类方法可以采用人工分类或者自动分类的方式,在此不做限定。分类完成后可以得到每一个预设危险性指标下的所有问询语料。
针对每一个预设危险性指标下的问询语料,服务端可以预先为每一个问询语料配置权重值,权重值可以被更改,在“暴力”危险性指标下,针对有关既往史的问询语料权重可以稍大,例如,“你在监禁机构内受过什么样的处罚”的问询语料权重值可以设定为0.9,其要大于“你是否感到压抑”0.1。服务端还预先存储了预每一个问询语料对应的目标答复语料中,目标答复语料包含的目标特征信息的分值,例如,针对“你在监禁机构内受过什么样的处罚”的问询语料,其对应的目标答复语料是“之前因为跟狱友犯了几次事,我打他了,警告过一次,严管过一次,关禁闭两次,后续我没再犯事了”,答复语料中的目标特征信息“我被警告、严管、禁闭”,分别预先关联了分值,例如,1分,2分,3分。针对“你是否感到压抑”的问询语料,其对应的目标答复语料是“是”,答复语料中的目标特征信息“是”,分别预先关联了分值,例如,1分,基于为所述问询语料预配置的权重值、以及所述目标答复语料数据中目标特征信息预关联的数值可以确定该“暴力”指标下的危险性数值,暴力指标下危险性数值=【0.9*(1+2+3)+0.1*1】=5.5,可以理解的是,上述暴力指标下的危险性数值的计算过程是示意性的,在实际场景中,问询语料的内容和个数、答复语料的内容不局限于上述实施例,其他预设危险性指标下的危险性数值的计算方式同上述实现方式相同,在此不再赘述。
作为本实施例一种可选的实现方式,在所述基于为所述问询语料预配置的权重值、以及所述目标答复语料数据中目标特征信息预关联的数值,确定所述服刑人员在多个预设危险性指标下危险性的数值之后,所述方法还包括:将所述服刑人员在各个预设危险性指标下危险性的数值加和,得到危险性的总值;将所述总值与预设的常模分数进行比对,得到比对结果;基于所述比对结果,确定所述服刑人员的危险性等级信息。
在本实施例中,在步骤103得到每一个预设危险性指标下危险性的数值之后,可以将各个预设危险性指标下的危险性数值相加,得到危险性数值的总和,例如,如果“暴力”危险性指标的危险性数值为5.5,“逃脱”危险性指标下的危险性数值为1,“自杀”危险性指标的危险性数值为0.5,则,则各个预设危险性指标下的危险性数值总和为7。在得到危险性数值的总值之后,可以将总和与常模分数进行比对,得到比对结果,例如常模分数为6分,则总值大于6分,且差值为1分,危险等级为“比较危险”。可以理解的是如果总值大于常模分数,且差值大于预设值,例如差值大于预设值2,则危险等级为“非常危险”;如果总值小于常模分数则危险等级
为“不危险”。
作为本实施例一种可选的实现方式,方法还包括:发送所述危险性等级信息至目标用户端。
在得到危险性等级信息后,可以将该信息发送至目标用户端,目标用户端可以是监狱管理人员的终端设备。
通过确定服刑人员的危险性等级,能够对服刑人员潜在的危险性进行直观的呈现,同时能够及时的将危险性数据发送至目标用户端,使监狱管理人员基于该危险等级信息,及时对相关服刑人员作出干预措施。
从以上的描述中,可以看出,本公开实现了如下技术效果:通过语音交互的方式获取服刑人员的答复语料,而后基于答复语料确定危险性数值,能够对服刑人员的危险性进行实时、快速预测,且通过利用语义识别网络结合量表计算规则,能够提高危险性预测的准确性。进而能够使管理人员及时的危险性大的服刑人员进行干预。
需要说明的是,在附图的流程图示出的步骤可以在诸如一组计算机可执行指令的计算机系统中执行,并且,虽然在流程图中示出了逻辑顺序,但是在某些情况下,可以以不同于此处的顺序执行所示出或描述的步骤。
根据本公开实施例,还提供了一种用于危险性预测的数据处理的装置,如图2所示,该装置包括:发送单元201,被配置成服务端在接收到机器人发送的危险性预测请求之后,向所述机器人发送与服刑相关的问询语料数据,以使所述机器人在向服刑人员播报所述问询语料数据时,接收服刑人员输入的与所述问询语料数据相对应的答复语料数据;处理单元202,被配置成在获取到与所述问询语料数据相对应的答复语料数据后,将所述答复语料数据输入至预先训练的语义识别网络模型中,以使所述语义识别网络模型识别得到包含目标特征信息的目标答复语料数据;确定单元203,被配置成基于为所述问询语料预配置的权重值、以及所述目标答复语料数据中目标特征信息预关联的数值,确定所述服刑人员在各个预设危险性指标下危险性的数值。
作为本实施例一种可选的实现方式,根据以下步骤训练所述语义识别网络模型:对待训练语料数据进行标注,得到标注待训练语料,其中,所述对待训练语料数据进行标注包括:对所述待训练语料数据中可用于预测所述危险性大小的特征词进行标注;对所述待训练语料数据中的语序进行标注;基于所述标注待训练语料对所述语义识别网络进行训练。
作为本实施例一种可选的实现方式,装置还包括:计算单元,被配置成将所述服刑人员在各个预设危险性指标下危险性的数值加和,得到危险性的总值;比对单元,被配置成将所述总值与预设的常模分数进行比对,得到比对结果;危险性等级确定单元,基于所述比对结果,确定所述服刑人员的危险性等级信息。
通过语音交互的方式获取服刑人员的答复语料,而后基于答复语料确定危险性数值,能够对服刑人员的危险性进行实时、快速预测,且通过利用语义识别网络结合量表计算规则,能够提高危险性预测的准确性。进而能够使管理人员及时的危险性大的服刑人员进行干预。
本公开实施例提供了一种电子设备,如图3所示,该电子设备包括一个或多个处理器31以及存储器32,图3中以一个处理器31为例。
该控制器还可以包括:输入装置33和输出装置34。
处理器31、存储器32、输入装置33和输出装置34可以通过总线或者其他方式连接,图3中以通过总线连接为例。
处理器31可以为中央处理器(CentralProcessingUnit,CPU)。处理器31还可以为其他通用处理器、数字信号处理器(DigitalSignalProcessor,DSP)、专用集成电路(ApplicationSpecificIntegratedCircuit,ASIC)、现场可编程门阵列(Field-ProgrammableGateArray,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等芯片,或者上述各类芯片的组合。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。
存储器32作为一种非暂态计算机可读存储介质,可用于存储非暂态软件程序、非暂态计算机可执行程序以及模块,如本公开实施例中的控制方法对应的程序指令/模块。处理器31通过运行存储在存储器32中的非暂态软件程序、指令以及模块,从而执行服务器的各种功能应用以及数据处理,即实现上述方法实施例的用于危险性预测的数据处理方法。
存储器32可以包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需要的应用程序;存储数据区可存储根据服务器操作的处理装置的使用所创建的数据等。此外,存储器32可以包括高速随机存取存储器,还可以包括非暂态存储器,例如至少一个磁盘存储器件、闪存器件、或其他非暂态固态存储器件。在一些实施例中,存储器32可选包括相对于处理器31远程设置的存储器,这些远程存储器可以通过网络连接至网络连接装置。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。
输入装置33可接收输入的数字或字符信息,以及产生与服务器的处理装置的用户设置以及功能控制有关的键信号输入。输出装置34可包括显示屏等显示设备。
一个或者多个模块存储在存储器32中,当被一个或者多个处理器31执行时,执行如图1所示的用于危险性预测的数据处理方法。
本领域技术人员可以理解,实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,的程序可存储于一计算机可读取存储介质中,该程序在执行时,可包括如上述各电机控制方法的实施例的流程。其中,存储介质可为磁碟、光盘、只读存储记忆体(Read-OnlyMemory,ROM)、随机存储记忆体(RandomAccessMemory,RAM)、快闪存储器(FlashMemory)、硬盘(HardDiskDrive,缩写:HDD)或固态硬盘(Solid-StateDrive,SSD)等;存储介质还可以包括上述种类的存储器的组合。
虽然结合附图描述了本公开的实施方式,但是本领域技术人员可以在不脱离本公开的精神和范围的情况下作出各种修改和变型,这样的修改和变型均落入由所附权利要求所限定的范围之内。
Claims (10)
1.一种用于危险性预测的数据处理方法,其特征在于,包括:
服务端在接收到机器人发送的危险性预测请求之后,向所述机器人发送与服刑相关的问询语料数据,以使所述机器人在向服刑人员播报所述问询语料数据时,接收服刑人员输入的与所述问询语料数据相对应的答复语料数据;
在获取到与所述问询语料数据相对应的答复语料数据后,将所述答复语料数据输入至预先训练的语义识别网络模型中,以使所述语义识别网络模型识别得到包含目标特征信息的目标答复语料数据;
基于为所述问询语料预配置的权重值、以及所述目标答复语料数据中目标特征信息预关联的数值,确定所述服刑人员在各个预设危险性指标下危险性的数值。
2.根据权利要求1所述的用于危险性预测的数据处理方法,其特征在于,服务端在接收到机器人发送的危险性预测请求之后,向所述机器人发送与服刑相关的问询语料数据,以使所述机器人在向服刑人员播报所述问询语料数据时,接收服刑人员输入的与所述问询语料相对应的答复语料数据包括:
服务端在接收到机器人发送的危险性预测请求之后,向所述机器人发送与服刑相关的第一问询语料,以使所述机器人在向服刑人员播报所述第一问询语料数据时,接收服刑人员输入的与所述第一问询语料相对应的第一答复语料数据;
在接收到所述机器人发送的所述第一答复语料数据后,利用所述预先训练的语义识别网络模型,对所述第一答复语料数据进行语义识别,得到语义识别结果;
如果所述语义识别结果满足预设条件,确定与所述语义识别结果相匹配的与服刑相关的第二问询语料数据;
向所述机器人发送所述与服刑相关的第二问询语料数据,以使所述机器人在向服刑人员播报所述第二问询语料数据时,接收服刑人员输入的与所述第二问询语料数据相对应的第二答复语料数据。
3.根据权利要求1所述的用于危险性预测的数据处理方法,其特征在于,根据以下步骤训练所述语义识别网络模型:
对待训练语料数据进行标注,得到标注待训练语料,其中,所述对待训练语料数据进行标注包括:对所述待训练语料数据中可用于预测所述危险性大小的特征词进行标注;对所述待训练语料数据中的语序进行标注;
基于所述标注待训练语料对所述语义识别网络进行训练。
4.根据权利要求1所述的用于危险性预测的数据处理方法,其特征在于,在所述基于为所述问询语料预配置的权重值、以及所述目标答复语料数据中目标特征信息预关联的数值,确定所述服刑人员在多个预设危险性指标下危险性的数值之后,所述方法还包括:
将所述服刑人员在各个预设危险性指标下危险性的数值加和,得到危险性的总值;
将所述总值与预设的常模分数进行比对,得到比对结果;
基于所述比对结果,确定所述服刑人员的危险性等级信息。
5.根据权利要求4所述的用于危险性预测的数据处理方法,其特征在于,所述方法还包括:
发送所述危险性等级信息至目标用户端。
6.一种用于危险性预测的数据处理装置,其特征在于,包括:
发送单元,被配置成服务端在接收到机器人发送的危险性预测请求之后,向所述机器人发送与服刑相关的问询语料数据,以使所述机器人在向服刑人员播报所述问询语料数据时,接收服刑人员输入的与所述问询语料数据相对应的答复语料数据;
处理单元,被配置成在获取到与所述问询语料数据相对应的答复语料数据后,将所述答复语料数据输入至预先训练的语义识别网络模型中,以使所述语义识别网络模型识别得到包含目标特征信息的目标答复语料数据;
确定单元,被配置成基于为所述问询语料预配置的权重值、以及所述目标答复语料数据中目标特征信息预关联的数值,确定所述服刑人员在各个预设危险性指标下危险性的数值。
7.根据权利要求6所述的用于危险性预测的数据处理装置,其特征在于,根据以下步骤训练所述语义识别网络模型:
对待训练语料数据进行标注,得到标注待训练语料,其中,所述对待训练语料数据进行标注包括:对所述待训练语料数据中可用于预测所述危险性大小的特征词进行标注;对所述待训练语料数据中的语序进行标注;
基于所述标注待训练语料对所述语义识别网络进行训练。
8.根据权利要求6所述的用于危险性预测的数据处理装置,其特征在于,所述装置还包括:
计算单元,被配置成将所述服刑人员在各个预设危险性指标下危险性的数值加和,得到危险性的总值;
比对单元,被配置成将所述总值与预设的常模分数进行比对,得到比对结果;
危险性等级确定单元,被配置成基于所述比对结果,确定所述服刑人员的危险性等级信息。
9.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储有计算机指令,所述计算机指令用于使所述计算机执行权利要求1-5任意一项所述的用于危险性预测的数据处理方法。
10.一种电子设备,其特征在于,包括:至少一个处理器;以及与所述至少一个处理器通信连接的存储器;其中,所述存储器存储有可被所述至少一个处理器执行的计算机程序,所述计算机程序被所述至少一个处理器执行,以使所述至少一个处理器执行权利要求1-5任意一项所述的用于危险性预测的数据处理方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110157302.XA CN112508311B (zh) | 2021-02-05 | 2021-02-05 | 基于语音交互实现危险性预测的数据处理方法及装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110157302.XA CN112508311B (zh) | 2021-02-05 | 2021-02-05 | 基于语音交互实现危险性预测的数据处理方法及装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN112508311A true CN112508311A (zh) | 2021-03-16 |
CN112508311B CN112508311B (zh) | 2021-11-02 |
Family
ID=74952603
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110157302.XA Active CN112508311B (zh) | 2021-02-05 | 2021-02-05 | 基于语音交互实现危险性预测的数据处理方法及装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112508311B (zh) |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20210272225A1 (en) * | 2017-04-19 | 2021-09-02 | Global Tel*Link Corporation | Mobile correctional facility robots |
CN113609851A (zh) * | 2021-07-09 | 2021-11-05 | 浙江连信科技有限公司 | 心理学上想法认知偏差的识别方法、装置及电子设备 |
CN114118084A (zh) * | 2021-12-16 | 2022-03-01 | 杭州华亭科技有限公司 | 一种基于神经网络算法的罪犯行凶危险性评估方法 |
US11959733B2 (en) | 2017-04-19 | 2024-04-16 | Global Tel*Link Corporation | Mobile correctional facility robots |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108511071A (zh) * | 2018-04-18 | 2018-09-07 | 广东惠禾科技发展有限公司 | 心理健康评估方法及装置 |
CN109543986A (zh) * | 2018-11-16 | 2019-03-29 | 湖南数定智能科技有限公司 | 基于用户画像的监狱罪犯三预风险评估方法及系统 |
CN109998570A (zh) * | 2019-03-11 | 2019-07-12 | 山东大学 | 服刑人员心理状态评估方法、终端、设备及系统 |
CN111430033A (zh) * | 2020-03-24 | 2020-07-17 | 浙江连信科技有限公司 | 基于人机交互的心理评估方法及电子设备 |
-
2021
- 2021-02-05 CN CN202110157302.XA patent/CN112508311B/zh active Active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108511071A (zh) * | 2018-04-18 | 2018-09-07 | 广东惠禾科技发展有限公司 | 心理健康评估方法及装置 |
CN109543986A (zh) * | 2018-11-16 | 2019-03-29 | 湖南数定智能科技有限公司 | 基于用户画像的监狱罪犯三预风险评估方法及系统 |
CN109998570A (zh) * | 2019-03-11 | 2019-07-12 | 山东大学 | 服刑人员心理状态评估方法、终端、设备及系统 |
CN111430033A (zh) * | 2020-03-24 | 2020-07-17 | 浙江连信科技有限公司 | 基于人机交互的心理评估方法及电子设备 |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20210272225A1 (en) * | 2017-04-19 | 2021-09-02 | Global Tel*Link Corporation | Mobile correctional facility robots |
US11959733B2 (en) | 2017-04-19 | 2024-04-16 | Global Tel*Link Corporation | Mobile correctional facility robots |
CN113609851A (zh) * | 2021-07-09 | 2021-11-05 | 浙江连信科技有限公司 | 心理学上想法认知偏差的识别方法、装置及电子设备 |
CN114118084A (zh) * | 2021-12-16 | 2022-03-01 | 杭州华亭科技有限公司 | 一种基于神经网络算法的罪犯行凶危险性评估方法 |
Also Published As
Publication number | Publication date |
---|---|
CN112508311B (zh) | 2021-11-02 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN112508311B (zh) | 基于语音交互实现危险性预测的数据处理方法及装置 | |
US11194965B2 (en) | Keyword extraction method and apparatus, storage medium, and electronic apparatus | |
US10915824B2 (en) | Trend basis and behavioral analytics system and methods | |
CN111191450B (zh) | 语料清洗方法、语料录入设备及计算机可读存储介质 | |
US8825578B2 (en) | System and method for determining an entity's identity and assessing risks related thereto | |
KR102207632B1 (ko) | 전문가 긴급 추천 서비스 시스템 | |
CN112468659B (zh) | 应用于电话客服的质量评价方法、装置、设备及存储介质 | |
CN107545505B (zh) | 保险理财产品信息的识别方法及系统 | |
CN109379228A (zh) | 误告警信息识别方法及装置、存储介质、电子终端 | |
US20180218730A1 (en) | System and Method for Assessing Security Threats and Criminal Proclivities | |
CN114004210A (zh) | 基于神经网络的应急预案生成方法、系统、设备及介质 | |
WO2023040516A1 (zh) | 一种事件整合方法、装置、电子设备、计算机可读存储介质及计算机程序产品 | |
CN112446210A (zh) | 用户性别预测方法、装置及电子设备 | |
KR20150089168A (ko) | 인공지능을 활용한 언어분석 방법 및 시스템 | |
CN110532393B (zh) | 文本处理方法、装置及其智能电子设备 | |
KR102297620B1 (ko) | 게임 내 성희롱 모니터링 시스템 | |
CN117114707A (zh) | 出险反欺诈预测模型的训练方法、预测方法和装置 | |
Liu et al. | Predicting subway incident delays using text analysis based accelerated failure time model | |
CN111753071B (zh) | 基于人工智能的法律咨询交互方法及装置 | |
CN109684470A (zh) | 法律信息推荐方法及装置、存储介质及电子设备 | |
CN115146175A (zh) | 一种新闻推荐算法的优化方法和装置 | |
CN114399816A (zh) | 社区火灾风险感知方法及装置 | |
CN112951429A (zh) | 用于中小学生心理危机筛查的信息处理方法及装置 | |
CN114239602A (zh) | 会话方法、装置和计算机程序产品 | |
CN113379219A (zh) | 应急管理数据的质量评估方法及装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |