CN112015858B - 信息的检测方法、设备及存储介质 - Google Patents
信息的检测方法、设备及存储介质 Download PDFInfo
- Publication number
- CN112015858B CN112015858B CN201910462635.6A CN201910462635A CN112015858B CN 112015858 B CN112015858 B CN 112015858B CN 201910462635 A CN201910462635 A CN 201910462635A CN 112015858 B CN112015858 B CN 112015858B
- Authority
- CN
- China
- Prior art keywords
- unexamined
- examination
- inspected
- determining
- text
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000003860 storage Methods 0.000 title claims description 20
- 238000001514 detection method Methods 0.000 title claims description 19
- 238000012550 audit Methods 0.000 claims abstract description 34
- 238000000034 method Methods 0.000 claims description 56
- 239000013598 vector Substances 0.000 claims description 36
- 230000015654 memory Effects 0.000 claims description 33
- 238000004590 computer program Methods 0.000 claims description 23
- 238000012512 characterization method Methods 0.000 claims description 22
- 238000007689 inspection Methods 0.000 claims description 17
- 238000013145 classification model Methods 0.000 claims description 14
- 238000012545 processing Methods 0.000 claims description 12
- 238000004891 communication Methods 0.000 claims description 10
- 238000009499 grossing Methods 0.000 claims description 6
- 238000012552 review Methods 0.000 abstract description 5
- 230000008569 process Effects 0.000 description 17
- 238000010586 diagram Methods 0.000 description 16
- 238000012549 training Methods 0.000 description 12
- 230000006870 function Effects 0.000 description 8
- 238000006243 chemical reaction Methods 0.000 description 4
- 230000005540 biological transmission Effects 0.000 description 3
- 238000005516 engineering process Methods 0.000 description 3
- 238000010801 machine learning Methods 0.000 description 3
- 238000013461 design Methods 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 230000002093 peripheral effect Effects 0.000 description 2
- 238000012384 transportation and delivery Methods 0.000 description 2
- 230000008859 change Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000009826 distribution Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 238000013507 mapping Methods 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000006403 short-term memory Effects 0.000 description 1
- 230000000192 social effect Effects 0.000 description 1
- 230000003068 static effect Effects 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 238000013518 transcription Methods 0.000 description 1
- 230000035897 transcription Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/3331—Query processing
- G06F16/334—Query execution
- G06F16/3344—Query execution using natural language analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/3331—Query processing
- G06F16/334—Query execution
- G06F16/3343—Query execution using phonetics
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Data Mining & Analysis (AREA)
- Databases & Information Systems (AREA)
- General Physics & Mathematics (AREA)
- General Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Acoustics & Sound (AREA)
- Health & Medical Sciences (AREA)
- Artificial Intelligence (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本申请实施例提供一种信息的检测方法、设备及存储介质,在本申请实施例中,获取审查事件中的审查文本,确定审查文本的已审查要素;至少根据已审查要素,确定审查事件的未审查要素,从而可根据确定的未审查要素,实时定位当前审查事件中的已审查内容,并对未审查要素进行提醒,使得审查人员能够最大程度获取到事件的有效信息,减少复审的概率。
Description
技术领域
本申请涉及计算机技术领域,尤其涉及一种信息的检测方法、设备及存储介质。
背景技术
随着时代的发展,由于人们对司法的倚重程度不断增强,舆论、宣传媒体不断宣传诉讼“维权”的社会成效,大大激发了公民的维权意识,促使更多人在发生纠纷后选择到法院诉讼,各类民商事案件大幅增加。使得法官需要审理的案件,也大幅增加。
发明内容
本申请的多个方面提供一种信息的检测方法、设备及存储介质,用以能够快速定位审查案件的审查要素,从而加快案件的审查。
本申请实施例提供一种信息的检测方法,包括:获取审查事件中的审查文本;确定所述审查文本的已审查要素;至少根据所述已审查要素,确定所述审查事件的未审查要素。
本申请实施例还提供一种信息的检测方法,包括:获取审查事件中的审查文本;确定所述审查文本的已审查要素;至少根据所述已审查要素,确定所述审查事件的未审查要素;提供所述未审查要素。
本申请实施例还提供一种信息的检测系统,包括:第一设备以及第二设备;所述第一设备,用于获取审查事件中的审查文本;确定所述审查文本的已审查要素;至少根据所述已审查要素,确定所述审查事件的未审查要素,并将所述未审查要素提供至所述第二设备;所述第二设备,用于展示所述未审查要素。
本申请实施例还提供一种设备,包括存储器以及处理器;所述存储器,用于存储计算机程序;所述处理器,用于执行所述计算机程序,以用于:获取审查事件中的审查文本;确定所述审查文本的已审查要素;至少根据所述已审查要素,确定所述审查事件的未审查要素。
本申请实施例还提供一种存储有计算机程序的计算机可读存储介质,计算机程序被一个或多个处理器执行时,致使所述一个或多个处理器实现上述方法中的步骤。
本申请实施例还提供一种设备,包括存储器、处理器以及通信组件;所述存储器,用于存储计算机程序;所述通信组件,用于提供所述未审查要素;所述处理器,用于执行所述计算机程序,以用于:获取审查事件中的审查文本;确定所述审查文本的已审查要素;至少根据所述已审查要素,确定所述审查事件的未审查要素。
本申请实施例还提供一种存储有计算机程序的计算机可读存储介质,计算机程序被一个或多个处理器执行时,致使所述一个或多个处理器实现上述方法中的步骤。
在本申请实施例中,获取审查文本,确定审查文本的已审查要素;根据已审查要素,确定审查事件的未审查要素,从而可根据确定的未审查要素,实时定位当前审查事件中的已审查内容,并对未审查要素进行提醒,使得审查人员能够最大程度获取到事件的有效信息,减少复审的概率。
附图说明
此处所说明的附图用来提供对本申请的进一步理解,构成本申请的一部分,本申请的示意性实施例及其说明用于解释本申请,并不构成对本申请的不当限定。在附图中:
图1为本申请一示例性信息的检测系统的结构示意图;
图2为本申请另一示例性实施例的信息的检测方法的流程示意图;
图3为本申请另一示例性实施例提供的分类标签的示意图;
图4为本申请另一示例性实施例提供的又一种信息的检测方法的流程示意图;
图5为本申请又一示例性实施例提供的一种信息的检测装置的结构示意图;
图6为本申请又一示例性实施例提供的又一种信息的检测装置的结构示意图;
图7为本申请又一示例性实施例提供的一种服务器的结构示意图;
图8A为本申请又一示例性实施例提供的一种终端的结构示意图;
图8B为本申请又一示例性实施例提供的又一种服务器的结构示意图。
具体实施方式
为使本申请的目的、技术方案和优点更加清楚,下面将结合本申请具体实施例及相应的附图对本申请技术方案进行清楚、完整地描述。显然,所描述的实施例仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
在法院对案件进行庭审的过程中,被告方与原告双方之间证据交错,事件描述较为复杂,尤其像民事类借贷类案件,多笔交付和结算时常发生,而由于这些事件中涉及到的事实较多,在对事实梳理的过程中会造成遗漏。
本申请实施例是通过识别庭审过程中双方谈论内容所对应的审查要素,帮助法官实时定位当前已审查的内容,并及时提醒法官未审查的要素,帮助法官在一次庭审中获得最大有效信息,减少二审的概率。
在本申请实施例中,获取审查文本,确定审查文本的已审查要素;根据已审查要素,确定审查事件的未审查要素,从而可根据确定的未审查要素,实时定位当前审查事件中的已审查内容,并对未审查要素进行提醒,使得审查人员能够最大程度获取到事件的有效信息,减少复审的概率。
以下结合附图,详细说明本申请各实施例提供的技术方案。
图1为本申请一示例性实施例提供的一种信息的检测系统的结构示意图。如图1所示,该检测系统100包括:第一设备101以及第二设备102。
其中,第一设备101可以是任何具有一定计算能力的设备,例如,可以是智能手机、笔记本、PC(personal computer)电脑等。第一设备101的基本结构包括:至少一个处理器。处理器的数量取决于第一设备101的配置和类型。第一设备101也可以包括存储器,该存储器可以为易失性的,例如RAM,也可以为非易失性的,例如只读存储器(Read-Only Memory,ROM)、闪存等,或者也可以同时包括两种类型。存储器内通常存储有操作系统(OperatingSystem,OS)、一个或多个应用程序,也可以存储有程序数据等。除了处理单元和存储器之外,第一设备101还包括一些基本配置,例如网卡芯片、IO总线、摄像头以及音视频组件等。可选地,第一设备101还可以包括一些外围设备,例如键盘、鼠标、输入笔、打印机等。其它外围设备在本领域中是众所周知的,在此不做赘述。
第二设备102是指可以在网络虚拟环境中进行信息检测的服务器,通常是指能够基于互联网络进行信息检测操作的服务器。在物理实现上,第二设备102可以是任何能够提供计算服务,响应服务请求,并进行处理的设备,例如可以是常规服务器、云服务器、云主机、虚拟中心等。服务器的构成主要包括处理器、硬盘、内存、系统总线等,和通用的计算机架构类似。
在本实施例中,第二设备102,用于获取审查事件中的审查文本;确定审查文本的已审查要素;至少根据已审查要素,确定审查事件的未审查要素,并将未审查要素提供至第一设备101;第一设备101,用于展示未审查要素。
本实施例可以适用于案件开庭庭审的应用场景,在庭审过程中,法官、被告以及原告等人员对案件分别进行陈述,可以由第一设备101上设置的收音装置,如话筒,记录陈述的语音,并发送至第二设备102,第二设备102针对语音获取对应的文本,或者,第二设备102直接从服务器本地存储区域内获取到审查文本,并确定文本中每个句子对应的类型,从而将确定的类型作为已审核要素,在确定未审查要素,并将未审查要素发送至第一设备101,使得第一设备101向法官展示该未审核要素,供法官及时对未审查要素进行审查。
在本实施例中,第一设备101与第二设备102进行网络连接。第一设备101与第二设备102之间可以是无线或有线网络连接。若第一设备101与第二设备102通信连接,则该移动网络的网络制式可以为2G(GSM)、2.5G(GPRS)、3G(WCDMA、TD-SCDMA、CDMA2000、UTMS)、4G(LTE)、4G+(LTE+)、WiMax等中的任意一种。
下面结合方法实施例,第二设备102检测信息的过程进行详细说明。
图2为本申请另一示例性实施例的信息的检测方法的流程示意图。本申请实施例提供的该方法200由第二设备执行,例如,服务器,该方法200包括以下步骤:
201:获取审查事件中的审查文本。
202:确定审查文本的已审查要素。
203:至少根据已审查要素,确定审查事件的未审查要素。
以下针对上述步骤进行详细地阐述:
201:获取审查事件中的审查文本。
其中,审查事件是指需要法庭进行庭审的案件,例如,民事借贷类案件。
审查文本是指审查事件在审查过程中对应的审查内容,以文本的形式记载。例如,可以是案件在庭审过程中审查语音对应的审查文本,庭审语音在是指庭审过程中不同人员对案件的陈述,如原告以及被告的陈述。
在一些实例中,获取审查事件中的审查文本,包括:接收审查事件中的审查语音;识别审查语音对应的文字;对文字进行文字平滑处理,得到审查文本。
文字平滑处理是指对文本中的句子去除多余文字或错误,例如,消除断句错误、删除口语重复、消除实体识别错误、消除法律用语识别错误等。
例如,法院对民事借贷类案件进行庭审,原告和被告分别对该案件进行陈述,并通过设置在终端,例如,电脑,上的外设的麦克风或者话筒进行收音,将原告与被告的陈述的语音,通过话筒传输到电脑上,并由电脑将原告以及被告的语音传输到服务器,其中,每个语音在传输的过程中还可以携带话筒标识,通过话筒标识可以确定该语音属于原告还是被告。服务器接收到语音后,通过ASR(Automatic Speech Recognition)自动语音识别,将语音实时转换(也可以称为转录)为文字,转化单位可以为字级别。且转化结果可以根据上下文进行调整,并可以根据调整结果,实时进行转换结果的更新,来保证转换的文本所表达的语义与语音的语义相同,达到更好的转换效果。在获取到最终调整的文本后,调整结果进行文字平滑处理,例如,消除断句错误、删除口语重复、消除实体识别错误、消除法律用语识别错误等,从而得到审查文本。
需要说明的是,自动语音识别是一种将人的语音转换为文本的技术,其目标是将人类的语音中的词汇内容转换为计算机可读的输入,例如按键、二进制编码或者字符序列。
此外,服务器还可以直接获取到已经存在的审查文本,如已经预置在服务器本地存储区域的审查文本,或,终端发送的审查文本,或获取到其他方式记录到的审查文本,均属于本申请实施例的保护范围。
202:确定审查文本的已审查要素。
其中,审查要素是指与审查事件相关的、且影响审查事件判决的重点要素。已审查要素是指审查文本中已经存在的审查要素。
需要说明的是,审查要素可以是已经预置好在法律知识图谱中的要素,且同类审查事件的审查要素可以相同。
在一些实例中,确定审查文本的已审查要素,包括:确定审查文本中各个句子的特征数据;确定特征数据对应的类型,作为已审查要素。
其中,特征是指用来表征文本属性的元素,用于区别文本之间的属性,这些元素可以为文本的字、词组、短语、甚至“概念”等多种元素。
特征数据是指用于量化特征的数据,如表征向量。
特征数据的类型是指与该特征数据具有关联关系或映射关系的标签,例如,借贷类审查事件中的分类标签:利息、本金争议。
在一些实例中,确定审查文本中各个句子的特征数据,包括:将各个句子输入至预置语言模型中,获取对应句子的表征向量,作为句子的特征数据。
其中,预置语言模型是指用于确定每个句子的表征向量的算法模型。
该预置语言模型是可以通过机器学习的方式训练得到的。该训练过程可以为先获取到大量文本中的每个句子以及文本中每个句子对应的表征向量,作为训练样本,并遮挡掉每个句子的表征向量,在训练过程中,基于对应文本的上下文的向量算法计算训练样本中每个句子的表征向量,再和训练样本中的对应表征向量进行比较,并矫正向量算法,直至计算得到的表征向量符合预期,并确定最终的向量算法作为预置语言模型,从而实现恢复每个句子的表征向量,并能够学到句子之间的联系。需要说明的是,句子之间的联系可以是通过表征向量之间的差值确定,例如,可以是当两个句子的表征向量差值在相似阈值内,就可以认定这两个句子相似。
需要说明的是,句子的表征向量是通过每个句子中各个单词或词语的表征向量来确定的。一个句子的表征向量可以是该句子中的一个单词或词语的表征向量。
例如,根据前文所述,服务器在获取到审查文本后,对审查文本进行划分,得到多个句子,将每个句子输入至训练好的预置语言模型中,得到每个句子对应的表征向量,作为每个句子的特征数据。
在一些实例中,确定特征数据对应的类型,作为已审查要素,包括:将表征向量输入至预置分类模型中,获取对应的分类标签,作为已审查要素。
其中,预置分类模型是指用于确定表征向量对应标签的算法模型。
该预置分类模型是可以通过机器学习的方式训练得到的。该训练过程可以为先获取到大量文本中的每个句子、文本中每个句子对应的表征向量以及每个句子所属的分类标签,作为训练样本,应理解,句子所属的分类标签,也是句子的表征向量对应的分类标签。在训练过程中,可以获取训练样本中每个句子的表征向量与对应的分类标签之间的关联关系,并根据这个关联关系,进行机器学习,可以根据每个相同或相似表征向量与对应的分类标签,进行聚类,确定表征向量对应分类标签的分类概率,根据分类概率,确定每个表征向量对应的分类标签。再基于更多的训练样本来矫正分类模型,直至计算得到的分类模型符合预期,并确定最终的分类模型作为预置分类模型。
需要说明的是,对于分类标签,可以是一层分类标签,也可以是多层分类标签。图3示出了分类标签,在该图3中,分类标签是第二列到第四列所示,其中,第二列为每个分类标签的总类,第三列为总类的下一层分类标签,第四列为下一层分类标签的下一层分类标签。而第一列则为审查文本中的句子,每个句子都有同行内的分类标签,当分类标签只存在第二列中,如,第一行第二列的分类标签:利息,则对应的第一行第一列的句子的分类标签仅为一层分类标签:利息。当分类标签只存在多列中,如,第三行第二、三以及四列的分类标签:本金争议、款项给付以及交付凭证,则对应的第三行第一列的句子的分类标签依次为:本金争议→款项给付→交付凭证。
在多层分类标签中,利用层次分类标签之间的依赖关系,在下一层级分类计算概率分布时,可以考虑上一级分类的概率。
还可以通过计算句子的分类标签层级数目的概率,根据这个概率在某层级分类节点后自动停止对句子的继续分类。
上述预置语言模型以及预置分类模型可以是基于将Encoder-Decoder(编码-解码)中的Attention机制运用在Bi-LSTM(Bi-Long Short-Term Memory,双向长短期记忆网络)中的模型。
此外,预置语言模型以及预置分类模型也可以设置在一个模型中,在实际分类当中,预训练是Encoder端的两层Bi-LSTM作为分类模型的句子表征向量。
例如,根据前文所述,服务器在获取到句子的表征向量后,将每个句子的表征向量输入至训练好的预置分类模型中,得到每个句子对应的分类标签,作为已审查要素,如图3所示,得到审查文本对应的分类标签。
203:至少根据已审查要素,确定审查事件的未审查要素。
在一些实例中,至少根据已审查要素,确定审查事件的未审查要素,包括:获取审查事件的待审查要素;将已审查要素与待审查要素进行对比,确定未审查要素。
例如,根据前文所述,服务器在获取到已审查要素后,可以从其案由知识库中法律知识图谱中获取借贷类案件的待审查要素,并与已审查要素进行对比,确定出未审查要素,例如,担保以及借贷法律关系。
需要说明的是,服务器可以实时接收审查语音并转化成审查文本,并得到未审查要素,进而对未审查要素进行更新。
在一些实例中,该方法200还包括:提供未审查要素,以提醒审查人员对未审查要素进行审查。
在一些实例中,提供未审查要素,包括:将未审查要素发送至展示终端,进行展示。
例如,根据前文所述,服务器在获取到未审查要素或更新的未审查要素后,将未审查要素或更新的未审查要素发送至终端进行提示。使得审查人员能够根据展示的未审查要素继续进行案件的审查,如担保是否合法,借贷法律关系是否成立。
本申请实施例,通过识别庭审过程中双方谈论内容所对应的已审查要素,帮助法官实时定位当前已审查的内容,并及时提醒法官未审查要素,帮助法官在一次庭审中获得最大有效信息,减少二审的概率。
图4为本申请另一示例性实施例提供的又一种信息的检测方法的流程示意图。本申请实施例提供的该方法400可以由第一设备执行,例如,终端,也可以由第二设备执行,例如,服务器,该方法400包括以下步骤:
401:获取审查事件中的审查文本。
402:确定审查文本的已审查要素。
403:至少根据已审查要素,确定审查事件的未审查要素。
404:提供未审查要素。
需要说明的是,上述实施例所提供方法400中的步骤401-403的具体实施方式在前文已经详细阐述过了,此处就不再赘述。
以下针对步骤404进行详细地阐述:
404:提供未审查要素。
在一些实例中,提供未审查要素,包括:展示未审查要素。
例如,根据前文所述,终端根据上述过程,获取到未审查要素后,直接将未审查要素进行提示,使得审查人员能够根据展示的未审查要素继续进行案件的审查,如担保是否合法,借贷法律关系是否成立。
在一些实例中,提供未审查要素,包括:将未审查要素发送至展示终端,进行展示。
当服务器执行上述过程并得到未审查要素,则服务器发送至终端进行提示,使得审查人员能够根据展示的未审查要素继续进行案件的审查,如担保是否合法,借贷法律关系是否成立。
图5为本申请又一示例性实施例提供的信息的检测装置的结构框架示意图。该装置500可以应用于第二设备中,如服务器,该装置500包括获取模块501、第一确定模块502以及第二确定模块503,以下针对各个模块的功能进行详细的阐述:
获取模块501,用于获取审查事件中的审查文本。
第一确定模块502,用于确定审查文本的已审查要素。
第二确定模块503,用于至少根据已审查要素,确定审查事件的未审查要素。
在一些实例中,该装置500还包括:提供模块,用于提供未审查要素,以提醒审查人员对未审查要素进行审查。
在一些实例中,获取模块501,包括:接收单元,用于接收审查事件中的审查语音;识别单元,用于识别审查语音对应的文字;处理单元,用于对文字进行文字平滑处理,得到审查文本。
在一些实例中,第一确定模块502,包括:第一确定单元,用于确定审查文本中各个句子的特征数据;第二确定单元,用于确定特征数据对应的类型,作为已审查要素。
在一些实例中,第一确定单元,用于将各个句子输入至预置语言模型中,获取对应句子的表征向量,作为句子的特征数据。
在一些实例中,第二确定单元,用于将表征向量输入至预置分类模型中,获取对应的分类标签,作为已审查要素。
在一些实例中,第二确定模块503包括:获取单元,用于获取审查事件的待审查要素;对比单元,用于将已审查要素与待审查要素进行对比,确定未审查要素。
在一些实例中,提供模块,用于将未审查要素发送至展示终端,进行展示。
图6为本申请又一示例性实施例提供的又一种信息的检测装置的结构框架示意图。该装置600可以应用于第一设备中,例如,终端,也可以应用于第二设备中,例如,服务器,该装置600包括:获取模块601、第一确定模块602、第二确定模块603以及提供模块604,以下针对各个模块的功能进行详细的阐述:
获取模块601,用于获取审查事件中的审查文本。
第一确定模块602,用于确定审查文本的已审查要素。
第二确定模块603,用于至少根据已审查要素,确定审查事件的未审查要素。
提供模块604,用于提供未审查要素。
在一些实例中,提供模块604,用于展示未审查要素。
在一些实例中,提供模块604,将未审查要素发送至展示终端,进行展示。
以上描述了图5所示的检测装置500的内部功能和结构,在一个可能的设计中,图5所示的检测装置500的结构可实现为服务器,如图7所示,该服务器700可以包括:存储器701以及处理器702;
存储器701,用于存储计算机程序。
处理器702,用于执行计算机程序,以用于:获取审查事件中的审查文本;确定审查文本的已审查要素;至少根据已审查要素,确定审查事件的未审查要素。
在一些实例中,该服务器700还可以包括:通信组件703,用于提供未审查要素,以提醒审查人员对未审查要素进行审查。
在一些实例中,处理器702,具体用于:接收审查事件中的审查语音;识别审查语音对应的文字;对文字进行文字平滑处理,得到审查文本。
在一些实例中,处理器702,具体用于:确定审查文本中各个句子的特征数据;确定特征数据对应的类型,作为已审查要素。
在一些实例中,处理器702,具体用于:将各个句子输入至预置语言模型中,获取对应句子的表征向量,作为句子的特征数据。
在一些实例中,处理器702,具体用于:将表征向量输入至预置分类模型中,获取对应的分类标签,作为已审查要素。
在一些实例中,处理器702,具体用于:获取审查事件的待审查要素;将已审查要素与待审查要素进行对比,确定未审查要素。
在一些实例中,通信组件703,具体用于:将未审查要素发送至展示终端,进行展示。
另外,本发明实施例提供了一种计算机存储介质,计算机程序被一个或多个处理器执行时,致使一个或多个处理器实现图2方法实施例中信息的检测方法的步骤。
以上描述了图6所示的检测装置600的内部功能和结构,在一个可能的设计中,图6所示的检测装置600的结构可实现为终端或服务器,如图8A或图8B所示,该终端800A或服务器800B可以包括:存储器801、处理器802以及通信组件803;
存储器801,用于存储计算机程序。
通信组件803,用于提供未审查要素。
处理器802,用于执行计算机程序,以用于:获取审查事件中的审查文本;确定审查文本的已审查要素;至少根据已审查要素,确定审查事件的未审查要素。
在一些实例中,通信组件803,用于展示未审查要素。
在一些实例中,通信组件803,用于将未审查要素发送至展示终端,进行展示。
另外,本发明实施例提供了一种计算机存储介质,计算机程序被一个或多个处理器执行时,致使一个或多个处理器实现图3方法实施例中信息的检测方法的步骤。
另外,在上述实施例及附图中的描述的一些流程中,包含了按照特定顺序出现的多个操作,但是应该清楚了解,这些操作可以不按照其在本文中出现的顺序来执行或并行执行,操作的序号如201、202、203等,仅仅是用于区分开各个不同的操作,序号本身不代表任何的执行顺序。另外,这些流程可以包括更多或更少的操作,并且这些操作可以按顺序执行或并行执行。需要说明的是,本文中的“第一”、“第二”等描述,是用于区分不同的消息、设备、模块等,不代表先后顺序,也不限定“第一”和“第二”是不同的类型。
以上所描述的装置实施例仅仅是示意性的,其中所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。本领域普通技术人员在不付出创造性的劳动的情况下,即可以理解并实施。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到各实施方式可借助加必需的通用硬件平台的方式来实现,当然也可以通过硬件和软件结合的方式来实现。基于这样的理解,上述技术方案本质上或者说对现有技术做出贡献的部分可以以计算机产品的形式体现出来,本发明可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本发明是参照根据本发明实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程多媒体数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程多媒体数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程多媒体数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程多媒体数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
在一个典型的配置中,计算设备包括一个或多个处理器(CPU)、输入/输出接口、网络接口和内存。
内存可能包括计算机可读介质中的非永久性存储器,随机存取存储器(RAM)和/或非易失性内存等形式,如只读存储器(ROM)或闪存(flash RAM)。内存是计算机可读介质的示例。
计算机可读介质包括永久性和非永久性、可移动和非可移动媒体可以由任何方法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序的模块或其他数据。计算机的存储介质的例子包括,但不限于相变内存(PRAM)、静态随机存取存储器(SRAM)、动态随机存取存储器(DRAM)、其他类型的随机存取存储器(RAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、快闪记忆体或其他内存技术、只读光盘只读存储器(CD-ROM)、数字多功能光盘(DVD)或其他光学存储、磁盒式磁带,磁带磁磁盘存储或其他磁性存储设备或任何其他非传输介质,可用于存储可以被计算设备访问的信息。按照本文中的界定,计算机可读介质不包括暂存电脑可读媒体(transitory media),如调制的数据信号和载波。
最后应说明的是:以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。
Claims (15)
1.一种信息的检测方法,其特征在于,包括:
获取审查事件中识别审查语音得到的审查文本;
确定所述审查文本中各个句子的特征数据;
确定所述特征数据对应的类型,作为已审查要素;
至少根据所述已审查要素,确定所述审查事件的未审查要素。
2.根据权利要求1所述的方法,其特征在于,所述方法还包括:
提供所述未审查要素,以提醒审查人员对所述未审查要素进行审查。
3.根据权利要求1所述的方法,其特征在于,所述获取审查事件中识别审查语音得到的审查文本,包括:
接收所述审查事件中的审查语音;
识别所述审查语音对应的文字;
对所述文字进行文字平滑处理,得到所述审查文本。
4.根据权利要求1所述的方法,其特征在于,所述确定所述审查文本中各个句子的特征数据,包括:
将所述各个句子输入至预置语言模型中,获取对应句子的表征向量,作为句子的特征数据。
5.根据权利要求4所述的方法,其特征在于,所述确定所述特征数据对应的类型,作为所述已审查要素,包括:
将所述表征向量输入至预置分类模型中,获取对应的分类标签,作为所述已审查要素。
6.根据权利要求1所述的方法,其特征在于,所述至少根据所述已审查要素,确定所述审查事件的未审查要素,包括:
获取所述审查事件的待审查要素;
将所述已审查要素与所述待审查要素进行对比,确定所述未审查要素。
7.根据权利要求2所述的方法,其特征在于,所述提供所述未审查要素,包括:
将所述未审查要素发送至展示终端,进行展示。
8.一种信息的检测方法,其特征在于,包括:
获取审查事件中识别审查语音得到的审查文本;
确定所述审查文本中各个句子的特征数据;
确定所述特征数据对应的类型,作为已审查要素;
至少根据所述已审查要素,确定所述审查事件的未审查要素;
提供所述未审查要素。
9.根据权利要求8所述的方法,其特征在于,所述提供所述未审查要素,包括:
展示所述未审查要素。
10.根据权利要求8所述的方法,其特征在于,所述提供所述未审查要素,包括:
将所述未审查要素发送至展示终端,进行展示。
11.一种信息的检测系统,其特征在于,包括:第一设备以及第二设备;
所述第一设备,用于获取审查事件中识别审查语音得到的审查文本;
确定所述审查文本中各个句子的特征数据;
确定所述特征数据对应的类型,作为已审查要素;
至少根据所述已审查要素,确定所述审查事件的未审查要素,并将所述未审查要素提供至所述第二设备;
所述第二设备,用于展示所述未审查要素。
12.一种设备,包括存储器以及处理器;
所述存储器,用于存储计算机程序;
所述处理器,用于执行所述计算机程序,以用于:获取审查事件中识别审查语音得到的审查文本;
确定所述审查文本中各个句子的特征数据;
确定所述特征数据对应的类型,作为已审查要素;
至少根据所述已审查要素,确定所述审查事件的未审查要素。
13.一种存储有计算机程序的计算机可读存储介质,其特征在于,计算机程序被一个或多个处理器执行时,致使所述一个或多个处理器实现权利要求1-7任一项所述方法中的步骤。
14.一种设备,包括存储器、处理器以及通信组件;
所述存储器,用于存储计算机程序;
所述通信组件,用于提供未审查要素;
所述处理器,用于执行所述计算机程序,以用于:
获取审查事件中识别审查语音得到的审查文本;
确定所述审查文本中各个句子的特征数据;
确定所述特征数据对应的类型,作为已审查要素;
至少根据所述已审查要素,确定所述审查事件的未审查要素。
15.一种存储有计算机程序的计算机可读存储介质,其特征在于,计算机程序被一个或多个处理器执行时,致使所述一个或多个处理器实现权利要求8-10任一项所述方法中的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910462635.6A CN112015858B (zh) | 2019-05-30 | 2019-05-30 | 信息的检测方法、设备及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910462635.6A CN112015858B (zh) | 2019-05-30 | 2019-05-30 | 信息的检测方法、设备及存储介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN112015858A CN112015858A (zh) | 2020-12-01 |
CN112015858B true CN112015858B (zh) | 2024-02-13 |
Family
ID=73501412
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910462635.6A Active CN112015858B (zh) | 2019-05-30 | 2019-05-30 | 信息的检测方法、设备及存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112015858B (zh) |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101763361A (zh) * | 2008-12-08 | 2010-06-30 | 新奥特硅谷视频技术有限责任公司 | 一种庭审过程中语音资料实时验证的方法和装置 |
CN107209810A (zh) * | 2015-02-05 | 2017-09-26 | 皇家飞利浦有限公司 | 用于支持放射学报告的动态核查表的通信系统 |
CN109003608A (zh) * | 2018-08-07 | 2018-12-14 | 北京东土科技股份有限公司 | 庭审控制方法、系统、计算机设备及存储介质 |
CN109213466A (zh) * | 2017-06-30 | 2019-01-15 | 北京国双科技有限公司 | 庭审信息的显示方法及装置 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6526382B1 (en) * | 1999-12-07 | 2003-02-25 | Comverse, Inc. | Language-oriented user interfaces for voice activated services |
-
2019
- 2019-05-30 CN CN201910462635.6A patent/CN112015858B/zh active Active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101763361A (zh) * | 2008-12-08 | 2010-06-30 | 新奥特硅谷视频技术有限责任公司 | 一种庭审过程中语音资料实时验证的方法和装置 |
CN107209810A (zh) * | 2015-02-05 | 2017-09-26 | 皇家飞利浦有限公司 | 用于支持放射学报告的动态核查表的通信系统 |
CN109213466A (zh) * | 2017-06-30 | 2019-01-15 | 北京国双科技有限公司 | 庭审信息的显示方法及装置 |
CN109003608A (zh) * | 2018-08-07 | 2018-12-14 | 北京东土科技股份有限公司 | 庭审控制方法、系统、计算机设备及存储介质 |
Also Published As
Publication number | Publication date |
---|---|
CN112015858A (zh) | 2020-12-01 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110263157B (zh) | 一种数据风险预测方法、装置及设备 | |
CN112686036B (zh) | 风险文本识别方法、装置、计算机设备及存储介质 | |
CN112686022A (zh) | 违规语料的检测方法、装置、计算机设备及存储介质 | |
CN109299276B (zh) | 一种将文本转化为词嵌入、文本分类方法和装置 | |
CN112951233A (zh) | 语音问答方法、装置、电子设备及可读存储介质 | |
CN116415017A (zh) | 基于人工智能的广告敏感内容审核方法及系统 | |
CN112906361A (zh) | 文本数据的标注方法和装置、电子设备和存储介质 | |
CN115525750A (zh) | 机器人话术检测可视化方法、装置、电子设备及存储介质 | |
CN117520503A (zh) | 基于llm模型的金融客服对话生成方法、装置、设备及介质 | |
CN113657773A (zh) | 话术质检方法、装置、电子设备及存储介质 | |
CN115982388B (zh) | 案件质控图谱建立、案件文书质检方法、设备及存储介质 | |
CN113515593A (zh) | 基于聚类模型的话题检测方法、装置和计算机设备 | |
CN112015858B (zh) | 信息的检测方法、设备及存储介质 | |
US11880798B2 (en) | Determining section conformity and providing recommendations | |
CN115620726A (zh) | 语音文本生成方法、语音文本生成模型的训练方法、装置 | |
CN114842385A (zh) | 学科教培视频审核方法、装置、设备及介质 | |
CN115080864A (zh) | 基于人工智能的产品推荐方法、装置、计算机设备及介质 | |
CN111488737B (zh) | 文本识别方法、装置及设备 | |
CN114238968A (zh) | 应用程序检测方法及装置、存储介质及电子设备 | |
CN113836297A (zh) | 文本情感分析模型的训练方法及装置 | |
CN113449506A (zh) | 一种数据检测方法、装置、设备及可读存储介质 | |
CN112786041A (zh) | 语音处理方法及相关设备 | |
CN112131378A (zh) | 用于识别民生问题类别的方法、装置及电子设备 | |
CN113255361B (zh) | 语音内容的自动检测方法、装置、设备以及存储介质 | |
CN117034033A (zh) | 数据检测方法、装置、处理器及电子设备 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |