CN111681673B - 庭审过程中敲法槌的识别方法及系统 - Google Patents

庭审过程中敲法槌的识别方法及系统 Download PDF

Info

Publication number
CN111681673B
CN111681673B CN202010460385.5A CN202010460385A CN111681673B CN 111681673 B CN111681673 B CN 111681673B CN 202010460385 A CN202010460385 A CN 202010460385A CN 111681673 B CN111681673 B CN 111681673B
Authority
CN
China
Prior art keywords
hammer
probability
image
sound
striking
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202010460385.5A
Other languages
English (en)
Other versions
CN111681673A (zh
Inventor
陈忠宇
卫东雷
刘燕飞
单衍景
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
BEIJING HUAXIA DENTSU TECHNOLOGY CO LTD
Original Assignee
BEIJING HUAXIA DENTSU TECHNOLOGY CO LTD
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by BEIJING HUAXIA DENTSU TECHNOLOGY CO LTD filed Critical BEIJING HUAXIA DENTSU TECHNOLOGY CO LTD
Priority to CN202010460385.5A priority Critical patent/CN111681673B/zh
Publication of CN111681673A publication Critical patent/CN111681673A/zh
Application granted granted Critical
Publication of CN111681673B publication Critical patent/CN111681673B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/48Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use
    • G10L25/51Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for comparison or discrimination
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/50Context or environment of the image
    • G06V20/52Surveillance or monitoring of activities, e.g. for recognising suspicious objects
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02PCLIMATE CHANGE MITIGATION TECHNOLOGIES IN THE PRODUCTION OR PROCESSING OF GOODS
    • Y02P90/00Enabling technologies with a potential contribution to greenhouse gas [GHG] emissions mitigation
    • Y02P90/30Computing systems specially adapted for manufacturing

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Physics & Mathematics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Signal Processing (AREA)
  • Acoustics & Sound (AREA)
  • Computational Linguistics (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Measurement Of Mechanical Vibrations Or Ultrasonic Waves (AREA)
  • Auxiliary Devices For Music (AREA)

Abstract

本发明提供一种庭审过程中敲法槌的识别方法及系统,该方法包括:对获取的与敲法槌相关的语音信息进行识别,确定与敲法槌相关的关键词时间点;获取基于关键词时间点设置的预设时间范围内敲法槌的图像和声音信息;对图像和声音信息分别进行分析,获得图像和声音分析结果;基于贝叶斯定理,根据图像和声音分析结果分别确定图像中敲法槌概率、声音中敲法槌概率;根据图像中敲法槌概率和声音中敲法槌概率确定最终敲法槌概率;将最终敲法槌概率与最终结果命中率阈值进行比较,当最终敲法槌概率超过最终结果命中率阈值时,表明在庭审过程中法官有敲法槌的动作。该方案对分析结果进行数据精加工,并多维度进行分析,减少错误结果,提升准确性。

Description

庭审过程中敲法槌的识别方法及系统
技术领域
本发明涉及人工智能技术领域,特别涉及一种庭审过程中敲法槌的识别方法及系统。
背景技术
随着人工智能技术的发展,法庭庭审过程中监督法官是否按规定敲法槌也应用了人工智能技术,例如图像分析技术,声音分析技术,但是大多使用单一,要么单纯依赖图像分析,要么单纯依赖声音分析,且在使用的过程中由于法庭内部光线情况,图像清晰程度,杂音干扰等原因导致智能识别结果并不是很准确,甚至无法识别,无法起到监督法官的作用。
针对上述问题,目前尚未提出有效的解决方案。
发明内容
本发明实施例提供了一种庭审过程中敲法槌的识别方法及系统,解决了现有技术中智能识别结果不准确、无法识别法官是否按规定敲法槌以及无法起到监督法官的作用的技术问题。
本发明实施例提供了一种庭审过程中敲法槌的识别方法,该方法包括:
获取与敲法槌相关的语音信息,对所述语音信息进行语音识别,确定与敲法槌相关的关键词的关键词时间点;
获取基于所述关键词时间点设置的预设时间范围内敲法槌的图像信息和声音信息;
对所述图像信息和所述声音信息分别进行分析,获得图像分析结果和声音分析结果;
基于贝叶斯定理,根据图像分析结果确定图像中敲法槌概率,根据声音分析结果确定声音中敲法槌概率;
根据所述图像中敲法槌概率和声音中敲法槌概率确定最终敲法槌概率;
将所述最终敲法槌概率与最终结果命中率阈值进行比较,当所述最终敲法槌概率超过最终结果命中率阈值时,表明在庭审过程中法官有敲法槌的动作;
所述图像分析结果包括是否检测出敲法槌动作和图像是否存在质量问题、是否检测出敲法槌动作其中之一;
所述声音分析结果包括是否检测出敲法槌动作和声音是否存在质量问题、是否检测出敲法槌动作其中之一;
当所述图像分析结果包括检测出敲法槌动作和图像存在质量问题、所述声音分析结果包括检测出敲法槌动作和声音存在质量问题时,基于贝叶斯定理,根据图像分析结果确定图像中敲法槌概率,根据声音分析结果确定声音中敲法槌概率,包括:
基于检测出敲法槌动作,确定图像检测准确概率和图像检测不准确概率;
基于检测出图像存在质量问题,确定对图像检测的信赖度;
基于贝叶斯定理,根据图像检测准确概率、图像检测不准确概率和对图像检测的信赖度确定图像中敲法槌概率;
基于贝叶斯定理,根据声音分析结果确定声音中敲法槌概率,包括:
基于检测出敲法槌动作,确定声音检测准确概率和声音检测不准确概率;
基于检测出图像存在质量问题,确定对声音检测的信赖度;
基于贝叶斯定理,根据声音检测准确概率、声音检测不准确概率和对声音检测的信赖度确定声音中敲法槌概率。
本发明实施例还提供了一种庭审过程中敲法槌的识别系统,该系统包括:语音识别装置、图像分析装置、声音分析装置和统计分析装置;
语音识别装置用于:获取与敲法槌相关的语音信息,对所述语音信息进行语音识别,确定与敲法槌相关的关键词的关键词时间点;
图像分析装置用于:获取基于所述关键词时间点设置的预设时间范围内敲法槌的图像信息,对所述图像信息进行分析,获得图像分析结果;
声音分析装置用于:获取基于所述关键词时间点设置的预设时间范围内敲法槌的声音信息,对所述声音信息进行分析,获得声音分析结果;
统计分析装置用于:基于贝叶斯定理,根据图像分析结果确定图像中敲法槌概率,根据声音分析结果确定声音中敲法槌概率;根据所述图像中敲法槌概率和声音中敲法槌概率确定最终敲法槌概率;将所述最终敲法槌概率与最终结果命中率阈值进行比较,当所述最终敲法槌概率超过最终结果命中率阈值时,表明在庭审过程中法官有敲法槌的动作;
所述图像分析结果包括检测出敲法槌动作和图像存在质量问题、所述声音分析结果包括检测出敲法槌动作和声音存在质量问题,统计分析装置具体用于:
基于检测出敲法槌动作,确定图像检测准确概率和图像检测不准确概率;
基于检测出图像存在质量问题,确定对图像检测的信赖度;
基于贝叶斯定理,根据图像检测准确概率、图像检测不准确概率和对图像检测的信赖度确定图像中敲法槌概率;
基于检测出敲法槌动作,确定声音检测准确概率和声音检测不准确概率;
基于检测出图像存在质量问题,确定对声音检测的信赖度;
基于贝叶斯定理,根据声音检测准确概率、声音检测不准确概率和对声音检测的信赖度确定声音中敲法槌概率。
本发明实施例还提供了一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现上述所述方法。
本发明实施例还提供了一种计算机可读存储介质,所述计算机可读存储介质存储有执行上述所述方法的计算机程序。
在本发明实施例中,通过语音、图像和声音识别分析,再基于贝叶斯定理,根据对图像和声音的分析概率确定在庭审过程中法官是否有敲法槌,与现有技术相比,本发明从多个维度进行分析,如图像识别,声音识别,语音识别,并将最终结果进行统计,从而提升识别准确率。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本发明实施例提供的一种庭审过程中敲法槌的识别方法流程图一;
图2是本发明实施例提供的一种庭审过程中敲法槌的识别方法流程图二;
图3是本发明实施例提供的一种庭审过程中敲法槌的识别系统结构框图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
在本发明实施例中,提供了一种庭审过程中敲法槌的识别方法,如图1所示,该方法包括:
步骤102:获取与敲法槌相关的语音信息,对所述语音信息进行语音识别,确定与敲法槌相关的关键词的关键词时间点;
步骤104:获取基于所述关键词时间点设置的预设时间范围内敲法槌的图像信息和声音信息;
步骤106:对所述图像信息和所述声音信息分别进行分析,获得图像分析结果和声音分析结果;
步骤108:基于贝叶斯定理,根据图像分析结果确定图像中敲法槌概率,根据声音分析结果确定声音中敲法槌概率;
步骤110:根据所述图像中敲法槌概率和声音中敲法槌概率确定最终敲法槌概率;
步骤112:将所述最终敲法槌概率与最终结果命中率阈值进行比较,当所述最终敲法槌概率超过最终结果命中率阈值时,表明在庭审过程中法官有敲法槌的动作。
在本发明实施例中,步骤102是通过语音识别装置(包括语音识别装置和语音识别服务器)获取与敲法槌相关的语音信息;步骤104中是通过图像分析装置(包括图像获取装置和图像分析服务器)获取基于所述关键词时间点设置的预设时间范围内敲法槌的图像信息,通过声音分析装置(包括声音分析装置和声音分析服务器)获取基于所述关键词时间点设置的预设时间范围内敲法槌的声音信息。由于想要识别敲法槌需要多种分析共同完成,包括图像,声音,语音识别,如果服务器时间不相同,会导致最终结果不准。所以,该方法还包括:
通过ntp服务同步语音识别装置、图像分析装置和声音分析装置的时间。
在本发明实施例中,步骤102中,法官每一次敲法槌,都有会一些关键词进行匹配,例如开庭敲法槌,法官会说现在开庭;闭庭敲法槌,法官会说现在闭庭。首先配置语音识别关键词范围,通过匹配关键词可以更精准的确定法官敲法槌的大致时间点,在这段时间之内识别敲法槌这个动作会使准确率提高。
在本发明实施例中,预设时间范围是根据所述关键词时间点而设置的,需要配置关键词时间点前后多久检测敲法槌。这个时间范围根据实际情况设置不同。
在本发明实施例中,图像分析结果可以包括是否检测出敲法槌动作和图像是否存在质量问题、是否检测出敲法槌动作其中之一。声音分析结果包括是否检测出敲法槌动作和声音是否存在质量问题、是否检测出敲法槌动作其中之一。
具体的,步骤106至步骤112中,为使检测结果更加精准,接收到图像分析结果和声音分析结果,并不直接使用,而是进行分析结果统计,尽最大可能的排除干扰。并使用贝叶斯定理进行检测结果分析,公式如下:
Figure GDA0004242245870000051
分析过程主要有如下步骤:
1、计算图像检测敲法槌概率:
设B为图像检测准确概率,G为图像检测不准确概率,E为对图像检测的信赖度,那么这件事分为两种情况,因为贝叶斯里面现象部分总是分两种情况出现的:
(1)图像检测分析结果准确,并最终采纳了图像检测的结果,则概率为:
P(E,B)=P(B)×P(E|B);
图像检测分析错误,但是最终采纳了图像算法的结果,则概率为:
P(E,~B)=P(~B)×P(E|~B)=P(~B)×(1-P(~E|~B));
P(E)=P(E,B)+P(E,~B);
(2)最终图像检测成功检测出敲法槌的概率为:
P(B|E)=P(E,B)/P(E);
以上图像检测的检测概率,是在图像质量检测没问题的情况下得出的。但是,在庭审过程中由于法庭内部光线情况,图像清晰程度,杂音干扰等原因可能会导致分析结果并不是很准确,甚至无法识别。基于此,为了避免其他因素干扰,如图像过暗导致图像分析识别结果不准,有噪声杂音导致声音识别不准,引进了图像质量检测,如图2所示,当检测出对应的图像质量问题时,对应的E则会变小,也就是当关键词时间点附近有图像质量违规时,认为此时图像检测的敲法槌动作事是相对不可信的。
下面将带入具体数据进行分析:
设B=30%;G=70%;E=40%,则P(B)=0.3,P(G)=P(~B)=0.7。
P(E,B)=P(B)×P(E|B)=0.3×0.4=0.12;
P(E,~B)=P(~B)×P(E|~B)=P(~B)×(1-P(~E|~B))=0.7×(1-0.4)=0.42;
P(E)=P(E,B)+P(E,~B)=0.12+0.42=0.54;
P(B|E)=P(E,B)/P(E)=0.12/0.54=0.22=22%。
此时单纯依靠图像检测,检测出敲法槌的概率为22%。如果同时检测出图像质量违规,那么E会下降,导致最终结果的概率会进一步降低。
例如:产生图像质量违规,则E为40%=>30%;最终P(B|E)=P(E,B)/P(E)=0.09/0.58=0.15=15%。
通过模拟计算得出当只有图像检测时,关键词时间点附近无图像质量违规,敲法槌的概率为22%,当有图像质量违规时,敲法槌的概率为15%;当然对于E值以及图像质量对E的影响比例是可以调节的,最终得出的概率值也会对应产生变化。
2、计算声音检测敲法槌概率:
公式同上,直接带入数据进行模拟计算:
设B=60%;G=40%;E=60%,则P(B)=0.6,P(G)=P(~B)=0.4。
P(E,B)=P(B)×P(E|B)=0.6×0.6=0.36;
P(E,~B)=P(~B)×P(E|~B)=P(~B)×(1-P(~E|~B))=0.4×(1-0.6)=0.16;
P(E)=P(E,B)+P(E,~B)=0.36+0.16=0.52;
P(B|E)=P(E,B)/P(E)=0.36/0.52=0.69=69%。
此时单纯依靠声音检测,检测出敲法槌的概率为69%。如果同时检测出声音质量违规,那么E会下降,导致最终结果的概率会进一步降低。
例如:产生声音质量违规,则E为60%=>50%;最终P(B|E)=P(E,B)/P(E)=0.3/0.5=0.6=60%。
通过模拟计算得出当只有声音检测时,关键词时间点附近无声音质量违规,敲法槌的概率为69%,当有声音质量违规时,敲法槌的概率为60%;当然对于E值以及声音质量对E的影响比例是可以调节的,最终得出的概率值也会对应产生变化。
根据图像,声音检测概率计算最终结果。
在本发明实施例中,为了满足不同需求,可以设置最终检测结果方式,该最终检测结果方式可以包括以精准率优先的方式或以检测出结果优先的方式。
以精准率优先:
P(AB)=P(A)×P(B);
以检测出结果优先:
P(E)=1-(1-P(A))×(1-P(B))。
基于同一发明构思,本发明实施例中还提供了一种庭审过程中敲法槌的识别系统,如下面的实施例所述。由于庭审过程中敲法槌的识别系统解决问题的原理与庭审过程中敲法槌的识别方法相似,因此庭审过程中敲法槌的识别系统的实施可以参见庭审过程中敲法槌的识别方法的实施,重复之处不再赘述。
图3是本发明实施例的庭审过程中敲法槌的识别系统结构框图,如图3所示,包括:语音识别装置、图像分析装置、声音分析装置和统计分析装置;
语音识别装置用于:获取与敲法槌相关的语音信息,对所述语音信息进行语音识别,确定与敲法槌相关的关键词的关键词时间点;
图像分析装置用于:获取基于所述关键词时间点设置的预设时间范围内敲法槌的图像信息,对所述图像信息进行分析,获得图像分析结果;
声音分析装置用于:获取基于所述关键词时间点设置的预设时间范围内敲法槌的声音信息,对所述声音信息进行分析,获得声音分析结果;
统计分析装置用于:基于贝叶斯定理,根据图像分析结果确定图像中敲法槌概率,根据声音分析结果确定声音中敲法槌概率;根据所述图像中敲法槌概率和声音中敲法槌概率确定最终敲法槌概率;将所述最终敲法槌概率与最终结果命中率阈值进行比较,当所述最终敲法槌概率超过最终结果命中率阈值时,表明在庭审过程中法官有敲法槌的动作。
在本发明实施例中,通过ntp服务同步语音识别装置、图像分析装置和声音分析装置的时间。
在本发明实施例中,所述图像分析结果包括是否检测出敲法槌动作和图像是否存在质量问题、是否检测出敲法槌动作其中之一;
所述声音分析结果包括是否检测出敲法槌动作和声音是否存在质量问题、是否检测出敲法槌动作其中之一。
在本发明实施例中,所述图像分析结果包括检测出敲法槌动作和图像存在质量问题、所述声音分析结果包括检测出敲法槌动作和声音存在质量问题,统计分析装置具体用于:
基于检测出敲法槌动作,确定图像检测准确概率和图像检测不准确概率;
基于检测出图像存在质量问题,确定对图像检测的信赖度;
基于贝叶斯定理,根据图像检测准确概率、图像检测不准确概率和对图像检测的信赖度确定图像中敲法槌概率;
基于检测出敲法槌动作,确定声音检测准确概率和声音检测不准确概率;
基于检测出图像存在质量问题,确定对声音检测的信赖度;
基于贝叶斯定理,根据声音检测准确概率、声音检测不准确概率和对声音检测的信赖度确定声音中敲法槌概率。
在本发明实施例中,统计分析装置具体用于:
确定最终检测结果方式;
基于所述最终检测结果方式,根据所述图像中敲法槌概率和声音中敲法槌概率确定最终敲法槌概率。
本发明实施例还提供了一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现上述所述方法。
本发明实施例还提供了一种计算机可读存储介质,所述计算机可读存储介质存储有执行上述所述方法的计算机程序。
综上所述,本发明设计了在庭审过程中通过智能分析的方式监督法官是否按规定敲法槌,通过智能监督的方式,减少了法官在开庭过程中流程的不规范,既减少了人力资源的消耗,又保证了庭审过程的严肃、认真。针对法庭复杂的环境,本发明设计引入了图像分析,声音分析,语音识别等功能,通过确定关键词的时间,来精准的检测敲法槌的动作时间范围,缩小了检测时间范围的同时又提升了准确率,不全程的检测的方式也缓解了设备的运行压力。同时判断是否在关键词附近有图像,声音的质量问题,并使用贝叶斯定理进行结果分析,最大程度提升了检测结果的准确性。同时本发明所使用的法槌检测过程是通过大量实验,并经过一系列改良验证后得到的,并通过了多次实际验证,准确性很高。
本领域内的技术人员应明白,本发明的实施例可提供为方法、系统、或计算机程序产品。因此,本发明可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本发明可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本发明是参照根据本发明实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
以上所述仅为本发明的优选实施例而已,并不用于限制本发明,对于本领域的技术人员来说,本发明实施例可以有各种更改和变化。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (7)

1.一种庭审过程中敲法槌的识别方法,其特征在于,包括:
获取与敲法槌相关的语音信息,对所述语音信息进行语音识别,确定与敲法槌相关的关键词的关键词时间点;
获取基于所述关键词时间点设置的预设时间范围内敲法槌的图像信息和声音信息;
对所述图像信息和所述声音信息分别进行分析,获得图像分析结果和声音分析结果;
基于贝叶斯定理,根据图像分析结果确定图像中敲法槌概率,根据声音分析结果确定声音中敲法槌概率;
根据所述图像中敲法槌概率和声音中敲法槌概率确定最终敲法槌概率;
将所述最终敲法槌概率与最终结果命中率阈值进行比较,当所述最终敲法槌概率超过最终结果命中率阈值时,表明在庭审过程中法官有敲法槌的动作;
所述图像分析结果包括是否检测出敲法槌动作和图像是否存在质量问题、是否检测出敲法槌动作其中之一;
所述声音分析结果包括是否检测出敲法槌动作和声音是否存在质量问题、是否检测出敲法槌动作其中之一;
当所述图像分析结果包括检测出敲法槌动作和图像存在质量问题、所述声音分析结果包括检测出敲法槌动作和声音存在质量问题时,基于贝叶斯定理,根据图像分析结果确定图像中敲法槌概率,根据声音分析结果确定声音中敲法槌概率,包括:
基于检测出敲法槌动作,确定图像检测准确概率和图像检测不准确概率;
基于检测出图像存在质量问题,确定对图像检测的信赖度;
基于贝叶斯定理,根据图像检测准确概率、图像检测不准确概率和对图像检测的信赖度确定图像中敲法槌概率;
基于贝叶斯定理,根据声音分析结果确定声音中敲法槌概率,包括:
基于检测出敲法槌动作,确定声音检测准确概率和声音检测不准确概率;
基于检测出图像存在质量问题,确定对声音检测的信赖度;
基于贝叶斯定理,根据声音检测准确概率、声音检测不准确概率和对声音检测的信赖度确定声音中敲法槌概率。
2.如权利要求1所述的庭审过程中敲法槌的识别方法,其特征在于,所述获取与敲法槌相关的语音信息,包括:
通过语音识别装置获取与敲法槌相关的语音信息;
获取基于所述关键词时间点设置的预设时间范围内敲法槌的图像信息和声音信息,包括:
通过图像分析装置获取基于所述关键词时间点设置的预设时间范围内敲法槌的图像信息,通过声音分析装置获取基于所述关键词时间点设置的预设时间范围内敲法槌的声音信息;
还包括:
通过ntp服务同步语音识别装置、图像分析装置和声音分析装置的时间。
3.如权利要求1所述的庭审过程中敲法槌的识别方法,其特征在于,还包括:
确定最终检测结果方式;
根据所述图像中敲法槌概率和声音中敲法槌概率确定最终敲法槌概率,包括:
基于所述最终检测结果方式,根据所述图像中敲法槌概率和声音中敲法槌概率确定最终敲法槌概率。
4.一种庭审过程中敲法槌的识别系统,其特征在于,包括:语音识别装置、图像分析装置、声音分析装置和统计分析装置;
语音识别装置用于:获取与敲法槌相关的语音信息,对所述语音信息进行语音识别,确定与敲法槌相关的关键词的关键词时间点;
图像分析装置用于:获取基于所述关键词时间点设置的预设时间范围内敲法槌的图像信息,对所述图像信息进行分析,获得图像分析结果;
声音分析装置用于:获取基于所述关键词时间点设置的预设时间范围内敲法槌的声音信息,对所述声音信息进行分析,获得声音分析结果;
统计分析装置用于:基于贝叶斯定理,根据图像分析结果确定图像中敲法槌概率,根据声音分析结果确定声音中敲法槌概率;根据所述图像中敲法槌概率和声音中敲法槌概率确定最终敲法槌概率;将所述最终敲法槌概率与最终结果命中率阈值进行比较,当所述最终敲法槌概率超过最终结果命中率阈值时,表明在庭审过程中法官有敲法槌的动作;
所述图像分析结果包括检测出敲法槌动作和图像存在质量问题、所述声音分析结果包括检测出敲法槌动作和声音存在质量问题,统计分析装置具体用于:
基于检测出敲法槌动作,确定图像检测准确概率和图像检测不准确概率;
基于检测出图像存在质量问题,确定对图像检测的信赖度;
基于贝叶斯定理,根据图像检测准确概率、图像检测不准确概率和对图像检测的信赖度确定图像中敲法槌概率;
基于检测出敲法槌动作,确定声音检测准确概率和声音检测不准确概率;
基于检测出图像存在质量问题,确定对声音检测的信赖度;
基于贝叶斯定理,根据声音检测准确概率、声音检测不准确概率和对声音检测的信赖度确定声音中敲法槌概率。
5.如权利要求4所述的庭审过程中敲法槌的识别系统,其特征在于,统计分析装置具体用于:
确定最终检测结果方式;
基于所述最终检测结果方式,根据所述图像中敲法槌概率和声音中敲法槌概率确定最终敲法槌概率。
6.一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求1至3任一项所述方法。
7.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储有执行权利要求1至3任一项所述方法的计算机程序。
CN202010460385.5A 2020-05-27 2020-05-27 庭审过程中敲法槌的识别方法及系统 Active CN111681673B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010460385.5A CN111681673B (zh) 2020-05-27 2020-05-27 庭审过程中敲法槌的识别方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010460385.5A CN111681673B (zh) 2020-05-27 2020-05-27 庭审过程中敲法槌的识别方法及系统

Publications (2)

Publication Number Publication Date
CN111681673A CN111681673A (zh) 2020-09-18
CN111681673B true CN111681673B (zh) 2023-06-20

Family

ID=72452758

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010460385.5A Active CN111681673B (zh) 2020-05-27 2020-05-27 庭审过程中敲法槌的识别方法及系统

Country Status (1)

Country Link
CN (1) CN111681673B (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114241521A (zh) * 2021-12-13 2022-03-25 北京华夏电通科技股份有限公司 一种识别庭审视频画面中法台区域的方法、装置及设备

Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105430316A (zh) * 2015-11-25 2016-03-23 北京华夏电通科技有限公司 庭审录像自动控制系统及方法
CN108345442A (zh) * 2018-01-18 2018-07-31 维沃移动通信有限公司 一种操作识别方法及移动终端
CN109830238A (zh) * 2018-12-24 2019-05-31 北京航空航天大学 塔台管制员工作状态的检测方法、装置及系统
CN109934731A (zh) * 2019-01-25 2019-06-25 广州富港万嘉智能科技有限公司 一种基于图像识别的点餐方法、电子设备及存储介质
CN110223690A (zh) * 2019-06-10 2019-09-10 深圳永顺智信息科技有限公司 基于图像与语音融合的人机交互方法及装置
CN110533288A (zh) * 2019-07-23 2019-12-03 平安科技(深圳)有限公司 业务办理流程检测方法、装置、计算机设备和存储介质
CN110647831A (zh) * 2019-09-12 2020-01-03 华宇(大连)信息服务有限公司 一种庭审巡查方法和系统
CN110659542A (zh) * 2018-06-29 2020-01-07 杭州海康威视数字技术股份有限公司 监控方法及装置
CN111161743A (zh) * 2019-12-31 2020-05-15 秒针信息技术有限公司 基于语音识别的收银监督方法及系统

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107134279B (zh) * 2017-06-30 2020-06-19 百度在线网络技术(北京)有限公司 一种语音唤醒方法、装置、终端和存储介质
CN110875060A (zh) * 2018-08-31 2020-03-10 阿里巴巴集团控股有限公司 语音信号处理方法、装置、系统、设备和存储介质

Patent Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105430316A (zh) * 2015-11-25 2016-03-23 北京华夏电通科技有限公司 庭审录像自动控制系统及方法
CN108345442A (zh) * 2018-01-18 2018-07-31 维沃移动通信有限公司 一种操作识别方法及移动终端
CN110659542A (zh) * 2018-06-29 2020-01-07 杭州海康威视数字技术股份有限公司 监控方法及装置
CN109830238A (zh) * 2018-12-24 2019-05-31 北京航空航天大学 塔台管制员工作状态的检测方法、装置及系统
CN109934731A (zh) * 2019-01-25 2019-06-25 广州富港万嘉智能科技有限公司 一种基于图像识别的点餐方法、电子设备及存储介质
CN110223690A (zh) * 2019-06-10 2019-09-10 深圳永顺智信息科技有限公司 基于图像与语音融合的人机交互方法及装置
CN110533288A (zh) * 2019-07-23 2019-12-03 平安科技(深圳)有限公司 业务办理流程检测方法、装置、计算机设备和存储介质
CN110647831A (zh) * 2019-09-12 2020-01-03 华宇(大连)信息服务有限公司 一种庭审巡查方法和系统
CN111161743A (zh) * 2019-12-31 2020-05-15 秒针信息技术有限公司 基于语音识别的收银监督方法及系统

Also Published As

Publication number Publication date
CN111681673A (zh) 2020-09-18

Similar Documents

Publication Publication Date Title
US10957339B2 (en) Speaker recognition method and apparatus, computer device and computer-readable medium
CN108875833B (zh) 神经网络的训练方法、人脸识别方法及装置
CN111639497B (zh) 一种基于大数据机器学习的异常行为发现方法
WO2020073714A1 (zh) 训练样本获取方法,账户预测方法及对应装置
CN108038176B (zh) 一种路人库的建立方法、装置、电子设备及介质
US10832032B2 (en) Facial recognition method, facial recognition system, and non-transitory recording medium
JP2022141931A (ja) 生体検出モデルのトレーニング方法及び装置、生体検出の方法及び装置、電子機器、記憶媒体、並びにコンピュータプログラム
CN109522221B (zh) 一种提高模糊测试效率的方法和系统
WO2021017286A1 (zh) 人脸识别方法、装置、电子设备及计算机非易失性可读存储介质
CN105335726A (zh) 人脸识别置信度获取方法和系统
CN111523317B (zh) 语音质检方法、装置、电子设备及介质
CN111221960A (zh) 文本检测方法、相似度计算方法、模型训练方法及装置
CN113468520A (zh) 应用于区块链业务的数据入侵检测方法及大数据服务器
CN111681673B (zh) 庭审过程中敲法槌的识别方法及系统
US20220188703A1 (en) Data generation apparatus and method thereof
US11665185B2 (en) Method and apparatus to detect scripted network traffic
CN116108896B (zh) 模型量化方法、装置、介质及电子设备
CN114285587A (zh) 域名鉴别方法和装置、域名分类模型的获取方法和装置
CN115774784A (zh) 一种文本对象的识别方法及装置
CN109271377A (zh) 一种数据质量检测方法及装置
CN110245302B (zh) 用于识别欺诈案件的策略生成方法及装置和电子设备
CN115278757A (zh) 一种检测异常数据的方法、装置及电子设备
CN114090377A (zh) 一种数据监控方法及装置
KR101327664B1 (ko) 음성 영역 검출 방법 및 그 장치
CN116720196B (zh) 一种代码同源性检测方法及系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
CB02 Change of applicant information

Address after: 100094 5 floor 101, 6 building, No. 3, Fung Xiu Road, Haidian District, Beijing.

Applicant after: Beijing Huaxia Dentsu Technology Co.,Ltd.

Address before: 100094 5 floor 101, 6 building, No. 3, Fung Xiu Road, Haidian District, Beijing.

Applicant before: CHINASYS TECHNOLOGIES Co.,Ltd.

CB02 Change of applicant information
GR01 Patent grant
GR01 Patent grant