CN101833985A

CN101833985A - 一种基于语音识别的法庭庭审录像视频实时标引系统

Info

Publication number: CN101833985A
Application number: CN200910079829A
Authority: CN
Inventors: 商文彬; 羊美华; 羊文广; 黄琼
Original assignee: Newauto Silicon Valley Video Technology Co Ltd
Current assignee: Newauto Silicon Valley Video Technology Co Ltd
Priority date: 2009-03-12
Filing date: 2009-03-12
Publication date: 2010-09-15

Abstract

本发明属于视频处理技术领域，具体涉及一种基于语音识别的法庭庭审录像视频实时标引系统。该系统包括数字化摄像装置，用于对整个庭审过程进行不间断的连续拍摄，形成视频文件；视频服务器，与数字化摄像装置连接，用于存储视频文件，并对视频文件进行处理；语音识别装置，与视频服务器连接，用于根据事先的设定程序，对法官的特定语句进行识别；实时标引模块，设置在视频服务器内，用于根据语音识别装置的识别结果触发标引操作，对视频文件的对应视频帧进行标引关联。本发明能够按庭审环节将长时间的庭审录像视频进行实时标引，以方便后续视频调看时视频片段的快速定位，并能够减轻工作人员劳动强度，提高视频文件的处理效率。

Description

一种基于语音识别的法庭庭审录像视频实时标引系统

技术领域

本发明属于视频处理技术领域，具体涉及一种基于语音识别的法庭庭审录像视频实时标引系统。

背景技术

法院的法庭审理过程需要进行现场录像，庭审现场录像对于提高庭审效率和案件审理质量是非常重要的。法庭的审理要求全面、真实、客观、公正，如果有音像资料作以佐证的话就更能直观、有效的印证案件审理的真实过程，从而为后续的监督检查以及庭审资料调用提供方便。而且，影像资料的保存作为一种真实历史的记录，可以为未来法庭庭审工作的发展提供借鉴和参考。

法庭的庭审过程一般都比较长，短则2～3个小时，长的可以花费半天甚至一天的时间，而庭审的现场录像是一个连续的过程，将最终形成一段时间很长的录像视频。随着数字化技术的发展，传统的录像带形式的录制方式已经逐渐被数字化录像方式所取代，数字摄像机将整个录制的现场过程形成一个视频文件，将视频文件存储在存储器中，以备后续调看。

法庭的审理都存在着一套比较规范的程序，我国的法庭审理过程一般包括如下步骤：宣布开庭→核实当事人身份并告知权利义务→法庭调查→举证质证→法庭辩论→法庭调解→宣判→闭庭。在进行庭审视频的观看过程中，如果希望针对其中的某个环节进行观看，在视频文件通过视频播放软件播放时，可以通过改变播放进度的形式来选择相应的视频片段，这是目前所有播放软件都支持的功能。但是，这种改变播放进度的形式一般只能以时间作为参考依据，观看者首先要估计希望观看的片段在什么时间点，然后再根据时间点进行查找，这样就会比较繁琐，特别是在视频文件比较长的情况下查找的效率相对较低。

由于法庭审理有着较规范的程序，因此，目前有一种做法是在庭审过程录制完成后，由工作人员再从头至尾浏览一遍整个视频文件，并对庭审的每一个步骤加入视频标引，从而为后续的观看提供方便。但这种方式不仅增加了工作人员的劳动强度，而且，耗时较长，工作效率比较低下。

发明内容

本发明的目的在于针对现有技术的缺陷，提供一种基于语音识别的法庭庭审录像视频实时标引系统，按庭审环节将长时间的庭审录像视频进行实时标引，以方便后续视频调看时视频片段的快速定位。

本发明的技术方案如下：一种基于语音识别的法庭庭审录像视频实时标引系统，包括：

-数字化摄像装置，用于对整个庭审过程进行不间断的连续拍摄，形成视频文件；

-视频服务器，与数字化摄像装置连接，用于存储视频文件，并对视频文件进行处理；

-语音识别装置，与视频服务器连接，用于根据事先的设定程序，对法官的特定语句进行识别；

-实时标引模块，设置在视频服务器内，用于根据语音识别装置的识别结果触发标引操作，对视频文件的对应视频帧进行标引关联。

进一步，如上所述的基于语音识别的法庭庭审录像视频实时标引系统，其中，该系统还包括语音信息检测模块，设置在视频服务器内，用于对语音识别装置输入的语音识别结果信息进行重复性检测，避免重复标引。

进一步，如上所述的基于语音识别的法庭庭审录像视频实时标引系统，其中，所述的语音识别装置与法官席麦克风相连接，直接识别法官的特定语句。

进一步，如上所述的基于语音识别的法庭庭审录像视频实时标引系统，其中，所述的语音识别装置包括用于接收模拟语音信息的语音接收单元，语音接收单元与模数转换单元连接，模数转换单元与特定语音信息识别单元连接，特定语音信息识别单元连接语音信息输出单元。

进一步，如上所述的基于语音识别的法庭庭审录像视频实时标引系统，其中，所述的实时标引模块中设有一个XML文件，XML文件的内容节点以庭审的规定环节名称命名，当实时标引模块收到一个语音识别结果信号时，便将当前视频帧与XML文件的当前节点内容相对应，实现标引关联。

进一步，如上所述的基于语音识别的法庭庭审录像视频实时标引系统，其中，该系统还包括视频文件打包模块，用于将起标引作用的XML文件与数字化摄像装置生成的视频文件整体打包。

本发明的有益效果如下：本发明通过语音识别装置对法官说出的特定语句进行识别，从而了解法庭审理的进程，确定每一个规定环节的开始时刻，通过信号触发实时标引模块对庭审录像进行实时标引，最终形成一个带有庭审环节标签的视频文件。通过在视频播放器上设计一个简单的插件，用于读取标引信息，就可以将庭审的环节标签显示在播放器的进度栏，从而为庭审录像的后续观看定位提供了极大的方便。本发明原理简单，易于实现，非常有助于庭审视频录像的处理，并能够减轻工作人员劳动强度，提高视频文件的处理效率。

附图说明

图1为本发明的系统结构组成示意图；

图2为语音识别装置的结构组成示意图；

图3为实时标引模块的原理图。

具体实施方式

下面结合附图和具体实施例对本发明进行详细的描述。

本发明所提供的基于语音识别的法庭庭审录像视频实时标引系统，用于庭审录像现场当中，其主要功能是对法庭庭审的数字化录像视频进行实时的环节标引，以便于后续视频观看中的快速定位，该系统的结构如图1所示，包括：

-数字化摄像装置，用于对整个庭审过程进行不间断的连续拍摄，形成视频文件，并将文件实时发送存储在视频服务器的存储器中；

-语音识别装置，与视频服务器连接，用于根据事先的设定程序，对法官的特定语句进行识别，语音识别装置直接连接在法官席的麦克风上，从而更准确的获取法官的语音信号；

-语音信息检测模块，设置在视频服务器内，与语音识别装置连接，用于对语音识别装置输入的语音识别结果信息进行重复性检测，避免重复标引；

-实时标引模块，设置在视频服务器内，与语音信息检测模块连接，用于根据检测合格的语音识别装置的识别结果触发标引操作，对视频文件的对应视频帧进行标引关联。

本发明的语音识别装置并不是对法官的所有话语都进行识别，而是只针对特定语音信息进行识别。由于庭审一般都有着比较规范的程序，在每个程序开始的时候，规定法官都要用标准语句进行宣读以表明现在进入相应程序，例如，开庭时法官宣读“现在开庭”，法庭辩论环节开始时法官宣读“现在进行法庭辩论”。这样，语音识别装置可以预先设定好需要识别的特定语音信息是什么，只有当捕捉到这些规定好的特定语音信息之后，才进行语音信息的输出。结合以上特点，语音识别装置的结构如图2所示，包括用于接收模拟语音信息的语音接收单元，语音接收单元与将模拟信号转换为数字信号的模数转换单元连接，模数转换单元与特定语音信息识别单元连接，特定语音信息识别单元连接语音信息输出单元。在特定语音信息识别单元中判断当前输入的语音是否是需要输出的语音信号，如果是，再进行语音信号的输出。

另外，在具体的庭审过程中，由于某些不太规范的人为因素，特定语音信息识别单元很可能会捕捉到多次同一特定语音信息，并将该信息进行了多次输出。因此，有必要在视频服务器内设置一个语音信息检测模块，该语音信息检测模块对语音识别装置输入的语音识别结果信息进行重复性检测，如果发现有重复的语音信号又一次被输入时，将该信号截断，不发送给实时标引模块，这样就保证了在一次庭审录制过程中对于一个规定环节只标引一次。

实时标引模块根据语音信息检测模块检测合格的语音识别装置的识别结果触发标引操作，对视频文件的对应视频帧进行标引关联。本发明中，将特定的语音信息作为标引的触发机制，实时标引模块事先已经定义了需要标引的具体内容，即每个庭审环节的名称，一种具体的实施方式是，在实时标引模块中设置一个XML文件，XML即为可扩展的标记语言(eXtensible Markup Language)，是一套定义语义标记的规则，这些标记可以将文档分成许多部件并对这些部件加以标识。如图3所示，本发明的XML文件的内容节点以庭审的规定环节名称命名，当实时标引模块收到一个语音识别结果信号时，即触发了相应的标引操作，系统便将视频文件中当前视频帧与XML文件的当前节点内容相对应，实现标引关联。下一个语音识别结果信号来到时，再将这一时刻的视频帧与依次排列的另一个节点内容相对应，实现下一个环节的标引关联。这一技术原理简单，对于本领域的技术人员来说非常容易实现。

针对上述标引方式，在视频服务器中，还设有一个视频文件打包模块，用于将起标引作用的XML文件与数字化摄像装置生成的视频文件整体打包。这样，就形成了一个可以实际被媒体播放器读取播放的完整的视频文件。

对于视频播放器软件来说，应该针对上述标引关联专门设计一个播放插件，通过该插件，可以将庭审的环节标签显示在播放器的进度栏，这样，在观看视频文件的时候，可以非常直观的找到庭审的某个环节的视频片段，便于观看的迅速定位。例如，观看者希望看一下法庭辩论环节的情况，就可以拖动进度栏游标，将之放于“法庭辩论”的标识处，播放软件便可以迅速的根据该标引信息，找到对应的片段起点视频帧，从该视频帧开始播放，非常方便实用。上述功能插件的设计对于本领域的技术人员来说是现有技术，此处不再进行过多的描述。

本发明所述的系统并不限于具体实施方式中所述的实施例，本领域技术人员根据本发明的技术方案得出其他的实施方式，同样属于本发明的技术创新范围。

Claims

1.一种基于语音识别的法庭庭审录像视频实时标引系统，包括：

2.如权利要求1所述的基于语音识别的法庭庭审录像视频实时标引系统，其特征在于：该系统还包括语音信息检测模块，设置在视频服务器内，用于对语音识别装置输入的语音识别结果信息进行重复性检测，避免重复标引。

3.如权利要求1或2所述的基于语音识别的法庭庭审录像视频实时标引系统，其特征在于：所述的语音识别装置与法官席麦克风相连接，直接识别法官的特定语句。

4.如权利要求3所述的基于语音识别的法庭庭审录像视频实时标引系统，其特征在于：所述的语音识别装置包括用于接收模拟语音信息的语音接收单元，语音接收单元与模数转换单元连接，模数转换单元与特定语音信息识别单元连接，特定语音信息识别单元连接语音信息输出单元。

5.如权利要求1所述的基于语音识别的法庭庭审录像视频实时标引系统，其特征在于：所述的实时标引模块中设有一个XML文件，XML文件的内容节点以庭审的规定环节名称命名，当实时标引模块收到一个语音识别结果信号时，便将当前视频帧与XML文件的当前节点内容相对应，实现标引关联。

6.如权利要求5所述的基于语音识别的法庭庭审录像视频实时标引系统，其特征在于：该系统还包括视频文件打包模块，用于将起标引作用的XML文件与数字化摄像装置生成的视频文件整体打包。