CN108234915A - 一种实现审讯过程中自动完成笔录的方法 - Google Patents

一种实现审讯过程中自动完成笔录的方法 Download PDF

Info

Publication number
CN108234915A
CN108234915A CN201810102644.XA CN201810102644A CN108234915A CN 108234915 A CN108234915 A CN 108234915A CN 201810102644 A CN201810102644 A CN 201810102644A CN 108234915 A CN108234915 A CN 108234915A
Authority
CN
China
Prior art keywords
audio
people
suspect
case
video
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201810102644.XA
Other languages
English (en)
Inventor
朱健立
于宏志
王景彬
邓志刚
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Tianjin Tiandi Weiye Information System Integration Co Ltd
Original Assignee
Tianjin Tiandi Weiye Information System Integration Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tianjin Tiandi Weiye Information System Integration Co Ltd filed Critical Tianjin Tiandi Weiye Information System Integration Co Ltd
Priority to CN201810102644.XA priority Critical patent/CN108234915A/zh
Publication of CN108234915A publication Critical patent/CN108234915A/zh
Pending legal-status Critical Current

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N5/00Details of television systems
    • H04N5/76Television signal recording
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/26Speech to text systems
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/20Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
    • H04N21/23Processing of content or additional data; Elementary server operations; Server middleware
    • H04N21/233Processing of audio elementary streams
    • H04N21/2335Processing of audio elementary streams involving reformatting operations of audio signals, e.g. by converting from one coding standard to another
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/20Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
    • H04N21/23Processing of content or additional data; Elementary server operations; Server middleware
    • H04N21/234Processing of video elementary streams, e.g. splicing of video streams or manipulating encoded video stream scene graphs
    • H04N21/2343Processing of video elementary streams, e.g. splicing of video streams or manipulating encoded video stream scene graphs involving reformatting operations of video signals for distribution or compliance with end-user requests or end-user device requirements
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N5/00Details of television systems
    • H04N5/76Television signal recording
    • H04N5/78Television signal recording using magnetic recording
    • H04N5/781Television signal recording using magnetic recording on disks or drums

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Closed-Circuit Television Systems (AREA)

Abstract

本发明提供一种实现审讯过程中自动完成笔录的方法,其过程为:1、办案人/嫌疑人前面放一个定向话筒,采集办案人/嫌疑人的声音;2、办案人的声音送给办案人的摄像机,嫌疑人的声音送给嫌疑人的摄像机,分别进行音视频的编码;3、办案人/嫌疑人摄像机将办案人/嫌疑人的音视频码流传送到同步录音录像审讯主机,审讯主机对音视频进行存储和刻录;4、审讯主机将办案人和嫌疑人的音频送给语音识别主机,语音识别主机对办案人和嫌疑人的音频分别进行识别,并自动生成文字,存储成文件,最后传送给PC机,完成语音的自动录入工作。本方法可以自动实现音频的录入,不需要后期投入大量人力进行手动录入,节省了人力,方便快速,效率大大提高。

Description

一种实现审讯过程中自动完成笔录的方法
技术领域
本发明属于音视频采集和处理领域,尤其是涉及一种实现审讯过程中自动完成笔录的方法。
背景技术
现有的审讯同步录音录像系统,语音采集往往是一个全向的拾音器,用于采集办案人员和被审讯人员(嫌疑人)的声音,送往审讯主机进行同步录音录像,然后文员根据录音录像进行手动录入文字。目前这种系统存在的缺点是,办案人员和嫌疑人的声音混在一起,后期手动录入文字时,工作量大,时间长。因此,研发一种实现审讯过程中自动完成笔录的方法是个亟待解决的问题。
发明内容
有鉴于此,本发明旨在提出一种实现审讯过程中自动完成笔录的方法,主要应用于公安、检察院审讯行业。
为达到上述目的,本发明的技术方案是这样实现的:
一种实现审讯过程中自动完成笔录的方法,其过程如下:
1、整个审讯过程一般有两方人员,即办案人和嫌疑人;
在办案人前面放一个定向话筒,办案人的定向话筒的输出为办案人的音频信号;
在嫌疑人前面放一个定向话筒,嫌疑人定向话筒的输出为嫌疑人的音频信号;
通过两个定向话筒,可以将办案人和嫌疑人的声音分离出来;
2、办案人定向话筒的音频输出,通过专用音频屏蔽线缆,传送给办案人的摄像机;在摄像机内部,模拟音频信号经过A/D转换成数字信号,然后通过I2S接口传送给音视频编码专用芯片Hi3516A,Hi3516A对I2S数字音频信号进行解析,然后按照AAC标准格式进行编码,视频通过H.264/H.265格式进行编码;
3、嫌疑人定向话筒的音频输出,通过专用音频屏蔽线缆,传送给嫌疑人的摄像机;在摄像机内部,模拟音频信号经过A/D转换成数字信号,然后通过I2S接口传送给音视频编码专用芯片Hi3516A,Hi3516A对I2S数字音频信号进行解析,然后按照AAC标准格式进行编码,视频通过H.264/H.265格式进行编码;
4、办案人摄像机的输出为RJ45网口,通过网线连接到审讯主机的RJ45口上,将办案人的音视频码流传送到同步录音录像审讯主机;审讯主机接收到AAC音频码流和H.264/H.265视频码流,然后按照文件系统格式存储到硬盘和光盘中,完成音视频的同步刻录和备份;
5、嫌疑人摄像机的输出为RJ45网口,通过网线连接到审讯主机的RJ45口上,将嫌疑人的音视频码流传送到同步录音录像审讯主机;审讯主机接收到AAC音频码流和H.264/H.265视频码流,然后按照文件系统格式存储到硬盘和光盘中,完成音视频的同步刻录和备份;
6、审讯主机同步将办案人和嫌疑人的AAC格式的音频码流传送给语音识别主机,语音识别主机内置语音识别算法,可以同时对办案人和嫌疑人的音频进行解压缩,然后分析识别,并自动生成文字,存储成文件,最后传送给PC机,至此完成全部语音的自动录入工作。
进一步的,办案人前面放置的定向话筒采集的音频范围为正前方30度(也就是说此话筒只能采集到办案人的声音)。
进一步的,嫌疑人前面放置的定向话筒采集的音频范围为正前方30度(也就是说此话筒只能采集到嫌疑人的声音)。
进一步的,所述摄像机的型号为TC-NH3204I。
进一步的,所述同步录音录像审讯主机的型号为TC-H804N-P。
进一步的,所述语音识别主机的型号为TC-5430W。
相对于现有技术,本发明所述的实现审讯过程中自动完成笔录的方法具有以下优势:本方法可以自动实现音频的录入,不需要后期投入大量人力进行手动录入,节省了人力,方便快速,效率大大提高。
附图说明
构成本发明的一部分的附图用来提供对本发明的进一步理解,本发明的示意性实施例及其说明用于解释本发明,并不构成对本发明的不当限定。在附图中:
图1为本发明实现流程图。
具体实施方式
需要说明的是,在不冲突的情况下,本发明中的实施例及实施例中的特征可以相互组合。
下面将参考附图并结合实施例来详细说明本发明。
如图1所示,一种实现审讯过程中自动完成笔录的方法,其过程如下:
1、整个审讯过程一般有两方人员,即办案人和嫌疑人;
在办案人前面放一个定向话筒,定向话筒采集的音频范围为正前方30度(也就是说此话筒只能采集到办案人的声音),办案人的定向话筒的输出为办案人的音频信号;
在嫌疑人前面放一个定向话筒,定向话筒采集的音频范围为正前方30度(也就是说此话筒只能采集到嫌疑人的声音),嫌疑人定向话筒的输出为嫌疑人的音频信号;
通过两个定向话筒,可以将办案人和嫌疑人的声音分离出来;
2、办案人定向话筒的音频输出,通过专用音频屏蔽线缆,传送给办案人的摄像机TC-NH3204I;在摄像机内部,模拟音频信号经过A/D转换成数字信号,然后通过I2S接口传送给音视频编码专用芯片Hi3516A,Hi3516A对I2S数字音频信号进行解析,然后按照AAC标准格式进行编码,视频通过H.264/H.265格式进行编码;
3、嫌疑人定向话筒的音频输出,通过专用音频屏蔽线缆,传送给嫌疑人的摄像机TC-NH3204I;在摄像机内部,模拟音频信号经过A/D转换成数字信号,然后通过I2S接口传送给音视频编码专用芯片Hi3516A,Hi3516A对I2S数字音频信号进行解析,然后按照AAC标准格式进行编码,视频通过H.264/H.265格式进行编码;
4、办案人摄像机的输出为RJ45网口,通过网线连接到审讯主机的RJ45口上,将办案人的音视频码流传送到同步录音录像审讯主机TC-H804N-P;审讯主机接收到AAC音频码流和H.264/H.265视频码流,然后按照文件系统格式存储到硬盘和光盘中,完成音视频的同步刻录和备份;
5、嫌疑人摄像机的输出为RJ45网口,通过网线连接到审讯主机的RJ45口上,将嫌疑人的音视频码流传送到同步录音录像审讯主机TC-H804N-P;审讯主机接收到AAC音频码流和H.264/H.265视频码流,然后按照文件系统格式存储到硬盘和光盘中,完成音视频的同步刻录和备份;
6、审讯主机同步将办案人和嫌疑人的AAC格式的音频码流传送给语音识别主机TC-5430W,语音识别主机内置语音识别算法,可以同时对办案人和嫌疑人的音频进行解压缩,然后分析识别,并自动生成文字,存储成文件,最后传送给PC机,至此完成全部语音的自动录入工作。
本方法可以自动实现音频的录入,同时将办案人员和嫌疑人的声音分离出来,对各自声音进行语音识别处理,不需要后期投入大量人力进行手动录入,节省了人力,方便快速,效率大大提高。
以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (6)

1.一种实现审讯过程中自动完成笔录的方法,其特征在于,其过程如下:
1)整个审讯过程有两方人员,即办案人和嫌疑人;
在办案人前面放一个定向话筒,办案人定向话筒的输出为办案人的音频信号;
在嫌疑人前面放一个定向话筒,嫌疑人定向话筒的输出为嫌疑人的音频信号;
通过两个定向话筒,可以将办案人和嫌疑人的声音分离出来;
2)办案人定向话筒的音频输出,通过专用音频屏蔽线缆,传送给办案人的摄像机;在摄像机内部,模拟音频信号经过A/D转换成数字信号,然后通过I2S接口传送给音视频编码专用芯片Hi3516A,Hi3516A对I2S数字音频信号进行解析,然后按照AAC标准格式进行编码,视频通过H.264/H.265格式进行编码;
3)嫌疑人定向话筒的音频输出,通过专用音频屏蔽线缆,传送给嫌疑人的摄像机;在摄像机内部,模拟音频信号经过A/D转换成数字信号,然后通过I2S接口传送给音视频编码专用芯片Hi3516A,Hi3516A对I2S数字音频信号进行解析,然后按照AAC标准格式进行编码,视频通过H.264/H.265格式进行编码;
4)办案人摄像机的输出为RJ45网口,通过网线连接到审讯主机的RJ45口上,将办案人的音视频码流传送到同步录音录像审讯主机;审讯主机接收到AAC音频码流和H.264/H.265视频码流,然后按照文件系统格式存储到硬盘和光盘中,完成音视频的同步刻录和备份;
5)嫌疑人摄像机的输出为RJ45网口,通过网线连接到审讯主机的RJ45口上,将嫌疑人的音视频码流传送到同步录音录像审讯主机;审讯主机接收到AAC音频码流和H.264/H.265视频码流,然后按照文件系统格式存储到硬盘和光盘中,完成音视频的同步刻录和备份;
6)审讯主机同步将办案人和嫌疑人的AAC格式的音频码流传送给语音识别主机,语音识别主机内置语音识别算法,可以同时对办案人和嫌疑人的音频进行解压缩,然后分析识别,并自动生成文字,存储成文件,最后传送给PC机,完成全部语音的自动录入工作。
2.根据权利要求1所述的一种实现审讯过程中自动完成笔录的方法,其特征在于:办案人前面放置的定向话筒采集的音频范围为正前方30度。
3.根据权利要求1所述的一种实现审讯过程中自动完成笔录的方法,其特征在于:嫌疑人前面放置的定向话筒采集的音频范围为正前方30度。
4.根据权利要求1所述的一种实现审讯过程中自动完成笔录的方法,其特征在于:所述摄像机的型号为TC-NH3204I。
5.根据权利要求1所述的一种实现审讯过程中自动完成笔录的方法,其特征在于:所述同步录音录像审讯主机的型号为TC-H804N-P。
6.根据权利要求1所述的一种实现审讯过程中自动完成笔录的方法,其特征在于:所述语音识别主机的型号为TC-5430W。
CN201810102644.XA 2018-02-01 2018-02-01 一种实现审讯过程中自动完成笔录的方法 Pending CN108234915A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201810102644.XA CN108234915A (zh) 2018-02-01 2018-02-01 一种实现审讯过程中自动完成笔录的方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201810102644.XA CN108234915A (zh) 2018-02-01 2018-02-01 一种实现审讯过程中自动完成笔录的方法

Publications (1)

Publication Number Publication Date
CN108234915A true CN108234915A (zh) 2018-06-29

Family

ID=62670476

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201810102644.XA Pending CN108234915A (zh) 2018-02-01 2018-02-01 一种实现审讯过程中自动完成笔录的方法

Country Status (1)

Country Link
CN (1) CN108234915A (zh)

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1835582A (zh) * 2005-03-18 2006-09-20 北京富星创业科技发展有限公司 询问指挥及特审管理系统及其工作方法
CN102047658A (zh) * 2008-04-06 2011-05-04 天射国际公司 用于事件记录的系统和方法
US20130121580A1 (en) * 2011-11-11 2013-05-16 International Business Machines Corporation Analysis of service delivery processes based on interrogation of work assisted devices
CN203457245U (zh) * 2013-07-31 2014-02-26 重庆顺利科技有限公司 一种公安审讯系统
CN205493847U (zh) * 2016-03-04 2016-08-24 北京同方神火联合科技发展有限公司 语音分析系统
CN106448675A (zh) * 2016-10-21 2017-02-22 科大讯飞股份有限公司 识别文本修正方法及系统
CN106448722A (zh) * 2016-09-14 2017-02-22 科大讯飞股份有限公司 录音方法、装置和系统
CN206040215U (zh) * 2016-09-14 2017-03-22 科大讯飞股份有限公司 录音设备

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1835582A (zh) * 2005-03-18 2006-09-20 北京富星创业科技发展有限公司 询问指挥及特审管理系统及其工作方法
CN102047658A (zh) * 2008-04-06 2011-05-04 天射国际公司 用于事件记录的系统和方法
US20130121580A1 (en) * 2011-11-11 2013-05-16 International Business Machines Corporation Analysis of service delivery processes based on interrogation of work assisted devices
CN203457245U (zh) * 2013-07-31 2014-02-26 重庆顺利科技有限公司 一种公安审讯系统
CN205493847U (zh) * 2016-03-04 2016-08-24 北京同方神火联合科技发展有限公司 语音分析系统
CN106448722A (zh) * 2016-09-14 2017-02-22 科大讯飞股份有限公司 录音方法、装置和系统
CN206040215U (zh) * 2016-09-14 2017-03-22 科大讯飞股份有限公司 录音设备
CN106448675A (zh) * 2016-10-21 2017-02-22 科大讯飞股份有限公司 识别文本修正方法及系统

Similar Documents

Publication Publication Date Title
US8538753B2 (en) Generating representations of group interactions
CN109003608A (zh) 庭审控制方法、系统、计算机设备及存储介质
JPH07123243B2 (ja) アナログ信号エンコ−ド及びデコ−ド装置及び方法
CN103700370A (zh) 一种广播电视语音识别系统方法及系统
EP1536638A4 (en) METADATA PRODUCTION DEVICE, CREATION METHOD DAFUR AND TESTING DEVICE
CN101510256A (zh) 一种口型语言的转换方法及装置
CN103336773A (zh) 一种音视频语音处理与检索的系统和方法
CN101867742A (zh) 一种基于声控控制下的电视系统
CN103607611A (zh) 一种智能电视的语音控制方法及系统
CN109285556A (zh) 音频处理方法、装置、设备以及存储介质
CN111107284B (zh) 一种视频字幕实时生成系统及生成方法
CN108305630A (zh) 低带宽条件下的语言传输方法及语言传输系统
CN112581965A (zh) 转写方法、装置、录音笔和存储介质
CN106550268A (zh) 视频处理方法和视频处理装置
CN108234915A (zh) 一种实现审讯过程中自动完成笔录的方法
CN111181949B (zh) 一种声音检测方法、装置、终端设备和存储介质
CN109300478A (zh) 一种听力障碍者的辅助对话装置
CN116527840A (zh) 一种基于云边协同的直播会议智能字幕显示方法和系统
CN202502737U (zh) 一种视音频信息的智能编辑系统
Bosi et al. Sound and music computing using AI: Designing a standard
CN107825433A (zh) 一种儿童语音指令识别的卡片机器人
AU2021101012A4 (en) A system for translating sign language into speech and vice-versa
CN113689855A (zh) 一种会议记录生成系统、方法、装置、存储介质
CN208335209U (zh) 听障生融合教育课堂辅助系统及装置
CN207651168U (zh) 一种超清晰语音传输和识别模块

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20180629

RJ01 Rejection of invention patent application after publication