CN106331556A - 基于语音识别的违章抓拍控制方法及其装置 - Google Patents
基于语音识别的违章抓拍控制方法及其装置 Download PDFInfo
- Publication number
- CN106331556A CN106331556A CN201610836408.1A CN201610836408A CN106331556A CN 106331556 A CN106331556 A CN 106331556A CN 201610836408 A CN201610836408 A CN 201610836408A CN 106331556 A CN106331556 A CN 106331556A
- Authority
- CN
- China
- Prior art keywords
- recording
- recording data
- video
- violating
- voice
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 27
- 238000012544 monitoring process Methods 0.000 claims description 7
- 230000006835 compression Effects 0.000 claims description 6
- 238000007906 compression Methods 0.000 claims description 6
- 230000013011 mating Effects 0.000 claims description 3
- 238000004321 preservation Methods 0.000 claims description 2
- 238000001514 detection method Methods 0.000 description 7
- 238000005516 engineering process Methods 0.000 description 6
- 238000001914 filtration Methods 0.000 description 4
- 238000012952 Resampling Methods 0.000 description 3
- 230000000694 effects Effects 0.000 description 3
- 238000004088 simulation Methods 0.000 description 3
- 238000004611 spectroscopical analysis Methods 0.000 description 3
- 238000013528 artificial neural network Methods 0.000 description 2
- 230000000630 rising effect Effects 0.000 description 2
- 230000003044 adaptive effect Effects 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 210000004556 brain Anatomy 0.000 description 1
- 230000008878 coupling Effects 0.000 description 1
- 238000010168 coupling process Methods 0.000 description 1
- 238000005859 coupling reaction Methods 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 230000007613 environmental effect Effects 0.000 description 1
- 230000010365 information processing Effects 0.000 description 1
- 239000000203 mixture Substances 0.000 description 1
- 238000005070 sampling Methods 0.000 description 1
- 238000003045 statistical classification method Methods 0.000 description 1
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N5/00—Details of television systems
- H04N5/76—Television signal recording
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L17/00—Speaker identification or verification techniques
- G10L17/02—Preprocessing operations, e.g. segment selection; Pattern representation or modelling, e.g. based on linear discriminant analysis [LDA] or principal components; Feature selection or extraction
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N7/00—Television systems
- H04N7/18—Closed-circuit television [CCTV] systems, i.e. systems in which the video signal is not broadcast
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
- G10L2015/223—Execution procedure of a spoken command
Landscapes
- Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Computational Linguistics (AREA)
- Television Signal Processing For Recording (AREA)
Abstract
本发明公开了一种基于语音识别的违章抓拍控制方法,智能行车终端实时录制前方录像的同时,对周围产生的语音实时进行录音采集并且对所述录音采集的录音数据进行预处理,对所述预处理后的录音数据进行识别,最后,所述识别结果与违章抓拍语音命令匹配后,所述智能行车终端根据预设的拍摄参数抓拍当前拍摄的图像或者视频进行压缩保存;本发明还公开了一种基于语音识别的违章抓拍控制装置,通过本发明无需后续查看行车录像,直接在行车中对违章车辆进行抓拍,无需手动操作,实现了无障碍操作,提高了用户体验,提高了违章抓拍的安全性。
Description
技术领域
本发明属于语音控制技术领域,具体涉及一种基于语音识别的违章抓拍控制方法及其装置。
背景技术
随着国民生活水平的提高,越来越多的家庭选择汽车作为主要的交通工具,而道路上车辆的增多也带来了更多的交通违章行为。
现有的电子监控设备以及交警数量上是有限的,只能在有限的路段上对司机进行监控,无法覆盖到其整个驾驶过程,从而造成部分司机在有监控的路段按交通规范驾驶,一旦脱离监控则随意进行违章。
发明内容
有鉴于此,本发明的主要目的在于提供一种基于语音识别的违章抓拍控制方法及其装置。
为达到上述目的,本发明的技术方案是这样实现的:
本发明实施例提供一种基于语音识别的违章抓拍控制方法,该方法为:智能行车终端实时录制前方录像的同时,对周围产生的语音实时进行录音采集并且对所述录音采集的录音数据进行预处理,对所述预处理后的录音数据进行识别,最后,所述识别结果与违章抓拍语音命令匹配后,所述智能行车终端根据预设的拍摄参数抓拍当前拍摄的图像或者视频进行压缩保存。
上述方案中,所述对周围产生的实时进行录音采集并且对所述录音采集的录音数据进行预处理之前,该方法还包括:所述智能行车终端监听周围是否有语音产生,当周围产生的语音音量大于阈值时,确定周围产生语音,并且对所述周围产生的实时进行录音采集。
上述方案中,该方法还包括,所述智能行车终端将压缩保存的图像或者视频上传至服务器端。
上述方案中,所述拍摄参数为抓拍图像或者视频、抓拍图片的数量、抓拍视频的起止时间、抓拍的时间间隔。
本发明实施例还提供一种基于语音识别的违章抓拍控制装置,该装置包括:录音数据采集单元、录音数据识别单元、录音数据处理单元、抓拍控制单元,
所述录音数据采集单元,用于在实时录制前方录像的同时,对周围产生的语音实时进行录音采集并且发送到录音数据处理单元;
所述录音数据处理单元,用于对所述录音采集的录音数据进行预处理,并且将预处理后的录音数据发送到录音数据识别单元;
所述录音数据识别单元,用于对所述预处理后的录音数据进行识别,并且将识别结果发送到抓拍控制单元;
所述抓拍控制单元,用于在所述识别结果与违章抓拍语音命令匹配后,根据预设的拍摄参数抓拍当前拍摄的图像或者视频进行压缩保存。
上述方案中,所述录音数据采集单元,还用于监听周围是否有语音产生,当周围产生的语音音量大于阈值时,确定周围产生语音,并且对所述周围产生的实时进行录音采集。
上述方案中,该装置包括上传单元,用于将压缩保存的图像或者视频上传至服务器端。
上述方案中,所述拍摄参数为抓拍图像或者视频、抓拍图片的数量、抓拍视频的起止时间、抓拍的时间间隔。
与现有技术相比,本发明的有益效果:
本发明无需后续查看行车录像,直接在行车中对违章车辆进行抓拍,无需手动操作,实现了无障碍操作,提高了用户体验,提高了违章抓拍的安全性。
附图说明
图1为本发明实施例提供一种基于语音识别的违章抓拍控制方法的流程图;
图2为本发明实施例提供一种基于语音识别的违章抓拍控制装置的连接框图。
具体实施方式
为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
本发明实施例提供一种基于语音识别的违章抓拍控制方法,如图1所示,该方法通过以下步骤实现:
步骤101:智能行车终端实时录制前方录像的同时,对周围产生的语音实时进行录音采集并且对所述录音采集的录音数据进行预处理;
具体地,所述对周围产生的实时进行录音采集并且对所述录音采集的录音数据进行预处理之前,所述智能行车终端监听周围是否有语音产生,当周围产生的语音音量大于阈值时,确定周围产生语音,并且对所述周围产生的实时进行录音采集。
根据噪声抑制(NS)、自动增益控制(AGC)、静音检测(VAD)、回音消除(AEC)、重采样、或自适应滤波中的至少一种方式对录音数据进行预处理,获得便于后续识别的录音数据。
本发明包括但不限于噪声抑制(NS)、自动增益控制(AGC)、静音检测(VAD)、回音消除(AEC)、重采样、自适应滤波,也可以采用其他预处理方式对录音数据进行预处理,以降低杂声等干扰元素,确保录音数据的纯净,为后续识别提供良好的数据基础。
所述噪声抑制(NS)指对环境噪音进行抑制,滤波,降低噪音对有效声音的影响,如车载环境的车噪、风噪、胎噪
所述自动增益控制(AGC)是处理面对录音因为大量不同设置而导致音量变化,AGC提供了一种方式去调整参考音量。这在VOIP中是很有用的,因为不需再手动调节麦克风的增益。还有另外一个优点是麦克风增益在一个比较保守的水平,它更容易避免削波、失真。
所述静音检测(VAD):语音活动检测(Voice Activity Detection,VAD)又称语音端点检测,语音边界检测,目的是从声音信号流里识别和消除长时间的静音期,以达到在不降低业务质量的情况下节省话路资源的作用,它是IP电话应用的重要组成部分。
所述回音消除(AEC):回声消除技术,采用回波抵消方法,也就是通过自适应方法估计回波信号的大小,然后在接收信号中减去此估计值以抵消回波。
所述重采样是根据一类象元的信息内插出另一类象元信息的过程,语音领域通常是对脉冲编码调制数据所述(PCM)进行重新采样,重新取得数据。
所述自适应滤波指在麦克风阵列或多路采样时,可能会有时延抖动问题,如在AEC技术中需要对声音数据在不同时延状态下进行回波抵消。
步骤102:对所述预处理后的录音数据进行识别;
具体地,根据语音识别算法对所述预处理后的录音数据进行识别;
所述语音识别算法包括但不限于人工神经网络、统计模式识别技术。
所述人工神经网络指从信息处理角度对人脑神经元网络进行抽象,建立某种简单模型,按不同的连接方式组成不同的网络
所述统计模式识别技术指统计模式识别statistical approach of patternrecognition对模式的统计分类方法,把模式类看成是用某个随机向量实现的集合。又称决策理论识别方法。
步骤103:所述识别结果与违章抓拍语音命令匹配后,所述智能行车终端根据预设的拍摄参数抓拍当前拍摄的图像或者视频进行压缩保存。
具体地,所述拍摄参数为抓拍图像或者视频、抓拍图片的数量、抓拍视频的起止时间、抓拍的时间间隔。
所述智能行车终端将压缩保存的图像或者视频上传至服务器端。
当所述识别结果与违章抓拍语音命令不匹配时,所述智能行车终端实时录制前方录像,不进行抓拍和上传。
本发明实施例还提供一种基于语音识别的违章抓拍控制装置,该装置包括:录音数据采集单元、录音数据识别单元、录音数据处理单元、抓拍控制单元,
所述录音数据采集单元,用于在实时录制前方录像的同时,对周围产生的语音实时进行录音采集并且发送到录音数据处理单元;
所述录音数据处理单元,用于对所述录音采集的录音数据进行预处理,并且将预处理后的录音数据发送到录音数据识别单元;
所述录音数据识别单元,用于对所述预处理后的录音数据进行识别,并且将识别结果发送到抓拍控制单元;
所述抓拍控制单元,用于在所述识别结果与违章抓拍语音命令匹配后,根据预设的拍摄参数抓拍当前拍摄的图像或者视频进行压缩保存。
所述录音数据采集单元,还用于监听周围是否有语音产生,当周围产生的语音音量大于阈值时,确定周围产生语音,并且对所述周围产生的实时进行录音采集。
该装置还包括上传单元,用于将压缩保存的图像或者视频上传至服务器端。
所述拍摄参数为抓拍图像或者视频、抓拍图片的数量、抓拍视频的起止时间、抓拍的时间间隔。
以上所述,仅为本发明的较佳实施例而已,并非用于限定本发明的保护范围。
Claims (8)
1.一种基于语音识别的违章抓拍控制方法,其特征在于,该方法为:智能行车终端实时录制前方录像的同时,对周围产生的语音实时进行录音采集并且对所述录音采集的录音数据进行预处理,对所述预处理后的录音数据进行识别,最后,所述识别结果与违章抓拍语音命令匹配后,所述智能行车终端根据预设的拍摄参数抓拍当前拍摄的图像或者视频进行压缩保存。
2.根据权利要求1所述的基于语音识别的违章抓拍控制方法,其特征在于,所述对周围产生的实时进行录音采集并且对所述录音采集的录音数据进行预处理之前,该方法还包括:所述智能行车终端监听周围是否有语音产生,当周围产生的语音音量大于阈值时,确定周围产生语音,并且对所述周围产生的实时进行录音采集。
3.据权利要求1所述的基于语音识别的违章抓拍控制方法,其特征在于,该方法还包括,所述智能行车终端将压缩保存的图像或者视频上传至服务器端。
4.据权利要求1所述的基于语音识别的违章抓拍控制方法,其特征在于:所述拍摄参数为抓拍图像或者视频、抓拍图片的数量、抓拍视频的起止时间、抓拍的时间间隔。
5.一种基于语音识别的违章抓拍控制装置,其特征在于,该装置包括:录音数据采集单元、录音数据识别单元、录音数据处理单元、抓拍控制单元,
所述录音数据采集单元,用于在实时录制前方录像的同时,对周围产生的语音实时进行录音采集并且发送到录音数据处理单元;
所述录音数据处理单元,用于对所述录音采集的录音数据进行预处理,并且将预处理后的录音数据发送到录音数据识别单元;
所述录音数据识别单元,用于对所述预处理后的录音数据进行识别,并且将识别结果发送到抓拍控制单元;
所述抓拍控制单元,用于在所述识别结果与违章抓拍语音命令匹配后,根据预设的拍摄参数抓拍当前拍摄的图像或者视频进行压缩保存。
6.根据权利要求5所述的基于语音识别的违章抓拍控制装置,其特征在于,所述录音数据采集单元,还用于监听周围是否有语音产生,当周围产生的语音音量大于阈值时,确定周围产生语音,并且对所述周围产生的实时进行录音采集。
7.据权利要求5所述的基于语音识别的违章抓拍控制装置,其特征在于,该装置包括上传单元,用于将压缩保存的图像或者视频上传至服务器端。
8.据权利要求5所述的基于语音识别的违章抓拍控制装置,其特征在于:所述拍摄参数为抓拍图像或者视频、抓拍图片的数量、抓拍视频的起止时间、抓拍的时间间隔。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201610836408.1A CN106331556A (zh) | 2016-09-20 | 2016-09-20 | 基于语音识别的违章抓拍控制方法及其装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201610836408.1A CN106331556A (zh) | 2016-09-20 | 2016-09-20 | 基于语音识别的违章抓拍控制方法及其装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN106331556A true CN106331556A (zh) | 2017-01-11 |
Family
ID=57788070
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201610836408.1A Pending CN106331556A (zh) | 2016-09-20 | 2016-09-20 | 基于语音识别的违章抓拍控制方法及其装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN106331556A (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108346296A (zh) * | 2018-01-10 | 2018-07-31 | 安康学院 | 一种基于太阳能供电的车载移动式声控抓拍违章系统 |
CN109767627A (zh) * | 2019-03-12 | 2019-05-17 | 福建工程学院 | 一种交通违章智能语音抓拍方法和系统 |
Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20120062745A1 (en) * | 2009-05-19 | 2012-03-15 | Imagenext Co., Ltd. | Lane departure sensing method and apparatus using images that surround a vehicle |
CN102739863A (zh) * | 2012-06-14 | 2012-10-17 | 中兴通讯股份有限公司 | 紧急呼救方法及装置 |
CN103001858A (zh) * | 2012-12-14 | 2013-03-27 | 上海量明科技发展有限公司 | 即时通信中回复消息的方法、客户端及系统 |
CN204291186U (zh) * | 2014-11-25 | 2015-04-22 | 赵大伟 | 一种车载机动车辆违章语音控制拍录装置 |
CN104978861A (zh) * | 2015-06-17 | 2015-10-14 | 小米科技有限责任公司 | 车辆标识方法及装置 |
CN105096936A (zh) * | 2014-05-15 | 2015-11-25 | 哈尔滨海能达科技有限公司 | 一种即时按键通话业务控制方法和装置 |
CN105329187A (zh) * | 2015-11-05 | 2016-02-17 | 深圳市几米软件有限公司 | 蓝牙按键触发实现安全操作的智能车载系统及控制方法 |
CN105869233A (zh) * | 2016-03-25 | 2016-08-17 | 奇瑞汽车股份有限公司 | 实现智能交互的行车记录仪及其控制方法 |
-
2016
- 2016-09-20 CN CN201610836408.1A patent/CN106331556A/zh active Pending
Patent Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20120062745A1 (en) * | 2009-05-19 | 2012-03-15 | Imagenext Co., Ltd. | Lane departure sensing method and apparatus using images that surround a vehicle |
CN102739863A (zh) * | 2012-06-14 | 2012-10-17 | 中兴通讯股份有限公司 | 紧急呼救方法及装置 |
CN103001858A (zh) * | 2012-12-14 | 2013-03-27 | 上海量明科技发展有限公司 | 即时通信中回复消息的方法、客户端及系统 |
CN105096936A (zh) * | 2014-05-15 | 2015-11-25 | 哈尔滨海能达科技有限公司 | 一种即时按键通话业务控制方法和装置 |
CN204291186U (zh) * | 2014-11-25 | 2015-04-22 | 赵大伟 | 一种车载机动车辆违章语音控制拍录装置 |
CN104978861A (zh) * | 2015-06-17 | 2015-10-14 | 小米科技有限责任公司 | 车辆标识方法及装置 |
CN105329187A (zh) * | 2015-11-05 | 2016-02-17 | 深圳市几米软件有限公司 | 蓝牙按键触发实现安全操作的智能车载系统及控制方法 |
CN105869233A (zh) * | 2016-03-25 | 2016-08-17 | 奇瑞汽车股份有限公司 | 实现智能交互的行车记录仪及其控制方法 |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108346296A (zh) * | 2018-01-10 | 2018-07-31 | 安康学院 | 一种基于太阳能供电的车载移动式声控抓拍违章系统 |
CN109767627A (zh) * | 2019-03-12 | 2019-05-17 | 福建工程学院 | 一种交通违章智能语音抓拍方法和系统 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
EP1765021A3 (en) | Adaptive prefiltering of digital video signals | |
CN101938610A (zh) | 一种基于声纹识别的新型电视装置 | |
EP3222057A1 (de) | Verfahren und vorrichtung zum schnellen erkennen der eigenen stimme | |
WO2005094157A2 (de) | Brillengestell mit integriertem akustischem kommunikationssystem zur kommunikation mit einem mobilfunkgerät und entsprechendes verfahren | |
EP2381702A3 (en) | Systems and methods for own voice recognition with adaptations for noise robustness | |
CN105046763B (zh) | 一种多存储行车信息记录的系统及方法 | |
WO2019085584A1 (zh) | 多媒体数据处理和获取方法、采集终端和处理装置 | |
CN109147820B (zh) | 车载音响控制方法、装置、电子设备及存储介质 | |
CN106331556A (zh) | 基于语音识别的违章抓拍控制方法及其装置 | |
CN110310653A (zh) | 一种回声消除方法 | |
CN107195016A (zh) | 基于震动传感器的停车监控系统 | |
WO2021184315A1 (zh) | 音频采集装置、音频接收装置及音频处理方法 | |
CN113630680A (zh) | 一种耳机音频视频交互系统、方法及智能头戴式耳机 | |
CN111416933B (zh) | 一种远程摄像头装置及控制方法 | |
CN115103159A (zh) | 一种利用摄像头进行监控的方法、装置、系统及相关设备 | |
CN108735234A (zh) | 一种采用语音信息监测健康状况的装置 | |
EP3985994B1 (de) | Verfahren zum betrieb eines hörhilfegeräts sowie hörhilfegerät | |
CN115348049B (zh) | 一种利用耳机内向麦克风的用户身份认证方法 | |
CN113390608B (zh) | 一种试验水池同步摄像控制系统及控制方法 | |
CN118250433A (zh) | 一种行车记录仪及通讯控制系统 | |
DE102008036803B3 (de) | Anordnung und Verfahren zur Regelung einer Rückkopplungsunterdrückung bei Hörvorrichtungen | |
CN118158596B (zh) | 应用于绿色建筑的基于掩蔽效应的智能声景控制方法 | |
CN115662094B (zh) | 太阳射电爆发实时监测预警方法、系统、存储介质及设备 | |
DE102010012941A1 (de) | Verfahren und Hörgerät zur Windgeräuscherkennung | |
CN204791216U (zh) | 一种汽车喇叭识别系统 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20170111 |
|
RJ01 | Rejection of invention patent application after publication |