CN110931019A - 公安语音数据采集方法、装置、设备和计算机存储介质 - Google Patents

公安语音数据采集方法、装置、设备和计算机存储介质 Download PDF

Info

Publication number
CN110931019A
CN110931019A CN201911254329.XA CN201911254329A CN110931019A CN 110931019 A CN110931019 A CN 110931019A CN 201911254329 A CN201911254329 A CN 201911254329A CN 110931019 A CN110931019 A CN 110931019A
Authority
CN
China
Prior art keywords
voice
information
acquisition device
preset
microphone
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201911254329.XA
Other languages
English (en)
Other versions
CN110931019B (zh
Inventor
黄族良
龙洪锋
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Guangzhou National Acoustic Intelligent Technology Co Ltd
Original Assignee
Guangzhou National Acoustic Intelligent Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Guangzhou National Acoustic Intelligent Technology Co Ltd filed Critical Guangzhou National Acoustic Intelligent Technology Co Ltd
Priority to CN201911254329.XA priority Critical patent/CN110931019B/zh
Publication of CN110931019A publication Critical patent/CN110931019A/zh
Application granted granted Critical
Publication of CN110931019B publication Critical patent/CN110931019B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L17/00Speaker identification or verification
    • G10L17/02Preprocessing operations, e.g. segment selection; Pattern representation or modelling, e.g. based on linear discriminant analysis [LDA] or principal components; Feature selection or extraction
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L17/00Speaker identification or verification
    • G10L17/22Interactive procedures; Man-machine interfaces
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/48Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use
    • G10L25/51Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for comparison or discrimination
    • G10L25/60Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for comparison or discrimination for measuring the quality of voice signals

Abstract

本发明公开了一种公安语音数据采集方法,包括以下步骤:获取预设采集装置采集的第一语音信息,分析所述第一语音信息得到所述第一语音信息的语音特征信息,其中,所述预设采集装置中包含至少两个麦克风;根据所述第一语音信息的语音特征信息,对所述预设采集装置中的麦克风调整;通过调整后的所述预设采集装置采集第二语音信息,将采集到的所述第二语音信息上传至公安语音数据库。本发明还公开了一种公安语音数据采集装置、设备和计算机存储介质。本发明能够提升公安采集语音数据的质量,以利于提取更高质量的声纹信息。

Description

公安语音数据采集方法、装置、设备和计算机存储介质
技术领域
本发明涉及语音处理技术领域,尤其涉及公安语音数据采集方法、装置、设备和计算机存储介质。
背景技术
声纹(Voiceprint)是用电声学仪器显示的携带言语信息的声波频谱。现代科学研究表明,声纹不仅具有特定性,而且有相对稳定性的特点。基于声纹的这两个特征,声纹采集和声纹识别已经广泛应用于公安系统,为案件侦破过程提供新的线索和证据,对于提高办案效率,优化办案方式,提高办案质量,提升案件侦破能力都将起到积极的推动作用。
当前的公安声纹库在进行声纹提取时对语音的要求很高,但目前公安语音采集的主要方法不可以保证语音采集的质量,如何合理的采集高质量的语音信息成为了当前亟待解决的技术问题。
发明内容
本发明的主要目的在于提供一种公安语音数据采集方法、装置、设备和计算机存储介质,旨在解决当前语音采集质量低的技术问题。
为实现上述目的,本发明提供公安语音数据采集方法,所述公安语音数据采集方法包括以下步骤:
获取预设采集装置采集的第一语音信息,分析所述第一语音信息得到所述第一语音信息的语音特征信息,其中,所述预设采集装置中包含至少两个麦克风;
根据所述第一语音信息的语音特征信息,对所述预设采集装置中的麦克风调整;
通过调整后的所述预设采集装置采集第二语音信息,将采集到的所述第二语音信息上传至公安语音数据库。
在一实施例中,所述根据所述第一语音信息的语音特征信息,对所述预设采集装置中的麦克风调整的步骤,包括:
根据所述第一语音信息的语音特征信息,从所述预设采集装置中选取主麦克风,并将所述预设采集装置中除所述主麦克风之外的麦克风作为副麦克风;
比对所述主麦克风对应的语音特征信息与所述副麦克风对应的语音特征信息,得到特征差值;
根据所述特征差值对所述预设采集装置中的麦克风调整。
在一实施例中,所述根据所述特征差值对所述预设采集装置中的麦克风调整的步骤,包括:
若所述预设采集装置包含两个麦克风,则判断所述特征差值是否为预设最大差值;
若所述特征差值不是预设最大差值,则将旋转所述预设采集装置,直至所述预设采集装置中主麦克风与副麦克风之间的特征差值为预设最大差值。
在一实施例中,所述根据所述第一语音信息的语音特征信息,从预设采集装置中选取主麦克风,并将所述预设采集装置中除所述主麦克风之外的麦克风作为副麦克风的步骤,包括:
提取所述预设采集装置中各麦克风对应语音特征信息中的振幅信息、频率信息、信噪比信息和/或短时能量信息;
将所述振幅信息、所述频率信息、所述信噪比信息和/或所述短时能量信息与预设标准信息进行比对,得到振幅差值、频率差值、信噪比差值和/或短时能量差值;
查询预设映射表,获取所述振幅差值对应的第一评分,所述频率差值对应的第二评分,所述信噪比差值对应的第三评分和/或所述短时能量差值对应的第四评分;
计算所述第一评分、所述第二评分、所述第三评分和/或所述第四评分的加权平均数,将所述加权平均数最大的麦克风作为主麦克风,将所述预设采集装置中除所述主麦克风之外的麦克风作为副麦克风。
在一实施例中,所述通过调整后的所述预设采集装置采集第二语音信息,将采集到的所述第二语音信息上传至公安语音数据库的步骤,包括:
通过调整后的所述预设采集装置采集第二语音信息,提取所述预设采集装置中主麦克风采集的第二语音信息;
解析所述主麦克风采集的第二语音信息,获得所述第二语音信息的语音特征信息,将所述语音特征信息与预设标准信息进行比对;
若所述语音特征信息与所述预设标准信息匹配,则将所述主麦克风采集的第二语音信息上传至公安语音数据库。
在一实施例中,所述解析所述主麦克风采集的第二语音信息,获得所述第二语音信息的语音特征信息,将所述语音特征信息与预设标准信息进行比对的步骤之后,包括:
若所述语音特征信息与所述预设标准信息不匹配,获取与所述预设标准信息不匹配的异常语音特征,及所述异常语音特征的类型;
若所述异常语音特征的类型为振幅类型,则调整所述第二语音信息,并将主麦克风采集的第二语音信息和调整后的第二语音信息上传至公安语音数据库;
若所述异常语音特征的类型为音色类型,则停止采集并输出提示信息。
在一实施例中,所述若所述异常语音特征的类型为振幅类型和/或噪声类型,则调整所述第二语音信息的步骤,包括:
若所述异常语音特征的类型为振幅类型,则获取预设采集装置中副麦克风采集的第二语音信息;
将所述主麦克风采集的第二语音信息与所述副麦克风采集的第二语音信息按照时间合成,得到调整后的第二语音信息。
此外,为实现上述目的,本发明还提供一种公安语音数据采集装置,所述公安语音数据采集装置包括:
获取分析模块,用于获取预设采集装置采集的第一语音信息,分析所述第一语音信息得到所述第一语音信息的语音特征信息,其中,所述预设采集装置中包含至少两个麦克风;
调整模块,用于根据所述第一语音信息的语音特征信息,对所述预设采集装置中的麦克风调整;
语音上传模块,用于通过调整后的所述预设采集装置采集第二语音信息,将采集到的所述第二语音信息上传至公安语音数据库。
此外,为实现上述目的,本发明还提供一种公安语音数据采集设备所述公安语音数据采集设备包括:预设采集装置,存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,其中:
所述预设采集装置,包括至少两个麦克风,所述麦克风用于采集语音信息;
所述计算机程序被所述处理器执行时实现公安语音数据采集方法的步骤。
此外,为实现上述目的,本发明还提供计算机存储介质;
所述计算机存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现如上述的公安语音数据采集方法的步骤。
本发明实施例提出的一种公安语音数据采集方法、装置、设备和计算机存储介质,本发明实施例中预设采集装置,预设的采集装置中包含多个麦克风,通过预设采集装置采集初始语音信息,然后根据采集到的初始语音信息的语音特征信息对预设采集装置中的麦克风进行调整,并利用预设采集装置中调整后的麦克风采集语音信息,使得采集到的语音信息更加清晰高质。
附图说明
图1是本发明实施例方案涉及的硬件运行环境的装置结构示意图;
图2为本发明公安语音数据采集方法第一实施例的流程示意图;
图3为图2中公安语音数据采集方法第一实施例中步骤S20的细化流程示意图;
图4为本发明公安语音数据采集方法第三实施例和第四实施例的流程示意图;
图5为本发明公安语音数据采集装置一实施例的功能模块示意图。
本发明实现的目的、功能特点及优点将结合实施例,参照附图做进一步说明。
具体实施方式
应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
由于现有技术在采集语音信息时多采用单个麦克风,可能出现麦克风未对准语音来源、采集的语音信息难以对比处理等缺陷,导致采集的语音质量差强人意,更难以满足公安系统对于采集语音的要求。
本发明提供一种解决方案,使采集装置自动调整至合适的采集位置,并且多麦克风同时采集按需处理,提升了采集语音的质量。
如图1所示,图1是本发明实施例方案涉及的硬件运行环境的终端(又叫公安语音数据采集设备,其中,公安语音数据采集设备可以是由单独的公安语音数据采集装置构成,也可以是由其他装置与公安语音数据采集装置组合形成)结构示意图。
本发明实施例终端可以固定终端,也可以是移动终端,如,带联网功能的PC(personal computer)个人计算机、智能手机、平板电脑、便携计算机等。
如图1所示,该终端可以包括:处理器1001,例如,中央处理器Central ProcessingUnit,CPU),网络接口1004,用户接口1003,存储器1005,通信总线1002。其中,通信总线1002用于实现这些组件之间的连接通信。用户接口1003可以包括显示屏(Display)、输入单元比如键盘(Keyboard),可选用户接口1003还可以包括标准的有线接口、无线接口。网络接口1004可选的可以包括标准的有线接口、无线接口(如无线保真WIreless-FIdelity,WIFI接口)。存储器1005可以是高速RAM存储器,也可以是稳定的存储器(non-volatile memory),例如,磁盘存储器。存储器1005可选的还可以是独立于前述处理器1001的存储装置。
可选地,终端还可以包括摄像头、RF(Radio Frequency,射频)电路,传感器、音频电路、WiFi模块;输入单元,比显示屏,触摸屏;网络接口可选除无线接口中除WiFi外,蓝牙、探针等等。其中,传感器比如光传感器、运动传感器以及其他传感器。
本领域技术人员可以理解,图1中示出的终端结构并不构成对终端的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置。
如图1所示,该计算机软件产品存储在一个存储介质(存储介质:又叫计算机存储介质、计算机介质、可读介质、可读存储介质、计算机可读存储介质或者直接叫介质等,存储介质可以是非易失性可读存储介质,如RAM、磁碟、光盘)中,包括若干指令用以使得一台终端设备(可以是手机,计算机,服务器,或者网络设备等)执行本发明各个实施例所述的方法,作为一种计算机存储介质的存储器1005中可以包括操作系统、网络通信模块、用户接口模块以及计算机程序。
在图1所示的终端中,网络接口1004主要用于连接后台服务器,与后台服务器进行数据通信;用户接口1003主要用于连接客户端(用户端),与客户端进行数据通信;而处理器1001可以用于调用存储器1005中存储的计算机程序,并执行本发明以下实施例提供的公安语音数据采集方法中的步骤。
基于上述硬件结构,提出了本发明公安语音数据采集方法的实施例。
参照图2,在本发明一种公安语音数据采集方法的第一实施例中,所述公安语音数据采集方法包括:
步骤S10,获取预设采集装置采集的第一语音信息,分析所述第一语音信息得到所述第一语音信息的语音特征信息,其中,所述预设采集装置中包含至少两个麦克风。
本实施例中公安语音数据采集方法应用于公安语音数据采集设备(又叫终端),终端中预设采集装置,预设采集装置中包含至少两个麦克风,至少两个麦克风的位置不作具体限定,例如,预设采集装置的主体是一个固定在电机上形状规则的柱体,至少两个麦克风分布在柱体的柱身同一水平线上,柱体可以通过电机完成360°旋转,每个麦克风可单独上下摆动。
终端控制开启预设采集装置,通过预设采集装置采集语音信息,终端获取预设采集装置采集的第一语音信息,并将采集的第一语音信息发送至处理器进行语音识别,终端获取第一语音信息识别得到的语音特征信息;语音特征信息包括但不仅限于:振幅信息、频率信息、信噪比信息、短时能量信息和音调信息等。
例如,当公安部门采集受采集者的语音信息时,首先在屏幕上输出一段文字,装置中的各麦克风采集受采集者读出这段文字的语音形成各麦克风对应的初始语音信息,下文将该初始语音信息称为第一语音信息以示区别,分析第一语音信息得到第一语音信息的语音特征信息。
可以理解的是,分析一段语音时的方式可以有多种,例如,通过语音识别模型进行语音信息分析,具体地:语音识别模型对第一语音信息的识别过程可以为:对第一语音信息进行预处理(包括预加重、加窗分帧处理、端点检测和降噪处理),然后提取经过预处理的第一语音信息对应的语音特征,然后根据该语音特征,通过训练好的语音识别模型进行识别,即可得到对应的语音特征信息。
步骤S20,根据所述第一语音信息的语音特征信息,对所述预设采集装置中的麦克风调整。
终端根据第一语音信息的语音特征信息,对预设采集装置中的麦克风调整,即,终端可以根据语音特征信息中的一个语音特征对预设采集装置中的一个麦克风进行调整;终端还可以结合特征信息中的多各语音特征对预设采集装置中的多个麦克风进行调整,本实施例中给出两种具体实现方式,包括:
实现方式一:终端获取第一语音信息的语音特征信息中表现语音响度的特征,例如振幅信息,若振幅信息低于预设限幅信息,将各麦克风进行伸缩调整至振幅信息最进阶限幅信息处,使麦克风接近受采集者,采集振幅信息更符合预设特征信息的语音。
实现方式二:终端利用第一语音信息判断区分主麦克风和副麦克风,计算主麦克风和副麦克采集语音的特征信息差值,利用该差值控制采集装置旋转。
步骤S30,通过调整后的所述预设采集装置采集第二语音信息,将采集到的所述第二语音信息上传至公安语音数据库。
在本实施例中,调整后的采集装置已达到最佳采集效果,装置调整完成后,输出装置调整完毕、开始采集的提示信息。
此后采集的语音信息为正式语音信息,为了便于描述,下文中将采集的正式语音信息称为第二语音信息。第二语音信息采集完成后,公安操作人员输入信息,可以是受采集的身份信息,采集地点、时间信息,采集事由信息等,将这些信息与第二语音信息绑定后上传至公安语音数据库中,以便于检索。
在实施例中终端预设采集装置,预设的采集装置中包含多个麦克风,通过预设采集装置采集初始语音信息,然后根据采集到的初始语音信息的语音特征信息对预设采集装置中的麦克风进行调整,并利用预设采集装置中调整后的麦克风采集语音信息,使得采集到的语音信息更加清晰高质,具体地,终端采集分析第一语音信息并获取参数,以对采集装置进行调整,从装置调整的角度出发,确保采集装置相对于受采集者处于采集装置的最佳采集方位,保证了语音质量的最优化。
进一步地,参照图3,在本发明第一实施例的基础上,提出了本发明公安语音数据采集方法的第二实施例。
本实施例是第一实施例中步骤S20的细化步骤,本实施例与第一实施例的区别在于:给出了一种根据所述第一语音信息的语音特征信息,对所述预设采集装置中的麦克风进行调整的具体方案,即,根据第一语音信息的语音特征信息,从预设采集装置中确定一个主麦克风,其余麦克风作为副麦克风,再利用主麦克风采集的第一语音信息和副麦克风采集的第一语音信息的特征差值,对采集装置进行调整,具体地,包括以下步骤:
步骤S21,根据所述第一语音信息的语音特征信息,从所述预设采集装置中选取主麦克风,并将所述预设采集装置中除所述主麦克风之外的麦克风作为副麦克风。
本实施例中,为了准确地调整采集装置的角度,采用了将采集装置中多个麦克风区分为主麦克风和副麦克风的方法,区分主麦克风和麦克风的标准是:使用各麦克风采集同一语音信息的各特征信息,将各特征信息与对应的预设标准特征信息比对并计算对应差值,根据差值查询映射表获得各特征的评分并计算各麦克风特征得加权平均值。计算该加权平均值的各权重并不固定,依据录制的环境和采用的语音特征信息而定,例如,当采用振幅信息、信噪比信息、短时能量信息三个特征信息时,结合公安系统应用场景,该应用场景下一般具有较为封闭的采集环境,所以应降低信噪比信息对应的第三评分权重,提升振幅信息和短时能量信息对应的第一评分和第四评分的权重,然后依据加权平均数的最大值确定主麦克风,除主麦克风外的麦克风为副麦克风。
具体地,步骤S21包括:
步骤a1,提取所述预设采集装置中各麦克风对应语音特征信息中的振幅信息、频率信息、信噪比信息和/或短时能量信息;
关于提取预设采集装置中个麦克风对应的语音特征信息的方法,在第一实施例中已经指出,此处不再赘述。
步骤a2,将所述振幅信息、所述频率信息、所述信噪比信息和/或所述短时能量信息与预设标准信息进行比对,得到振幅差值、频率差值、信噪比差值和/或短时能量差值;
本步骤中指出的预设标准信息是一个各类标准特征信息的集合,包含但不限于标准振幅特征信息、标准频率特征信息、标准信噪比特征信息和/或短时能量特征信息,该预设标准信息视实际应用场景修改各标准特征信息的阈值,在该场景下提供一个标准的参考值以评估语音特征信息,下文中的预设标准信息均与本实施例中的预设标准信息相同,是公安语音采集场景下的预设标准信息。
本步骤将步骤a1中提取的振幅信息、频率信息、信噪比信息和/或短时能量信息,预设标准信息进行比对,得到振幅差值、频率差值、信噪比差值和/或短时能量差值,但应了解的是,本步骤进行比对的特征不止限于上述特征。
步骤a3,查询预设映射表,获取所述振幅差值对应的第一评分,所述频率差值对应的第二评分,所述信噪比差值对应的第三评分和/或所述短时能量差值对应的第四评分;
终端中预设映射表,预设映射表是指包含各语音特征信息的特征差值与对应评分的映射,所述预设映射表指明了使用各语音特征信息的特征差值获得对各语音特征信息的特征差值的评分,其中的映射关系可以是一种计算方法,也可以是已给出的一一对应的关系。
步骤a4,计算所述第一评分、所述第二评分、所述第三评分和/或所述第四评分的加权平均数,将所述加权平均数最大的麦克风作为主麦克风,将所述预设采集装置中除所述主麦克风之外的麦克风作为副麦克风。
本实施中终端综合预设采集装置中各个麦克风采集语音的情况,划分主麦克风和副麦克风,以根据主麦克风和副麦克风的语音特征信息对预设采集装置进行调整,使得预设采集装置的调整更加科学,具体地:
步骤S22,比对所述主麦克风对应的语音特征信息与所述副麦克风对应的语音特征信息,得到特征差值。
终端比对主麦克风对应的语音特征信息与副麦克风对应的语音特征信息,得到特征差值,本实施例中,所述主麦克风对应的语音特征信息与所述副麦克风对应的语音特征信息包括但不限于:振幅特征信息、频率特征信息、短时能量特征信息、声强级特征信息,信噪比特征信息等;特征差值包括但不限于:振幅特征差值、频率特征差值、短时能量特征差值、声强级特征差值和信噪比特征差值。
步骤S23,根据所述特征差值对所述预设采集装置中的麦克风调整。
终端根据特征差值对预设采集装置中的麦克风调整,即,终端可以选择一个特征信息的特征差值,根据一个特征信息的特征差值对预设采集装置中的麦克风进行调整;此外,终端也可选择多个特征信息的特征差值对预设采集装置中的麦克风进行调整,例如,终端将多个特征信息的特征差值进行加权运算,然后根据加权得到的值进行调整。
具体地,本实施例在根据所述特征差值对所述预设采集装置中的麦克风调整有以下步骤:
步骤b1,若所述预设采集装置包含两个麦克风,则判断所述特征差值是否达到最大值,若没有达到最大值则继续旋转直至所述特征差值是否达到最大值;
本步骤中,所述特征差值的最大值可理解为一个特征差值的临界值,采集装置只包含两个麦克风时,装置旋转必然会导致该特征差值的变化,由初始值变化至最大值,再逐渐减小,记录该最大值对应的参数,旋转至该最大值处即完成了对于的采集装置的调整。
步骤b2,若所述特征差值不是预设最大差值,则将旋转所述预设采集装置,直至所述预设采集装置中主麦克风与副麦克风之间的特征差值为预设最大差值。
可以理解的是,若预设采集装置中存在两个以上麦克风时,获取主麦克风与相邻两个副麦克风的特征差值,若两个特征差值不相等,则采集装置向特征差值较大的麦克风旋转,自至两个特征差值相等时停止旋转。
在本实施例中通过分析采集装置获取的初始语音信息,提取其中的多个语音特征信息并查询映射表获取各语音特征信息评分,从而计算加权平均数确定采集装置的主麦克风和副麦克风,再比对主麦克风对应的语音特征信息和副麦克风对应的语音特征信息得到特征差值,并利用特征差值对采集装置进行调整,从而在采集装置调整角度保证了采集语音的最优,进而实现了提升采集语音的质量,满足了公安系统对于采集语音的需求。
进一步地,参照图4,在本发明上述实施例的基础上,提出了本发明公安语音数据采集方法的第三实施例。
本实施例是第一实施例中步骤S30的细化,本实施例中终端获取调整后预设采集装置采集第二语音信息,并对第二语音信息进行分析,判断第二语音信息是否符合标准,在第二语音信息符合标准时,终端将第二语音信息上传至公安语音数据库,保证公安语音数据库中音频的质量,具体地,包括:
步骤S31,通过调整后的所述预设采集装置采集第二语音信息,提取所述预设采集装置中主麦克风采集的第二语音信息。
步骤S32,解析所述主麦克风采集的第二语音信息,获得所述第二语音信息的语音特征信息,将所述语音特征信息与预设标准信息进行比对。
步骤S33,若所述语音特征信息与所述预设标准信息匹配,则将所述主麦克风采集的第二语音信息上传至公安语音数据库。
在本实施例中,完成调整后的采集装置开始采集第二语音信息,可以预知,因为每个人的发音方式(可理解为声音三要素,即响度、音调、音色)都不相同,导致每个人的语音特征信息不相同,所以采集的语音也不都尽如人意,因此本实施例使用了预设标准信息与主麦克风采集的第二语音特征信息进行比对,此预设标准信息为包含多个语音特征信息的标准信息的集合,根据实际应用场景选择对比特征信息的标准阈值,例如,在语音采集时,选取幅值特征信息和信噪比特征信息作为比对特征信息,采集语音的幅值特征信息在标准阈值内,采集语音的信噪比特征信息高于标准阈值,则所述语音特征信息与所述预设标准信息匹配,可以判定主麦克风采集的第二语音信息符合标准,因此不作其余语音上的处理,将语音上传至公安语音数据库。
本实施例提出的方案,从装置调整完成后开始采集的正式语音着手,在采集中预设了采集语音特征信息的标准进行比对,限定符合标准的语音才可上传至公安语音数据库,进一步地保证了语音采集的质量。
进一步地,参照图4,在本发明上述实施例的基础上,提出了本发明公安语音数据采集方法的第四实施例。
本实施例是第三实施例中步骤S32之后的步骤,上一实施例给出了第二语音特征信息与预设标准信息匹配的处理方法,本实施例给出了第二语音特征信息与预设标准信息不匹配的处理方法,具体地,包括:
步骤S34,若所述语音特征信息与所述预设标准信息不匹配,获取与所述预设标准信息不匹配的异常语音特征,及所述异常语音特征的类型。
步骤S35,若所述异常语音特征的类型为振幅类型,则调整所述第二语音信息,并将主麦克风采集的第二语音信息和调整后的第二语音信息上传至公安语音数据库。
步骤S36,若所述异常语音特征的类型为音色类型,则停止采集并输出提示信息。
上一实施例中已说明第二语音特征信息与预设标准信息比对的方法,此处不再赘述,当判定主麦克风采集的第二语音信息不符合标准,获取与所述预设标准信息不匹配的异常语音特征,依据不匹配的异常语音特征,本实施例给出两种处理方式:
1)当该异常语音特征可以通过一般语音处理手段解决时,例如,当该异常语音特征为振幅特征信息或是信噪比特征信息时,可以通过压缩振幅和与副麦克风语音按时间合成或与副麦克风采集的第二语音信息合成解决,将主麦克风采集的第二语音信息和合成后的语音信息一同上传至语音数据库中,以便后期按需选择未处理或处理过的语音。
2)当该异常语音特征不能通过一般语音处理手段解决时,例如,当该异常语音特征为音色特征信息时,进行特殊处理可能导致该语音失真,则停止采集并输出提示信息。
本实施例是对上一实施例的补充,指出了第二语音特征信息与预设标准信息不匹配的处理方法,可通过一般语音处理手段解决时,将语音处理后与未处理语音一同上传至公安语音库,不可通过一般语音处理手段解决时,停止采集并输出提示信息,处理后的语音和未处理的语音一同上传可以满足公安对语音尽量还原的要求。
此外,参照图5,本发明实施例还提出一种公安语音数据采集装置,所述公安语音数据采集装置包括:
获取分析模块10,用于获取预设采集装置采集的第一语音信息,分析所述第一语音信息得到所述第一语音信息的语音特征信息,其中,所述预设采集装置中包含至少两个麦克风;
调整模块20,用于根据所述第一语音信息的语音特征信息,对所述预设采集装置中的麦克风调整;
语音上传模块30,用于通过调整后的所述预设采集装置采集第二语音信息,将采集到的所述第二语音信息上传至公安语音数据库。
在一实施例中,所述调整模块20,包括:
选取子模块,用于根据所述第一语音信息的语音特征信息,从所述预设采集装置中选取主麦克风,并将所述预设采集装置中除所述主麦克风之外的麦克风作为副麦克风;
比对子模块,用于比对所述主麦克风对应的语音特征信息与所述副麦克风对应的语音特征信息,得到特征差值;
调整子模块,用于根据所述特征差值对所述预设采集装置中的麦克风调整。
在一实施例中,所述调整子模块,包括:
判断单元,用于若所述预设采集装置包含两个麦克风,则判断所述特征差值是否为预设最大差值;
旋转单元,用于若所述特征差值不是预设最大差值,则将旋转所述预设采集装置,直至所述预设采集装置中主麦克风与副麦克风之间的特征差值为预设最大差值。
在一实施例中,所述选取子模块包括:
提取单元,用于提取所述预设采集装置中各麦克风对应语音特征信息中的振幅信息、频率信息、信噪比信息和/或短时能量信息;
比较单元,用于将所述振幅信息、所述频率信息、所述信噪比信息和/或所述短时能量信息与预设标准信息进行比对,得到振幅差值、频率差值、信噪比差值和/或短时能量差值;
查询单元,用于查询预设映射表,获取所述振幅差值对应的第一评分,所述频率差值对应的第二评分,所述信噪比差值对应的第三评分和/或所述短时能量差值对应的第四评分;
计算单元,用于计算所述第一评分、所述第二评分、所述第三评分和/或所述第四评分的加权平均数,将所述加权平均数最大的麦克风作为主麦克风,将所述预设采集装置中除所述主麦克风之外的麦克风作为副麦克风。
在一实施例中,所述语音上传模块30,包括:
提取子模块,用于通过调整后的所述预设采集装置采集第二语音信息,提取所述预设采集装置中主麦克风采集的第二语音信息;
解析子模块,用于解析所述主麦克风采集的第二语音信息,获得所述第二语音信息的语音特征信息,将所述语音特征信息与预设标准信息进行比对;
上传子模块,用于若所述语音特征信息与所述预设标准信息匹配,则将所述主麦克风采集的第二语音信息上传至公安语音数据库。
在一实施例中,所述语音上传模块30,包括:
获取子模块,用于若所述语音特征信息与所述预设标准信息不匹配,获取与所述预设标准信息不匹配的异常语音特征,及所述异常语音特征的类型;
调整子模块,用于若所述异常语音特征的类型为振幅类型,则调整所述第二语音信息,并将主麦克风采集的第二语音信息和调整后的第二语音信息上传至公安语音数据库;
提示子模块,用于若所述异常语音特征的类型为音色类型,则停止采集并输出提示信息。
在一实施例中,所述调整子模块,包括:
获取单元,用于若所述异常语音特征的类型为振幅类型,则获取预设采集装置中副麦克风采集的第二语音信息;
调整单元,用于将所述主麦克风采集的第二语音信息与所述副麦克风采集的第二语音信息按照时间合成,得到调整后的第二语音信息。
其中,公安语音数据采集装置的各个功能模块实现的步骤可参照本发明公安语音数据采集方法的各个实施例,此处不再赘述。
此外,本发明实施例还提出一种计算机存储介质。
所述计算机存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现上述实施例提供的公安语音数据采集方法中的操作。
需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体/操作/对象与另一个实体/操作/对象区分开来,而不一定要求或者暗示这些实体/操作/对象之间存在任何这种实际的关系或者顺序;术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者系统不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者系统所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括该要素的过程、方法、物品或者系统中还存在另外的相同要素。
对于装置实施例而言,由于其基本相似于方法实施例,所以描述得比较简单,相关之处参见方法实施例的部分说明即可。以上所描述的装置实施例仅仅是示意性的,其中作为分离部件说明的单元可以是或者也可以不是物理上分开的。可以根据实际的需要选择中的部分或者全部模块来实现本发明方案的目的。本领域普通技术人员在不付出创造性劳动的情况下,即可以理解并实施。
上述本发明实施例序号仅仅为了描述,不代表实施例的优劣。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在如上所述的一个存储介质(如ROM/RAM、磁碟、光盘)中,包括若干指令用以使得一台终端设备(可以是手机,计算机,服务器,空调器,或者网络设备等)执行本发明各个实施例所述的方法。
以上仅为本发明的优选实施例,并非因此限制本发明的专利范围,凡是利用本发明说明书及附图内容所作的等效结构或等效流程变换,或直接或间接运用在其他相关的技术领域,均同理包括在本发明的专利保护范围内。

Claims (10)

1.一种公安语音数据采集方法,其特征在于,所述公安语音数据采集方法包括以下步骤:
获取预设采集装置采集的第一语音信息,分析所述第一语音信息得到所述第一语音信息的语音特征信息,其中,所述预设采集装置中包含至少两个麦克风;
根据所述第一语音信息的语音特征信息,对所述预设采集装置中的麦克风调整;
通过调整后的所述预设采集装置采集第二语音信息,将采集到的所述第二语音信息上传至公安语音数据库。
2.如权利要求1所述的公安语音数据采集方法,其特征在于,所述根据所述第一语音信息的语音特征信息,对所述预设采集装置中的麦克风调整的步骤,包括:
根据所述第一语音信息的语音特征信息,从所述预设采集装置中选取主麦克风,并将所述预设采集装置中除所述主麦克风之外的麦克风作为副麦克风;
比对所述主麦克风对应的语音特征信息与所述副麦克风对应的语音特征信息,得到特征差值;
根据所述特征差值对所述预设采集装置中的麦克风调整。
3.如权利要求2所述的公安语音数据采集方法,其特征在于,所述根据所述特征差值对所述预设采集装置中的麦克风调整的步骤,包括:
若所述预设采集装置包含两个麦克风,则判断所述特征差值是否为预设最大差值;
若所述特征差值不是预设最大差值,则将旋转所述预设采集装置,直至所述预设采集装置中主麦克风与副麦克风之间的特征差值为预设最大差值。
4.如权利要求2所述的公安语音数据采集方法,其特征在于,所述根据所述第一语音信息的语音特征信息,从所述预设采集装置中选取主麦克风,并将所述预设采集装置中除所述主麦克风之外的麦克风作为副麦克风的步骤,包括:
提取所述预设采集装置中各麦克风对应语音特征信息中的振幅信息、频率信息、信噪比信息和/或短时能量信息;
将所述振幅信息、所述频率信息、所述信噪比信息和/或所述短时能量信息与预设标准信息进行比对,得到振幅差值、频率差值、信噪比差值和/或短时能量差值;
查询预设映射表,获取所述振幅差值对应的第一评分,所述频率差值对应的第二评分,所述信噪比差值对应的第三评分和/或所述短时能量差值对应的第四评分;
计算所述第一评分、所述第二评分、所述第三评分和/或所述第四评分的加权平均数,将所述加权平均数最大的麦克风作为主麦克风,将所述预设采集装置中除所述主麦克风之外的麦克风作为副麦克风。
5.如权利要求1所述的公安语音数据采集方法,其特征在于,所述通过调整后的所述预设采集装置采集第二语音信息,将采集到的所述第二语音信息上传至公安语音数据库的步骤,包括:
通过调整后的所述预设采集装置采集第二语音信息,提取所述预设采集装置中主麦克风采集的第二语音信息;
解析所述主麦克风采集的第二语音信息,获得所述第二语音信息的语音特征信息,将所述语音特征信息与预设标准信息进行比对;
若所述语音特征信息与所述预设标准信息匹配,则将所述主麦克风采集的第二语音信息上传至公安语音数据库。
6.如权利要求5所述的公安语音数据采集方法,其特征在于,所述解析所述主麦克风采集的第二语音信息,获得所述第二语音信息的语音特征信息,将所述语音特征信息与预设标准信息进行比对的步骤之后,包括:
若所述语音特征信息与所述预设标准信息不匹配,获取与所述预设标准信息不匹配的异常语音特征,及所述异常语音特征的类型;
若所述异常语音特征的类型为振幅类型,则调整所述第二语音信息,并将主麦克风采集的第二语音信息和调整后的第二语音信息上传至公安语音数据库;
若所述异常语音特征的类型为音色类型,则停止采集并输出提示信息。
7.如权利要求5所述的公安语音数据采集方法,其特征在于,所述若所述异常语音特征的类型为振幅类型,则调整所述第二语音信息的步骤,包括:
若所述异常语音特征的类型为振幅类型,则获取所述预设采集装置中副麦克风采集的第二语音信息;
将所述主麦克风采集的第二语音信息与所述副麦克风采集的第二语音信息按照时间合成,得到调整后的第二语音信息。
8.一种公安语音数据采集装置,其特征在于,所述公安语音数据采集装置包括:
获取分析模块,用于获取预设采集装置采集的第一语音信息,分析所述第一语音信息得到所述第一语音信息的语音特征信息,其中,所述预设采集装置中包含至少两个麦克风;
调整模块,用于根据所述第一语音信息的语音特征信息,对所述预设采集装置中的麦克风调整;
语音上传模块,用于通过调整后的所述预设采集装置采集第二语音信息,将采集到的所述第二语音信息上传至公安语音数据库。
9.一种公安语音数据采集设备,其特征在于,所述公安语音数据采集设备包括:预设采集装置,存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,其中:
所述预设采集装置,包括至少两个麦克风,所述麦克风用于采集语音信息;
所述计算机程序被所述处理器执行时实现如权利要求1至7中任一项所述的公安语音数据采集方法的步骤。
10.一种计算机存储介质,其特征在于,所述计算机存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现如权利要求1至7中任一项所述的公安语音数据采集方法的步骤。
CN201911254329.XA 2019-12-06 2019-12-06 公安语音数据采集方法、装置、设备和计算机存储介质 Active CN110931019B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201911254329.XA CN110931019B (zh) 2019-12-06 2019-12-06 公安语音数据采集方法、装置、设备和计算机存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201911254329.XA CN110931019B (zh) 2019-12-06 2019-12-06 公安语音数据采集方法、装置、设备和计算机存储介质

Publications (2)

Publication Number Publication Date
CN110931019A true CN110931019A (zh) 2020-03-27
CN110931019B CN110931019B (zh) 2022-06-21

Family

ID=69857852

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201911254329.XA Active CN110931019B (zh) 2019-12-06 2019-12-06 公安语音数据采集方法、装置、设备和计算机存储介质

Country Status (1)

Country Link
CN (1) CN110931019B (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111883164A (zh) * 2020-06-22 2020-11-03 北京达佳互联信息技术有限公司 模型训练方法、装置、电子设备及存储介质
CN112687295A (zh) * 2020-12-22 2021-04-20 联想(北京)有限公司 一种输入控制方法及电子设备
CN113870879A (zh) * 2020-06-12 2021-12-31 青岛海尔电冰箱有限公司 智能家电麦克风的共享方法、智能家电和可读存储介质

Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104093094A (zh) * 2014-06-16 2014-10-08 华南理工大学 基于自适应旋转对准的室内语音采集方法与装置
CN104991755A (zh) * 2015-07-10 2015-10-21 联想(北京)有限公司 一种信息处理方法及电子设备
EP3001421A1 (en) * 2014-09-29 2016-03-30 Kabushiki Kaisha Toshiba Electronic device, method and storage medium
CN106303804A (zh) * 2016-07-28 2017-01-04 维沃移动通信有限公司 一种麦克风的控制方法及移动终端
CN107742523A (zh) * 2017-11-16 2018-02-27 广东欧珀移动通信有限公司 语音信号处理方法、装置以及移动终端
US9930447B1 (en) * 2016-11-09 2018-03-27 Bose Corporation Dual-use bilateral microphone array
CN108471561A (zh) * 2018-03-30 2018-08-31 上海摩软通讯技术有限公司 拾音控制方法、装置以及音箱
CN208507181U (zh) * 2018-07-09 2019-02-15 科沃斯商用机器人有限公司 语音采集设备
CN109767769A (zh) * 2019-02-21 2019-05-17 珠海格力电器股份有限公司 一种语音识别方法、装置、存储介质及空调

Patent Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104093094A (zh) * 2014-06-16 2014-10-08 华南理工大学 基于自适应旋转对准的室内语音采集方法与装置
EP3001421A1 (en) * 2014-09-29 2016-03-30 Kabushiki Kaisha Toshiba Electronic device, method and storage medium
CN104991755A (zh) * 2015-07-10 2015-10-21 联想(北京)有限公司 一种信息处理方法及电子设备
CN106303804A (zh) * 2016-07-28 2017-01-04 维沃移动通信有限公司 一种麦克风的控制方法及移动终端
US9930447B1 (en) * 2016-11-09 2018-03-27 Bose Corporation Dual-use bilateral microphone array
CN107742523A (zh) * 2017-11-16 2018-02-27 广东欧珀移动通信有限公司 语音信号处理方法、装置以及移动终端
CN108471561A (zh) * 2018-03-30 2018-08-31 上海摩软通讯技术有限公司 拾音控制方法、装置以及音箱
CN208507181U (zh) * 2018-07-09 2019-02-15 科沃斯商用机器人有限公司 语音采集设备
CN109767769A (zh) * 2019-02-21 2019-05-17 珠海格力电器股份有限公司 一种语音识别方法、装置、存储介质及空调

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
YI JIANG: "Auditory features for the close talk speech enhancement with parameter masks", 《2015 8TH INTERNATIONAL CONGRESS ON IMAGE AND SIGNAL PROCESSING (CISP)》 *
万梦时: "基于麦克风阵列的智能音视频处理系统", 《中国优秀硕士学位论文全文数据库》 *

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113870879A (zh) * 2020-06-12 2021-12-31 青岛海尔电冰箱有限公司 智能家电麦克风的共享方法、智能家电和可读存储介质
CN111883164A (zh) * 2020-06-22 2020-11-03 北京达佳互联信息技术有限公司 模型训练方法、装置、电子设备及存储介质
CN111883164B (zh) * 2020-06-22 2023-11-03 北京达佳互联信息技术有限公司 模型训练方法、装置、电子设备及存储介质
CN112687295A (zh) * 2020-12-22 2021-04-20 联想(北京)有限公司 一种输入控制方法及电子设备

Also Published As

Publication number Publication date
CN110931019B (zh) 2022-06-21

Similar Documents

Publication Publication Date Title
CN110931019B (zh) 公安语音数据采集方法、装置、设备和计算机存储介质
US20190132453A1 (en) Method and Apparatus for Adjusting Volume of User Terminal, and Terminal
US10733970B2 (en) Noise control method and device
US10121492B2 (en) Voice converting apparatus and method for converting user voice thereof
CN107172256B (zh) 耳机通话自适应调整方法、装置、移动终端及存储介质
CN108346433A (zh) 一种音频处理方法、装置、设备及可读存储介质
CN104991754B (zh) 录音方法及装置
CN112017687B (zh) 一种骨传导设备的语音处理方法、装置及介质
CN110970057A (zh) 一种声音处理方法、装置与设备
WO2022042129A1 (zh) 音频处理方法及装置
CN112017693B (zh) 一种音频质量评估方法及装置
CN110400565A (zh) 说话人识别方法、系统及计算机可读存储介质
US9251803B2 (en) Voice filtering method, apparatus and electronic equipment
CN107452398B (zh) 回声获取方法、电子设备及计算机可读存储介质
CN104851423B (zh) 一种声音信息处理方法及装置
CN107977187B (zh) 一种混响调节方法及电子设备
CN113709291A (zh) 音频处理方法、装置、电子设备及可读存储介质
CN107197404B (zh) 一种音效自动调节方法、装置和一种录播系统
CN116132875B (zh) 一种辅听耳机的多模式智能控制方法、系统及存储介质
CN109215688B (zh) 同场景音频处理方法、装置、计算机可读存储介质及系统
CN113370923B (zh) 一种车辆配置的调整方法、装置、电子设备及存储介质
CN111182416B (zh) 处理方法、装置及电子设备
WO2021103262A1 (zh) 耳机的控制方法、耳机及可读存储介质
CN106790963A (zh) 音频信号的控制方法及装置
CN112509597A (zh) 录音数据识别方法和装置、录音设备

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant