CN110970035A - 单机语音识别方法、装置及计算机可读存储介质 - Google Patents

单机语音识别方法、装置及计算机可读存储介质 Download PDF

Info

Publication number
CN110970035A
CN110970035A CN201911248623.XA CN201911248623A CN110970035A CN 110970035 A CN110970035 A CN 110970035A CN 201911248623 A CN201911248623 A CN 201911248623A CN 110970035 A CN110970035 A CN 110970035A
Authority
CN
China
Prior art keywords
information
voiceprint
suspect
stand
library
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201911248623.XA
Other languages
English (en)
Other versions
CN110970035B (zh
Inventor
彭辉
黎智勇
许敏强
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Guangzhou Speakin Intelligent Technology Co ltd
Original Assignee
Guangzhou Speakin Intelligent Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Guangzhou Speakin Intelligent Technology Co ltd filed Critical Guangzhou Speakin Intelligent Technology Co ltd
Priority to CN201911248623.XA priority Critical patent/CN110970035B/zh
Publication of CN110970035A publication Critical patent/CN110970035A/zh
Application granted granted Critical
Publication of CN110970035B publication Critical patent/CN110970035B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L17/00Speaker identification or verification techniques
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L17/00Speaker identification or verification techniques
    • G10L17/04Training, enrolment or model building
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L17/00Speaker identification or verification techniques
    • G10L17/06Decision making techniques; Pattern matching strategies

Landscapes

  • Engineering & Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Business, Economics & Management (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Game Theory and Decision Science (AREA)
  • Telephonic Communication Services (AREA)

Abstract

本发明公开了一种单机语音识别方法,该单机语音识别方法包括:从声纹数据库中获取数据库声纹信息;根据预设规则对所述数据库声纹信息进行分区存储,得到分区存储声纹库;接收采集到的嫌疑人语音信息;解析所述嫌疑人语音信息,得到嫌疑人声纹信息;将所述嫌疑人声纹信息与所述分区存储声纹库进行比较,得到识别比较结果。本发明还公开了一种单机语音识别装置和一种计算机可读存储介质。本发明能够在无法连接网络的情况下,实现辨别嫌疑人的声纹信息的功能;能够在无法连接网络的情况下,实现快速辨别和查询嫌疑人的声纹信息的功能。

Description

单机语音识别方法、装置及计算机可读存储介质
技术领域
本发明涉及通信技术领域,尤其涉及单机语音识别方法、装置及计算机可读存储介质。
背景技术
目前,公共安全领域通常是通过辨识嫌疑人身份来协助案件侦破方面,在辨别嫌疑人的身份时通常使用指纹识别技术、人脸识别技术和声纹识别技术,其中,声纹识别技术通常是先获取到嫌疑人的语音信息,提取语音信息中的声纹信息,将声纹信息与公安声纹库中的数据进行比较,得到比较结果;但是,在有些无法连接数据库网络的调查地点进行调查时,无法将获取到的嫌疑人语音信息与公安声纹库进行比较,得不到比较结果,不能识别嫌疑人的声纹信息,进而不能识别嫌疑人的身份。
发明内容
本发明的主要目的在于提出一种单机语音识别方法、装置及计算机可读存储介质,旨在解决在无法连接网络的情况下,如何辨别嫌疑人的声纹信息的技术问题。
为实现上述目的,本发明提供一种单机语音识别方法,所述单机语音识别方法包括如下步骤:
从声纹数据库中获取数据库声纹信息;
根据预设规则对所述数据库声纹信息进行分区存储,得到分区存储声纹库;
接收采集到的嫌疑人语音信息;
解析所述嫌疑人语音信息,得到嫌疑人声纹信息;
将所述嫌疑人声纹信息与所述分区存储声纹库进行比较,得到识别比较结果。
可选地,所述根据预设规则对数据库声纹信息进行分区存储,得到分区存储声纹库的步骤,包括:
读取数据库声纹信息中的个体声纹信息和与个体声纹信息对应的个体相关信息;
根据所述个体相关信息得到维度信息;
根据所述维度信息和预设维度分类规则对所述个体声纹信息进行分区存储,得到分区存储声纹库。
可选地,所述根据所述个体相关信息得到维度信息的步骤之后,包括:
根据维度信息建立分区存储库;
所述根据所述维度信息和预设维度分类规则对所述个体声纹信息进行分区存储,得到分区存储声纹库的步骤,包括:
将每个所述个体声纹信息按照维度信息和预设维度分类规则依次存入分区存储库中,得到分区存储声纹库。
可选地,所述接收采集到的嫌疑人语音信息的步骤之后,还包括:
接收嫌疑人语音信息对应的嫌疑人相关信息;
所述将所述嫌疑人声纹信息与所述分区存储声纹库进行比较,得到比较结果的步骤包括:
将所述嫌疑人声纹信息与所述分区存储声纹库进行比较,得到声纹比较结果;
将所述嫌疑人相关信息与所述个体相关信息进行比较,得到相关比较结果;
根据所述声纹比较结果和所述相关比较结果,生成识别比较结果。
可选地,所述根据所述声纹比较结果和所述相关比较结果,生成识别比较结果的步骤之后,包括:
根据所述声纹比较结果,得到声纹比较值;
根据所述相关比较结果,得到相关比较值;
检测所述声纹比较值是否大于预设声纹阈值;
若所述声纹比较值大于预设声纹阈值,则检测所述相关比较值是否大于预设相关阈值;
所述相关比较值大于预设相关阈值,则将所述嫌疑人声纹信息保存至所述分区存储声纹库。
可选地,所述接收嫌疑人语音信息对应的嫌疑人相关信息的步骤之后,包括:
根据所述嫌疑人相关信息,得到嫌疑人维度信息;
将嫌疑人维度信息与所述维度信息进行比对,得到筛选维度信息;
所述将所述嫌疑人声纹信息与所述分区存储声纹库进行比较,得到识别比较结果的步骤,还包括:
将所述嫌疑人声纹信息与筛选维度信息相关的所述分区存储声纹库进行比较,得到识别比较结果。
可选地,所述接收采集到的嫌疑人语音信息的步骤之前,包括:
在接收到用户发出的声纹识别指令之后,在终端显示验证界面,以使得用户根据终端显示验证界面输入用户身份验证信息;
检验所述用户验证信息是否符合预设身份验证信息;
若用户验证信息符合预设身份验证信息,则执行:接收采集到的嫌疑人语音信息。
可选地,所述接收采集到的嫌疑人语音信息的步骤之后,还包括:
将采集到的所述嫌疑人语音信息进行去噪处理。
此外,为实现上述目的,本发明还提供一种装置,所述装置包括:存储器、处理器及存储在所述存储器上并可在所述处理器上运行的单机语音识别程序,所述单机语音识别程序被所述处理器执行时实现如上所述的单机语音识别方法的步骤。
此外,为实现上述目的,本发明还提供一种计算机可读存储介质,所述计算机可读存储介质上存储有单机语音识别程序,所述单机语音识别程序被处理器执行时实现如上所述的单机语音识别方法的步骤。
本发明提供了一种单机语音识别方法、系统及计算机可读存储介质,从声纹数据库中获取数据库声纹信息;根据预设规则对所述数据库声纹信息进行分区存储,得到分区存储声纹库;接收采集到的嫌疑人语音信息;解析所述嫌疑人语音信息,得到嫌疑人声纹信息;将所述嫌疑人声纹信息与所述分区存储声纹库进行比较,得到识别比较结果。通过上述方式,本发明能够在无法连接网络的情况下,实现了辨别嫌疑人的声纹信息的功能;能够在无法连接网络的情况下,实现了快速辨别和查询嫌疑人的声纹信息的功能。
附图说明
图1是本发明实施例方案涉及的硬件运行环境的终端结构示意图;
图2为本发明单机语音识别方法第一实施例的流程示意图;
图3为本发明单机语音识别方法第二实施例的流程示意图;
图4为本发明单机语音识别方法第三实施例的流程示意图;
图5为本发明单机语音识别方法第四实施例的流程示意图;
图6为本发明单机语音识别方法第五实施例的流程示意图。
本发明目的的实现、功能特点及优点将结合实施例,参照附图做进一步说明。
具体实施方式
应当理解,此处所描述的具体实施例仅用以解释本发明,并不用于限定本发明。
本发明实施例的主要解决方案是:从声纹数据库中获取数据库声纹信息;根据预设规则对所述数据库声纹信息进行分区存储,得到分区存储声纹库;接收采集到的嫌疑人语音信息;解析所述嫌疑人语音信息,得到嫌疑人声纹信息;将所述嫌疑人声纹信息与所述分区存储声纹库进行比较,得到识别比较结果。
现有的声纹识别技术通常是先获取到嫌疑人的语音信息,提取语音信息中的声纹信息,将声纹信息与公安声纹库中的数据进行比较,得到比较结果;但是,在有些无法连接数据库网络的调查地点进行调查时,无法将获取到的嫌疑人语音信息与公安声纹库进行比较,得不到比较结果,不能识别嫌疑人的声纹信息,进而不能识别嫌疑人的身份。
本发明解决在无法连接网络的情况下,如何辨别嫌疑人的声纹信息的技术问题。
如图1所示,图1是本发明实施例方案涉及的硬件运行环境的终端结构示意图。
本发明实施例终端可以是PC,也可以是智能手机、平板电脑等具有显示功能的可移动式终端设备。
如图1所示,该终端可以包括:处理器1001,例如CPU,网络接口1004,用户接口1003,存储器1005,通信总线1002。其中,通信总线1002用于实现这些组件之间的连接通信。用户接口1003可以包括显示屏(Display)、输入单元比如键盘(Keyboard),可选用户接口1003还可以包括标准的有线接口、无线接口。网络接口1004可选的可以包括标准的有线接口、无线接口(如WI-FI接口)。存储器1005可以是高速RAM存储器,也可以是稳定的存储器(non-volatile memory),例如磁盘存储器。存储器1005可选的还可以是独立于前述处理器1001的存储装置。
优选地,终端还可以包括摄像头、RF(Radio Frequency,射频)电路,传感器、音频电路、WiFi模块等等。其中,传感器比如光传感器、运动传感器以及其他传感器。具体地,光传感器可包括环境光传感器及接近传感器,其中,环境光传感器可根据环境光线的明暗来调节显示屏的亮度,接近传感器可在移动终端移动到耳边时,关闭显示屏和/或背光。作为运动传感器的一种,重力加速度传感器可检测各个方向上(一般为三轴)加速度的大小,静止时可检测出重力的大小及方向,可用于识别移动终端姿态的应用(比如横竖屏切换、相关游戏、磁力计姿态校准)、振动识别相关功能(比如计步器、敲击)等;当然,移动终端还可配置陀螺仪、气压计、湿度计、温度计、红外线传感器等其他传感器,在此不再赘述。
本领域技术人员可以理解,图1中示出的终端结构并不构成对终端的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置。
如图1所示,作为一种计算机存储介质的存储器1005中可以包括操作系统、网络通信模块、用户接口模块以及单机语音识别程序。
在图1所示的终端中,网络接口1004主要用于连接后台服务器,与后台服务器进行数据通信;用户接口1003主要用于连接客户端(用户端),与客户端进行数据通信;而处理器1001可以用于调用存储器1005中存储的单机语音识别程序,并执行以下操作:
从声纹数据库中获取数据库声纹信息;
根据预设规则对所述数据库声纹信息进行分区存储,得到分区存储声纹库;
接收采集到的嫌疑人语音信息;
解析所述嫌疑人语音信息,得到嫌疑人声纹信息;
将所述嫌疑人声纹信息与所述分区存储声纹库进行比较,得到识别比较结果。
进一步地,处理器1001可以调用存储器1005中存储的单机语音识别程序,还执行以下操作:
读取数据库声纹信息中的个体声纹信息和与个体声纹信息对应的个体相关信息;
根据所述个体相关信息得到维度信息;
根据所述维度信息和预设维度分类规则对所述个体声纹信息进行分区存储,得到分区存储声纹库。
进一步地,处理器1001可以调用存储器1005中存储的单机语音识别程序,还执行以下操作:
根据维度信息建立分区存储库;
所述根据所述维度信息和预设维度分类规则对所述个体声纹信息进行分区存储,得到分区存储声纹库的步骤,包括:
将每个所述个体声纹信息按照维度信息和预设维度分类规则依次存入分区存储库中,得到分区存储声纹库。
进一步地,处理器1001可以调用存储器1005中存储的单机语音识别程序,还执行以下操作:
接收嫌疑人语音信息对应的嫌疑人相关信息;
所述将所述嫌疑人声纹信息与所述分区存储声纹库进行比较,得到比较结果的步骤包括:
将所述嫌疑人声纹信息与所述分区存储声纹库进行比较,得到声纹比较结果;
将所述嫌疑人相关信息与所述个体相关信息进行比较,得到相关比较结果;
根据所述声纹比较结果和所述相关比较结果,生成识别比较结果。
进一步地,处理器1001可以调用存储器1005中存储的单机语音识别程序,还执行以下操作:
根据所述声纹比较结果,得到声纹比较值;
根据所述相关比较结果,得到相关比较值;
检测所述声纹比较值是否大于预设声纹阈值;
若所述声纹比较值大于预设声纹阈值,则检测所述相关比较值是否大于预设相关阈值;
所述相关比较值大于预设相关阈值,则将所述嫌疑人声纹信息保存至所述分区存储声纹库。
进一步地,处理器1001可以调用存储器1005中存储的单机语音识别程序,还执行以下操作:
根据所述嫌疑人相关信息,得到嫌疑人维度信息;
将嫌疑人维度信息与所述维度信息进行比对,得到筛选维度信息;
所述将所述嫌疑人声纹信息与所述分区存储声纹库进行比较,得到识别比较结果的步骤,还包括:
将所述嫌疑人声纹信息与筛选维度信息相关的所述分区存储声纹库进行比较,得到识别比较结果。
进一步地,处理器1001可以调用存储器1005中存储的单机语音识别程序,还执行以下操作:
在接收到用户发出的声纹识别指令之后,在终端显示验证界面,以使得用户根据终端显示验证界面输入用户身份验证信息;
检验所述用户验证信息是否符合预设身份验证信息;
若用户验证信息符合预设身份验证信息,则执行:接收采集到的嫌疑人语音信息。
进一步地,处理器1001可以调用存储器1005中存储的单机语音识别程序,还执行以下操作:
将采集到的所述嫌疑人语音信息进行去噪处理。
基于上述硬件结构,提出本发明单机语音识别方法实施例。
本发明单机语音识别方法。
参照图2,图2为本发明单机语音识别方法第一实施例的流程示意图。
本发明实施例中,该单机语音识别方法应用于单机语音识别装置,所述方法包括:
步骤S10,从声纹数据库中获取数据库声纹信息;
在本实施例中,当用户(公共安全调查机关)需要在没有网络的调查地点(如境外或某些无网络特定的地点)对用户进行声纹识别时,不能与省级声纹数据库或者国家声纹数据库进行对分析,得到结果;这种情况下单机语音识别装置通过预先从省级声纹数据库或者国家声纹数据库获取与调查案件可能相关的数据库声纹信息;单机语音识别装置可以是移动终端,也可以是固定终端,还可以是用于调查的特殊电子设备。其中,数据库声纹信息是用户根据案件调查地域、案件调查可能的对象、案件调查的时间和案件调查的性质向省级声纹数据库或者国家声纹数据库获取的。
步骤S20,根据预设规则对所述数据库声纹信息进行分区存储,得到分区存储声纹库;
在本实施例中,单机语音识别装置在获取到数据库声纹信息之后,单机语音识别装置根据预设对数据库声纹信息进行分区存储,得到分区存储声纹库。其中,分区存储声纹库是用于用户在无法通过网络连接省级声纹数据库或者国家声纹数据库网络的情况下或者不方便使用网络的情况下设置的一个用于检测犯罪嫌疑人声纹信息的一个特殊的数据库。
步骤S30,接收采集到的嫌疑人语音信息;
在本实施例中,当用户到达办案地点之后,用采集到嫌疑人的语音信息,用户将采集到的嫌疑人语音信息传输至单机语音识别装置,单机语音识别装置接收采集到的嫌疑人语音信息。
步骤S30接收采集到的嫌疑人语音信息之前,可以包括;
步骤a,在接收到用户发出的声纹识别指令之后,在终端显示验证界面,以使得用户根据终端显示验证界面输入用户身份验证信息;
步骤b,检验所述用户验证信息是否符合预设身份验证信息;
步骤c,若用户验证信息符合预设身份验证信息,则执行:接收采集到的嫌疑人语音信息。
在本实施例中,为了加强分区存储声纹库的使用安全,可以在对嫌疑人进行语音信息进行比较之前进行用户身份的验证;单机语音识别装置在接收到用户发出的声纹识别指令之后,单机语音识别装置在终端显示验证界面,以使得用户根据终端显示验证界面输入用户身份验证信息;单机语音识别装置在接收到用户输入的身份验证信息之后,单机语音识别装置检验用户验证信息是否符合预设身份验证信息;若单机语音识别装置检测用户验证信息符合预设身份验证信息,则单机语音识别装置接收采集到的嫌疑人语音信息,并解析嫌疑人语音信息。
步骤S30接收采集到的嫌疑人语音信息之后,还包括:
步骤d,将采集到的所述嫌疑人语音信息进行去噪处理。
在本实施例中,单机语音识别装置计算嫌疑人语音信息的优化参数,所述优化参数包括:指向性参数和白噪声增益,指向性参数是指期望信号相对于全向噪声的输入信噪比和麦克风的输入信噪比的比值,白噪声增益是指所述多个麦克风输出信噪比与输入性噪比的比值;根据优化参数对嫌疑人语音信息进行优化,得到去噪后的语音信号。
在实际应用中,考虑到嫌疑人语音信息为宽带信号,对于不同频点需要分别处理,所以需要将集到的嫌疑人语音信息转化为待识别频域信号。单机语音识别装置计算待识别频域信号的优化参数,优化参数包括:指向性参数和白噪声增益,指向性参数是指期望信号相对于全向噪声的输入信噪比和麦克风的输入信噪比的比值,白噪声增益是指多个麦克风输出信噪比与输入性噪比的比值;根据优化参数对待识别声音频域信号进行优化,得到去噪后的嫌疑人语音信息。
步骤S40,解析所述嫌疑人语音信息,得到嫌疑人声纹信息;
在本实施例中,单机语音识别装置在接收采集到的嫌疑人语音信息之后,单机语音识别装置对嫌疑人语音信息进行处理,解析嫌疑人语音信息,得到嫌疑人声纹信息。
步骤S50,将所述嫌疑人声纹信息与所述分区存储声纹库进行比较,得到识别比较结果。
在本实施例中,单机语音识别装置在得到嫌疑人声纹信息之后,单机语音识别装置将嫌疑人声纹信息与分区存储声纹库进行比较,得到识别比较结果。
本实施例通过上述方案,从声纹数据库中获取数据库声纹信息;根据预设规则对所述数据库声纹信息进行分区存储,得到分区存储声纹库;接收采集到的嫌疑人语音信息;解析所述嫌疑人语音信息,得到嫌疑人声纹信息;将所述嫌疑人声纹信息与所述分区存储声纹库进行比较,得到识别比较结果。由此,通过将嫌疑人声纹信息与所述分区存储声纹库进行比较,实现了在无法连接网络的情况下,也能辨别嫌疑人的声纹信息;实现了在无法连接网络的情况下,快速辨别和查询嫌疑人的声纹信息。
进一步地,参照图3,图3为本发明单机语音识别方法第二实施例的流程示意图。基于上述图2所示的实施例,步骤S20根据预设规则对数据库声纹信息进行分区存储,得到分区存储声纹库,可以包括:
步骤S21,读取数据库声纹信息中的个体声纹信息和与个体声纹信息对应的个体相关信息;
在本实施例中,单机语音识别装置在获取到数据库声纹信息之后,单机语音识别装置读取数据库声纹信息中的个体声纹信息和与隔日声纹信息对应的个体相关信息;其中,个体声纹信息是每个存储在省级声纹数据库或者国家声纹数据库中的单条声纹信息,个体相关信息是与个体声纹信息同一个人的其它与个人声纹信息相关联的信息,个体相关信息包括个体的人脸信息、姓名信息、身份证号码信息个体照片信息、语音备注信息、录入的时间信息和犯罪的地点信息等。其中,个体就是省级声纹数据库或者国家声纹数据库有犯罪记录或者可能有犯罪记录的人员。
步骤S22,根据所述个体相关信息得到维度信息;
在本实施例中,单机语音识别装置在得到个体声纹信息和个体相关信息之后,单机语音识别装置读取个体相关信息中的维度信息,其中,维度信息包括个体信息录入的时间信息和个体可能犯罪的地点或地域。
步骤S23,根据所述维度信息和预设维度分类规则对所述个体声纹信息进行分区存储,得到分区存储声纹库。
在本实施例中,单机语音识别装置在得到维度信息之后,单机语音识别装置根据维度信息和预设维度分类规则对隔日声纹信息进行分区存储,得到分区存储声纹库。其中,预设维度分类规则可以是根据个体的个体声纹信息和个体相关信息录入省级声纹数据库或者国家声纹数据库的时间,预设维度分类规则也可以是个体的犯罪或可能犯罪的地点或地域。
步骤S22根据所述个体相关信息得到维度信息之后,可以包括:
步骤e,根据维度信息建立分区存储库;
在本实施例中,单机语音识别装置在得到维度信息之后,单机语音识别装置根据维度信息建立分区存储库。
步骤S23根据所述维度信息和预设维度分类规则对所述个体声纹信息进行分区存储,得到分区存储声纹库的步骤,包括:
步骤f,将每个所述个体声纹信息按照维度信息和预设维度分类规则依次存入分区存储库中,得到分区存储声纹库。
在本实施例中,单机语音识别装置在根据维度信息建立分区存储库之后,单机语音识别装置将每个个体声纹信息按照维度信息和预设维度分类规则依次存入分区存储库中,得到分区存储声纹库。
本实施例通过上述方案,所从声纹数据库中获取数据库声纹信息;读取数据库声纹信息中的个体声纹信息和与个体声纹信息对应的个体相关信息;根据所述个体相关信息得到维度信息;根据所述维度信息和预设维度分类规则对所述个体声纹信息进行分区存储,得到分区存储声纹库;接收采集到的嫌疑人语音信息;解析所述嫌疑人语音信息,得到嫌疑人声纹信息;将所述嫌疑人声纹信息与所述分区存储声纹库进行比较,得到识别比较结果。由此,通过将嫌疑人声纹信息与所述分区存储声纹库进行比较,实现了在无法连接网络的情况下,也能辨别嫌疑人的声纹信息;实现了在无法连接网络的情况下,快速辨别和查询嫌疑人的声纹信息。
进一步地,参照图4,图4为本发明单机语音识别方法第三实施例的流程示意图。基于上述图3所示的实施例,步骤S30接收采集到的嫌疑人语音信息之后,可以包括:
步骤S60,接收嫌疑人语音信息对应的嫌疑人相关信息;
在本实施例中,单机语音识别装置在接收采集到的嫌疑人语音信息之后,单机语音识别装置接收嫌疑人语音信息对应的嫌疑人相关信息。其中,嫌疑人相关信息可以是在嫌疑人语音信息同时发送至单机语音识别装置的,嫌疑人相关信息可以是在嫌疑人语音信息之后发送至单机语音识别装置的;嫌疑人相关信息可以是嫌疑人的人脸信息、姓名信息、身份证号码信息个体照片信息、语音备注信息、录入的时间信息和犯罪的地点信息等。
步骤S50,所述将所述嫌疑人声纹信息与所述分区存储声纹库进行比较,得到比较结果的步骤包括:
步骤S51,将所述嫌疑人声纹信息与所述分区存储声纹库进行比较,得到声纹比较结果;
在本实施例中,单机语音识别装置在接收到嫌疑人相关信息之后,单机语音识别装置将嫌疑人声纹信息与分区存储声纹库进行比较,得到声纹比较结果。
步骤S52,将所述嫌疑人相关信息与所述个体相关信息进行比较,得到相关比较结果;
在本实施例中,单机语音识别装置在接收到嫌疑人相关信息之后,单机语音识别装置将嫌疑人相关信息与个体相关信息进行比较,得到相关比较结果。
步骤S53,根据所述声纹比较结果和所述相关比较结果,生成识别比较结果。
在本实施例中,单机语音识别装置在得到声纹比较结果和相关比较结果之后,单机语音识别装置根据声纹比较结果和相关比较结果,生成识别比较结果。
本实施例通过上述方案,从声纹数据库中获取数据库声纹信息;根据预设规则对所述数据库声纹信息进行分区存储,得到分区存储声纹库;接收采集到的嫌疑人语音信息;接收嫌疑人语音信息对应的嫌疑人相关信息;解析所述嫌疑人语音信息,得到嫌疑人声纹信息;将所述嫌疑人声纹信息与所述分区存储声纹库进行比较,得到声纹比较结果;将所述嫌疑人相关信息与所述个体相关信息进行比较,得到相关比较结果;根据所述声纹比较结果和所述相关比较结果,生成识别比较结果。由此,通过将声纹比较结果与相关比较结果进行比较,实现了在无法连接网络的情况下,也能辨别嫌疑人的声纹信息;实现了在无法连接网络的情况下,快速辨别和查询嫌疑人的声纹信息。
进一步地,参照图5,图5为本发明单机语音识别方法第四实施例的流程示意图。基于上述图4所示的实施例,步骤S53根据所述声纹比较结果和所述相关比较结果,生成识别比较结果,可以包括:
步骤S531,根据所述声纹比较结果,得到声纹比较值;
在本实施例中,单机语音识别装置在得到声纹比较结果和相关比较结果之后,单机语音识别装置根据声纹比较结果,得到声纹比较值。其中,声纹比较值是用于评价嫌疑人声纹信息与分区存储声纹库中那些个体的个体声纹信息相似,相似度分别是多少。
步骤S532,根据所述相关比较结果,得到相关比较值;
在本实施例中,单机语音识别装置在得到声纹比较结果和相关比较结果之后,单机语音识别装置根据相关比较结果,得到相关比较值。其中,相关比较值是用于评价嫌疑人相关信息与分区存储声纹库中那些个体的个体相关信息相似,相似度分别是多少。
步骤S533,检测所述声纹比较值是否大于预设声纹阈值;
在本实施例中,单机语音识别装置在得到声纹比较值之后,检测声纹比较值是否大于预设声纹阈值;其中,预设声纹阈值是根据时间案件调查需求设置的,可以设置为相似度高于50%、60%或70%。
步骤S534,若所述声纹比较值大于预设声纹阈值,则检测所述相关比较值是否大于预设相关阈值;
在本实施例中,当单机语音识别装置检测声纹比较值大于预设声纹阈值时,单机语音识别装置检测相关比较值是否大于预设相关阈值。其中,预设相关阈值是根据时间案件调查需求设置的,可以设置为相似度高于50%、60%或70%。
步骤S535,所述相关比较值大于预设相关阈值,则将所述嫌疑人声纹信息保存至所述分区存储声纹库。
在本实施例中,单机语音识别装置在检测到相关比较值大于预设相关阈值,则执行将嫌疑人声纹信息保存至分区存储声纹库。
本实施例通过上述方案,从声纹数据库中获取数据库声纹信息;根据预设规则对所述数据库声纹信息进行分区存储,得到分区存储声纹库;接收采集到的嫌疑人语音信息;接收嫌疑人语音信息对应的嫌疑人相关信息;解析所述嫌疑人语音信息,得到嫌疑人声纹信息;将所述嫌疑人声纹信息与所述分区存储声纹库进行比较,得到声纹比较结果;将所述嫌疑人相关信息与所述个体相关信息进行比较,得到相关比较结果;根据所述声纹比较结果,得到声纹比较值;根据所述相关比较结果,得到相关比较值;检测所述声纹比较值是否大于预设声纹阈值;若所述声纹比较值大于预设声纹阈值,则检测所述相关比较值是否大于预设相关阈值;所述相关比较值大于预设相关阈值,则将所述嫌疑人声纹信息保存至所述分区存储声纹库。由此,通过将声纹比较结果与相关比较结果进行比较,实现了在无法连接网络的情况下,也能辨别嫌疑人的声纹信息;实现了在无法连接网络的情况下,快速辨别和查询嫌疑人的声纹信息。
进一步地,参照图6,图6为本发明单机语音识别方法第五实施例的流程示意图。基于上述图4所示的实施例,步骤S60接收嫌疑人语音信息对应的嫌疑人相关信息之后,可以包括:
步骤S70,根据所述嫌疑人相关信息,得到嫌疑人维度信息;
在本实施例中,单机语音识别装置在接收到嫌疑人相关信息之后,单机语音识别装置根据嫌疑人相关信息,读取嫌疑人相关信息中的嫌疑人维度信息。嫌疑人维度信息为嫌疑人录入的时间信息和嫌疑人可能犯罪的地点或地域。
步骤S80,将嫌疑人维度信息与所述维度信息进行比对,得到筛选维度信息;
在本实施例中,单机语音识别装置在读取嫌疑人相关信息中的嫌疑人维度信息之后,单机语音识别装置将嫌疑人维度信息与维度信息进行比较,得到筛选维度信息。筛选维度信息为筛选出于维度信息中的匹配值较高的维度信息,作为读取分区存储声纹库的某一个分区的依据,可以根据筛选维度信息直接读取一下经过筛选的分区,就不需要通过另外一些分区的分区存储声纹库进行比较验证了。
步骤S50将所述嫌疑人声纹信息与所述分区存储声纹库进行比较,得到识别比较结果,还可以包括:
步骤S54,将所述嫌疑人声纹信息与筛选维度信息相关的所述分区存储声纹库进行比较,得到识别比较结果。
在本实施例中,单机语音识别装置在得到筛选维度信息之后,将所述嫌疑人声纹信息与筛选维度信息相关的所述分区存储声纹库进行比较,得到识别比较结果。
本实施例通过上述方案,从声纹数据库中获取数据库声纹信息;根据预设规则对所述数据库声纹信息进行分区存储,得到分区存储声纹库;接收采集到的嫌疑人语音信息;接收嫌疑人语音信息对应的嫌疑人相关信息;根据所述嫌疑人相关信息,得到嫌疑人维度信息;将嫌疑人维度信息与所述维度信息进行比对,得到筛选维度信息;解析所述嫌疑人语音信息,得到嫌疑人声纹信息;将所述嫌疑人声纹信息与筛选维度信息相关的所述分区存储声纹库进行比较,得到识别比较结果。由此,通过筛选维度信息查找分区存储声纹库,实现了在无法连接网络的情况下,也能辨别嫌疑人的声纹信息;实现了在无法连接网络的情况下,快速辨别和查询嫌疑人的声纹信息。
本发明还提供一种单机语音识别装置。
本发明单机语音识别装置包括:存储器、处理器及存储在所述存储器上并可在所述处理器上运行的单机语音识别程序,所述单机语音识别程序被所述处理器执行时实现如上所述的单机语音识别方法的步骤。
其中,在所述处理器上运行的单机语音识别程序被执行时所实现的方法可参照本发明单机语音识别方法各个实施例,此处不再赘述。
本发明还提供一种计算机可读存储介质。
本发明计算机可读存储介质上存储有单机语音识别程序,所述单机语音识别程序被处理器执行时实现如上所述的单机语音识别方法的步骤。
其中,在所述处理器上运行的单机语音识别程序被执行时所实现的方法可参照本发明单机语音识别方法各个实施例,此处不再赘述。
需要说明的是,在本文中,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者系统不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者系统所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括该要素的过程、方法、物品或者系统中还存在另外的相同要素。
上述本发明实施例序号仅为了描述,不代表实施例的优劣。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在如上所述的一个存储介质(如ROM/RAM、磁碟、光盘)中,包括若干指令用以使得一台终端设备(可以是手机,计算机,服务器,空调器,或者网络设备等)执行本发明各个实施例所述的方法。
以上仅为本发明的优选实施例,并非因此限制本发明的专利范围,凡是利用本发明说明书及附图内容所作的等效结构或等效流程变换,或直接或间接运用在其他相关的技术领域,均同理包括在本发明的专利保护范围内。

Claims (10)

1.一种单机语音识别方法,其特征在于,所述单机语音识别方法包括如下步骤:
从声纹数据库中获取数据库声纹信息;
根据预设规则对所述数据库声纹信息进行分区存储,得到分区存储声纹库;
接收采集到的嫌疑人语音信息;
解析所述嫌疑人语音信息,得到嫌疑人声纹信息;
将所述嫌疑人声纹信息与所述分区存储声纹库进行比较,得到识别比较结果。
2.如权利要求1所述的单机语音识别方法,其特征在于,所述根据预设规则对数据库声纹信息进行分区存储,得到分区存储声纹库的步骤,包括:
读取数据库声纹信息中的个体声纹信息和与个体声纹信息对应的个体相关信息;
根据所述个体相关信息得到维度信息;
根据所述维度信息和预设维度分类规则对所述个体声纹信息进行分区存储,得到分区存储声纹库。
3.如权利要求2所述的单机语音识别方法,其特征在于,所述根据所述个体相关信息得到维度信息的步骤之后,包括:
根据维度信息建立分区存储库;
所述根据所述维度信息和预设维度分类规则对所述个体声纹信息进行分区存储,得到分区存储声纹库的步骤,包括:
将每个所述个体声纹信息按照维度信息和预设维度分类规则依次存入分区存储库中,得到分区存储声纹库。
4.如权利要求2或3所述的单机语音识别方法,其特征在于,所述接收采集到的嫌疑人语音信息的步骤之后,还包括:
接收嫌疑人语音信息对应的嫌疑人相关信息;
所述将所述嫌疑人声纹信息与所述分区存储声纹库进行比较,得到比较结果的步骤包括:
将所述嫌疑人声纹信息与所述分区存储声纹库进行比较,得到声纹比较结果;
将所述嫌疑人相关信息与所述个体相关信息进行比较,得到相关比较结果;
根据所述声纹比较结果和所述相关比较结果,生成识别比较结果。
5.如权利要求4所述的单机语音识别方法,其特征在于,所述根据所述声纹比较结果和所述相关比较结果,生成识别比较结果的步骤之后,包括:
根据所述声纹比较结果,得到声纹比较值;
根据所述相关比较结果,得到相关比较值;
检测所述声纹比较值是否大于预设声纹阈值;
若所述声纹比较值大于预设声纹阈值,则检测所述相关比较值是否大于预设相关阈值;
所述相关比较值大于预设相关阈值,则将所述嫌疑人声纹信息保存至所述分区存储声纹库。
6.如权利要求4所述的单机语音识别方法,其特征在于,所述接收嫌疑人语音信息对应的嫌疑人相关信息的步骤之后,包括:
根据所述嫌疑人相关信息,得到嫌疑人维度信息;
将嫌疑人维度信息与所述维度信息进行比对,得到筛选维度信息;
所述将所述嫌疑人声纹信息与所述分区存储声纹库进行比较,得到识别比较结果的步骤,还包括:
将所述嫌疑人声纹信息与筛选维度信息相关的所述分区存储声纹库进行比较,得到识别比较结果。
7.如权利要求1所述的单机语音识别方法,其特征在于,所述接收采集到的嫌疑人语音信息的步骤之前,包括:
在接收到用户发出的声纹识别指令之后,在终端显示验证界面,以使得用户根据终端显示验证界面输入用户身份验证信息;
检验所述用户验证信息是否符合预设身份验证信息;
若用户验证信息符合预设身份验证信息,则执行:接收采集到的嫌疑人语音信息。
8.如权利要求1所述的单机语音识别方法,其特征在于,所述接收采集到的嫌疑人语音信息的步骤之后,还包括:
将采集到的所述嫌疑人语音信息进行去噪处理。
9.一种单机语音识别装置,其特征在于,所述单机语音识别装置包括:存储器、处理器及存储在所述存储器上并在所述处理器上运行的单机语音识别程序,所述单机语音识别程序被所述处理器执行时实现如权利要求1至8中任一项所述的单机语音识别方法的步骤。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储有单机语音识别程序,所述单机语音识别程序被处理器执行时实现如权利要求1至8中任一项所述的单机语音识别方法的步骤。
CN201911248623.XA 2019-12-06 2019-12-06 单机语音识别方法、装置及计算机可读存储介质 Active CN110970035B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201911248623.XA CN110970035B (zh) 2019-12-06 2019-12-06 单机语音识别方法、装置及计算机可读存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201911248623.XA CN110970035B (zh) 2019-12-06 2019-12-06 单机语音识别方法、装置及计算机可读存储介质

Publications (2)

Publication Number Publication Date
CN110970035A true CN110970035A (zh) 2020-04-07
CN110970035B CN110970035B (zh) 2022-10-11

Family

ID=70033414

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201911248623.XA Active CN110970035B (zh) 2019-12-06 2019-12-06 单机语音识别方法、装置及计算机可读存储介质

Country Status (1)

Country Link
CN (1) CN110970035B (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111444375A (zh) * 2020-04-15 2020-07-24 厦门快商通科技股份有限公司 一种声纹识别的验证方法和装置以及设备

Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20070282605A1 (en) * 2005-04-21 2007-12-06 Anthony Rajakumar Method and System for Screening Using Voice Data and Metadata
CN105244031A (zh) * 2015-10-26 2016-01-13 北京锐安科技有限公司 说话人识别方法和装置
CN105845139A (zh) * 2016-05-20 2016-08-10 北方民族大学 一种离线语音控制方法和装置
CN107104994A (zh) * 2016-02-22 2017-08-29 华硕电脑股份有限公司 语音识别方法、电子装置及语音识别系统
CN107808082A (zh) * 2017-10-13 2018-03-16 平安科技(深圳)有限公司 电子装置、数据访问验证方法和计算机可读存储介质
CN107863098A (zh) * 2017-12-07 2018-03-30 广州市艾涛普电子有限公司 一种语音识别控制方法和装置
CN109036434A (zh) * 2018-08-07 2018-12-18 广州势必可赢网络科技有限公司 一种通过声纹协助案件侦破的方法、装置及设备
US20190005961A1 (en) * 2017-06-28 2019-01-03 Baidu Online Network Technology (Beijing) Co., Ltd. Method and device for processing voice message, terminal and storage medium
CN109192216A (zh) * 2018-08-08 2019-01-11 联智科技(天津)有限责任公司 一种声纹识别用训练数据集仿真获取方法及其获取装置
CN110335608A (zh) * 2019-06-17 2019-10-15 平安科技(深圳)有限公司 声纹验证方法、装置、设备及存储介质

Patent Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20070282605A1 (en) * 2005-04-21 2007-12-06 Anthony Rajakumar Method and System for Screening Using Voice Data and Metadata
CN105244031A (zh) * 2015-10-26 2016-01-13 北京锐安科技有限公司 说话人识别方法和装置
CN107104994A (zh) * 2016-02-22 2017-08-29 华硕电脑股份有限公司 语音识别方法、电子装置及语音识别系统
CN105845139A (zh) * 2016-05-20 2016-08-10 北方民族大学 一种离线语音控制方法和装置
US20190005961A1 (en) * 2017-06-28 2019-01-03 Baidu Online Network Technology (Beijing) Co., Ltd. Method and device for processing voice message, terminal and storage medium
CN107808082A (zh) * 2017-10-13 2018-03-16 平安科技(深圳)有限公司 电子装置、数据访问验证方法和计算机可读存储介质
CN107863098A (zh) * 2017-12-07 2018-03-30 广州市艾涛普电子有限公司 一种语音识别控制方法和装置
CN109036434A (zh) * 2018-08-07 2018-12-18 广州势必可赢网络科技有限公司 一种通过声纹协助案件侦破的方法、装置及设备
CN109192216A (zh) * 2018-08-08 2019-01-11 联智科技(天津)有限责任公司 一种声纹识别用训练数据集仿真获取方法及其获取装置
CN110335608A (zh) * 2019-06-17 2019-10-15 平安科技(深圳)有限公司 声纹验证方法、装置、设备及存储介质

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
李洁: "《现代高新技术》", 31 March 2009 *

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111444375A (zh) * 2020-04-15 2020-07-24 厦门快商通科技股份有限公司 一种声纹识别的验证方法和装置以及设备

Also Published As

Publication number Publication date
CN110970035B (zh) 2022-10-11

Similar Documents

Publication Publication Date Title
US10678828B2 (en) Model-based media classification service using sensed media noise characteristics
CN106778179B (zh) 一种基于超声波唇语识别的身份认证方法
JP5142883B2 (ja) 本人識別装置
KR102454515B1 (ko) 네트워크 최적화 방법 및 장치, 이미지 처리 방법 및 장치, 및 기억 매체
US20180357400A1 (en) Electronic device and method for providing user information
CN110826637A (zh) 情绪识别方法、系统及计算机可读存储介质
US10482393B2 (en) Machine-based learning systems, methods, and apparatus for interactively mapping raw data objects to recognized data objects
US9218540B2 (en) Apparatus and computer readable medium for signal classification using spectrogram and templates
CN110875036A (zh) 语音分类方法、装置、设备及计算机可读存储介质
KR20150107499A (ko) 오브젝트 인식 장치 및 그 제어 방법
CN110970035B (zh) 单机语音识别方法、装置及计算机可读存储介质
US20190026265A1 (en) Information processing apparatus and information processing method
CN108600559B (zh) 静音模式的控制方法、装置、存储介质及电子设备
CN110827834B (zh) 声纹注册方法、系统及计算机可读存储介质
CN110827850B (zh) 音频分离方法、装置、设备及计算机可读存储介质
CN110767229B (zh) 基于声纹的音频输出方法、装置、设备及可读存储介质
CN110992930A (zh) 声纹特征提取方法、装置、终端及可读存储介质
CN105989000A (zh) 音视频拷贝检测方法及装置
CN111640421A (zh) 语音对比方法、装置、设备及计算机可读存储介质
KR102453161B1 (ko) 자동 응답 시스템으로 개인 정보를 전송하기 위한 장치 및 방법
JP2008078763A (ja) 携帯電話機
CN112699720B (zh) 基于人物信息集的监控方法、设备、存储介质及装置
US10922514B2 (en) Electronic apparatus
CN111641756B (zh) 诈骗识别方法、装置及计算机可读存储介质
CN110875043B (zh) 声纹识别方法、装置、移动终端及计算机可读存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant