CN108231078A - 一种语音识别方法 - Google Patents

一种语音识别方法 Download PDF

Info

Publication number
CN108231078A
CN108231078A CN201810040453.5A CN201810040453A CN108231078A CN 108231078 A CN108231078 A CN 108231078A CN 201810040453 A CN201810040453 A CN 201810040453A CN 108231078 A CN108231078 A CN 108231078A
Authority
CN
China
Prior art keywords
characteristic value
voice
recognition method
user
digital information
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201810040453.5A
Other languages
English (en)
Inventor
林辉
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shenzhen Love Letter Intelligent Ltd By Share Ltd
Original Assignee
Shenzhen Love Letter Intelligent Ltd By Share Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shenzhen Love Letter Intelligent Ltd By Share Ltd filed Critical Shenzhen Love Letter Intelligent Ltd By Share Ltd
Priority to CN201810040453.5A priority Critical patent/CN108231078A/zh
Publication of CN108231078A publication Critical patent/CN108231078A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/08Speech classification or search
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/20Speech recognition techniques specially adapted for robustness in adverse environments, e.g. in noise, of stress induced speech
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L17/00Speaker identification or verification techniques
    • G10L17/06Decision making techniques; Pattern matching strategies
    • G10L17/14Use of phonemic categorisation or speech recognition prior to speaker recognition or verification
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L17/00Speaker identification or verification techniques
    • G10L17/22Interactive procedures; Man-machine interfaces
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • G10L2015/223Execution procedure of a spoken command

Landscapes

  • Engineering & Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Computational Linguistics (AREA)
  • Business, Economics & Management (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Game Theory and Decision Science (AREA)
  • Telephonic Communication Services (AREA)

Abstract

一种语音识别方法,包括如下步骤:(1)语音的处理:将收集装置收集的语音信息进行预处理再数字化,转化成数字信息;(2)特征值的提取与存储:对数字信息进行特征选择,提取数字信息中的特征值a并分类、标记,根据需要建立数据库并存储;(3)语音的分析与对比:用户输入语音信息,需要识别的语音信息经过数字化及特征提取,得到的特征值b与语音识别库内的特征值a进行对比、识别;若数据库内存在特征值a与特征值b匹配,则用户信息解锁;反之,则发出提示,同时后台服务器会收到报警信息。本发明通过特征值的提取与对比,可以区分不同的音色及命令,提高了语音识别的准确性与安全性,有效保护了用户的隐私。

Description

一种语音识别方法
技术领域
本发明涉及语音识别,特别涉及一种语音识别方法。
背景技术
随着科学技术的发展,语音识别的实用越来越广泛。基于语音识别的解锁、控制方法与用户手动输入指令相比更加方便、体验上更具优势,因此,人们对语音识别的需求越来越大。但是,现有的语音识别方法为了使用户的语音信息更快的被识别,大多对用户的音色识别区分成都较低,过程简单、粗略,隐私的保护程度较低,很容易被破解。
发明内容
针对现有技术中的上述不足,本发明提供了一种语音识别方法,其结构简单,方便推广。
为了达到上述发明目的,本发明采用的技术方案为:
一种语音识别方法,包括如下步骤:
(1)语音的处理:将收集装置收集的语音信息进行预处理,去除杂音等干扰信息,再将预处理后的语音信息数字化,转化成数字信息;
(2)特征值的提取与存储:对数字信息进行特征选择,提取数字信息中的特征值a;对特征值a进行分类、标记,并根据需要建立语音数据库,存储于数据存储装置中,并在后台服务器生成记录;
(3)语音的分析与对比:用户通过收集装置输入语音信息,需要识别的语音信息经过数字化及特征提取,得到的特征值b与语音识别库内的特征值a进行对比、识别;
(Ⅰ)若数据库内存在特征值a与特征值b匹配,则用户信息解锁,用户可继续正常操作;
(Ⅱ)若数据库内不存在特征值a与特征值b匹配,则发出提示,连续三次比对无结果后收集装置会锁定一定时间,同时后台服务器会收到报警信息。
优选的,预处理可采用去噪装置进行。
优选的,所述收集装置可以为话筒、录音器等。
优选的,所述存储装置为硬盘。
优选的,所述报警信息采用弹出窗口、语音报警器或警示灯的方式。
本发明的有益效果为:通过特征值的提取与对比,可以区分不同的音色及命令,提高了语音识别的准确性与安全性,有效的保护了用户的隐私。
附图说明
图1为本发明的结构示意图。
具体实施方式
为了使本发明的内容更容易被清楚地理解,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述。
如图1所示,一种语音识别方法,包括如下步骤:
(1)语音的处理:将收集装置收集的语音信息进行预处理,去除杂音等干扰信息,再将预处理后的语音信息数字化,转化成数字信息;
(2)特征值的提取与存储:对数字信息进行特征选择,提取数字信息中的特征值a;对特征值a进行分类、标记,并根据需要建立语音数据库,存储于数据存储装置中,并在后台服务器生成记录;
(3)语音的分析与对比:用户通过收集装置输入语音信息,需要识别的语音信息经过数字化及特征提取,得到的特征值b与语音识别库内的特征值a进行对比、识别;
(Ⅰ)若数据库内存在特征值a与特征值b匹配,则用户信息解锁,用户可继续正常操作;
(Ⅱ)若数据库内不存在特征值a与特征值b匹配,则发出提示,连续三次比对无结果后收集装置会锁定一定时间,同时后台服务器会收到报警信息。
优选的,预处理可采用去噪装置进行,有效去除杂音等干扰型噪音。
优选的,所述收集装置可以为话筒、录音器等,这些装置便于声音的采集,减少噪声。
优选的,所述存储装置为硬盘,可以保证语音信息的安全及保存的时间。
优选的,所述报警信息采用弹出窗口、语音报警器或警示灯的方式,提示工作人员及时处理,保证安全。
本发明的有益效果为:通过特征值的提取与对比,可以区分不同的音色及命令,提高了语音识别的准确性与安全性,有效的保护了用户的隐私。
以上所述仅为本发明专利的较佳实施例而已,并不用以限制本发明专利,凡在本发明专利的精神和原则之内所作的任何修改、等同替换和改进等,均应包含在本发明专利的保护范围之内。

Claims (5)

1.一种语音识别方法,其特征在于,包括如下步骤:
(1)语音的处理:将收集装置收集的语音信息进行预处理,再将预处理后的语音信息数字化,转化成数字信息;
(2)特征值的提取与存储:对数字信息进行特征选择,提取数字信息中的特征值a;对特征值a进行分类、标记,并根据需要建立语音识别库,存储于数据存储装置中,并在后台服务器生成记录;
(3)语音的分析与对比:用户通过收集装置输入语音信息,需要识别的语音信息经过数字化及特征提取,得到的特征值b与语音识别库内的特征值a进行对比、识别;
(Ⅰ)若数据库内存在特征值a与特征值b匹配,则用户信息解锁,用户可继续正常操作;
(Ⅱ)若数据库内不存在特征值a与特征值b匹配,则发出提示,连续三次比对无结果后收集装置会锁定一定时间,同时后台服务器会收到报警信息。
2.根据权利要求1所述的一种语音识别方法,其特征在于:预处理可采用去噪装置进行。
3.根据权利要求1所述的一种语音识别方法,其特征在于:所述收集装置可以为话筒、录音器等。
4.根据权利要求1所述的一种语音识别方法,其特征在于:所述存储装置为硬盘。
5.根据权利要求1所述的一种语音识别方法,其特征在于:所述报警信息采用弹出窗口、语音报警器或警示灯的方式。
CN201810040453.5A 2018-01-16 2018-01-16 一种语音识别方法 Pending CN108231078A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201810040453.5A CN108231078A (zh) 2018-01-16 2018-01-16 一种语音识别方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201810040453.5A CN108231078A (zh) 2018-01-16 2018-01-16 一种语音识别方法

Publications (1)

Publication Number Publication Date
CN108231078A true CN108231078A (zh) 2018-06-29

Family

ID=62641358

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201810040453.5A Pending CN108231078A (zh) 2018-01-16 2018-01-16 一种语音识别方法

Country Status (1)

Country Link
CN (1) CN108231078A (zh)

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104658533A (zh) * 2013-11-20 2015-05-27 中兴通讯股份有限公司 一种终端解锁的方法、装置及终端
CN105357006A (zh) * 2014-08-20 2016-02-24 中兴通讯股份有限公司 一种基于声纹特征进行安全认证的方法及设备

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104658533A (zh) * 2013-11-20 2015-05-27 中兴通讯股份有限公司 一种终端解锁的方法、装置及终端
CN105357006A (zh) * 2014-08-20 2016-02-24 中兴通讯股份有限公司 一种基于声纹特征进行安全认证的方法及设备

Similar Documents

Publication Publication Date Title
US10977299B2 (en) Systems and methods for consolidating recorded content
US10170112B2 (en) Detecting and suppressing voice queries
CN111524527B (zh) 话者分离方法、装置、电子设备和存储介质
CN107395352B (zh) 基于声纹的身份识别方法及装置
CN107274916B (zh) 基于声纹信息对音频/视频文件进行操作的方法及装置
CN111128223B (zh) 一种基于文本信息的辅助说话人分离方法及相关装置
CN107562760B (zh) 一种语音数据处理方法及装置
US20110218798A1 (en) Obfuscating sensitive content in audio sources
CN104376250A (zh) 基于音型像特征的真人活体身份验证方法
CN102142254A (zh) 基于声纹识别和语音识别的防录音假冒的身份确认方法
CN107507626B (zh) 一种基于语音频谱融合特征的手机来源识别方法
JP2002517175A (ja) 人間の音源を識別するための手段および装置
CN109887508A (zh) 一种基于声纹的会议自动记录方法、电子设备及存储介质
Jiang et al. An Improved Speech Segmentation and Clustering Algorithm Based on SOM and K‐Means
US20220224792A1 (en) Caller identification in a secure environment using voice biometrics
CN105283916A (zh) 电子水印嵌入装置、电子水印嵌入方法及电子水印嵌入程序
EP3881318B1 (en) Contents based on policy permissions
CN109920447A (zh) 基于自适应滤波器振幅相位特征提取的录音欺诈检测方法
CN111341301B (zh) 一种录音处理方法
CN108231078A (zh) 一种语音识别方法
Elliott et al. Is anybody out there? The detection of intelligent and generic language-like features
Singh et al. Voice disguise by mimicry: deriving statistical articulometric evidence to evaluate claimed impersonation
CN109271480A (zh) 一种语音搜题方法及电子设备
He et al. A weighted partial domain adaptation for acoustic scene classification and its application in fiber optic security system
Shaikh et al. Language independent on–off voice over IP source model with lognormal transitions

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20180629