CN108231078A - 一种语音识别方法 - Google Patents
一种语音识别方法 Download PDFInfo
- Publication number
- CN108231078A CN108231078A CN201810040453.5A CN201810040453A CN108231078A CN 108231078 A CN108231078 A CN 108231078A CN 201810040453 A CN201810040453 A CN 201810040453A CN 108231078 A CN108231078 A CN 108231078A
- Authority
- CN
- China
- Prior art keywords
- characteristic value
- voice
- recognition method
- user
- digital information
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 15
- 238000000605 extraction Methods 0.000 claims abstract description 11
- 239000000284 extract Substances 0.000 claims abstract description 4
- 238000013500 data storage Methods 0.000 claims description 3
- 239000003086 colorant Substances 0.000 abstract description 3
- 230000009286 beneficial effect Effects 0.000 description 2
- 230000008901 benefit Effects 0.000 description 1
- 230000007812 deficiency Effects 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 238000004321 preservation Methods 0.000 description 1
- 230000008569 process Effects 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/08—Speech classification or search
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/20—Speech recognition techniques specially adapted for robustness in adverse environments, e.g. in noise, of stress induced speech
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L17/00—Speaker identification or verification techniques
- G10L17/06—Decision making techniques; Pattern matching strategies
- G10L17/14—Use of phonemic categorisation or speech recognition prior to speaker recognition or verification
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L17/00—Speaker identification or verification techniques
- G10L17/22—Interactive procedures; Man-machine interfaces
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
- G10L2015/223—Execution procedure of a spoken command
Landscapes
- Engineering & Computer Science (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Computational Linguistics (AREA)
- Business, Economics & Management (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Game Theory and Decision Science (AREA)
- Telephonic Communication Services (AREA)
Abstract
一种语音识别方法,包括如下步骤:(1)语音的处理:将收集装置收集的语音信息进行预处理再数字化,转化成数字信息;(2)特征值的提取与存储:对数字信息进行特征选择,提取数字信息中的特征值a并分类、标记,根据需要建立数据库并存储;(3)语音的分析与对比:用户输入语音信息,需要识别的语音信息经过数字化及特征提取,得到的特征值b与语音识别库内的特征值a进行对比、识别;若数据库内存在特征值a与特征值b匹配,则用户信息解锁;反之,则发出提示,同时后台服务器会收到报警信息。本发明通过特征值的提取与对比,可以区分不同的音色及命令,提高了语音识别的准确性与安全性,有效保护了用户的隐私。
Description
技术领域
本发明涉及语音识别,特别涉及一种语音识别方法。
背景技术
随着科学技术的发展,语音识别的实用越来越广泛。基于语音识别的解锁、控制方法与用户手动输入指令相比更加方便、体验上更具优势,因此,人们对语音识别的需求越来越大。但是,现有的语音识别方法为了使用户的语音信息更快的被识别,大多对用户的音色识别区分成都较低,过程简单、粗略,隐私的保护程度较低,很容易被破解。
发明内容
针对现有技术中的上述不足,本发明提供了一种语音识别方法,其结构简单,方便推广。
为了达到上述发明目的,本发明采用的技术方案为:
一种语音识别方法,包括如下步骤:
(1)语音的处理:将收集装置收集的语音信息进行预处理,去除杂音等干扰信息,再将预处理后的语音信息数字化,转化成数字信息;
(2)特征值的提取与存储:对数字信息进行特征选择,提取数字信息中的特征值a;对特征值a进行分类、标记,并根据需要建立语音数据库,存储于数据存储装置中,并在后台服务器生成记录;
(3)语音的分析与对比:用户通过收集装置输入语音信息,需要识别的语音信息经过数字化及特征提取,得到的特征值b与语音识别库内的特征值a进行对比、识别;
(Ⅰ)若数据库内存在特征值a与特征值b匹配,则用户信息解锁,用户可继续正常操作;
(Ⅱ)若数据库内不存在特征值a与特征值b匹配,则发出提示,连续三次比对无结果后收集装置会锁定一定时间,同时后台服务器会收到报警信息。
优选的,预处理可采用去噪装置进行。
优选的,所述收集装置可以为话筒、录音器等。
优选的,所述存储装置为硬盘。
优选的,所述报警信息采用弹出窗口、语音报警器或警示灯的方式。
本发明的有益效果为:通过特征值的提取与对比,可以区分不同的音色及命令,提高了语音识别的准确性与安全性,有效的保护了用户的隐私。
附图说明
图1为本发明的结构示意图。
具体实施方式
为了使本发明的内容更容易被清楚地理解,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述。
如图1所示,一种语音识别方法,包括如下步骤:
(1)语音的处理:将收集装置收集的语音信息进行预处理,去除杂音等干扰信息,再将预处理后的语音信息数字化,转化成数字信息;
(2)特征值的提取与存储:对数字信息进行特征选择,提取数字信息中的特征值a;对特征值a进行分类、标记,并根据需要建立语音数据库,存储于数据存储装置中,并在后台服务器生成记录;
(3)语音的分析与对比:用户通过收集装置输入语音信息,需要识别的语音信息经过数字化及特征提取,得到的特征值b与语音识别库内的特征值a进行对比、识别;
(Ⅰ)若数据库内存在特征值a与特征值b匹配,则用户信息解锁,用户可继续正常操作;
(Ⅱ)若数据库内不存在特征值a与特征值b匹配,则发出提示,连续三次比对无结果后收集装置会锁定一定时间,同时后台服务器会收到报警信息。
优选的,预处理可采用去噪装置进行,有效去除杂音等干扰型噪音。
优选的,所述收集装置可以为话筒、录音器等,这些装置便于声音的采集,减少噪声。
优选的,所述存储装置为硬盘,可以保证语音信息的安全及保存的时间。
优选的,所述报警信息采用弹出窗口、语音报警器或警示灯的方式,提示工作人员及时处理,保证安全。
本发明的有益效果为:通过特征值的提取与对比,可以区分不同的音色及命令,提高了语音识别的准确性与安全性,有效的保护了用户的隐私。
以上所述仅为本发明专利的较佳实施例而已,并不用以限制本发明专利,凡在本发明专利的精神和原则之内所作的任何修改、等同替换和改进等,均应包含在本发明专利的保护范围之内。
Claims (5)
1.一种语音识别方法,其特征在于,包括如下步骤:
(1)语音的处理:将收集装置收集的语音信息进行预处理,再将预处理后的语音信息数字化,转化成数字信息;
(2)特征值的提取与存储:对数字信息进行特征选择,提取数字信息中的特征值a;对特征值a进行分类、标记,并根据需要建立语音识别库,存储于数据存储装置中,并在后台服务器生成记录;
(3)语音的分析与对比:用户通过收集装置输入语音信息,需要识别的语音信息经过数字化及特征提取,得到的特征值b与语音识别库内的特征值a进行对比、识别;
(Ⅰ)若数据库内存在特征值a与特征值b匹配,则用户信息解锁,用户可继续正常操作;
(Ⅱ)若数据库内不存在特征值a与特征值b匹配,则发出提示,连续三次比对无结果后收集装置会锁定一定时间,同时后台服务器会收到报警信息。
2.根据权利要求1所述的一种语音识别方法,其特征在于:预处理可采用去噪装置进行。
3.根据权利要求1所述的一种语音识别方法,其特征在于:所述收集装置可以为话筒、录音器等。
4.根据权利要求1所述的一种语音识别方法,其特征在于:所述存储装置为硬盘。
5.根据权利要求1所述的一种语音识别方法,其特征在于:所述报警信息采用弹出窗口、语音报警器或警示灯的方式。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810040453.5A CN108231078A (zh) | 2018-01-16 | 2018-01-16 | 一种语音识别方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810040453.5A CN108231078A (zh) | 2018-01-16 | 2018-01-16 | 一种语音识别方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN108231078A true CN108231078A (zh) | 2018-06-29 |
Family
ID=62641358
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201810040453.5A Pending CN108231078A (zh) | 2018-01-16 | 2018-01-16 | 一种语音识别方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN108231078A (zh) |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104658533A (zh) * | 2013-11-20 | 2015-05-27 | 中兴通讯股份有限公司 | 一种终端解锁的方法、装置及终端 |
CN105357006A (zh) * | 2014-08-20 | 2016-02-24 | 中兴通讯股份有限公司 | 一种基于声纹特征进行安全认证的方法及设备 |
-
2018
- 2018-01-16 CN CN201810040453.5A patent/CN108231078A/zh active Pending
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104658533A (zh) * | 2013-11-20 | 2015-05-27 | 中兴通讯股份有限公司 | 一种终端解锁的方法、装置及终端 |
CN105357006A (zh) * | 2014-08-20 | 2016-02-24 | 中兴通讯股份有限公司 | 一种基于声纹特征进行安全认证的方法及设备 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US10977299B2 (en) | Systems and methods for consolidating recorded content | |
US10170112B2 (en) | Detecting and suppressing voice queries | |
CN111524527B (zh) | 话者分离方法、装置、电子设备和存储介质 | |
CN107395352B (zh) | 基于声纹的身份识别方法及装置 | |
CN107274916B (zh) | 基于声纹信息对音频/视频文件进行操作的方法及装置 | |
CN111128223B (zh) | 一种基于文本信息的辅助说话人分离方法及相关装置 | |
CN107562760B (zh) | 一种语音数据处理方法及装置 | |
US20110218798A1 (en) | Obfuscating sensitive content in audio sources | |
CN104376250A (zh) | 基于音型像特征的真人活体身份验证方法 | |
CN102142254A (zh) | 基于声纹识别和语音识别的防录音假冒的身份确认方法 | |
CN107507626B (zh) | 一种基于语音频谱融合特征的手机来源识别方法 | |
JP2002517175A (ja) | 人間の音源を識別するための手段および装置 | |
CN109887508A (zh) | 一种基于声纹的会议自动记录方法、电子设备及存储介质 | |
Jiang et al. | An Improved Speech Segmentation and Clustering Algorithm Based on SOM and K‐Means | |
US20220224792A1 (en) | Caller identification in a secure environment using voice biometrics | |
CN105283916A (zh) | 电子水印嵌入装置、电子水印嵌入方法及电子水印嵌入程序 | |
EP3881318B1 (en) | Contents based on policy permissions | |
CN109920447A (zh) | 基于自适应滤波器振幅相位特征提取的录音欺诈检测方法 | |
CN111341301B (zh) | 一种录音处理方法 | |
CN108231078A (zh) | 一种语音识别方法 | |
Elliott et al. | Is anybody out there? The detection of intelligent and generic language-like features | |
Singh et al. | Voice disguise by mimicry: deriving statistical articulometric evidence to evaluate claimed impersonation | |
CN109271480A (zh) | 一种语音搜题方法及电子设备 | |
He et al. | A weighted partial domain adaptation for acoustic scene classification and its application in fiber optic security system | |
Shaikh et al. | Language independent on–off voice over IP source model with lognormal transitions |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20180629 |