CN103077708A - 一种语音识别系统中拒识能力提升方法 - Google Patents
一种语音识别系统中拒识能力提升方法 Download PDFInfo
- Publication number
- CN103077708A CN103077708A CN2012105814261A CN201210581426A CN103077708A CN 103077708 A CN103077708 A CN 103077708A CN 2012105814261 A CN2012105814261 A CN 2012105814261A CN 201210581426 A CN201210581426 A CN 201210581426A CN 103077708 A CN103077708 A CN 103077708A
- Authority
- CN
- China
- Prior art keywords
- network
- model
- wfst
- noise
- word
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 32
- 238000010521 absorption reaction Methods 0.000 claims abstract description 14
- 239000013598 vector Substances 0.000 claims abstract description 13
- 238000001514 detection method Methods 0.000 claims abstract description 5
- 241001269238 Data Species 0.000 claims description 7
- 206010038743 Restlessness Diseases 0.000 claims description 7
- 238000006116 polymerization reaction Methods 0.000 claims description 6
- 206010011224 Cough Diseases 0.000 claims description 4
- 238000010276 construction Methods 0.000 claims description 2
- 230000000694 effects Effects 0.000 abstract description 3
- 238000000605 extraction Methods 0.000 abstract 1
- 238000005516 engineering process Methods 0.000 description 9
- 238000010586 diagram Methods 0.000 description 2
- 230000006870 function Effects 0.000 description 2
- 238000004364 calculation method Methods 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 238000013480 data collection Methods 0.000 description 1
- 230000007812 deficiency Effects 0.000 description 1
- 230000002950 deficient Effects 0.000 description 1
- 239000012467 final product Substances 0.000 description 1
- 230000004927 fusion Effects 0.000 description 1
- 230000010354 integration Effects 0.000 description 1
- 239000000203 mixture Substances 0.000 description 1
- 230000008447 perception Effects 0.000 description 1
- 239000000047 product Substances 0.000 description 1
- NGVDGCNFYWLIFO-UHFFFAOYSA-N pyridoxal 5'-phosphate Chemical compound CC1=NC=C(COP(O)(O)=O)C(C=O)=C1O NGVDGCNFYWLIFO-UHFFFAOYSA-N 0.000 description 1
Images
Landscapes
- Telephonic Communication Services (AREA)
Abstract
Description
Claims (2)
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201210581426.1A CN103077708B (zh) | 2012-12-27 | 2012-12-27 | 一种语音识别系统中拒识能力提升方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201210581426.1A CN103077708B (zh) | 2012-12-27 | 2012-12-27 | 一种语音识别系统中拒识能力提升方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN103077708A true CN103077708A (zh) | 2013-05-01 |
CN103077708B CN103077708B (zh) | 2015-04-01 |
Family
ID=48154218
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201210581426.1A Active CN103077708B (zh) | 2012-12-27 | 2012-12-27 | 一种语音识别系统中拒识能力提升方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN103077708B (zh) |
Cited By (16)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103337241A (zh) * | 2013-06-09 | 2013-10-02 | 北京云知声信息技术有限公司 | 一种语音识别方法和装置 |
CN103824557A (zh) * | 2014-02-19 | 2014-05-28 | 清华大学 | 一种具有自定义功能的音频检测分类方法 |
CN105321518A (zh) * | 2014-08-05 | 2016-02-10 | 中国科学院声学研究所 | 一种低资源嵌入式语音识别的拒识方法 |
CN105489222A (zh) * | 2015-12-11 | 2016-04-13 | 百度在线网络技术(北京)有限公司 | 语音识别方法和装置 |
CN106033669A (zh) * | 2015-03-18 | 2016-10-19 | 展讯通信(上海)有限公司 | 语音识别方法及装置 |
CN106663423A (zh) * | 2014-10-06 | 2017-05-10 | 英特尔公司 | 使用具有词历史的实时词网格生成的自动语音识别的系统和方法 |
CN107580722A (zh) * | 2015-05-27 | 2018-01-12 | 英特尔公司 | 具有对应于各个数据流的直接存储器存取引擎的高斯混合模型加速器 |
CN107919116A (zh) * | 2016-10-11 | 2018-04-17 | 芋头科技(杭州)有限公司 | 一种语音激活检测方法及装置 |
CN108694939A (zh) * | 2018-05-23 | 2018-10-23 | 广州视源电子科技股份有限公司 | 语音搜索优化方法、装置和系统 |
CN108962271A (zh) * | 2018-06-29 | 2018-12-07 | 广州视源电子科技股份有限公司 | 多加权有限状态转换器合并方法、装置、设备及存储介质 |
WO2018232591A1 (en) * | 2017-06-20 | 2018-12-27 | Microsoft Technology Licensing, Llc. | SEQUENCE RECOGNITION PROCESSING |
CN110110069A (zh) * | 2019-04-04 | 2019-08-09 | 上海易点时空网络有限公司 | 关键词过滤方法及装置 |
CN110544469A (zh) * | 2019-09-04 | 2019-12-06 | 秒针信息技术有限公司 | 语音识别模型的训练方法及装置、存储介质、电子装置 |
CN110610700A (zh) * | 2019-10-16 | 2019-12-24 | 科大讯飞股份有限公司 | 解码网络构建方法、语音识别方法、装置、设备及存储介质 |
CN112951219A (zh) * | 2021-02-01 | 2021-06-11 | 思必驰科技股份有限公司 | 噪声拒识方法和装置 |
CN113421558A (zh) * | 2021-08-25 | 2021-09-21 | 北京新河科技有限公司 | 一种语音识别系统及方法 |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6574595B1 (en) * | 2000-07-11 | 2003-06-03 | Lucent Technologies Inc. | Method and apparatus for recognition-based barge-in detection in the context of subword-based automatic speech recognition |
CN1542737A (zh) * | 2003-03-12 | 2004-11-03 | ��ʽ����Ntt����Ħ | 语音识别噪声自适应系统、方法及程序 |
US20050049872A1 (en) * | 2003-08-26 | 2005-03-03 | International Business Machines Corporation | Class detection scheme and time mediated averaging of class dependent models |
CN1856821A (zh) * | 2003-07-31 | 2006-11-01 | 艾利森电话股份有限公司 | 允许声音打断的系统与方法 |
CN1965218A (zh) * | 2004-06-04 | 2007-05-16 | 皇家飞利浦电子股份有限公司 | 交互式语音识别系统的性能预测 |
US20090112599A1 (en) * | 2007-10-31 | 2009-04-30 | At&T Labs | Multi-state barge-in models for spoken dialog systems |
-
2012
- 2012-12-27 CN CN201210581426.1A patent/CN103077708B/zh active Active
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6574595B1 (en) * | 2000-07-11 | 2003-06-03 | Lucent Technologies Inc. | Method and apparatus for recognition-based barge-in detection in the context of subword-based automatic speech recognition |
CN1542737A (zh) * | 2003-03-12 | 2004-11-03 | ��ʽ����Ntt����Ħ | 语音识别噪声自适应系统、方法及程序 |
CN1856821A (zh) * | 2003-07-31 | 2006-11-01 | 艾利森电话股份有限公司 | 允许声音打断的系统与方法 |
US20050049872A1 (en) * | 2003-08-26 | 2005-03-03 | International Business Machines Corporation | Class detection scheme and time mediated averaging of class dependent models |
CN1965218A (zh) * | 2004-06-04 | 2007-05-16 | 皇家飞利浦电子股份有限公司 | 交互式语音识别系统的性能预测 |
US20090112599A1 (en) * | 2007-10-31 | 2009-04-30 | At&T Labs | Multi-state barge-in models for spoken dialog systems |
Cited By (27)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103337241A (zh) * | 2013-06-09 | 2013-10-02 | 北京云知声信息技术有限公司 | 一种语音识别方法和装置 |
CN103824557B (zh) * | 2014-02-19 | 2016-06-15 | 清华大学 | 一种具有自定义功能的音频检测分类方法 |
CN103824557A (zh) * | 2014-02-19 | 2014-05-28 | 清华大学 | 一种具有自定义功能的音频检测分类方法 |
CN105321518A (zh) * | 2014-08-05 | 2016-02-10 | 中国科学院声学研究所 | 一种低资源嵌入式语音识别的拒识方法 |
CN105321518B (zh) * | 2014-08-05 | 2018-12-04 | 中国科学院声学研究所 | 一种低资源嵌入式语音识别的拒识方法 |
CN106663423B (zh) * | 2014-10-06 | 2021-02-26 | 英特尔公司 | 使用具有词历史的实时词网格生成的自动语音识别的系统和方法 |
CN106663423A (zh) * | 2014-10-06 | 2017-05-10 | 英特尔公司 | 使用具有词历史的实时词网格生成的自动语音识别的系统和方法 |
CN106033669A (zh) * | 2015-03-18 | 2016-10-19 | 展讯通信(上海)有限公司 | 语音识别方法及装置 |
CN107580722A (zh) * | 2015-05-27 | 2018-01-12 | 英特尔公司 | 具有对应于各个数据流的直接存储器存取引擎的高斯混合模型加速器 |
CN107580722B (zh) * | 2015-05-27 | 2022-01-14 | 英特尔公司 | 具有对应于各个数据流的直接存储器存取引擎的高斯混合模型加速器 |
CN105489222A (zh) * | 2015-12-11 | 2016-04-13 | 百度在线网络技术(北京)有限公司 | 语音识别方法和装置 |
WO2017096778A1 (zh) * | 2015-12-11 | 2017-06-15 | 百度在线网络技术(北京)有限公司 | 语音识别方法和装置 |
US10685647B2 (en) | 2015-12-11 | 2020-06-16 | Baidu Online Network Technology (Beijing) Co., Ltd. | Speech recognition method and device |
CN105489222B (zh) * | 2015-12-11 | 2018-03-09 | 百度在线网络技术(北京)有限公司 | 语音识别方法和装置 |
WO2018068649A1 (zh) * | 2016-10-11 | 2018-04-19 | 芋头科技(杭州)有限公司 | 一种语音激活检测方法及装置 |
CN107919116A (zh) * | 2016-10-11 | 2018-04-17 | 芋头科技(杭州)有限公司 | 一种语音激活检测方法及装置 |
CN107919116B (zh) * | 2016-10-11 | 2019-09-13 | 芋头科技(杭州)有限公司 | 一种语音激活检测方法及装置 |
WO2018232591A1 (en) * | 2017-06-20 | 2018-12-27 | Microsoft Technology Licensing, Llc. | SEQUENCE RECOGNITION PROCESSING |
CN108694939A (zh) * | 2018-05-23 | 2018-10-23 | 广州视源电子科技股份有限公司 | 语音搜索优化方法、装置和系统 |
CN108962271A (zh) * | 2018-06-29 | 2018-12-07 | 广州视源电子科技股份有限公司 | 多加权有限状态转换器合并方法、装置、设备及存储介质 |
CN110110069A (zh) * | 2019-04-04 | 2019-08-09 | 上海易点时空网络有限公司 | 关键词过滤方法及装置 |
CN110544469A (zh) * | 2019-09-04 | 2019-12-06 | 秒针信息技术有限公司 | 语音识别模型的训练方法及装置、存储介质、电子装置 |
CN110544469B (zh) * | 2019-09-04 | 2022-04-19 | 秒针信息技术有限公司 | 语音识别模型的训练方法及装置、存储介质、电子装置 |
CN110610700A (zh) * | 2019-10-16 | 2019-12-24 | 科大讯飞股份有限公司 | 解码网络构建方法、语音识别方法、装置、设备及存储介质 |
CN110610700B (zh) * | 2019-10-16 | 2022-01-14 | 科大讯飞股份有限公司 | 解码网络构建方法、语音识别方法、装置、设备及存储介质 |
CN112951219A (zh) * | 2021-02-01 | 2021-06-11 | 思必驰科技股份有限公司 | 噪声拒识方法和装置 |
CN113421558A (zh) * | 2021-08-25 | 2021-09-21 | 北京新河科技有限公司 | 一种语音识别系统及方法 |
Also Published As
Publication number | Publication date |
---|---|
CN103077708B (zh) | 2015-04-01 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN103077708B (zh) | 一种语音识别系统中拒识能力提升方法 | |
Zhang et al. | Boosting contextual information for deep neural network based voice activity detection | |
CN103971685B (zh) | 语音命令识别方法和系统 | |
CN102982811B (zh) | 一种基于实时解码的语音端点检测方法 | |
CN102142253B (zh) | 语音情感识别设备及方法 | |
CN110033758B (zh) | 一种基于小训练集优化解码网络的语音唤醒实现方法 | |
US8275616B2 (en) | System for detecting speech interval and recognizing continuous speech in a noisy environment through real-time recognition of call commands | |
CN107767861B (zh) | 语音唤醒方法、系统及智能终端 | |
CN107767863A (zh) | 语音唤醒方法、系统及智能终端 | |
CN104036774A (zh) | 藏语方言识别方法及系统 | |
CN110534099A (zh) | 语音唤醒处理方法、装置、存储介质及电子设备 | |
CN108694940A (zh) | 一种语音识别方法、装置及电子设备 | |
CN107403619A (zh) | 一种应用于自行车环境的语音控制方法及系统 | |
CN111462756B (zh) | 声纹识别方法、装置、电子设备及存储介质 | |
CN102945673A (zh) | 一种语音指令范围动态变化的连续语音识别方法 | |
CN107093422B (zh) | 一种语音识别方法和语音识别系统 | |
CN109147774B (zh) | 一种改进的延时神经网络声学模型 | |
CN106558306A (zh) | 用于语音识别的方法、装置和设备 | |
CN105374352A (zh) | 一种语音激活方法及系统 | |
CN101452701A (zh) | 基于反模型的置信度估计方法及装置 | |
EP4379712A1 (en) | Wake-on-voice method and apparatus, device, storage medium, and program product | |
CN110853669B (zh) | 音频识别方法、装置及设备 | |
CN103366737B (zh) | 在自动语音识别中应用声调特征的装置和方法 | |
CN114360510A (zh) | 一种语音识别方法和相关装置 | |
CN112825250A (zh) | 语音唤醒方法、设备、存储介质及程序产品 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C14 | Grant of patent or utility model | ||
GR01 | Patent grant | ||
C56 | Change in the name or address of the patentee | ||
CP01 | Change in the name or title of a patent holder |
Address after: Wangjiang Road high tech Development Zone Hefei city Anhui province 230088 No. 666 Patentee after: IFLYTEK Co.,Ltd. Address before: Wangjiang Road high tech Development Zone Hefei city Anhui province 230088 No. 666 Patentee before: ANHUI USTC IFLYTEK Co.,Ltd. |
|
TR01 | Transfer of patent right |
Effective date of registration: 20170629 Address after: 230000, Hefei province high tech Zone, 2800 innovation Avenue, 288 innovation industry park, H2 building, room two, Anhui Patentee after: Anhui Puji Information Technology Co.,Ltd. Address before: Wangjiang Road high tech Development Zone Hefei city Anhui province 230088 No. 666 Patentee before: IFLYTEK Co.,Ltd. |
|
TR01 | Transfer of patent right | ||
CP01 | Change in the name or title of a patent holder |
Address after: 230000, Hefei province high tech Zone, 2800 innovation Avenue, 288 innovation industry park, H2 building, room two, Anhui Patentee after: ANHUI IFLYTEK MEDICAL INFORMATION TECHNOLOGY CO.,LTD. Address before: 230000, Hefei province high tech Zone, 2800 innovation Avenue, 288 innovation industry park, H2 building, room two, Anhui Patentee before: Anhui Puji Information Technology Co.,Ltd. |
|
CP01 | Change in the name or title of a patent holder | ||
CP03 | Change of name, title or address |
Address after: 230088 floor 23-24, building A5, No. 666, Wangjiang West Road, high tech Zone, Hefei, Anhui Province Patentee after: Anhui Xunfei Medical Co.,Ltd. Address before: Room 288, H2 / F, phase II, innovation industrial park, 2800 innovation Avenue, high tech Zone, Hefei, Anhui 230000 Patentee before: ANHUI IFLYTEK MEDICAL INFORMATION TECHNOLOGY CO.,LTD. |
|
CP03 | Change of name, title or address | ||
CP01 | Change in the name or title of a patent holder |
Address after: 230088 floor 23-24, building A5, No. 666, Wangjiang West Road, high tech Zone, Hefei, Anhui Province Patentee after: IFLYTEK Medical Technology Co.,Ltd. Address before: 230088 floor 23-24, building A5, No. 666, Wangjiang West Road, high tech Zone, Hefei, Anhui Province Patentee before: Anhui Xunfei Medical Co.,Ltd. |
|
CP01 | Change in the name or title of a patent holder |