CN104143329A - 进行语音关键词检索的方法及装置 - Google Patents
进行语音关键词检索的方法及装置 Download PDFInfo
- Publication number
- CN104143329A CN104143329A CN201310361835.5A CN201310361835A CN104143329A CN 104143329 A CN104143329 A CN 104143329A CN 201310361835 A CN201310361835 A CN 201310361835A CN 104143329 A CN104143329 A CN 104143329A
- Authority
- CN
- China
- Prior art keywords
- model
- keyword
- languages
- recognition result
- cognition
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 31
- 238000000605 extraction Methods 0.000 claims abstract description 37
- 230000019771 cognition Effects 0.000 claims description 60
- 230000008878 coupling Effects 0.000 claims description 10
- 238000010168 coupling process Methods 0.000 claims description 10
- 238000005859 coupling reaction Methods 0.000 claims description 10
- 230000004069 differentiation Effects 0.000 claims description 7
- 230000036962 time dependent Effects 0.000 claims description 7
- 239000000284 extract Substances 0.000 claims description 6
- 235000012054 meals Nutrition 0.000 description 9
- 238000001514 detection method Methods 0.000 description 4
- 238000005516 engineering process Methods 0.000 description 4
- 230000008569 process Effects 0.000 description 4
- 238000010586 diagram Methods 0.000 description 3
- 230000008901 benefit Effects 0.000 description 2
- 230000007547 defect Effects 0.000 description 2
- 238000000926 separation method Methods 0.000 description 2
- 241001672694 Citrus reticulata Species 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 230000010365 information processing Effects 0.000 description 1
- 235000013311 vegetables Nutrition 0.000 description 1
- 235000003563 vegetarian diet Nutrition 0.000 description 1
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/08—Speech classification or search
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/08—Speech classification or search
- G10L15/18—Speech classification or search using natural language modelling
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/28—Constructional details of speech recognition systems
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/28—Constructional details of speech recognition systems
- G10L15/32—Multiple recognisers used in sequence or in parallel; Score combination systems therefor, e.g. voting systems
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/08—Speech classification or search
- G10L2015/088—Word spotting
Landscapes
- Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Artificial Intelligence (AREA)
- Telephonic Communication Services (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Machine Translation (AREA)
Abstract
Description
Claims (10)
Priority Applications (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201310361835.5A CN104143329B (zh) | 2013-08-19 | 2013-08-19 | 进行语音关键词检索的方法及装置 |
PCT/CN2014/083531 WO2015024431A1 (en) | 2013-08-19 | 2014-08-01 | Method and apparatus for performing speech keyword retrieval |
US14/620,000 US9355637B2 (en) | 2013-08-19 | 2015-02-11 | Method and apparatus for performing speech keyword retrieval |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201310361835.5A CN104143329B (zh) | 2013-08-19 | 2013-08-19 | 进行语音关键词检索的方法及装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN104143329A true CN104143329A (zh) | 2014-11-12 |
CN104143329B CN104143329B (zh) | 2015-10-21 |
Family
ID=51852487
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201310361835.5A Active CN104143329B (zh) | 2013-08-19 | 2013-08-19 | 进行语音关键词检索的方法及装置 |
Country Status (3)
Country | Link |
---|---|
US (1) | US9355637B2 (zh) |
CN (1) | CN104143329B (zh) |
WO (1) | WO2015024431A1 (zh) |
Cited By (17)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104715752A (zh) * | 2015-04-09 | 2015-06-17 | 刘文军 | 语音识别方法、装置及系统 |
CN105185375A (zh) * | 2015-08-10 | 2015-12-23 | 联想(北京)有限公司 | 一种信息处理方法和电子设备 |
CN107195298A (zh) * | 2016-03-15 | 2017-09-22 | 通用汽车环球科技运作有限责任公司 | 根本原因分析以及校正系统和方法 |
CN108305617A (zh) * | 2018-01-31 | 2018-07-20 | 腾讯科技(深圳)有限公司 | 语音关键词的识别方法和装置 |
CN108682415A (zh) * | 2018-05-23 | 2018-10-19 | 广州视源电子科技股份有限公司 | 语音搜索方法、装置和系统 |
WO2018232591A1 (en) * | 2017-06-20 | 2018-12-27 | Microsoft Technology Licensing, Llc. | SEQUENCE RECOGNITION PROCESSING |
CN109523991A (zh) * | 2017-09-15 | 2019-03-26 | 阿里巴巴集团控股有限公司 | 语音识别的方法及装置、设备 |
CN109643542A (zh) * | 2016-09-23 | 2019-04-16 | 英特尔公司 | 用于改进的关键词检测的技术 |
CN110223672A (zh) * | 2019-05-16 | 2019-09-10 | 九牧厨卫股份有限公司 | 一种离线式多语种语音识别方法 |
CN110349572A (zh) * | 2017-05-27 | 2019-10-18 | 腾讯科技(深圳)有限公司 | 一种语音关键词识别方法、装置、终端及服务器 |
CN110444198A (zh) * | 2019-07-03 | 2019-11-12 | 平安科技(深圳)有限公司 | 检索方法、装置、计算机设备和存储介质 |
CN111031329A (zh) * | 2018-10-10 | 2020-04-17 | 北京默契破冰科技有限公司 | 一种用于管理音频数据的方法、设备和计算机存储介质 |
CN111107380A (zh) * | 2018-10-10 | 2020-05-05 | 北京默契破冰科技有限公司 | 一种用于管理音频数据的方法、设备和计算机存储介质 |
CN111161706A (zh) * | 2018-10-22 | 2020-05-15 | 阿里巴巴集团控股有限公司 | 交互方法、装置、设备和系统 |
CN111369978A (zh) * | 2018-12-26 | 2020-07-03 | 北京搜狗科技发展有限公司 | 一种数据处理方法、装置和用于数据处理的装置 |
CN112133291A (zh) * | 2019-06-05 | 2020-12-25 | 科大讯飞股份有限公司 | 一种语种识别模型训练、语种识别的方法和相关装置 |
CN114697748A (zh) * | 2020-12-25 | 2022-07-01 | 深圳Tcl新技术有限公司 | 一种基于语音识别的视频推荐方法和计算机设备 |
Families Citing this family (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103971678B (zh) * | 2013-01-29 | 2015-08-12 | 腾讯科技(深圳)有限公司 | 关键词检测方法和装置 |
US9704482B2 (en) * | 2015-03-11 | 2017-07-11 | International Business Machines Corporation | Method and system for order-free spoken term detection |
CN110781270A (zh) * | 2018-07-13 | 2020-02-11 | 北京搜狗科技发展有限公司 | 一种解码网络中非关键词模型的构建方法和装置 |
CN109712607B (zh) * | 2018-12-30 | 2021-12-24 | 联想(北京)有限公司 | 一种处理方法、装置及电子设备 |
US11043218B1 (en) * | 2019-06-26 | 2021-06-22 | Amazon Technologies, Inc. | Wakeword and acoustic event detection |
US11132990B1 (en) * | 2019-06-26 | 2021-09-28 | Amazon Technologies, Inc. | Wakeword and acoustic event detection |
CN111176618B (zh) * | 2019-12-10 | 2023-09-01 | 武汉学子明灯科技有限责任公司 | 一种语音唤醒开发程序的方法及系统 |
CN111429912B (zh) * | 2020-03-17 | 2023-02-10 | 厦门快商通科技股份有限公司 | 关键词检测方法、系统、移动终端及存储介质 |
CN113611284B (zh) * | 2021-08-06 | 2024-05-07 | 工银科技有限公司 | 语音库构建方法、识别方法、构建系统和识别系统 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5689616A (en) * | 1993-11-19 | 1997-11-18 | Itt Corporation | Automatic language identification/verification system |
US5805771A (en) * | 1994-06-22 | 1998-09-08 | Texas Instruments Incorporated | Automatic language identification method and system |
US20030220784A1 (en) * | 2002-05-24 | 2003-11-27 | International Business Machines Corporation | System and method for automated voice message transcription and delivery |
CN101231660A (zh) * | 2008-02-19 | 2008-07-30 | 林超 | 电话自然对话中关键信息的挖掘系统及其方法 |
CN101645269A (zh) * | 2008-12-30 | 2010-02-10 | 中国科学院声学研究所 | 一种语种识别系统及方法 |
Family Cites Families (20)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US2003220A (en) | 1931-10-23 | 1935-05-28 | William J Pearson | Type-setting device |
US5502790A (en) * | 1991-12-24 | 1996-03-26 | Oki Electric Industry Co., Ltd. | Speech recognition method and system using triphones, diphones, and phonemes |
US5428707A (en) * | 1992-11-13 | 1995-06-27 | Dragon Systems, Inc. | Apparatus and methods for training speech recognition systems and their users and otherwise improving speech recognition performance |
US6029124A (en) * | 1997-02-21 | 2000-02-22 | Dragon Systems, Inc. | Sequential, nonparametric speech recognition and speaker identification |
US5953700A (en) * | 1997-06-11 | 1999-09-14 | International Business Machines Corporation | Portable acoustic interface for remote access to automatic speech/speaker recognition server |
US7054810B2 (en) * | 2000-10-06 | 2006-05-30 | International Business Machines Corporation | Feature vector-based apparatus and method for robust pattern recognition |
JP2002132287A (ja) * | 2000-10-20 | 2002-05-09 | Canon Inc | 音声収録方法および音声収録装置および記憶媒体 |
US7676366B2 (en) * | 2003-01-13 | 2010-03-09 | Art Advanced Recognition Technologies Inc. | Adaptation of symbols |
JP4033299B2 (ja) * | 2003-03-12 | 2008-01-16 | 株式会社エヌ・ティ・ティ・ドコモ | 音声モデルの雑音適応化システム、雑音適応化方法、及び、音声認識雑音適応化プログラム |
JP4548646B2 (ja) * | 2003-09-12 | 2010-09-22 | 株式会社エヌ・ティ・ティ・ドコモ | 音声モデルの雑音適応化システム、雑音適応化方法、及び、音声認識雑音適応化プログラム |
US7774196B2 (en) * | 2003-10-01 | 2010-08-10 | Dictaphone Corporation | System and method for modifying a language model and post-processor information |
US7596498B2 (en) * | 2005-09-02 | 2009-09-29 | Microsoft Corporation | Monitoring, mining, and classifying electronically recordable conversations |
CN101030369B (zh) * | 2007-03-30 | 2011-06-29 | 清华大学 | 基于子词隐含马尔可夫模型的嵌入式语音识别方法 |
JP5200712B2 (ja) * | 2008-07-10 | 2013-06-05 | 富士通株式会社 | 音声認識装置、音声認識方法及びコンピュータプログラム |
CA2680304C (en) * | 2008-09-25 | 2017-08-22 | Multimodal Technologies, Inc. | Decoding-time prediction of non-verbalized tokens |
JP5150542B2 (ja) * | 2009-03-26 | 2013-02-20 | 株式会社東芝 | パターン認識装置、パターン認識方法、及び、プログラム |
US20100268534A1 (en) * | 2009-04-17 | 2010-10-21 | Microsoft Corporation | Transcription, archiving and threading of voice communications |
KR101154011B1 (ko) * | 2010-06-07 | 2012-06-08 | 주식회사 서비전자 | 다중 모델 적응화와 음성인식장치 및 방법 |
US8532994B2 (en) * | 2010-08-27 | 2013-09-10 | Cisco Technology, Inc. | Speech recognition using a personal vocabulary and language model |
CN102521221A (zh) * | 2011-11-30 | 2012-06-27 | 江苏奇异点网络有限公司 | 具有文字输出功能的多语言会议信息输出方法 |
-
2013
- 2013-08-19 CN CN201310361835.5A patent/CN104143329B/zh active Active
-
2014
- 2014-08-01 WO PCT/CN2014/083531 patent/WO2015024431A1/en active Application Filing
-
2015
- 2015-02-11 US US14/620,000 patent/US9355637B2/en active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5689616A (en) * | 1993-11-19 | 1997-11-18 | Itt Corporation | Automatic language identification/verification system |
US5805771A (en) * | 1994-06-22 | 1998-09-08 | Texas Instruments Incorporated | Automatic language identification method and system |
US20030220784A1 (en) * | 2002-05-24 | 2003-11-27 | International Business Machines Corporation | System and method for automated voice message transcription and delivery |
CN101231660A (zh) * | 2008-02-19 | 2008-07-30 | 林超 | 电话自然对话中关键信息的挖掘系统及其方法 |
CN101645269A (zh) * | 2008-12-30 | 2010-02-10 | 中国科学院声学研究所 | 一种语种识别系统及方法 |
Cited By (31)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104715752B (zh) * | 2015-04-09 | 2019-01-08 | 刘文军 | 语音识别方法、装置及系统 |
CN104715752A (zh) * | 2015-04-09 | 2015-06-17 | 刘文军 | 语音识别方法、装置及系统 |
CN105185375A (zh) * | 2015-08-10 | 2015-12-23 | 联想(北京)有限公司 | 一种信息处理方法和电子设备 |
CN105185375B (zh) * | 2015-08-10 | 2019-03-08 | 联想(北京)有限公司 | 一种信息处理方法和电子设备 |
CN107195298A (zh) * | 2016-03-15 | 2017-09-22 | 通用汽车环球科技运作有限责任公司 | 根本原因分析以及校正系统和方法 |
CN109643542B (zh) * | 2016-09-23 | 2024-01-12 | 英特尔公司 | 用于改进的关键词检测的技术 |
CN109643542A (zh) * | 2016-09-23 | 2019-04-16 | 英特尔公司 | 用于改进的关键词检测的技术 |
CN110349572B (zh) * | 2017-05-27 | 2021-10-22 | 腾讯科技(深圳)有限公司 | 一种语音关键词识别方法、装置、终端及服务器 |
CN110349572A (zh) * | 2017-05-27 | 2019-10-18 | 腾讯科技(深圳)有限公司 | 一种语音关键词识别方法、装置、终端及服务器 |
WO2018232591A1 (en) * | 2017-06-20 | 2018-12-27 | Microsoft Technology Licensing, Llc. | SEQUENCE RECOGNITION PROCESSING |
CN109523991B (zh) * | 2017-09-15 | 2023-08-18 | 阿里巴巴集团控股有限公司 | 语音识别的方法及装置、设备 |
CN109523991A (zh) * | 2017-09-15 | 2019-03-26 | 阿里巴巴集团控股有限公司 | 语音识别的方法及装置、设备 |
US11222623B2 (en) | 2018-01-31 | 2022-01-11 | Tencent Technology (Shenzhen) Company Limited | Speech keyword recognition method and apparatus, computer-readable storage medium, and computer device |
CN108305617B (zh) * | 2018-01-31 | 2020-09-08 | 腾讯科技(深圳)有限公司 | 语音关键词的识别方法和装置 |
CN108305617A (zh) * | 2018-01-31 | 2018-07-20 | 腾讯科技(深圳)有限公司 | 语音关键词的识别方法和装置 |
CN108682415A (zh) * | 2018-05-23 | 2018-10-19 | 广州视源电子科技股份有限公司 | 语音搜索方法、装置和系统 |
CN111031329B (zh) * | 2018-10-10 | 2023-08-15 | 北京默契破冰科技有限公司 | 一种用于管理音频数据的方法、设备和计算机存储介质 |
CN111107380A (zh) * | 2018-10-10 | 2020-05-05 | 北京默契破冰科技有限公司 | 一种用于管理音频数据的方法、设备和计算机存储介质 |
CN111107380B (zh) * | 2018-10-10 | 2023-08-15 | 北京默契破冰科技有限公司 | 一种用于管理音频数据的方法、设备和计算机存储介质 |
CN111031329A (zh) * | 2018-10-10 | 2020-04-17 | 北京默契破冰科技有限公司 | 一种用于管理音频数据的方法、设备和计算机存储介质 |
CN111161706A (zh) * | 2018-10-22 | 2020-05-15 | 阿里巴巴集团控股有限公司 | 交互方法、装置、设备和系统 |
CN111369978A (zh) * | 2018-12-26 | 2020-07-03 | 北京搜狗科技发展有限公司 | 一种数据处理方法、装置和用于数据处理的装置 |
CN111369978B (zh) * | 2018-12-26 | 2024-05-17 | 北京搜狗科技发展有限公司 | 一种数据处理方法、装置和用于数据处理的装置 |
CN110223672B (zh) * | 2019-05-16 | 2021-04-23 | 九牧厨卫股份有限公司 | 一种离线式多语种语音识别方法 |
CN110223672A (zh) * | 2019-05-16 | 2019-09-10 | 九牧厨卫股份有限公司 | 一种离线式多语种语音识别方法 |
CN112133291A (zh) * | 2019-06-05 | 2020-12-25 | 科大讯飞股份有限公司 | 一种语种识别模型训练、语种识别的方法和相关装置 |
CN112133291B (zh) * | 2019-06-05 | 2024-02-13 | 科大讯飞股份有限公司 | 一种语种识别模型训练、语种识别的方法和相关装置 |
CN110444198A (zh) * | 2019-07-03 | 2019-11-12 | 平安科技(深圳)有限公司 | 检索方法、装置、计算机设备和存储介质 |
CN110444198B (zh) * | 2019-07-03 | 2023-05-30 | 平安科技(深圳)有限公司 | 检索方法、装置、计算机设备和存储介质 |
CN114697748B (zh) * | 2020-12-25 | 2024-05-03 | 深圳Tcl新技术有限公司 | 一种基于语音识别的视频推荐方法和计算机设备 |
CN114697748A (zh) * | 2020-12-25 | 2022-07-01 | 深圳Tcl新技术有限公司 | 一种基于语音识别的视频推荐方法和计算机设备 |
Also Published As
Publication number | Publication date |
---|---|
WO2015024431A1 (en) | 2015-02-26 |
US20150154955A1 (en) | 2015-06-04 |
US9355637B2 (en) | 2016-05-31 |
CN104143329B (zh) | 2015-10-21 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN104143329B (zh) | 进行语音关键词检索的方法及装置 | |
CN109408526B (zh) | Sql语句生成方法、装置、计算机设备及存储介质 | |
CN109817213B (zh) | 用于自适应语种进行语音识别的方法、装置及设备 | |
CN105869634B (zh) | 一种基于领域的带反馈语音识别后文本纠错方法及系统 | |
US10672391B2 (en) | Improving automatic speech recognition of multilingual named entities | |
CN105931644B (zh) | 一种语音识别方法及移动终端 | |
KR101309042B1 (ko) | 다중 도메인 음성 대화 장치 및 이를 이용한 다중 도메인 음성 대화 방법 | |
US10755048B2 (en) | Artificial intelligence based method and apparatus for segmenting sentence | |
CN109637537B (zh) | 一种自动获取标注数据优化自定义唤醒模型的方法 | |
US20150278192A1 (en) | Language model adaptation based on filtered data | |
CN105654943A (zh) | 一种语音唤醒方法、装置及系统 | |
CN107077843A (zh) | 对话控制装置和对话控制方法 | |
WO2021103712A1 (zh) | 一种基于神经网络的语音关键词检测方法、装置及系统 | |
CN107369439A (zh) | 一种语音唤醒方法和装置 | |
CN112001175A (zh) | 流程自动化方法、装置、电子设备及存储介质 | |
JP6875819B2 (ja) | 音響モデル入力データの正規化装置及び方法と、音声認識装置 | |
US11907665B2 (en) | Method and system for processing user inputs using natural language processing | |
KR101149521B1 (ko) | 도메인 온톨로지를 이용한 음성 인식 방법 및 그 장치 | |
CN105869622B (zh) | 中文热词检测方法和装置 | |
CN111209367A (zh) | 信息查找方法、信息查找装置、电子设备及存储介质 | |
KR20170008357A (ko) | 크라우드 소싱을 이용한 웹툰 언어 자동 번역 방법 | |
CN104199811A (zh) | 短句解析模型建立方法及系统 | |
EP4024393A2 (en) | Training a speech recognition model | |
CN116052655A (zh) | 音频处理方法、装置、电子设备和可读存储介质 | |
CN115132170A (zh) | 语种分类方法、装置及计算机可读存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C14 | Grant of patent or utility model | ||
GR01 | Patent grant | ||
TR01 | Transfer of patent right |
Effective date of registration: 20200825 Address after: 518057 Nanshan District science and technology zone, Guangdong, Zhejiang Province, science and technology in the Tencent Building on the 1st floor of the 35 layer Co-patentee after: TENCENT CLOUD COMPUTING (BEIJING) Co.,Ltd. Patentee after: TENCENT TECHNOLOGY (SHENZHEN) Co.,Ltd. Address before: Shenzhen Futian District City, Guangdong province 518044 Zhenxing Road, SEG Science Park 2 East Room 403 Patentee before: TENCENT TECHNOLOGY (SHENZHEN) Co.,Ltd. |
|
TR01 | Transfer of patent right |