KR100755677B1 - 주제 영역 검출을 이용한 대화체 음성 인식 장치 및 방법 - Google Patents
주제 영역 검출을 이용한 대화체 음성 인식 장치 및 방법 Download PDFInfo
- Publication number
- KR100755677B1 KR100755677B1 KR1020050104462A KR20050104462A KR100755677B1 KR 100755677 B1 KR100755677 B1 KR 100755677B1 KR 1020050104462 A KR1020050104462 A KR 1020050104462A KR 20050104462 A KR20050104462 A KR 20050104462A KR 100755677 B1 KR100755677 B1 KR 100755677B1
- Authority
- KR
- South Korea
- Prior art keywords
- subject area
- subject
- word
- language model
- text
- Prior art date
Links
- 238000000034 method Methods 0.000 title claims abstract description 55
- 238000001514 detection method Methods 0.000 title claims abstract description 30
- 230000002441 reversible effect Effects 0.000 claims abstract description 18
- 230000002452 interceptive effect Effects 0.000 claims abstract description 15
- 238000012549 training Methods 0.000 claims abstract description 15
- 239000013598 vector Substances 0.000 claims abstract description 14
- 238000004364 calculation method Methods 0.000 claims description 3
- 230000000694 effects Effects 0.000 abstract description 3
- 230000008569 process Effects 0.000 description 17
- 238000010586 diagram Methods 0.000 description 13
- 238000000605 extraction Methods 0.000 description 5
- 238000012986 modification Methods 0.000 description 4
- 230000004048 modification Effects 0.000 description 4
- 238000013459 approach Methods 0.000 description 3
- 238000002474 experimental method Methods 0.000 description 3
- 230000006870 function Effects 0.000 description 2
- 101100493820 Caenorhabditis elegans best-1 gene Proteins 0.000 description 1
- 238000003491 array Methods 0.000 description 1
- 238000009223 counseling Methods 0.000 description 1
- 230000001419 dependent effect Effects 0.000 description 1
- 239000000284 extract Substances 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 239000000463 material Substances 0.000 description 1
- 230000001151 other effect Effects 0.000 description 1
- 230000008447 perception Effects 0.000 description 1
- 238000012805 post-processing Methods 0.000 description 1
- NGVDGCNFYWLIFO-UHFFFAOYSA-N pyridoxal 5'-phosphate Chemical compound CC1=NC=C(COP(O)(O)=O)C(C=O)=C1O NGVDGCNFYWLIFO-UHFFFAOYSA-N 0.000 description 1
- 230000002123 temporal effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/08—Speech classification or search
- G10L15/18—Speech classification or search using natural language modelling
- G10L15/1822—Parsing for meaning understanding
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/08—Speech classification or search
- G10L15/18—Speech classification or search using natural language modelling
- G10L15/1815—Semantic context, e.g. disambiguation of the recognition hypotheses based on word meaning
Landscapes
- Engineering & Computer Science (AREA)
- Artificial Intelligence (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Machine Translation (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
Description
Claims (14)
- 사전 구축된 글로벌 언어 모델 데이터베이스와 발음 사전 데이터베이스 및 음향 모델 데이터베이스를 참조하여, 입력 음성 신호로부터 검출된 특징 벡터와 유사한 단어열을 생성하는 전방향 탐색(Forward Search)을 수행하는 전방향 탐색부;상기 전방향 탐색의 결과 생성된 상기 단어열에 대한 정보를 이용하여 상기 단어열 내의 어휘들의 의미로부터 도출되는 주제 영역(Topic Domain)을 검출하는 주제 영역 검출부;상기 검출된 주제 영역에 관하여 사전 구축된 특정 주제 영역 언어모델 데이터베이스를 참조하여 상기 입력 음성 신호에 대한 음성 인식 결과를 텍스트로 출력하는 역방향 디코딩(Backward Decoding)을 수행하는 역방향 디코딩부; 및상기 역방향 디코딩부에 의해 출력된 텍스트의 주제 영역에 대한 정보와 상기 텍스트의 히스토리 정보를 포함하는 정보를 저장하고 관리하는 텍스트 정보 관리부를 포함하는, 주제 영역 검출을 이용한 대화체 음성 인식 장치.
- 삭제
- 제 1 항에 있어서,상기 주제 영역 검출부는,상기 단어열을 구성하는 단어들 중 주제 영역과 무관한 비핵심어를 제거하는 비핵심어 제거부;상기 비핵심어가 제거된 단어열을 입력받아 상기 단어열 내의 어휘들로부터 각 주제 영역과의 거리를 산출하는 주제 영역 거리산출부; 및상기 산출된 각 주제 영역과의 거리 중 최소 거리를 가지는 주제 영역을 검출하는 최소 거리 주제 영역 검출부를 포함하는, 주제 영역 검출을 이용한 대화체 음성 인식 장치.
- 제 3 항에 있어서,상기 주제 영역 거리산출부는,상기 텍스트 정보 관리부로부터 획득한 정보와 상기 각 주제 영역과의 거리 산출에 사용되는 확률 인자를 가지고 있는 확률 인자 데이터베이스로부터 획득한 정보를 참조하여 상기 거리를 산출하는, 주제 영역 검출을 이용한 대화체 음성 인식 장치.
- 제 4 항에 있어서,상기 확률 인자 데이터베이스는,상기 주제 영역 별로 미리 구축된 발성 가능한 텍스트 정보를 포함하는 훈련 코퍼스(Training Corpus)를 이용하여 생성되는, 주제 영역 검출을 이용한 대화체 음성 인식 장치.
- 제 4 항에 있어서,상기 주제영역 거리산출부는,상기 확률 인자로 이루어진 하기의 <수학식>(여기서, 상기 Pr(Di|w1 wn)은 n 개의 단어들로부터 i 번째 주제 영역이 선택되는 확률, Pr(wj|Di)는 i 번째 주제 영역 Di가 선택된 상태에서 j 번째 주제 단어 wj 가 선택되는 확률, DFwj 는 상기 j 번째 주제 단어 wj 가 나타나는 주제 영역의 개수인 주제 영역 빈도수, wdomain 은 발화 문맥에 대한 가중치, 그리고, WFDi 는 상기 i 번째 주제 영역 Di 를 지지하는 주제 단어의 개수인 주제 단어 빈도수를 의미한다)에 의해 상기 거리를 산출하는, 주제 영역 검출을 이용한 대화체 음성 인식 장치.
- 제 1 항에 있어서,상기 역방향 디코딩부는,상기 특정주제 영역 언어모델 데이터베이스를 참조한 역방향 디코딩의 결과 상기 텍스트가 출력되지 못하는 경우에는, 상기 글로벌 언어 모델 데이터베이스를 참조하는 역방향 서브 디코딩을 더 수행하는, 주제 영역 검출을 이용한 대화체 음성 인식 장치.
- (a) 사전 구축된 글로벌 언어 모델 데이터베이스와 발음 사전 데이터베이스 및 음향 모델 데이터베이스를 참조하여, 입력 음성 신호로부터 검출된 특징 벡터와 유사한 단어열을 생성하는 전방향 탐색(Forward Search)을 수행하는 단계;(b) 상기 전방향 탐색의 결과 생성된 상기 단어열에 대한 정보를 이용하여 상기 단어열 내의 어휘들의 의미로부터 도출되는 주제 영역(Topic Domain)을 검출하는 단계; 및(c) 상기 검출된 주제 영역에 관하여 사전 구축된 특정 주제 영역 언어모델 데이터베이스를 참조하여, 상기 입력 음성 신호에 대한 음성 인식 결과를 텍스트로 출력하는 역방향 디코딩(Backward Decoding)을 수행하는 단계; 및(d) 상기 역방향 디코딩 수행 단계에 의해 출력된 텍스트의 주제 영역에 대한 정보와 상기 텍스트의 히스토리 정보를 포함하는 정보를 저장하고 관리하는 단계를 포함하는, 주제 영역 검출을 이용한 대화체 음성 인식 방법.
- 제 8 항에 있어서,상기 (b) 단계는,(b1) 상기 단어열을 구성하는 단어들 중 주제 영역과 무관한 비핵심어를 제거하는 단계;(b2) 상기 비핵심어가 제거된 단어열을 입력받아 상기 단어열 내의 어휘들로부터 각 주제 영역과의 거리를 산출하는 단계; 및(b3) 상기 산출된 각 주제 영역과의 거리 중 최소 거리를 가지는 주제 영역을 검출하는 단계를 포함하는, 주제 영역 검출을 이용한 대화체 음성 인식 방법.
- 제 9 항에 있어서,상기 (b2) 단계는,상기 역방향 디코딩 결과 출력된 텍스트로부터 획득한 정보와 상기 각 주제 영역과의 거리 산출에 사용되는 확률 인자를 가지고 있는 확률 인자 데이터베이스로부터 획득한 정보를 참조하여 상기 거리를 산출하는 단계를 포함하는, 주제 영역 검출을 이용한 대화체 음성 인식 방법.
- 제 10 항에 있어서,상기 확률 인자 데이터베이스는,상기 주제 영역 별로 미리 구축된 발성 가능한 텍스트 정보를 포함하는 훈련 코퍼스(Training Corpus)를 이용하여 생성되는, 주제 영역 검출을 이용한 대화체 음성 인식 방법.
- 제 10 항에 있어서,상기 (b2) 단계는,상기 확률 인자로 이루어진 하기의 <수학식>(여기서, 상기 Pr(Di|w1 wn)은 n 개의 단어들로부터 i 번째 주제 영역이 선택되는 확률, Pr(wj|Di)는 i 번째 주제 영역 Di가 선택된 상태에서 j 번째 주제 단어 wj 가 선택되는 확률, DFwj 는 상기 j 번째 주제 단어 wj 가 나타나는 주제 영역의 개수인 주제 영역 빈도수, wdomain 은 발화 문맥에 대한 가중치, 그리고, WFDi 는 상기 i 번째 주제 영역 Di 를 지지하는 주제 단어의 개수인 주제 단어 빈도수를 의미한다)에 의해 상기 거리를 산출하는 단계를 포함하는, 주제 영역 검출을 이용한 대화체 음성 인식 방법.
- 제 10 항에 있어서,상기 (c) 단계는,상기 특정주제 영역 언어모델 데이터베이스를 참조한 역방향 디코딩의 결과 상기 텍스트가 출력되지 못하는 경우에는, 상기 글로벌 언어 모델 데이터베이스를 참조하는 역방향 서브 디코딩을 더 수행하는 단계를 포함하는, 주제 영역 검출을 이용한 대화체 음성 인식 방법.
- 제 8 항 내지 제 13 항 중 어느 한 항의 방법을 컴퓨터에서 실행하기 위한 프로그램 코드를 기록한 컴퓨터로 읽을 수 있는 기록 매체.
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020050104462A KR100755677B1 (ko) | 2005-11-02 | 2005-11-02 | 주제 영역 검출을 이용한 대화체 음성 인식 장치 및 방법 |
US11/589,165 US8301450B2 (en) | 2005-11-02 | 2006-10-30 | Apparatus, method, and medium for dialogue speech recognition using topic domain detection |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020050104462A KR100755677B1 (ko) | 2005-11-02 | 2005-11-02 | 주제 영역 검출을 이용한 대화체 음성 인식 장치 및 방법 |
Publications (2)
Publication Number | Publication Date |
---|---|
KR20070047579A KR20070047579A (ko) | 2007-05-07 |
KR100755677B1 true KR100755677B1 (ko) | 2007-09-05 |
Family
ID=37997631
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020050104462A KR100755677B1 (ko) | 2005-11-02 | 2005-11-02 | 주제 영역 검출을 이용한 대화체 음성 인식 장치 및 방법 |
Country Status (2)
Country | Link |
---|---|
US (1) | US8301450B2 (ko) |
KR (1) | KR100755677B1 (ko) |
Families Citing this family (77)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2007271876A (ja) * | 2006-03-31 | 2007-10-18 | Denso Corp | 音声認識装置および音声認識用のプログラム |
JP4188989B2 (ja) * | 2006-09-15 | 2008-12-03 | 本田技研工業株式会社 | 音声認識装置、音声認識方法、及び音声認識プログラム |
US7788095B2 (en) * | 2007-11-18 | 2010-08-31 | Nice Systems, Ltd. | Method and apparatus for fast search in call-center monitoring |
JP5327054B2 (ja) * | 2007-12-18 | 2013-10-30 | 日本電気株式会社 | 発音変動規則抽出装置、発音変動規則抽出方法、および発音変動規則抽出用プログラム |
JP5440177B2 (ja) * | 2007-12-21 | 2014-03-12 | 日本電気株式会社 | 単語カテゴリ推定装置、単語カテゴリ推定方法、音声認識装置、音声認識方法、プログラム、および記録媒体 |
KR101149521B1 (ko) * | 2008-12-10 | 2012-05-25 | 한국전자통신연구원 | 도메인 온톨로지를 이용한 음성 인식 방법 및 그 장치 |
US8447608B1 (en) * | 2008-12-10 | 2013-05-21 | Adobe Systems Incorporated | Custom language models for audio content |
US20110004473A1 (en) * | 2009-07-06 | 2011-01-06 | Nice Systems Ltd. | Apparatus and method for enhanced speech recognition |
KR101597289B1 (ko) * | 2009-07-31 | 2016-03-08 | 삼성전자주식회사 | 동적 화면에 따라 음성을 인식하는 장치 및 방법 |
US10614134B2 (en) | 2009-10-30 | 2020-04-07 | Rakuten, Inc. | Characteristic content determination device, characteristic content determination method, and recording medium |
KR20140127360A (ko) * | 2009-10-30 | 2014-11-03 | 라쿠텐 인코포레이티드 | 특유 콘텐츠 판정 장치, 특유 콘텐츠 판정 방법, 기록 매체, 콘텐츠 생성 장치 및 관련 콘텐츠 삽입 장치 |
US8589163B2 (en) * | 2009-12-04 | 2013-11-19 | At&T Intellectual Property I, L.P. | Adapting language models with a bit mask for a subset of related words |
CN103038764A (zh) * | 2010-04-14 | 2013-04-10 | 惠普发展公司,有限责任合伙企业 | 用于关键字提取的方法 |
KR101699720B1 (ko) * | 2010-08-03 | 2017-01-26 | 삼성전자주식회사 | 음성명령 인식 장치 및 음성명령 인식 방법 |
DE102010040553A1 (de) * | 2010-09-10 | 2012-03-15 | Siemens Aktiengesellschaft | Spracherkennungsverfahren |
US8812321B2 (en) * | 2010-09-30 | 2014-08-19 | At&T Intellectual Property I, L.P. | System and method for combining speech recognition outputs from a plurality of domain-specific speech recognizers via machine learning |
US9202465B2 (en) * | 2011-03-25 | 2015-12-01 | General Motors Llc | Speech recognition dependent on text message content |
US9679561B2 (en) * | 2011-03-28 | 2017-06-13 | Nuance Communications, Inc. | System and method for rapid customization of speech recognition models |
WO2013056343A1 (en) * | 2011-09-30 | 2013-04-25 | Ming Li | System, method and computer program for correcting speech recognition information |
US9324323B1 (en) * | 2012-01-13 | 2016-04-26 | Google Inc. | Speech recognition using topic-specific language models |
US8775177B1 (en) | 2012-03-08 | 2014-07-08 | Google Inc. | Speech recognition process |
US9053708B2 (en) * | 2012-07-18 | 2015-06-09 | International Business Machines Corporation | System, method and program product for providing automatic speech recognition (ASR) in a shared resource environment |
US8577671B1 (en) * | 2012-07-20 | 2013-11-05 | Veveo, Inc. | Method of and system for using conversation state information in a conversational interaction system |
US9697821B2 (en) * | 2013-01-29 | 2017-07-04 | Tencent Technology (Shenzhen) Company Limited | Method and system for building a topic specific language model for use in automatic speech recognition |
US9495357B1 (en) * | 2013-05-02 | 2016-11-15 | Athena Ann Smyros | Text extraction |
PT2994908T (pt) | 2013-05-07 | 2019-10-18 | Veveo Inc | Interface de entrada incremental de discurso com retorno em tempo real |
KR101905827B1 (ko) * | 2013-06-26 | 2018-10-08 | 한국전자통신연구원 | 연속어 음성 인식 장치 및 방법 |
US10643616B1 (en) * | 2014-03-11 | 2020-05-05 | Nvoq Incorporated | Apparatus and methods for dynamically changing a speech resource based on recognized text |
US9812130B1 (en) * | 2014-03-11 | 2017-11-07 | Nvoq Incorporated | Apparatus and methods for dynamically changing a language model based on recognized text |
US9286892B2 (en) | 2014-04-01 | 2016-03-15 | Google Inc. | Language modeling in speech recognition |
CN103942191B (zh) * | 2014-04-25 | 2018-04-27 | 中国科学院自动化研究所 | 一种基于内容的恐怖文本识别方法 |
US9971765B2 (en) * | 2014-05-13 | 2018-05-15 | Nuance Communications, Inc. | Revising language model scores based on semantic class hypotheses |
US9721564B2 (en) * | 2014-07-31 | 2017-08-01 | Rovi Guides, Inc. | Systems and methods for performing ASR in the presence of heterographs |
US20160171122A1 (en) * | 2014-12-10 | 2016-06-16 | Ford Global Technologies, Llc | Multimodal search response |
US9852136B2 (en) | 2014-12-23 | 2017-12-26 | Rovi Guides, Inc. | Systems and methods for determining whether a negation statement applies to a current or past query |
CN106796586A (zh) * | 2014-12-30 | 2017-05-31 | 哈曼国际工业有限公司 | 基于语音识别的拨号 |
US9854049B2 (en) | 2015-01-30 | 2017-12-26 | Rovi Guides, Inc. | Systems and methods for resolving ambiguous terms in social chatter based on a user profile |
WO2016126768A2 (en) * | 2015-02-03 | 2016-08-11 | Dolby Laboratories Licensing Corporation | Conference word cloud |
US9953648B2 (en) * | 2015-05-11 | 2018-04-24 | Samsung Electronics Co., Ltd. | Electronic device and method for controlling the same |
KR102413067B1 (ko) * | 2015-07-28 | 2022-06-24 | 삼성전자주식회사 | 문법 모델을 갱신하고, 문법 모델에 기초하여 음성 인식을 수행하는 방법 및 디바이스 |
US9858923B2 (en) * | 2015-09-24 | 2018-01-02 | Intel Corporation | Dynamic adaptation of language models and semantic tracking for automatic speech recognition |
US10896681B2 (en) * | 2015-12-29 | 2021-01-19 | Google Llc | Speech recognition with selective use of dynamic language models |
US10049666B2 (en) * | 2016-01-06 | 2018-08-14 | Google Llc | Voice recognition system |
WO2017210613A1 (en) * | 2016-06-03 | 2017-12-07 | Maluuba Inc. | Natural language generation in a spoken dialogue system |
CN105957516B (zh) * | 2016-06-16 | 2019-03-08 | 百度在线网络技术(北京)有限公司 | 多语音识别模型切换方法及装置 |
US10083451B2 (en) | 2016-07-08 | 2018-09-25 | Asapp, Inc. | Using semantic processing for customer support |
US9805371B1 (en) * | 2016-07-08 | 2017-10-31 | Asapp, Inc. | Automatically suggesting responses to a received message |
JP2018054850A (ja) * | 2016-09-28 | 2018-04-05 | 株式会社東芝 | 情報処理システム、情報処理装置、情報処理方法、及びプログラム |
US10650311B2 (en) | 2016-12-19 | 2020-05-12 | Asaap, Inc. | Suggesting resources using context hashing |
US10109275B2 (en) | 2016-12-19 | 2018-10-23 | Asapp, Inc. | Word hash language model |
US10268680B2 (en) * | 2016-12-30 | 2019-04-23 | Google Llc | Context-aware human-to-computer dialog |
CN107358143A (zh) * | 2017-05-17 | 2017-11-17 | 广州视源电子科技股份有限公司 | 前向搜索模型集成方法、装置、存储设备和人脸识别系统 |
US10762423B2 (en) | 2017-06-27 | 2020-09-01 | Asapp, Inc. | Using a neural network to optimize processing of user requests |
CN107423398B (zh) * | 2017-07-26 | 2023-04-18 | 腾讯科技(上海)有限公司 | 交互方法、装置、存储介质和计算机设备 |
US10497004B2 (en) | 2017-12-08 | 2019-12-03 | Asapp, Inc. | Automating communications using an intent classifier |
US10489792B2 (en) | 2018-01-05 | 2019-11-26 | Asapp, Inc. | Maintaining quality of customer support messages |
US10210244B1 (en) | 2018-02-12 | 2019-02-19 | Asapp, Inc. | Updating natural language interfaces by processing usage data |
US10169315B1 (en) | 2018-04-27 | 2019-01-01 | Asapp, Inc. | Removing personal information from text using a neural network |
KR102030551B1 (ko) * | 2018-07-09 | 2019-10-10 | 주식회사 한글과컴퓨터 | 인스턴트 메신저 구동 장치 및 그 동작 방법 |
US11216510B2 (en) | 2018-08-03 | 2022-01-04 | Asapp, Inc. | Processing an incomplete message with a neural network to generate suggested messages |
CN109284397A (zh) * | 2018-09-27 | 2019-01-29 | 深圳大学 | 一种领域词典的构建方法、装置、设备及存储介质 |
EP3640834A1 (en) * | 2018-10-17 | 2020-04-22 | Verint Americas Inc. | Automatic discovery of business-specific terminology |
US10747957B2 (en) | 2018-11-13 | 2020-08-18 | Asapp, Inc. | Processing communications using a prototype classifier |
US11551004B2 (en) | 2018-11-13 | 2023-01-10 | Asapp, Inc. | Intent discovery with a prototype classifier |
US11043214B1 (en) * | 2018-11-29 | 2021-06-22 | Amazon Technologies, Inc. | Speech recognition using dialog history |
US11955120B1 (en) | 2019-01-31 | 2024-04-09 | Alan AI, Inc. | Systems and methods for integrating voice controls into applications |
US11935539B1 (en) * | 2019-01-31 | 2024-03-19 | Alan AI, Inc. | Integrating voice controls into applications |
US11301629B2 (en) | 2019-08-21 | 2022-04-12 | International Business Machines Corporation | Interleaved conversation concept flow enhancement |
US11425064B2 (en) | 2019-10-25 | 2022-08-23 | Asapp, Inc. | Customized message suggestion with user embedding vectors |
CN111159403B (zh) * | 2019-12-27 | 2022-07-29 | 广东高乐教育科技有限公司 | 一种智能课堂感知的方法及系统 |
CN112259084B (zh) * | 2020-06-28 | 2024-07-16 | 北京汇钧科技有限公司 | 语音识别方法、装置和存储介质 |
CN111785254B (zh) * | 2020-07-24 | 2023-04-07 | 四川大学华西医院 | 基于模拟人的自助化bls培训与考核系统 |
CN111916089B (zh) * | 2020-07-27 | 2022-11-04 | 南京信息工程大学 | 基于声信号特征分析的冰雹检测方法和装置 |
CN112951210A (zh) * | 2021-02-02 | 2021-06-11 | 虫洞创新平台(深圳)有限公司 | 语音识别方法及装置、设备、计算机可读存储介质 |
CN112908339B (zh) * | 2021-03-18 | 2022-11-04 | 龙马智芯(珠海横琴)科技有限公司 | 一种会议环节定位方法、装置、定位设备及可读存储介质 |
CN113539246B (zh) * | 2021-08-20 | 2022-10-18 | 贝壳找房(北京)科技有限公司 | 语音识别方法和装置 |
CN114663042B (zh) * | 2022-02-11 | 2023-04-21 | 北京斗米优聘科技发展有限公司 | 一种智能电话呼叫招聘方法、装置、电子设备及存储介质 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20030008596A (ko) * | 2001-07-19 | 2003-01-29 | 한국전자통신연구원 | 주제어 인식이 가능한 음성인식시스템 및 방법 |
JP2004021207A (ja) | 2002-06-20 | 2004-01-22 | Nippon Hoso Kyokai <Nhk> | 音素認識方法、音素認識装置および音素認識プログラム |
KR20040069060A (ko) * | 2003-01-28 | 2004-08-04 | 삼성전자주식회사 | 양방향 n-그램 언어모델을 이용한 연속 음성인식방법 및장치 |
KR20050082249A (ko) * | 2004-02-18 | 2005-08-23 | 삼성전자주식회사 | 도메인 기반 대화 음성인식방법 및 장치 |
JP2005284209A (ja) | 2004-03-31 | 2005-10-13 | Kddi Corp | 音声認識方式 |
Family Cites Families (17)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
DE69423838T2 (de) * | 1993-09-23 | 2000-08-03 | Xerox Corp., Rochester | Semantische Gleichereignisfilterung für Spracherkennung und Signalübersetzungsanwendungen |
JP3647518B2 (ja) * | 1994-10-06 | 2005-05-11 | ゼロックス コーポレイション | コード化したワードトークンを使用して文書画像をハイライトで強調する装置 |
US5787230A (en) * | 1994-12-09 | 1998-07-28 | Lee; Lin-Shan | System and method of intelligent Mandarin speech input for Chinese computers |
US5887120A (en) * | 1995-05-31 | 1999-03-23 | Oracle Corporation | Method and apparatus for determining theme for discourse |
US6185531B1 (en) * | 1997-01-09 | 2001-02-06 | Gte Internetworking Incorporated | Topic indexing method |
US6052657A (en) * | 1997-09-09 | 2000-04-18 | Dragon Systems, Inc. | Text segmentation and identification of topic using language models |
US6104989A (en) * | 1998-07-29 | 2000-08-15 | International Business Machines Corporation | Real time detection of topical changes and topic identification via likelihood based methods |
US6324510B1 (en) * | 1998-11-06 | 2001-11-27 | Lernout & Hauspie Speech Products N.V. | Method and apparatus of hierarchically organizing an acoustic model for speech recognition and adaptation of the model to unseen domains |
US6631351B1 (en) * | 1999-09-14 | 2003-10-07 | Aidentity Matrix | Smart toys |
US7401023B1 (en) * | 2000-09-06 | 2008-07-15 | Verizon Corporate Services Group Inc. | Systems and methods for providing automated directory assistance using transcripts |
ATE297588T1 (de) * | 2000-11-14 | 2005-06-15 | Ibm | Anpassung des phonetischen kontextes zur verbesserung der spracherkennung |
US6772120B1 (en) * | 2000-11-21 | 2004-08-03 | Hewlett-Packard Development Company, L.P. | Computer method and apparatus for segmenting text streams |
US20030023437A1 (en) * | 2001-01-27 | 2003-01-30 | Pascale Fung | System and method for context-based spontaneous speech recognition |
US6925154B2 (en) * | 2001-05-04 | 2005-08-02 | International Business Machines Corproation | Methods and apparatus for conversational name dialing systems |
US20040083090A1 (en) * | 2002-10-17 | 2004-04-29 | Daniel Kiecza | Manager for integrating language technology components |
EP1599867B1 (en) * | 2003-03-01 | 2008-02-13 | Robert E. Coifman | Improving the transcription accuracy of speech recognition software |
WO2005050621A2 (en) * | 2003-11-21 | 2005-06-02 | Philips Intellectual Property & Standards Gmbh | Topic specific models for text formatting and speech recognition |
-
2005
- 2005-11-02 KR KR1020050104462A patent/KR100755677B1/ko active IP Right Grant
-
2006
- 2006-10-30 US US11/589,165 patent/US8301450B2/en not_active Expired - Fee Related
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20030008596A (ko) * | 2001-07-19 | 2003-01-29 | 한국전자통신연구원 | 주제어 인식이 가능한 음성인식시스템 및 방법 |
JP2004021207A (ja) | 2002-06-20 | 2004-01-22 | Nippon Hoso Kyokai <Nhk> | 音素認識方法、音素認識装置および音素認識プログラム |
KR20040069060A (ko) * | 2003-01-28 | 2004-08-04 | 삼성전자주식회사 | 양방향 n-그램 언어모델을 이용한 연속 음성인식방법 및장치 |
KR20050082249A (ko) * | 2004-02-18 | 2005-08-23 | 삼성전자주식회사 | 도메인 기반 대화 음성인식방법 및 장치 |
JP2005284209A (ja) | 2004-03-31 | 2005-10-13 | Kddi Corp | 音声認識方式 |
Also Published As
Publication number | Publication date |
---|---|
KR20070047579A (ko) | 2007-05-07 |
US8301450B2 (en) | 2012-10-30 |
US20070100618A1 (en) | 2007-05-03 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR100755677B1 (ko) | 주제 영역 검출을 이용한 대화체 음성 인식 장치 및 방법 | |
CN111933129B (zh) | 音频处理方法、语言模型的训练方法、装置及计算机设备 | |
US10923111B1 (en) | Speech detection and speech recognition | |
US9934777B1 (en) | Customized speech processing language models | |
US10176802B1 (en) | Lattice encoding using recurrent neural networks | |
Arora et al. | Automatic speech recognition: a review | |
JP4195428B2 (ja) | 多数の音声特徴を利用する音声認識 | |
KR100612839B1 (ko) | 도메인 기반 대화 음성인식방법 및 장치 | |
US20140207457A1 (en) | False alarm reduction in speech recognition systems using contextual information | |
US11158307B1 (en) | Alternate utterance generation | |
US11935525B1 (en) | Speech processing optimizations based on microphone array | |
KR20180038707A (ko) | 동적 가중치 값과 토픽 정보를 이용하는 음성인식 방법 | |
Nakagawa | A survey on automatic speech recognition | |
JP4700522B2 (ja) | 音声認識装置及び音声認識プログラム | |
Zhang et al. | Improved mandarin keyword spotting using confusion garbage model | |
KR100480790B1 (ko) | 양방향 n-그램 언어모델을 이용한 연속 음성인식방법 및장치 | |
Tabibian | A survey on structured discriminative spoken keyword spotting | |
US11688394B1 (en) | Entity language models for speech processing | |
KR101677530B1 (ko) | 음성 인식 장치 및 음성 인식 방법 | |
JP2009116075A (ja) | 音声認識装置 | |
Rebai et al. | Linto platform: A smart open voice assistant for business environments | |
US11328713B1 (en) | On-device contextual understanding | |
US11817090B1 (en) | Entity resolution using acoustic data | |
Kurian et al. | Automated Transcription System for MalayalamLanguage | |
CN112997247A (zh) | 利用大数据的最佳语言模型生成方法及用于其的装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A201 | Request for examination | ||
E902 | Notification of reason for refusal | ||
E902 | Notification of reason for refusal | ||
E701 | Decision to grant or registration of patent right | ||
GRNT | Written decision to grant | ||
FPAY | Annual fee payment |
Payment date: 20120730 Year of fee payment: 6 |
|
FPAY | Annual fee payment |
Payment date: 20130730 Year of fee payment: 7 |
|
FPAY | Annual fee payment |
Payment date: 20140730 Year of fee payment: 8 |
|
FPAY | Annual fee payment |
Payment date: 20150730 Year of fee payment: 9 |
|
FPAY | Annual fee payment |
Payment date: 20160728 Year of fee payment: 10 |
|
FPAY | Annual fee payment |
Payment date: 20170728 Year of fee payment: 11 |