KR20070047579A - 주제 영역 검출을 이용한 대화체 음성 인식 장치 및 방법 - Google Patents
주제 영역 검출을 이용한 대화체 음성 인식 장치 및 방법 Download PDFInfo
- Publication number
- KR20070047579A KR20070047579A KR1020050104462A KR20050104462A KR20070047579A KR 20070047579 A KR20070047579 A KR 20070047579A KR 1020050104462 A KR1020050104462 A KR 1020050104462A KR 20050104462 A KR20050104462 A KR 20050104462A KR 20070047579 A KR20070047579 A KR 20070047579A
- Authority
- KR
- South Korea
- Prior art keywords
- subject area
- subject
- word
- language model
- speech recognition
- Prior art date
Links
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/08—Speech classification or search
- G10L15/18—Speech classification or search using natural language modelling
- G10L15/1822—Parsing for meaning understanding
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/08—Speech classification or search
- G10L15/18—Speech classification or search using natural language modelling
- G10L15/1815—Semantic context, e.g. disambiguation of the recognition hypotheses based on word meaning
Landscapes
- Engineering & Computer Science (AREA)
- Artificial Intelligence (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Machine Translation (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
Description
Claims (14)
- 사전 구축된 글로벌 언어 모델 데이터베이스와 발음 사전 데이터베이스 및 음향 모델 데이터베이스를 참조하여, 입력 음성 신호로부터 검출된 특징 벡터와 유사한 단어열을 생성하는 전방향 탐색(Forward Search)을 수행하는 전방향 탐색부;상기 전방향 탐색의 결과 생성된 상기 단어열에 대한 정보를 이용하여 상기 단어열 내의 어휘들의 의미로부터 도출되는 주제 영역(Topic Domain)을 검출하는 주제 영역 검출부; 및상기 검출된 주제 영역에 관하여 사전 구축된 특정 주제 영역 언어모델 데이터베이스를 참조하여 상기 입력 음성 신호에 대한 음성 인식 결과를 텍스트로 출력하는 역방향 디코딩(Backward Decoding)을 수행하는 역방향 디코딩부를 포함하는, 주제 영역 검출을 이용한 대화체 음성 인식 장치.
- 제 1 항에 있어서,상기 역방향 디코딩부에 의해 출력된 텍스트의 주제 영역에 대한 정보와 상기 텍스트의 히스토리 정보를 포함하는 정보를 저장하고 관리하는 텍스트 정보 관리부를 더 포함하는, 주제 영역 검출을 이용한 대화체 음성 인식 장치.
- 제 2 항에 있어서,상기 주제 영역 검출부는,상기 단어열을 구성하는 단어들 중 주제 영역과 무관한 비핵심어를 제거하는 비핵심어 제거 모듈;상기 비핵심어가 제거된 단어열을 입력받아 상기 단어열 내의 어휘들로부터 각 주제 영역과의 거리를 산출하는 주제 영역 거리산출 모듈; 및상기 산출된 각 주제 영역과의 거리 중 최소 거리를 가지는 주제 영역을 검출하는 최소 거리 주제 영역 검출 모듈을 포함하는, 주제 영역 검출을 이용한 대화체 음성 인식 장치.
- 제 3 항에 있어서,상기 주제 영역 거리산출 모듈은,상기 텍스트 정보 관리부로부터 획득한 정보와 상기 각 주제 영역과의 거리 산출에 사용되는 확률 인자를 가지고 있는 확률 인자 데이터베이스로부터 획득한 정보를 참조하여 상기 거리를 산출하는, 주제 영역 검출을 이용한 대화체 음성 인식 장치.
- 제 4 항에 있어서,상기 확률 인자 데이터베이스는,상기 주제 영역 별로 미리 구축된 발성 가능한 텍스트 정보를 포함하는 훈련 코퍼스(Training Corpus)를 이용하여 생성되는, 주제 영역 검출을 이용한 대화체 음성 인식 장치.
- 제 4 항에 있어서,상기 주제영역 거리산출 모듈은,상기 확률 인자로 이루어진 하기의 <수학식>(여기서, 상기 Pr(Di|w1 wn)은 n 개의 단어들로부터 i 번째 주제 영역이 선택되는 확률, Pr(wj|Di)는 i 번째 주제 영역 Di가 선택된 상태에서 j 번째 주제 단어 wj 가 선택되는 확률, DFwj 는 상기 j 번째 주제 단어 wj 가 나타나는 주제 영역의 개수인 주제 영역 빈도수, wdomain 은 발화 문맥에 대한 가중치, 그리고, WFDi 는 상기 i 번째 주제 영역 Di 를 지지하는 주제 단어의 개수인 주제 단어 빈도수를 의미한다)에 의해 상기 거리를 산출하는, 주제 영역 검출을 이용한 대화체 음성 인식 장치.
- 제 2 항에 있어서,상기 역방향 디코딩부는,상기 특정주제 영역 언어모델 데이터베이스를 참조한 역방향 디코딩의 결과 상기 텍스트가 출력되지 못하는 경우에는, 상기 글로벌 언어 모델 데이터베이스를 참조하는 역방향 서브 디코딩을 더 수행하는, 주제 영역 검출을 이용한 대화체 음성 인식 장치.
- (a) 사전 구축된 글로벌 언어 모델 데이터베이스와 발음 사전 데이터베이스 및 음향 모델 데이터베이스를 참조하여, 입력 음성 신호로부터 검출된 특징 벡터와 유사한 단어열을 생성하는 전방향 탐색(Forward Search)을 수행하는 단계;(b) 상기 전방향 탐색의 결과 생성된 상기 단어열에 대한 정보를 이용하여 상기 단어열 내의 어휘들의 의미로부터 도출되는 주제 영역(Topic Domain)을 검출하는 단계; 및(c) 상기 검출된 주제 영역에 관하여 사전 구축된 특정 주제 영역 언어모델 데이터베이스를 참조하여, 상기 입력 음성 신호에 대한 음성 인식 결과를 텍스트로 출력하는 역방향 디코딩(Backward Decoding)을 수행하는 단계를 포함하는, 주제 영역 검출을 이용한 대화체 음성 인식 방법.
- 제 2 항에 있어서,상기 (b) 단계는,(b1) 상기 단어열을 구성하는 단어들 중 주제 영역과 무관한 비핵심어를 제거하는 단계;(b2) 상기 비핵심어가 제거된 단어열을 입력받아 상기 단어열 내의 어휘들로부터 각 주제 영역과의 거리를 산출하는 단계; 및(b3) 상기 산출된 각 주제 영역과의 거리 중 최소 거리를 가지는 주제 영역을 검출하는 단계를 포함하는, 주제 영역 검출을 이용한 대화체 음성 인식 방법.
- 제 9 항에 있어서,상기 (b2) 단계는,상기 역방향 디코딩 결과 출력된 텍스트로부터 획득한 정보와 상기 각 주제 영역과의 거리 산출에 사용되는 확률 인자를 가지고 있는 확률 인자 데이터베이스로부터 획득한 정보를 참조하여 상기 거리를 산출하는 단계를 포함하는, 주제 영역 검출을 이용한 대화체 음성 인식 방법.
- 제 10 항에 있어서,상기 확률 인자 데이터베이스는,상기 주제 영역 별로 미리 구축된 발성 가능한 텍스트 정보를 포함하는 훈련 코퍼스(Training Corpus)를 이용하여 생성되는, 주제 영역 검출을 이용한 대화체 음성 인식 방법.
- 제 10 항에 있어서,상기 (b2) 단계는,상기 확률 인자로 이루어진 하기의 <수학식>(여기서, 상기 Pr(Di|w1 wn)은 n 개의 단어들로부터 i 번째 주제 영역이 선택되는 확률, Pr(wj|Di)는 i 번째 주제 영역 Di가 선택된 상태에서 j 번째 주제 단어 wj 가 선택되는 확률, DFwj 는 상기 j 번째 주제 단어 wj 가 나타나는 주제 영역의 개수인 주제 영역 빈도수, wdomain 은 발화 문맥에 대한 가중치, 그리고, WFDi 는 상기 i 번째 주제 영역 Di 를 지지하는 주제 단어의 개수인 주제 단어 빈도수를 의미한다)에 의해 상기 거리를 산출하는 단계를 포함하는, 주제 영역 검출을 이용한 대화체 음성 인식 방법.
- 제 10 항에 있어서,상기 (c) 단계는,상기 특정주제 영역 언어모델 데이터베이스를 참조한 역방향 디코딩의 결과 상기 텍스트가 출력되지 못하는 경우에는, 상기 글로벌 언어 모델 데이터베이스를 참조하는 역방향 서브 디코딩을 더 수행하는 단계를 포함하는, 주제 영역 검출을 이용한 대화체 음성 인식 방법.
- 제 8 항 내지 제 13 항 중 어느 한 항의 방법을 컴퓨터에서 실행하기 위한 프로그램 코드를 기록한 컴퓨터로 읽을 수 있는 기록 매체.
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020050104462A KR100755677B1 (ko) | 2005-11-02 | 2005-11-02 | 주제 영역 검출을 이용한 대화체 음성 인식 장치 및 방법 |
US11/589,165 US8301450B2 (en) | 2005-11-02 | 2006-10-30 | Apparatus, method, and medium for dialogue speech recognition using topic domain detection |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020050104462A KR100755677B1 (ko) | 2005-11-02 | 2005-11-02 | 주제 영역 검출을 이용한 대화체 음성 인식 장치 및 방법 |
Publications (2)
Publication Number | Publication Date |
---|---|
KR20070047579A true KR20070047579A (ko) | 2007-05-07 |
KR100755677B1 KR100755677B1 (ko) | 2007-09-05 |
Family
ID=37997631
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020050104462A KR100755677B1 (ko) | 2005-11-02 | 2005-11-02 | 주제 영역 검출을 이용한 대화체 음성 인식 장치 및 방법 |
Country Status (2)
Country | Link |
---|---|
US (1) | US8301450B2 (ko) |
KR (1) | KR100755677B1 (ko) |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20120088792A (ko) * | 2009-10-30 | 2012-08-08 | 라쿠텐 인코포레이티드 | 특유 콘텐츠 판정 장치, 특유 콘텐츠 판정 방법, 기록 매체, 콘텐츠 생성 장치 및 관련 콘텐츠 삽입 장치 |
KR20150001191A (ko) * | 2013-06-26 | 2015-01-06 | 한국전자통신연구원 | 연속어 음성 인식 장치 및 방법 |
KR102030551B1 (ko) * | 2018-07-09 | 2019-10-10 | 주식회사 한글과컴퓨터 | 인스턴트 메신저 구동 장치 및 그 동작 방법 |
US10614134B2 (en) | 2009-10-30 | 2020-04-07 | Rakuten, Inc. | Characteristic content determination device, characteristic content determination method, and recording medium |
Families Citing this family (72)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2007271876A (ja) * | 2006-03-31 | 2007-10-18 | Denso Corp | 音声認識装置および音声認識用のプログラム |
JP4188989B2 (ja) * | 2006-09-15 | 2008-12-03 | 本田技研工業株式会社 | 音声認識装置、音声認識方法、及び音声認識プログラム |
US7788095B2 (en) * | 2007-11-18 | 2010-08-31 | Nice Systems, Ltd. | Method and apparatus for fast search in call-center monitoring |
JP5327054B2 (ja) * | 2007-12-18 | 2013-10-30 | 日本電気株式会社 | 発音変動規則抽出装置、発音変動規則抽出方法、および発音変動規則抽出用プログラム |
WO2009081861A1 (ja) * | 2007-12-21 | 2009-07-02 | Nec Corporation | 単語カテゴリ推定装置、単語カテゴリ推定方法、音声認識装置、音声認識方法、プログラム、および記録媒体 |
KR101149521B1 (ko) * | 2008-12-10 | 2012-05-25 | 한국전자통신연구원 | 도메인 온톨로지를 이용한 음성 인식 방법 및 그 장치 |
US8447608B1 (en) * | 2008-12-10 | 2013-05-21 | Adobe Systems Incorporated | Custom language models for audio content |
US20110004473A1 (en) * | 2009-07-06 | 2011-01-06 | Nice Systems Ltd. | Apparatus and method for enhanced speech recognition |
KR101597289B1 (ko) * | 2009-07-31 | 2016-03-08 | 삼성전자주식회사 | 동적 화면에 따라 음성을 인식하는 장치 및 방법 |
US8589163B2 (en) * | 2009-12-04 | 2013-11-19 | At&T Intellectual Property I, L.P. | Adapting language models with a bit mask for a subset of related words |
CN103038764A (zh) * | 2010-04-14 | 2013-04-10 | 惠普发展公司,有限责任合伙企业 | 用于关键字提取的方法 |
KR101699720B1 (ko) * | 2010-08-03 | 2017-01-26 | 삼성전자주식회사 | 음성명령 인식 장치 및 음성명령 인식 방법 |
DE102010040553A1 (de) * | 2010-09-10 | 2012-03-15 | Siemens Aktiengesellschaft | Spracherkennungsverfahren |
US8812321B2 (en) * | 2010-09-30 | 2014-08-19 | At&T Intellectual Property I, L.P. | System and method for combining speech recognition outputs from a plurality of domain-specific speech recognizers via machine learning |
US9202465B2 (en) * | 2011-03-25 | 2015-12-01 | General Motors Llc | Speech recognition dependent on text message content |
US9679561B2 (en) * | 2011-03-28 | 2017-06-13 | Nuance Communications, Inc. | System and method for rapid customization of speech recognition models |
WO2013056343A1 (en) * | 2011-09-30 | 2013-04-25 | Ming Li | System, method and computer program for correcting speech recognition information |
US9324323B1 (en) * | 2012-01-13 | 2016-04-26 | Google Inc. | Speech recognition using topic-specific language models |
US8775177B1 (en) | 2012-03-08 | 2014-07-08 | Google Inc. | Speech recognition process |
US9053708B2 (en) * | 2012-07-18 | 2015-06-09 | International Business Machines Corporation | System, method and program product for providing automatic speech recognition (ASR) in a shared resource environment |
US9424233B2 (en) * | 2012-07-20 | 2016-08-23 | Veveo, Inc. | Method of and system for inferring user intent in search input in a conversational interaction system |
US9697821B2 (en) * | 2013-01-29 | 2017-07-04 | Tencent Technology (Shenzhen) Company Limited | Method and system for building a topic specific language model for use in automatic speech recognition |
US9727619B1 (en) | 2013-05-02 | 2017-08-08 | Intelligent Language, LLC | Automated search |
US10121493B2 (en) | 2013-05-07 | 2018-11-06 | Veveo, Inc. | Method of and system for real time feedback in an incremental speech input interface |
US10643616B1 (en) * | 2014-03-11 | 2020-05-05 | Nvoq Incorporated | Apparatus and methods for dynamically changing a speech resource based on recognized text |
US9812130B1 (en) * | 2014-03-11 | 2017-11-07 | Nvoq Incorporated | Apparatus and methods for dynamically changing a language model based on recognized text |
US9286892B2 (en) | 2014-04-01 | 2016-03-15 | Google Inc. | Language modeling in speech recognition |
CN103942191B (zh) * | 2014-04-25 | 2018-04-27 | 中国科学院自动化研究所 | 一种基于内容的恐怖文本识别方法 |
US9971765B2 (en) * | 2014-05-13 | 2018-05-15 | Nuance Communications, Inc. | Revising language model scores based on semantic class hypotheses |
US9721564B2 (en) * | 2014-07-31 | 2017-08-01 | Rovi Guides, Inc. | Systems and methods for performing ASR in the presence of heterographs |
US20160171122A1 (en) * | 2014-12-10 | 2016-06-16 | Ford Global Technologies, Llc | Multimodal search response |
US9852136B2 (en) | 2014-12-23 | 2017-12-26 | Rovi Guides, Inc. | Systems and methods for determining whether a negation statement applies to a current or past query |
US10582046B2 (en) * | 2014-12-30 | 2020-03-03 | Harman International Industries, Incorporated | Voice recognition-based dialing |
US9854049B2 (en) | 2015-01-30 | 2017-12-26 | Rovi Guides, Inc. | Systems and methods for resolving ambiguous terms in social chatter based on a user profile |
US20180190266A1 (en) * | 2015-02-03 | 2018-07-05 | Dolby Laboratories Licensing Corporation | Conference word cloud |
US9953648B2 (en) * | 2015-05-11 | 2018-04-24 | Samsung Electronics Co., Ltd. | Electronic device and method for controlling the same |
KR102413067B1 (ko) * | 2015-07-28 | 2022-06-24 | 삼성전자주식회사 | 문법 모델을 갱신하고, 문법 모델에 기초하여 음성 인식을 수행하는 방법 및 디바이스 |
US9858923B2 (en) * | 2015-09-24 | 2018-01-02 | Intel Corporation | Dynamic adaptation of language models and semantic tracking for automatic speech recognition |
US10896681B2 (en) * | 2015-12-29 | 2021-01-19 | Google Llc | Speech recognition with selective use of dynamic language models |
US10049666B2 (en) * | 2016-01-06 | 2018-08-14 | Google Llc | Voice recognition system |
WO2017210613A1 (en) * | 2016-06-03 | 2017-12-07 | Maluuba Inc. | Natural language generation in a spoken dialogue system |
CN105957516B (zh) * | 2016-06-16 | 2019-03-08 | 百度在线网络技术(北京)有限公司 | 多语音识别模型切换方法及装置 |
US10387888B2 (en) | 2016-07-08 | 2019-08-20 | Asapp, Inc. | Assisting entities in responding to a request of a user |
US10083451B2 (en) | 2016-07-08 | 2018-09-25 | Asapp, Inc. | Using semantic processing for customer support |
JP2018054850A (ja) * | 2016-09-28 | 2018-04-05 | 株式会社東芝 | 情報処理システム、情報処理装置、情報処理方法、及びプログラム |
US10650311B2 (en) | 2016-12-19 | 2020-05-12 | Asaap, Inc. | Suggesting resources using context hashing |
US10109275B2 (en) | 2016-12-19 | 2018-10-23 | Asapp, Inc. | Word hash language model |
US10268680B2 (en) * | 2016-12-30 | 2019-04-23 | Google Llc | Context-aware human-to-computer dialog |
CN107358143A (zh) * | 2017-05-17 | 2017-11-17 | 广州视源电子科技股份有限公司 | 前向搜索模型集成方法、装置、存储设备和人脸识别系统 |
US10762423B2 (en) | 2017-06-27 | 2020-09-01 | Asapp, Inc. | Using a neural network to optimize processing of user requests |
CN107423398B (zh) * | 2017-07-26 | 2023-04-18 | 腾讯科技(上海)有限公司 | 交互方法、装置、存储介质和计算机设备 |
US10497004B2 (en) | 2017-12-08 | 2019-12-03 | Asapp, Inc. | Automating communications using an intent classifier |
US10489792B2 (en) | 2018-01-05 | 2019-11-26 | Asapp, Inc. | Maintaining quality of customer support messages |
US10210244B1 (en) | 2018-02-12 | 2019-02-19 | Asapp, Inc. | Updating natural language interfaces by processing usage data |
US10169315B1 (en) | 2018-04-27 | 2019-01-01 | Asapp, Inc. | Removing personal information from text using a neural network |
US11216510B2 (en) | 2018-08-03 | 2022-01-04 | Asapp, Inc. | Processing an incomplete message with a neural network to generate suggested messages |
CN109284397A (zh) * | 2018-09-27 | 2019-01-29 | 深圳大学 | 一种领域词典的构建方法、装置、设备及存储介质 |
EP3640834A1 (en) | 2018-10-17 | 2020-04-22 | Verint Americas Inc. | Automatic discovery of business-specific terminology |
US11551004B2 (en) | 2018-11-13 | 2023-01-10 | Asapp, Inc. | Intent discovery with a prototype classifier |
US10747957B2 (en) | 2018-11-13 | 2020-08-18 | Asapp, Inc. | Processing communications using a prototype classifier |
US11043214B1 (en) * | 2018-11-29 | 2021-06-22 | Amazon Technologies, Inc. | Speech recognition using dialog history |
US11935539B1 (en) * | 2019-01-31 | 2024-03-19 | Alan AI, Inc. | Integrating voice controls into applications |
US11955120B1 (en) | 2019-01-31 | 2024-04-09 | Alan AI, Inc. | Systems and methods for integrating voice controls into applications |
US11301629B2 (en) * | 2019-08-21 | 2022-04-12 | International Business Machines Corporation | Interleaved conversation concept flow enhancement |
US11425064B2 (en) | 2019-10-25 | 2022-08-23 | Asapp, Inc. | Customized message suggestion with user embedding vectors |
CN111159403B (zh) * | 2019-12-27 | 2022-07-29 | 广东高乐教育科技有限公司 | 一种智能课堂感知的方法及系统 |
CN111785254B (zh) * | 2020-07-24 | 2023-04-07 | 四川大学华西医院 | 基于模拟人的自助化bls培训与考核系统 |
CN111916089B (zh) * | 2020-07-27 | 2022-11-04 | 南京信息工程大学 | 基于声信号特征分析的冰雹检测方法和装置 |
CN112951210A (zh) * | 2021-02-02 | 2021-06-11 | 虫洞创新平台(深圳)有限公司 | 语音识别方法及装置、设备、计算机可读存储介质 |
CN112908339B (zh) * | 2021-03-18 | 2022-11-04 | 龙马智芯(珠海横琴)科技有限公司 | 一种会议环节定位方法、装置、定位设备及可读存储介质 |
CN113539246B (zh) * | 2021-08-20 | 2022-10-18 | 贝壳找房(北京)科技有限公司 | 语音识别方法和装置 |
CN114663042B (zh) * | 2022-02-11 | 2023-04-21 | 北京斗米优聘科技发展有限公司 | 一种智能电话呼叫招聘方法、装置、电子设备及存储介质 |
Family Cites Families (22)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
DE69423838T2 (de) * | 1993-09-23 | 2000-08-03 | Xerox Corp | Semantische Gleichereignisfilterung für Spracherkennung und Signalübersetzungsanwendungen |
JP3647518B2 (ja) * | 1994-10-06 | 2005-05-11 | ゼロックス コーポレイション | コード化したワードトークンを使用して文書画像をハイライトで強調する装置 |
US5787230A (en) * | 1994-12-09 | 1998-07-28 | Lee; Lin-Shan | System and method of intelligent Mandarin speech input for Chinese computers |
US5887120A (en) * | 1995-05-31 | 1999-03-23 | Oracle Corporation | Method and apparatus for determining theme for discourse |
US6185531B1 (en) * | 1997-01-09 | 2001-02-06 | Gte Internetworking Incorporated | Topic indexing method |
US6052657A (en) * | 1997-09-09 | 2000-04-18 | Dragon Systems, Inc. | Text segmentation and identification of topic using language models |
US6104989A (en) * | 1998-07-29 | 2000-08-15 | International Business Machines Corporation | Real time detection of topical changes and topic identification via likelihood based methods |
US6324510B1 (en) * | 1998-11-06 | 2001-11-27 | Lernout & Hauspie Speech Products N.V. | Method and apparatus of hierarchically organizing an acoustic model for speech recognition and adaptation of the model to unseen domains |
US6631351B1 (en) * | 1999-09-14 | 2003-10-07 | Aidentity Matrix | Smart toys |
US7401023B1 (en) * | 2000-09-06 | 2008-07-15 | Verizon Corporate Services Group Inc. | Systems and methods for providing automated directory assistance using transcripts |
ATE297588T1 (de) * | 2000-11-14 | 2005-06-15 | Ibm | Anpassung des phonetischen kontextes zur verbesserung der spracherkennung |
US6772120B1 (en) * | 2000-11-21 | 2004-08-03 | Hewlett-Packard Development Company, L.P. | Computer method and apparatus for segmenting text streams |
US20030023437A1 (en) * | 2001-01-27 | 2003-01-30 | Pascale Fung | System and method for context-based spontaneous speech recognition |
US6925154B2 (en) * | 2001-05-04 | 2005-08-02 | International Business Machines Corproation | Methods and apparatus for conversational name dialing systems |
KR100423460B1 (ko) * | 2001-07-19 | 2004-03-18 | 한국전자통신연구원 | 주제어 인식이 가능한 음성인식시스템 및 방법 |
JP2004021207A (ja) | 2002-06-20 | 2004-01-22 | Nippon Hoso Kyokai <Nhk> | 音素認識方法、音素認識装置および音素認識プログラム |
US20040176946A1 (en) * | 2002-10-17 | 2004-09-09 | Jayadev Billa | Pronunciation symbols based on the orthographic lexicon of a language |
KR100480790B1 (ko) * | 2003-01-28 | 2005-04-06 | 삼성전자주식회사 | 양방향 n-그램 언어모델을 이용한 연속 음성인식방법 및장치 |
DE602004011753T2 (de) * | 2003-03-01 | 2009-02-05 | Coifman, Robert E. | Verfahren und Vorrichtung zum Verbessern der Transkriptionsgenauigkeit bei der Spracherkennung |
WO2005050621A2 (en) * | 2003-11-21 | 2005-06-02 | Philips Intellectual Property & Standards Gmbh | Topic specific models for text formatting and speech recognition |
KR100612839B1 (ko) * | 2004-02-18 | 2006-08-18 | 삼성전자주식회사 | 도메인 기반 대화 음성인식방법 및 장치 |
JP2005284209A (ja) | 2004-03-31 | 2005-10-13 | Kddi Corp | 音声認識方式 |
-
2005
- 2005-11-02 KR KR1020050104462A patent/KR100755677B1/ko active IP Right Grant
-
2006
- 2006-10-30 US US11/589,165 patent/US8301450B2/en not_active Expired - Fee Related
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20120088792A (ko) * | 2009-10-30 | 2012-08-08 | 라쿠텐 인코포레이티드 | 특유 콘텐츠 판정 장치, 특유 콘텐츠 판정 방법, 기록 매체, 콘텐츠 생성 장치 및 관련 콘텐츠 삽입 장치 |
US10614134B2 (en) | 2009-10-30 | 2020-04-07 | Rakuten, Inc. | Characteristic content determination device, characteristic content determination method, and recording medium |
KR20150001191A (ko) * | 2013-06-26 | 2015-01-06 | 한국전자통신연구원 | 연속어 음성 인식 장치 및 방법 |
KR102030551B1 (ko) * | 2018-07-09 | 2019-10-10 | 주식회사 한글과컴퓨터 | 인스턴트 메신저 구동 장치 및 그 동작 방법 |
Also Published As
Publication number | Publication date |
---|---|
KR100755677B1 (ko) | 2007-09-05 |
US8301450B2 (en) | 2012-10-30 |
US20070100618A1 (en) | 2007-05-03 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR100755677B1 (ko) | 주제 영역 검출을 이용한 대화체 음성 인식 장치 및 방법 | |
Xiong | Fundamentals of speech recognition | |
CN111933129B (zh) | 音频处理方法、语言模型的训练方法、装置及计算机设备 | |
US10176802B1 (en) | Lattice encoding using recurrent neural networks | |
US9934777B1 (en) | Customized speech processing language models | |
US10923111B1 (en) | Speech detection and speech recognition | |
KR100612839B1 (ko) | 도메인 기반 대화 음성인식방법 및 장치 | |
JP4195428B2 (ja) | 多数の音声特徴を利用する音声認識 | |
Arora et al. | Automatic speech recognition: a review | |
US11158307B1 (en) | Alternate utterance generation | |
US11935525B1 (en) | Speech processing optimizations based on microphone array | |
KR20180038707A (ko) | 동적 가중치 값과 토픽 정보를 이용하는 음성인식 방법 | |
Nakagawa | A survey on automatic speech recognition | |
JP4700522B2 (ja) | 音声認識装置及び音声認識プログラム | |
Zhang et al. | Improved mandarin keyword spotting using confusion garbage model | |
KR100480790B1 (ko) | 양방향 n-그램 언어모델을 이용한 연속 음성인식방법 및장치 | |
JP2009116075A (ja) | 音声認識装置 | |
KR101677530B1 (ko) | 음성 인식 장치 및 음성 인식 방법 | |
Rebai et al. | LinTO Platform: A Smart Open Voice Assistant for Business Environments | |
Tabibian | A survey on structured discriminative spoken keyword spotting | |
US11328713B1 (en) | On-device contextual understanding | |
US11817090B1 (en) | Entity resolution using acoustic data | |
Kurian et al. | Automated Transcription System for MalayalamLanguage | |
Khalifa et al. | Statistical modeling for speech recognition | |
CN112997247A (zh) | 利用大数据的最佳语言模型生成方法及用于其的装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A201 | Request for examination | ||
E902 | Notification of reason for refusal | ||
E902 | Notification of reason for refusal | ||
E701 | Decision to grant or registration of patent right | ||
GRNT | Written decision to grant | ||
FPAY | Annual fee payment |
Payment date: 20120730 Year of fee payment: 6 |
|
FPAY | Annual fee payment |
Payment date: 20130730 Year of fee payment: 7 |
|
FPAY | Annual fee payment |
Payment date: 20140730 Year of fee payment: 8 |
|
FPAY | Annual fee payment |
Payment date: 20150730 Year of fee payment: 9 |
|
FPAY | Annual fee payment |
Payment date: 20160728 Year of fee payment: 10 |
|
FPAY | Annual fee payment |
Payment date: 20170728 Year of fee payment: 11 |