JP6507316B2 - 外部データソースを用いた音声の再認識 - Google Patents
外部データソースを用いた音声の再認識 Download PDFInfo
- Publication number
- JP6507316B2 JP6507316B2 JP2018524838A JP2018524838A JP6507316B2 JP 6507316 B2 JP6507316 B2 JP 6507316B2 JP 2018524838 A JP2018524838 A JP 2018524838A JP 2018524838 A JP2018524838 A JP 2018524838A JP 6507316 B2 JP6507316 B2 JP 6507316B2
- Authority
- JP
- Japan
- Prior art keywords
- transcription
- generating
- candidate transcription
- automatic speech
- speech recognizer
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/28—Constructional details of speech recognition systems
- G10L15/32—Multiple recognisers used in sequence or in parallel; Score combination systems therefor, e.g. voting systems
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/08—Speech classification or search
- G10L15/18—Speech classification or search using natural language modelling
- G10L15/183—Speech classification or search using natural language modelling using context dependencies, e.g. language models
- G10L15/187—Phonemic context, e.g. pronunciation rules, phonotactical constraints or phoneme n-grams
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/08—Speech classification or search
- G10L15/18—Speech classification or search using natural language modelling
- G10L15/183—Speech classification or search using natural language modelling using context dependencies, e.g. language models
- G10L15/19—Grammatical context, e.g. disambiguation of the recognition hypotheses based on word sequence rules
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/02—Feature extraction for speech recognition; Selection of recognition unit
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/08—Speech classification or search
- G10L15/18—Speech classification or search using natural language modelling
- G10L15/183—Speech classification or search using natural language modelling using context dependencies, e.g. language models
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/26—Speech to text systems
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/48—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use
- G10L25/51—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for comparison or discrimination
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/02—Feature extraction for speech recognition; Selection of recognition unit
- G10L2015/025—Phonemes, fenemes or fenones being the recognition units
Description
110 自動音声認識器
112 音響モデル
114 言語モデル
120 言語モデル
130 音素展開器
140 再スコア決定器
302 プロセッサ
304 メモリ
306 ストレージデバイス
308 高速インターフェース
310 高速拡張ポート
312 低速インターフェース
314 低速拡張ポート
316 ディスプレイ
320 標準サーバ
322 ラップトップコンピュータ
324 ラックサーバシステム
350 デバイス
352 プロセッサ
354 ディスプレイ
356 ディスプレイインターフェース
358 制御インターフェース
360 オーディオコーデック
362 外部インターフェース
364 メモリ
366 通信インターフェース
368 トランシーバ
370 受信機モジュール
372 拡張インターフェース
374 拡張メモリ
380 セルラ電話
382 スマートフォン
Claims (20)
- コンピュータによって実施される方法であって、
自動音声認識器を使用して発話の初期候補トランスクリプションを取得するステップと、
前記初期候補トランスクリプションを生成する際に前記自動音声認識器によって使用されていない言語モデルに基づいて、前記初期候補トランスクリプションに出現する1つまたは複数のタームと音素的に類似している1つまたは複数のタームを識別するステップと、
前記識別した1つまたは複数のタームに基づいて1つまたは複数の追加の候補トランスクリプションを生成するステップと、
前記候補トランスクリプションからトランスクリプションを選択するステップと
を含む、方法。 - 前記初期候補トランスクリプションを生成する際に前記自動音声認識器によって使用されていない前記言語モデルは、前記初期候補トランスクリプションを生成する際に前記自動音声認識器によって使用される言語モデルにはない1つまたは複数のタームを含む、請求項1に記載の方法。
- 前記初期候補トランスクリプションを生成する際に前記自動音声認識器によって使用されていない前記言語モデルと前記初期候補トランスクリプションを生成する際に前記自動音声認識器によって使用される言語モデルとの両方は、1つまたは複数のタームの配列を含むが、出現について異なる尤度を有するような前記配列を示す、請求項1または請求項2に記載の方法。
- 前記初期候補トランスクリプションを生成する際に前記自動音声認識器によって使用されていない前記言語モデルは、ワードまたはワードの配列が出現する尤度を示す、請求項1から3のいずれか一項に記載の方法。
- 前記候補トランスクリプションの各々について、どれくらいの頻度で前記候補トランスクリプションが話される見込みがあるかを反映する尤度スコアを決定するステップと、
前記候補トランスクリプションの各々について、前記候補トランスクリプションと前記発話との間の音素類似度を反映する音響一致スコアを決定するステップとを含み、
前記候補トランスクリプションから前記トランスクリプションを選択するステップは、前記音響一致スコアおよび前記尤度スコアに基づく、請求項1から4のいずれか一項に記載の方法。 - 前記候補トランスクリプションと前記発話との間の音素類似度を反映する音響一致スコアを決定するステップは、
サブワード音響一致スコアを前記自動音声認識器から取得するステップと、
前記候補トランスクリプションと一致する前記サブワード音響一致スコアのサブセットを識別するステップと、
前記候補トランスクリプションと一致する前記サブワード音響一致スコアの前記サブセットに基づいて前記音響一致スコアを生成するステップとを含む、請求項5に記載の方法。 - どれくらいの頻度で前記候補トランスクリプションが話される見込みがあるかを反映する尤度スコアを決定するステップは、
前記初期候補トランスクリプションを生成する際に前記自動音声認識器によって使用されていない前記言語モデルに基づいて前記尤度スコアを決定するステップを含む、請求項5または請求項6に記載の方法。 - 前記識別した1つまたは複数のタームに基づいて1つまたは複数の追加の候補トランスクリプションを生成するステップは、
前記初期候補トランスクリプションに出現する1つまたは複数のタームと音素的に類似している前記識別した1つまたは複数のタームで前記初期候補トランスクリプションに出現する前記1つまたは複数のタームを置換するステップを含む、請求項1から7のいずれか一項に記載の方法。 - システムであって、
1つまたは複数のコンピュータと、1つまたは複数のストレージデバイスとを含み、前記1つまたは複数のストレージデバイスは、前記1つまたは複数のコンピュータによって実行されると、前記1つまたは複数のコンピュータに、
自動音声認識器を使用して発話の初期候補トランスクリプションを取得するステップと、
前記初期候補トランスクリプションを生成する際に前記自動音声認識器によって使用されていない言語モデルに基づいて、前記初期候補トランスクリプションに出現する1つまたは複数のタームと音素的に類似している1つまたは複数のタームを識別するステップと、
前記識別した1つまたは複数のタームに基づいて1つまたは複数の追加の候補トランスクリプションを生成するステップと、
前記候補トランスクリプションからトランスクリプションを選択するステップと
を含む動作を行わせるように動作可能な命令を記憶する、システム。 - 前記初期候補トランスクリプションを生成する際に前記自動音声認識器によって使用されていない前記言語モデルは、前記初期候補トランスクリプションを生成する際に前記自動音声認識器によって使用される言語モデルにはない1つまたは複数のタームを含む、請求項9に記載のシステム。
- 前記初期候補トランスクリプションを生成する際に前記自動音声認識器によって使用されていない前記言語モデルと前記初期候補トランスクリプションを生成する際に前記自動音声認識器によって使用される言語モデルとの両方は、1つまたは複数のタームの配列を含むが、出現について異なる尤度を有するような前記配列を示す、請求項9または請求項10に記載のシステム。
- 前記初期候補トランスクリプションを生成する際に前記自動音声認識器によって使用されていない前記言語モデルは、ワードまたはワードの配列が出現する尤度を示す、請求項9から11のいずれか一項に記載のシステム。
- 前記候補トランスクリプションの各々について、どれくらいの頻度で前記候補トランスクリプションが話される見込みがあるかを反映する尤度スコアを決定するステップと、
前記候補トランスクリプションの各々について、前記候補トランスクリプションと前記発話との間の音素類似度を反映する音響一致スコアを決定するステップとを含み、
前記候補トランスクリプションから前記トランスクリプションを選択するステップは、前記音響一致スコアおよび前記尤度スコアに基づく、請求項9から12のいずれか一項に記載のシステム。 - 前記候補トランスクリプションと前記発話との間の音素類似度を反映する音響一致スコアを決定するステップは、
サブワード音響一致スコアを前記自動音声認識器から取得するステップと、
前記候補トランスクリプションと一致する前記サブワード音響一致スコアのサブセットを識別するステップと、
前記候補トランスクリプションと一致する前記サブワード音響一致スコアの前記サブセットに基づいて前記音響一致スコアを生成するステップとを含む、請求項13に記載のシステム。 - どれくらいの頻度で前記候補トランスクリプションが話される見込みがあるかを反映する尤度スコアを決定するステップは、
前記初期候補トランスクリプションを生成する際に前記自動音声認識器によって使用されていない前記言語モデルに基づいて前記尤度スコアを決定するステップを含む、請求項13または請求項14に記載のシステム。 - 前記識別した1つまたは複数のタームに基づいて1つまたは複数の追加の候補トランスクリプションを生成するステップは、
前記初期候補トランスクリプションに出現する1つまたは複数のタームと音素的に類似している前記識別した1つまたは複数のタームで前記初期候補トランスクリプションに出現する前記1つまたは複数のタームを置換するステップを含む、請求項9から15のいずれか一項に記載のシステム。 - 1つまたは複数のコンピュータによって実行可能な命令を含むソフトウェアを記憶する非一時的コンピュータ可読媒体であって、前記命令は、その実行時に、前記1つまたは複数のコンピュータに、
自動音声認識器を使用して発話の初期候補トランスクリプションを取得するステップと、
前記初期候補トランスクリプションを生成する際に前記自動音声認識器によって使用されていない言語モデルに基づいて、前記初期候補トランスクリプションに出現する1つまたは複数のタームと音素的に類似している1つまたは複数のタームを識別するステップと、
前記識別した1つまたは複数のタームに基づいて1つまたは複数の追加の候補トランスクリプションを生成するステップと、
前記候補トランスクリプションからトランスクリプションを選択するステップとを含む動作を行わせる、媒体。 - 前記初期候補トランスクリプションを生成する際に前記自動音声認識器によって使用されていない前記言語モデルは、前記初期候補トランスクリプションを生成する際に前記自動音声認識器によって使用される言語モデルにはない1つまたは複数のタームを含む、請求項17に記載の媒体。
- 前記初期候補トランスクリプションを生成する際に前記自動音声認識器によって使用されていない前記言語モデルと前記初期候補トランスクリプションを生成する際に前記自動音声認識器によって使用される言語モデルとの両方は、1つまたは複数のタームの配列を含むが、出現について異なる尤度を有するような前記配列を示す、請求項17に記載の媒体。
- 前記初期候補トランスクリプションを生成する際に前記自動音声認識器によって使用されていない前記言語モデルは、ワードまたはワードの配列が出現する尤度を示す、請求項17に記載の媒体。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US15/016,609 US20170229124A1 (en) | 2016-02-05 | 2016-02-05 | Re-recognizing speech with external data sources |
US15/016,609 | 2016-02-05 | ||
PCT/US2016/062753 WO2017136016A1 (en) | 2016-02-05 | 2016-11-18 | Re-recognizing speech with external data sources |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2019507362A JP2019507362A (ja) | 2019-03-14 |
JP6507316B2 true JP6507316B2 (ja) | 2019-04-24 |
Family
ID=57530835
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2018524838A Active JP6507316B2 (ja) | 2016-02-05 | 2016-11-18 | 外部データソースを用いた音声の再認識 |
Country Status (8)
Country | Link |
---|---|
US (2) | US20170229124A1 (ja) |
EP (1) | EP3360129B1 (ja) |
JP (1) | JP6507316B2 (ja) |
KR (1) | KR102115541B1 (ja) |
CN (1) | CN107045871B (ja) |
DE (2) | DE102016125954A1 (ja) |
RU (1) | RU2688277C1 (ja) |
WO (1) | WO2017136016A1 (ja) |
Families Citing this family (14)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105957516B (zh) * | 2016-06-16 | 2019-03-08 | 百度在线网络技术(北京)有限公司 | 多语音识别模型切换方法及装置 |
CN106297797B (zh) | 2016-07-26 | 2019-05-31 | 百度在线网络技术(北京)有限公司 | 语音识别结果纠错方法和装置 |
US10650803B2 (en) * | 2017-10-10 | 2020-05-12 | International Business Machines Corporation | Mapping between speech signal and transcript |
KR102449181B1 (ko) * | 2017-11-24 | 2022-09-29 | 삼성전자 주식회사 | 전자장치 및 그 제어방법 |
JP6763527B2 (ja) * | 2018-08-24 | 2020-09-30 | ソプラ株式会社 | 認識結果補正装置、認識結果補正方法、およびプログラム |
KR20200059703A (ko) | 2018-11-21 | 2020-05-29 | 삼성전자주식회사 | 음성 인식 방법 및 음성 인식 장치 |
US10978069B1 (en) * | 2019-03-18 | 2021-04-13 | Amazon Technologies, Inc. | Word selection for natural language interface |
WO2020226948A1 (en) * | 2019-05-03 | 2020-11-12 | Google Llc | Phoneme-based contextualization for cross-lingual speech recognition in end-to-end models |
US11189264B2 (en) * | 2019-07-08 | 2021-11-30 | Google Llc | Speech recognition hypothesis generation according to previous occurrences of hypotheses terms and/or contextual data |
KR20210016767A (ko) | 2019-08-05 | 2021-02-17 | 삼성전자주식회사 | 음성 인식 방법 및 음성 인식 장치 |
AU2020378208A1 (en) * | 2019-11-08 | 2022-05-19 | Vail Systems, Inc. | System and method for disambiguation and error resolution in call transcripts |
CN111326144B (zh) * | 2020-02-28 | 2023-03-03 | 网易(杭州)网络有限公司 | 语音数据处理方法、装置、介质和计算设备 |
US11580959B2 (en) | 2020-09-28 | 2023-02-14 | International Business Machines Corporation | Improving speech recognition transcriptions |
US20220101835A1 (en) * | 2020-09-28 | 2022-03-31 | International Business Machines Corporation | Speech recognition transcriptions |
Family Cites Families (44)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5233681A (en) * | 1992-04-24 | 1993-08-03 | International Business Machines Corporation | Context-dependent speech recognizer using estimated next word context |
US5839106A (en) * | 1996-12-17 | 1998-11-17 | Apple Computer, Inc. | Large-vocabulary speech recognition using an integrated syntactic and semantic statistical language model |
RU2119196C1 (ru) * | 1997-10-27 | 1998-09-20 | Яков Юноевич Изилов | Способ лексической интерпретации слитной речи и система для его реализации |
EP1215662A4 (en) * | 2000-02-28 | 2005-09-21 | Sony Corp | SPEECH RECOGNITION DEVICE, SPEECH RECOGNITION METHOD, AND RECORDING MEDIUM |
JP2001249684A (ja) * | 2000-03-02 | 2001-09-14 | Sony Corp | 音声認識装置および音声認識方法、並びに記録媒体 |
US20020087315A1 (en) * | 2000-12-29 | 2002-07-04 | Lee Victor Wai Leung | Computer-implemented multi-scanning language method and system |
JP4269625B2 (ja) * | 2002-10-08 | 2009-05-27 | 三菱電機株式会社 | 音声認識辞書作成方法及びその装置と音声認識装置 |
US20040186714A1 (en) * | 2003-03-18 | 2004-09-23 | Aurilab, Llc | Speech recognition improvement through post-processsing |
US8041566B2 (en) * | 2003-11-21 | 2011-10-18 | Nuance Communications Austria Gmbh | Topic specific models for text formatting and speech recognition |
KR100612839B1 (ko) * | 2004-02-18 | 2006-08-18 | 삼성전자주식회사 | 도메인 기반 대화 음성인식방법 및 장치 |
US20070005345A1 (en) * | 2005-07-01 | 2007-01-04 | Microsoft Corporation | Generating Chinese language couplets |
KR100897554B1 (ko) * | 2007-02-21 | 2009-05-15 | 삼성전자주식회사 | 분산 음성인식시스템 및 방법과 분산 음성인식을 위한 단말기 |
EP2135231A4 (en) * | 2007-03-01 | 2014-10-15 | Adapx Inc | SYSTEM AND METHOD FOR DYNAMIC LEARNING |
CN101836205A (zh) * | 2007-08-23 | 2010-09-15 | 谷歌股份有限公司 | 域词典创建 |
JP5377430B2 (ja) * | 2009-07-08 | 2013-12-25 | 本田技研工業株式会社 | 質問応答データベース拡張装置および質問応答データベース拡張方法 |
WO2011052412A1 (ja) * | 2009-10-28 | 2011-05-05 | 日本電気株式会社 | 音声認識システム、音声認識要求装置、音声認識方法、音声認識用プログラムおよび記録媒体 |
JP2011170087A (ja) * | 2010-02-18 | 2011-09-01 | Fujitsu Ltd | 音声認識装置 |
JP5480760B2 (ja) * | 2010-09-15 | 2014-04-23 | 株式会社Nttドコモ | 端末装置、音声認識方法および音声認識プログラム |
JP5148671B2 (ja) * | 2010-09-15 | 2013-02-20 | 株式会社エヌ・ティ・ティ・ドコモ | 音声認識結果出力装置、音声認識結果出力方法、及び音声認識結果出力プログラム |
US9009041B2 (en) * | 2011-07-26 | 2015-04-14 | Nuance Communications, Inc. | Systems and methods for improving the accuracy of a transcription using auxiliary data such as personal data |
US8996371B2 (en) * | 2012-03-29 | 2015-03-31 | Nice-Systems Ltd. | Method and system for automatic domain adaptation in speech recognition applications |
KR20140028174A (ko) * | 2012-07-13 | 2014-03-10 | 삼성전자주식회사 | 음성 인식 방법 및 이를 적용한 전자 장치 |
US9047868B1 (en) * | 2012-07-31 | 2015-06-02 | Amazon Technologies, Inc. | Language model data collection |
WO2014049998A1 (ja) * | 2012-09-27 | 2014-04-03 | 日本電気株式会社 | 情報検索システム、情報検索方法およびプログラム |
US8589164B1 (en) * | 2012-10-18 | 2013-11-19 | Google Inc. | Methods and systems for speech recognition processing using search query information |
JP5396530B2 (ja) * | 2012-12-11 | 2014-01-22 | 株式会社Nttドコモ | 音声認識装置および音声認識方法 |
US9293129B2 (en) * | 2013-03-05 | 2016-03-22 | Microsoft Technology Licensing, Llc | Speech recognition assisted evaluation on text-to-speech pronunciation issue detection |
US9159317B2 (en) * | 2013-06-14 | 2015-10-13 | Mitsubishi Electric Research Laboratories, Inc. | System and method for recognizing speech |
US9940927B2 (en) * | 2013-08-23 | 2018-04-10 | Nuance Communications, Inc. | Multiple pass automatic speech recognition methods and apparatus |
JP2015060095A (ja) * | 2013-09-19 | 2015-03-30 | 株式会社東芝 | 音声翻訳装置、音声翻訳方法およびプログラム |
CN103578464B (zh) * | 2013-10-18 | 2017-01-11 | 威盛电子股份有限公司 | 语言模型的建立方法、语音辨识方法及电子装置 |
JP6165619B2 (ja) * | 2013-12-13 | 2017-07-19 | 株式会社東芝 | 情報処理装置、情報処理方法、および情報処理プログラム |
US20150179169A1 (en) * | 2013-12-19 | 2015-06-25 | Vijay George John | Speech Recognition By Post Processing Using Phonetic and Semantic Information |
US9589564B2 (en) * | 2014-02-05 | 2017-03-07 | Google Inc. | Multiple speech locale-specific hotword classifiers for selection of a speech locale |
CN105981099A (zh) * | 2014-02-06 | 2016-09-28 | 三菱电机株式会社 | 语音检索装置和语音检索方法 |
US20150242386A1 (en) * | 2014-02-26 | 2015-08-27 | Google Inc. | Using language models to correct morphological errors in text |
JP2016009193A (ja) * | 2014-06-23 | 2016-01-18 | ハーマン インターナショナル インダストリーズ インコーポレイテッド | ユーザ適合音声認識 |
KR102292546B1 (ko) * | 2014-07-21 | 2021-08-23 | 삼성전자주식회사 | 컨텍스트 정보를 이용하는 음성 인식 방법 및 장치 |
RU153322U1 (ru) * | 2014-09-30 | 2015-07-10 | Закрытое акционерное общество "ИстраСофт" | Устройство для обучения разговорной(устной) речи с визуальной обратной связью |
KR102380833B1 (ko) * | 2014-12-02 | 2022-03-31 | 삼성전자주식회사 | 음성 인식 방법 및 음성 인식 장치 |
US10127904B2 (en) * | 2015-05-26 | 2018-11-13 | Google Llc | Learning pronunciations from acoustic sequences |
US9576578B1 (en) * | 2015-08-12 | 2017-02-21 | Google Inc. | Contextual improvement of voice query recognition |
KR102386854B1 (ko) * | 2015-08-20 | 2022-04-13 | 삼성전자주식회사 | 통합 모델 기반의 음성 인식 장치 및 방법 |
US9984677B2 (en) * | 2015-09-30 | 2018-05-29 | Nice Ltd. | Bettering scores of spoken phrase spotting |
-
2016
- 2016-02-05 US US15/016,609 patent/US20170229124A1/en not_active Abandoned
- 2016-11-18 EP EP16809254.2A patent/EP3360129B1/en active Active
- 2016-11-18 RU RU2018117655A patent/RU2688277C1/ru active
- 2016-11-18 WO PCT/US2016/062753 patent/WO2017136016A1/en active Application Filing
- 2016-11-18 JP JP2018524838A patent/JP6507316B2/ja active Active
- 2016-11-18 KR KR1020187013507A patent/KR102115541B1/ko active IP Right Grant
- 2016-12-29 CN CN201611243688.1A patent/CN107045871B/zh active Active
- 2016-12-30 DE DE102016125954.3A patent/DE102016125954A1/de not_active Withdrawn
- 2016-12-30 DE DE202016008230.3U patent/DE202016008230U1/de active Active
-
2017
- 2017-06-29 US US15/637,526 patent/US20170301352A1/en not_active Abandoned
Also Published As
Publication number | Publication date |
---|---|
CN107045871A (zh) | 2017-08-15 |
WO2017136016A1 (en) | 2017-08-10 |
CN107045871B (zh) | 2020-09-15 |
US20170301352A1 (en) | 2017-10-19 |
EP3360129A1 (en) | 2018-08-15 |
DE202016008230U1 (de) | 2017-05-04 |
EP3360129B1 (en) | 2020-08-12 |
RU2688277C1 (ru) | 2019-05-21 |
DE102016125954A1 (de) | 2017-08-10 |
KR20180066216A (ko) | 2018-06-18 |
JP2019507362A (ja) | 2019-03-14 |
KR102115541B1 (ko) | 2020-05-26 |
US20170229124A1 (en) | 2017-08-10 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6507316B2 (ja) | 外部データソースを用いた音声の再認識 | |
EP3125234B1 (en) | Individualized hotword detection models | |
EP3469489B1 (en) | Follow-up voice query prediction | |
CN110825340B (zh) | 提供预先计算的热词模型 | |
CN106233374B (zh) | 用于检测用户定义的关键字的关键字模型生成 | |
CN110110319B (zh) | 语音输入的字词级纠正 | |
US9589564B2 (en) | Multiple speech locale-specific hotword classifiers for selection of a speech locale | |
US11450313B2 (en) | Determining phonetic relationships | |
US9401146B2 (en) | Identification of communication-related voice commands | |
CN107066494B (zh) | 语音查询的搜索结果预获取 | |
CN113611316A (zh) | 人机交互方法、装置、设备以及存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20190204 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20190304 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20190401 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6507316 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |