JP6066354B2 - 信頼度計算の方法及び装置 - Google Patents
信頼度計算の方法及び装置 Download PDFInfo
- Publication number
- JP6066354B2 JP6066354B2 JP2014518551A JP2014518551A JP6066354B2 JP 6066354 B2 JP6066354 B2 JP 6066354B2 JP 2014518551 A JP2014518551 A JP 2014518551A JP 2014518551 A JP2014518551 A JP 2014518551A JP 6066354 B2 JP6066354 B2 JP 6066354B2
- Authority
- JP
- Japan
- Prior art keywords
- word string
- target word
- target
- string
- reliability
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000004364 calculation method Methods 0.000 title claims description 90
- 238000000034 method Methods 0.000 title claims description 67
- 238000012549 training Methods 0.000 claims description 81
- 238000000605 extraction Methods 0.000 claims description 20
- 239000011159 matrix material Substances 0.000 claims description 13
- 238000012545 processing Methods 0.000 claims description 12
- 230000002093 peripheral effect Effects 0.000 claims description 8
- 239000000284 extract Substances 0.000 claims description 7
- 238000004590 computer program Methods 0.000 claims 15
- 241000282575 Gorilla Species 0.000 description 31
- 239000013598 vector Substances 0.000 description 10
- 238000013500 data storage Methods 0.000 description 9
- 238000007477 logistic regression Methods 0.000 description 5
- 238000010586 diagram Methods 0.000 description 4
- 238000012706 support-vector machine Methods 0.000 description 3
- 230000006978 adaptation Effects 0.000 description 2
- 238000013528 artificial neural network Methods 0.000 description 2
- 230000008901 benefit Effects 0.000 description 2
- 238000010606 normalization Methods 0.000 description 2
- 238000004458 analytical method Methods 0.000 description 1
- 238000013459 approach Methods 0.000 description 1
- 238000000354 decomposition reaction Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 230000002452 interceptive effect Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000003672 processing method Methods 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 238000013518 transcription Methods 0.000 description 1
- 230000035897 transcription Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/02—Feature extraction for speech recognition; Selection of recognition unit
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/06—Creation of reference templates; Training of speech recognition systems, e.g. adaptation to the characteristics of the speaker's voice
- G10L15/063—Training
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/08—Speech classification or search
- G10L15/10—Speech classification or search using distance or distortion measures between unknown speech and reference templates
Landscapes
- Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Artificial Intelligence (AREA)
- Machine Translation (AREA)
Description
次に、実施例を参照して、本実施形態に基づく信頼度計算装置をより具体的に説明する。図5は、実施例に基づく装置を示している。
またさらに別の考え得る特徴量として、例えば、『2単語前に「family」が存在するか否か』といったような、ある単語が出現する位置を考えてもよい。
また、正解の単語列と周辺文脈との整合度は認識誤りの単語列と周辺文脈との整合度よりも大きくなる、と期待できる。したがって、たとえ対象単語列と周辺文脈との整合度が大きくても、対象単語列が認識誤りである場合には、他の候補単語列と周辺文脈との整合度がさらに大きくなると期待できる。その結果、信頼度計算部107は、「対象単語列の位置における真の単語列は他の候補単語列である」または「真の単語列が対象単語列である可能性は低い」ということを示す分類結果を出力し、小さな信頼度が得られる。
Claims (34)
- 認識結果中の指定された対象単語列の信頼度を計算する信頼度計算方法であって、
前記認識結果と前記対象単語列とを受け取ることと、
生成部が、前記対象単語列の位置における最も正解らしい単語列を他の候補単語列として生成することと、
訓練部が、訓練データにおける前記対象単語列の位置における周辺文脈を表す第一の特徴量と、前記第一の特徴量と同じ種類であって前記訓練データにおける前記他の候補単語列の位置における周辺文脈を表す第二の特徴量とを用いて、前記対象単語列と前記他の候補単語列とを区別するように構成された分類器を訓練することと、
抽出部が、前記第一の特徴量と同じ種類であって前記認識結果での前記対象単語列の位置における周辺文脈を表す第三の特徴量を抽出することと、
計算部が、前記訓練された分類器と前記第三の特徴量とを用いて、前記認識結果での前記対象単語列の位置における真の単語列が前記対象単語列であるかあるいは前記他の候補単語列であるかを判別することと、
前記計算部が、判別結果に基づいて前記認識結果における前記対象単語列の信頼度を計算することと、
を有する方法。 - 複数の前記他の候補単語列が生成され、前記分類器は、前記対象単語列と前記複数の他の候補単語列のどれでもとを区別するように構成され、前記対象単語列の前記位置における前記真の単語列が前記対象単語列であるかあるいは前記複数の他の候補単語列のいずれかであるかが前記分類器を用いて判別される、請求項1に記載の方法。
- 前記分類器は、分類結果の事後確率を出力するように構成され、前記対象単語列が正しいという事後確率が、前記対象単語列の前記信頼度として用いられる、請求項1に記載の方法。
- 前記対象単語列の前記位置における前記真の単語列が前記対象単語列であると分類された場合に第一の定数が前記対象単語列の前記信頼度として用いられ、前記対象単語列の前記位置における前記真の単語列が前記他の候補単語列であると分類された場合に前記第一の定数より小さな第二の定数が前記対象単語列の前記信頼度として用いられる、請求項1に記載の方法。
- 認識システムによって前記対象単語列の前記位置において出力された仮説であって前記対象単語列以外の仮説が、前記他の候補単語列として用いられる、請求項1に記載の方法。
- 発音辞書を参照することにより、前記対象単語列の発音と類似した発音を有する単語列が、前記他の候補単語列として生成される、請求項1に記載の方法。
- 単語間混同行列を参照することにより、認識システムが前記対象単語列と混同しやすい単語列が、前記他の候補単語列として生成される、請求項1に記載の方法。
- 前記第一、第二及び第三の特徴量は、前記対象単語列の前記位置から一定距離内に出現する単語の頻度数または前記単語の属性の頻度数に基づいて計算される、請求項1に記載の方法。
- 前記対象単語列の前記計算された信頼度が所定のしきい値以下であるときに、前記対象単語列は認識誤りであると判断することをさらに有する、請求項1に記載の方法。
- 認識システムから出力される前記対象単語列の事後確率が第一のしきい値以下であり、かつ、前記対象単語列の前記計算された信頼度が第二のしきい値以下であるときに、前記対象単語列は認識誤りであると判断することをさらに有する、請求項1に記載の方法。
- 前記生成することと前記訓練することと前記抽出することと前記判別することとを実施して、前記対象単語列の信頼度と前記他の候補単語列の信頼度とを得ることと、
最大の信頼度を有する単語列を出力することと、
をさらに有する、請求項1に記載の方法。 - 認識結果中の指定された対象単語列の信頼度を計算する信頼度計算装置であって、
前記対象単語列の位置における最も正解らしい単語列を他の候補単語列として生成する生成部と、
訓練データにおける前記対象単語列の位置における周辺文脈を表す第一の特徴量と、前記第一の特徴量と同じ種類であって前記訓練データにおける前記他の候補単語列の位置における周辺文脈を表す第二の特徴量とを用いて、前記対象単語列と前記他の候補単語列とを区別するように構成された分類器を訓練する訓練部と、
前記第一の特徴量と同じ種類であって前記認識結果での前記対象単語列の位置における周辺文脈を表す第三の特徴量を抽出する抽出部と、
前記訓練された分類器と前記第三の特徴量とを用いて前記認識結果での前記対象単語列の位置における真の単語列が前記対象単語列であるかあるいは前記他の候補単語列であるかを判別し、判別結果に基づいて前記認識結果における前記対象単語列の信頼度を計算する計算部と、
を有する装置。 - 前記生成部は、複数の前記他の候補単語列を生成し、前記分類器は、前記対象単語列と前記複数の他の候補単語列のどれでもとを区別するように構成され、判別に際し、前記計算部は、前記対象単語列の前記位置における前記真の単語列が前記対象単語列であるか前記複数の他の候補単語列のいずれかであるかを判別する、請求項12に記載の装置。
- 前記分類器は分類結果の事後確率を出力するように構成され、前記計算部は、前記対象単語列が正しいという事後確率を前記対象単語列の前記信頼度として用いる、請求項12に記載の装置。
- 前記計算部は、前記対象単語列の前記位置における前記真の単語列が前記対象単語列であると分類された場合に第一の定数を前記対象単語列の前記信頼度として用い、前記対象単語列の前記位置における前記真の単語列が前記他の候補単語列であると分類された場合に前記第一の定数より小さな第二の定数を前記対象単語列の前記信頼度として用いる、請求項12に記載の装置。
- 前記生成部は、前記他の候補単語列として、認識システムによって前記対象単語列の前記位置において出力された仮説であって前記対象単語列以外の仮説を用いる、請求項12に記載の装置。
- 前記生成部は、発音辞書を参照し、前記他の候補単語列として、前記対象単語列の発音と類似した発音を有する単語列を生成する、請求項12に記載の装置。
- 前記生成部は、単語間混同行列を参照して、前記他の候補単語列として、認識システムが前記対象単語列と混同しやすい単語列を生成する、請求項12に記載の装置。
- 前記第一、第二及び第三の特徴量は、前記対象単語列の前記位置から一定距離内に出現する単語の頻度数または前記単語の属性の頻度数に基づいて計算される、請求項12に記載の装置。
- 前記対象単語列の前記計算された信頼度が所定のしきい値以下であるときに、前記対象単語列は認識誤りであると判断される、請求項12に記載の装置。
- 認識システムから出力される前記対象単語列の事後確率が第一のしきい値以下であり、かつ、前記対象単語列の前記計算された信頼度が第二のしきい値以下であるときに、前記対象単語列は認識誤りであると判断される、請求項12に記載の装置。
- 前記対象単語列の信頼度と前記他の候補単語列の信頼度とを計算し、最大の信頼度を有する単語列を出力する、請求項12に記載の装置。
- 認識結果中の指定された対象単語列の信頼度を計算する信頼度計算装置であって、
前記対象単語列の位置における最も正解らしい単語列を他の候補単語列として生成する手段と、
訓練データにおける前記対象単語列の位置における周辺文脈を表す第一の特徴量と、前記第一の特徴量と同じ種類であって前記訓練データにおける前記他の候補単語列の位置における周辺文脈を表す第二の特徴量とを用いて、前記対象単語列と前記他の候補単語列とを区別するように構成された分類器を訓練する手段と、
前記第一の特徴量と同じ種類であって前記認識結果での前記対象単語列の位置における周辺文脈を表す第三の特徴量を抽出する手段と、
前記訓練された分類器と前記第三の特徴量とを用いて前記認識結果での前記対象単語列の位置における真の単語列が前記対象単語列であるかあるいは前記他の候補単語列であるかを判別し、判別結果に基づいて前記認識結果における前記対象単語列の信頼度を計算する手段と、
を有する装置。 - コンピュータに、
認識結果と前記認識結果中で指定された対象単語列とを受け取る処理と、
前記対象単語列の位置における最も正解らしい単語列を他の候補単語列として生成する処理と、
訓練データにおける前記対象単語列の位置における周辺文脈を表す第一の特徴量と、前記第一の特徴量と同じ種類であって前記訓練データにおける前記他の候補単語列の位置における周辺文脈を表す第二の特徴量とを用いて、前記対象単語列と前記他の候補単語列とを区別するように構成された分類器を訓練する処理と、
前記第一の特徴量と同じ種類であって前記認識結果での前記対象単語列の位置における周辺文脈を表す第三の特徴量を抽出する処理と、
前記訓練された分類器と前記第三の特徴量とを用いて、前記認識結果での前記対象単語列の位置における真の単語列が前記対象単語列であるかあるいは前記他の候補単語列であるかを判別する処理と、
判別結果に基づいて前記認識結果における前記対象単語列の信頼度を計算する処理と、
を実行させるコンピュータプログラム。 - 前記コンピュータに、前記生成する処理において複数の前記他の候補単語列を生成させ、前記訓練する処理において、前記対象単語列と前記複数の他の候補単語列のどれでもとを区別するように構成された分類器を訓練させ、前記判別する処理において、前記対象単語列の前記位置における前記真の単語列が前記対象単語列であるかあるいは前記複数の他の候補単語列のいずれかであるかを前記分類器を用いて判別させる、請求項24に記載のコンピュータプログラム。
- 前記分類器は、分類結果の事後確率を出力するように構成され、前記コンピュータプログラムは、前記コンピュータに、前記計算する処理において、前記対象単語列が正しいという事後確率を前記対象単語列の前記信頼度として使用させる、請求項24に記載のコンピュータプログラム。
- 前記コンピュータに、前記計算する処理において、前記対象単語列の前記位置における前記真の単語列が前記対象単語列であると分類された場合に第一の定数を前記対象単語列の前記信頼度として使用させ、前記対象単語列の前記位置における前記真の単語列が前記他の候補単語列であると分類された場合に前記第一の定数より小さな第二の定数を前記対象単語列の前記信頼度として使用させる、請求項24に記載のコンピュータプログラム。
- 前記コンピュータに、前記他の候補単語列として、認識システムによって前記対象単語列の前記位置において出力された仮説であって前記対象単語列以外の仮説を使用させる、請求項24に記載のコンピュータプログラム。
- 前記コンピュータに、前記生成する処理において、発音辞書を参照させて、前記対象単語列の発音と類似した発音を有する単語列を前記他の候補単語列として生成させる、請求項24に記載のコンピュータプログラム。
- 前記コンピュータに、前記生成する処理において、単語間混同行列を参照させて、認識システムが前記対象単語列と混同しやすい単語列を前記他の候補単語列として生成させる、請求項24に記載のコンピュータプログラム。
- 前記コンピュータに、前記対象単語列の前記位置から一定距離内に出現する単語の頻度数または前記単語の属性の頻度数に基づいて、前記第一、第二及び第三の特徴量を計算させる、請求項24に記載のコンピュータプログラム。
- 前記コンピュータに、前記対象単語列の前記計算された信頼度が所定のしきい値以下であるときに前記対象単語列は認識誤りであると判断する処理をさらに実行させる、請求項24に記載のコンピュータプログラム。
- 前記コンピュータに、認識システムから出力される前記対象単語列の事後確率が第一のしきい値以下であり、かつ、前記対象単語列の前記計算された信頼度が第二のしきい値以下であるときに、前記対象単語列は認識誤りであると判断する処理をさらに実行させる、請求項24に記載のコンピュータプログラム。
- 前記コンピュータに、
前記生成する処理と前記訓練する処理と前記抽出する処理と前記判別する処理とを実施して、前記対象単語列の信頼度と前記他の候補単語列の信頼度とを得る処理と、
最大の信頼度を有する単語列を出力する処理と、
をさらに実行させる、請求項24に記載のコンピュータプログラム。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US201161503956P | 2011-07-01 | 2011-07-01 | |
US61/503,956 | 2011-07-01 | ||
PCT/US2012/027233 WO2013006215A1 (en) | 2011-07-01 | 2012-03-01 | Method and apparatus of confidence measure calculation |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2014521115A JP2014521115A (ja) | 2014-08-25 |
JP6066354B2 true JP6066354B2 (ja) | 2017-01-25 |
Family
ID=47437338
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2014518551A Active JP6066354B2 (ja) | 2011-07-01 | 2012-03-01 | 信頼度計算の方法及び装置 |
Country Status (3)
Country | Link |
---|---|
US (1) | US9336769B2 (ja) |
JP (1) | JP6066354B2 (ja) |
WO (1) | WO2013006215A1 (ja) |
Families Citing this family (32)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8073681B2 (en) | 2006-10-16 | 2011-12-06 | Voicebox Technologies, Inc. | System and method for a cooperative conversational voice user interface |
US7818176B2 (en) | 2007-02-06 | 2010-10-19 | Voicebox Technologies, Inc. | System and method for selecting and presenting advertisements based on natural language processing of voice-based input |
US8140335B2 (en) | 2007-12-11 | 2012-03-20 | Voicebox Technologies, Inc. | System and method for providing a natural language voice user interface in an integrated voice navigation services environment |
US9305548B2 (en) | 2008-05-27 | 2016-04-05 | Voicebox Technologies Corporation | System and method for an integrated, multi-modal, multi-device natural language voice services environment |
US8326637B2 (en) | 2009-02-20 | 2012-12-04 | Voicebox Technologies, Inc. | System and method for processing multi-modal device interactions in a natural language voice services environment |
JP5799733B2 (ja) * | 2011-10-12 | 2015-10-28 | 富士通株式会社 | 認識装置、認識プログラムおよび認識方法 |
US9292487B1 (en) * | 2012-08-16 | 2016-03-22 | Amazon Technologies, Inc. | Discriminative language model pruning |
JP2014202848A (ja) * | 2013-04-03 | 2014-10-27 | 株式会社東芝 | テキスト生成装置、方法、及びプログラム |
JP5932869B2 (ja) | 2014-03-27 | 2016-06-08 | インターナショナル・ビジネス・マシーンズ・コーポレーションInternational Business Machines Corporation | N−gram言語モデルの教師無し学習方法、学習装置、および学習プログラム |
CN105320957B (zh) * | 2014-07-10 | 2022-02-15 | 腾讯科技(深圳)有限公司 | 分类器训练方法和装置 |
US9721564B2 (en) * | 2014-07-31 | 2017-08-01 | Rovi Guides, Inc. | Systems and methods for performing ASR in the presence of heterographs |
CN107003996A (zh) | 2014-09-16 | 2017-08-01 | 声钰科技 | 语音商务 |
US9898459B2 (en) * | 2014-09-16 | 2018-02-20 | Voicebox Technologies Corporation | Integration of domain information into state transitions of a finite state transducer for natural language processing |
WO2016061309A1 (en) | 2014-10-15 | 2016-04-21 | Voicebox Technologies Corporation | System and method for providing follow-up responses to prior natural language inputs of a user |
US10431214B2 (en) | 2014-11-26 | 2019-10-01 | Voicebox Technologies Corporation | System and method of determining a domain and/or an action related to a natural language input |
US10614799B2 (en) | 2014-11-26 | 2020-04-07 | Voicebox Technologies Corporation | System and method of providing intent predictions for an utterance prior to a system detection of an end of the utterance |
US9384188B1 (en) | 2015-01-27 | 2016-07-05 | Microsoft Technology Licensing, Llc | Transcription correction using multi-token structures |
US10048842B2 (en) | 2015-06-15 | 2018-08-14 | Google Llc | Selection biasing |
US10152298B1 (en) * | 2015-06-29 | 2018-12-11 | Amazon Technologies, Inc. | Confidence estimation based on frequency |
KR102443087B1 (ko) | 2015-09-23 | 2022-09-14 | 삼성전자주식회사 | 전자 기기 및 그의 음성 인식 방법 |
CN105893414A (zh) * | 2015-11-26 | 2016-08-24 | 乐视致新电子科技(天津)有限公司 | 筛选发音词典有效词条的方法及装置 |
CN105529028B (zh) * | 2015-12-09 | 2019-07-30 | 百度在线网络技术(北京)有限公司 | 语音解析方法和装置 |
US9589049B1 (en) * | 2015-12-10 | 2017-03-07 | International Business Machines Corporation | Correcting natural language processing annotators in a question answering system |
US10140976B2 (en) * | 2015-12-14 | 2018-11-27 | International Business Machines Corporation | Discriminative training of automatic speech recognition models with natural language processing dictionary for spoken language processing |
WO2018023106A1 (en) | 2016-07-29 | 2018-02-01 | Erik SWART | System and method of disambiguating natural language processing requests |
US10607601B2 (en) | 2017-05-11 | 2020-03-31 | International Business Machines Corporation | Speech recognition by selecting and refining hot words |
CN109271624B (zh) * | 2018-08-23 | 2020-05-29 | 腾讯科技(深圳)有限公司 | 一种目标词确定方法、装置及存储介质 |
CN110265018B (zh) * | 2019-07-01 | 2022-03-04 | 成都启英泰伦科技有限公司 | 一种连续发出的重复命令词识别方法 |
US11238884B2 (en) * | 2019-10-04 | 2022-02-01 | Red Box Recorders Limited | Systems and methods for recording quality driven communication management |
US20230076709A1 (en) | 2020-03-16 | 2023-03-09 | Nec Corporation | Speech recognition apparatus, control method, and non-transitory storage medium |
CN111951805A (zh) * | 2020-07-10 | 2020-11-17 | 华为技术有限公司 | 一种文本数据处理方法及装置 |
KR102660480B1 (ko) * | 2021-04-29 | 2024-04-25 | 한양대학교 산학협력단 | 랜덤 워크를 이용한 개인화된 랭킹 방법 및 시스템 |
Family Cites Families (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6839667B2 (en) * | 2001-05-16 | 2005-01-04 | International Business Machines Corporation | Method of speech recognition by presenting N-best word candidates |
JP2003308094A (ja) * | 2002-02-12 | 2003-10-31 | Advanced Telecommunication Research Institute International | 音声認識における認識誤り箇所の訂正方法 |
ATE508455T1 (de) * | 2002-09-27 | 2011-05-15 | Callminer Inc | Verfahren zur statistischen analyse von sprache |
US20050114131A1 (en) * | 2003-11-24 | 2005-05-26 | Kirill Stoimenov | Apparatus and method for voice-tagging lexicon |
US7363224B2 (en) * | 2003-12-30 | 2008-04-22 | Microsoft Corporation | Method for entering text |
KR20060098673A (ko) | 2005-03-03 | 2006-09-19 | 삼성전자주식회사 | 음성 인식 방법 및 장치 |
US7890325B2 (en) | 2006-03-16 | 2011-02-15 | Microsoft Corporation | Subword unit posterior probability for measuring confidence |
JP2009116075A (ja) | 2007-11-07 | 2009-05-28 | Xanavi Informatics Corp | 音声認識装置 |
US8713433B1 (en) * | 2012-10-16 | 2014-04-29 | Google Inc. | Feature-based autocorrection |
CN104143328B (zh) * | 2013-08-15 | 2015-11-25 | 腾讯科技(深圳)有限公司 | 一种关键词检测方法和装置 |
-
2012
- 2012-03-01 JP JP2014518551A patent/JP6066354B2/ja active Active
- 2012-03-01 WO PCT/US2012/027233 patent/WO2013006215A1/en active Application Filing
- 2012-03-01 US US14/130,335 patent/US9336769B2/en active Active
Also Published As
Publication number | Publication date |
---|---|
JP2014521115A (ja) | 2014-08-25 |
WO2013006215A1 (en) | 2013-01-10 |
US20140195238A1 (en) | 2014-07-10 |
US9336769B2 (en) | 2016-05-10 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6066354B2 (ja) | 信頼度計算の方法及び装置 | |
US10134388B1 (en) | Word generation for speech recognition | |
US10210862B1 (en) | Lattice decoding and result confirmation using recurrent neural networks | |
US10943583B1 (en) | Creation of language models for speech recognition | |
US9911413B1 (en) | Neural latent variable model for spoken language understanding | |
US9600231B1 (en) | Model shrinking for embedded keyword spotting | |
US11721329B2 (en) | Method, system and apparatus for multilingual and multimodal keyword search in a mixlingual speech corpus | |
JP5440177B2 (ja) | 単語カテゴリ推定装置、単語カテゴリ推定方法、音声認識装置、音声認識方法、プログラム、および記録媒体 | |
US20180137109A1 (en) | Methodology for automatic multilingual speech recognition | |
US8065149B2 (en) | Unsupervised lexicon acquisition from speech and text | |
US20110224982A1 (en) | Automatic speech recognition based upon information retrieval methods | |
US20070100814A1 (en) | Apparatus and method for detecting named entity | |
JP6323947B2 (ja) | 音響イベント認識装置、及びプログラム | |
Lugosch et al. | DONUT: CTC-based query-by-example keyword spotting | |
WO2010100853A1 (ja) | 言語モデル適応装置、音声認識装置、言語モデル適応方法、及びコンピュータ読み取り可能な記録媒体 | |
JP4769098B2 (ja) | 音声認識信頼度推定装置、その方法、およびプログラム | |
Hanani et al. | Spoken Arabic dialect recognition using X-vectors | |
CA2883076A1 (en) | Method and system for predicting speech recognition performance using accuracy scores | |
JP2004198597A (ja) | 音声認識装置および文分類装置としてコンピュータを動作させるコンピュータプログラム、階層化された言語モデルを作成する方法を実現する様にコンピュータを動作させるコンピュータプログラム、および記憶媒体 | |
US20110224985A1 (en) | Model adaptation device, method thereof, and program thereof | |
Hazen et al. | Topic modeling for spoken documents using only phonetic information | |
KR101483947B1 (ko) | 핵심어에서의 음소 오류 결과를 고려한 음향 모델 변별 학습을 위한 장치 및 이를 위한 방법이 기록된 컴퓨터 판독 가능한 기록매체 | |
Lee et al. | Improved spoken term detection using support vector machines based on lattice context consistency | |
Nguyen et al. | Speech recognition with flat direct models | |
Soto et al. | Rescoring confusion networks for keyword search |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
RD04 | Notification of resignation of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7424 Effective date: 20140527 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20150204 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20160322 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20160613 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20161122 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20161215 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6066354 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |