JP5772585B2 - 音声認識装置、方法、及びプログラム - Google Patents
音声認識装置、方法、及びプログラム Download PDFInfo
- Publication number
- JP5772585B2 JP5772585B2 JP2011289004A JP2011289004A JP5772585B2 JP 5772585 B2 JP5772585 B2 JP 5772585B2 JP 2011289004 A JP2011289004 A JP 2011289004A JP 2011289004 A JP2011289004 A JP 2011289004A JP 5772585 B2 JP5772585 B2 JP 5772585B2
- Authority
- JP
- Japan
- Prior art keywords
- independent
- word
- priority
- words
- association
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
- 238000000034 method Methods 0.000 title claims description 18
- 238000000605 extraction Methods 0.000 claims description 17
- 238000006243 chemical reaction Methods 0.000 description 11
- 240000008620 Fagopyrum esculentum Species 0.000 description 10
- 235000009419 Fagopyrum esculentum Nutrition 0.000 description 10
- 238000012545 processing Methods 0.000 description 10
- 101100365741 Mus musculus Shisa2 gene Proteins 0.000 description 9
- 101100365738 Xenopus laevis shisa1 gene Proteins 0.000 description 9
- 241001147101 Dugong Species 0.000 description 7
- 238000012937 correction Methods 0.000 description 4
- 239000000284 extract Substances 0.000 description 4
- 238000004891 communication Methods 0.000 description 2
- 238000010586 diagram Methods 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 241000209094 Oryza Species 0.000 description 1
- 235000007164 Oryza sativa Nutrition 0.000 description 1
- 230000007423 decrease Effects 0.000 description 1
- 238000010606 normalization Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 239000013307 optical fiber Substances 0.000 description 1
- 239000002245 particle Substances 0.000 description 1
- 235000009566 rice Nutrition 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
Images
Description
P(w)=P(wi|wiーN−1・・・wi―1)
Priority(シーサー)=(シーサー|食べる)+(シーサー|ソーキそば)+(シーサー|きれい)+(シーサー|泳ぐ)+(シーサー|海)+(シーサー|行く)+(シーサー|旅行)+(シーサー|家族)+(シーサー|行く)+(シーサー|沖縄)=1.1
11 特徴量抽出部
12 類似度計算部
13 音響モデル
14 Ngram修正モデル
15 認識結果履歴
16 Ngram言語モデル
20 優先語推定部
21 自立語抽出部
22 優先度計算部
23 優先語判別部
24 言語モデル更新処理部
30 オントロジー
31 自立語関連度DB
Claims (8)
- 言語モデルを用いて、ユーザの音声を認識する音声認識手段と、
前記ユーザの音声に含まれる自立語を抽出する抽出手段と、
互いに関連する自立語を関連度に対応づけて記憶する関連度記憶手段と、
前記関連度記憶手段を参照して、前記抽出手段で抽出された前記自立語と関連する関連自立語の優先度を算出する優先度算出手段と、
前記優先度に応じて、前記言語モデルの重みを調整する調整手段と、を備え、
文章における2つの自立語の共起頻度に基づいて前記2つの自立語の前記関連度が設定され、かつ、共起頻度の高い自立語の2次関連語であるか否かに応じて前記関連度が設定され、
第1の自立語及び第2の自立語の共起頻度が高く、かつ、前記第2の自立語及び第3の自立語の共起頻度が高い場合、前記第1の自立語と前記第3の自立語とが前記2次関連語となる音声認識装置。 - 前記関連自立語の前記優先度に応じて、前記関連自立語が優先語であるか否かを判別する判別手段をさらに備え、
前記調整手段が、前記優先語に関するスコアを相対的に大きくするよう、前記言語モデルを更新することを特徴とする請求項1に記載の音声認識装置。 - 前記関連度記憶手段に記憶された自立語について、前記抽出手段で抽出された複数の自立語との前記関連度の和を優先度として算出し、
前記判別手段が、前記優先度としきい値との比較結果に応じて、前記関連自立語が前記優先語であるか否かを判別することを特徴とする請求項2に記載の音声認識装置。 - 前記関連度記憶手段に記憶された自立語について、前記抽出手段で抽出された複数の自立語との前記関連度の和を優先度として算出し、
前記判別手段が、前記関連自立語のうち、前記優先度が上位N(Nは自然数)個の自立語を、前記優先語と判別することを特徴とする請求項2、又は3に記載の音声認識装置。 - 前記自立語が、名詞、形容詞、及び動詞に限定されていることを特徴する請求項1〜4のいずれか1項に記載の音声認識装置。
- 前記関連度が文章中における2つの自立語の共起頻度に応じて設定されていることを特徴とする請求項1〜5のいずれか1項に記載の音声認識装置。
- 言語モデルを用いて、ユーザの音声を認識するステップと、
前記ユーザの音声に含まれる自立語を抽出するステップと、
関連する自立語を関連度に対応づけて記憶された関連度記憶手段を参照して、抽出された前記自立語と関連する関連自立語の優先度を算出するステップと、
前記優先度に応じて、前記言語モデルの重みを調整するステップと、を備え、
文章における2つの自立語の共起頻度に基づいて前記2つの自立語の前記関連度が設定され、かつ、共起頻度の高い自立語の2次関連語であるか否かに応じて前記関連度が設定され、
第1の自立語及び第2の自立語の共起頻度が高く、かつ、前記第2の自立語及び第3の自立語の共起頻度が高い場合、前記第1の自立語と前記第3の自立語とが前記2次関連語となる音声認識方法。 - コンピュータに対して、
言語モデルを用いて、ユーザの音声を認識するステップと、
前記ユーザの音声に含まれる自立語を抽出するステップと、
関連する自立語を関連度に対応づけて記憶された関連度記憶手段を参照して、抽出された前記自立語と関連する関連自立語の優先度を算出するステップと、
前記優先度に応じて、前記言語モデルの重みを調整するステップと、
を実行させ、
文章における2つの自立語の共起頻度に基づいて前記2つの自立語の前記関連度が設定され、かつ、共起頻度の高い自立語の2次関連語であるか否かに応じて前記関連度が設定され、
第1の自立語及び第2の自立語の共起頻度が高く、かつ、前記第2の自立語及び第3の自立語の共起頻度が高い場合、前記第1の自立語と前記第3の自立語とが前記2次関連語となる音声認識プログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2011289004A JP5772585B2 (ja) | 2011-12-28 | 2011-12-28 | 音声認識装置、方法、及びプログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2011289004A JP5772585B2 (ja) | 2011-12-28 | 2011-12-28 | 音声認識装置、方法、及びプログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2013137458A JP2013137458A (ja) | 2013-07-11 |
JP5772585B2 true JP5772585B2 (ja) | 2015-09-02 |
Family
ID=48913230
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2011289004A Expired - Fee Related JP5772585B2 (ja) | 2011-12-28 | 2011-12-28 | 音声認識装置、方法、及びプログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP5772585B2 (ja) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP6363478B2 (ja) * | 2014-11-21 | 2018-07-25 | 日本電信電話株式会社 | 音声認識装置、音声認識方法及び音声認識プログラム |
Family Cites Families (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP3660512B2 (ja) * | 1998-12-07 | 2005-06-15 | 日本電信電話株式会社 | 音声認識方法、その装置及びプログラム記録媒体 |
JP3913626B2 (ja) * | 2002-07-17 | 2007-05-09 | 日本電信電話株式会社 | 言語モデル生成方法、その装置及びそのプログラム |
JP2005284209A (ja) * | 2004-03-31 | 2005-10-13 | Kddi Corp | 音声認識方式 |
JP4734155B2 (ja) * | 2006-03-24 | 2011-07-27 | 株式会社東芝 | 音声認識装置、音声認識方法および音声認識プログラム |
WO2008001486A1 (fr) * | 2006-06-29 | 2008-01-03 | Nec Corporation | Dispositif et programme de traitement vocal, et procédé de traitement vocal |
JP5189413B2 (ja) * | 2008-06-09 | 2013-04-24 | 株式会社日立製作所 | 音声データ検索システム |
-
2011
- 2011-12-28 JP JP2011289004A patent/JP5772585B2/ja not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
JP2013137458A (ja) | 2013-07-11 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN107810529B (zh) | 语言模型语音端点确定 | |
US10388274B1 (en) | Confidence checking for speech processing and query answering | |
US10482885B1 (en) | Speaker based anaphora resolution | |
US10460034B2 (en) | Intention inference system and intention inference method | |
US10713289B1 (en) | Question answering system | |
JP5141695B2 (ja) | 記号挿入装置および記号挿入方法 | |
CN104021784B (zh) | 基于大语料库的语音合成方法和装置 | |
JP4745094B2 (ja) | クラスタリングシステム、クラスタリング方法、クラスタリングプログラムおよびクラスタリングシステムを用いた属性推定システム | |
US20140025382A1 (en) | Speech processing system | |
JP5932869B2 (ja) | N−gram言語モデルの教師無し学習方法、学習装置、および学習プログラム | |
US10366690B1 (en) | Speech recognition entity resolution | |
CN110675855A (zh) | 一种语音识别方法、电子设备及计算机可读存储介质 | |
US20110224982A1 (en) | Automatic speech recognition based upon information retrieval methods | |
JP5799733B2 (ja) | 認識装置、認識プログラムおよび認識方法 | |
JP4885160B2 (ja) | 英語変異発音を識別するモジュールの構築方法、および、当該モジュールの構築を実現するプログラムを記憶したコンピュータが読み取り可能な記録媒体 | |
White et al. | Maximum entropy confidence estimation for speech recognition | |
JP5772585B2 (ja) | 音声認識装置、方法、及びプログラム | |
JP2013137459A (ja) | 音声認識装置、方法、及びプログラム | |
Wu et al. | Semi-black-box attacks against speech recognition systems using adversarial samples | |
JP2013137460A (ja) | 音声認識装置、方法、及びプログラム | |
Amoolya et al. | Automatic speech recognition for Tulu Language using GMM-HMM and DNN-HMM techniques | |
JPH10247194A (ja) | 自動通訳装置 | |
US20110301949A1 (en) | Speaker-cluster dependent speaker recognition (speaker-type automated speech recognition) | |
Veisi et al. | Jira: a Kurdish Speech Recognition System Designing and Building Speech Corpus and Pronunciation Lexicon | |
Akita et al. | Generalized statistical modeling of pronunciation variations using variable-length phone context |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20140114 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20141015 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20141111 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20150108 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20150602 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20150615 |
|
R151 | Written notification of patent or utility model registration |
Ref document number: 5772585 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R151 |
|
LAPS | Cancellation because of no payment of annual fees |