JP5152020B2 - 音声認識装置及び音声認識方法 - Google Patents
音声認識装置及び音声認識方法 Download PDFInfo
- Publication number
- JP5152020B2 JP5152020B2 JP2009021360A JP2009021360A JP5152020B2 JP 5152020 B2 JP5152020 B2 JP 5152020B2 JP 2009021360 A JP2009021360 A JP 2009021360A JP 2009021360 A JP2009021360 A JP 2009021360A JP 5152020 B2 JP5152020 B2 JP 5152020B2
- Authority
- JP
- Japan
- Prior art keywords
- reading information
- speech recognition
- recognition
- speech
- degree
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Description
図1は、本発明に係る音声認識装置の構成を示す機能ブロック図である。
図6は、本発明の第2実施形態に係る音声認識装置の構成を示す機能ブロック図である。
第2実施形態に係る音声認識装置60の認識頻度計数部61により頻度計数を行う際に、音声認識部12における認識スコア毎の認識頻度を計数し、この認識スコア毎の認識頻度に基づいて、読み情報選択部13において読み情報を選択する際の閾値を決定することが可能である。
図10は、本発明の第3実施形態に係る音声認識装置の構成を示す機能ブロック図である。
12:音声認識部
13:読み情報選択部
14:音声認識用辞書
15:音響モデル
16:認識結果保存部
Claims (8)
- 単語と複数の読み情報とを対応付けて記憶し、かつ前記複数の読み情報のうちの基準となる基準読み情報と他の読み情報との異同度合いを示し、読み情報と基準読み情報との文字列間の距離に基づいて決定される揺らぎ度を記憶する音声認識用辞書と、
音声信号の入力を受け付ける音声信号入力部と、
前記音声認識用辞書に記憶されている単語に対応する複数の読み情報のうち、前記揺らぎ度に関する所定条件を満たす読み情報を、音声認識用の音節または音素モデル列を生成するための読み情報として選択する読み情報選択部と、
前記音声信号入力部から入力された音声信号を、前記読み情報選択部で選択された読み情報に基づいて所定の音響モデルから生成される音節または音素モデル列を用いて音声認識し、前記音声認識用辞書に記憶されている単語に相当する音声信号が含まれているか否かを判定し、含まれている場合は前記単語を音声認識結果として出力する音声認識部と、
を含む音声認識装置。 - 前記読み情報選択部は、前記複数の読み情報のうち前記揺らぎ度が所定値以下である読み情報を、前記音声認識部で用いる音節または音素モデル列を生成するための読み情報として選択する、請求項1に記載の音声認識装置。
- 前記読み情報選択部は、前記複数の読み情報のうち、前記揺らぎ度が低いものから順に所定個数の読み情報を選択し、
前記音声認識部は、前記選択された所定個数の読み情報を用いて音節または音素モデル列を用いて音声認識し、音声認識結果を出力する、請求項1に記載の音声認識装置。 - 単語と複数の読み情報とを対応付けて記憶し、かつ前記複数の読み情報のうちの基準となる基準読み情報と他の読み情報との異同度合いを示す揺らぎ度を記憶する音声認識用辞書と、
音声信号の入力を受け付ける音声信号入力部と、
前記音声認識用辞書に記憶されている単語に対応する複数の読み情報のうち、前記揺らぎ度に関する所定条件を満たす読み情報を、音声認識用の音節または音素モデル列を生成するための読み情報として選択する読み情報選択部と、
前記音声信号入力部から入力された音声信号を、前記読み情報選択部で選択された読み情報に基づいて所定の音響モデルから生成される音節または音素モデル列を用いて音声認識し、前記音声認識用辞書に記憶されている単語に相当する音声信号が含まれているか否かを判定し、含まれている場合は前記単語を音声認識結果として出力する音声認識部と、
を含み、
前記読み情報選択部は、前記複数の読み情報のうち、前記基準読み情報の音素または音節数に基づいて、前記揺らぎ度に関する所定条件を決定する音声認識装置。 - 単語と複数の読み情報とを対応付けて記憶し、かつ前記複数の読み情報のうちの基準となる基準読み情報と他の読み情報との異同度合いを示す揺らぎ度を記憶する音声認識用辞書と、
音声信号の入力を受け付ける音声信号入力部と、
前記音声認識用辞書に記憶されている単語に対応する複数の読み情報のうち、前記揺らぎ度に関する所定条件を満たす読み情報を、音声認識用の音節または音素モデル列を生成するための読み情報として選択する読み情報選択部と、
前記音声信号入力部から入力された音声信号を、前記読み情報選択部で選択された読み情報に基づいて所定の音響モデルから生成される音節または音素モデル列を用いて音声認識し、前記音声認識用辞書に記憶されている単語に相当する音声信号が含まれているか否かを判定し、含まれている場合は前記単語を音声認識結果として出力する音声認識部と、
前記音声認識部おける単語毎の認識回数を計数する認識頻度計数部と、
を含み、
前記読み情報選択部は、前記認識頻度計数部において計数された認識回数に基づいて、前記揺らぎ度に関する所定条件を決定する音声認識装置。 - 前記音声認識部は、選択した読み情報に基づいて生成した音節または音素モデル列と前記入力された音声信号とが音節または音素毎に類似しているか否かの度合いを示す認識スコアを算出し、算出した認識スコアに基づいて音声認識を行い、
前記認識頻度計数部は前記認識スコア別の認識回数を計数する、請求項5に記載の音声認識装置。 - 単語と複数の読み情報とを対応付けて記憶し、かつ前記複数の読み情報のうちの基準となる基準読み情報と他の読み情報との異同度合いを示す揺らぎ度を記憶する音声認識用辞書と、
音声信号の入力を受け付ける音声信号入力部と、
前記音声認識用辞書に記憶されている単語に対応する複数の読み情報のうち、前記揺らぎ度に関する所定条件を満たす読み情報を、音声認識用の音節または音素モデル列を生成するための読み情報として選択する読み情報選択部と、
前記音声信号入力部から入力された音声信号を、前記読み情報選択部で選択された読み情報に基づいて所定の音響モデルから生成される音節または音素モデル列を用いて音声認識し、前記音声認識用辞書に記憶されている単語に相当する音声信号が含まれているか否かを判定し、含まれている場合は前記単語を音声認識結果として出力する音声認識部と、
を含み、
前記音声認識用辞書は、各単語の標準的な読み情報である標準読み情報を前記基準読み情報とし、前記単語に対応する標準読み情報以外の読み情報を拡張読み情報とする初期設定がなされており、
前記音声認識部における認識結果に基づいて、前記音声認識用辞書の各単語の基準読み情報及び拡張読み情報を再設定し、新たな基準読み情報と拡張読み情報とに基づいて前記拡張読み情報の揺らぎ度を再計算して前記音声認識用辞書に記憶させる辞書更新部をさらに含む音声認識装置。 - 単語と複数の読み情報とを対応付けて記憶し、かつ前記複数の読み情報のうちの基準となる基準読み情報と他の読み情報との異同度合いを示し、読み情報と基準読み情報との文字列間の距離に基づいて決定される揺らぎ度を音声認識用辞書に記憶させる段階と、
音声信号の入力を受け付ける段階と、
前記音声認識用辞書に記憶されている単語に対応する複数の読み情報のうち、揺らぎ度に関する所定条件を満たす読み情報を、音声認識用の音節または音素モデル列を生成するための読み情報として選択する段階と、
前記入力された音声信号を、前記選択された読み情報に基づいて所定の音響モデルから生成される音節または音素モデル列を用いて音声認識し、前記音声認識用辞書に記憶されている単語に相当する音声信号が含まれているか否かを判定し、含まれている場合は前記単語を音声認識結果として出力する段階と、
を含む音声認識方法のプログラムをコンピュータに実行させるためのプログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2009021360A JP5152020B2 (ja) | 2009-02-02 | 2009-02-02 | 音声認識装置及び音声認識方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2009021360A JP5152020B2 (ja) | 2009-02-02 | 2009-02-02 | 音声認識装置及び音声認識方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2010176067A JP2010176067A (ja) | 2010-08-12 |
JP5152020B2 true JP5152020B2 (ja) | 2013-02-27 |
Family
ID=42707070
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2009021360A Expired - Fee Related JP5152020B2 (ja) | 2009-02-02 | 2009-02-02 | 音声認識装置及び音声認識方法 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP5152020B2 (ja) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP5703747B2 (ja) * | 2010-12-27 | 2015-04-22 | 富士通株式会社 | 音声認識装置,および音声認識プログラム |
JP6106616B2 (ja) * | 2014-02-13 | 2017-04-05 | 日本電信電話株式会社 | データベース作成装置、単語検索装置、情報端末、単語検索方法、プログラム |
Family Cites Families (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS62111292A (ja) * | 1985-11-08 | 1987-05-22 | 松下電器産業株式会社 | 音声認識装置 |
JPH08123470A (ja) * | 1994-10-25 | 1996-05-17 | Nippon Hoso Kyokai <Nhk> | 音声認識装置 |
US8918318B2 (en) * | 2007-01-16 | 2014-12-23 | Nec Corporation | Extended recognition dictionary learning device and speech recognition system |
-
2009
- 2009-02-02 JP JP2009021360A patent/JP5152020B2/ja not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
JP2010176067A (ja) | 2010-08-12 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5200712B2 (ja) | 音声認識装置、音声認識方法及びコンピュータプログラム | |
US9196247B2 (en) | Voice recognition method and voice recognition apparatus | |
JP4769223B2 (ja) | テキスト発音記号変換辞書作成装置、認識語彙辞書作成装置、及び音声認識装置 | |
JP6556575B2 (ja) | 音声処理装置、音声処理方法及び音声処理プログラム | |
JP5533042B2 (ja) | 音声検索装置、音声検索方法、プログラム及び記録媒体 | |
JP6011565B2 (ja) | 音声検索装置、音声検索方法及びプログラム | |
JP5753769B2 (ja) | 音声データ検索システムおよびそのためのプログラム | |
JP2007047412A (ja) | 認識文法モデル作成装置、認識文法モデル作成方法、および、音声認識装置 | |
JP2009139862A (ja) | 音声認識装置及びコンピュータプログラム | |
JP2014232268A (ja) | 音声認識における読み精度を改善するシステム、方法、およびプログラム | |
JP2018159788A (ja) | 情報処理装置、方法及びプログラム | |
JP2015014665A (ja) | 音声認識装置及び方法、並びに、半導体集積回路装置 | |
JP6690484B2 (ja) | 音声認識用コンピュータプログラム、音声認識装置及び音声認識方法 | |
JP2010267012A (ja) | 音声データ検索システム及び音声データ検索方法 | |
JP6127422B2 (ja) | 音声認識装置及び方法、並びに、半導体集積回路装置 | |
JP4966324B2 (ja) | 音声翻訳装置、および方法 | |
JP5152020B2 (ja) | 音声認識装置及び音声認識方法 | |
JP5293478B2 (ja) | 音声認識用の閾値管理プログラム、音声認識用の閾値管理方法、音声認識装置 | |
JP5196114B2 (ja) | 音声認識装置およびプログラム | |
JP2001312293A (ja) | 音声認識方法およびその装置、並びにコンピュータ読み取り可能な記憶媒体 | |
JP2012255867A (ja) | 音声認識装置 | |
JP5772219B2 (ja) | 音響モデル生成装置、音響モデル生成方法及び音響モデル生成用コンピュータプログラム | |
JP5152016B2 (ja) | 音声認識用辞書作成装置及び音声認識用辞書作成方法 | |
JP6006674B2 (ja) | 音響モデル選択装置とその方法とプログラム | |
JPWO2013125203A1 (ja) | 音声認識装置、音声認識方法およびコンピュータプログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20111006 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20120808 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20120814 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20121012 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20121106 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20121119 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20151214 Year of fee payment: 3 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5152020 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
LAPS | Cancellation because of no payment of annual fees |