JP5406797B2 - 音声認識方法とその装置とプログラム - Google Patents
音声認識方法とその装置とプログラム Download PDFInfo
- Publication number
- JP5406797B2 JP5406797B2 JP2010158472A JP2010158472A JP5406797B2 JP 5406797 B2 JP5406797 B2 JP 5406797B2 JP 2010158472 A JP2010158472 A JP 2010158472A JP 2010158472 A JP2010158472 A JP 2010158472A JP 5406797 B2 JP5406797 B2 JP 5406797B2
- Authority
- JP
- Japan
- Prior art keywords
- word
- reliability
- recognition
- document
- speech recognition
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Description
図9に単語関連度テーブル作成装置150の機能構成例を示す。単語関連度テーブル作成装置150は、学習コーパス81と、形態素解析部82と、学習コーパス単語集合取得部83と、単語リスト84と、単語カウント部85と、単語関連度計算部86と、テーブル配列部87と、を具備する。
Claims (5)
- 入力される音声文書を音声認識処理した単語毎に単語認識信頼度を付与した音声認識結果を出力する音声認識過程と、
上記音声認識結果を入力として音声文書全体の認識信頼度である音声文書認識信頼度を計算して出力する音声認識信頼度計算過程と、
上記音声認識結果と上記音声文書認識信頼度とを入力として所定の音声文書認識信頼度閾値未満の音声文書を除去する音声文書除去過程と、
上記音声文書除去過程で除去されなかった音声文書の音声認識結果から所定の単語認識信頼度閾値未満の単語認識信頼度の単語を除去する単語除去過程と、
を含む音声認識方法において、
上記音声認識信頼度計算過程は、
上記音声認識結果の単語を、その先頭から所定の数n個ずつnより小さい数のm個移動させながら単語集合に分割する単語集合取得ステップと、
上記単語認識信頼度にその単語の継続時間長を乗算して時間正規化を解除した値を足し合わせ、その足し合わせた値を上記単語集合の全単語の継続時間長の総和で除算して単語集合音響信頼度として求める単語集合音響信頼度計算ステップと、
上記音声認識結果に含まれる全ての単語間の組み合わせの2単語間の関連度を表した単語関連度テーブルを参照して上記単語集合に含まれる2単語の組み合わせの関連の強さの平均値を単語集合文脈信頼度として求める単語集合文脈信頼度計算ステップと、
上記音声文書全体の上記単語集合音響信頼度と上記単語集合文脈信頼度とを平均した値を、音声文書認識信頼度として求める信頼度統合ステップと、
を含むことを特徴とする音声認識方法。 - 入力される音声文書を音声認識処理した単語毎に単語認識信頼度を付与した音声認識結果を出力する音声認識過程と、
上記音声認識結果を入力として音声文書全体の認識信頼度である音声文書認識信頼度を計算して出力する音声認識信頼度計算過程と、
上記音声認識結果と上記音声文書認識信頼度とを入力として所定の音声文書認識信頼度閾値未満の音声文書を除去する音声文書除去過程と、
上記音声文書除去過程で除去されなかった音声文書の音声認識結果から所定の単語認識信頼度閾値未満の単語認識信頼度の単語を除去する単語除去過程と、
を含む音声認識方法において、
上記音声認識信頼度計算過程は、
上記音声認識結果の単語を、その先頭から所定の数n個ずつnより小さい数のm個移動
させながら単語集合に分割し、1番目の単語集合に追加する1番目からm番目の単語の直
前重複フラグと直後重複フラグを偽とし、N番目の単語集合に追加する1番目からN・m番目の単語の直前重複フラグを真及び直後重複フラグを偽、N・m+1番目からn+N・m番目の単語の直前重複フラグを偽及び直後重複フラグを真とする単語集合取得ステップと、
上記直後重複フラグが真の単語の上記単語認識信頼度にその単語の継続時間長を乗算して時間正規化を解除した値とその継続時間長を記憶する重複区間記憶ステップと、
上記直前重複フラグが偽で直後重複フラグが真の単語の上記単語認識信頼度にその単語の継続時間長を乗算して時間正規化を解除した値とその継続時間長と、上記重複区間記憶ステップで記憶された値とから当該単語集合の音響信頼度を計算する単語集合音響信頼度高速計算ステップと、
を含むことを特徴とする音声認識方法。 - 入力される音声文書を音声認識処理した単語毎に単語認識信頼度を付与した音声認識結果を出力する音声認識部と、
上記音声認識結果を入力として音声文書全体の認識信頼度である音声文書認識信頼度を計算して出力する音声認識信頼度計算部と、
上記音声認識結果と上記音声文書認識信頼度とを入力として所定の音声文書認識信頼度閾値未満の音声文書を除去するする音声文書除去部と、
上記音声文書除去部で除去されなかった音声文書の音声認識結果から所定の単語認識信頼度閾値未満の単語認識信頼度の単語を除去する単語除去部と、
を具備する音声認識装置において、
上記音声認識信頼度計算部は、
上記音声認識結果の単語を、その先頭から所定の数n個ずつnより小さい数のm個移動させながら単語集合に分割する単語集合取得手段と、
上記単語認識信頼度にその単語の継続時間長を乗算して時間正規化を解除した値を足し合わせ、その足し合わせた値を上記単語集合の全単語の継続時間長の総和で除算して単語集合音響信頼度として求める単語集合音響信頼度計算手段と、
上記音声認識結果に含まれる全ての単語間の組み合わせの2単語間の関連度を表した単語関連度テーブルを参照して上記単語集合に含まれる2単語の組み合わせの関連の強さの平均値を単語集合文脈信頼度として求める単語集合文脈信頼度計算手段と、
上記音声文書全体の上記単語集合音響信頼度と上記単語集合文脈信頼度とを平均した値を、音声文書認識信頼度として求める信頼度統合手段と、
を備えることを特徴とする音声認識装置。 - 入力される音声文書を音声認識処理した単語毎に単語認識信頼度を付与した音声認識結果を出力する音声認識部と、
上記音声認識結果を入力として音声文書全体の認識信頼度である音声文書認識信頼度を計算して出力する音声認識信頼度計算部と、
上記音声認識結果と上記音声文書認識信頼度とを入力として所定の音声文書認識信頼度閾値未満の音声文書を除去するする音声文書除去部と、
上記音声文書除去部で除去されなかった音声文書の音声認識結果から所定の単語認識信頼度閾値未満の単語認識信頼度の単語を除去する単語除去部と、
を具備する音声認識装置において、
上記音声認識信頼度計算部は、
上記音声認識結果の単語を、その先頭から所定の数n個ずつnより小さい数のm個移動
させながら単語集合に分割し、1番目の単語集合に追加する1番目からm番目の単語の直
前重複フラグと直後重複フラグを偽とし、N番目の単語集合に追加する1番目からN・m番目の単語の直前重複フラグを真及び直後重複フラグを偽、N・m+1番目からn+N・m番目の単語の直前重複フラグを偽及び直後重複フラグを真とする単語集合取得手段と、
上記直後重複フラグが真の単語の上記単語認識信頼度にその単語の継続時間長を乗算して時間正規化を解除した値とその継続時間長を記憶する重複区間記憶部と、
上記直前重複フラグが偽で直後重複フラグが真の単語の上記単語認識信頼度にその単語の継続時間長を乗算して時間正規化を解除した値とその継続時間長と、上記重複区間記憶部に記憶された値とから当該単語集合の音響信頼度を計算する単語集合音響信頼度高速計算手段と、
上記音声認識結果に含まれる全ての単語間の組み合わせの2単語間の関連度を表した単語関連度テーブルを参照して上記単語集合に含まれる2単語の組み合わせの関連の強さの平均値を単語集合文脈信頼度として求める単語集合文脈信頼度計算手段と、
上記音声文書全体の上記単語集合の音響信頼度と上記単語集合文脈信頼度とを平均した値を、音声文書認識信頼度として求める信頼度統合手段と、
を備えることを特徴とする音声認識装置。 - 請求項1又は2に記載した音声認識方法を、コンピュータに実行させるためのプログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2010158472A JP5406797B2 (ja) | 2010-07-13 | 2010-07-13 | 音声認識方法とその装置とプログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2010158472A JP5406797B2 (ja) | 2010-07-13 | 2010-07-13 | 音声認識方法とその装置とプログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2012022069A JP2012022069A (ja) | 2012-02-02 |
JP5406797B2 true JP5406797B2 (ja) | 2014-02-05 |
Family
ID=45776413
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2010158472A Expired - Fee Related JP5406797B2 (ja) | 2010-07-13 | 2010-07-13 | 音声認識方法とその装置とプログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP5406797B2 (ja) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP6532619B2 (ja) * | 2017-01-18 | 2019-06-19 | 三菱電機株式会社 | 音声認識装置 |
JP6811865B2 (ja) * | 2017-08-08 | 2021-01-13 | 三菱電機株式会社 | 音声認識装置および音声認識方法 |
Family Cites Families (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP1207517B1 (en) * | 2000-11-16 | 2007-01-03 | Sony Deutschland GmbH | Method for recognizing speech |
JP3819896B2 (ja) * | 2003-11-14 | 2006-09-13 | 日本電信電話株式会社 | 音声認識方法、この方法を実施する装置、プログラムおよび記録媒体 |
-
2010
- 2010-07-13 JP JP2010158472A patent/JP5406797B2/ja not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
JP2012022069A (ja) | 2012-02-02 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6066354B2 (ja) | 信頼度計算の方法及び装置 | |
JPS63259697A (ja) | 音声認識方法 | |
JP2007256342A (ja) | クラスタリングシステム、クラスタリング方法、クラスタリングプログラムおよびクラスタリングシステムを用いた属性推定システム | |
WO2018192186A1 (zh) | 语音识别方法及装置 | |
JP6622681B2 (ja) | 音素崩れ検出モデル学習装置、音素崩れ区間検出装置、音素崩れ検出モデル学習方法、音素崩れ区間検出方法、プログラム | |
KR20100130263A (ko) | 음성 인식용 발음사전 확장 장치 및 방법 | |
Khan et al. | An intelligent system for spoken term detection that uses belief combination | |
JP2018077440A (ja) | 音声認識装置、音声認識方法およびプログラム | |
CN107610693A (zh) | 文本语料库的构建方法和装置 | |
Sadeghian et al. | Towards an automatic speech-based diagnostic test for Alzheimer’s disease | |
JP5406797B2 (ja) | 音声認識方法とその装置とプログラム | |
JP5149941B2 (ja) | 音声認識方法とその装置とプログラム | |
JP5546565B2 (ja) | 単語追加装置、単語追加方法、およびプログラム | |
KR20130126570A (ko) | 핵심어에서의 음소 오류 결과를 고려한 음향 모델 변별 학습을 위한 장치 및 이를 위한 방법이 기록된 컴퓨터 판독 가능한 기록매체 | |
Tejedor et al. | Search on speech from spoken queries: the multi-domain International ALBAYZIN 2018 query-by-example spoken term detection evaluation | |
US20050246172A1 (en) | Acoustic model training method and system | |
JP2011248107A (ja) | 音声認識結果検索方法とその装置とプログラム | |
JP2005275348A (ja) | 音声認識方法、この方法を実施する装置、プログラムおよび記録媒体 | |
JP4478925B2 (ja) | 音声認識結果の信頼度検証装置、コンピュータプログラム、及びコンピュータ | |
JP2004157337A (ja) | トピック境界決定方法及び装置及びトピック境界決定プログラム | |
JP5308102B2 (ja) | 誤り数別識別スコア・事後確率計算方法と、その方法を用いた誤り数重み付き識別学習装置とその方法と、その装置を用いた音声認識装置と、プログラムと記録媒体 | |
Ravi et al. | Phoneme segmentation-based unsupervised pattern discovery and clustering of speech signals | |
JP5325176B2 (ja) | 2チャネル音声の音声認識方法とその装置とプログラム | |
JP2005173008A (ja) | 音声解析処理およびそれを用いた音声処理装置および媒体 | |
JP7259988B2 (ja) | 検知装置、その方法、およびプログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20121101 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20130610 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20130618 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20130718 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20130827 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20130828 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20130920 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20131022 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20131101 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5406797 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
S531 | Written request for registration of change of domicile |
Free format text: JAPANESE INTERMEDIATE CODE: R313531 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
LAPS | Cancellation because of no payment of annual fees |