JP4820240B2 - 単語分類装置及び音声認識装置及び単語分類プログラム - Google Patents
単語分類装置及び音声認識装置及び単語分類プログラム Download PDFInfo
- Publication number
- JP4820240B2 JP4820240B2 JP2006231471A JP2006231471A JP4820240B2 JP 4820240 B2 JP4820240 B2 JP 4820240B2 JP 2006231471 A JP2006231471 A JP 2006231471A JP 2006231471 A JP2006231471 A JP 2006231471A JP 4820240 B2 JP4820240 B2 JP 4820240B2
- Authority
- JP
- Japan
- Prior art keywords
- word
- class
- context
- merging
- classes
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Landscapes
- Machine Translation (AREA)
- Document Processing Apparatus (AREA)
Description
R.Kneser and H.Ney,"Improved Clustering Techniques for Class−based Statistical Language Modeing,"Eurospeech93,PP.993−996,1993. L.Saul and F.Pereira,"Aggregate and Mixed−order Markov Models for Statistical Language Processing,"Proceedings of the 2nd International Conference on Empirical Methods in Natural Language Processing,pp.81−89,1997 北研二,"確率的言語モデル"東京大学出版,pp.57−62,1999 伊藤秀一ほか,"モデル選択"岩波書店,pp.108−113,2005 下平英寿ほか,"モデル選択"岩波書店,pp.24−25,2005
単語リストとして与えられた複数の単語について、学習テキストにおいて前記単語リストとして与えられた前記単語の前後の単語列である文脈の異なりに応じて複数の文脈クラスを設定する文脈クラス設定手段と、
任意の単語が所属する文脈クラスと他の文脈クラスとを併合したときの尤度を計算して最適の組み合わせの文脈クラスを併合する文脈クラス併合手段と、
併合された文脈クラスに基づいて割り当てた単語クラスのうち、任意の単語クラスと他の単語クラスとを併合したときの尤度を計算して最適の組み合わせの単語クラスを併合する単語クラス併合手段と、
併合された単語クラスを用いて統計的手順により言語モデルを生成する言語モデル生成手段を有することにより、同じ表記で異なる意味を持つ単語の取り扱いができ、言語モデルにおける確率値の計算時間を短縮することができる。
単語リストとして与えられた複数の単語について、学習テキストにおいて前記単語リストとして与えられた前記単語の前後の単語列である文脈の異なりに応じて複数の文脈クラスを設定する文脈クラス設定手段、
任意の単語が所属する文脈クラスと他の文脈クラスとを併合したときの尤度を計算して最適の組み合わせの文脈クラスを併合する文脈クラス併合手段、
併合された文脈クラスに基づいて割り当てた単語クラスのうち、任意の単語クラスと他の単語クラスとを併合したときの尤度を計算して最適の組み合わせの単語クラスを併合する単語クラス併合手段、
併合された単語クラスを用いて統計的手順により言語モデルを生成する言語モデル生成手段、として機能させることができる。
本発明では、学習テキストと予め定められた語彙を用いて、
(1)単語を文脈にしたがって分類し、文脈クラスを統計的に推定する。
(2)上記にしたがって文脈分類されたクラスをマージし、単語クラスを統計的に推定する。
図2は、本発明の単語分類装置を含む音声認識装置のハードウェア構成を示す一実施形態のブロック図を示す。音声認識装置は、専用の装置構成とすることもできるが、例えば、汎用のパーソナルコンピュータ、ワークステーション等を適用することができる。
図3は、本発明の音声認識装置の一実施形態の機能構成図を示す。同図中、学習テキスト21は予め補助記憶装置14に格納されており、補助記憶装置14からメモリ装置15内の所定領域に転送される。また、入力装置11から音声認識させたい語彙及び文脈クラスを求めたい単語リストが入力されメモリ装置15内の所定領域に格納される。演算処理装置16で実行されるプログラムである分類部22すなわち本発明の単語分類装置によって所定領域の学習テキスト21が演算処理装置16内で処理されて適切な単語クラスに分類され、分類された単語クラスが当該単語に属性として付与され、言語モデル23としてデータベース17に格納される。
ただし、d’は併合による分類後の文脈クラス数、Nは学習テキスト21の総単語数である。P(yk|x)は文脈xが与えられたときの文脈クラスykの条件付き確率を表し、(1),(2)式の右辺第1項は対数尤度であり、右辺第2項は併合したことによるペナルティである。また、尤度L’MDL,L’AICは値が小さいほど尤もらしいことを表す。
この差分△MDLが最大となる併合を最適とする。
(5)式をすべての単語クラスの併合に対して計算し、ΔMDLが最大となる併合を最適とする。もし、ΔMDLが予め定められた閾値を下回ったときは、ステップS24からステップS26に進んで、単語クラス33を結果として出力する。
ここで、クラストライグラムは(6a)式の単語トライグラムに対して、マルコフ性を単語ではなく単語クラスで表現し、単語は所属する単語クラスの出現確率に依存するとしたもので、(6c)式のようになる。本実施形態では、単語ωiに対応する単語クラスは複数存在する。このため、単語列ωの確率P(ω)を(6c)式が最大となるような単語クラス列c^を演算処理装置16で求める。
12 出力装置
13 ドライブ装置
14 補助記憶装置
15 メモリ装置
16 演算処理装置
17 データベース
18 システムバス
19 記憶媒体
21 学習テキスト
22 分類部
23 言語モデル
24 音響モデル
25 音声認識部
26 入力音声
27 単語列
30 文脈分類部
31 文脈クラス
32 単語分類部
33 単語クラス
34 言語モデル学習部
Claims (3)
- 単語リストとして与えられた複数の単語について、学習テキストにおいて前記単語リストとして与えられた前記単語の前後の単語列である文脈の異なりに応じて複数の文脈クラスを設定する文脈クラス設定手段と、
任意の単語が所属する文脈クラスと他の文脈クラスとを併合したときの尤度を計算して最適の組み合わせの文脈クラスを併合する文脈クラス併合手段と、
併合された文脈クラスに基づいて割り当てた単語クラスのうち、任意の単語クラスと他の単語クラスとを併合したときの尤度を計算して最適の組み合わせの単語クラスを併合する単語クラス併合手段と、
併合された単語クラスを用いて統計的手順により言語モデルを生成する言語モデル生成手段を
有することを特徴とする単語分類装置。 - 請求項1記載の単語分類装置で生成した言語モデルを用いて音声認識を行う音声認識手段を
有することを特徴とする音声認識装置。 - コンピュータを、
単語リストとして与えられた複数の単語について、学習テキストにおいて前記単語リストとして与えられた前記単語の前後の単語列である文脈の異なりに応じて複数の文脈クラスを設定する文脈クラス設定手段、
任意の単語が所属する文脈クラスと他の文脈クラスとを併合したときの尤度を計算して最適の組み合わせの文脈クラスを併合する文脈クラス併合手段、
併合された文脈クラスに基づいて割り当てた単語クラスのうち、任意の単語クラスと他の単語クラスとを併合したときの尤度を計算して最適の組み合わせの単語クラスを併合する単語クラス併合手段、
併合された単語クラスを用いて統計的手順により言語モデルを生成する言語モデル生成手段、
として機能させるための単語分類プログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2006231471A JP4820240B2 (ja) | 2006-08-29 | 2006-08-29 | 単語分類装置及び音声認識装置及び単語分類プログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2006231471A JP4820240B2 (ja) | 2006-08-29 | 2006-08-29 | 単語分類装置及び音声認識装置及び単語分類プログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2008058341A JP2008058341A (ja) | 2008-03-13 |
JP4820240B2 true JP4820240B2 (ja) | 2011-11-24 |
Family
ID=39241197
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2006231471A Expired - Fee Related JP4820240B2 (ja) | 2006-08-29 | 2006-08-29 | 単語分類装置及び音声認識装置及び単語分類プログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP4820240B2 (ja) |
Families Citing this family (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP4941495B2 (ja) * | 2009-03-31 | 2012-05-30 | 日本電気株式会社 | ユーザ辞書作成システム、方法、及び、プログラム |
JP5184467B2 (ja) * | 2009-08-31 | 2013-04-17 | 日本放送協会 | 適応化音響モデル生成装置及びプログラム |
CN102256125B (zh) * | 2011-07-14 | 2013-06-05 | 北京工业大学 | 面向高效视频编码hevc基于上下文的自适应算数编码方法 |
KR101410163B1 (ko) * | 2013-01-02 | 2014-06-20 | 포항공과대학교 산학협력단 | 통계적 음성 언어 이해 방법 |
JP6366166B2 (ja) * | 2014-01-27 | 2018-08-01 | 日本放送協会 | 音声認識装置、及びプログラム |
WO2023073886A1 (ja) * | 2021-10-28 | 2023-05-04 | 日本電気株式会社 | 情報処理システム、情報処理装置、情報処理方法、及び記録媒体 |
Family Cites Families (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP1016077B1 (de) * | 1997-09-17 | 2001-05-16 | Siemens Aktiengesellschaft | Verfahren zur bestimmung einer wahrscheinlichkeit für das auftreten einer folge von mindestens zwei wörtern bei einer spracherkennung |
JPH11143875A (ja) * | 1997-11-10 | 1999-05-28 | Nec Corp | 単語自動分類装置及び単語自動分類方法 |
JP2006003413A (ja) * | 2004-06-15 | 2006-01-05 | Nippon Telegr & Teleph Corp <Ntt> | 音声自動応答方法、この方法を実施する装置、音声自動応答プログラムおよびその記録媒体 |
-
2006
- 2006-08-29 JP JP2006231471A patent/JP4820240B2/ja not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
JP2008058341A (ja) | 2008-03-13 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US10134388B1 (en) | Word generation for speech recognition | |
JP6493866B2 (ja) | 情報処理装置、情報処理方法、およびプログラム | |
CN113692616B (zh) | 用于在端到端模型中的跨语言语音识别的基于音素的场境化 | |
JP4215418B2 (ja) | 単語予測方法、音声認識方法、その方法を用いた音声認識装置及びプログラム | |
US20060129397A1 (en) | System and method for identifying semantic intent from acoustic information | |
JP2004362584A (ja) | テキストおよび音声の分類のための言語モデルの判別トレーニング | |
JP2001101187A (ja) | 翻訳装置および翻訳方法、並びに記録媒体 | |
JP2002287787A (ja) | 明確化言語モデル | |
JP2001100781A (ja) | 音声処理装置および音声処理方法、並びに記録媒体 | |
JP2007115145A (ja) | 会話制御装置 | |
JP2002041080A (ja) | 単語予測方法、音声認識方法、単語予測装置、音声認識装置、コンピュータ・システム、記憶媒体およびプログラム伝送装置 | |
JP5799733B2 (ja) | 認識装置、認識プログラムおよび認識方法 | |
JP4820240B2 (ja) | 単語分類装置及び音声認識装置及び単語分類プログラム | |
JP7544989B2 (ja) | ルックアップテーブルリカレント言語モデル | |
JP3660512B2 (ja) | 音声認識方法、その装置及びプログラム記録媒体 | |
JP3961780B2 (ja) | 言語モデル学習装置およびそれを用いた音声認識装置 | |
JP4653598B2 (ja) | 構文・意味解析装置、音声認識装置、及び構文・意味解析プログラム | |
JP2001075964A (ja) | 情報処理装置および情報処理方法、並びに記録媒体 | |
Rudzionis et al. | Web services based hybrid recognizer of Lithuanian voice commands | |
JP4528540B2 (ja) | 音声認識方法及び装置及び音声認識プログラム及び音声認識プログラムを格納した記憶媒体 | |
US20210407511A1 (en) | Systems and methods related to automated transcription of voice communications | |
JP2006107353A (ja) | 情報処理装置および方法、記録媒体、並びにプログラム | |
JPH11143493A (ja) | 音声言語理解装置及び音声言語理解システム | |
JP6276516B2 (ja) | 辞書作成装置、及び辞書作成プログラム | |
JP4674609B2 (ja) | 情報処理装置および方法、プログラム、並びに記録媒体 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20081029 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20100921 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20101109 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20101222 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20110809 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20110902 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20140909 Year of fee payment: 3 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 4820240 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
LAPS | Cancellation because of no payment of annual fees |