JPH0535722A - 学習単語決定方法 - Google Patents
学習単語決定方法Info
- Publication number
- JPH0535722A JPH0535722A JP3192155A JP19215591A JPH0535722A JP H0535722 A JPH0535722 A JP H0535722A JP 3192155 A JP3192155 A JP 3192155A JP 19215591 A JP19215591 A JP 19215591A JP H0535722 A JPH0535722 A JP H0535722A
- Authority
- JP
- Japan
- Prior art keywords
- word
- characters
- transition matrix
- learning
- probability transition
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Landscapes
- Machine Translation (AREA)
- Document Processing Apparatus (AREA)
Abstract
(57)【要約】
【目的】 この発明は音声・文字認識方法に関し、認識
対象の特徴を学習しながら逐次単語を決定していく学習
単語決定方法に関する。 【構成】 音声・文字などの認識において、単語候補領
域の認識結果候補から単語を決定する際、確率遷移行列
を用いて単語を先頭の文字から逐次決定していくと同時
に、現れた文字の組み合わせを学習テーブルにカウント
しておいて、ある程度の数の単語が確定した段階で、学
習テーブルから確率遷移行列の各出現頻度を再計算する
ことにより、認識対象の特徴を学習しながら逐次単語を
決定していくことを特徴とする。
対象の特徴を学習しながら逐次単語を決定していく学習
単語決定方法に関する。 【構成】 音声・文字などの認識において、単語候補領
域の認識結果候補から単語を決定する際、確率遷移行列
を用いて単語を先頭の文字から逐次決定していくと同時
に、現れた文字の組み合わせを学習テーブルにカウント
しておいて、ある程度の数の単語が確定した段階で、学
習テーブルから確率遷移行列の各出現頻度を再計算する
ことにより、認識対象の特徴を学習しながら逐次単語を
決定していくことを特徴とする。
Description
【0001】
【産業上の利用分野】本発明は音声・文字などを認識す
る認識装置に関し、詳しくは音声・文字認識における単
語の学習方法に関する。
る認識装置に関し、詳しくは音声・文字認識における単
語の学習方法に関する。
【0002】
【従来の技術】従来の音声・文字認識装置では、言語処
理段階において認識結果候補から文字を決定する際に
は、あらかじめ大量の教師文章データから作成した内容
固定の確率遷移行列を使用している。
理段階において認識結果候補から文字を決定する際に
は、あらかじめ大量の教師文章データから作成した内容
固定の確率遷移行列を使用している。
【0003】
【発明が解決しようとする課題】しかしながら上記手法
では、確率遷移行列の作成に用いた教師文章データにお
いて出現頻度が低かった単語(固有名刺や専門用語な
ど)が何度も繰り返し現れる特殊な認識対象に対して
は、それらの単語についていつも同じ認識間違いが生じ
るため、何度も同じ作業をしなければならないという問
題点がある。
では、確率遷移行列の作成に用いた教師文章データにお
いて出現頻度が低かった単語(固有名刺や専門用語な
ど)が何度も繰り返し現れる特殊な認識対象に対して
は、それらの単語についていつも同じ認識間違いが生じ
るため、何度も同じ作業をしなければならないという問
題点がある。
【0004】
【課題を解決するための手段】本発明は以上の事情を考
慮してなされたもので、上記問題点を解消し、認識対象
の特徴を学習しながら逐次単語を決定していく学習単語
決定方法を提供する。
慮してなされたもので、上記問題点を解消し、認識対象
の特徴を学習しながら逐次単語を決定していく学習単語
決定方法を提供する。
【0005】本発明では、最初に教師文章データから作
成した確率遷移行列を用いて単語を決定していき、間違
いの部分の修正作業後、確定した単語の各文字の組み合
わせを学習テーブルにカウントしておき、ある一定の間
隔で学習テーブルの内容から確率遷移行列の出現頻度を
再計算して、現在の認識対象の特徴を学習させることに
より、上記問題点を解決する。
成した確率遷移行列を用いて単語を決定していき、間違
いの部分の修正作業後、確定した単語の各文字の組み合
わせを学習テーブルにカウントしておき、ある一定の間
隔で学習テーブルの内容から確率遷移行列の出現頻度を
再計算して、現在の認識対象の特徴を学習させることに
より、上記問題点を解決する。
【0006】
【実施例】以下図に示す実施例に基づいてこの発明を詳
述する。なお、これによってこの発明は限定されるもの
ではない。図1はこの発明における学習単語決定方法を
実現するための光学的文字読み取り装置の構成を示すブ
ロック図である。同図において、10は言語処理部であ
り、後述する確率遷移行列(3文字および2文字の組み
合わせの出現頻度テーブル)を用いて、認識文字候補か
ら単語を確定する。
述する。なお、これによってこの発明は限定されるもの
ではない。図1はこの発明における学習単語決定方法を
実現するための光学的文字読み取り装置の構成を示すブ
ロック図である。同図において、10は言語処理部であ
り、後述する確率遷移行列(3文字および2文字の組み
合わせの出現頻度テーブル)を用いて、認識文字候補か
ら単語を確定する。
【0007】11は学習部であり、確定した単語から学
習テーブル(3文字および2文字の組み合わせの出現回
数テーブルおよび出現回数合計)をカウントする。もし
確定単語の数が、あらかじめ決められている値を越えた
ら、学習テーブルより確率遷移行列を再計算する。12
は処理中の内容を記憶するための作業用メモである。1
3はマイクロプロセッサから構成されるCPU14を介
して上記各ブロックを制御するための制御部である。
習テーブル(3文字および2文字の組み合わせの出現回
数テーブルおよび出現回数合計)をカウントする。もし
確定単語の数が、あらかじめ決められている値を越えた
ら、学習テーブルより確率遷移行列を再計算する。12
は処理中の内容を記憶するための作業用メモである。1
3はマイクロプロセッサから構成されるCPU14を介
して上記各ブロックを制御するための制御部である。
【0008】15は確率遷移行列を記憶している確率遷
移行列メモリである。n文字の確率遷移行列とは、全て
の文字種のn個の組み合わせの、教師文章中での出現頻
度を表したものであり、各出現頻度は次式でもとめられ
る。 C(w1,w2……,)=N(w1,w2……, wn)/N
total C(w1,w2……,wn)は文字w1,w2……,wnの組み
合わせの出現頻度を示し、N(w1,w2……,wn)は文
字w1,w2……,wnの組み合わせの出現頻度を示し、N
totalは全ての文字の組み合わせの出現回数を示してい
る。
移行列メモリである。n文字の確率遷移行列とは、全て
の文字種のn個の組み合わせの、教師文章中での出現頻
度を表したものであり、各出現頻度は次式でもとめられ
る。 C(w1,w2……,)=N(w1,w2……, wn)/N
total C(w1,w2……,wn)は文字w1,w2……,wnの組み
合わせの出現頻度を示し、N(w1,w2……,wn)は文
字w1,w2……,wnの組み合わせの出現頻度を示し、N
totalは全ての文字の組み合わせの出現回数を示してい
る。
【0009】認識処理によって得られた文字列W=w1,
w2……, wnの生起確率P(W)は、2文字の確率遷移
行列と3文字の確率遷移行列とを用いて次式で求められ
る。
w2……, wnの生起確率P(W)は、2文字の確率遷移
行列と3文字の確率遷移行列とを用いて次式で求められ
る。
【0010】このように、ある文章中の文字数nの文字
列(単語)が、文字列W=“w1,w 2……,wn”である
確率(文字列Wの生起確率P(W))は、その文章中に
存在する文字列Wの総数を、文字数nの文字列の総数で
割ることで求められる。文字数nの全ての組み合わせの
文字列についての生起確率を求めたものが、n文字の確
率遷移行列(Ngram)である。
列(単語)が、文字列W=“w1,w 2……,wn”である
確率(文字列Wの生起確率P(W))は、その文章中に
存在する文字列Wの総数を、文字数nの文字列の総数で
割ることで求められる。文字数nの全ての組み合わせの
文字列についての生起確率を求めたものが、n文字の確
率遷移行列(Ngram)である。
【0011】ところで、任意の文字数の文字列Wの生起
確率を求めようとした場合、あらゆる文字数の確率遷移
行列を用意しなければならないが、これは莫大な大きさ
となり実際には実現不可能である。そこで一般的には、
3文字の確率遷移行列(trigram)と2文字の確
率遷移行列(digram)を用いて、n文字の文字列
Wの生起確率を近似することが行われる。それが上記の
式P(W)である。
確率を求めようとした場合、あらゆる文字数の確率遷移
行列を用意しなければならないが、これは莫大な大きさ
となり実際には実現不可能である。そこで一般的には、
3文字の確率遷移行列(trigram)と2文字の確
率遷移行列(digram)を用いて、n文字の文字列
Wの生起確率を近似することが行われる。それが上記の
式P(W)である。
【0012】例えば、文字列“table ”の生起確率P
("table")は、次のようになります。 この式は、(文字列“tab”の出現する確率)×
(文字列“ab”の後に文字“l ”の続く確率)×(文
字列“bl ”の後に文字“e”の続く確率)という意味
を表している。
("table")は、次のようになります。 この式は、(文字列“tab”の出現する確率)×
(文字列“ab”の後に文字“l ”の続く確率)×(文
字列“bl ”の後に文字“e”の続く確率)という意味
を表している。
【0013】また、16は学習テーブルである。学習テ
ーブルとは、上記の確率遷移行列の各要素を出現頻度の
かわりに出現回数としたものである。学習テーブル16
は、最初は確率遷移行列の作成に用いた教師文章データ
の各文字の組み合わせの出現回数で初期化されている。
認識によって単語が決定されると同時にその決定された
単語の文字の組み合わせが学習テーブル16でカウント
され、ある一定の間隔でその学習テーブル16から確率
遷移行列の出現頻度が再計算される。
ーブルとは、上記の確率遷移行列の各要素を出現頻度の
かわりに出現回数としたものである。学習テーブル16
は、最初は確率遷移行列の作成に用いた教師文章データ
の各文字の組み合わせの出現回数で初期化されている。
認識によって単語が決定されると同時にその決定された
単語の文字の組み合わせが学習テーブル16でカウント
され、ある一定の間隔でその学習テーブル16から確率
遷移行列の出現頻度が再計算される。
【0014】通常、教師文章データから確率遷移行列を
作成したときの学習テーブル16の各出現回数は極めて
大きな値であり、それに比べて決定単語から更新した学
習テーブル16の変更は微々たるものなので、このまま
では学習結果は確率遷移行列へほとんど反映されない。
そこで、最初に教師文章データから確率遷移行列を作成
する場合も含めて、出現頻度を計算する前には出現回数
の合計Ntotalが常にある一定の値になるよう出現回数
を正規化しておく。
作成したときの学習テーブル16の各出現回数は極めて
大きな値であり、それに比べて決定単語から更新した学
習テーブル16の変更は微々たるものなので、このまま
では学習結果は確率遷移行列へほとんど反映されない。
そこで、最初に教師文章データから確率遷移行列を作成
する場合も含めて、出現頻度を計算する前には出現回数
の合計Ntotalが常にある一定の値になるよう出現回数
を正規化しておく。
【0015】出現回数の合計Ntotalが常にある一定の
値になるようにするとは具体的には以下のとおりであ
る。すなわち、学習前の3文字および2文字の組み合わ
せの出現回数と出現回数合計をそれぞれ N03(w1,w2,w3)、N02(w1,w2)、N03total、N02total
値になるようにするとは具体的には以下のとおりであ
る。すなわち、学習前の3文字および2文字の組み合わ
せの出現回数と出現回数合計をそれぞれ N03(w1,w2,w3)、N02(w1,w2)、N03total、N02total
【0016】また、学習後の3文字および2文字の組み
合わせの出現回数と出現回数合計の増加分をそれぞれ Nd3(w1,w2,w3) 、Nd2(w1,w2)、Nd3total、Nd2total とすると、学習後の3文字および2文字の組み合わせの
出現頻度C3、C2は、以下の式で求められます。
合わせの出現回数と出現回数合計の増加分をそれぞれ Nd3(w1,w2,w3) 、Nd2(w1,w2)、Nd3total、Nd2total とすると、学習後の3文字および2文字の組み合わせの
出現頻度C3、C2は、以下の式で求められます。
【0017】
【0018】ところで、一般的にN03、N02、N
03total 、N02totalはNd3、Nd2、Nd3t otal 、N
d2totalに比べて極めて大きい値なので、このままでは
C3、C2の値をNd3total 、Nd2totalに対して意味を
持つ程度の小さな値に変更し、それに合わせてN03、N
02の各値も補正しておく。N03total 、N02totalの値
を、N03' total、N02'totalへ変更した場合、N03、N
02の各値の補正は以下の式で行う。
03total 、N02totalはNd3、Nd2、Nd3t otal 、N
d2totalに比べて極めて大きい値なので、このままでは
C3、C2の値をNd3total 、Nd2totalに対して意味を
持つ程度の小さな値に変更し、それに合わせてN03、N
02の各値も補正しておく。N03total 、N02totalの値
を、N03' total、N02'totalへ変更した場合、N03、N
02の各値の補正は以下の式で行う。
【0019】 ここで、N03'total、N02'total の具体的な値は、
学習サイクル(何単語確定、学習したら出現頻度を再計
算するか)とともにあらかじめ適当な値に決めておく。
学習サイクル(何単語確定、学習したら出現頻度を再計
算するか)とともにあらかじめ適当な値に決めておく。
【0020】図2は、ある認識領域における各単語矩形
領域と各文字認定候補が与えられて、その認識領域内の
全単語が決定するまでを示すフローチャートである。こ
れに沿って、本発明の動作の詳細を説明する。
領域と各文字認定候補が与えられて、その認識領域内の
全単語が決定するまでを示すフローチャートである。こ
れに沿って、本発明の動作の詳細を説明する。
【0021】まず、認識領域内に次の単語候補があるか
どうかを判断し(ステップ30)、yesであればステ
ップ31に、無ければ終了する。次いで単語候補内に次
の文字候補があるかどうかを判断し(ステップ31)、
noであればステップ33に移る。yesであれば確率
遷移行列を用いて認識結果候補の中から文字を決定する
(ステップ32)。ステップ33においてここまで決定
している文字列が妥当(他の候補が無い、類似度が極め
て高いなど)なら、単語として決定してステップ35へ
行く。
どうかを判断し(ステップ30)、yesであればステ
ップ31に、無ければ終了する。次いで単語候補内に次
の文字候補があるかどうかを判断し(ステップ31)、
noであればステップ33に移る。yesであれば確率
遷移行列を用いて認識結果候補の中から文字を決定する
(ステップ32)。ステップ33においてここまで決定
している文字列が妥当(他の候補が無い、類似度が極め
て高いなど)なら、単語として決定してステップ35へ
行く。
【0022】ステップ33においてyesならば複数候
補の中から目視で選択する、間違っている部分に直接入
力して修正する、などにより正しい単語を決定する(ス
テップ34)。ステップ35において決定した単語の各
文字の組み合わせを学習テーブル16にカウントする。
補の中から目視で選択する、間違っている部分に直接入
力して修正する、などにより正しい単語を決定する(ス
テップ34)。ステップ35において決定した単語の各
文字の組み合わせを学習テーブル16にカウントする。
【0023】学習テーブルにカウントする処理につい
て、確定した単語が「School」の場合を例にとり説明す
る。この場合、3文字および2文字の組み合わせの出現
回数テーブルN3(w1,w2,w3)、N2(w1,w2)と、3文字
および2文字の組み合わせの出現回数合計N03total 、
N02totalを、次のように変更する。
て、確定した単語が「School」の場合を例にとり説明す
る。この場合、3文字および2文字の組み合わせの出現
回数テーブルN3(w1,w2,w3)、N2(w1,w2)と、3文字
および2文字の組み合わせの出現回数合計N03total 、
N02totalを、次のように変更する。
【0024】N3(S,c,h)、N3(c,h,o)、N3(h,o,
o)、N3(o,o,l)を1ずつ増やす。N2(S,c)、N
2(c,h)、N2(h,o) 、N2(o,o)、N2(o,l)を1ず
つ増やす。N03totalを4(単語の長さ−2)増やす。
N02totalを5(単語の長さ−1)増やす。
o)、N3(o,o,l)を1ずつ増やす。N2(S,c)、N
2(c,h)、N2(h,o) 、N2(o,o)、N2(o,l)を1ず
つ増やす。N03totalを4(単語の長さ−2)増やす。
N02totalを5(単語の長さ−1)増やす。
【0025】次いで決定した単語の数がある規定の数に
達したかどうかを判断し(ステップ36)、規定の数に
達したら、学習テーブル16の各出現回数をその合計が
ある一定の値になるよう正規化し、その後、学習テーブ
ル16より確率遷移行列の各出現頻度を再計算する。
(ステップ37)。
達したかどうかを判断し(ステップ36)、規定の数に
達したら、学習テーブル16の各出現回数をその合計が
ある一定の値になるよう正規化し、その後、学習テーブ
ル16より確率遷移行列の各出現頻度を再計算する。
(ステップ37)。
【0026】
【発明の効果】従来の音声・文字認識装置では、言語処
理で用いる確率遷移行列の内容が固定であったため、認
識対象が特殊な場合には同じ認識間違いを何度も繰り返
し、その都度、オペレーターの手動操作による修正作業
が必要であった。本発明によれば、確率遷移行列をその
認識対象にあわせて学習させて行くため、よく起こる間
違いについては何度も同じ修正をする必要が無くなり、
オペレーターの作業負担が軽減されるとともに単語認識
率が向上する。
理で用いる確率遷移行列の内容が固定であったため、認
識対象が特殊な場合には同じ認識間違いを何度も繰り返
し、その都度、オペレーターの手動操作による修正作業
が必要であった。本発明によれば、確率遷移行列をその
認識対象にあわせて学習させて行くため、よく起こる間
違いについては何度も同じ修正をする必要が無くなり、
オペレーターの作業負担が軽減されるとともに単語認識
率が向上する。
【図1】この発明の学習単語決定方法を実現するための
装置構成図である。
装置構成図である。
【図2】この発明の一実施例の動作を説明するフローチ
ャートである。
ャートである。
10 言語処理部 11 学習部 12 作業用メモリ 13 制御部 14 CPU 15 確率遷移行列メモリ 16 学習テーブル
Claims (1)
- 【特許請求の範囲】 【請求項1】 音声・文字などの認識において、単語候
補領域の認識結果候補から単語を決定する際、確率遷移
行列を用いて単語を先頭の文字から逐次決定していくと
同時に、現れた文字の組み合わせを学習テーブルにカウ
ントしておいて、ある程度の数の単語が決定した段階
で、学習テーブルから確率遷移行列の各出現頻度を再計
算することにより、認識対象の特徴を学習しながら逐次
単語を決定していく学習単語決定方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP19215591A JP3184568B2 (ja) | 1991-07-31 | 1991-07-31 | 確率遷移行列の出現頻度計算方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP19215591A JP3184568B2 (ja) | 1991-07-31 | 1991-07-31 | 確率遷移行列の出現頻度計算方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
JPH0535722A true JPH0535722A (ja) | 1993-02-12 |
JP3184568B2 JP3184568B2 (ja) | 2001-07-09 |
Family
ID=16286614
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP19215591A Expired - Fee Related JP3184568B2 (ja) | 1991-07-31 | 1991-07-31 | 確率遷移行列の出現頻度計算方法 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP3184568B2 (ja) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2012212276A (ja) * | 2011-03-31 | 2012-11-01 | Denso It Laboratory Inc | 学習装置、学習方法、及び学習プログラム |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS62165267A (ja) * | 1986-01-17 | 1987-07-21 | Ricoh Co Ltd | 音声ワ−ドプロセツサ装置 |
JPH01287771A (ja) * | 1988-05-13 | 1989-11-20 | Matsushita Electric Ind Co Ltd | 形態素解析装置 |
-
1991
- 1991-07-31 JP JP19215591A patent/JP3184568B2/ja not_active Expired - Fee Related
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS62165267A (ja) * | 1986-01-17 | 1987-07-21 | Ricoh Co Ltd | 音声ワ−ドプロセツサ装置 |
JPH01287771A (ja) * | 1988-05-13 | 1989-11-20 | Matsushita Electric Ind Co Ltd | 形態素解析装置 |
Also Published As
Publication number | Publication date |
---|---|
JP3184568B2 (ja) | 2001-07-09 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111310443B (zh) | 一种文本纠错方法和系统 | |
JP5462001B2 (ja) | 文脈上の入力方法 | |
JP4864712B2 (ja) | ユーザインタフェースを有するインテリジェント音声認識 | |
US20110035210A1 (en) | Conditional random fields (crf)-based relation extraction system | |
US20040006465A1 (en) | Dynamic semantic control of a speech recognition system | |
US11380315B2 (en) | Characterizing accuracy of ensemble models for automatic speech recognition by determining a predetermined number of multiple ASR engines based on their historical performance | |
JP2991178B2 (ja) | 音声ワープロ | |
US7010486B2 (en) | Speech recognition system, training arrangement and method of calculating iteration values for free parameters of a maximum-entropy speech model | |
CN110929514B (zh) | 文本校对方法、装置、计算机可读存储介质及电子设备 | |
JPH0535722A (ja) | 学習単語決定方法 | |
US11024315B2 (en) | Characterizing accuracy of ensemble models for automatic speech recognition | |
JPS60189565A (ja) | 仮名漢字変換装置 | |
WO2023087702A1 (zh) | 一种表格证件影像件的文本识别方法及计算设备 | |
Cortes et al. | Lattice kernels for spoken-dialog classification | |
WO2021196835A1 (zh) | 提取时间字符串的方法、装置、计算机设备及存储介质 | |
CN110600011B (zh) | 一种语音识别方法、装置和计算机可读存储介质 | |
JP3080066B2 (ja) | 文字認識装置、方法及び記憶媒体 | |
KR100977000B1 (ko) | 업데이트된 주소의 음성 인식 그래마 자동 생성 방법 및시스템 | |
JPH06102897A (ja) | 連続文音声認識方式 | |
JP2003280903A (ja) | ソースプログラム比較情報生成システム | |
JP2986255B2 (ja) | 文字認識装置 | |
JPH07152754A (ja) | 文章作成補助機能を持つ文章作成装置 | |
CN118193733A (zh) | 生成报告的方法、装置、电子设备和存储介质 | |
JPH0576672B2 (ja) | ||
JP2001343995A (ja) | 音声入力処理装置、音声入力処理方法及び音声入力処理プログラムを記録した記録媒体 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20080427 Year of fee payment: 7 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20090427 Year of fee payment: 8 |
|
LAPS | Cancellation because of no payment of annual fees |