JPH0552507B2 - - Google Patents
Info
- Publication number
- JPH0552507B2 JPH0552507B2 JP57170190A JP17019082A JPH0552507B2 JP H0552507 B2 JPH0552507 B2 JP H0552507B2 JP 57170190 A JP57170190 A JP 57170190A JP 17019082 A JP17019082 A JP 17019082A JP H0552507 B2 JPH0552507 B2 JP H0552507B2
- Authority
- JP
- Japan
- Prior art keywords
- syllable
- syllables
- candidate
- recognition
- transition
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Lifetime
Links
- 239000004816 latex Substances 0.000 claims description 5
- 229920000126 latex Polymers 0.000 claims description 5
- 230000007704 transition Effects 0.000 description 57
- 239000011159 matrix material Substances 0.000 description 36
- 238000000034 method Methods 0.000 description 12
- 235000016496 Panda oleosa Nutrition 0.000 description 4
- 240000000220 Panda oleosa Species 0.000 description 4
- 238000010586 diagram Methods 0.000 description 4
- 230000000694 effects Effects 0.000 description 2
- 238000007796 conventional method Methods 0.000 description 1
- 239000000284 extract Substances 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
Description
<技術分野>
本発明は認識装置の改良に関し、更に詳細には
例えば文節等の一区切りの音声等の一区切りの認
識すべき情報を音韻、かな、音節、文節等のより
細分化された単位要素で認識する認識装置に適用
可能な認識装置に関するものである。 <従来技術> 文節等の一区切りの音声等を音韻、かな、音節
等のより細分化された単位で認識する場合、従来
一般的には音韻、音節等の標準パターンを記憶し
ておき入力パターンと標準パターンとのマツチン
グを行つて認識している。 この場合、全ての音韻、音節等の標準パターン
と入力パターンとのマツチングを行つて類似度を
算出し、類似度の高いものから順に候補音節等と
して出力している。 したがつて、例えば拗音を含む単音節単位で認
識する場合、各音節単位全てについて100種以上
の単音節の標準パターンと入力パターンとの間で
マツチングを行う必要があり、その処理に時間を
要し、正しい文節等を認識する確度が向上せず、
結果的に全体の認識に要する処理量が膨大なもの
になつていた。 <目的> 本発明は、上記従来の欠点を除去した認識装置
を提供することを目的とし、正しい文節等の一区
切りの認識すべき情報を認識する確度を向上させ
ると共に、結果的に全体の認識に要する処理量を
減少させることの出来る認識装置を提供するもの
である。 <実施例> 以下、本発明の認識装置を文節等の一区切りの
音声を音節等のより細分化された単位要素で認識
する認識装置に適用した例を実施例として説明す
る。 本発明の実施例によれば、文節等の一区切りの
音声等の認識すべき情報を音韻、かな、音節等の
より細分化されたN個の単位要素で認識する認識
装置において、単位要素毎に認識された音節等の
複数個の候補から信頼度の高い組合せ順に候補列
を作成して辞書照合等の処理を行い妥当な文字列
等の単位要素列を認識結果として出力する場合上
記の辞書に対応した言語に含まれる文節等の文字
列(単位要素列)について、予め(N+1)個の
文字(単位要素)間の接続関係であるM次の遷移
関係を記述した遷移行列を設け、上記の音節等の
単位要素毎の認識においてこの遷移行列を用いて
文字(単位要素)の非遷移関係を積極的に活用し
て以前の文字(単位要素)候補から遷移不可能な
文字(単位要素)を抽出し、それ等の文字(単位
要素)は認識対象から除外して処理し音節等の候
補を出力するように構成されている。 まず、本発明の実施例の説明に先立ち、本発明
の認識装置に用いられる単位要素間の接続関係で
ある遷移関係を示した遷移行列について説明す
る。 一般に日本語文章は、全てかな文字で表現した
場合、かな文字列に対応した音節列で表現でき
る。例えば文節「地球の」は“ち”“きゆ”“う”
“の”という4個の単音節といわれる単位要素か
ら成り立つている。2つの音節間の接続関係
(“ち”から“きゆ”、“きゆ”から“う”、“う”か
ら“の”)を、日本語全てあるいは特定の分野、
話題における文章等について調べると接続(遷
移;以下遷移ということばを使う)しない音節対
がある。例えばぱ行の音節の前には“ん”、“つ”
以外はこない。また“にや”は語頭にこないし、
“へ”(へと発声するもの)は語尾にこない。 このような文節を構成する音節の1次の遷移関
係を、以下に示す式(1)に従つて記述して、第1図
に示すような遷移行列M(X,Y)を作成する。 第1図において遷移行列M(X,Y)は単位要
素列である文字列の文字Xから次の文字Yへの遷
移を記述したものであり、単位要素(音節)がN
個の場合、(N+1)×(N+1)の行列であり、
ハード的にはROM等に記憶される。またY0列に
は各単位要素(1〜N)が節頭に来るか否かを表
わし、X0行には各単位要素(1〜N)が節尾に
来るか否かを表わすデータが書込まれる。 例えば“赤い”という文字列の遷移を遷移行列
に書込んだ例を第2図に示す。遷移行列の要素は
0(遷移不可能)か1(遷移可能)の2値のどちら
かで表現され、1ビツトで記憶される。なお第2
図においては表記“1”以外の行列要素は全て
“0”であり、その表示を省略している。 次に遷移行列の作成について今少し詳細に説明
する。 まず遷移行列の作成にあたつて遷移行列メモリ
を“0”に初期セツト〔M(X,Y)=0〕する。 次に文字列〓=(a1,a2,a3,……、aI) 但し、I:列の文字数 とした場合、次式(1) M(0,a1)=1,(i=1) M(ai-1,ai)=1,(i=2〜I) M(aI,0)=1,(i=I+1) ……(1) に従つて文字列〓の文字遷移関係を遷移行列M
(X,Y)に書込む。同様に認識対象となる文字
列の全てについて遷移関係を書込み遷移行列(1
次)の作成を完了する。 このようにして作成された具体的な遷移行列
(1次)M(X,Y)の例を第3図に示している。 上記は1次の遷移であるが、2次遷移、さらに
は一般にM次へ拡張したM次遷移行列も、同様に
次式(2)に従つて作成することが出来る。 M次遷移行列:M(X1,X2,X3,……,MM,
Y),(N+1)M+1次元 M(ai-M,ai-(M-1),……,ai)=1,(i=1〜
I+1) ……(2) 但し 0 >Iのときa=0 本発明の実施例はこの遷移しない音節の非遷移
関係を積極的に活用して、入力された文節音声を
音節毎に認識する場合に、上記第3図に示したよ
うな遷移行列を用いて、前に認識した音節候補か
ら遷移不可能な音節を遷移行列表より抽出し、そ
れ等の音節については次の音節の認識対象から除
外して処理し、候補音節を出力するようにしたも
のである。 次に本発明の実施例を図面を参照して説明す
る。 第4図は単音節音声標準パターンを用いた音声
認識の単音節認識に上記の遷移行列に基く認識処
理を適用した装置のブロツク図である。 第4図において、入力端子1に加えられた文節
音声入力は次段の音節音声識別部2を介して単音
節認識部3に入力される。この単音節認識部3は
遷移行列メモリ4を用いた処理部分を除いた部分
は従来公知のものであり、例えば入力端子1に加
えられた文節音声入力が音節音声識別部2により
音節単位に区分され、音響処理・比較部5により
単音節毎に特徴抽出が行なわれ、各単音節毎の特
徴パターンが同処理部5内のバツフアメモリに一
時記憶される。一方記憶装置6には各単音節毎の
標準パターンPi(i=1〜N)が記憶されており、
この標準パターンPiが順次読出されて処理部5内
のバツフアメモリに記憶された入力音声の入力特
徴パターンとのマツチング計算処理が行なわれ
る。 従来技術によれば、この標準パターンと入力特
徴パターンとのマツチング計算処理は全ての標準
パターンについて行なわれていたが、本発明によ
れば後述するように遷移行列メモリ4に記憶され
た情報にもとずいて前に候補として認識した音節
に接続可能な音節(最初の場合は先頭に来る可能
性のある音節)の標準パターンとのみマツチング
が計算され、最も近似したものが第1候補とし
て、また順次近似したものが次候補として選出さ
れ、その結果が候補音節メモリ7に音節ラテイス
として記憶される。 上記単音節認識部3において認識され、音節ラ
テイスとしてメモリ7に記憶された内容は候補列
作成部8に入力されて、音節候補列(文節候補)
が作成され、この候補列と辞書9に記憶された文
節とが辞書照合部10により照合され、一致すれ
ばその結果が文節出力部11に出力され、不一致
の場合には候補列作成部8を動作させて、同様の
動作を再度行なわせる。 次に遷移行列M(X,Y)を用いた音節認識処
理について第5図に示す遷移行列を用いた候補音
節作成処理ブロツク図を参照して説明する。 本発明においては、結果として得る候補音節を
時系列順に候補音節ラテイスバツフア7に一次記
憶する。また上記した遷移行列情報はメモリ4に
記憶されており、音節標準パターンはメモリ6に
記憶されている。 候補音節ラテイス7には認識結果が次表の如く
記憶されていくが今第i音節を認識する場合に
は、以下の如く処理が実行される。
例えば文節等の一区切りの音声等の一区切りの認
識すべき情報を音韻、かな、音節、文節等のより
細分化された単位要素で認識する認識装置に適用
可能な認識装置に関するものである。 <従来技術> 文節等の一区切りの音声等を音韻、かな、音節
等のより細分化された単位で認識する場合、従来
一般的には音韻、音節等の標準パターンを記憶し
ておき入力パターンと標準パターンとのマツチン
グを行つて認識している。 この場合、全ての音韻、音節等の標準パターン
と入力パターンとのマツチングを行つて類似度を
算出し、類似度の高いものから順に候補音節等と
して出力している。 したがつて、例えば拗音を含む単音節単位で認
識する場合、各音節単位全てについて100種以上
の単音節の標準パターンと入力パターンとの間で
マツチングを行う必要があり、その処理に時間を
要し、正しい文節等を認識する確度が向上せず、
結果的に全体の認識に要する処理量が膨大なもの
になつていた。 <目的> 本発明は、上記従来の欠点を除去した認識装置
を提供することを目的とし、正しい文節等の一区
切りの認識すべき情報を認識する確度を向上させ
ると共に、結果的に全体の認識に要する処理量を
減少させることの出来る認識装置を提供するもの
である。 <実施例> 以下、本発明の認識装置を文節等の一区切りの
音声を音節等のより細分化された単位要素で認識
する認識装置に適用した例を実施例として説明す
る。 本発明の実施例によれば、文節等の一区切りの
音声等の認識すべき情報を音韻、かな、音節等の
より細分化されたN個の単位要素で認識する認識
装置において、単位要素毎に認識された音節等の
複数個の候補から信頼度の高い組合せ順に候補列
を作成して辞書照合等の処理を行い妥当な文字列
等の単位要素列を認識結果として出力する場合上
記の辞書に対応した言語に含まれる文節等の文字
列(単位要素列)について、予め(N+1)個の
文字(単位要素)間の接続関係であるM次の遷移
関係を記述した遷移行列を設け、上記の音節等の
単位要素毎の認識においてこの遷移行列を用いて
文字(単位要素)の非遷移関係を積極的に活用し
て以前の文字(単位要素)候補から遷移不可能な
文字(単位要素)を抽出し、それ等の文字(単位
要素)は認識対象から除外して処理し音節等の候
補を出力するように構成されている。 まず、本発明の実施例の説明に先立ち、本発明
の認識装置に用いられる単位要素間の接続関係で
ある遷移関係を示した遷移行列について説明す
る。 一般に日本語文章は、全てかな文字で表現した
場合、かな文字列に対応した音節列で表現でき
る。例えば文節「地球の」は“ち”“きゆ”“う”
“の”という4個の単音節といわれる単位要素か
ら成り立つている。2つの音節間の接続関係
(“ち”から“きゆ”、“きゆ”から“う”、“う”か
ら“の”)を、日本語全てあるいは特定の分野、
話題における文章等について調べると接続(遷
移;以下遷移ということばを使う)しない音節対
がある。例えばぱ行の音節の前には“ん”、“つ”
以外はこない。また“にや”は語頭にこないし、
“へ”(へと発声するもの)は語尾にこない。 このような文節を構成する音節の1次の遷移関
係を、以下に示す式(1)に従つて記述して、第1図
に示すような遷移行列M(X,Y)を作成する。 第1図において遷移行列M(X,Y)は単位要
素列である文字列の文字Xから次の文字Yへの遷
移を記述したものであり、単位要素(音節)がN
個の場合、(N+1)×(N+1)の行列であり、
ハード的にはROM等に記憶される。またY0列に
は各単位要素(1〜N)が節頭に来るか否かを表
わし、X0行には各単位要素(1〜N)が節尾に
来るか否かを表わすデータが書込まれる。 例えば“赤い”という文字列の遷移を遷移行列
に書込んだ例を第2図に示す。遷移行列の要素は
0(遷移不可能)か1(遷移可能)の2値のどちら
かで表現され、1ビツトで記憶される。なお第2
図においては表記“1”以外の行列要素は全て
“0”であり、その表示を省略している。 次に遷移行列の作成について今少し詳細に説明
する。 まず遷移行列の作成にあたつて遷移行列メモリ
を“0”に初期セツト〔M(X,Y)=0〕する。 次に文字列〓=(a1,a2,a3,……、aI) 但し、I:列の文字数 とした場合、次式(1) M(0,a1)=1,(i=1) M(ai-1,ai)=1,(i=2〜I) M(aI,0)=1,(i=I+1) ……(1) に従つて文字列〓の文字遷移関係を遷移行列M
(X,Y)に書込む。同様に認識対象となる文字
列の全てについて遷移関係を書込み遷移行列(1
次)の作成を完了する。 このようにして作成された具体的な遷移行列
(1次)M(X,Y)の例を第3図に示している。 上記は1次の遷移であるが、2次遷移、さらに
は一般にM次へ拡張したM次遷移行列も、同様に
次式(2)に従つて作成することが出来る。 M次遷移行列:M(X1,X2,X3,……,MM,
Y),(N+1)M+1次元 M(ai-M,ai-(M-1),……,ai)=1,(i=1〜
I+1) ……(2) 但し 0 >Iのときa=0 本発明の実施例はこの遷移しない音節の非遷移
関係を積極的に活用して、入力された文節音声を
音節毎に認識する場合に、上記第3図に示したよ
うな遷移行列を用いて、前に認識した音節候補か
ら遷移不可能な音節を遷移行列表より抽出し、そ
れ等の音節については次の音節の認識対象から除
外して処理し、候補音節を出力するようにしたも
のである。 次に本発明の実施例を図面を参照して説明す
る。 第4図は単音節音声標準パターンを用いた音声
認識の単音節認識に上記の遷移行列に基く認識処
理を適用した装置のブロツク図である。 第4図において、入力端子1に加えられた文節
音声入力は次段の音節音声識別部2を介して単音
節認識部3に入力される。この単音節認識部3は
遷移行列メモリ4を用いた処理部分を除いた部分
は従来公知のものであり、例えば入力端子1に加
えられた文節音声入力が音節音声識別部2により
音節単位に区分され、音響処理・比較部5により
単音節毎に特徴抽出が行なわれ、各単音節毎の特
徴パターンが同処理部5内のバツフアメモリに一
時記憶される。一方記憶装置6には各単音節毎の
標準パターンPi(i=1〜N)が記憶されており、
この標準パターンPiが順次読出されて処理部5内
のバツフアメモリに記憶された入力音声の入力特
徴パターンとのマツチング計算処理が行なわれ
る。 従来技術によれば、この標準パターンと入力特
徴パターンとのマツチング計算処理は全ての標準
パターンについて行なわれていたが、本発明によ
れば後述するように遷移行列メモリ4に記憶され
た情報にもとずいて前に候補として認識した音節
に接続可能な音節(最初の場合は先頭に来る可能
性のある音節)の標準パターンとのみマツチング
が計算され、最も近似したものが第1候補とし
て、また順次近似したものが次候補として選出さ
れ、その結果が候補音節メモリ7に音節ラテイス
として記憶される。 上記単音節認識部3において認識され、音節ラ
テイスとしてメモリ7に記憶された内容は候補列
作成部8に入力されて、音節候補列(文節候補)
が作成され、この候補列と辞書9に記憶された文
節とが辞書照合部10により照合され、一致すれ
ばその結果が文節出力部11に出力され、不一致
の場合には候補列作成部8を動作させて、同様の
動作を再度行なわせる。 次に遷移行列M(X,Y)を用いた音節認識処
理について第5図に示す遷移行列を用いた候補音
節作成処理ブロツク図を参照して説明する。 本発明においては、結果として得る候補音節を
時系列順に候補音節ラテイスバツフア7に一次記
憶する。また上記した遷移行列情報はメモリ4に
記憶されており、音節標準パターンはメモリ6に
記憶されている。 候補音節ラテイス7には認識結果が次表の如く
記憶されていくが今第i音節を認識する場合に
は、以下の如く処理が実行される。
【表】
今、前音節候補を
X={Si-1、j}j=1〜J(i−1)
組合せ数:J(i−1)(=0のときS,j=
0) とした場合、次式(3)に従つて直前の複数個(J
(i−1)個)の候補音節について遷移行列の各
行の和をとり、得られた行m(Y)が0である音
節は遷移不可能であると指定する。 m(Y)=VM(Si-1,j,Y) =M(Si-1,1,Y)+M(Si-1,2,Y)+……+M(
Si-1,J(i-1),Y)……(3) この(3)式においてm(Y)=0となり、遷移不可
能と指定された音節群は、除外して、次の類似比
較の処理を行い、第i音節の候補音節を出力し、
候補音節ラテイス7に書込む。但し、i=1(節
頭の音節)のときは第0行M(0,Y)によつて
遷移不可能と指定された音節群を除外して類似比
較の処理を行なう。 以上を繰返して、一文節音声の候補音節ラテイ
スの作成を完了する。 今、一文節音声として「国民は」を入力した場
合、音響処理部により音節毎に特徴抽出が行なわ
れ、その音節毎の特徴パターンXiが入力パターン
時系列バツフア21に記憶される。次に本発明に
係る候補音節作成処理に移り、最初に第1音節の
特徴パターンX1が入力パターンバツフア22に
読み込まれ、次にステツプn3に移行して前候補
音節群により式(3)にしたがつて遷移行列の行を指
定する。最初の場合はステツプn4において第0
行のM(0,Y)が指定されその内容がバツフア
23に一時記憶され、ステツプn5の生起音節の
指定が成される。 次にステツプn6に移行して入力パターンバツ
フア22に記憶された第1音節X1の特徴パター
ンがロードされ、この特徴パターンX1と音節標
準パターンメモリ6に記憶された標準パターンの
内バツフア23によつて生起音節と指定されて順
次標準パターンバツフア24に読出される標準パ
ターンとの間で類似比較が行なわれ(ステツプ
n7)、その結果にもとずいて候補音節が出力され
(ステツプn8)、その結果が候補音節ラテイス7
に書かれる。この実施例においては第1音節候補
として“KO”,“GO”,“BO”が記憶される。 次にステツプn2に戻り、第2音節特徴パター
ンX2がバツフア22に入力され、ステツプn3に
移行して、候補音節ラテイス7の第1候補音節に
もとずいて“KO”,“GO”,“BO”に対応した各
行のM(S1,1〜3,Y)が指定され、ステツプn4にお
いて、その遷移行列の和(OR)が作成されてそ
の結果がバツフア23に一時記憶され、ステツプ
n5の生起音節の指定が成される。 次にステツプn6に移行し、以下同様のステツ
プn6〜n9を実行して第2候補音節“KU”,“GU”
をメモリ7に記憶する。 以上の動作を繰返して一文節の候補音節ラテイ
スの作成を完了する。 以上のようにして候補音節ラテイス7に候補例
が記憶されることになるが、遷移行列を用いない
場合の従来方式の場合と本発明方式の場合の実例
を入力音声「国民は」について次表に示す。
0) とした場合、次式(3)に従つて直前の複数個(J
(i−1)個)の候補音節について遷移行列の各
行の和をとり、得られた行m(Y)が0である音
節は遷移不可能であると指定する。 m(Y)=VM(Si-1,j,Y) =M(Si-1,1,Y)+M(Si-1,2,Y)+……+M(
Si-1,J(i-1),Y)……(3) この(3)式においてm(Y)=0となり、遷移不可
能と指定された音節群は、除外して、次の類似比
較の処理を行い、第i音節の候補音節を出力し、
候補音節ラテイス7に書込む。但し、i=1(節
頭の音節)のときは第0行M(0,Y)によつて
遷移不可能と指定された音節群を除外して類似比
較の処理を行なう。 以上を繰返して、一文節音声の候補音節ラテイ
スの作成を完了する。 今、一文節音声として「国民は」を入力した場
合、音響処理部により音節毎に特徴抽出が行なわ
れ、その音節毎の特徴パターンXiが入力パターン
時系列バツフア21に記憶される。次に本発明に
係る候補音節作成処理に移り、最初に第1音節の
特徴パターンX1が入力パターンバツフア22に
読み込まれ、次にステツプn3に移行して前候補
音節群により式(3)にしたがつて遷移行列の行を指
定する。最初の場合はステツプn4において第0
行のM(0,Y)が指定されその内容がバツフア
23に一時記憶され、ステツプn5の生起音節の
指定が成される。 次にステツプn6に移行して入力パターンバツ
フア22に記憶された第1音節X1の特徴パター
ンがロードされ、この特徴パターンX1と音節標
準パターンメモリ6に記憶された標準パターンの
内バツフア23によつて生起音節と指定されて順
次標準パターンバツフア24に読出される標準パ
ターンとの間で類似比較が行なわれ(ステツプ
n7)、その結果にもとずいて候補音節が出力され
(ステツプn8)、その結果が候補音節ラテイス7
に書かれる。この実施例においては第1音節候補
として“KO”,“GO”,“BO”が記憶される。 次にステツプn2に戻り、第2音節特徴パター
ンX2がバツフア22に入力され、ステツプn3に
移行して、候補音節ラテイス7の第1候補音節に
もとずいて“KO”,“GO”,“BO”に対応した各
行のM(S1,1〜3,Y)が指定され、ステツプn4にお
いて、その遷移行列の和(OR)が作成されてそ
の結果がバツフア23に一時記憶され、ステツプ
n5の生起音節の指定が成される。 次にステツプn6に移行し、以下同様のステツ
プn6〜n9を実行して第2候補音節“KU”,“GU”
をメモリ7に記憶する。 以上の動作を繰返して一文節の候補音節ラテイ
スの作成を完了する。 以上のようにして候補音節ラテイス7に候補例
が記憶されることになるが、遷移行列を用いない
場合の従来方式の場合と本発明方式の場合の実例
を入力音声「国民は」について次表に示す。
【表】
【表】
上記の例から明らかなように、本発明方式によ
る方が正しい文字列が候補列の上位に上がつてい
る様子がわかる。 以上の遷移行列は1次遷移であるが、2次遷
移、更には一般的なM次遷移まで同じ手法で拡張
することができる。 なおM次の遷移行列の作成は上述の式(2)に従
い、前候補音節(M音節前まで)からの音節指定
は次に示す式(4)によつて行なうことが出来る。 即ちM次遷移行列M(X1,X2,……XM,Y)
への拡張の場合、前音節候補列を {X1,X2,……,XM}= {Si-M,J1Si-(M-1,j2……Si-1,jM} j1=1〜J(i−M) j2=1〜J(i−(M−1)) … jM=1〜J(i−1) 組合せの数:J(i−M)・J(−(M−1))…
…J(i−1) (0のとき S,j=0) とした場合、 音節指定は m(Y)=VM(Si-M,j1,Si-(M-1),j2,
……,Si-1,jM,Y)……(4) j1=1〜J(i−M) j2=1〜J(i−(M−1)) … jM=1〜J(i−1) によつて行なうことになる。 なお、Mの次数を大きくとれば、生成音節の限
定が強くなり、本発明装置による効果は大きくな
る。 以上に述べた、本発明装置による認識対象は文
節に限らず、音節、単語、文章でもよく、また細
分化された単位は音節に限らず音韻、単語でもよ
い。 また、アルフアベツト等の文字列でもよい。 本発明装置は一般に、認識対象語を構成する細
分化した単位の遷移関係が存在する文字列であれ
ば適用可能である。 <効果> 以上の如く、本発明によれば、確度良く正しい
単位要素を候補として抽出することが出来るた
め、正しい文節等を認識する確度が高くなり、結
果的に全体の認識に要する処理量を少なくするこ
とが出来る。
る方が正しい文字列が候補列の上位に上がつてい
る様子がわかる。 以上の遷移行列は1次遷移であるが、2次遷
移、更には一般的なM次遷移まで同じ手法で拡張
することができる。 なおM次の遷移行列の作成は上述の式(2)に従
い、前候補音節(M音節前まで)からの音節指定
は次に示す式(4)によつて行なうことが出来る。 即ちM次遷移行列M(X1,X2,……XM,Y)
への拡張の場合、前音節候補列を {X1,X2,……,XM}= {Si-M,J1Si-(M-1,j2……Si-1,jM} j1=1〜J(i−M) j2=1〜J(i−(M−1)) … jM=1〜J(i−1) 組合せの数:J(i−M)・J(−(M−1))…
…J(i−1) (0のとき S,j=0) とした場合、 音節指定は m(Y)=VM(Si-M,j1,Si-(M-1),j2,
……,Si-1,jM,Y)……(4) j1=1〜J(i−M) j2=1〜J(i−(M−1)) … jM=1〜J(i−1) によつて行なうことになる。 なお、Mの次数を大きくとれば、生成音節の限
定が強くなり、本発明装置による効果は大きくな
る。 以上に述べた、本発明装置による認識対象は文
節に限らず、音節、単語、文章でもよく、また細
分化された単位は音節に限らず音韻、単語でもよ
い。 また、アルフアベツト等の文字列でもよい。 本発明装置は一般に、認識対象語を構成する細
分化した単位の遷移関係が存在する文字列であれ
ば適用可能である。 <効果> 以上の如く、本発明によれば、確度良く正しい
単位要素を候補として抽出することが出来るた
め、正しい文節等を認識する確度が高くなり、結
果的に全体の認識に要する処理量を少なくするこ
とが出来る。
第1図は1次遷移行列を示す図、第2図は文字
列の遷移を書込んだ遷移行列例を示す図、第3図
は文節文字列の遷移行列例を示す図、第4図は本
発明の実施された認識装置の構成を示すブロツク
図、第5図は本発明に係る候補音節作成処理ブロ
ツク図である。 3……単音節認識部、4……遷移行列メモリ、
6……音節標準パターンメモリ、7……候補音節
ラテイスメモリ、21……入力パターンバツフ
ア、23……生起音節指定バツフア。
列の遷移を書込んだ遷移行列例を示す図、第3図
は文節文字列の遷移行列例を示す図、第4図は本
発明の実施された認識装置の構成を示すブロツク
図、第5図は本発明に係る候補音節作成処理ブロ
ツク図である。 3……単音節認識部、4……遷移行列メモリ、
6……音節標準パターンメモリ、7……候補音節
ラテイスメモリ、21……入力パターンバツフ
ア、23……生起音節指定バツフア。
Claims (1)
- 【特許請求の範囲】 1 一区切りの認識すべき情報をより細分化され
たN個の音節で認識する装置に於いて、 認識すべき所定の単位音節列について予め(N
+1)個の単位音節間の接続非接続情報を記憶す
る音節間接続情報メモリと、入力された音声を音
響処理、比較処理するとともに前記メモリの音節
間接続情報に基いて候補音節ラテイスを生成する
手段と、生成した候補音節ラテイスに基いて候補
列を生成する手段と、生成した候補列の辞書照合
等の処理を行ない、妥当な単位文字列を認識結果
として出力する手段とを備えたことを特徴とする
認識装置。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP57170190A JPS5958493A (ja) | 1982-09-28 | 1982-09-28 | 認識装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP57170190A JPS5958493A (ja) | 1982-09-28 | 1982-09-28 | 認識装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
JPS5958493A JPS5958493A (ja) | 1984-04-04 |
JPH0552507B2 true JPH0552507B2 (ja) | 1993-08-05 |
Family
ID=15900342
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP57170190A Granted JPS5958493A (ja) | 1982-09-28 | 1982-09-28 | 認識装置 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JPS5958493A (ja) |
Families Citing this family (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS6126133A (ja) * | 1984-07-17 | 1986-02-05 | Nippon Signal Co Ltd:The | 音声認識入力装置 |
JPS6148032A (ja) * | 1984-08-14 | 1986-03-08 | Sharp Corp | 音声入力式日本語文書処理装置 |
JPS6256997A (ja) * | 1985-09-06 | 1987-03-12 | 株式会社日立製作所 | パタ−ンマツチング装置 |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS5629292A (en) * | 1979-08-17 | 1981-03-24 | Nippon Electric Co | Continuous voice identifier |
JPS5629299A (en) * | 1979-07-16 | 1981-03-24 | Western Electric Co | Voice identifier |
-
1982
- 1982-09-28 JP JP57170190A patent/JPS5958493A/ja active Granted
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS5629299A (en) * | 1979-07-16 | 1981-03-24 | Western Electric Co | Voice identifier |
JPS5629292A (en) * | 1979-08-17 | 1981-03-24 | Nippon Electric Co | Continuous voice identifier |
Also Published As
Publication number | Publication date |
---|---|
JPS5958493A (ja) | 1984-04-04 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
EP0691023B1 (en) | Text-to-waveform conversion | |
KR100403293B1 (ko) | 음성합성방법, 음성합성장치 및 음성합성프로그램을기록한 컴퓨터판독 가능한 매체 | |
US6134528A (en) | Method device and article of manufacture for neural-network based generation of postlexical pronunciations from lexical pronunciations | |
Frederking et al. | Interactive speech translation in the diplomat project | |
US6477495B1 (en) | Speech synthesis system and prosodic control method in the speech synthesis system | |
JPH0552507B2 (ja) | ||
Stefan-Adrian et al. | Rule-based automatic phonetic transcription for the Romanian language | |
Chowdhury et al. | Bangla grapheme to phoneme conversion using conditional random fields | |
JP3371761B2 (ja) | 氏名読み音声合成装置 | |
Marcadet et al. | A transformation-based learning approach to language identification for mixed-lingual text-to-speech synthesis. | |
Hoste et al. | Using rule-induction techniques to model pronunciation variation in Dutch | |
JPH0552506B2 (ja) | ||
Saychum et al. | A great reduction of wer by syllable toneme prediction for thai grapheme to phoneme conversion | |
JPS6342279B2 (ja) | ||
JP3001334B2 (ja) | 認識用言語処理装置 | |
JPS6229796B2 (ja) | ||
JPH0210957B2 (ja) | ||
Alsulaiman et al. | Development and Analysis of a Versatile Dataset of Speech, Real and Synthesized, of Arabic Learners | |
JP2996978B2 (ja) | テキスト音声合成装置 | |
JPH0652478B2 (ja) | 認識装置 | |
JP2951332B2 (ja) | 音声認識における文節候補削減方式 | |
Silamu et al. | HMM-based uyghur continuous speech recognition system | |
Deyu et al. | An Efficient Method To Synthesize Chinese Speech With Speaker Style | |
JPS63158599A (ja) | 単語検出方式 | |
JPS63208096A (ja) | 情報入力装置 |