JPH067351B2 - 候補列作成装置 - Google Patents

候補列作成装置

Info

Publication number
JPH067351B2
JPH067351B2 JP57190642A JP19064282A JPH067351B2 JP H067351 B2 JPH067351 B2 JP H067351B2 JP 57190642 A JP57190642 A JP 57190642A JP 19064282 A JP19064282 A JP 19064282A JP H067351 B2 JPH067351 B2 JP H067351B2
Authority
JP
Japan
Prior art keywords
candidate
memory
recognition
syllable
column
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP57190642A
Other languages
English (en)
Other versions
JPS5978400A (ja
Inventor
充宏 斗谷
文雄 外川
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sharp Corp
Original Assignee
Sharp Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sharp Corp filed Critical Sharp Corp
Priority to JP57190642A priority Critical patent/JPH067351B2/ja
Publication of JPS5978400A publication Critical patent/JPS5978400A/ja
Publication of JPH067351B2 publication Critical patent/JPH067351B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Description

【発明の詳細な説明】 〈技術分野〉 本発明はかな文字,単音節,単語等の認識単位で認識を
行った後で、連続した複数の認識結果をまとめて、一つ
の候補列として導出するに際し、各認識単位での認識結
果を複数個採用し、全体として認識確度の高い候補列が
順次処理し得るように複数の候補列を作成する候補列作
成装置の改良に関するものである。
〈従来技術〉 従来の音声認識装置において、例えば音節単位の認識を
行ない、その音節列を一つの文節(単語)として辞書と
のマッチングを行う方法では、各音節毎に複数の認識結
果を取り、その組合せとして一つの文字候補列を作り順
次辞書との照合を行なっている。この方法では文節の長
さと各音節毎の候補数で組合せた数の文字候補列が出
る。
したがって、これらの組合せの全てについて辞書照合を
行なった場合、音節数,認識候補の増大に伴ない、非常
に多くの処理時間を必要としていた。
〈目的〉 本発明は上記従来問題点を除去した候補列作成方式を提
供することを目的として成されたものであり、処理する
候補数の最大値を規定し、最も確度の高い認識結果から
処理を行うことにより、音節数,認識候補の増加に対し
て、処理量がそれほど増大しないようにした候補列作成
装置を提供するものである。
〈実施例〉 以下、本発明の候補列作成装置を実施した音声認識装置
を実施例を挙げて詳細に説明する。
第1図は本発明の候補列作成方式の適用可能な単音節音
声標準パターンを用いた音声認識装置の構成を示すブロ
ック図である。
第1図において、入力端子1に加えられた文節音声入力
は次段の音節音声識別部2を介して単音節認識部3に入
力される。この単音節認識部3は従来公知のものであ
り、例えば入力端子1に加えられた文節音声入力が音節
音声識別部2により音節単位に区分され、音響処理・比
較部5により単音節毎に特徴抽出が行なわれ、単音節毎
の特徴パターンが同処理部5内のバッファメモリに一時
記憶される。一方記憶装置6には各単音節毎の標準パタ
ーンP(i=1〜N)が記憶されており、この標準パター
ンPが順次読出されて処理部5内のバッファメモリに
記憶された入力音声の入力特徴パターンとのマッチング
計算処理が行なわれる。このマッチング計算処理の結
果、最も近似したものが第1候補として、また順次近似
したものが次候補として選出され、その結果が近似度を
示す距離差情報と共に候補音節メモリ4に音節ラティス
として記憶される。
上記単音節認識部3において認識され、音節ラティスと
してメモリ4に記憶された音節単位の各候補は候補列作
成部7に入力される。
該候補列作成部7は後述するように、候補列を記憶する
候補列メモリと、最後の候補列番号を指示する最終ポイ
ンタメモリと、上記の候補列メモリに記憶された候補列
中の一つの認識単位だけが一位でないものの中で、候補
列として最も確度の低い候補列位置に対応した情報を記
憶する確定位置記憶メモリと、候補列の最大数を指示す
る最大値設定メモリとを備え、最初に上記の認識結果
(候補音節)メモリに記憶された一位の認識結果ばかり
を並べて候補列を作成して候補列メモリに記憶し、次に
順次認識結果(候補音節)メモリに記憶された認識結果
の確度の高い認識候補を用いて上記候補列メモリの内容
とを組合せて新たな候補列を作成し、全体としての確度
の降順に候補列をソートすると共に、上記の確定位置記
憶メモリと最終ポインタメモリの内容を更新し、最終ポ
インタメモリの内容が最大値設定メモリの値に対応した
値を越えた場合は、その値で固定とし、確定位置記憶メ
モリの値が最大値設定メモリの値に対応した値を越えた
場合あるいは音節候補がなくなった場合には候補列作成
の処理を終了するように構成されている。
上記候補列作成部7において作成され、該候補列作成部
7内の候補列メモリに記憶された候補列は確度の高いも
の順に順次出力され、辞書8に記憶された文節と辞書照
合部9により、照合され、一致したものが文節出力部1
0に出力されるように構成されている。
次に上記した候補列作成部7について詳細に説明する。
第2図は候補列作成部7の具体的構成を示すブロック図
であり、第1図と同一部分は同一符号で示している。
第2図において候補列作成部7は候補列を記憶する候補
列メモリ11と、候補列の最大数を指示する最大値設定
メモリ12と、最後の候補列番号を指示する最終ポイン
タメモリ13と、上記の候補列メモリに記憶された候補
列中の一つの認識単位だけが一位でないものの中で、候
補列として最も確度の低い候補列位置に対応した情報を
記憶する確定位置記憶メモリ14と、各認識単位(音
節)位置の何番目の候補まで候補列の作成に使用したか
を示す情報を記憶するサーチポイントメモリ15と、最
初に上記の認識結果(候補音節)メモリ4に記憶された
一位の認識結果ばかりを並べて候補列を作成して候補列
メモリ11に記憶し、次に順次認識結果(候補音節)メ
モリ4に記憶された認識結果の確度の高い認識候補を用
いて上記の候補列メモリ11の内容とを組合せて新たな
候補列を作成し、全体としての確度の降順に候補列をソ
ートすると共に、確定位置記憶メモリ14と最終ポイン
タメモリ13の内容を更新し、最終ポインタメモリ13
の内容が最大値設定メモリ12の値に対応した値を越え
た場合は、その値で固定とし、確定位置記憶メモリ14
の値が最大値設定メモリの値に対応した値を越えた場合
あるいは音節候補がなくなった場合には候補列作成の処
理を終了するよう動作するようにプログラムされた中央
処理装置(CPU)16とから構成されている。
上記候補音節メモリ4は第3図に示す如く、各音節S1
〜Sn毎に複数個の候補音節(認識結果)及び第1番目
の候補との認識での距離(比)の差を記憶する領域A及
びDにより構成され、領域Aには認識された単音節の識
別番号(例えばJISコードに対応)が記憶される。
なお第3図においてaijはi番目の音節のj位の認識
結果を表わし、またdaijはi番目の入力音節のaij
の距離を表わしている。
また、この実施例においては第1候補の距離差領域P1
〜Pがサーチポイントメモリ15として代用されるよ
うに構成されている。
また候補列メモリ11は第4図に示す如く、全体として
確度の降順に候補列を記憶する領域L及び候補列の距離
の総和を記憶する領域Mにより構成され、上記候補列領
域Lには各単音節の何番目の候補を使ったかを示す値が
記憶されるように構成されている。
次に上記のように構成された装置の動作を第5図に示す
処理フローに従って説明する。
認識動作がスタートし(第5図ステップn1,以下ステ
ップniを単にniと記す。)入力端子1に加えられた
認識すべき音声入力は次段の音節音声識別部2を介して
単音節認識部3に入力されて単音節の認識が実行され、
その結果が認識結果メモリ4に第1位の認識結果との距
離差情報と共に記憶される(n2,n3)。この動作は
単語あるいは文節の区切単位で行なわれ、単語あるいは
文節区切の検知(n4)により次のステップn5に移行
する。
今認識すべき文節として「/や/ま/に/」が入力され
た場合、ステップn2〜n4において単音節の認識が成
され、その結果が例えばメモリ4に第1表の如く音節ラ
ティスとして記憶されることになる。
次に、候補列作成動作に移行し、次の如く順次処理され
る。
、まずステップn5において、候補列メモリ11の先頭
に、認識結果メモリ4の第1位の候補音節を入力して、
第1位の候補列を作成する。このような動作により、候
補列メモリ11の内容は第2表の如くなる。
、次に確定位置記憶メモリ14及び最終ポインタメモ
リ13の内容を初期値“1”にセットする。(n6)。
また最大値設定メモリ12の内容は作成したい候補列数
に対応した値に予め設定されている。
、次にステップn7に移行して認識結果から使われて
いない残りの単音節の内最も確度の高い音節候補を選
ぶ。即ち今まで用いていない残りの音節ラティスの中か
ら最小の距離差を持つ音節候補を選び、この選んだ音節
候補に対応したサーチポイントメモリ15の内容を更新
する(n8)。次にこの選んだ音節の位置に認識結果
(選んだ音節の順位番号)を入れ、その他の音節の位置
に一位の候補(0)を入れ、距離の総和の位置に距離差を
入れた候補列を作成する(n10)。
次にこの作成された候補列を確定位置記憶メモリ14と
最終ポインタメモリ13の値の指示する順位の間で候補
列メモリ11の距離の総和の昇順となる位置に挿入記憶
する(n11)。次に確定位置記憶メモリ14の内容を
挿入位置の次の位置に設定し(n12)、最終ポインタ
メモリ13の内容を更新して“1”増加させる(n1
5)。なお最終ポインタメモリ13の値が最大値設定メ
モリ12の値を越える場合にはメモリ13の値をメモリ
12の最大値に固定する。
このような一連の動作により最も確度の高い音節候補と
して第2位の第2音節の「ま」が選択され、距離総和2
0が作成れ、その結果が候補列メモリ11の第2位に挿
入される。
この結果メモリ11,13,14の記憶内容は第6図に
示すようになる。
、次に候補列メモリ11の先頭+1の位置から、今選
ばれた音節位置が0(類似度が一番高い)のもの、すな
わち第2表に示すように、音節位置が一位のものを捜し
(n16)、その候補列があれば(n17)、ステップn18に
移行して、その距離の総和に距離の差を加算し、確定位
置記憶メモリ14の内容によって指定された位置以降に
上記に示した動作と同様の方法で挿入し、候補列メモ
リ11内で距離の昇順となるように新たに作成された候
補列を挿入する。次にステップn15に戻って最終ポイ
ンタメモリ13の内容を更新して“1”増加させ、以下
最終ポインタメモリ13の内容の指示する位置の前まで
このの操作を繰返す。
また選ばれた音節の位置が0のものがなければステップ
n16からn17を通ってステップn7に戻り、上記し
たの操作を再び繰返す。
、上記のおよびの動作は確定位置記憶メモリ14
の値が最大値設定メモリ12の最大値に対応した値を越
えるか(n13,n14)、あるいは音節候補が無くなるまで(n
9,n19,n20)まで繰返す。
以上のような動作により、文節の音節数や、各音節の候
補数の増加に対して、指数的な処理の増加を招くことな
く候補列が作成される。
第6図に示した状態以降の処理の状態を具体的に示す
と、の過程において“ま”の次に距離の近い第3音節
の“に”が選択され、第7図に示すようにメモリ11,
13,14の記憶内容が変化する。
次にの処理工程に移行して第8図に示す如き第4位の
候補列が作成され、またの処理工程に戻って、新たな
単音節候補“ぎゃ”が選択され、第9図に示す如き第5
位の候補列が作成され、次にの処理工程に移行して第
10図に示す如き第6〜第8位の候補列が作成される。
以下同様の手順で実行される。
この時確定位置記憶メモリ14の内容によって指示され
る位置以前の候補列の順位はこの時点で確定しており、
挿入対象となるのは確定位置記憶メモリ14の内容によ
って指示される順位位置以降となる。従って確定位置記
憶メモリ14の内容が最大値設定メモリ12の記憶内容
を越えた時点で処理を終了することが出来る。
以上のような処理動作によって作成された候補列と辞書
8との内容が照合部9で照合れ、一致したものが文節
(単語)認識結果として出力部10に出力される。
なお候補列メモリ11に記憶された候補列が各音節の何
番目の候補かを示す値によって記憶されている場合に
は、候補音節メモリ4の記憶内容によってJISコード
等の単音節の識別番号列に変換された後、辞書8との照
合が行なわれることになる。
〈効果〉 以上述べたように、本発明によれば、認識単位での認識
単位とその認識確度の一位との差に対応した距離情報を
記憶する認識結果メモリと、候補列を記憶する候補列メ
モリと、この候補列メモリに記憶された候補列中の一つ
の認識単位だけが一位でないものの中で、候補列として
最も確度の低い候補列位置に対応した情報を記憶する確
定位置記憶メモリとを有し、最初に上記の認識結果メモ
リに記憶された一位の認識結果により候補列を作成して
上記候補列メモリに記憶し、次に順次上記認識結果メモ
リに記憶された認識結果の確度の高い認識候補を用いて
一つの認識単位だけが一位でない候補列を作成すると共
に上記候補列メモリの内容を組み合わせ確度の降順にソ
ートされた新たな候補列を作成し、 一つの認識単位だけが一位でない候補列を作成した時に
は、上記確定位置記憶メモリに記憶された上記候補列メ
モリの該候補列位置以降において確度の降順に該候補列
を挿入してその挿入位置で上記確定位置記憶メモリの内
容を更新する手段を備えたから、文節の音節数や、各音
節の候補数の増加に対して指数的な処理の増加を招くこ
となく候補列を作成することが出来る。
なお、上記実施例においては、単音節音声の認識に対す
る処理を例にして説明したが、本発明の候補列作成装置
はその他単語音声,手書きかな文字認識等にも適用する
ことが可能なことは言うまでもない。
【図面の簡単な説明】
第1図は本発明の適用される音声認識装置の構成を示す
ブロック図、第2図は本発明を実施した装置の要部の構
成を示すブロック図、第3図は候補音節メモリの構成例
を示す図、第4図は候補列メモリの構成例を示す図、第
5図は本発明の候補列作成処理フローを示す図、第6図
乃至第10図はそれぞれ本発明の候補列作成処理の各段
階における候補列メモリの記憶状態を示す図である。 3…単音節認識部、4…候補音節(認識結果)メモリ、
7…候補列作成部、11…候補列メモリ、12…最大値
設定メモリ、13…最終ポインタメモリ、14…確定位
置記憶メモリ、16…中央処理装置。

Claims (1)

    【特許請求の範囲】
  1. 【請求項1】所定の認識単位で認識を行った後に、各認
    識単位での認識結果を複数個採用して複数の候補列を作
    成する候補列作成装置において、 認識単位での認識結果とその認識確度の一位との差に対
    応した距離情報を記憶する認識結果メモリと、 候補列を記憶する候補列メモリと、 該候補列メモリに記憶された候補列中の一つの認識単位
    だけが一位でないものの中で、候補列として最も確度の
    低い候補列位置に対応した情報を記憶する確定位置記憶
    メモリと、 を有し、 最初に上記認識結果メモリに記憶された一位の認識結果
    により候補列を作成して上記候補列メモリに記憶し、次
    に順次上記認識結果メモリに記憶された認識結果の確度
    の高い認識候補を用いて一つの認識単位だけが一位でな
    い候補列を作成すると共に上記候補列メモリの内容を組
    み合わせ確度の降順にソートされた新たな候補列を作成
    し、 一つの認識単位だけが一位でない候補列を作成した時に
    は、上記確定位置記憶メモリに記憶された上記候補列メ
    モリの該候補列位置以降において確度の降順に該候補列
    を挿入してその挿入位置で上記確定位置記憶メモリの内
    容を更新する手段を備えた ことを特徴とする候補列作成装置。
JP57190642A 1982-10-27 1982-10-27 候補列作成装置 Expired - Lifetime JPH067351B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP57190642A JPH067351B2 (ja) 1982-10-27 1982-10-27 候補列作成装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP57190642A JPH067351B2 (ja) 1982-10-27 1982-10-27 候補列作成装置

Publications (2)

Publication Number Publication Date
JPS5978400A JPS5978400A (ja) 1984-05-07
JPH067351B2 true JPH067351B2 (ja) 1994-01-26

Family

ID=16261465

Family Applications (1)

Application Number Title Priority Date Filing Date
JP57190642A Expired - Lifetime JPH067351B2 (ja) 1982-10-27 1982-10-27 候補列作成装置

Country Status (1)

Country Link
JP (1) JPH067351B2 (ja)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3460723B2 (ja) * 1992-05-19 2003-10-27 富士通株式会社 音声認識方式
JP2007041971A (ja) * 2005-08-04 2007-02-15 Albert:Kk 推薦システム、推薦方法、及び、推薦プログラム

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS57102689A (en) * 1980-12-19 1982-06-25 Oki Electric Ind Co Ltd Single syllable voice input typewriter

Also Published As

Publication number Publication date
JPS5978400A (ja) 1984-05-07

Similar Documents

Publication Publication Date Title
JP2739945B2 (ja) 音声認識方法
CN101286170B (zh) 声音检索装置
US5329609A (en) Recognition apparatus with function of displaying plural recognition candidates
US5127055A (en) Speech recognition apparatus & method having dynamic reference pattern adaptation
US6507815B1 (en) Speech recognition apparatus and method
JPH03144877A (ja) 文脈的文字または音素認識方法及びシステム
JPH067351B2 (ja) 候補列作成装置
JP2002278579A (ja) 音声データ検索装置
JP4511274B2 (ja) 音声データ検索装置
JP3758241B2 (ja) 音声情報検索装置
Rabiner et al. On the application of embedded training to connected letter recognition for directory listing retrieval
JP2000099084A (ja) 音声認識方法及びその装置
JPS60225273A (ja) 単語検索方式
JPH0576675B2 (ja)
Bajwa et al. Simultaneous speech segmentation and phoneme recognition using dynamic programming
JP2637762B2 (ja) パターン詳細同定方式
JPH0438026B2 (ja)
JPS59100939A (ja) 日本語入力装置
JP2947832B2 (ja) 単語照合方法
JPH01177094A (ja) データ検索装置
JPS5868180A (ja) 仮名漢字変換装置
JPS63118198A (ja) 音声認識装置
JPH0632021B2 (ja) 日本語音声認識装置
JPH0746373B2 (ja) 単語認識装置
JPH03214198A (ja) ワードスポッティング音声認識方法