JPS6344698A

JPS6344698A - 単語検出方式

Info

Publication number: JPS6344698A
Application number: JP61190261A
Authority: JP
Inventors: 畑崎　香一郎
Original assignee: NEC Corp
Current assignee: NEC Corp
Priority date: 1986-08-12
Filing date: 1986-08-12
Publication date: 1988-02-25
Anticipated expiration: 2009-07-27
Also published as: JPH0656559B2

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】（産業上の利用分野）本発明は音声認識装置、音声入力装置等において用いら
れ、入力音声中に含まれる単語とその単語の音声中での
位置とを検出する単語検出方式に関する。

（従来の技術）音声認識装置、音声入力装置等において入力音声中の単
語とその位置を検出する方法に、音節、音素、音素クラ
ス等のカテゴリの列である入力音声から各カテゴリとそ
れらの入力音声中での位置情報とを抽出し、抽出された
カテゴリから作成したカテゴリ列がある単語のカテゴリ
洒に対応すれば、その単語と入力音声中でのカテゴリ列
の位置とを検出結果として出力する方法がある。

一般に上述のカテゴリは、その時間長が短かく、また類
似するカテゴリが存在することなどから、入力音声中の
カテゴリを完全に誤りなく抽出することは困難である。

このため、従来は、入力音声中の各カテゴリの区間に対
して複数個のカテゴリ候補を抽出しておき、入力音声の
端から順にカテゴリ候補を用いて、部分的なカテゴリ候
補列を生成しては単語のカテゴリ列との照合を行なうと
いう処理を繰り返すことによって、その単語に対応する
カテゴリ候補タリを見つけていた。この方法の詳細は、
例えば、文献１ｒ特願昭５８−２１４５４４号、バタン
認識装置」に述べられているので、ここでは省略する。

また、入力音声中のカテゴリ抽出の段諧において、発声
のなまけや隣接するカテゴリ（例えば音節）どうしの調
音結合などの原因によって、入力音声には含まれないカ
テゴリが検出され、その結果、隣接すべきカテゴリ候補
の間に他のカテゴリ候補が出現することがある。この現
象を以後、カテゴリ挿入誤りと呼ぶ。

カテゴリ挿入誤りに対処するために、従来は次の方法を
用いていた。１−なわら、どのようなカテゴリの芝びの
とぎにカテゴリ挿入誤りが起こりやすいかということ奢
あらかじめ調査し、その結果から比・咬的頻度の高いカ
テゴリ挿入誤りについてカテゴリ列訂正規則を用意する
。カテゴリ列訂正規則は、カテゴリ挿入誤りの起こって
いるカテゴリタフに適用された場合、挿入されたカテゴ
リを削除する。この規則を、単語検出時に、カテゴリ候
補列に適用することによって、比較的類度の高いカテゴ
リ挿入誤りは、訂正することができる。この方法は、例
えば文献２″松永昭−５好田正紀’　Ｂｒａｎｃｈ　＆
　Ｂｏｕｒｉｄ法の効果とＢｏｔｔｏｍ　−ＩＪｐ音１
０識を利用した９補選択”、日本前り学会音声研究会資
料Ｓ　８５−７９．１９８６年１月」の６１６頁右側１
５行から１８行目に述べられている。また、訂正規則の
例は同文＃、６１７頁、表４に示されている。

（発明が解決しようとしている問題点）上記従来の方法
では、入力音声から抽出されたカテゴリ候補を用いてカ
テゴリ候補列を生成したのちに、Ｒ語のカテゴリ列との
照合を行なっていたために、最終的に無駄になるカテゴ
リ候補列が多数生成されてしまい、そのために多大な計
算量を必要としていた。

また、検出すべき単語の区間が入力音声の一部分しか占
めない場合でも、従来は、その単語の存在しない区間を
含め、入力音声の端からすべてのカテゴリ候補について
等しく単語中のカテゴリとの照合を行なわねばならず、
無駄な計算時間を必要とし、単語の検出まで長い時間を
必要としていた。

きらに、前記のカテゴリ列訂正規則は、カテゴリ挿入誤
りの起こ−）でいるカテゴリ候補列だけではなくて、起
こっていないカテゴリ候補列にも等しく通用される。ま
た、一つのカテゴリ候補列に対し−Ｃは、多くの場合複
数個の訂正規則が個別に適用される。このため、一つの
カテゴリ候補列から多くのカテゴリ候補７ｇが生成され
てしまい、単語のカテゴリタフとの照合を行なうべきカ
テゴリ候補列の数が増加する。しがもそのカテゴリ候補
列のほとんどは、検出すべき単語のカテゴリ列とは−７
一致しないために拒絶されるものである。

また、訂正規則で訂正できるカテゴリ挿入誤りは比較的
８繁に起こるものに限られ、まれに起こる誤りを訂正す
ることはできない。訂正できる誤りの種類を増やすため
には訂正規則の数を増加いせなければならないが、この
結果、生成されるカテゴリ候補夕＋ｌはまｒま１増加す
る。

例えば、「オンセイニンシキワ（音声認識は）、と発声
された音声が入力され、その中の音節候補を抽出した場
合、音節“ン”と“シ”のそれぞれの音節候補の間に音
節“二゛が誤って挿入される場合がある。この場合、他
の音節に対して正しい音ＷＪ侯補が得られた場合でも、
抽出された音節候補から生成される音＠候補夕１１は“
オンセイニンニシキワ”となり、この中には正しい単Ｚ
５候補１認識」の音節例゛ニンシキ”に一致する部分が
ないため、単語ｒで識」を検出することはできない、し
かも、このような音節の挿入誤りは比較的まれな種類の
ものであり、この誤りを訂正する規則が用意さｇ−ｒい
、にとは少ない。

本発明の目的は、無駄なカテゴリ候補列を生成せず、ま
た、検出すべき単語の区間が入力音声全体のごく一部で
ある場合や、さらに入力音声中のカテゴリ候補検出時に
いくつかのカテゴリ候補が誤って挿入された場合でも、
効率よく入力音声から正しい単語とその位置とを検出す
ることを可能にする単語検出方式を提供することにある
。

（問題点を解決するための手段）前述の問題点を解決し上記目的を達成するために本発明
が提供する手段は、音節、音素、音素クラス等のカテゴ
リの列である入力音声から抽出した複数個のカテゴリ候
補とそれらの位置情報とを用いて、単語のカテゴリ列に
対応するカテゴリ候補列を生成することによって、入力
音声中の単語とその出現位置を検出する単語検出方式で
あって、入力音声から得た複数詞のカテゴリ候補のそれ
ぞれをそのカテゴリ名で分類して記憶し、単語中のカテ
ゴリの並びの順に従って各カテゴリに対応するカテゴリ
候補をそのカテゴリと同じ名前に分類きれて記憶されて
いるカテゴリ候補の中から選ぶとともに、単語中の黛接
する２個のカテゴリのそれぞれが、入力音声中の連続す
る３個のカテゴリ候補の並びの両端のカテゴリ候補に対
応するときには、その２個のカテゴリの並びと３個のカ
テゴリ候補の並びとを対応許せて、カテゴリ候補列の生
成を行なうことを特徴とする。

（作用）本発明の方式では、入力音声から抽出諮れたカテゴリ候
補のうち、検出すべき単語に含まれるカテゴリと同じ名
前のカテゴリ候補だけを用いて、かつ単語中のカテゴリ
の並びを辿りながら対応するカテゴリ候補列を生成する
。このことによって、単語のカテゴリ列あるいはその部
分列に対応するカテゴリ候補列だけが生成されることに
なり、無駄なカテゴリ列を生成することを避けることが
可能となる。

また、入力音声中のカテゴリ候補のうち、単語中のカテ
ゴリに対応するカテゴリ候補からカテゴリ候補列を生成
してゆくために、検出すべき単語の区間が入力音声の全
体のごく一部の場合であっても、また、その区間が入力
音声中のどの位置にあっても、素早くその単語を検出す
ることが可能となる。

また、カテゴリの挿入誤りが生じた場合でも以下の原理
で単語を検出することが可能となる。いま、カテゴリ列
がｃ　、、、、　Ｃ、、Ｃ、、、、Ｃｒである単語Ｗが
含まれる入力音声中のカテゴリ候補を抽出した結果、カ
テゴリＣ，，、Ｃ，それぞれのカテコ゛り候補に、、、
に、の間に誤ってカテゴリ候補Ｋｘが挿入されたとする
。すなわち、入力音声中での単ＭＷに対応する部分のカ
テゴリ候補列はＫ　１８．　、　Ｋ　＋　−ｒ　Ｋ　ｘ
　Ｋ　Ｉ、　、、　Ｋ　ｒとなる。そこで、検出すべき
単語中のカテゴリの並びを辿りながら、そのｉ語に対応
するカテゴリ候補列を生成するときに、カテゴリＣ５−
エに対応するカテゴリ候補（Ｋ、、）とカテゴリＣＩに
対応するカテゴリ候補（Ｋ、）とがそれぞれ、入力音声
中での連続する３個のカテゴリ候補の並びの両端のカテ
ゴリ候補であるなら、その３個のカテゴリ候補の並びを
単語中のカテゴリ列Ｃ１−、Ｃ、に対応きせる。このこ
とによって、カテゴリ候補に８が挿入されたとしても、
カテゴリ候補列とカテゴリ列との正しい対応をとること
が可能になる。また、単語のカテゴリ列に対応するカテ
ゴリ候補列だけが生成されることになるため、無駄なカ
テゴリ候補列の生成を避けることができる。

（実施例）以下、図面を参照しつつ、実施例に従って本発明を一層
詳細に説明する。

第１図は本発明の一実施例を示すブロック図である。

本実施例では日本語の音声の入力がきれるものとし、ま
たカテゴリとして音節を用いる。音節抽出部１０１は入
力音声中の音節候補を検出し、その候補を音節候補記憶
部１０２に記憶する。

音節抽出部１０１の一例をブロック図で第２図に示す、
第２図において、入力音声は音声バッファ２０１に一旦
格納きれる。まず、母音候補検出部２０２が、音声バッ
ファ２０１に格納された音声中のＤ前候補を検出し、Ｎ
音候補記憶部２０３に格納する。

母音候補の検出は母音バタン記憶部２０４にあらかじめ
格納されている各母音の音声標準バタンと入力音声の各
区間とを照合することによって行なわれる。母音の音声
信号は比較的定常であるので検出は容易である。各母音
候補は少なくとも母音名、入力音声中での位置の情報を
保持している。母音候補の検出が終了した後、子音候補
検出部２０５によって子音候補が次に述べるようにして
検出される。日本語においては、音節は子音（Ｃ）−母
音（Ｖ）の組である。従って入力音声中では、２個の母
音に挾まれた区間のうちのある時間長以下の区間（これ
を■ＣＶ区間）および入力音声の始端からある時間長以
内にある母音までの区間（これをＣｖ区間）のそれぞれ
に、１個の子音が存在すると言える。子音候補検出部２
０４は母音候補記憶部２０３に記憶されている母音候補
から作られるすべての７０７区問およびＣＶ区間のそれ
ぞれに対して、あらかじめ子音バタン記憶部２０６に記
憶されている■Ｃ■およびＣｖ標準音声バタンとの照合
を行ない、類似度の高い複数個の音声バタンの名前を子
音民補とする０以上で決定されたバｌ音候補と子音候補
とを組み合わせて音節候補とし、入力音声中での位置と
共に音節候補記憶部１０２（こ二己士意ずろ。

例として、“オンセイニンシキワ″（音声認識は）とい
う音声が入力されたとすると、音節認識の結果として例
えば第３図に示されるような音節候補が抽出゛される。

第３図において、矢印の線が各音節候補の区間であり、
各区間に複数個の音節候補が抽出されている。これらの
音節候補は、音節名で分類されて、音節候補記憶部１０
２に記憶される。この結果、音節候補記憶部１０２の内
容は第４図に示されるようになる。この図では、各音節
候補を“音節名／始端時刻：終端時刻”の形式で表現し
ている。

単語記憶部１０３には検出すべさ単語の音節夕ｌが記憶
されている。その中の１個の単語を、！を語バッファ１
０４に取り出した後、入力音声にこの単語が含まれるか
どうかが調べられる。今、単語バッファ１０４には単語
「認識、の音節列“ニンシキ”が記憶されているとする
。

音節候補列生成部１０５は単語バッファ１０４に記憶さ
れている一ａ語中の音節の並びの順に、音節候補記憶部
１０２中の音節候補から音節候補列を作成し、その結果
の音節候補列と対応する音節列とを音節候補列記憶部１
０６に記憶する。本実施例では、単語の先頭の音節から
順に音節列を作成してゆく。

まず、単語バッファ１０４先頭の音節は“二”であるか
ら、音節候補列生成部１０５は音節候補記憶部１０２中
で“二”に分類されて記憶されている音節候補を取り出
し、それぞれを長さ１の音節候補列として、音節“二”
とともに音節候補列記憶部１０６に記憶する。この結果
、音節候補列記憶部１０６には、 ■二１０：２　　（ニ） ■二／２：４（ニ） ■−二／１０　：　　１２　　　（二　）■二／１４　
：　１６　　（ニ）の４個の音節候補列が記憶部れる。ここで、括ユの中が
対応する音節列である。

次に、音節候補列生成部１０５は単語バッファ１０４中
の次の音節“ン”に注目し、音節候補記憶部１０２中で
“ン”に分類されて記憶されている音節候補のそれぞれ
について、音節候補列記憶部１０６中のいずれかの音節
候補列の最後尾の音節候補の直後にか、あるいは他の１
個の他の音節候補を介して、入力音声中で後続している
かどうかを調べる。そのように後続している音節候補が
あれば、その音節候補を音節候補列の最後尾に連結して
新たな音節候補列を生成し音節候補列記憶部１０６に記
憶する。音節候補Ａが他の音節候補Ｂに後続Ｌ７ている
かどうかは音節候補Ａの終端時刻と音ｗＪ侯補Ｂの始端
時刻とを比較することによって判定することができる。

ここでは、それらの時刻の差がプラスマイナス１以下の
ときに後続すると判定する。今の場合は、“ン”に分類
されて記憶されている音節候補は、ン／２：４、ン／１
２　：　１４の３個である。そこで、音節候補ン／２：
４が音節候補列■の最後尾の音節候補二１０：２の直後
に後続することから、音節候補列■に音節吸補二１０：
２を連結して音節列“ニン”とする。同様に、音節候補
ン／１２：１４を音節候補列■に連結して音節列″ニン
”とする、また、それまで音節候補列記憶部１０６に記
憶されていた音節候補列は削除する。この結果、音節候
補列記憶部１０６の中には、 ■二１０：２−ン／２：４にン） ■二／１０　：　１２−ン／１２：１４　　にン）の２
個の音節候補列が残る。

統いて、音節“シ”についての処理に進む。音節候補記
憶部１０２中で、“シ”に分類されて記憶されている音
節候補は、シ／４ニアとシ／１６：１８の２個である。

このそれぞれについて音節候補列■と■の最後尾の音節
候補に、直接かあるいは他の１個の他の音節候補を介し
て、入力音声中で後続しているかどうかを調べる。この
結果、シ／４ニアが音節候補列■に連結される。また、
シ／１６　：　１Ｂは音節候補列■の最後尾の音節候補
ン／１２：１４に音節候補二／１４：１６またはイ／１
４：１６を介して接読しているため、音節侯補シ／１６
：１８が音節候補列■に連結される。従って、音節候補
列記憶部１０６の内容は ■二１０：２−ン／２：４−シ／４ニアにンシ） ■二／１０：１２−ン、／１２：１４−シ／１６：１８
にンシ）となる。

ここで、単語バッファ１０４の中の最後の音節“キ”に
ついての処理に進む。音節候補記憶部１０２中で、“キ
”に分類されて記憶されている音節候補は、キ／１８：
１９の１個である。この音節候補について音節候補タリ
■と■の最後子の音節候補に、直接かあるいは他の１個
の他の音節候補を介して、入力音声中で後続しているか
どうかを調べる。この場合、音節候補列■の最後尾の音
節候補シ／１４：１６の直後に後続している。このこと
から、音節候補キ／１８：１（ｌが音節候補列■に連結
きれ、次の音節候補列■が音節候補列に記憶される。

■二／１０：１２−ン／１２：１４−シ／１６　：　１
８−キ／１８　：　１９　　にンシキ）ここで、単語バッファ１０４の最後の音節に達している
ため、音節候補列生成部１０５は、単語「認識」が入力
音声中の時刻１０から時刻１９に至る区間に存在すると
いうことを出力する。

以上、本発明の一実施例を説明した。なお、カテゴリの
挿入誤りは、連続しないかぎり、１個の単語中に複数細
土じていてもよい。

（発明の効果）以上説明したように、本発明によれば、入力音声からの
音節候補抽出の段階で、いくつかの余分な音節候補が誤
って挿入きれた場合でも、その単語の存在と入力音声中
での位置を検出することが可能となり、しかも検出処理
の途中で生成される音節候補列の数が極めて少なくて、
効率の良い単語検出を行なうことが可能となる、単語検
出方式を提供することができる。

【図面の簡単な説明】第１図は本発明の一実施例を示すブロック図、第２図は
第１図実施例における音節抽出部の具体例を示すブロッ
ク図、第３図は第１図実施例における入力音声と抽出さ
れた音節候補の一例を示す図、第４図は第１図実施例に
おける音節候補記憶部の内容の一例を示す図である。１０１・・・音節抽出部、１０２・・・音節候補記憶部
、１０３・・・単語記憶部、１０４・・・単語バッファ
、１０５・・・音節列生成部、１０６・・・音節列記憶
部、２０１・・・音声バッファ、２０２・・・母音候補
検出部、２０３・・・母音候補記憶部、２０４・・・母
音バタン記憶部、２０５・・・子音候補検出部、２０６
・・・子音バタン記憶部。

Claims

【特許請求の範囲】

音節、音素、音素クラス等のカテゴリの列である入力音
声から抽出した複数個のカテゴリ候補とそれらの位置情
報とを用いて、単語のカテゴリ列に対応するカテゴリ候
補列を生成することによって、入力音声中の単語とその
出現位置を検出する単語検出方式において、入力音声か
ら得た複数個のカテゴリ候補のそれぞれをそのカテゴリ
名で分類して記憶し、単語中のカテゴリの並びの順に従
って各カテゴリに対応するカテゴリ候補をそのカテゴリ
と同じ名前に分類されて記憶されているカテゴリ候補の
中から選ぶとともに、単語中の隣接する２個のカテゴリ
のそれぞれが、入力音声中の連続する３個のカテゴリ候
補の並びの両端のカテゴリ候補に対応するときには、そ
の２個のカテゴリの並びと３個のカテゴリ候補の並びと
を対応させて、カテゴリ候補列の生成を行なうことを特
徴とする単語検出方式。