JPS6147993A

JPS6147993A - 音声認識方式

Info

Publication number: JPS6147993A
Application number: JP59169594A
Authority: JP
Inventors: 教幸藤本; 佐藤　泰雄
Original assignee: Fujitsu Ltd
Current assignee: Fujitsu Ltd
Priority date: 1984-08-14
Filing date: 1984-08-14
Publication date: 1986-03-08

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】〔産業上の利用分野〕本発明は、音声認識方式、特に拗音節の認識率の向上を
図った単音節単位の音声認識方式に関するものである。

〔従来の技術〕

単音節を認識単位とした従来の音声認識方式では、／ｋ
ｊａ／、／ｋｊｕ／、／ｋｊｏ／、／ｌｆａ／、／Ｌｆ
ｕ／、／ｌｆｏ／、／ｆａ／、／ｆｕ／、／ｆｏ／など
の拗音節の認識率が低いのが現状である。

第３図は、従来の単音節単位の音声認識方式を示す図で
ある。図において、１は前処理部、２はパラメータ抽出
部、３は母音定常部抽出部、４は切替部、５は登録部、
６は候補削減部、７はＤＰ照合部、８は再照合方式選定
部、９は各種再照合部、１０は判定部である。

この従来の音声認識方式によれば、特定話者が拗音節を
含む単音節単位に区切って発声した入力音声の個々の単
音節音声を、前処理部１において雑音を除くなどの前処
理を行った後に、パラメータ抽出部２において音声の特
徴を表す特徴パラメータを抽出する。特徴パラメータと
しては、例えば複数子４−ンネルの帯域フィルタの出力
を一定周期でサンプリングしたパラメータなどが用いら
れる。母音定常部抽出部３において、１つの単音節の特
徴パラメータの安定な部分を定常部として抽出する。一
般に特徴パラメータは母音部分で安定するから、抽出さ
れた定常部は母音定常部とみなすことができる。したが
って、母音定常部は母音の特徴を十分に表している部分
である。

第４図は、例えば単音節／　ｋ　ｉ　／の特徴パラメー
タについて、母音定常部を説明するための図である。母
音定常部は、母音／ｉ／の比較的安定した部分に位置し
ている。なお、第４図に示すパターンは、特徴パラメー
タの時系列を包絡特性で示しており、一般に特徴パター
ンと称されている。

母音定常部までの抽出された特徴パターンは、切替部４
を経て、登録部５に送られる。登録部５では、第５図に
示すように母音定常部以降の特徴パラメータ部分（図中
、斜線を施して示す）を削除して得られた特徴パターン
を登録する。

以上のようにして特定話者の音声の特徴パターンが登録
部５に登録された状態下で認識処理が行われる。前記特
定話者により、拗音節を含む単音節単位に区切って発声
された音声が入力されると、この未知入力音声の個々の
単音節音声は、前処理部１、パラメータ抽出部２、母音
定常部抽出部３において前述したと同様の処理がなされ
、切替部４を経て候補削減部６に送られる。候補削減部
６では、人力された単音節音声の特徴パラメータの母音
定常部の値、すなわち母音定常部のパラメータ値を、登
録部５に登録されているすべての単音節音声の特徴パラ
メータの母音定常部のパラメータ値と比較して、母音定
常部のパラメータ値どうしの距離を算出する。そして、
距離の小さい単音節音声を候補として登録部５より選出
することによって、後述するＤＰ（動的計画法）照合に
おける照合候補の削減を図る。候補削減の目的は、ＤＰ
照合の処理量を減らすことにより、処理時間を短縮する
ことにある。

ＤＰ照合部７では、入力音声の特徴パターンと、前記候
補削減部６において選出された登録音声の特徴パターン
とのＤＰ照合を行う。この場合、第５図に示すように特
徴パターンの始端から母音定常部までをＤＰ照合区間と
してＤＰ照合を行う。

ＤＰ照合部７は、入力音声の特徴パターンに対して、登
録部５に登録されている特徴パターンを照合距隈の小さ
いものから、すなわち類似度の大きいものから、順位づ
けて照合結果を出力する。しかし　ＤＰ照合は、始端か
ら母音定常部までの特徴パターン全体についてみている
から例えば、子音の部分の細かい特徴についての照合は
十分でない。例えば、入力された単音節が／　ｋ　ａ　
／であるにもかかわらず、ＤＰ照合部７の照合結果とし
て、１位を／　ｔ　ａ　／に、２位を／　ｋ　ａ　／と
して出力することがある。したがって、このような誤り
を是正するため、再照合が行われている。再照合方式選
定部８は、ＤＰ照合の照合結果に基づいて、再照合すべ
き複数の再照合候補単音節を指示すると共に、再照合す
る方式を決定する。各種再照合部９では、決定された再
照合方式に従って、例えば上述したような単音節／　ｋ
　ａ　／と／　ｔ　ａ　／について子音／に／と／’ｔ
／の再興台が行われる。各種再照合部９では再照合候補
単音節の組合わせに適した識別または照合方式によって
再照合を行うことができるように構成されている。

判定部１０では、再照合方式選定部８によって選定され
た再照合方式と、各種再照合部９の照合結果とから、入
力された単音節音声を判定して認識結果を出力する。

〔発明が解決しようとする問題点〕

以上のような従来の音声認識方式では、拗音節と拗音節
でない他の単音節との認識の誤りが生じやすい。例えば
すｊ音節／ｋｊｕ／と他の音節／ｋｉ／とを誤る如くで
ある。これは、母音定常部抽山部３における拗音節の母
音定常部の抽出が拗音節でない単音節に比べて不安定で
あるからである。

例えば第６図に示すように拗音節／ｋｊｕ／の特徴パラ
メータから抽出した母音寞常部が必ずしも母音／ｕ／の
部分ではなく、子音／ｊ／から母音／ｕ／の過渡部分で
あって、どちらかと言えば子音／ｉ／に近い部分にくる
場合がある。このような場合には、拗音節／ｋｊｕ／の
始端から母音定常部までの特徴パターンと、単音節／　
ｋ　ｉ　／の始端から母音定常部までの特徴パターンが
似て（る結果、ＤＰ照合部７におけるＤＰ照合では、拗
音節／ｋｊｕ／と単音節／　ｋ　ｉ　／との順位を誤っ
た照合結果を出力することがある。その結果、従来の音
声認識方式では、拗音節と拗音節でない単音節との認識
誤りが多いという欠点がある。

〔問題点を解決するための手段〕

本発明の目的は、拗音節に対しても良い認識率が得られ
る音声認識方式を提供することにある。

本発明は、拗音節を含む単音節単位に区切って発声され
た単音節音声を予め登録しておく登録部と；拗音節を含
む単音節単位に区切って発声された未知入力音声の個々
の単音節音声と前記登録部に予め登録された多くともす
べての単音節音声とを、照合区間を各単音節音声始端か
ら母音定常部までとしてＤＰ照合を行うＤＰ照合部と；
前記ＤＰ照合部での照合結果に基づいて、複数の再照合
候補単音節を前記登録部に予め登録された単音節音声よ
り選出し、選出された再照合候補単音節の組合わせに適
した再照合方式によって再照合する再照合部とを備える
音声認識方式において；前記再照合候補単音節中に拗音
節と拗音節でない単音節とが混在している場合に、前記
再照合部が、ＤＰ照合距離と母音定常部の値を用いた距
離との荷重和によって前記再照合候補単音節を再照合す
ることを特徴とするものである。

〔作用〕

拗音節音声の始端から母音定常部までの特徴パターンと
、拗音節でない単音節音声の始端から母音定常部までの
特徴パターンが類似していても、一般に、母音定常部の
パラメー・夕値は異なってくる。したがって、例えば未
知入力単音節音声が／ｋｉ／である場合に、この未知入
力単音節音声／ｋｉ／の母音定常部のパラメータ値と登
録部５に登録されている単音節音声／　ｋ　ｉ　／の母
音定常部のパラメータ値との距離、および未知入力単音
節音声／ｋｉ／の母音定常部のパラメータ値と登録部５
に登録されている拗音節音声／ｋｊｕ／の母音定常部の
パラメータ値との距離には差が生じる。

よって、母音定常部のパラメータ値を用いた距離を再照
合時に利用すれば母音の誤りを防ぐことができる。

したがって、再照合候補中に拗音節と拗音節でない単音
節が混在している場合には、ＤＰ照合により算出される
ＤＰ照合距離と、上述した母音定常部のパラメータ値を
用いた距離との荷重和を形成し、この荷重和を用いて再
照合を行えば、拗音節と拗音節でない単音節との認識誤
りを軽減することができる。

〔実施例〕

以下、図面を参照して本発明の実施例を詳細に説明する
。

第１図は、本発明の一実施例を示す図である。

本実施例は、第３図図示の従来の音声認識方式に、さら
に再照合部１１を付加したものである。したがって、第
３図の要素と同一の要素には同一の番号を付して示す。

再照合部１１は、ＤＰ照合部７において算出されたＤＰ
照合距離と母音定常部のパラメータ値を用いた距離との
荷重和により再照合を行うための照合部である。

本実施例によれは、ＤＰ照合部７における照合結果に基
づき再照合すべき再照合候補単音節中に、拗音節と拗音
節でない単音節とが混在している場合には、再照合方式
選定部８は、再照合部１１に対して再照合を指示する。

今、未知入力単音節音声が／　ｋ　ｉ　／である場合に
、ＤＰ照合部７の照合結果が／ｋ　ｊ　ｕ／が１位で、
／　ｋ　ｉ　／が２位であるものとする。

候補削減部６においては、前述したように、登録部に登
録されていた拗音節／ｋｊｕ／および単音節／　ｋ　ｉ
　／の特徴パラメータの母音定常部のパラメータ値と、
入力単音節／　ｋ　ｉ　／の特徴パラメータの母音定常
部のパラメータ値とが比較照合され、母音定常部のパラ
メータ値どうしの距離が算出されている。これら母音定
常部のパラメータ値を用いた距離は、再照合部１１に送
られる。一方ＤＰ照合部７において算出されたＤＰ照合
距離も再照合部１１に送られる。

第２図は母音定常部のパラメータ値を示す図であり、第
２図（Ａ）は入力車音節／　ｋ　ｉ　／の特徴パターン
を、第２図ＣＢ）は登録単音節／　ｋ　ｉ　／の特徴パ
ターンを、第２図（Ｃ）は登録拗音節／ｋｊｕ／の特徴
パターンをそれぞれ示している。

再照合部１１では、登録部５に登録されている拗音節／
ｋｊｕ／と入力単音ｉｆｆ／ｋｉ／とのＤＰ照合距離と
、これら登録拗音節／ｋｊｕ／と入力単音節／　ｋ　ｉ
　／との母音定常部のパラメータ値を用いた距離との荷
重和をとる。一方、登録部に登録されている単音節／　
ｋ　ｉ　／と入力単音節／ｋｉ／とのＤＰ照合距離と、
これら登録単音節／ｋｉ／と入力車音節／　ｋ　ｉ　／
との母音定常部のパラメータ値を用いた距離との荷重和
をとる。再照合部１１では、これら荷重和を比較照合し
て結果を出力する。

登録車音節／　ｋ　ｉ　／の母音定常部のパラメータ値
と入力車音節／　ｋ　ｉ　／の母音定常部のパラメータ
値との距離は、登録拗音節／ｋｊｕ／の母音定常部のパ
ラメータ値と入力単音節／　ｋ　ｉ　／の母音定常部の
パラメータ値との距離よりも小さいから、再照合部１１
では、１位を／ｋｉ／に、２位を／ｋｊｕ／とする照合
結果を出力する。

再照合部１１における照合結果は判定部１０に送られ、
判定部１０では入力された単音節を／ｋｉ／と判定する
認識結果を出力する。　　　　　′以上の実施例では、
再照合部１１は、候補削減部６において算出された母音
定常部のパラメータ値を用いた距離を利用しているが、
候補削減部を有さない場合には、再照合部１１内で母音
定常部のパラメータ値を用いた距離を算出する必要があ
ることは明らかである。

なお、本発明は母音定常部の抽出が不安定な拗音節に対
して適用されるものであるが、／ｊａ／、／ｊｕ／、／
ｊｅ／、／　ｊ　Ｏ／等の音節についても母音定常部が
不安定であるから、これら音節も拗音節として扱うこと
により認識率の向上を図ることができる。

〔発明の効果〕

以上説明した如く、本発明によれば、拗音節と拗音節で
ない単音節との認識誤りをなくするようにすることが可
能となる。

【図面の簡単な説明】

第１図は本発明の音声認識方式の一実施例を示すブロッ
ク図、第２図は母音定常部のパラメータ値を説明するた
めの特徴パターンを示す図、第３図は従来の音声認識方
式を示すブロック図、第４図および第５図は母音定常部
を説明するための特徴パターンを示す図、第６図は拗音
節の場合の母音定常部を説明するための特徴パターンを
示す図である。図中、１は前処理部、２はパラメータ抽出部、３は母音
定常部抽山部、４は切替部、５は登録部、６は候補削減
部、７はＤＰ照合部、８は再照合方式選定部、９は各種
再照合部、１０は判定部、１１は再照合部をそれぞれ示
す。

Claims

【特許請求の範囲】

拗音節を含む単音節単位に区切って発声された単音節音
声を予め登録しておく登録部と；拗音節を含む単音節単
位に区切って発声された未知入力音声の個々の単音節音
声と前記登録部に予め登録された多くともすべての単音
節音声とを、照合区間を各単音節音声始端から母音定常
部までとしてＤＰ照合を行うＤＰ照合部と；前記ＤＰ照
合部での照合結果に基づいて、複数の再照合候補単音節
を前記登録部に予め登録された単音節音声より選出し、
選出された再照合候補単音節の組合わせに適した再照合
方式によって再照合する再照合部とを備える音声認識方
式において；前記再照合候補単音節中に拗音節と拗音節
でない単音節とが混在している場合に、前記再照合部が
、ＤＰ照合距離と母音定常部の値を用いた距離との荷重
和によって前記再照合候補単音前を再照合することを特
徴とする音声認識方式。