JPS6147993A - 音声認識方式 - Google Patents

音声認識方式

Info

Publication number
JPS6147993A
JPS6147993A JP59169594A JP16959484A JPS6147993A JP S6147993 A JPS6147993 A JP S6147993A JP 59169594 A JP59169594 A JP 59169594A JP 16959484 A JP16959484 A JP 16959484A JP S6147993 A JPS6147993 A JP S6147993A
Authority
JP
Japan
Prior art keywords
matching
vowel
unit
verification
monosyllabic
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP59169594A
Other languages
English (en)
Inventor
教幸 藤本
佐藤 泰雄
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP59169594A priority Critical patent/JPS6147993A/ja
Publication of JPS6147993A publication Critical patent/JPS6147993A/ja
Pending legal-status Critical Current

Links

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 〔産業上の利用分野〕 本発明は、音声認識方式、特に拗音節の認識率の向上を
図った単音節単位の音声認識方式に関するものである。
〔従来の技術〕
単音節を認識単位とした従来の音声認識方式では、/k
ja/、/kju/、/kjo/、/lfa/、/Lf
u/、/lfo/、/fa/、/fu/、/fo/など
の拗音節の認識率が低いのが現状である。
第3図は、従来の単音節単位の音声認識方式を示す図で
ある。図において、1は前処理部、2はパラメータ抽出
部、3は母音定常部抽出部、4は切替部、5は登録部、
6は候補削減部、7はDP照合部、8は再照合方式選定
部、9は各種再照合部、10は判定部である。
この従来の音声認識方式によれば、特定話者が拗音節を
含む単音節単位に区切って発声した入力音声の個々の単
音節音声を、前処理部1において雑音を除くなどの前処
理を行った後に、パラメータ抽出部2において音声の特
徴を表す特徴パラメータを抽出する。特徴パラメータと
しては、例えば複数子4−ンネルの帯域フィルタの出力
を一定周期でサンプリングしたパラメータなどが用いら
れる。母音定常部抽出部3において、1つの単音節の特
徴パラメータの安定な部分を定常部として抽出する。一
般に特徴パラメータは母音部分で安定するから、抽出さ
れた定常部は母音定常部とみなすことができる。したが
って、母音定常部は母音の特徴を十分に表している部分
である。
第4図は、例えば単音節/ k i /の特徴パラメー
タについて、母音定常部を説明するための図である。母
音定常部は、母音/i/の比較的安定した部分に位置し
ている。なお、第4図に示すパターンは、特徴パラメー
タの時系列を包絡特性で示しており、一般に特徴パター
ンと称されている。
母音定常部までの抽出された特徴パターンは、切替部4
を経て、登録部5に送られる。登録部5では、第5図に
示すように母音定常部以降の特徴パラメータ部分(図中
、斜線を施して示す)を削除して得られた特徴パターン
を登録する。
以上のようにして特定話者の音声の特徴パターンが登録
部5に登録された状態下で認識処理が行われる。前記特
定話者により、拗音節を含む単音節単位に区切って発声
された音声が入力されると、この未知入力音声の個々の
単音節音声は、前処理部1、パラメータ抽出部2、母音
定常部抽出部3において前述したと同様の処理がなされ
、切替部4を経て候補削減部6に送られる。候補削減部
6では、人力された単音節音声の特徴パラメータの母音
定常部の値、すなわち母音定常部のパラメータ値を、登
録部5に登録されているすべての単音節音声の特徴パラ
メータの母音定常部のパラメータ値と比較して、母音定
常部のパラメータ値どうしの距離を算出する。そして、
距離の小さい単音節音声を候補として登録部5より選出
することによって、後述するDP(動的計画法)照合に
おける照合候補の削減を図る。候補削減の目的は、DP
照合の処理量を減らすことにより、処理時間を短縮する
ことにある。
DP照合部7では、入力音声の特徴パターンと、前記候
補削減部6において選出された登録音声の特徴パターン
とのDP照合を行う。この場合、第5図に示すように特
徴パターンの始端から母音定常部までをDP照合区間と
してDP照合を行う。
DP照合部7は、入力音声の特徴パターンに対して、登
録部5に登録されている特徴パターンを照合距隈の小さ
いものから、すなわち類似度の大きいものから、順位づ
けて照合結果を出力する。しかし DP照合は、始端か
ら母音定常部までの特徴パターン全体についてみている
から例えば、子音の部分の細かい特徴についての照合は
十分でない。例えば、入力された単音節が/ k a 
/であるにもかかわらず、DP照合部7の照合結果とし
て、1位を/ t a /に、2位を/ k a /と
して出力することがある。したがって、このような誤り
を是正するため、再照合が行われている。再照合方式選
定部8は、DP照合の照合結果に基づいて、再照合すべ
き複数の再照合候補単音節を指示すると共に、再照合す
る方式を決定する。各種再照合部9では、決定された再
照合方式に従って、例えば上述したような単音節/ k
 a /と/ t a /について子音/に/と/’t
/の再興台が行われる。各種再照合部9では再照合候補
単音節の組合わせに適した識別または照合方式によって
再照合を行うことができるように構成されている。
判定部10では、再照合方式選定部8によって選定され
た再照合方式と、各種再照合部9の照合結果とから、入
力された単音節音声を判定して認識結果を出力する。
〔発明が解決しようとする問題点〕
以上のような従来の音声認識方式では、拗音節と拗音節
でない他の単音節との認識の誤りが生じやすい。例えば
すj音節/kju/と他の音節/ki/とを誤る如くで
ある。これは、母音定常部抽山部3における拗音節の母
音定常部の抽出が拗音節でない単音節に比べて不安定で
あるからである。
例えば第6図に示すように拗音節/kju/の特徴パラ
メータから抽出した母音寞常部が必ずしも母音/u/の
部分ではなく、子音/j/から母音/u/の過渡部分で
あって、どちらかと言えば子音/i/に近い部分にくる
場合がある。このような場合には、拗音節/kju/の
始端から母音定常部までの特徴パターンと、単音節/ 
k i /の始端から母音定常部までの特徴パターンが
似て(る結果、DP照合部7におけるDP照合では、拗
音節/kju/と単音節/ k i /との順位を誤っ
た照合結果を出力することがある。その結果、従来の音
声認識方式では、拗音節と拗音節でない単音節との認識
誤りが多いという欠点がある。
〔問題点を解決するための手段〕
本発明の目的は、拗音節に対しても良い認識率が得られ
る音声認識方式を提供することにある。
本発明は、拗音節を含む単音節単位に区切って発声され
た単音節音声を予め登録しておく登録部と;拗音節を含
む単音節単位に区切って発声された未知入力音声の個々
の単音節音声と前記登録部に予め登録された多くともす
べての単音節音声とを、照合区間を各単音節音声始端か
ら母音定常部までとしてDP照合を行うDP照合部と;
前記DP照合部での照合結果に基づいて、複数の再照合
候補単音節を前記登録部に予め登録された単音節音声よ
り選出し、選出された再照合候補単音節の組合わせに適
した再照合方式によって再照合する再照合部とを備える
音声認識方式において;前記再照合候補単音節中に拗音
節と拗音節でない単音節とが混在している場合に、前記
再照合部が、DP照合距離と母音定常部の値を用いた距
離との荷重和によって前記再照合候補単音節を再照合す
ることを特徴とするものである。
〔作用〕
拗音節音声の始端から母音定常部までの特徴パターンと
、拗音節でない単音節音声の始端から母音定常部までの
特徴パターンが類似していても、一般に、母音定常部の
パラメー・夕値は異なってくる。したがって、例えば未
知入力単音節音声が/ki/である場合に、この未知入
力単音節音声/ki/の母音定常部のパラメータ値と登
録部5に登録されている単音節音声/ k i /の母
音定常部のパラメータ値との距離、および未知入力単音
節音声/ki/の母音定常部のパラメータ値と登録部5
に登録されている拗音節音声/kju/の母音定常部の
パラメータ値との距離には差が生じる。
よって、母音定常部のパラメータ値を用いた距離を再照
合時に利用すれば母音の誤りを防ぐことができる。
したがって、再照合候補中に拗音節と拗音節でない単音
節が混在している場合には、DP照合により算出される
DP照合距離と、上述した母音定常部のパラメータ値を
用いた距離との荷重和を形成し、この荷重和を用いて再
照合を行えば、拗音節と拗音節でない単音節との認識誤
りを軽減することができる。
〔実施例〕
以下、図面を参照して本発明の実施例を詳細に説明する
第1図は、本発明の一実施例を示す図である。
本実施例は、第3図図示の従来の音声認識方式に、さら
に再照合部11を付加したものである。したがって、第
3図の要素と同一の要素には同一の番号を付して示す。
再照合部11は、DP照合部7において算出されたDP
照合距離と母音定常部のパラメータ値を用いた距離との
荷重和により再照合を行うための照合部である。
本実施例によれは、DP照合部7における照合結果に基
づき再照合すべき再照合候補単音節中に、拗音節と拗音
節でない単音節とが混在している場合には、再照合方式
選定部8は、再照合部11に対して再照合を指示する。
今、未知入力単音節音声が/ k i /である場合に
、DP照合部7の照合結果が/k j u/が1位で、
/ k i /が2位であるものとする。
候補削減部6においては、前述したように、登録部に登
録されていた拗音節/kju/および単音節/ k i
 /の特徴パラメータの母音定常部のパラメータ値と、
入力単音節/ k i /の特徴パラメータの母音定常
部のパラメータ値とが比較照合され、母音定常部のパラ
メータ値どうしの距離が算出されている。これら母音定
常部のパラメータ値を用いた距離は、再照合部11に送
られる。一方DP照合部7において算出されたDP照合
距離も再照合部11に送られる。
第2図は母音定常部のパラメータ値を示す図であり、第
2図(A)は入力車音節/ k i /の特徴パターン
を、第2図CB)は登録単音節/ k i /の特徴パ
ターンを、第2図(C)は登録拗音節/kju/の特徴
パターンをそれぞれ示している。
再照合部11では、登録部5に登録されている拗音節/
kju/と入力単音iff/ki/とのDP照合距離と
、これら登録拗音節/kju/と入力単音節/ k i
 /との母音定常部のパラメータ値を用いた距離との荷
重和をとる。一方、登録部に登録されている単音節/ 
k i /と入力単音節/ki/とのDP照合距離と、
これら登録単音節/ki/と入力車音節/ k i /
との母音定常部のパラメータ値を用いた距離との荷重和
をとる。再照合部11では、これら荷重和を比較照合し
て結果を出力する。
登録車音節/ k i /の母音定常部のパラメータ値
と入力車音節/ k i /の母音定常部のパラメータ
値との距離は、登録拗音節/kju/の母音定常部のパ
ラメータ値と入力単音節/ k i /の母音定常部の
パラメータ値との距離よりも小さいから、再照合部11
では、1位を/ki/に、2位を/kju/とする照合
結果を出力する。
再照合部11における照合結果は判定部10に送られ、
判定部10では入力された単音節を/ki/と判定する
認識結果を出力する。     ′以上の実施例では、
再照合部11は、候補削減部6において算出された母音
定常部のパラメータ値を用いた距離を利用しているが、
候補削減部を有さない場合には、再照合部11内で母音
定常部のパラメータ値を用いた距離を算出する必要があ
ることは明らかである。
なお、本発明は母音定常部の抽出が不安定な拗音節に対
して適用されるものであるが、/ja/、/ju/、/
je/、/ j O/等の音節についても母音定常部が
不安定であるから、これら音節も拗音節として扱うこと
により認識率の向上を図ることができる。
〔発明の効果〕
以上説明した如く、本発明によれば、拗音節と拗音節で
ない単音節との認識誤りをなくするようにすることが可
能となる。
【図面の簡単な説明】
第1図は本発明の音声認識方式の一実施例を示すブロッ
ク図、第2図は母音定常部のパラメータ値を説明するた
めの特徴パターンを示す図、第3図は従来の音声認識方
式を示すブロック図、第4図および第5図は母音定常部
を説明するための特徴パターンを示す図、第6図は拗音
節の場合の母音定常部を説明するための特徴パターンを
示す図である。 図中、1は前処理部、2はパラメータ抽出部、3は母音
定常部抽山部、4は切替部、5は登録部、6は候補削減
部、7はDP照合部、8は再照合方式選定部、9は各種
再照合部、10は判定部、11は再照合部をそれぞれ示
す。

Claims (1)

    【特許請求の範囲】
  1. 拗音節を含む単音節単位に区切って発声された単音節音
    声を予め登録しておく登録部と;拗音節を含む単音節単
    位に区切って発声された未知入力音声の個々の単音節音
    声と前記登録部に予め登録された多くともすべての単音
    節音声とを、照合区間を各単音節音声始端から母音定常
    部までとしてDP照合を行うDP照合部と;前記DP照
    合部での照合結果に基づいて、複数の再照合候補単音節
    を前記登録部に予め登録された単音節音声より選出し、
    選出された再照合候補単音節の組合わせに適した再照合
    方式によって再照合する再照合部とを備える音声認識方
    式において;前記再照合候補単音節中に拗音節と拗音節
    でない単音節とが混在している場合に、前記再照合部が
    、DP照合距離と母音定常部の値を用いた距離との荷重
    和によって前記再照合候補単音前を再照合することを特
    徴とする音声認識方式。
JP59169594A 1984-08-14 1984-08-14 音声認識方式 Pending JPS6147993A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP59169594A JPS6147993A (ja) 1984-08-14 1984-08-14 音声認識方式

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP59169594A JPS6147993A (ja) 1984-08-14 1984-08-14 音声認識方式

Publications (1)

Publication Number Publication Date
JPS6147993A true JPS6147993A (ja) 1986-03-08

Family

ID=15889380

Family Applications (1)

Application Number Title Priority Date Filing Date
JP59169594A Pending JPS6147993A (ja) 1984-08-14 1984-08-14 音声認識方式

Country Status (1)

Country Link
JP (1) JPS6147993A (ja)

Similar Documents

Publication Publication Date Title
US7809561B2 (en) Method and apparatus for verification of speaker authentication
CN106128465A (zh) 一种声纹识别系统及方法
JPS62232691A (ja) 音声認識装置
CN110875044B (zh) 一种基于字相关得分计算的说话人识别方法
JPS6147993A (ja) 音声認識方式
JPS6147994A (ja) 音声認識方式
JPS6346496A (ja) 音声認識装置
JPS6147995A (ja) 音声認識方式
JP3007357B2 (ja) 音声認識装置の辞書更新方式
JPS6147996A (ja) 音声認識方式
JPS59143200A (ja) 連続音声認識装置
JPS6147992A (ja) 音声認識方式
JP2655637B2 (ja) 音声パターン照合方式
KR100339525B1 (ko) 1,2단계중심어인식방법을이용한생활정보안내장치
JPS58159598A (ja) 単音節音声認識方式
JPS6148000A (ja) 連続音声認識方式
JPH05188998A (ja) 音声認識方法
JPS62217297A (ja) 単語音声認識装置
Yin et al. Languagedependent fusion for language identification
JPS6136797A (ja) 音声セグメンテ−シヨン法
JPH0119599B2 (ja)
Reinhard et al. Diphone subspace models for phone-based HMM complementation.
JPS59211100A (ja) 登録型音声認識方法
JPS616694A (ja) 音声登録方式
JPH02178728A (ja) 音声認識方式