JPH0585917B2 - - Google Patents

Info

Publication number
JPH0585917B2
JPH0585917B2 JP58230429A JP23042983A JPH0585917B2 JP H0585917 B2 JPH0585917 B2 JP H0585917B2 JP 58230429 A JP58230429 A JP 58230429A JP 23042983 A JP23042983 A JP 23042983A JP H0585917 B2 JPH0585917 B2 JP H0585917B2
Authority
JP
Japan
Prior art keywords
words
speech pattern
matching
word
distance
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP58230429A
Other languages
English (en)
Other versions
JPS60121499A (ja
Inventor
Toyoshi Yamada
Haruki Matsui
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP58230429A priority Critical patent/JPS60121499A/ja
Publication of JPS60121499A publication Critical patent/JPS60121499A/ja
Publication of JPH0585917B2 publication Critical patent/JPH0585917B2/ja
Granted legal-status Critical Current

Links

Description

【発明の詳細な説明】 (a) 発明の技術分野 本発明は標準音声パターンと入力音声パターン
とを照合して音声を認識する音声認識装置に於け
る音声照合方式に関するものである。
(b) 従来技術と問題点 音声を情報処理に用いることが盛んに行われ効
果を発揮している。音声を認識するのに音声認識
装置が一般に用いられている。此の音声認識の方
法は第1図に示す手順にて行われている。即ち、
音声登録時は、音声認識装置1に音声が入力され
ると前処理部11にて入力信号を所要値にまで増
幅して周波数分析を行い、パラメータ抽出部12
にて抽出された特徴パラメータを標準音声パター
ンとして辞書メモリ14に格納しておき、次に音
声認識時には、同様に入力音声の特徴パラメータ
を入力音声パターンとして照合部13に導入し、
辞書メモリ14に登録されている標準音声パター
ンと照合を行い、両パターン間の最小距離にある
標準音声パターンを音声として認識するようにし
ていた。ところが、此の従来の方法は紛らわしい
音声の場合に、認識の確度に欠けると言つた欠点
があつた。
(c) 発明の目的 以上従来の欠点に鑑み本発明は、音声パラメー
タを時系列にn分割し差異のある分割部を再照合
して認識確度の高い音声照合装置を提供すること
を目的とするものである。
(d) 発明の構成 本発明の構成は、認識対象の各単語に対応した
標準音声パターンを格納するメモリと、入力音声
パターンの特徴抽出を行う抽出部と、該特徴抽出
したパラメータと前記標準音声パターンと照合
し、両パターン間の最小距離にある類似上位二単
語を選定し、更に前記二単語の中から類似度が最
上位となる単語を判定して認識結果を確定する照
合部とを備える音声照合装置において、紛らわし
い特定単語の組合せと、前記特定単語の標準音声
パターンを時間軸方向にn分割し、前記組合せの
差異のある特徴部分が前記n分割の中のどの分割
部分に位置するかを予め記憶しておく再照合テー
ブルメモリと、入力音声パターンと特徴部分のみ
を再照合する部分照合部とを設け、前記部分照合
部は、選定した前記二単語が前記再照合テーブル
メモリに登録されている単語であつた場合、前記
入力音声パターンも時間軸方向にn分割し、前記
再照合テーブルメモリに登録されている該二単語
の標準音声パターンの差異のある特徴部分が位置
する分割部分を該n分割の中から取り出し、前記
二単語の特徴部分とそれぞれ再照合を行い、前記
二単語の中から最初の照合結果と再照合結果の距
離に重み付けして距離の小さい方を採用するよう
制御することを特徴とする音声照合装置である。
(e) 発明の実施例 以下本発明の実施例を図に依つて詳細に説明す
る。
第2図は本発明の音声照合方式を説明する為の
一実施例のブロツク図、第3図は本発明の他の実
施例のブロツク図、第4図は音声パターンの分割
状態を示す模式図である。
図中第1図と同一個所は同符号を用いる。図に
おいて、15は候補格納部、16は距離格納部、
17は再照合テーブル、18は部分照合部、19
は演算部、20は差値処理部、21は分割照合
部、22は分割距離比較部をそれぞれ示す。
実施例の説明に先だち音声パターンの分割例に
ついて第4図を用いて説明する。第4図aは音声
パワーの状態を示す模式図、第4図bは音声パワ
ー変動量の累積を示す模式図であり、音声は始端
から終端にわたつてa図に示すように音声パワー
を持つている。即ち音声をサンプリングする際の
前記した周波数分析した出力の総和(各帯域フイ
ルタの出力総和)をY軸方向に、X軸方向は時間
を示し記したものである。一方b図はX軸時間
で、Y軸はサンプリングした際の音声パワーの
時々刻々のパワーの変動量の累積値を示す。本発
明は此の終端にまでのパワーの変動量の累積を均
等に4分割し、4分割点に該当するa図のX軸位
置にて音声パワーをA1乃至A4に分割する。以
下第2図によつて本発明の実施例を説明する。上
記したように、入力音声はパラメータ抽出部12
にて特徴パラメータが得られる。此の入力音声パ
ターンと辞書メモリに格納されている標準音声パ
ターンとが照合部13にて照合され両パターン間
の距離が求められる。其の結果距離の小さいもの
から一次候補と二次候補を選び出して、候補格納
部15に格納される。更に入力音声パターンと一
次候補の標準音声パターンとの距離及び二次候補
の標準音声パターンとの距離とが距離格納部16
に格納される。候補格納部15は再照合テーブル
17が付設されており、再照合テーブル17には
図に示すように、紛らわしい音声が例えば4分割
され登録されている。例えば「イシカワ」、「イチ
カワ」此の両者の差異のある分割部は単語の2番
目である事を表す特徴部分と共に予め紛らわしい
単語の組合せが登録されている。一次候補と二次
候補の組合せが再照合テーブル17の紛らわしい
単語組合せに登録されていれば、部分照合部18
へ特徴部分例えば2番目を示し再照合を起動させ
る。再照合の起動を受けた部分照合部18は入力
音声パターンの4分割された2番目の部分と「イ
シカワ」の4分割された2番目の部分及び「イチ
カワ」の標準音声パターンの4分割された2番目
の部分を再照合をおこない、それぞれの距離を導
出する。導出された距離Dsと照合部13にて求
められた分割前の距離Dnとが共に演算部19に
入力される。演算部19はDnとDsと重み付け定
数αとによつて(1−α)Dn+αDsの演算を第1
と第2の候補とに対してそれぞれ行ない、演算値
の小さい方を音声として認識する。再テーブル1
7の検索時に紛らわしい単語の組合せとして登録
されて居なければ、そのまま距離格納部16に格
納されている距離の小さい方を音声として認識す
る。
以上は紛らわしい音声を予め予定して、再照合
テーブル17に格納した場合であり、再照合テー
ブル17に格納した場合であり、再照合テーブル
17を作成しない場合に付いて、第3図の他の実
施例にて説明する。実施例にて用いた分割前の第
1と第2の候補のそれぞれの距離Dn-1とDn-2
を照合部13に依つて求め、此の距離を距離格納
部16に格納する。差値処理部20はDn-1
Dn-2の演算を行い、演算結果の絶対値が所要の
閾値Dthより大である場合には、第1候補を音声
と認識し、閾値Dthより小さい場合には、分割照
合部21を作動せしめ、一次と二次の候補のそれ
ぞれの分割部分の距離を分割距離比較部22にて
比較し、一次と二次の候補のそれぞれ対応する分
割個所で差の最も大きいものを選び出す。此の選
択された分割部の距離と分割前の距離とが演算部
19に入力され音声認識されることは前記実施例
と同一である。
(f) 発明の効果 以上詳細に説明したように本発明の音声照合方
式は、音声パラメータを時系列にn分割し差異の
ある分割部を再照合して認識確度の高い音声照合
が行われ、音声認識を行う上で利点の多いものと
なる。
【図面の簡単な説明】
第1図は音声認識の手順を示すブロツク図、第
2図は本発明の音声照合方式を説明する為の一実
施例のブロツク図、第3図は本発明の他の実施例
のブロツク図、第4図は音声パターンの分割状態
を示す模式図である。 図において、1は音声認識装置、11は前処理
部、12はパラメータ抽出部、13は照合部、1
4は登録パターン、15は候補格納部、16は距
離格納部、17は再照合テーブル、18は部分照
合部、19は演算部、20は差値処理部、21は
分割照合部、22は分割距離比較部をそれぞれ示
す。

Claims (1)

  1. 【特許請求の範囲】 1 認識対象の各単語に対応した標準音声パター
    ンを格納するメモリ14と、入力音声パターンの
    特徴抽出を行う抽出部12と、該特徴抽出したパ
    ラメータと前記標準音声パターンと照合し、両パ
    ターン間の最小距離にある類似上位二単語を選定
    し、更に前記二単語の中から類似度が最上位とな
    る単語を判定して認識結果を確定する照合部13
    とを備える音声照合装置において、 紛らわしい特定単語の組合せと、前記特定単語
    の標準音声パターンを時間軸方向にn分割し、前
    記組合せの差異のある特徴部分が前記n分割の中
    のどの分割部分に位置するかを予め記憶しておく
    再照合テーブルメモリ17と、入力音声パターン
    と特徴部分のみを再照合する部分照合部18とを
    設け、 前記部分照合部18は、選定した前記二単語が
    前記再照合テーブルメモリ17に登録されている
    単語であつた場合、前記入力音声パターンも時間
    軸方向にn分割し、前記再照合テーブルメモリ1
    7に登録されている該二単語の標準音声パターン
    の差異のある特徴部分が位置する分割部分を該n
    分割の中から取り出し、前記二単語の特徴部分と
    それぞれ再照合を行い、 前記二単語の中から最初の照合結果と再照合結
    果の距離に重み付けして距離の小さい方を採用す
    るよう制御することを特徴とする音声照合装置。
JP58230429A 1983-12-05 1983-12-05 音声照合装置 Granted JPS60121499A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP58230429A JPS60121499A (ja) 1983-12-05 1983-12-05 音声照合装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP58230429A JPS60121499A (ja) 1983-12-05 1983-12-05 音声照合装置

Publications (2)

Publication Number Publication Date
JPS60121499A JPS60121499A (ja) 1985-06-28
JPH0585917B2 true JPH0585917B2 (ja) 1993-12-09

Family

ID=16907755

Family Applications (1)

Application Number Title Priority Date Filing Date
JP58230429A Granted JPS60121499A (ja) 1983-12-05 1983-12-05 音声照合装置

Country Status (1)

Country Link
JP (1) JPS60121499A (ja)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2757356B2 (ja) * 1986-12-12 1998-05-25 株式会社日立製作所 単語音声認識方法および装置
JP2966002B2 (ja) * 1989-08-29 1999-10-25 三菱電機株式会社 音声認識装置
JP2862306B2 (ja) * 1990-02-01 1999-03-03 キヤノン株式会社 音声認識装置
JP6276513B2 (ja) * 2013-04-12 2018-02-07 株式会社レイトロン 音声認識装置および音声認識プログラム

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS5946698A (ja) * 1982-09-09 1984-03-16 株式会社日立製作所 音声認識方式
JPS5968794A (ja) * 1982-10-13 1984-04-18 電子計算機基本技術研究組合 単語音声認識方法

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS5946698A (ja) * 1982-09-09 1984-03-16 株式会社日立製作所 音声認識方式
JPS5968794A (ja) * 1982-10-13 1984-04-18 電子計算機基本技術研究組合 単語音声認識方法

Also Published As

Publication number Publication date
JPS60121499A (ja) 1985-06-28

Similar Documents

Publication Publication Date Title
EP0128755A1 (en) Apparatus for speech recognition
US4987596A (en) Knowledge-guided automatic speech recognition apparatus and method
JPH0585917B2 (ja)
JPH0558553B2 (ja)
JPH05210397A (ja) 音声認識装置
JP3063855B2 (ja) 音声認識におけるマッチング距離値の極小値探索方法
JPH0419700A (ja) 音声パターンマッチング方法
JPH03118600A (ja) 音声認識装置
JP2655637B2 (ja) 音声パターン照合方式
JP2547541B2 (ja) 単音節音声認識装置
JPH0554116B2 (ja)
JP2844592B2 (ja) 離散単語音声認識装置
JP3011984B2 (ja) パターン照合方法
JPS59124390A (ja) 候補削減音声認識方式
JPS60147797A (ja) 音声認識装置
JPS61122699A (ja) 単音節音声認識方式
JPH04230797A (ja) 音声認識方法
JPH01209499A (ja) パターン照合方式
JPH04212199A (ja) 標準パターン登録方法
JPH01253799A (ja) 音声の認識方法
JPS63223694A (ja) 単音節登録・認識方式
JPH0570159B2 (ja)
JPS61259299A (ja) 音声パタ−ン照合方式
JPS6069694A (ja) 語頭子音のセグメンテ−ション法
JPH026079B2 (ja)