JP2655637B2 - 音声パターン照合方式 - Google Patents

音声パターン照合方式

Info

Publication number
JP2655637B2
JP2655637B2 JP60074007A JP7400785A JP2655637B2 JP 2655637 B2 JP2655637 B2 JP 2655637B2 JP 60074007 A JP60074007 A JP 60074007A JP 7400785 A JP7400785 A JP 7400785A JP 2655637 B2 JP2655637 B2 JP 2655637B2
Authority
JP
Japan
Prior art keywords
blocks
block
pattern
input voice
voice pattern
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP60074007A
Other languages
English (en)
Other versions
JPS61232499A (ja
Inventor
晴剛 安田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ricoh Co Ltd
Original Assignee
Ricoh Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ricoh Co Ltd filed Critical Ricoh Co Ltd
Priority to JP60074007A priority Critical patent/JP2655637B2/ja
Publication of JPS61232499A publication Critical patent/JPS61232499A/ja
Application granted granted Critical
Publication of JP2655637B2 publication Critical patent/JP2655637B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Description

【発明の詳細な説明】 技術分野 本発明は、音声認識装置における音声パターン照合方
法に関する。
従来技術 従来、入力音声データと辞書データを照合する際、音
声区間検出データの無音区間に着目し、その無音区間に
よつて区切られる各々の有音区間を入力データと辞書デ
ータでその単語長に基く正規化された有音区間の位置に
よつて最適対応を行い、照合を行つていた。
第3図は、従来の対応づけの一例を単語“ストップ”
を例として示す図で、(a)はフレーム周期、(b)は
辞書データ、(c)は入力データで、入力データのフレ
ーム長を100で正規化し、その位置において、辞書デー
タの最も近いものを対応づけ、その各々について線型伸
縮を行つて、パターン照合を行うものである。しかしな
がら、この正規化された位置データだけでは入力データ
の子音情報などが欠落し、辞書のそれと照合する際、不
適合となる場合等が存在した。
目的 本発明は、上述のごとき実情に鑑みてなされたもの
で、特に、音声認識装置におけるパターン照合におい
て、パターンの最適な対応を与える最適照合を行うこと
を目的としてなされたのである。
構成 本発明は、上記目的を達成するために、(1)入力音
声信号から特徴を抽出した後に得られる入力音声パター
ンと予め登録されている標準パターンとの照合を行う音
声パターン照合方法において、入力音声パターン及び標
準パターン中の無音区間を区切りとして、有音区間をブ
ロック化し、入力音声パターン中のブロックの各々につ
いて、入力音声パターン中のブロックと標準パターン中
のブロックとを出現順に対応づけて類似度を比較し、さ
らに比較対象となったブロックの前後にあるブロックと
も比較し、これらの比較対象となったブロックのうち最
も類似するブロック同士を対応付けて最終照合を行った
後に、この入力音声パターン中のブロックと対応した標
準パターン中のブロックとの次のブロックを先頭ブロッ
クとして上記照合を繰り返すこと、或いは、(2)入力
音声信号から特徴を抽出した後に得られる入力音声パタ
ーンを予め登録されている標準パターンとの照合を行う
音声パターン照合方法において、入力音声パターン中の
無音区間を区切りとして、有音区間をブロック化し、入
力音声パターン中のブロックの各々について、入力音声
パターン中のブロックと標準パターン中のブロックとを
出現順に対応づけて類似度を比較し、比較対象となった
ブロックの前後にあるブロックとも比較し、さらに、比
較対象となったブロックの前後にあるブロックを併合し
たブロックとも比較し、併合したブロックも含めたこれ
ら比較対象となったブロックのうち最も類似するブロッ
ク同士を対応付けて最終照合を行った後に、この入力音
声パターン中のブロックと対応した標準パターン中のブ
ロックとの次のブロックを先頭ブロックとして上記照合
を繰り返すことを特徴としたものである。以下、本発明
の実施例に基づいて説明する。
第1図は、本発明の実施に使用する電気回路の一例を
示す図で、図中、1はマイク、2は前処理部、3は周波
数分析フィルタ、4は特徴抽出部、5は対応処理ブロッ
ク、6は認識照合部、7は辞書データ、8は結果出力部
である。音声認識処理における音声パターン照合におい
て、無音区間を導入し、その有音区間同志で対応づけす
ることは周知であるが、例えば、BTSP方式の様に発声終
了後、線型伸縮を行う様な照合方式の場合、一つの有音
区間同志で線型伸縮を行つて類似度を求めるので、その
精度をより向上させることができるが、その場合、その
最適対応のやり方がその良否のポイントを握ることにな
る。従つて、本発明においては、その最適対応をより精
度よく行おうとするものである。
以下、本発明の一実施例についてBTSP方式を用いて説
明する。
第2図は、本発明の一実施例を説明するための図で、
図中、(a)は辞書データ、(b)は入力データを示
し、辞書データの有音ブロック、D1,D2,D3と入力の有音
ブロックI1,I2と最適対応を行う際、まず、D1とI1の線
型伸縮を行い、その類似度X11を求め、次にD2とI1の類
似度X12を求め、例えば、その類似度に大きな差異がで
なかつた場合、D1,D2の連続ブロックと、I1の類似度を
求め、その最も大きいものを求める。第2図ではI1
D1,D2の連続ブロック、D3とI2が対応づくと仮定してい
る。次にI2とD2の類似度とI2とD2の類似度を求める。こ
の様にすれば、入力音声が本来どのブロックと対応する
ものかを適格に判断する事ができ、又、例えば、入力
I1,I2の前にD1の相当する子音ブロックが存在したとす
ると、検出もれした子音ブロックの欠落による類似度の
低下も防ぐことができる。もちろん、このI1,I2に対し
て辞書データは装置に格納された辞書データ全てに対し
てマッチングするので、その合計の類似度の差は大きく
つくことになる。この様にブロックがn個に分れた場
合、その隣り合うブロックの類似度も求めて最適対応づ
けを行い、最終的な類似度を求めればより正確なパター
ン照合が可能となる。
次に、BTSP方式などでは、その1フレーム周期におい
てその周波数方向の特徴データは2値化して求められ、
例えば、第2図の各ブロックに対してその特徴量の総和
を求める事は比較的可能である。これを前記のものに併
用し単語全体の総和に対する各ブロックの比をそのブロ
ックに対して求めておき、その対応処理において、その
最も近いものに従つて前記と同様に求めればよい。又、
前記のものとを併用すれば更に精度を上げることができ
る。又、例えば、これらの特徴量の総和を周波数方向に
2〜n個に分割して、その各々のブロックの特徴量の比
を求めてそれを符号化する等、ある特徴量に着目して符
号化し、その符号化の適合性を見つけて最適対応する方
法も併用すれば更に効果を上げることができる。
効果 以上の説明から明らかなように、本発明によると、正
確な辞書データと入力データとの対応づけが正確に可能
となり、より認識率を向上させることができる。
【図面の簡単な説明】
第1図は、本発明の実施に使用される電気回路の一例を
示す図、第2図は、本発明の一実施例を説明するための
図、第3図は、従来の音声照合方式の一例を説明するた
めの図である。 1……マイク、2……前処理部、3……周波数分析フィ
ルタ、4……特徴抽出部、5……対応処理ブロック、 6……認識照合部、7……辞書データ、8……結果出力
部。

Claims (2)

    (57)【特許請求の範囲】
  1. 【請求項1】入力音声信号から特徴を抽出した後に得ら
    れる入力音声パターンと予め登録されている標準パター
    ンとの照合を行う音声パターン照合方法において、入力
    音声パターン及び標準パターン中の無音区間を区切りと
    して、有音区間をブロック化し、入力音声パターン中の
    ブロックの各々について、入力音声パターン中のブロッ
    クと標準パターン中のブロックとを出現順に対応づけて
    類似度を比較し、さらに比較対象となったブロックの前
    後にあるブロックとも比較し、これらの比較対象となっ
    たブロックのうち最も類似するブロック同士を対応付け
    て最終照合を行った後に、この入力音声パターン中のブ
    ロックと対応した標準パターン中のブロックとの次のブ
    ロックを先頭ブロックとして上記照合を繰り返すことを
    特徴とする音声パターン照合方法。
  2. 【請求項2】入力音声信号から特徴を抽出した後に得ら
    れる入力音声パターンを予め登録されている標準パター
    ンとの照合を行う音声パターン照合方法において、入力
    音声パターン中の無音区間を区切りとして、有音区間を
    ブロック化し、入力音声パターン中のブロックの各々に
    ついて、入力音声パターン中のブロックと標準パターン
    中のブロックを出現順に対応づけて類似度を比較し、比
    較対象となったブロックの前後にあるブロックとも比較
    し、さらに、比較対象となったブロックの前後にあるブ
    ロックを併合したブロックとも比較し、併合したブロッ
    クも含めたこれら比較対象となったブロックのうち最も
    類似するブロック同士を対応付けて最終照合を行った後
    に、この入力音声パターン中のブロックと対応した標準
    パターン中のブロックとの次のブロックを先頭ブロック
    として上記照合を繰り返すことを特徴とする音声パター
    ン照合方法。
JP60074007A 1985-04-08 1985-04-08 音声パターン照合方式 Expired - Lifetime JP2655637B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP60074007A JP2655637B2 (ja) 1985-04-08 1985-04-08 音声パターン照合方式

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP60074007A JP2655637B2 (ja) 1985-04-08 1985-04-08 音声パターン照合方式

Publications (2)

Publication Number Publication Date
JPS61232499A JPS61232499A (ja) 1986-10-16
JP2655637B2 true JP2655637B2 (ja) 1997-09-24

Family

ID=13534588

Family Applications (1)

Application Number Title Priority Date Filing Date
JP60074007A Expired - Lifetime JP2655637B2 (ja) 1985-04-08 1985-04-08 音声パターン照合方式

Country Status (1)

Country Link
JP (1) JP2655637B2 (ja)

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS56138798A (en) * 1980-03-31 1981-10-29 Nippon Electric Co High speed voice recognition device
JPS59161782A (ja) * 1983-03-04 1984-09-12 Matsushita Electric Ind Co Ltd パタ−ン・マツチング方法
JPS59195292A (ja) * 1983-04-19 1984-11-06 株式会社リコー 音声パタ−ンマツチング方式

Also Published As

Publication number Publication date
JPS61232499A (ja) 1986-10-16

Similar Documents

Publication Publication Date Title
JPS58130393A (ja) 音声認識装置
EP0319140A2 (en) Speech recognition
JP2655637B2 (ja) 音声パターン照合方式
JP3098157B2 (ja) 話者照合方法及び装置
JPS6147999A (ja) 音声認識装置
JP2757356B2 (ja) 単語音声認識方法および装置
JPH0585917B2 (ja)
Lee Incremental network generation in word recognition
JPS63173100A (ja) キ−ワ−ド抽出装置
JP2844592B2 (ja) 離散単語音声認識装置
JPS58159598A (ja) 単音節音声認識方式
JPS6346499A (ja) 大語▲い▼単語音声認識方式
JPS61252595A (ja) 音声認識処理方式
JPS63259600A (ja) 連続音声認識方式
JPS63223696A (ja) 音声パタ−ン作成方式
JPS6136797A (ja) 音声セグメンテ−シヨン法
JPS595294A (ja) 音声認識装置
JPS63798B2 (ja)
JPH06175677A (ja) 音声認識方法
JPS60200294A (ja) 音韻格子作成装置
Ariki et al. Continuous speech understanding by keyword extraction in a voice mail system.
JPS62166400A (ja) 音声ワ−ドプロセツサ装置
JPS6069694A (ja) 語頭子音のセグメンテ−ション法
JPH0458638B2 (ja)
JPS61122699A (ja) 単音節音声認識方式

Legal Events

Date Code Title Description
EXPY Cancellation because of completion of term