JPS62237500A - 音声パタ−ン照合方式 - Google Patents

音声パタ−ン照合方式

Info

Publication number
JPS62237500A
JPS62237500A JP8040086A JP8040086A JPS62237500A JP S62237500 A JPS62237500 A JP S62237500A JP 8040086 A JP8040086 A JP 8040086A JP 8040086 A JP8040086 A JP 8040086A JP S62237500 A JPS62237500 A JP S62237500A
Authority
JP
Japan
Prior art keywords
pattern
peak
speech
pattern matching
matching method
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP8040086A
Other languages
English (en)
Inventor
安田 晴剛
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ricoh Co Ltd
Original Assignee
Ricoh Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ricoh Co Ltd filed Critical Ricoh Co Ltd
Priority to JP8040086A priority Critical patent/JPS62237500A/ja
Publication of JPS62237500A publication Critical patent/JPS62237500A/ja
Pending legal-status Critical Current

Links

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 遺極分更 本発明は、音声認識装置における音声パターン照合方式
に関する。
丈米挟亙 B T S P (Binary Time−5pec
trum Pattern)方式を用いたパターン照合
方式は、辞書パターンとして入力されたブロードパター
ンを荷重平均化したものを用い、入カバターンとしてピ
ークパターン又はブロードパターンを用いてパターン照
合を行っている。このBTSP方式におけるピークパタ
ーンはいわゆる音声ホルマントのローカルピーク情報で
あり、ブロードパターンはそのホルマントの周波数方向
の広がりを意味する。而して、従来のBTSPパターン
照合においては、ブロードパターンにより辞書を作成し
、辞書の作成が不特定話者におけるものの場合は、入カ
バターンとしてブロードパターンを用い、特定話者にお
けるものの場合は、ピークパターンを用いて、その類似
度を求めるためのパターン照合を行っていた。しかしな
がら、対象単語が増えてくると、近似したパターンが増
えてきて、類似度も接近し、誤認識もでてくるため、従
来の入カバターンのみでは正確に差異を出すことが難し
かった。
目     的 本発明は、上述のごとき実情に鑑みてなされたもあで、
特に、BTSP方式を用いた音声認識装置において、よ
り正確なパターン照合を行うことを目的としてなさ胆だ
ものである。
隻−一双 本発明は、上記目的を達成するために、入力された音声
の周波数スペクトルを求めるバンドパスフィルタと、得
られた周波数スペクトルを2値のタイムスペクトルに変
換するBTSP生成部とを有し、音声ホルマン1−のピ
ーク点を‘1’とするピークパターンと、ピーク点から
1/2の点までを′1′とするブロードパターンを得る
手段と、該ブロードパターンを3回重ねて発声して辞書
パターンを生成し、ピークパターンにより認識する音声
認識装置において、認識時のパターン照合において、前
記ピークパターンとブロードパターンを重ね、音声ホル
マントのピークを考慮したパターン照合を行うことを特
徴としたものである。以下1本発明の実施例に基いて説
明する。
第1図は、本発明の一実施例を説明するための電気的ブ
ロック線図で、図中、1はマイクロフォン、2は前処理
部、3は特徴抽出部、4は音声区間検出部、5はピーク
パターン生成部、6はブロードパターン生成部、7は加
算部、8は認識処理及び辞書作成部、9は単語辞書部で
、以下のようにして音声パターンの照合を行う。
第2図において、(a)はブロードをパターンを3回重
ねて作られた辞書パターン、(b)は認識時に入力され
たピークパターン、(C)はブロードパターンである。
従来は、認識のパターン照合にピーク又はブロードパタ
ーンのみを用いて類似度を算出していたため、ピークパ
ターンはそのパターンが周波数、時間軸方向に変動した
場合、類似度の変動が多くなることになり、又、逆にブ
ロードパターンはそのものがパターンの広がりを持つの
で、得点の変動がさほど大きくないかわりに、近似した
パターンでの差異が出にくくなる。
従って、認識時はこの点を考慮して、まず、入力された
ピークパターンとブロードパターンを重ねる。そうする
と、第3図の如く、ブロードパターンの中にピークパタ
ーンが重なり、重った部分は°2′ となり、いわゆる
ローカルピークの考慮された入カバターンを構成できる
。これを用いてパターン照合を行えば、音声のローカル
ピークに重みづけをし、かつ1周波数方向に吸収性を持
った類似度演算を行うことが可能となる。これは逆に言
うと、ピークパターンとブロードパターンを用いて別々
に類似度を求めた結果に重みを持たせたものと同様に次
のように表わせる。
類似度=(ブロードパターンによる類似度)+2・(ピ
ークパターンによる類似度)この様にすることにより、
従来の認識法に比べ、パターン変動の吸収性に強く、そ
の特徴をより強調でき、より正確なパターン照合が可能
となる。
しかし、上述のごときパターン照合を全単語に対して行
うと、認識処理時間が従来に比べ大きくなるので、この
パターン照合をある条件下で行うようにすれば効果的で
ある1例えば、音声認識装置は一般に予備選択を行い、
候補単語をある単語数に絞り込み行っている場合が多く
、当然残された単語は近似してい場合が多く、その残さ
れた単語についてのみ適用した方が効率的である。又、
1位と2位の類似度が接近している場合(一般的には、
リジェクトされる場合が多い)について上述のごときパ
ターン照合を行えばその差異を少しでも強調することが
でき、有効な手段といえる。
肱−一米 以上の説明から明らかなように、本発明によると、比校
的近似している場合のその差異を詳細にっヵ、も、ユと
が可能となり、認識率を向上させイことができる。
【図面の簡単な説明】
第1図は、本発明による音声パターン照合方式を実施に
使用して好適な電気回路の一例を示す電気的ブロック線
図、第2図及び第3図は、本発明の動作原理を説明する
ための音声パターンの例を示す図である。 1・・・マイクロフォン、2・・・前処理部、3・・・
特徴抽出部、4・・・音声区間検出部、5・・・ピーク
パターン生成部、6・・・ブロードパターン生成部、7
・・・加算部、8・・・認識処理及び辞書作成部、9・
・・単語辞書部。 特許出願人  株式会社 リコー 第1図 第2図 第3図

Claims (3)

    【特許請求の範囲】
  1. (1)、入力された音声の周波数スペクトルを求めるバ
    ンドパスフィルタと、得られた周波数スペクトルを2値
    のタイムスペクトルに変換するBTSP生成部とを有し
    、音声ホルマントのピーク点を‘1’とするピークパタ
    ーンと、ピーク点から1/2の点までを‘1’とするブ
    ロードパターンを得る手段と、該ブロードパターンを3
    回重ねて発声して辞書パターンを生成し、ピークパター
    ンにより認識する音声認識装置において、認識時のパタ
    ーン照合において、前記ピークパターンとブロードパタ
    ーンを重ね、音声ホルマントのピークを考慮したパター
    ン照合を行うことを特徴とする音声パターン照合方式。
  2. (2)、通常のパターン照合方式において予備選択によ
    り残された数個の単語に対して前記の音声パターンの照
    合を行うことを特徴とする特許請求の範囲第(1)項に
    記載の音声パターン照合方式。
  3. (3)、通常のパターン照合方式において1位と2位の
    類似度が接近している時のみに、その1位と2位の対象
    単語に対して前記の音声パターンの照合を行うことを特
    徴とする特許請求の範囲第(1)項に記載の音声パター
    ン照合方式。
JP8040086A 1986-04-08 1986-04-08 音声パタ−ン照合方式 Pending JPS62237500A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP8040086A JPS62237500A (ja) 1986-04-08 1986-04-08 音声パタ−ン照合方式

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP8040086A JPS62237500A (ja) 1986-04-08 1986-04-08 音声パタ−ン照合方式

Publications (1)

Publication Number Publication Date
JPS62237500A true JPS62237500A (ja) 1987-10-17

Family

ID=13717236

Family Applications (1)

Application Number Title Priority Date Filing Date
JP8040086A Pending JPS62237500A (ja) 1986-04-08 1986-04-08 音声パタ−ン照合方式

Country Status (1)

Country Link
JP (1) JPS62237500A (ja)

Similar Documents

Publication Publication Date Title
CN108305615B (zh) 一种对象识别方法及其设备、存储介质、终端
EP0128755B1 (en) Apparatus for speech recognition
US7133826B2 (en) Method and apparatus using spectral addition for speaker recognition
US11611581B2 (en) Methods and devices for detecting a spoofing attack
JP2996019B2 (ja) 音声認識装置
JPS6348598A (ja) 単語音声認識装置
JPS62237500A (ja) 音声パタ−ン照合方式
JP2757356B2 (ja) 単語音声認識方法および装置
JP3063855B2 (ja) 音声認識におけるマッチング距離値の極小値探索方法
JPS5936759B2 (ja) 音声認識方法
JP2602271B2 (ja) 連続音声中の子音識別方式
JP2844592B2 (ja) 離散単語音声認識装置
JPS60198598A (ja) 音声認識方式
JPS59170894A (ja) 音声区間の切り出し方式
JPH01158499A (ja) 定常雑音除去方式
JPS59124390A (ja) 候補削減音声認識方式
JPH0640274B2 (ja) 音声認識装置
JPS63798B2 (ja)
JPS60115996A (ja) 音声認識装置
JP2000515991A (ja) パターン認識
JPS6313198B2 (ja)
JPS59204897A (ja) 音声認識辞書登録方式
JPH0554118B2 (ja)
JPH07111639B2 (ja) 音声標準パタン自動作成装置
JPS58189695A (ja) 連続数字音声認識方式