JPS6069699A - 音声パタ−ン作成装置 - Google Patents

音声パタ−ン作成装置

Info

Publication number
JPS6069699A
JPS6069699A JP17893583A JP17893583A JPS6069699A JP S6069699 A JPS6069699 A JP S6069699A JP 17893583 A JP17893583 A JP 17893583A JP 17893583 A JP17893583 A JP 17893583A JP S6069699 A JPS6069699 A JP S6069699A
Authority
JP
Japan
Prior art keywords
pattern
value
threshold
frequency
audio
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP17893583A
Other languages
English (en)
Other versions
JPH0466040B2 (ja
Inventor
米山 正秀
潤一郎 藤本
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ricoh Co Ltd
Original Assignee
Ricoh Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ricoh Co Ltd filed Critical Ricoh Co Ltd
Priority to JP17893583A priority Critical patent/JPS6069699A/ja
Publication of JPS6069699A publication Critical patent/JPS6069699A/ja
Publication of JPH0466040B2 publication Critical patent/JPH0466040B2/ja
Granted legal-status Critical Current

Links

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 良亙上」 本発明は、音声認a装置における音声パターン作成に関
する。
良末昔遺 小話の音声認識を行う場合、現在、Dr法(動的計画法
)を用いたマツチング法が一般化しているが、この方法
は計算量が多いという欠点を持っている。そこで、音声
を時間、周波数パターン(TSP)として表わしてマツ
チングする方法が提案されている。
第1図は、上記TSFの一例を示すブロック線3bはア
ンプ、4a、4bはフィルター群、5a、5bは2値化
回路、6は辞書部、7は類似度照合部、8は比較部、9
は結果出方部である。この方法は、単語TSPをある闇
値で2値化したパターンを標準パターンとして登録[7
ておき、未知入カバターンを闇値を変えて2値化パター
ンにして登録されたパターンに重ね合せる操作をしてそ
の重なり具合から類似度をめるもので、こうすることで
低い閾で2値化した幅の広いパターンと高い閾で2m化
した幅の狭いパターンの毛ね合せをみるため周波数方向
のゆらぎを吸収したパターンマツチングが可能で、これ
Iよ不#4j定話名認識向きのマツチング手段となる。
第2図は、ある単語のTSPの時間の1サンプルを示す
図で、横軸に周波数、縦軸にレベルをボす。この場合、
声帯、音源特性が周波数のI−: ji 、!:共に低
下するため、発声された単語の周波数パターン七でも高
周波数域でのレベルが下る。これをLl、L2の閾値が
rlJ 、roJ 4.:2値化すると、第2[Δ(b
)、(C)に示すごとく、同じパターンでも「1」とな
る部分が違ってくる。そこで、闇値を? 4tF ff
性に近い傾斜を持たせる方法が考えられるが、この方法
によると、第2図に示したような2植化パターンの違い
は少なくなるが、第3図に不すように、Flに比へてF
2.F3のピークが小さい場合に、やはりパターンに違
いが出るという欠点があった。
旦−的 本発明は上述のごとき実情に鑑みてなされたもので、特
に、z値化に際してTSP上のピークが欠落しないよう
にすることを目的としてなされたものである。
構」 本発明の椙成について、以下、実施例に基づいて説明す
る。
本発明は、パターンヒの各凸部又は凹部を検出し、その
凸部又は四部のピーク又はディップの一定値倍するか一
定値を加減することによって2値化閾値を決めるもので
ある。
第4図は、本発明の一実施例を説明するための構成図で
、図中、10はマイク、11はフィルター群、12は音
声区間切出12部、13は凸部検出部、14はレジスタ
ー、15は2値化部、16は閾値決定部、17は辞書部
、18は類似度照合部、19は結果表示部で、まず、マ
イクlOで入力された単語音声をバンドパスフィルター
群tiによって周波数の特徴パシメータに変換し、その
中から音声に関する部分だけをとり出す。この信号は凸
部検出部13にて時間の1サンプルずつ周波数方向に凸
部を検出する。凸部の検出は例えば隣接するフィルター
出力の差を見ながらそのネ1号が反転する部分として検
出することができる。検出された凸部のピーク値は閾値
決定部IOへ送られ、ここで隣接するピークを結ぶ直線
(第5図の破線より一定の値だけ低い値(第5図実線)
として閾値が決定される。なお、辞書作成時と認識時に
よって2値化の閾値を変化させる場合は、それぞれによ
って上記一定値を変化させれば良い。このようにして辞
書登録された後、未知入力は2値化されて照合部では辞
書登録された各単語と類似度のq出が1「われ、最大類
似度を有する結果を認識結果として出力する。類似度の
算出は未知の音jhの時間周波数パターンの2値化され
たものを辞書の同様のパターン1−二へ重ね、重なり具
合によってめる。重ねるパターンの時間長が異なる場合
は例えば線形伸縮などによって長さを揃えても良いし、
辞書パターンが同じ単語を何回も発声した2値パターン
の加算からなる場合は長さを揃えなくとも良いこともあ
る。また、第4図の凸部検出を四部検出にお5かえ、一
定の値だけ高い値を閾値とすることも1ffi能で、こ
のようにしても同様の効果を得ることができる。
第6図は、本発明の他の実施例を説明するための構成図
である。この実施例は、基本的には、第4図に示した実
施例と同様であるが、図示のように、音声区間!ilJ
り出し後に凸部検出部13と凹部検出部20を設けて、
特徴パターンの凸部と四部をめ、凸部のピークと四部の
ピーク値、ディツプ値の差から2値化の閾値を決定する
ものである。
第7図は、本発明の更に他の実施例を説明するための構
成図で、図中のA部は第4図又は第6図のA部に相当し
ている。この実施例は1図示のように、音声区間切り出
し部の次に、或いは、凸部、四部検出部の前に傾斜補I
F部21を設け、第3図に示]7た如き周波数方向への
傾斜を持つ値を引き、ピークのレベルをほぼ一定にして
からI−記の如き操作を行なうように1.たものである
。このようにしてピークレベルの補正を行った後に、第
4図、第6図のA部に相当する部分へ信号伝達すれば良
い。なお、傾斜補正は例えば最小自乗直線(三輪、城戸
:音声研究会資料579−24)などによって達成でき
る。
汎−一1 以Fの説明から明らかなように、本発明によると、音声
の時間−周波数パターン1−の特徴的なピークを欠くこ
とのないIF確な音声パターンの作成が口■能となる。
【図面の簡単な説明】
QS 1 図は、TSPマツチング法の一例を示す構成
図、第2因及び第3図は、それぞれTSPの時間のlサ
−ンブルを示す図、第4図は、本発明の一実施例を説明
するための構成図、第5図は、動作説明をするための波
形図、第6図及び第7図は、それぞれ本発明の他の実施
例を説明するための構成図である。 10・・・マイク、11・・・フィルター群、12・・
・音トも区間!;lJり出し部、13・・・凸部検出部
、14・・・レジスター、15・・・2値化部、16・
・・閾値決定部、17・・・辞書部、18・・・類似度
照合部、19・・・結果表示部、20・・・四部検出部
、21・・・傾斜補正部。 第1図 第 3 図 第4図 第 5 図

Claims (6)

    【特許請求の範囲】
  1. (1)音声を周波数と時間の2次元面上のパターンに変
    換する・L段と、このパターンを定められた閾イ1^に
    よって2伯化する手段と、前記閾値を変化させる手段と
    、2値化されたパターンを記憶する手段と、入力された
    パターンと前記記憶されたパターンとの重ね合せの操作
    によって類似度を算出する1段とを有する音声パターン
    比較装置において、該パターンの周波数方向の凸部を検
    出ル、凸部の頂点より一定の値だけ低い値を閾値に設定
    するようにしたことを特徴とする音声パターン作成装置
  2. (2)前記パターンのレベルから周波数方向に11[を
    持つ一定レベルを差し引きその後に前記閾値を設定する
    ことを特徴とする特許請求の範囲第(1)項に記載の音
    声パターン作成装置。
  3. (3)音声を周波数と時間の2次元面上のパターンに変
    換する手段と、このパターンを定められた閾値によって
    2値化する手段と、前記閾値を変化させる手段と、2値
    化されたパターンを記憶する手段と、入力されたパター
    ンと前記記憶されたパターンとの重ね合せの操作によっ
    て類似度を算出する手段とを有する音声パターン比較装
    置において、該パターンの周波数方向の四部を検出し、
    四部の最小点より一定の値だけ大なる値を閾値とするこ
    とを特徴とする音声パターン作成装置。
  4. (4)前記パターンのレベルから周波数方向に傾斜を持
    つ一定レベルを差し引き、その後に前記14 (fを設
    定することを特徴とする特許請求の範囲第(3)項に記
    載の音声パターン作成装置。
  5. (5)音%を周波数と時間の2次元面上のパターンに変
    換する手段と、このパターンを定められた闇値によって
    2値化する手段と、前記闇値を変化させる手段と、2値
    化されたパターンを記憶する手段と、入力されたパター
    ンと前記記憶されたパターンとの重ね合せの操作によっ
    て類似度を算出する手段とを有する音声パターン比較装
    4において、該パターンの周波数方向の凸部と四部の各
    最大値、最小値をめこれらの値より闇値を決めることを
    特徴とする音声パターン作成装置。
  6. (6)前パターンのレベルから周波数方向に傾斜を持つ
    一定レベルを差し引きその後に前記闇値を決)■!する
    操作を行なうようにしたことを特徴とする特、竹請求の
    範囲第(5)項に記載の音声パターン作成装置。
JP17893583A 1983-09-26 1983-09-26 音声パタ−ン作成装置 Granted JPS6069699A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP17893583A JPS6069699A (ja) 1983-09-26 1983-09-26 音声パタ−ン作成装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP17893583A JPS6069699A (ja) 1983-09-26 1983-09-26 音声パタ−ン作成装置

Publications (2)

Publication Number Publication Date
JPS6069699A true JPS6069699A (ja) 1985-04-20
JPH0466040B2 JPH0466040B2 (ja) 1992-10-21

Family

ID=16057212

Family Applications (1)

Application Number Title Priority Date Filing Date
JP17893583A Granted JPS6069699A (ja) 1983-09-26 1983-09-26 音声パタ−ン作成装置

Country Status (1)

Country Link
JP (1) JPS6069699A (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH04219799A (ja) * 1990-03-09 1992-08-10 American Teleph & Telegr Co <Att> オーディオ信号処理方法
JPH05232998A (ja) * 1991-06-28 1993-09-10 Sip Soc It Per Esercizio Delle Telecommun Pa 合成による分析技術に基づく音声コーダの改良

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH04219799A (ja) * 1990-03-09 1992-08-10 American Teleph & Telegr Co <Att> オーディオ信号処理方法
JPH05232998A (ja) * 1991-06-28 1993-09-10 Sip Soc It Per Esercizio Delle Telecommun Pa 合成による分析技術に基づく音声コーダの改良

Also Published As

Publication number Publication date
JPH0466040B2 (ja) 1992-10-21

Similar Documents

Publication Publication Date Title
US4401849A (en) Speech detecting method
JPS5844500A (ja) 音声認識方式
US4513436A (en) Speech recognition system
JPS6069699A (ja) 音声パタ−ン作成装置
JP2006039382A (ja) 音声認識装置
JP2992324B2 (ja) 音声区間検出方法
JPH04369698A (ja) 音声認識方式
JP3002200B2 (ja) 音声認識
JP2666296B2 (ja) 音声認識装置
JPS6266300A (ja) 音声認識方法及びその装置
JPS62141595A (ja) 音声検出方式
JP2547541B2 (ja) 単音節音声認識装置
JPH0419700A (ja) 音声パターンマッチング方法
JPS6332396B2 (ja)
JPS6048100A (ja) 音声認識装置
JPS63798B2 (ja)
JPH0376471B2 (ja)
JP2712586B2 (ja) 単語音声認識装置用パターンマッチング方式
JPS62262899A (ja) 音声認識装置
JPS59219800A (ja) 音声パターン比較方法
JPH04275600A (ja) 音声認識装置
JPS5886598A (ja) 音声認識装置
JPH01269998A (ja) 音声認識装置の辞書作成方式
JPS60262198A (ja) 子音区間検出装置
JPS6147994A (ja) 音声認識方式