JPS60158498A - パターン照合装置 - Google Patents

パターン照合装置

Info

Publication number
JPS60158498A
JPS60158498A JP59014112A JP1411284A JPS60158498A JP S60158498 A JPS60158498 A JP S60158498A JP 59014112 A JP59014112 A JP 59014112A JP 1411284 A JP1411284 A JP 1411284A JP S60158498 A JPS60158498 A JP S60158498A
Authority
JP
Japan
Prior art keywords
pattern
time
register
section
word
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP59014112A
Other languages
English (en)
Other versions
JPH0582599B2 (ja
Inventor
潤一郎 藤本
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ricoh Co Ltd
Original Assignee
Ricoh Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ricoh Co Ltd filed Critical Ricoh Co Ltd
Priority to JP59014112A priority Critical patent/JPS60158498A/ja
Publication of JPS60158498A publication Critical patent/JPS60158498A/ja
Priority to US07/511,979 priority patent/US5095508A/en
Publication of JPH0582599B2 publication Critical patent/JPH0582599B2/ja
Granted legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/08Speech classification or search
    • G10L15/10Speech classification or search using distance or distortion measures between unknown speech and reference templates

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 炎亙公」 本発明は、音声パターンの照合方式に関する。
しり」 音声認識において、単語等の音声を時間−周波数のパタ
ーンに変換することは広く行われている手段である。又
、同じ単語を発声しても発声毎に非線形な時間伸縮があ
り、この時間変動を吸収してパターン照合をするために
動的計画法による方法やパターンに幅を持たせたいわゆ
るFuzzy集合におけるMembe rsh i p
関数の性質を利用する方法なとが知られている。この中
で特に後者の場合は、照合すべき2つのパターンの時間
長を適当な手段によって一致させてから重ね合わせ、そ
の重なり具合から類似度をめなければならない。又、メ
モリー容量を減少させるために一方のパターンの情報圧
縮をすることが行われる。例えば第1図に示すように周
波数成分の大きさを表わす数字を並べた時間−周波数パ
ターン以外に圧縮情報Aを記入したレジスタを持つよう
なものがある。これはillフレームのパターンはlフ
レーム分だけ、又、次のフレームのパターンは3フレー
ム分続くことを示している。このようなパターンと圧縮
していないパターンを照合する場合、圧縮されたパター
ンを一度元へ戻してから非圧縮パターンと対応づけられ
るのが一般であるが、元の状態へ戻すという無駄な作業
が必要となる。或いは非圧縮パターンも一関圧縮演算を
してから対応づけても良いが、この場合にも不必要な演
算をすることになる。
目 的 本発明は、に述のごとき従来技術の欠点を解決するため
になされたもので、特に、無駄な演算を除いて効率良く
パターンの照合を行うこ、とのできるパターン照合方式
を提供することを目的としてなされたものである。
一−1 本発明の構成について、以下、−・実施例に基づいて説
明する。
第251Jは、本発明によるパターン照合方式の一実施
例を説明するための電気的ブロック線図で、図中、1は
マイク、2はフィルタ群、3は区間検出部、4はレジス
タ、4aは時間長レジスタ、5は照合部、6は辞書部、
7はパターン伸縮部、8は重ね合せ類似度判定部、9は
リセット部、1゜は結果表示部で、特に、本発明におい
ては、上記目的を達成するため、時間−周波数で表わさ
れたパターンの時間軸に対応するレジスタ4aを有し、
パターンの照合に際し、このレジスタ内にパターンの伸
縮情報を記入した後にこの情報に基づいて一方のパター
ンを他方のパターンに対応づけるようにしている。第2
図において、あらかじめ認識すべき全ての単語について
使用者か発声し、各単語音声は特徴量が変換されて辞書
に納められているものとする。認識に際し、入力された
音声はマイク1からフィルタ群2を通過して時間−周波
数パターンに変換される。フィルタ群2は通過帯域の異
なるいくつかのバントパスフィルタにより構成されてい
る。次に区間検出部3によって中nh 音声に係るパタ
ーンのみを抽出し、レジスタ4に格納する。この時にパ
ターンは一般に10m秒毎にサンプルされ、バントパス
フィルタの数は8〜30程度のものが用いられる。仮に
バンドパスフィルタ数を8とすると、10m秒毎に8コ
のデータがレジスタ4に格納される。単語長が600m
秒であるなら480コのデータとなる。この時、レジス
タ内に単語長600m秒と一致するデータ数60コの時
間長レジスタ4aを設けておく。この時間長レジスタ4
aはリセット状態で全てlになっている。このように入
カバターンとすでに登録されている辞書中の各単語パタ
ーンとを照合する。辞書中のパターンは第1図に示すご
とく圧縮されており、通常のパターン部以外に同しフレ
ームがいくつ続くかを示す圧縮情報°と、更に圧縮61
ノの単語長つまりフレーム数を記録しである。そこで入
カバターンを照合すべき単語パターンの長さを線形挿入
によって一致させる。ここでは仮に線形挿入による方法
を述べるがこれはどのような方法をもってしても良く本
発明の範囲外である。まず、単語パターンの時間長と入
カバターンの時間長を比較しどちらをどれだけ伸縮すれ
ば良いかを決め、単語パターンの圧縮情報をレジスタ4
に入れてパターン伸縮部7へ送る。ここでは実際のパタ
ーンは不要で入力の時間長レジスタと単語パターンの圧
縮情報のみによりパターンの伸縮を行なう。仮に単語パ
ターンの時間長が620m秒、62サンプル(62フレ
ーム)あり、短いパターンを伸ばして長いパターンに一
致させるものとすると入カバターンを2サンプル増やさ
なければならない。そこで入カバターンの時間長60フ
レームに均一に2サンプル増すようにする。っt!J6
0フレームの21フレーム目と417レーム目に各々2
0フレーム目、40フレーム目と回し情報を加えて均一
に全体を62フレームに伸ばす。挿入する部分は全体の
フレーム数を挿入すべきフレーム数+1で割ることによ
り容易にめられる。これがめられると20#i目、4o
#目の時間長レジスタ4aに1を加える。こうして二つ
のパターンの重ね合わせ操作つまり2つのパターンの積
を取る時には両パターンの時間長レジスタと圧縮情報を
参照しな力七、ら積を取るようにする。
例えば第1図のパターンでは第1フレームのパターンは
入力の第1フレームと積がとられ、第2フレームのパタ
ーンは入力の第2、第3、第4フレームと積がとられる
ことになる。なお、ここでは入力音声長を伸ばすことを
述べたが辞書の単語パターンを伸ばす場合には圧縮情報
に1を加えれば良く縮める場合は1を引けは°良い。第
2図の例ではこうして一つの単語パターンとの類似をめ
れば時間長レジスタをリセットして次の単語パターンの
照合へ移る。
以下に、重ね合わせて類似度を算出する部分をFORT
RANでサブルーチンプログラムにして示すが、DIC
Tは辞書の単語パターン、INPは、入カバターン、N
Fは時間長を一致させた後のフレーム数、IDは類似度
である。
5UBROUTINE 5UPER(D[CT、INP
、NF、10INTEGERDICT(9,’1OO)
、INP(9,100)Id=O J3=1 Di5 10 J=I、NF J1≧INP(9,J) Dii 10 J2=l、JI JD−旧CT(9,J3)−1 1F(JD、LT、0) Gi5 T5 5D610I
−1,8 ID=DICT(1、J3)木TNP(1,J2) +
 IDGδ Ti5 IQ 5 j3=J3+ 1 10 C0NTINUE ETURN ND 防−−−浬 以−1−の説明から明らかなように、本発明によると、
無駄な演算かなくなり、効率の良いパターン照合が実現
できる゛。
【図面の簡単な説明】
iR1図は、従来のパターン照合方式の一例を説−明す
るだめの図、第2図は、本発明によるパターン照合方式
の一例を説明するための電気的ブロック線図である。 l・・・マイク、2・・・フィルタ群、3・・・区間検
出部、4・・・レジスタ、4a・・・時間長レジスタ、
5・・・照合部、6・・・辞書部、7・・・パターン伸
縮部、8・・・重ね合せ類似度判定部、9・・・リセッ
ト部、10・・・結果表示部。

Claims (1)

    【特許請求の範囲】
  1. 高声を時間と周波数の2次元面子のパターンとして表わ
    し、このパターンの時間軸サンプルに対応するレジスタ
    を有し、複数のパターンの照合に際し、両パターンが有
    する該レジスタ内にパターンの伸縮情報を記入した後に
    この情報に基づいて方のパターンの−・つの時間サンプ
    ルを他方のパターンの複数に対応づけたり或いは対応光
    をなくしたりすることによって照合することを特徴とす
    るパターン照合方式。
JP59014112A 1984-01-27 1984-01-27 パターン照合装置 Granted JPS60158498A (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP59014112A JPS60158498A (ja) 1984-01-27 1984-01-27 パターン照合装置
US07/511,979 US5095508A (en) 1984-01-27 1990-04-16 Identification of voice pattern

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP59014112A JPS60158498A (ja) 1984-01-27 1984-01-27 パターン照合装置

Publications (2)

Publication Number Publication Date
JPS60158498A true JPS60158498A (ja) 1985-08-19
JPH0582599B2 JPH0582599B2 (ja) 1993-11-19

Family

ID=11852029

Family Applications (1)

Application Number Title Priority Date Filing Date
JP59014112A Granted JPS60158498A (ja) 1984-01-27 1984-01-27 パターン照合装置

Country Status (2)

Country Link
US (1) US5095508A (ja)
JP (1) JPS60158498A (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2011022621A (ja) * 2006-10-20 2011-02-03 Toshiba Tec Corp パターンマッチング装置及び方法
US9517735B2 (en) 2012-03-08 2016-12-13 Ts Tech Co., Ltd. Interior material

Families Citing this family (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH03163623A (ja) * 1989-06-23 1991-07-15 Articulate Syst Inc 音声制御コンピュータ・インターフェース
US5680506A (en) * 1994-12-29 1997-10-21 Lucent Technologies Inc. Apparatus and method for speech signal analysis
US5835894A (en) * 1995-01-19 1998-11-10 Ann Adcock Corporation Speaker and command verification method
US5765132A (en) * 1995-10-26 1998-06-09 Dragon Systems, Inc. Building speech models for new words in a multi-word utterance
US5794189A (en) * 1995-11-13 1998-08-11 Dragon Systems, Inc. Continuous speech recognition
US5799279A (en) * 1995-11-13 1998-08-25 Dragon Systems, Inc. Continuous speech recognition of text and commands
US5946654A (en) * 1997-02-21 1999-08-31 Dragon Systems, Inc. Speaker identification using unsupervised speech models
US6029124A (en) * 1997-02-21 2000-02-22 Dragon Systems, Inc. Sequential, nonparametric speech recognition and speaker identification
JP4527679B2 (ja) * 2006-03-24 2010-08-18 学校法人早稲田大学 音声の類似度の評価を行う方法および装置
JP4305509B2 (ja) * 2006-12-26 2009-07-29 ヤマハ株式会社 音声処理装置およびプログラム

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS5882300A (ja) * 1981-11-11 1983-05-17 住友電気工業株式会社 音声認識方式
JPS59195699A (ja) * 1983-04-21 1984-11-06 三菱電機株式会社 単語音声認識装置

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US3641496A (en) * 1969-06-23 1972-02-08 Phonplex Corp Electronic voice annunciating system having binary data converted into audio representations
US4297528A (en) * 1979-09-10 1981-10-27 Interstate Electronics Corp. Training circuit for audio signal recognition computer
JPS57125999A (en) * 1981-01-29 1982-08-05 Seiko Instr & Electronics Voice synthesizer
US4570232A (en) * 1981-12-21 1986-02-11 Nippon Telegraph & Telephone Public Corporation Speech recognition apparatus
US4608708A (en) * 1981-12-24 1986-08-26 Nippon Electric Co., Ltd. Pattern matching system

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS5882300A (ja) * 1981-11-11 1983-05-17 住友電気工業株式会社 音声認識方式
JPS59195699A (ja) * 1983-04-21 1984-11-06 三菱電機株式会社 単語音声認識装置

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2011022621A (ja) * 2006-10-20 2011-02-03 Toshiba Tec Corp パターンマッチング装置及び方法
US9517735B2 (en) 2012-03-08 2016-12-13 Ts Tech Co., Ltd. Interior material

Also Published As

Publication number Publication date
US5095508A (en) 1992-03-10
JPH0582599B2 (ja) 1993-11-19

Similar Documents

Publication Publication Date Title
JPS60158498A (ja) パターン照合装置
JPS5972496A (ja) 単音識別装置
JP2989211B2 (ja) 音声認識装置における辞書制御方式
JP2980026B2 (ja) 音声認識装置
JPH02210500A (ja) 標準パターン登録方式
JPS62211699A (ja) 音声区間検出回路
JPS61180297A (ja) 話者照合装置
JPS5882300A (ja) 音声認識方式
JPS61278896A (ja) 話者照合装置
JPS5876892A (ja) 音声認識装置
JPS63125998A (ja) 音声入出力装置
JPS63798B2 (ja)
JPH04212199A (ja) 標準パターン登録方法
JPS60115996A (ja) 音声認識装置
JPS6344698A (ja) 単語検出方式
JPS63303395A (ja) マルチ増幅機能を備えた音声認識装置
JPS59124388A (ja) 単語音声認識処理方式
JPS60158497A (ja) パタ−ン照合方式
JPS6363099A (ja) 音声認識装置
JPS62206596A (ja) 音声認識システム
JPH0679232B2 (ja) 音声認識装置
JPS5936299A (ja) 音声認識装置
JPH03206497A (ja) パターン照合方法
JPS5944640B2 (ja) 音声情報サンプリング装置
JPS6070496A (ja) 音声認識処理方式