JPS63205698A - パタ−ン識別装置 - Google Patents

パタ−ン識別装置

Info

Publication number
JPS63205698A
JPS63205698A JP62037787A JP3778787A JPS63205698A JP S63205698 A JPS63205698 A JP S63205698A JP 62037787 A JP62037787 A JP 62037787A JP 3778787 A JP3778787 A JP 3778787A JP S63205698 A JPS63205698 A JP S63205698A
Authority
JP
Japan
Prior art keywords
data
section
storage device
similarity
recognition
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP62037787A
Other languages
English (en)
Other versions
JPH067343B2 (ja
Inventor
潤 角田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Original Assignee
Toshiba Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp filed Critical Toshiba Corp
Priority to JP62037787A priority Critical patent/JPH067343B2/ja
Priority to KR1019880001822A priority patent/KR910001117B1/ko
Priority to KR1019880001822A priority patent/KR890013577A/ko
Priority to DE88102646T priority patent/DE3882400T2/de
Priority to EP88102646A priority patent/EP0283743B1/en
Publication of JPS63205698A publication Critical patent/JPS63205698A/ja
Priority to US07/469,820 priority patent/US5027407A/en
Publication of JPH067343B2 publication Critical patent/JPH067343B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Classifications

    • BPERFORMING OPERATIONS; TRANSPORTING
    • B66HOISTING; LIFTING; HAULING
    • B66CCRANES; LOAD-ENGAGING ELEMENTS OR DEVICES FOR CRANES, CAPSTANS, WINCHES, OR TACKLES
    • B66C15/00Safety gear
    • B66C15/04Safety gear for preventing collisions, e.g. between cranes or trolleys operating on the same track
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/78Detection of presence or absence of voice signals
    • G10L25/87Detection of discrete points within a voice signal
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/08Speech classification or search
    • G10L15/10Speech classification or search using distance or distortion measures between unknown speech and reference templates

Landscapes

  • Engineering & Computer Science (AREA)
  • Acoustics & Sound (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Mechanical Engineering (AREA)
  • Image Analysis (AREA)
  • Image Processing (AREA)
  • Control Of Position, Course, Altitude, Or Attitude Of Moving Bodies (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 [発明の目的] (産業上の利用分野) この発明は入力信号を識別するパターン識別装置に係り
、特に集積回路化に適したパターン識別装置に関する。
(従来の技術) 第5図はパターン識別装置の一種である音声認識装置の
従来の構成を示すプロツク図である。マイクロフォン等
の音声信号入力手段により入力された音声信号は音響分
析部51に供給される。この音響分析部51においてス
ペクトル等の特徴が規定フレーム長(通常は数m8〜数
+ms)毎に分析され、特徴データが時系列的に抽出さ
れる。この時系列データは記憶装置52に蓄えられた後
、もしくは蓄えられながら、音声区間検出部53により
有効な音声の開始点(始点)と終了点(終点)が検出さ
れる。この音声区間検出部53で検出された有効音声の
開始点と終了点とは記憶装置152のアドレス・テーブ
ル54に供給される。このテーブル54の出力アドレス
に基づき、記憶部@52から特定の音声区間のデータ列
が1111用データとして取り出され、類似度計算部5
5に供給される。
一方、標準パターン記憶装置56には多数の標準パター
ンデータが登録されており、類似度計算部55でこれら
の標準パターンデータと記憶装置52から取り出された
データ列との間で類似度計算が行われる。この計算結果
は判定部57に供給され、最大の類似度を持つ標準パタ
ーンに該当する値が認識結果として出力される。
ところで、標準パターンデータを登録する際の音声長と
、識別対象となる入力音声長とが一致していないのが一
般的である。このため、SX識用データを記憶装置52
から取り出す際には、標準パターンデータの時間長に合
せて時間的に正規化した後、類似度計算を行なう必要が
ある。
時間的に正規化して類似度計算を行なう方式の一つであ
り、時間的な正規化であるリサンプルを行ない、例えば
全てのりサンプルが終了した後に類似度計算を行なう方
式では、記憶81152から認識用データを取り出す際
に正規化を行なう必要があり、データの格納箇所を固定
的に割付けることはできない。
そこで、アドレス・テーブル54や、次に取り出すデー
タまでの距離のテーブルを用意したり、計算により順次
アドレスを求めて間接的に記憶データを参照しながら認
識計算を行なっている。
すなわち従来では、認識対象となるデータ列がアドレス
−テーブルや計算によって求められたアドレスに基づい
て間接的に取り出され、類似度計算部55に供給されて
いる。このような制御動作をハードウェアを用いて実現
するには、アドレス計算が複雑であるだけではなく、計
算の実行速度を速めるためには複雑なタイミング設計が
必要であり、ハードウェア量が極めて多くなってしまう
また、音声認識率に大きく依存する音声区間の切出しは
非常に難しく、単一のアルゴリズムでは切出しミスが発
生する場合がある。そこで、何通りかの切出しを複数の
アルゴリズムで行ない、同時に類似度計算を行なえば、
高い認識率が速い応答速度で得られる可能性がある。し
かし、従来の方式では、特徴データが格納されている記
憶装置52をII謙計算時にも使用するため、同時に複
数の類似度計算を行なうことはできない。
(発明が解決しようとする問題点) このように従来方式の識別装置では、装置の構成が複雑
であり、高い認識率を得ることができないという欠点が
ある。
この発明は上、記のような事情を考慮してなされたもの
であり、その目的は、高いm識率が得られ、かつ少ない
ハードウェア量で構成することができるパターン識別装
置を提供することにある。
[発明の構成] (12)題点を解決するための手段) この発明のパターン識別m1llは、入力信号からフレ
ーム周期毎にスペクトルなどの特徴データを抽出する分
析部と、上記分析部から出力される特徴データを順次格
納する第1の記憶部と、上記第1の記憶部に格納された
データから有効な信号区間のデータを取出すデータ取り
出し部と、上記データ取り出し部から取り出されたデー
タを格納する第2の記憶部と、上記第2の記憶部に格納
された特徴データと標準パターンデータとの間で類似度
計眸を行なう!1i計鐸計算、上記認識計算部からの出
力データに基づき上記入力信号を識別判定する判定部と
から構成されている。
(作用) この発明のパターン識別装置では、認識計算部が専用に
アクセスできる第2の記憶部を用意し、データ取り出し
部で取り出されたl!!!識用データをこの第2の記憶
部に格納する。また、入力信号から得られた特徴データ
は第1の記憶部に格納することにより、この第1の記憶
部を認識計算とは別の目的でアクセスできるようにして
いる。
(実施例) 以下、図面を参照してこの発明の詳細な説明する。
第1図はこの発明のパターン識別装置を音声認°識装置
に実施したこの発明の第1の実施例@胃の構成を示すブ
ロック図である。
マイクロフォン等の音声信号入力手段により入力された
音声信号は音響分析部11に供給される。
この音響分析部11は例えばアナログ中バンドパス・フ
ィルタ・バンクと各フィルタ・バンクの出力をディジタ
ルデータに変換するA/D変換器との組合わせにより、
入力音声信号から特徴データを抽出する。抽出された特
徴データは音声区間検出部12によって入力音声区間が
検出されながら1次記憶装置13に格納される。
上記音声区間検出部12における検出の一つの方法とし
て、音響分析部11で入力音声のエネルギー成分を取出
し、そのエネルギーが予め定められた閾値を一定時間越
えたとき、始めに同値を越えたところを音声の始端とし
、その後、同値を一定時間下回ったとき、始めに下回っ
たところを音声の終端とする方式がある。検出の別の方
法として、低い閾値と高い閾値の二つの閾値を定め、エ
ネルギーが一定時間以内に低い閾値から高いIIIIに
達するときに、低い同値を音声区間の始端とする方式が
ある。
音声区間の検出によって得られた入力音声の特徴データ
は、通常、ある標本化周波数によって時間的に標本化さ
れている。この標本数をNフレームすると、Nは音声の
長さによって変化する。このNフレームのデータを線形
伸縮することにより、で、1次記憶装!!13に格納さ
れた特徴データはりサンプル部14によってリサンプル
され、時間的に正規化された後に2次記憶装置115に
転送され、ここに格納される。
2次記憶@[15に格納されたデータ列は認識用データ
として取り出され、m似度計算部16に供給される。
一方、標準パターン記憶袋w117には多数の標準パタ
ーンデータが登録されており、類似度計算部16でこれ
らの標準パターンデータと2次記憶装置15から取り出
されたデータ列との間で類似度計算が行われる。この計
算結果は判定部18に供給され、最大の類似度を持つ標
準パターンに該当する単語番号が判定され、この番号が
1!謙結果として出力される。
上記実施例!i置では、2次記憶装置15をアクセスし
て!!11用デー少データ出す際に、従来のように複雑
なアドレス計算は必要なく、2次記憶装画15から順次
アドレス指定して取り出せばよい。このため、簡単な構
造のアドレス・カウンタを2次記憶装置!15のアドレ
ス発生に用いることができる。
かつ、類似度計算部16が認識用データをアクセスする
際に必要な信号は、読出し制御信号とアドレス・カウン
トアツプ信号のみでよい。このため、制御回路の構成が
簡単となり、集積回路化する際のハードウェア量を少な
くすることができる。
また、1次記憶装置13に格納される特徴データに比べ
ると、2次記憶装[15に格納されるりサンプルデータ
は1/10以下の容量となる。このため、音声区間検出
を複数のアルゴリズムで行なったり、特定のアルゴリズ
ムで複数の候補を挙げる場合のように、複数の類似度計
算部を用意す−る必要が生じたときでも、1次記憶装置
113は一つのみ用意すればよい。
実際に上記実施例装置を集積回路化した場合のチップ占
有面積は例えば、1次記憶8113が1に対br2次i
gm装s+nsがo、 1、m似度計5ua1eが0.
3の割合となっている。従って、複数の類似度計算部を
用意する必要が生じた場合にも1次記憶装置13を1個
のみ用意すればよいということは、チップ面積縮小化の
上で大きなメリットになっている。
第2図はこの発明の第2の実施例装置の構成を示すブロ
ック図である。
−において、20はマイクロフォン等の音声信号入力手
段により入力された音声信号を分析するアナログ・プロ
セッサである。このアナログ・プロセッサ20はバンド
パス・フィルタ・バンク2)とA/D変換器22とを内
蔵し、CP U 3Gの指示により入力音声信号から特
徴の抽出を行なう。
40はディジタル・プロセッサであり、1次記憶装置4
1、!!!識計算部42及び外部インターフェース部(
1/F)43を内蔵している。
さらに、fi!識計算部42は類似度計算値44.2次
記憶装置45及び標準パターン記憶装置46を内蔵して
いる。
このような構成において、CPu30はアナログ・プロ
セッサ20で得られた特徴データをディジタル・プロセ
ッサ40内の1次記憶装置141に格納させる。また、
CP Ll 30は同時に音声区間検出Ill III
も行なっており、入力音声が終了すると、リサンプル制
御を行なって2次配憶装置45に対しりサンプルデータ
の転送制御を行なう。
次に、CPU30はディジタル・プロセッサ40内の認
識計算部42に対して計算開始指令を与える。
認識計算部42は、標準パターン記憶装置!46に格納
されている全ての単語パターンについて類似度計算を行
ない、−単珀分の計算が終了する毎に続出し要求信号を
CP Ll 3Gに送り、類似度計算値の読出しを要求
する。
全単語分の類似度計算値を読み込むと、CPU30はそ
の中から最大の類似度を持つ単語番号を外部インターフ
ェース部43を介して外部のホストシステムに送出する
すなわち、この実施例装置では、CP LJ 30が全
体の動作をIllwJする制御回路と、前記第1図の実
施例装置における判定部18とを兼ねている。
第3図はこの発明の第3の実施例装置の構成を示すブロ
ック図である。
この実施例装置は複数のg*計算部を持つ音声認II装
置の例である。20はバンドパス・フィルタ・バンクと
A/D変換器とを内蔵し、マイクロフォン等の音声信号
入力手段により入力された音声信号を分析するアナログ
・プロセッサ、30はCPU、41は1次記憶装置、4
4A及び44Bはそれぞれ類似度計算部、45A及び4
5Bはそれぞれ2次記憶装置46A及び46Bはそれぞ
れ標準パターン記憶@@、43は外部インターフェース
部である。
c p U 30は、1次記憶装![41に格納された
特徴データから音声区間を検出する際に、複数(この例
では2種類)の始端点と終端点とを選び出し、リサンプ
ルしながらそれぞれのデータを2数記憶@H45A、 
45Bに転送する。この転送が終了すると、類似度計算
部44A、44Bに対して認識計算開始命令を与え、−
単語分の計算が終了するのを待機する。−単語分の類似
度計算は通常3mS程度で終了するが、CP U 30
の命令実行速度は2μs程度と速いため、二つの類似度
計算部44A144Bで類似度計算が並行して順次行わ
れても、計算結果を取りこぼすことなく、全てのデータ
を処理することができる。
ここで、標準パターン記憶装置46A1468が同一の
内容を格納する場合には、前記のように複数の音声区間
に対して得られる類似度計算値の中で最大の値を持つも
のをその単語に対する類似度値とすることにより、音声
区間検出誤り率を減らして高いa識率を得ることができ
る。
また、標準パターン記憶装置f46A146Bが興なる
内容を格納する場合には、標準パターン記憶装置を1個
のみ設けたときに比べて標準パターン、データが2倍と
なり、大語いの入力音声信号に対して前記第2図1iW
の2倍の速さで類似度値を得ることができる。
なおこの実施例装置では、二つの類似度計算部44A 
、 443で類似度計算を行なうようにしているが、類
似度計算部を二つ以上用意して、よりも高いgw率を得
るようにしたり、より速い速度で類似度値を得るように
してもよい。
第4図はこの発明の第4の実施例装置の構成を示すブロ
ック図である。
この実施例装置は、二つの類似度計算部44A144B
を設けた場合に、標準パターン記憶装置i46を一つの
み設け、異なる類似度計算部で共用するように構成した
ものである。この実施例装置では大語いを高速に!!!
謙することはできないが、少ないハードウェア量で音声
区間の検出の確度を上げて、高い認識率を得ることがで
きる。
[発明の効果] 以上説明したようにこの発明によれば、高い認識率が得
られ、かつ少ないハードウェア量で構成することができ
るパターン識別装置を提供することができる。
【図面の簡単な説明】
第1図はこの発明の第1の実施例装置の構成を示すブロ
ック図、第2図はこの発明の第2の実施例装置の構成を
示すブロック図、第3図はこの発明の第3の実施例装置
の構成を示すブロック図、第4図はこの発明の第4の実
施例装置の構成を示すブロック図、第5図は従来装置の
構成を示すブロック図である。 11・・・音響分析部、12・・・音声区間検出部、1
3・・・1次記憶装置、14・・・リサンプル部、15
・・・2次記憶装置、16・・・類似度計算部、17・
・・標準パターン記憶装置、18・・・判定部、20・
・・アナログ・プロセッサ、2)・・・バンドパス・フ
ィルタ・バンク、22・・・A/D変換器、30・・・
CPLJ、40・・・ディジタル・プロセッサ、41・
・・1次記憶装置、42・・・認識計算部、43・・・
外部インターフェース部、44・・・類似度計算部、4
5・・・2次記憶装置、46・・・標準パターン記憶装
置。 出願人代理人 弁理士 鈴江武彦 I:1゜ 第5図

Claims (2)

    【特許請求の範囲】
  1. (1)入力信号からフレーム周期毎にスペクトルなどの
    特徴データを抽出する分析部と、上記分析部から出力さ
    れる特徴データを順次格納する第1の記憶部と、上記第
    1の記憶部に格納されたデータから有効な信号区間のデ
    ータを取出すデータ取り出し部と、上記データ取り出し
    部から取り出されたデータを格納する第2の記憶部と、
    上記第2の記憶部に格納された特徴データと標準パター
    ンデータとの間で類似度計算を行なう認識計算部と、上
    記認識計算部からの出力データに基づき上記入力信号を
    識別判定する判定部とを具備したことを特徴とするパタ
    ーン識別装置。
  2. (2)前記入力信号が音声信号であり、入力音声信号の
    パターン識別を行なつて音声認識を行なうように構成さ
    れた特許請求の範囲第1項に記載のパターン識別装置。
JP62037787A 1987-02-23 1987-02-23 パタ−ン識別装置 Expired - Fee Related JPH067343B2 (ja)

Priority Applications (6)

Application Number Priority Date Filing Date Title
JP62037787A JPH067343B2 (ja) 1987-02-23 1987-02-23 パタ−ン識別装置
KR1019880001822A KR910001117B1 (ko) 1987-02-23 1988-02-22 패턴식별장치
KR1019880001822A KR890013577A (ko) 1987-02-23 1988-02-22 패턴식별장치
DE88102646T DE3882400T2 (de) 1987-02-23 1988-02-23 Anordnung zur Mustererkennung.
EP88102646A EP0283743B1 (en) 1987-02-23 1988-02-23 Pattern recognition apparatus
US07/469,820 US5027407A (en) 1987-02-23 1990-01-23 Pattern recognition apparatus using a plurality of candidates

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP62037787A JPH067343B2 (ja) 1987-02-23 1987-02-23 パタ−ン識別装置

Publications (2)

Publication Number Publication Date
JPS63205698A true JPS63205698A (ja) 1988-08-25
JPH067343B2 JPH067343B2 (ja) 1994-01-26

Family

ID=12507197

Family Applications (1)

Application Number Title Priority Date Filing Date
JP62037787A Expired - Fee Related JPH067343B2 (ja) 1987-02-23 1987-02-23 パタ−ン識別装置

Country Status (4)

Country Link
EP (1) EP0283743B1 (ja)
JP (1) JPH067343B2 (ja)
KR (2) KR910001117B1 (ja)
DE (1) DE3882400T2 (ja)

Families Citing this family (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1013525B (zh) * 1988-11-16 1991-08-14 中国科学院声学研究所 认人与不认人实时语音识别的方法和装置
US5210820A (en) * 1990-05-02 1993-05-11 Broadcast Data Systems Limited Partnership Signal recognition system and method
US6471420B1 (en) 1994-05-13 2002-10-29 Matsushita Electric Industrial Co., Ltd. Voice selection apparatus voice response apparatus, and game apparatus using word tables from which selected words are output as voice selections
DE4417557A1 (de) * 1994-05-19 1995-11-23 Daimler Benz Aerospace Ag Verfahren zur Erkennung von Sprachsignalen und Anordnung zum Durchführen des Verfahrens
KR100396748B1 (ko) * 1996-12-23 2003-11-28 엘지전자 주식회사 유음구간추출처리장치및방법
KR102343620B1 (ko) * 2019-12-03 2021-12-24 세메스 주식회사 캐리어 이송 장치를 구비하는 캐리어 이송 시스템
KR102516414B1 (ko) * 2020-10-07 2023-03-31 유기석 외부 선택 개폐형 마스크

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS59131999A (ja) * 1983-01-19 1984-07-28 松下電器産業株式会社 音声認識装置
JPS59223499A (ja) * 1983-06-02 1984-12-15 松下電器産業株式会社 音素認識装置

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US3710323A (en) * 1971-12-13 1973-01-09 Ibm Pattern-size normalizing for recognition apparatus
US3943295A (en) * 1974-07-17 1976-03-09 Threshold Technology, Inc. Apparatus and method for recognizing words from among continuous speech
DE3008830A1 (de) * 1980-03-07 1981-10-01 Siemens AG, 1000 Berlin und 8000 München Verfahren zum betrieb eines spracherkennungsgeraetes

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS59131999A (ja) * 1983-01-19 1984-07-28 松下電器産業株式会社 音声認識装置
JPS59223499A (ja) * 1983-06-02 1984-12-15 松下電器産業株式会社 音素認識装置

Also Published As

Publication number Publication date
EP0283743B1 (en) 1993-07-21
KR880011006A (ko) 1988-10-25
EP0283743A1 (en) 1988-09-28
KR890013577A (ko) 1989-09-25
DE3882400T2 (de) 1993-11-11
DE3882400D1 (de) 1993-08-26
KR910001117B1 (ko) 1991-02-23
JPH067343B2 (ja) 1994-01-26

Similar Documents

Publication Publication Date Title
US5027407A (en) Pattern recognition apparatus using a plurality of candidates
JP2989211B2 (ja) 音声認識装置における辞書制御方式
JPS6336675B2 (ja)
JPS63205698A (ja) パタ−ン識別装置
US5909665A (en) Speech recognition system
KR20020005205A (ko) 인간 청각 모델을 이용한 효율적인 음성인식 장치
JPS6123560B2 (ja)
US4868879A (en) Apparatus and method for recognizing speech
JPH11231897A (ja) 音声認識装置及び方法
JP2801602B2 (ja) 単語認識装置
JP2001127832A (ja) プロトコルアナライザ、及びプロトコル解析方法
RU96119820A (ru) Устройство обработки информации для информационного поиска
JPS5952388A (ja) 辞書照合方式
JPS598864B2 (ja) パタ−ン認識方式
JP2638003B2 (ja) 画像処理装置
JPH0421879B2 (ja)
TW504666B (en) Speech recognition method
JPS5882300A (ja) 音声認識方式
JPS58100889A (ja) イメ−ジ表示装置
JPS6265095A (ja) 音声認識装置
JPS6152698A (ja) 音声認識装置
JPH03214198A (ja) ワードスポッティング音声認識方法
JPS59167737A (ja) かな漢字変換装置
JPS6286427A (ja) サンプル抽出方式
JPS6288077A (ja) パタ−ン類似度計算装置

Legal Events

Date Code Title Description
LAPS Cancellation because of no payment of annual fees