JPH067343B2 - パタ−ン識別装置 - Google Patents

パタ−ン識別装置

Info

Publication number
JPH067343B2
JPH067343B2 JP62037787A JP3778787A JPH067343B2 JP H067343 B2 JPH067343 B2 JP H067343B2 JP 62037787 A JP62037787 A JP 62037787A JP 3778787 A JP3778787 A JP 3778787A JP H067343 B2 JPH067343 B2 JP H067343B2
Authority
JP
Japan
Prior art keywords
data
voice
recognition
unit
storage device
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP62037787A
Other languages
English (en)
Other versions
JPS63205698A (ja
Inventor
潤 角田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Original Assignee
Tokyo Shibaura Electric Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tokyo Shibaura Electric Co Ltd filed Critical Tokyo Shibaura Electric Co Ltd
Priority to JP62037787A priority Critical patent/JPH067343B2/ja
Priority to KR1019880001822A priority patent/KR890013577A/ko
Priority to KR1019880001822A priority patent/KR910001117B1/ko
Priority to EP88102646A priority patent/EP0283743B1/en
Priority to DE88102646T priority patent/DE3882400T2/de
Publication of JPS63205698A publication Critical patent/JPS63205698A/ja
Priority to US07/469,820 priority patent/US5027407A/en
Publication of JPH067343B2 publication Critical patent/JPH067343B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Classifications

    • BPERFORMING OPERATIONS; TRANSPORTING
    • B66HOISTING; LIFTING; HAULING
    • B66CCRANES; LOAD-ENGAGING ELEMENTS OR DEVICES FOR CRANES, CAPSTANS, WINCHES, OR TACKLES
    • B66C15/00Safety gear
    • B66C15/04Safety gear for preventing collisions, e.g. between cranes or trolleys operating on the same track
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/78Detection of presence or absence of voice signals
    • G10L25/87Detection of discrete points within a voice signal
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/08Speech classification or search
    • G10L15/10Speech classification or search using distance or distortion measures between unknown speech and reference templates

Description

【発明の詳細な説明】 [発明の目的] (産業上の利用分野) この発明は入力信号を識別するパターン識別装置に係
り、特に集積回路化に適したパターン識別装置に関す
る。
(従来の技術) 第5図はパターン識別装置の一種である音声認識装置の
従来の構成を示すブロック図である。マイクロフォン等
の音声信号入力手段により入力された音声信号は音響分
析部51に供給される。この音響分析部51においてスペク
トル等の特徴が規定フレーム長(通常は数mS〜数十m
S)毎に分析され、特徴データが時系列的に抽出され
る。この時系列データは記憶装置52に蓄えられた後、
もしくは蓄えられながら、音声区間検出部53により有効
な音声の開始点(始点)と終了点(終点)が検出され
る。この音声区間検出部53で検出された有効音声の開始
点と終了点とは記憶装置52のアドレス・テーブル54に供
給される。このテーブル54の出力アドレスに基づき、記
憶装置52から特定の音声区間のデータ列が認識用データ
として取り出され、類似度計算部55に供給される。
一方、標準パターン記憶装置56には多数の標準パターン
データが登録されており、類似度計算部55でこれらの標
準パターンデータと記憶装置52から取り出されたデータ
列との間で類似度計算が行われる。この計算結果は判定
部57に供給され、最大の類似度を持つ標準パターンに該
当する値が認識結果として出力される。
ところで、標準パターンデータを登録する際の音声長
と、識別対象となる入力音声長とが一致していないのが
一般的である。このため、認識用データを記憶装置52か
ら取り出す際には、標準パターンデータの時間長に合せ
て時間的に正規化した後、類似度計算を行なう必要があ
る。
時間的に正規化して類似度計算を行なう方式の一つであ
り、時間的な正規化であるリサンプルを行ない、例えば
全てのリサンプルが終了した後に類似度計算を行なう方
式では、記憶装置52から認識用データを取り出す際に正
規化を行なう必要があり、データの格納箇所を固定的に
割付けることはできない。
そこで、アドレス・テーブル54や、次に取り出すデータ
までの距離のテーブルを用意したり、計算により順次ア
ドレスを求めて間接的に記憶データを参照しながら認識
計算を行なっている。
すなわち従来では、認識対象となるデータ列がアドレス
・テーブルや計算によって求められたアドレスに基づい
て間接的に取り出され、類似度計算部55に供給されてい
る。このような制御動作をハードウエアを用いて実現す
るには、アドレス計算が複雑であるだけではなく、計算
の実行速度を速めるためには複雑なタイミング設計が必
要であり、ハードウエア量が極めて多くなってしまう。
また、音声認識率に大きく依存する音声区間の切出しは
非常に難しく、単一のアルゴリズムでは切出しミスが発
生する場合がある。そこで、何通りかの切出しを複数の
アルゴリズムで行ない、同時に類似度計算を行なえば、
高い認識率が速い応答速度で得られる可能性がある。し
かし、従来の方式では、特徴データが格納されている記
憶装置52を認識計算時にも使用するため、同時に複数の
類似度計算を行なうことはできない。
(発明が解決しようとする問題点) このように従来方式の識別装置では、装置の構成が複雑
であり、高い認識率を得ることができないという欠点が
ある。
この発明は上記のような事情を考慮してなされたもので
あり、その目的は、高い認識率が得られ、かつ少ないハ
ードウエア量で構成することができるパターン識別装置
を提供することにある。
[発明の構成] (問題点を解決するための手段) この発明のパターン識別装置は、入力信号からフレーム
周期毎にスペクトルなどの特徴データを抽出する分析部
と、上記分析部から出力される特徴データを順次格納す
る第1の記憶部と、上記第1の記憶部に格納されたデー
タから有効な信号区間のデータを取出すデータ取り出し
部と、上記データ取り出し部から取り出されたデータを
それぞれ格納する複数の第2の記憶部と、上記複数の各
第2の記憶部に記憶された特徴データと標準パターンデ
ータとの間で類似度計算を並列的に行う複数の認識計算
部と、上記複数の各認識計算部からの出力データに基づ
き上記入力信号を識別判定する判定部とから構成されて
いる。
(作用) この発明のパターン識別装置では、認識計算部が専用に
アクセスできる第2の記憶部を用意し、データ取り出し
部で取り出された認識用データをこの第2の記憶部に格
納する。また、入力信号から得られた特徴データは第1
の記憶部に格納することにより、この第1の記憶部を認
識計算とは別の目的でアクセスできるようにしている。
(実施例) 以下、図面を参照してこの発明の実施例を説明する。
第1図はこの発明の途中で考えられた音声認識装置の構
成を示すブロック図である。
マイクロフォン等の音声信号入力手段により入力された
音声信号は音響分析部11に供給される。この音響分析部
11は例えばアナログ・バンドパス・フィルタ・バンクと
各フィルタ・バンクの出力をディジタルデータに変換す
るA/D変換器との組合わせにより、入力音声信号から
特徴データを抽出する。抽出された特徴データは音声区
間検出部12によって入力音声区間が検出されながら1次
記憶装置13に格納される。
上記音声区間検出部12における検出の一つの方法とし
て、音響分析部11で入力音声のエネルギー成分を取出
し、そのエネルギーが予め定められた閾値を一定時間越
えたとき、始めに閾値を越えたところを音声の始端と
し、その後、閾値を一定時間下回ったとき、始めに下回
ったところを音声の終端とする方式がある。検出の別の
方法として、低い閾値と高い閾値の二つの閾値を定め、
エネルギーが一定時間以内に低い閾値から高い閾値に達
するときに、低い閾値を音声区間の始端とする方式があ
る。
音声区間の検出によって得られた入力音声の特徴データ
は、通常、ある標本化周波数によって時間的に標本化さ
れている。この標本数をNフレームすると、Nは音声の
長さによって変化する。このNフレームのデータを線形
伸縮することにより、固定長のMフレームのデータに時
間軸の正規化を行なう方法の一つとしてリサンプルがあ
る。例えば始端から フレーム目のサンプルを取り出す。そこで、1次記憶装
置13に格納された特徴データはリサンプル部14によって
リサンプルされ、時間的に正規化された後に2次記憶部
15に転送され、ここの格納される。
2次記憶装置15に格納されたデータ列は認識用データと
して取り出され、類似度計算部16に供給される。
一方、標準パターン記憶装置17には多数の標準パターン
データが登録されており、類似度計算部16でこれらの標
準パターンデータと2次記憶装置15から取り出されたデ
ータ列との間で類似度計算が行われる。この計算結果は
判定部18に供給され、最大の類似度を持つ標準パターン
に該当する単語番号が判定され、この番号が認識結果と
して出力される。
上記構成でなる装置では、2次記憶装置15をアクセスし
て認識用データを取り出す際に、従来のように複雑なア
ドレス計算は必要なく、2次記憶装置15から順次アドレ
ス指定して取り出せばよい。このため、簡単な構造のア
ドレス・カウンタを2次記憶装置15のアドレス発生に用
いることができる。かつ、類似度計算部16が認識用デー
タをアクセスする際に必要な信号は、読出し制御信号と
アドレス・カウントアップ信号のみでよい。このため、
制御回路の構成が簡単となり、集積回路化する際のハー
ドウエア量を少なくすることができる。
また、1次記憶装置13に格納される特徴データに比べる
と、2次記憶装置15に格納されるリサンプルデータは1/
10以下の容量となる。このため、音声区間検出を複数の
アルゴリズムで行なったり、特定のアルゴリズムで複数
の候補を挙げる場合のように、複数の類似度計算部を用
意する必要が生じたときでも、1次記憶装置13は一つの
み用意すればよい。
実際に上記構成でなる装置を集積回路化した場合のチッ
プ占有面積は例えば、1次記憶装置13が1に対して2次
記憶装置15が0:1、類似度計算部16が0.3の割合と
なっている。従って、複数の類似度計算部を用意する必
要が生じた場合にも1次記憶装置13を1個のみ用意すれ
ばよいということは、チップ面積縮小化の上で大きなメ
リットになっている。
第2図はこの発明の途中で考えられた別の音声認識装置
の構成を示すブロック図である。
図において、20はマイクロフォン等の音声信号入力手段
により入力された音声信号を分析するアナログ・プロセ
ッサである。このアナログ・プロセッサ20はバンドパス
・フィルタ・バンク21とA/D変換器22とを内蔵し、C
PU30の指示により入力音声信号から特徴の抽出を行な
う。
40はディジタル・プロセッサであり、1次記憶装置41、
認識計算部42及び外部インターフェース部(I/F)43
を内蔵している。
さらに、認識計算部42は類似度計算部44、2次記憶装置
45及び標準パターン記憶装置46を内蔵している。
このような構成において、CPU30はアナログ・プロセ
ッサ20で得られた特徴データをディジタル・プロセッサ
40内の1次記憶装置41に格納させる。また、CPU30は
同時に音声区間検出制御も行なっており、入力音声が終
了すると、リサンプル制御を行なって2次記憶装置45に
対しリサンプルデータの転送制御を行なう。
次に、CPU30はディジタル・プロセッサ40内の認識計
算部42に対して計算開始指令を与える。認識計算部42
は、標準パターン記憶装置46に格納されている全ての単
語パターンについて類似度計算を行ない、一単語分の計
算が終了する毎に読出し要求信号をCPU30に送り、類
似度計算値の読出しを要求する。
全単語分の類似度計算値を読み込むと、CPU30はその
中から最大の類似度を持つ単語番号を外部インターフェ
ース部43を介して外部のホストシステムに送出する。
すなわち、上記構成でなる装置では、CPU30が全体の
動作を制御する制御回路と、前記第1図の実施例装置に
おける判定部18とを兼ねている。
第3図はこの発明の第1の実施例に係る音声認識装置の
構成を示すブロック図である。
この実施例装置は複数の認識計算部を持つ音声認識装置
の例である。20はバンドパス・フィルタ・バンクとA/
D変換器とを内蔵し、マイクロフォン等の音声信号入力
手段により入力された音声信号を分析するアナログ・プ
ロセッサ、30はCPU、41は1次記憶装置、44A及び44
Bはそれぞれ類似度計算部、45A及び45Bはそれぞれ2
次記憶装置、46A及び46Bはそれぞれ標準パターン記憶
装置、43は外部インターフェース部である。
CPU30は、1次記憶装置41に格納された特徴データか
ら音声区間を検出する際に、複数(この例では2種類)
の始端点と終端点とを選び出し、リサンプルしながらそ
れぞれのデータを2次記憶装置45A、45Bに転送する。
この転送が終了すると、類似度計算部44A、44Bに対し
て認識計算開始命令を与え、一単語分の計算が終了する
のを待機する。一単語分の類似度計算は通常3mS程度
で終了するが、CPU30の命令実行速度は2μS程度と
速いため、二つの類似度計算部44A、44Bで類似度計算
が並行して順次行われても、計算結果を取りこぼすこと
なく、全てのデータを処理することができる。
ここで、標準パターン記憶装置46A、46Bが同一の内容
を格納する場合には、前記のように複数の音声区間に対
して得られる類似度計算値の中で最大の値を持つものを
その単語に対する類似度値とすることにより、音声区間
検出誤り率を減らして高い認識率を得ることができる。
なおこの実施例装置では、二つの類似度計算部44A、44
Bで類似度計算を行なうようにしているが、類似度計算
部を二つ以上用意して、よりも高い認識率を得るように
したり、より速い速度で類似度値を得るようにしてもよ
い。
第4図はこの発明の第2の実施例に係る音声認識装置の
構成を示すブロック図である。
この実施例装置は、二つの類似度計算部44A、44Bを設
けた場合に、標準パターン記憶装置46を一つのみ設け、
異なる類似度計算部で共用するように構成したものであ
る。この実施例装置では大語いを高速に認識することは
できないが、少ないハードウエア量で音声区間の検出の
確度を上げて、高い認識率を得ることができる。
[発明の効果] 以上説明したようにこの発明によれば、高い認識率が得
られ、かつ少ないハードウエア量で構成することができ
るパターン識別装置を提供することができる。
【図面の簡単な説明】
第1図はこの発明の途中で考えられた音声認識装置の構
成を示すブロック図、第2図は同じくこの発明の途中で
考えられた別の音声認識装置の構成を示すブロック図、
第3図はこの発明の第1の実施例装置の構成を示すブロ
ック図、第4図はこの発明の第2の実施例装置の構成を
示すブロック図、第5図は従来装置の構成を示すブロッ
ク図である。 11…音響分析部、12…音声区間検出部、13…1次
記憶装置、14…リサンプル部、15…2次記憶装置、
16…類似度計算部、17…標準パターン記憶装置、1
8…判定部、20…アナログ・プロセッサ、21…バン
ドパス・フィルタ・バンク、22…A/D変換器、30
…CPU、40…ディジタル・プロセッサ、41…1次
記憶装置、42…認識計算部、43…外部インターフェ
ース部、44…類似度計算部、45…2次記憶装置、4
6…標準パターン記憶装置。

Claims (2)

    【特許請求の範囲】
  1. 【請求項1】入力信号からフレーム周期毎にスペクトル
    などの特徴データを抽出する分析部と、 上記分析部から出力される特徴データを順次格納する第
    1の記憶部と、 上記第1の記憶部に格納されたデータから、それぞれ区
    間が異なる有効な信号区間のデータを取り出すデータ取
    り出し部と、 上記データ取り出し部から取り出された信号区間が異な
    るデータをそれぞれ格納する複数の第2の記憶部と、 上記複数の各第2の記憶部に記憶された特徴データと、
    同一の標準パターンデータそれぞれとの間で類似度計算
    を並列的に行う複数の認識計算部と、 上記複数の認識計算部における類似度計算値の中で最大
    の値を持つものを上記入力信号に対する識別結果として
    判定する判定部 とを具備したことを特徴とするパターン識別装置。
  2. 【請求項2】前記入力信号が音声信号であり、入力音声
    信号のパターン識別を行って音声認識を行うように構成
    された特許請求の範囲第1項に記載のパターン識別装
    置。
JP62037787A 1987-02-23 1987-02-23 パタ−ン識別装置 Expired - Fee Related JPH067343B2 (ja)

Priority Applications (6)

Application Number Priority Date Filing Date Title
JP62037787A JPH067343B2 (ja) 1987-02-23 1987-02-23 パタ−ン識別装置
KR1019880001822A KR890013577A (ko) 1987-02-23 1988-02-22 패턴식별장치
KR1019880001822A KR910001117B1 (ko) 1987-02-23 1988-02-22 패턴식별장치
EP88102646A EP0283743B1 (en) 1987-02-23 1988-02-23 Pattern recognition apparatus
DE88102646T DE3882400T2 (de) 1987-02-23 1988-02-23 Anordnung zur Mustererkennung.
US07/469,820 US5027407A (en) 1987-02-23 1990-01-23 Pattern recognition apparatus using a plurality of candidates

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP62037787A JPH067343B2 (ja) 1987-02-23 1987-02-23 パタ−ン識別装置

Publications (2)

Publication Number Publication Date
JPS63205698A JPS63205698A (ja) 1988-08-25
JPH067343B2 true JPH067343B2 (ja) 1994-01-26

Family

ID=12507197

Family Applications (1)

Application Number Title Priority Date Filing Date
JP62037787A Expired - Fee Related JPH067343B2 (ja) 1987-02-23 1987-02-23 パタ−ン識別装置

Country Status (4)

Country Link
EP (1) EP0283743B1 (ja)
JP (1) JPH067343B2 (ja)
KR (2) KR890013577A (ja)
DE (1) DE3882400T2 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20220046121A (ko) * 2020-10-07 2022-04-14 유기석 외부 선택 개폐형 마스크

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1013525B (zh) * 1988-11-16 1991-08-14 中国科学院声学研究所 认人与不认人实时语音识别的方法和装置
US5210820A (en) * 1990-05-02 1993-05-11 Broadcast Data Systems Limited Partnership Signal recognition system and method
US6471420B1 (en) 1994-05-13 2002-10-29 Matsushita Electric Industrial Co., Ltd. Voice selection apparatus voice response apparatus, and game apparatus using word tables from which selected words are output as voice selections
DE4417557A1 (de) * 1994-05-19 1995-11-23 Daimler Benz Aerospace Ag Verfahren zur Erkennung von Sprachsignalen und Anordnung zum Durchführen des Verfahrens
KR100396748B1 (ko) * 1996-12-23 2003-11-28 엘지전자 주식회사 유음구간추출처리장치및방법
KR102343620B1 (ko) * 2019-12-03 2021-12-24 세메스 주식회사 캐리어 이송 장치를 구비하는 캐리어 이송 시스템

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US3710323A (en) * 1971-12-13 1973-01-09 Ibm Pattern-size normalizing for recognition apparatus
US3943295A (en) * 1974-07-17 1976-03-09 Threshold Technology, Inc. Apparatus and method for recognizing words from among continuous speech
DE3008830A1 (de) * 1980-03-07 1981-10-01 Siemens AG, 1000 Berlin und 8000 München Verfahren zum betrieb eines spracherkennungsgeraetes
JPS59131999A (ja) * 1983-01-19 1984-07-28 松下電器産業株式会社 音声認識装置
JPS59223499A (ja) * 1983-06-02 1984-12-15 松下電器産業株式会社 音素認識装置

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20220046121A (ko) * 2020-10-07 2022-04-14 유기석 외부 선택 개폐형 마스크

Also Published As

Publication number Publication date
KR880011006A (ko) 1988-10-25
DE3882400T2 (de) 1993-11-11
DE3882400D1 (de) 1993-08-26
EP0283743A1 (en) 1988-09-28
EP0283743B1 (en) 1993-07-21
JPS63205698A (ja) 1988-08-25
KR890013577A (ko) 1989-09-25
KR910001117B1 (ko) 1991-02-23

Similar Documents

Publication Publication Date Title
CA1198216A (en) Data processing apparatus and method for use in speech recognition
JPH02163819A (ja) テキスト処理装置
US5027407A (en) Pattern recognition apparatus using a plurality of candidates
EP0112717B1 (en) Continuous speech recognition apparatus
US5355432A (en) Speech recognition system
JPH067343B2 (ja) パタ−ン識別装置
US5909665A (en) Speech recognition system
US4720864A (en) Speech recognition apparatus
JP2829014B2 (ja) 音声認識装置及び方法
JPS6123560B2 (ja)
US4868879A (en) Apparatus and method for recognizing speech
JPS6129519B2 (ja)
JPS6114520B2 (ja)
JPH11231897A (ja) 音声認識装置及び方法
JPH06167997A (ja) 音声認識装置
JP2603920B2 (ja) 音声認識装置
JPS6332399B2 (ja)
JPS6152698A (ja) 音声認識装置
JPS63223696A (ja) 音声パタ−ン作成方式
JPS5882300A (ja) 音声認識方式
JPS63103393A (ja) 単語認識装置
JPS63798B2 (ja)
JPH0465391B2 (ja)
JPH0682402B2 (ja) 文字認識装置
JPS6336679B2 (ja)

Legal Events

Date Code Title Description
LAPS Cancellation because of no payment of annual fees