JPS593498A - 音声認識装置 - Google Patents

音声認識装置

Info

Publication number
JPS593498A
JPS593498A JP57112923A JP11292382A JPS593498A JP S593498 A JPS593498 A JP S593498A JP 57112923 A JP57112923 A JP 57112923A JP 11292382 A JP11292382 A JP 11292382A JP S593498 A JPS593498 A JP S593498A
Authority
JP
Japan
Prior art keywords
signal
recognition
section
voice
input signal
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP57112923A
Other languages
English (en)
Other versions
JPH0361958B2 (ja
Inventor
保夫 高橋
酒井 利成
麻田 治男
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Original Assignee
Tokyo Shibaura Electric Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tokyo Shibaura Electric Co Ltd filed Critical Tokyo Shibaura Electric Co Ltd
Priority to JP57112923A priority Critical patent/JPS593498A/ja
Publication of JPS593498A publication Critical patent/JPS593498A/ja
Publication of JPH0361958B2 publication Critical patent/JPH0361958B2/ja
Granted legal-status Critical Current

Links

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 〔発明の技術分野〕 本発明は電話回線を通じて入力される音声信号とブツシ
ュホン信号とをそれぞれ確実に認識することのできる音
声認識装置に関する。
〔発明の技術的背景とその問題点〕
近時、情報化社会の発達に伴って電話回線を介して接続
された系において、音声信号や電話機から発せられるブ
ツシュホン信号をそれぞれ認識してデータ処理を行うこ
とが考えられている。ところがこのような音声信号とブ
ツシュホン信号と云う明らかに性質の異なる信号を1つ
のアルゴリズムに従って認識処理することは甚だ困難で
あり、またその認識精度の向上も望めない。そこで従来
では第1図に示すようにブツシュホン信号を認識する為
の専用のアルゴリズムを備えた!、シュホン信号認識部
1と、音声信号を認識する為の専用のアルゴリズムを備
えた音声認識部2と、これらの認識部1,2による認識
結果を総合判定する総合判定部3とによυ音声認識装置
を構成することが行われている。
このようにすれば音声認識部2における認識対象語数を
整理することができるので、成る程度信頼性の高い認識
処理を行うことが可能となる。然し乍ら、例えば曖昧な
信号が入力された場合等、ゾ、シュホン信号認識部1は
これを音声信号であるとして確実にリジェクトするとと
が困難であり、まだ音声信号認識部2にあっても同様に
これをブツシュホン信号であると認定して確実にリジェ
クトすることが困難である為、結局総合判定部3におい
ても上記入力信号がブツシュホン信号であるか、或いは
音声信号であるかを確実に識別することができないと云
う問題があった。またこのような不具合を解消する為に
は各認識部1,2のリジェクト能力を高めなければなら
ず、結局装置構成が複雑化すると云う問題があった。ま
たこのような複雑化に見合う効果がさほど期待されない
と云う問題もあった。
〔発明の目的〕
本発明はこのような事情を考慮してなされたもので、そ
の目的とするととろは、簡易に且つ確実に音声信号とブ
ツシュホン信号とを識別することのできる実用性の高い
音声認識装置を提供することにある。
〔発明の概要〕
本発明は入力信号を所定の時間軸フレーム毎にグツシュ
ホン信号の音響特徴辞書を用いて類似度計算することに
よってブツシュポン信号を確実に識別し、その結果に応
じて音声信号およびブツシュホン信号をそれぞれの処理
対象に限って確実に認識するようにしたものである。
〔発明の効果〕
従って本発明によれば、所定の時間軸フレームにおいて
トーンが安定であると云うブツシュホン信号特有の特徴
を利用して入力信号を識別したのち、との識別結果に従
って音声信号およびダッシュホン信号をそれぞれ別個に
認識処理するので、その認識精度は非常に高いものとな
る。しかも処理形式が簡単であり、装置構成も簡易であ
るから、容易にその信頼性の向上を図るととができ、実
用的利点が多大である。
〔発明の実施例〕
以下、図面を参照して本発明の一実施例につき説明する
第2図は実施例装置の概略構成図であり、第1図に示す
従来装置と同一構成部分には同一符号を付して示しであ
る。この実施例装置が特徴と、するところは、判定部4
にて入力信号をブツシュホン信号の音響特徴辞書を用い
て類似度計算処理し、これによって上記入力信号がブツ
シュホン信号であるか否かを判定するようにしたところ
にある。上記類似度計算処理は、入力信号に対して所定
の時間軸フレーム毎に行われる。
そして、類似度値に基づく判定は、例えば音声信号/ブ
ツシュホン信号の2値として、あるいはこれに判定不能
なる信号を加えだ3値によって行われる。このような判
定結果が認識部1゜2および総合判定部3に送られる。
判定結果がグツシュホン信号であるとして識別したとき
、その判定信号によってゾッシュポン信号認識部1が駆
動されて入力信号の認識が行われる。そしてその認識結
果は総合判定部3を介して出力される。また判定結果が
音声、信号であるとして識別したとき、その判定信号に
よって音声認識部2が駆動される。これにより入力信号
は音声認識され、その認識結果が総合判定部3を介して
出力されることになる。そして判定不能なる判定結果が
得られた場合には、認識部1,2がそれぞれ駆動され、
その各々において認識結果が求められる。このとき総合
判定部3は所定のアルゴリズムに従って上記両認識結果
を総合判定し、その判定結果を入力信号に対する最終的
な認識結果として出力することになる。
かくして上記の如く構成された装置によれば明らかに性
質の異なる音声信号とブツシュホン信号とを簡易に且つ
精度良く識別したのち、その各々の場合に応じて適切な
アルゴリズムに従って信号認識することができる。これ
故、従来非常に複雑であった音声信号およびブツシュホ
ン信号に対する認識処理プロセスを系統別に分けること
によって、簡易にすることができ、またその認識精度の
向上を図ることができる。つt、b簡易に装置の高性能
化を図ることが可能となる。
ところで、前記の如く入力信号の識別を行う判定部4は
、例えば第3図に示す如く構成することができる。即ち
、入力信号を前処理部11に導びき、例えば数10 m
5ecの所定時間軸フレーム毎に上記入力信号を分析し
、例えばそのバンド・ぐスフィルタ出力Aと、低域まだ
は全帯域フィルタ出力Bとを得る。上記・ぐンド・ぐス
フィルタ出力Aを類似度計算部12に導びき、ゾッシー
ポン信号・音響信号特辞辞書13に格納されたブツシュ
ホン信号のカテゴリ毎の特徴データとの類似度計算を行
わしめる。
一方、分析区間決定部14では前記全帯域フィルタ出力
Bを用い、例えばその信号レベルの犬なる区間を検出す
る等して分析処理区間を求めている。そして、その分析
開始点と分析終了点において計数処理部15に制御信号
を力えている。この計数処理部15は、上記の如く設定
される区間内において、前記類似度計算部12が所定値
01以上の類似度値を得る回数を計数するものである。
この所定値θSを越える類似度値の判定は、全てのカテ
ゴリについて行われる。
そして、この計数された回数には、前記分析区間の情報
lと共に認識判定部16に力えられるようになっている
認識判定部16は、上記分析区間lの値に応じて2つの
閾値θkm(1) 、θkw(i)  を持っており、
これらの閾値と前記計数値にとを比較して入力信号の判
定を行っている。但し、lは1,2゜3・・・lなる値
をとる。そして、 k≧θks(71り          ・・・(1)
θks(/り’)k:2θkW(1)      ・(
2)θkw (1) :) k        ・・・
(3)なる3通りの判定を行い、上記条件が(1)なる
場合にはこれを入力信号がブツシュホン信号であるとの
判定結果を得ている。まだ上記条件が(2)なる場合に
は入力信号の判定が不能であシ、寸だ条件が(3)なる
場合には前記入力信号が音声信号であるとの判定結果を
それぞれ得ている。
このようにして求められる判定結果に応じて前述した認
識部1,2.および総合判定部3における認識・判定処
理がそれぞれ行われることになる。
以上のように本装置によれば、認識処理の中心となる音
を認識部2に、ブツシュホン信号に対する辞1を設ける
ことが必要でなくなるので、従来装置に比して処理速度
の大幅な向上と、辞書分離度の上昇による認識率の著し
い改善、更には辞書記憶領域の減少による装置構成の簡
素化を図ることが可能となる。またこの音声認識部2が
グツシュホン信号に対するリジェクト能力が低い場合で
も、ブツシュホン信号認識部1では音声信号に対するリ
ジェクト能力を考慮することなしに、その処理を簡易に
行い得る。つまり特徴の変動が激しい音声信号に比べて
、特徴変動の小さいブツシュホン信号のみを処理対象と
し得るので、極めて簡単な構成を採用して信頼性の高い
ブツシュホン信号の認識を行い得る。寸だ判定部4の構
成についても、第3図に示すように簡易に実現できる。
また分析区間判定処理を装置の前処理結果をそのまま利
用して、つまり判定部4として格別に前処理部11等を
設けることなしに行うことも可能であり、装置全体とし
て、その構成の簡易化を図り得る。故に、辞書処理を始
めとするその他関連した処理の簡易化を図り、処理速度
の向上を図シ得る等、実用上多大なる効果が奏せられる
尚、本発明は上記実施例に限定されるものではない。例
えばブツシュホン信号は、音響結合器等を用いた擬似ブ
ツシュホン信号をも含むことは云うまでもない。またブ
ツシュホン信号に対する辞書を全てのカテゴリに対して
持つことなく、カテゴリを相互にクラスタリングして少
数にまとめて辞書として与えることも有効である。また
音声信号とプツシ−ホン信号との特徴の分離度が比較的
大きい場合には、所定の識別性能をそのまま維持した状
態で上述した処理を行うようにしてもよい。このように
すれば辞書とのマツチング処理に要する時間を短くする
ことができ、更に辞書としての記憶領域を軽減できる等
の利点が生まれる。このように本発明は、その要旨を逸
脱しない範囲で種々変形して実施することができる。
【図面の簡単な説明】
第1図は従来装置の一例を示す構成図、第2図は本発明
の一実施例装置の概略構成図、第3図は実施例装置にお
ける判定部の構成図である1ノ・・・ゾ、シュホン信号
認識部、2・・・音声信号認識部、3・・・総合判定部
、4・・・判定部、1ノ・・・前処理部、12・・・類
似度計算部、13・・・特徴辞書、14・・・分析区間
決定部、15・・・特徴区間計数部、16・・・認識判
定部。 出願人代理人  弁理士 鈴 江 武 彦第1図 第2図 第3図

Claims (1)

    【特許請求の範囲】
  1. 電話回線に接続されて音声信号とダッシュホン信号とを
    入力し、これらの信号を認識してなる音声認識装置にお
    いて、音声信号あるいはグツシュホン信号からなる入力
    信号を所定の時間軸フレーム毎に前記ブツシュホン信号
    に対する音響特徴辞書を用いて類似度計算処理し、この
    計算された類似度から前記入力信号が70ッシュホン信
    号であるか否かを判定して前記入力信号を認識処理する
    ことを特徴とする音声認識装置。
JP57112923A 1982-06-30 1982-06-30 音声認識装置 Granted JPS593498A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP57112923A JPS593498A (ja) 1982-06-30 1982-06-30 音声認識装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP57112923A JPS593498A (ja) 1982-06-30 1982-06-30 音声認識装置

Publications (2)

Publication Number Publication Date
JPS593498A true JPS593498A (ja) 1984-01-10
JPH0361958B2 JPH0361958B2 (ja) 1991-09-24

Family

ID=14598869

Family Applications (1)

Application Number Title Priority Date Filing Date
JP57112923A Granted JPS593498A (ja) 1982-06-30 1982-06-30 音声認識装置

Country Status (1)

Country Link
JP (1) JPS593498A (ja)

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS5768965A (en) * 1980-10-17 1982-04-27 Fujitsu Ltd Telephone line information service system
JPS58193595A (ja) * 1982-05-07 1983-11-11 株式会社日立製作所 電話情報入力装置

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS5768965A (en) * 1980-10-17 1982-04-27 Fujitsu Ltd Telephone line information service system
JPS58193595A (ja) * 1982-05-07 1983-11-11 株式会社日立製作所 電話情報入力装置

Also Published As

Publication number Publication date
JPH0361958B2 (ja) 1991-09-24

Similar Documents

Publication Publication Date Title
Lamel et al. An improved endpoint detector for isolated word recognition
JPS5972496A (ja) 単音識別装置
JPS62217295A (ja) 音声認識方式
US4776017A (en) Dual-step sound pattern matching
US5101434A (en) Voice recognition using segmented time encoded speech
US3377428A (en) Voiced sound detector circuits and systems
JPS593498A (ja) 音声認識装置
JPS6312312B2 (ja)
JPH0119597B2 (ja)
JPS6361300A (ja) 音声認識方式
JPS5953898A (ja) 音声認識装置
JPS5953897A (ja) 音声認識装置
JPS5953899A (ja) 音声認識装置
JPH0376471B2 (ja)
JPS59219798A (ja) 音声認識装置
JPS63163399A (ja) パタ−ン認識装置
JPS5977500A (ja) 単語音声認識方式
JPS59124388A (ja) 単語音声認識処理方式
JPH03155599A (ja) 音声認識装置
JPS595294A (ja) 音声認識装置
JPS6150199A (ja) 音声認識装置
JPS62286099A (ja) 音声認識方式
JPS63210998A (ja) パタ−ン認識システム
JPS59124389A (ja) 単語音声認識方式
JPS58190998A (ja) 音声認識装置