JPH02278299A - 音声信号処理方式 - Google Patents

音声信号処理方式

Info

Publication number
JPH02278299A
JPH02278299A JP1101142A JP10114289A JPH02278299A JP H02278299 A JPH02278299 A JP H02278299A JP 1101142 A JP1101142 A JP 1101142A JP 10114289 A JP10114289 A JP 10114289A JP H02278299 A JPH02278299 A JP H02278299A
Authority
JP
Japan
Prior art keywords
pattern
channel
patterns
voice
frame
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP1101142A
Other languages
English (en)
Inventor
Takashi Ariyoshi
有吉 敬
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ricoh Co Ltd
Original Assignee
Ricoh Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ricoh Co Ltd filed Critical Ricoh Co Ltd
Priority to JP1101142A priority Critical patent/JPH02278299A/ja
Publication of JPH02278299A publication Critical patent/JPH02278299A/ja
Pending legal-status Critical Current

Links

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 瑳4止乱 本発明は、音声信号処理方式、より詳細には、騒音下で
の音声認識技術に係り、オフィス内、工場内、自動車内
、家庭内での音声認識に適用して好適なものである。
灸未1度 音声認識などに用いるための音声のタイムスペクトルパ
ターンには、マイク入力に周囲のノイズが混入していた
り、回路に電気的なノイズが混入したりすることによっ
て、音声ではないパターンが現れることがある。特に、
音声区間中のノイズのパターンを除去することは難しか
った。
タイムスペクトルパターンからノイズの成分を除去する
従来の方法としては、スペクトルサブトラクション法C
′5uppression of acoustic 
noisein 5peech using 5pec
tral 5ubtraction” IEEETra
ns、 ASSP、 Vol、26 No、4. Au
g、 19713)がある。
これは、一般的に、予め測定された、音声区間でない区
間のスペクトルパターンをノイズのパターンとして、入
力信号から得られたスペクトルパターンから差引きその
結果を音声のスペクトルパターンとするものである。こ
の方法は、ノイズのスペクトルパターンが時間定常でな
く、予め測定したときと、音声区間、及び、その前後で
変化する状況では効果が薄い。これに対して時間非定常
のノイズに対応するために、時間軸、及び1周波数軸方
向に広がりを持つ音声、または、ノイズのタイムスペク
トルパターンを予め登録しておき。
入力信号から得られたスペクトルパターンに類似のパタ
ーンが存在する場合に、それを除去する方法(特開昭5
8−123599号公報)も考えられているが、あらゆ
るノイズのパターンを登録することは不可能であるし、
多くの音声パターン、または、ノイズパターンと照合す
るためには時間がかかるという欠点がある。
正−一孜 本発明は、上述のごとき実情に鑑みてなされたもので、
特に、BPFを用いた音声のタイムスペクトルパターン
には時間軸上と周波数軸上の両方にある程度以上の広が
りがあるという性質を利用して、予め定められた大きさ
に満たない広がりを持つパターンをノイズのパターンと
して除去すること、更には、この演算を高速に行うこと
を目的としてなされたものである。
1−一皮 本発明は、上記目的を達成するために、(1)予め定め
られたサンプリング周期を1フレームとする時間軸と、
複数のチャンネルから成る周波数軸とに対するタイムス
ペクトルパターンを生成する音声信号処理装置に於て、
入力された音声信号から得られたタイムスペクトルパタ
ーンのうち、時間軸上でパターンとして連続して現われ
たフレームの数が予め定められた数に満たない場合、ま
たは、周波数軸上でパターンとして連続して現れたチャ
ンネルの数が予め定められた数に満たない場合、該当す
る部分のパターンを除去すること。
或いは、(2)あるフレーム、あるチャンネルのパター
ンを除去する手段として、各フレーム毎に、該チャンネ
ルに於て、該フレームを含む、時間軸上でパターンとし
て連続して現れたフレームの数が予め定められた数に満
たない場合に、該フレーム、該チャンネルのパターンを
除去する手続きを各チャンネル毎に行う手段と、該フレ
ームに於て、該チャンネルを含む1周波数軸上でパター
ンとして連続して現われたチャンネルの数が予め定めら
れた数に満たない場合に、該フレーム、該チャンネルの
パターンを除去する手続きを各チャンネル毎に行う手段
とを有すること、或いは、(3)マイクから入力された
音声信号の前処理を行う音声前処理部と、複数のチャン
ネルから成り、上記音声前処理部の出力のスペクトルを
求めるバンドパスフィルタ部と、上記バンドパスフィル
タ部の各チャンネルの出力をA/Dコンバートし、予め
定められたサンプル周期でタイムスペクトルパターンを
出力するA/Dコンバータと、上記A/Dコンバータか
ら得られたタイムスペクトルパターンからノイズのパタ
ーンを除去するパターン処理部と、上記パターン処理部
の出力である、ノイズを除去したタイムスペクトルパタ
ーンから、音声区間を決定し、入力音声の特徴量パター
ンを作成する音声パターン作成部と、複数の標準音声の
特徴量パターンが格納されている標準音声パターンメモ
リと、上記音声パターン作成部からの入力音声の特徴量
パターンと、上記標準パターンメモリ内の標準音声の特
徴量パターンとを用いてパターンマツチングを行い、上
記入力音声の特徴量パターンに最も類似する上記標準音
声の特徴量パターンに対応する結果を認識結果として出
力する認識部とを具備して成り、上記パターン処理部に
於て、前記(1)記載の方式によりノイズを除去するこ
とを特徴としたものである。以下5本発明の実施例に基
づいて説明する。
第1図は1本発明の一実施例を説明するための構成図で
、図中、1はマイクロフォン、2は音声前処理部、3は
バンドパスフィルタバンク、4はパターン処理部、5は
A/Dコンバータ、6は音声パターン作成部、7は標準
音声パターンメモリ。
8は認識部、9は認識結果出力部で、音声前処理部2は
、マイクエから入力された音声信号の増帽。
プリエンファシス等を行い、バンドパスフィルタバンク
3は複数のチャンネルから成るバンドパスフィルタ(B
PF)、検波器(DET) 、及び、ローパスフィルタ
(LPF)で構成され、音声のスペクトルを求める。A
/Dコンバータ4は、BPF−DET−LPFの各チャ
ンネルの出力をA/DコンバートするA/Dコンバータ
である。
パターン処理部5は、A/Dコンバータから得られたタ
イムスペクトルパターンのうち、Oでない部分を音声、
または、ノイズのパターンとして見て、時間軸上でパタ
ーンとして連続して現れたフレームの数が予め定められ
た数(=2とする。)に満たない場合、または、周波数
軸上でパターンとして連続して現れたチャンネルの数が
予め定められた数(=2とする。)に満たない場合、該
当する部分のパターンをノイズとして除去する。
音声パターン作成部6は、パターン処理部の出力である
、ノイズを除去したタイムスペクトルパターンから、音
声区間を決定し、入力音声の特徴量パターンを作成する
。標準音声パターンメモリ7には、複数の標準音声の特
徴量パターンが格納されている。認識部8は、音声パタ
ーン作成部6からの入力音声の特徴量パターンと、標準
音声パターンメモリ内の標準音声の特徴量パターンとを
用いてパターンマツチングを行い、入力音声の特徴量パ
ターンに最も類似する′IfA準音声の特徴量パターン
に対応する結果をrism結果9として出力する。
第2図は1本発明の動作説明をするためのフローチャー
トで、1つのフレームのスペクトルパターンが入力され
る毎に1回、上記パターン処理部で実行される。すなわ
ち。
周波数軸のチャンネル数をn、フレーム番号i。
チャンネル番号jのタイムスペクトルパターンをP(i
、j)として、 (1) j=LLp+nについて。
P=(i−2,j)=0かっ−P(xvj):0であれ
ば、p(i−Lj)=0とし、さらに、 (2) J=LLypnについて、 P=(i−1,j−1)=0かつ、P (i−1t、1
+1):0であれば、 P(i−1*j)=0とする。
但し、ここで、P(i−1,0)= P(i−1,n+
1)=0とする。
という、(1)、(2)の手続きである。
ここでは、ノイズとして除去しないための、時間軸上で
パターンとして連続して現れたフレームの数と、周波数
軸上でパターンとして連続して現九たチャンネルの数を
いずれも2としたが、この数のうち、いずれか一方、あ
るいは、両方を3以上にする場合にも、(1)、(2)
と類似の手続きを繰り返し行うことにより実現できる。
即ち、除去しない、連続するフレーム数をkt、連続す
るチャンネル数をkfとして。
(1’)j=lyLttnについて、 P (x−kt、j)=0       かつ、(P(
x−kt+2yj)”0または、P(i−kt÷3.j
)=O1 P(i、j) :O)  であれば。
P(i−ktすIFJ) =Oとし、さらに。
C2’>J=lp2pppnについて、P(i−kf÷
1.j−1)=0       かつ、(P (i−k
t+1.j+1)=Oまたは、P (i−kt◆1.j
+2)=O。
P (i−kt◆1.j+kf−1) = 0  であ
れば、P (i−kt◆Lj)”Oとする。
但し、ここで、層〈1または層〉nなる層に対して、 P(i−kt+1.m)=0 とする。
という、(1′)、(2′)の手続きをフレームを遡る
などして繰り返し行う。
第3図は、A/Dコンバータの出カバターンの例で、1
つのフレーム、1つのチャンネルの値が8ビツトで表現
されている。第4図は、第3図のパターンに対して本発
明の処理を行ったパターン処理部の出力である。
羞−一来 以上の説明から明らかなように、tit求項第1項の発
明によると、時rJJ軸上でパターンとして連続して現
れたフレームの数が予め定められた数に満たない場合、
または、周波数軸上でパターンとして連続して現れたチ
ャンネルの数が予め定められた数に満たない場合、該当
する部分のパターンを除去するので、時間軸上、および
、周波数軸上である限られた広がりのないノイズのパタ
ーンを容易に除去することが出来るようになった。特に
、従来、困難であった音声区間中のノイズパターンが除
去出来るようになった。
また、請求項第2項の発明によると、請求項第1項記載
のノイズパターン除去のための演算に、アンドオアとO
か、0でないかの単純な演算のみを用い実行しているの
で、高速に、かつ、実時間で実施することが出来る。
更に、請求項第3項の発明によると、タイムスペクトル
パターンの生成に請求項第1項の音声信号処理方式を用
いているので、騒音下での音声認識においては、その音
響的ノイズの除去、及び、LSIなど比較的精度の悪い
アナログ部を持つ音声認識装置においては5回路的なノ
イズの除去を行なうことができ、音声認識率が向上する
また、請求項第1項記載の音声信号処理方式は、簡単な
ソフトウェアで実現できるので、従来のハードウェアを
そのまま用い、若干のソフトウェアの変更をするだけで
、従来の音声認識装置に付加することが出来る。
【図面の簡単な説明】
第1図は1本発明による音声信号処理方式を実施するた
めの一構成例を示す図、第2図は1本発明の動作説明を
するためのフローチャート、第3図は、A/Dコンバー
タの出カバターンの一例を示す図、第4図は、第3図の
パターンに対して本発明による処理を行ったパターン処
理部の出カバターンを示す図である。 1・・・マイクロフォン、2・・・音声前処理部、3・
・・バンドパスフィルタバンク、4・・・パターン処理
部、5・・・A/Dコンバータ、6・・・音声パターン
作成部、7・・・#*音声パターンメモTハ8・・・L
召識部、9・・・認識結果出力部。

Claims (1)

  1. 【特許請求の範囲】 1、予め定められたサンプリング周期を1フレームとす
    る時間軸と、複数のチャンネルから成る周波数軸とに対
    するタイムスペクトルパターンを生成する音声信号処理
    装置に於て、入力された音声信号から得られたタイムス
    ペクトルパターンのうち、時間軸上でパターンとして連
    続して現われたフレームの数が予め定められた数に満た
    ない場合、または、周波数軸上でパターンとして連続し
    て現れたチャンネルの数が予め定められた数に満たない
    場合、該当する部分のパターンを除去することを特徴と
    した音声信号処理方式。 2、あるフレーム、あるチャンネルのパターンを除去す
    る手段として、各フレーム毎に、該チャンネルに於て、
    該フレームを含む、時間軸上でパターンとして連続して
    現れたフレームの数が予め定められた数に満たない場合
    に、該フレーム、該チャンネルのパターンを除去する手
    続きを各チャンネル毎に行う手段と、該フレームに於て
    、該チャンネルを含む、周波数軸上でパターンとして連
    続して現われたチャンネルの数が予め定められた数に満
    たない場合に、該フレーム、該チャンネルのパターンを
    除去する手続きを各チャンネル毎に行う手段とを有する
    ことを特徴とした請求項第1記載の音声信号処理方式。 3、マイクから入力された音声信号の前処理を行う音声
    前処理部と、複数のチヤンネルから成り、上記音声前処
    理部の出力のスペクトルを求めるバンドパスフィルタ部
    と、上記バンドパスフィルタ部の各チャンネルの出力を
    A/Dコンバートし、予め定められたサンプル周期でタ
    イムスペクトルパターンを出力するA/Dコンバータと
    、上記A/Dコンバータから得られたタイムスペクトル
    パターンからノイズのパターンを除去するパターン処理
    部と、上記パターン処理部の出力である、ノイズを除去
    したタイムスペクトルパターンから、音声区間を決定し
    、入力音声の特徴量パターンを作成する音声パターン作
    成部と、複数の標準音声の特徴量パターンが格納されて
    いる標準音声パターンメモリと、上記音声パターン作成
    部からの入力音声の特徴量パターンと、上記標準パター
    ンメモリ内の標準音声の特徴量パターンとを用いてパタ
    ーンマッチングを行い、上記入力音声の特徴量パターン
    に最も類似する上記標準音声の特徴量パターンに対応す
    る結果を認識結果として出力する認識部とを具備して成
    り、上記パターン処理部に於て、請求項第1記載の方式
    によりノイズを除去することを特徴とした音声信号処理
    方式。
JP1101142A 1989-04-19 1989-04-19 音声信号処理方式 Pending JPH02278299A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP1101142A JPH02278299A (ja) 1989-04-19 1989-04-19 音声信号処理方式

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP1101142A JPH02278299A (ja) 1989-04-19 1989-04-19 音声信号処理方式

Publications (1)

Publication Number Publication Date
JPH02278299A true JPH02278299A (ja) 1990-11-14

Family

ID=14292834

Family Applications (1)

Application Number Title Priority Date Filing Date
JP1101142A Pending JPH02278299A (ja) 1989-04-19 1989-04-19 音声信号処理方式

Country Status (1)

Country Link
JP (1) JPH02278299A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005122034A (ja) * 2003-10-20 2005-05-12 Fujitsu Ten Ltd オーディオデータ圧縮方法

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005122034A (ja) * 2003-10-20 2005-05-12 Fujitsu Ten Ltd オーディオデータ圧縮方法
JP4508599B2 (ja) * 2003-10-20 2010-07-21 富士通テン株式会社 データ圧縮方法

Similar Documents

Publication Publication Date Title
JP4177755B2 (ja) 発話特徴抽出システム
US7243060B2 (en) Single channel sound separation
US4864620A (en) Method for performing time-scale modification of speech information or speech signals
JP2004531767A5 (ja)
CN109785854A (zh) 一种经验模态分解和小波阈值去噪相结合的语音增强方法
JP4790319B2 (ja) 解決調波および未解決調波の統一処理方法
JPH0312319B2 (ja)
US20080027708A1 (en) Method and system for FFT-based companding for automatic speech recognition
JPH0237600B2 (ja)
JPH02278299A (ja) 音声信号処理方式
JP2863214B2 (ja) 雑音除去装置及び該装置を用いた音声認識装置
Muhsina et al. Signal enhancement of source separation techniques
JP3352144B2 (ja) 音声認識装置
JP2859634B2 (ja) 雑音除去装置
KR930008721A (ko) 음성인식 시스템의 특징추출방법
JPS59231599A (ja) 音声認識方法
JPH0461359B2 (ja)
JPS61228500A (ja) 音声認識方法
JPS61187000A (ja) 音声のピツチ周波数抽出装置
JPS6217800A (ja) 音声区間判定方式
JPS62159195A (ja) 音声パタン作成方法
JP3015477B2 (ja) 音声認識方法
JPS6229798B2 (ja)
JP2000250599A (ja) 音響特徴抽出方法及び装置
JPH04121794A (ja) 音声認識方法