JP3027389B2 - 2値化パターン生成方式 - Google Patents

2値化パターン生成方式

Info

Publication number
JP3027389B2
JP3027389B2 JP2076465A JP7646590A JP3027389B2 JP 3027389 B2 JP3027389 B2 JP 3027389B2 JP 2076465 A JP2076465 A JP 2076465A JP 7646590 A JP7646590 A JP 7646590A JP 3027389 B2 JP3027389 B2 JP 3027389B2
Authority
JP
Japan
Prior art keywords
value
threshold value
point
maximum
output
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2076465A
Other languages
English (en)
Other versions
JPH03274600A (ja
Inventor
晴剛 安田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ricoh Co Ltd
Original Assignee
Ricoh Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ricoh Co Ltd filed Critical Ricoh Co Ltd
Priority to JP2076465A priority Critical patent/JP3027389B2/ja
Publication of JPH03274600A publication Critical patent/JPH03274600A/ja
Application granted granted Critical
Publication of JP3027389B2 publication Critical patent/JP3027389B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Description

【発明の詳細な説明】 技術分野 本発明は、2値化パターン生成方式、より詳細には、
音声認識装置における特徴抽出方式に関する。
従来技術 一般に、音声波のスペクトルを時間−周波数パターン
(Time−Spectrum−Pattern=TSP)で表わし、これを音
声認識のための特徴量とすることが行われているが、更
に、このTSPを2値化し、音声の特徴量を「0」、
「1」の2値で表わすBinay−TSP(BTSP)が提案されて
いる。而して、従来においては、2値化パターンをうる
ためには、得られたある音声のスペクトルパターンの最
小二乗近似直線を求め、スペクトルパターンから差し引
いて得られる音声のローカルピークに基づいて2値化し
ていた(リコー テクニカルレポート1984No.11参
照)。又、直線位相型C.I.Cフィルタを用いて同様の効
果をうる方式(音響学会講演論文集(s.59.10)「ディ
ジタルフィルタを用いたBTSP方式のシュミレーション」
田中 他 電気学会論文誌C108巻10号、昭63参照)によ
り提案されている。
しかしながら、最小二乗近似直線の演算処理はその処
理量が多くハードウエア量も大きくなる欠点があった。
又、直線位相C.I.C.フィルタは最小二乗近似直線演算よ
りは演算処理が小さいが、最低数10回の加減算処理が必
要になる等の欠点があった。
目的 本発明は、上述のごとき従来技術の欠点に鑑みてなさ
れたもので、簡易な演算で上記従来技術とほぼ同様の効
果を得ることを目的としてなされたものである。
構成 本発明は、上記目的を達成するために、 (1)請求項1の発明は、入力された音声を増幅し、適
正なレベル処理や不要な周波数成分を取り除く処理を行
う前処理部と、得られた音声信号を周波数分析するバン
ドパスフィルタ群、各フィルタ群の各々の信号を整流し
高域成分を取り除くローパスフィルタとより成りパワー
スペクトラムをうるスペクトル解析部と、ある時間周期
で入力したこれらのパワースペクトルを時系列信号に変
換するマルチプレクサを有する音声特徴抽出方式におい
て、前記マルチプレクサから出力される時系列化された
パワースペクトルの極大点と極小点とを検出する極値検
出回路と、前記極値検出回路で検出されたスペクトル包
絡の極大点と隣り合う極小点の差又は極大点とその両側
の極小点の平均値の差と正規化係数とから第1の閾値を
決定する閾値決定回路と、該閾値決定回路で決定された
第1の閾値と前記マルチプレクサから出力される時系列
化されたパワースペクトル値とを比較する比較回路とを
備え、前記比較回路はそのパワースペクトル値が第1の
閾値以上のとき「1」を、それ以外の値のとき「0」を
出力することを特徴としたものである。
(2)請求項2の発明は、前記閾値決定回路は、周波数
のチャンネルに対応した正規化係数を有し、チャンネル
によって異なる値の第1の閾値として決定することを特
徴としたものである。
(3)請求項3の発明は、前記極値検出回路で検出され
た極大点とその両側の隣り合う極小点が隣り合う周波数
チャンネルの場合、この極大点における前記比較回路か
らの出力値を「1」にしないことを特徴としたものであ
る。
(4)請求項4の発明は、前記極値検出回路で検出され
た隣り合う極大点と極小点の差が第2の閾値以下の場
合、この極大点における前記比較回路の出力値を「1」
にしないことを特徴としたものである。
(5)請求項5の発明は、前記極値検出回路で検出され
たスペクトル包絡の極小点の隣り合う両側の周波数チャ
ンネルが極大点の場合、この極小点における前記比較回
路の出力値を「0」にしないことを特徴としたものであ
る。
(6)請求項6の発明は、請求項3乃至請求項5のいず
れか一つに記載の2値化パターン生成方式の前記比較回
路において、周波数チャンネルが高域周波数の場合は、
上記処理を中止することを特徴としたものである。以
下、本発明の実施例に基いて説明する。
前述のように、BTSP方式においては音声信号から得ら
れたパワースペクトラムを用いて2値化コードを生成す
る。第5図は、TSPからBTSPを得る一例を説明するため
の図で、上記リコーテクニカルリポートに開示されてい
るように、上段のTSP(Time−Spectrum−Pattern)周波
数軸上に最小二乗近似直線(Least−Square−Fit−Line
=L.S.F.L.)を引いた後、各ローカルピークを検出し、
その近傍を「1」、他を「0」として2値化パターンを
生成する。しかし、最小二乗近似直線の演算処理はその
処理量が多い欠点がある。又、その演算処理を軽減する
方法として前述のように、直線位相型C.I.C.フィルタを
用いて簡易化する方法があるが、この場合もフィルタ演
算に多少の処理量がある。
この様な背景から簡易な2値化パターンの生成処理方
式が望まれていた。本発明は、以上の点に鑑み容易な方
法で比較的正確に2値化パターンを得ようとするもので
ある。
第2図は、ある時点での音声のタイムスペクトラム
で、このタイムスペクトラムは、第1図に示した構成の
周波数解析部3で生成される。すなわち第1図におい
て、入力された音声は前処理部2において増幅、整形さ
れ、周波数解析部3において1〜Nチャンネル(図示例
ではN=15)のバンドパスフィルタ群で周波数解析され
各チャンネルごとに整流されローパスフィルタをとうし
てパワースペクトラムに変換され、これをマルチプレク
サ4で時系列変換してタイムスペクトラムを得る。
第2図においてX軸は周波数軸、Y軸はレベルであ
る。本発明においては、まず時系列されたパワースペク
トラムの各ローカルピーク(極大点)P1,P2,……とロー
カルミニマム(極小点)M1,M2,……を求める。ここで生
成される2値化コードについてまず極大点Pnのチャンネ
ルに対するビットは「1」とし極小点Mnに対するビット
は「0」とする。
次に、第2図においてP1は周波数軸上の第一の極大点
になり隣り合う極小点はM1のみである。この場合、しき
い(閾)値T1は以下の様に決定される。
T1=(P1−M1)×K (Kは正規係数0<K<1) この様にして得られたしきい値T1を用いP1を極大値に
持つローカルピーク部の範囲チャンネル1〜M1の各チャ
ンネルの値を比較し、このT1より大なるチャンネルは
「1」、「0」とする。
次に同様に、第2図においてP2は両側に極小点M1とM2
を持つ、この場合のしきい値T2は (Kは正規係数0<K<1) となり、前記と同様にP2を極大点に持つローカルピーク
の範囲M1〜M2での各チャンネルの値を生成する。この様
にすることにより音声のスペクトルからそのローカルピ
ーク近傍を「1」、その部分を「0」として2値化パタ
ーンを生成可能である。
第1図は、これを実現するブロック図で、前述のよう
にしてマルチプレクサ4より得られ時系列化されたパワ
ースペクトラムをLog変換器10によりLog変換し、ピーク
検出器11、ミニマム検出器12においてローカルピークと
ローカルミニマムを検出し、各々のメモリ13,14に記憶
する。順序制御回路15においては得られた各ピーク点と
隣り合うミニマム点を順次読み出し差分回路16により差
分を求め、正規化回路17において正規化係数を用いて正
規化を行い、しきい値決定回路18でしきい値を決定し
て、原信号を遅延回路19で遅延したものと比較器20で比
較して2値化パターンを生成する。
而して、この様にして二値化パターンを得る方式にお
いて、一般的に低域チャンネルはパワースペクトルのエ
ネルギーレベルが大きく、高域チャンネルはレベルが小
さい。従って、低域チャンネルと高域チャンネルの正規
化係数の値が同一であると、高域チャンネルの特徴量が
出にくくなる。従って、高域チャンネルのしきい値は比
較的低くなる様、又、低域チャンネルは比較的高くなる
様設定するため、各周波チャンネル毎に予め、その正規
化係数を可変する。つまり、周波数チャンネル毎にその
閾値の値を異ならしめる。
次に、第3図の場合について説明すると、この場合は
小さなピークP2があり、P2の周波数チャンネルが「1」
となる。しかしながら、この様な小ピークはそのチャン
ネルの変動雑音により出る可能性もあり、その特徴パタ
ーンとして「1」にする必要はない。従って、この様な
場合は、P2を「1」とせず、無視することにより生成さ
れる2値パターンのノイズが減りパターンが安定する。
逆に、第4図に示す様に極小点M1の両側の隣り合うチャ
ンネル(P1,P2)がローカルピークを有する場合も同様
にM1の極小点を「0」としない。
次に上述の場合において極大点と極小点の差がある値
(H)より小なる場合も同様に変動雑音の可能性があ
り、その場合も前記と同様にその極大点を無視する。
効果 以上の説明から明らかなように、本発明によると、従
来、演算処理に時間を要していた又はハードウエア規模
が大きかったものが、簡易にしかも小規模で処理でき
る。
【図面の簡単な説明】
第1図は、本発明の一実施例を説明するための構成図、
第2図乃至第4図は、本発明の動作説明をするための
図、第5図は、TSPからBTSPを得るための動作原理を説
明するための図である。 1……マイク、2……前処理部、3……周波数解析部、
4……マルチプレクサ、5……A/D変換器、10……Log変
換器、11……ピーク検出器、12……ミニマム検出器、13
……ピーク記憶メモリ、14……ミニマム記憶メモリ、15
……順序制御回路、16……差分回路、17……正規化回
路、18……しきい値決定回路、19……遅延回路、20……
比較器。
フロントページの続き (58)調査した分野(Int.Cl.7,DB名) G10L 15/02 G10L 11/00 G10L 101:02

Claims (6)

    (57)【特許請求の範囲】
  1. 【請求項1】入力された音声を増幅し、適正なレベル処
    理や不要な周波数成分を取り除く処理を行う前処理部
    と、得られた音声信号を周波数分析するバンドパスフィ
    ルタ群、各フィルタ群の各々の信号を整流し高域成分を
    取り除くローパスフィルタとより成りパワースペクトラ
    ムをうるスペクトル解析部と、ある時間周期で入力した
    これらのパワースペクトルを時系列信号に変換するマル
    チプレクサを有する音声特徴抽出方式において、前記マ
    ルチプレクサから出力される時系列化されたパワースペ
    クトルの極大点と極小点とを検出する極値検出回路と、
    前記極値検出回路で検出されたスペクトル包絡の極大点
    と隣り合う極小点の差又は極大点とその両側の極小点の
    平均値の差と正規化係数とから第1の閾値を決定する閾
    値決定回路と、該閾値決定回路で決定された第1の閾値
    と前記マルチプレクサから出力される時系列化されたパ
    ワースペクトル値とを比較する比較回路とを備え、前記
    比較回路はそのパワースペクトル値が第1の閾値以上の
    とき「1」を、それ以外の値のとき「0」を出力するこ
    とを特徴とする2値化パターン生成方式。
  2. 【請求項2】前記閾値決定回路は、周波数のチャンネル
    に対応した正規化係数を有し、チャンネルによって異な
    る値の第1の閾値として決定することを特徴とする請求
    項1記載の2値化パターン生成方式。
  3. 【請求項3】前記極値検出回路で検出された極大点とそ
    の両側の隣り合う極小点が隣り合う周波数チャンネルの
    場合、この極大点における前記比較回路からの出力値を
    「1」にしないことを特徴とする請求項1記載の2値化
    パターン生成方式。
  4. 【請求項4】前記極値検出回路で検出された隣り合う極
    大点と極小点の差が第2の閾値以下の場合、この極大点
    における前記比較回路の出力値を「1」にしないことを
    特徴とする請求項1記載の2値化パターン生成方式。
  5. 【請求項5】前記極値検出回路で検出されたスペクトル
    包絡の極小点の隣り合う両側の周波数チャンネルが極大
    点の場合、この極小点における前記比較回路の出力値を
    「0」にしないことを特徴とする請求項1記載の2値化
    パターン生成方式。
  6. 【請求項6】請求項3乃至請求項5のいずれか一つに記
    載の2値化パターン生成方式の前記比較回路において、
    周波数チャンネルが高域周波数の場合は、上記処理を中
    止することを特徴とする2値化パターン生成方式。
JP2076465A 1990-03-26 1990-03-26 2値化パターン生成方式 Expired - Fee Related JP3027389B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2076465A JP3027389B2 (ja) 1990-03-26 1990-03-26 2値化パターン生成方式

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2076465A JP3027389B2 (ja) 1990-03-26 1990-03-26 2値化パターン生成方式

Publications (2)

Publication Number Publication Date
JPH03274600A JPH03274600A (ja) 1991-12-05
JP3027389B2 true JP3027389B2 (ja) 2000-04-04

Family

ID=13605916

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2076465A Expired - Fee Related JP3027389B2 (ja) 1990-03-26 1990-03-26 2値化パターン生成方式

Country Status (1)

Country Link
JP (1) JP3027389B2 (ja)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP1845520A4 (en) * 2005-02-02 2011-08-10 Fujitsu Ltd SIGNAL PROCESSING METHOD AND SIGNAL PROCESSING DEVICE

Also Published As

Publication number Publication date
JPH03274600A (ja) 1991-12-05

Similar Documents

Publication Publication Date Title
US20120103166A1 (en) Signal Processing Device, Signal Processing Method, and Program
CN107919134B (zh) 啸叫检测方法及装置和啸叫抑制方法及装置
JP2010539792A (ja) スピーチ増強
US7860708B2 (en) Apparatus and method for extracting pitch information from speech signal
US20230300529A1 (en) Divisive normalization method, device, audio feature extractor and a chip
US20150071463A1 (en) Method and apparatus for filtering an audio signal
US20070011001A1 (en) Apparatus for predicting the spectral information of voice signals and a method therefor
US20060178881A1 (en) Method and apparatus for detecting voice region
JP3027389B2 (ja) 2値化パターン生成方式
CN113707168A (zh) 一种语音增强方法、装置、设备及存储介质
US8204255B2 (en) Method of distortion-free signal compression
JP4655766B2 (ja) 信号検出方法及び信号検出装置
JP2932996B2 (ja) 高調波ピッチ検出装置
JP2000315094A (ja) 広帯域音響検出方法および装置およびこのプログラム記録媒体
JP2992324B2 (ja) 音声区間検出方法
RU2436173C1 (ru) Способ обнаружения пауз в речевых сигналах и устройство его реализующее
CN114125658A (zh) 动态范围控制电路、音频处理芯片及其音频处理方法
JP3118023B2 (ja) 音声区間検出方式及び音声認識装置
JP4031587B2 (ja) 音圧レベルの測定方法及びその装置
JP2989219B2 (ja) 音声区間検出方式
KR0176751B1 (ko) 음성인식 시스템의 특징추출방법
JP2681956B2 (ja) デジタル信号処理装置用のエンベロープ検出方法
JP2681957B2 (ja) デジタル信号処理装置
JPH0573090A (ja) 音声認識方法
JPH03253899A (ja) 音声区間検出方式

Legal Events

Date Code Title Description
FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080128

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090128

Year of fee payment: 9

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100128

Year of fee payment: 10

LAPS Cancellation because of no payment of annual fees