JPH03274600A - 2値化パターン生成方式 - Google Patents

2値化パターン生成方式

Info

Publication number
JPH03274600A
JPH03274600A JP2076465A JP7646590A JPH03274600A JP H03274600 A JPH03274600 A JP H03274600A JP 2076465 A JP2076465 A JP 2076465A JP 7646590 A JP7646590 A JP 7646590A JP H03274600 A JPH03274600 A JP H03274600A
Authority
JP
Japan
Prior art keywords
points
minimum
value
spectrum
threshold value
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2076465A
Other languages
English (en)
Other versions
JP3027389B2 (ja
Inventor
Harutake Yasuda
安田 晴剛
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ricoh Co Ltd
Original Assignee
Ricoh Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ricoh Co Ltd filed Critical Ricoh Co Ltd
Priority to JP2076465A priority Critical patent/JP3027389B2/ja
Publication of JPH03274600A publication Critical patent/JPH03274600A/ja
Application granted granted Critical
Publication of JP3027389B2 publication Critical patent/JP3027389B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 技先立互 本発明は、2値化パターン生戊方式、より詳細には、音
声認識装置における特徴抽出方式に関する。
従」むL4 一般に、音声波のスペクトルを時間−周波数パターン(
Time −Spectrum −Pattern= 
T S P )で表わし、これを音声認識のための特徴
量とすることが行われているが、更に、このTSPを2
値化し、音声の特徴量を「0」、「1」の2値で表わす
Binay−TSP (BTSP)が提案されている。
而して、従来においては、2値化パターンをうるために
は、得られたある音声のスペクトルパターンの最小2乗
近似直線を求め、スペクトルパターンから差し引いて得
られる音声のローカルピークに基づいて2値化していた
(リコーテクニカルレポート1984 NQII参照)
。又、直線位相型C,1,Cフィルタを用いて同様の効
果をうる方式(音響学会講演論文集(s、59.10)
rディジタルフィルタを用いたBTSP方式のシュミレ
ーション」田中他電気学会論文誌C10g巻10号、昭
63参照)により提案されている。
しかしながら、最小2乗近似直線の演算処理はその処理
量が多くハードウェア量も大きくなる欠点があった。又
、直線位相C,1,Cフィルタは最小2乗近似直線演算
よりは演算処理が小さいが、最低数10回の加減算処理
が必要になる等の欠点があった。
且−一並 本発明は、上述のごとき従来技術の欠点に鑑みてなされ
たもので、簡易な演算で上記従来技術とほぼ同様の効果
を得ることを目的としてなされたものである。
璽−一」炙 本発明は、上記目的を達成するために、(1)入力され
た音声を増幅し、適正なレベル処理や不要な周波数成分
を取り除く処理を行う前処理部と、得られた音声信号を
周波数分析するバンドパスフィルタ群、各フィルタ群の
各々の信号を整流し高域成分を取り除くローパスフィル
タとより成りパワースペクトラムをうるスペクトル解析
部と、ある時間周期で入力したこれらのパワースペクト
ルを時系列信号に変換するマルチプレクサを有する音声
特徴抽出方式において、スペクトル包絡の極大点と隣り
合う極小点の値、又は両側の極小点の平均値との差を正
規化し、その値の第1の閾値以上を「1」とし、それ以
外の点をrQJとすることを特徴としたものであり、更
には、(2)周波数のチャンネルに対応した正規化係数
を有し、チャンネルによって異なる値の第1の閾値を有
すること、或いは、(3)極大点とその両側の隣り合う
極小点が隣り合う周波数チャンネルの場合、極大点を「
1」としないこと、或いは、(4)隣り合う極大点と極
小点の差が第2の閾値以下の場合は極大点の値を「1」
にしないこと、或いは、(5)スペクトル包絡の極小点
の隣り合う両側の周波数チャンネルが極大点の場合、極
小点の設定をとり消すこと、或いは、(6)周波数チャ
ンネルが高域周波数の場合は、上記処理を中止すること
を特徴したものである。以下1本発明の実施例に基いて
説明する。
前述のように、BTSP方式においては音声信号から得
られたパワースペクトラムを用いて2値化コードを生成
する。第5図は、TSPがらBTSPを得る一例を説明
するための図で、上記リコーテクニカルリポートに開示
されているように、上段のT S P (T ime 
−S pectrum −P attern)周波数軸
上に最小2乗近似直線(L east −S quar
e−Fit−Line=L、S、F、L、)を引いた後
、各ローカルピークを検出し、その近傍を「1」、他を
「0」として2値化パターンを生成する。しかし、最小
2乗近似直線の演算処理はその処理量が多い欠点がある
。又、その演算処理を軽減する方法として前述のように
、直線位相型C,I 、C,フィルタを用いて簡易化す
る方法があるが、この場合もフィルタ演算に多少の処理
量がある。
この様な背景から簡易な2値化パターンの生成処理方式
が望まれていた。本発明は、以上の点に鑑み簡易な方法
で比較的正確に2値化パターンを得ようとするものであ
る。
第2図は、ある時点での音声のタイムスペクトラムで、
このタイムスペクトラムは、第1図に示した構成の周波
数解析部3で生成される。すなわち第1図において、入
力された音声は前処理部2において増幅、整形され1周
波数解析部3においてエルNチャンネル(図示例ではN
=15)のバントパスフィルタ群で周波数解析され各チ
ャンネルごとに整流されローパスフィルタをとうしてパ
ワースペクトラムに変換され、これをマルチプレクサ4
で時系列変換してタイムスペクトラムを得る。
第2図においてX軸は周波数軸、Y軸はレベルである。
本発明においては、まず時系列化されたパワースペクト
ルの各ローカルピーク(極大点)Pl、P2.、、、、
とローカルミニマム(極小点)Ml、M2.、、、、を
求める。ここで生成される2値化コードについてまず極
大点Pnのチャンネルに対するビットは「1」とし極小
点Mnに対するピントは「O」とする。
次に、第2図においてPlは周波数軸上の第一の極大点
になり隣り合う極小点はMlのみである。
この場合、しきい(閾)値T1は以下の様に決定される
T1= (PL−Ml)XK (Kは正規係数0<K<1) この様にして得られたしきい値T1を用いPlを極大値
に持つローカルピーク部の範囲チャンネル1〜Mlの各
チャンネルの値を比較し、このT1より大なるチャンネ
ルは「1」、「0」とする。
次に同様に、第2図においてP2は両側に極小点M1と
M2を持つ、この場合のしきい値T2は(Kは正規係数
Q(K<1) となり、前記と同様にP2を極大点に持つローカルピー
クの範囲M1〜M2での各チャンネルの値を生成する。
この様にすることにより音声のスペクトルからそのロー
カルピーク近傍を「1」、その部分を「O」として2値
化パターンを生成可能である。
第1図は、これを実現するブロック図で、前述のように
してマルチプレクサ4より得られ時系列化されたパワー
スペクトラムをLog変換器10によりLog変換し、
ピーク検出器11、ミニマム検出器12においてローカ
ルピークとローカルミニマムを検出し、各々のメモリ1
3.14に記憶する。順序制御回路15においては得ら
れた各ピーク点と隣り合うミニマム点を順次読み出し差
分回路工6により差分を求め、正規化回路エフにより正
規化を行い、しきい値決定回路18でしきい値を決定し
て、原信号を遅延回路19で遅延したものと比較器20
で比較して2値化パターンを生成する。
而して、この様にして二値化パターンを得る方式におい
て、−殻内に低域チャンネルはパワースペクトルのエネ
ルギーレベルが大きく、高域チャンネルはレベルが小さ
い。従って、低域チャンネルと高域チャンネルの正規化
係数の値が同一であると、高域チャンネルの特徴量が出
にくくなる。
従って、高域チャンネルのしきい値は比較的低くなる様
、又、低域チャンネルは比較的高くなる様設定するため
、各周波チャンネル毎に予め、その正規化係数を可変す
る。つまり、周波数チャンネル毎にその閾値の値を異な
らしめる。
次に、第3図の場合について説明すると、この場合は小
さなピークP2があり、P2の周波数チャンネルが「1
」となる。しかしながら、この様な小ピークはそのチャ
ンネルの変動雑音により出る可能性もあり、その特徴パ
ターンとして「1」にする必要はない。従って、この様
な場合は、P2を「1」とせず、無視することにより生
成される2値パターンのノイズが減りパターンが安定す
る。逆に、第4図に示す様に極小点M1の両側の隣り合
うチャンネル(PL、P2)がローカルピークを有する
場合も同様にMlの極小点をrQJとしない。
次に上述の場合において極大点と極小点の差がある値(
H)より小なる場合も同様に変動雑音の可能性があり、
その場合も前記と同様にその極大点を無視する。
羞−一果 以上の説明から明らかなように1本発明によると、従来
、演算処理に時間を要していた又はハードウェア規模が
大きかったものが、簡易にしかも小規模で処理できる。
【図面の簡単な説明】
第1図は、本発明の一実施例を説明するための構成図、
第2図乃至第4図は、本発明の動作説明をするための図
、第5図は、TSPからBTSPを得るための動作原理
を説明するための図である。 1・・・マイク、2・・・前処理部、3・・・周波数解
析部、4・・・マルチプレクサ、5・・・A/D変換器
、10・・Log変換器、11・・・ピーク検出器、1
2・・・ミニマム検出器、13・ ピーク記憶メモリ、
14 ミニマム記憶メモリ、15・・・順序制御回路、
16・・・差分回路、↓7・・正規化回路、工8・・し
きい値決定回路、19・・遅延回路、20・・比較器。 第 1 図 第 図  34 67 89101112131415 01 001 001 00 第 図 0 5 ○ 100001 oooo。

Claims (1)

    【特許請求の範囲】
  1. 1、入力された音声を増幅し、適正なレベル処理や不要
    な周波数成分を取り除く処理を行う前処理部と、得られ
    た音声信号を周波数分析してパワースペクトラムをうる
    周波数解析部と、ある時間周期で入力したこれらのパワ
    ースペクトルを時系列信号に変換するマルチプレクサを
    有する音声特徴抽出方式において、スペクトル包絡の極
    大点と隣り合う極小点の値、又は両側の極小点の平均値
    との差を正規化し、その値の第1の閾値以上を「1」と
    し、それ以外の点を「0」とすることを特徴とする2値
    化パターン生成方式。
JP2076465A 1990-03-26 1990-03-26 2値化パターン生成方式 Expired - Fee Related JP3027389B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2076465A JP3027389B2 (ja) 1990-03-26 1990-03-26 2値化パターン生成方式

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2076465A JP3027389B2 (ja) 1990-03-26 1990-03-26 2値化パターン生成方式

Publications (2)

Publication Number Publication Date
JPH03274600A true JPH03274600A (ja) 1991-12-05
JP3027389B2 JP3027389B2 (ja) 2000-04-04

Family

ID=13605916

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2076465A Expired - Fee Related JP3027389B2 (ja) 1990-03-26 1990-03-26 2値化パターン生成方式

Country Status (1)

Country Link
JP (1) JP3027389B2 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2006082636A1 (ja) * 2005-02-02 2006-08-10 Fujitsu Limited 信号処理方法および信号処理装置

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2006082636A1 (ja) * 2005-02-02 2006-08-10 Fujitsu Limited 信号処理方法および信号処理装置

Also Published As

Publication number Publication date
JP3027389B2 (ja) 2000-04-04

Similar Documents

Publication Publication Date Title
US8073145B2 (en) Method and apparatus for separating sound-source signal and method and device for detecting pitch
KR100717058B1 (ko) 고주파 성분 복원 방법 및 그 장치
JP5507596B2 (ja) スピーチ増強
KR100930060B1 (ko) 신호 검출 방법, 장치 및 그 방법을 실행하는 프로그램이기록된 기록매체
CN107919134B (zh) 啸叫检测方法及装置和啸叫抑制方法及装置
CA2341834A1 (en) Apparatus and method for adaptive signal characterization and noise reduction in hearing aids and other audio devices
US4827519A (en) Voice recognition system using voice power patterns
CN113341378B (zh) 基于频谱差分熵检测的自适应信道化接收方法
US20060178881A1 (en) Method and apparatus for detecting voice region
JPH03274600A (ja) 2値化パターン生成方式
KR20090080777A (ko) 신호 검출 방법 및 장치
CN114724573A (zh) 一种啸叫抑制方法、装置、计算机可读存储介质以及系统
JP4655766B2 (ja) 信号検出方法及び信号検出装置
JP2932996B2 (ja) 高調波ピッチ検出装置
RU2436173C1 (ru) Способ обнаружения пауз в речевых сигналах и устройство его реализующее
JP4031587B2 (ja) 音圧レベルの測定方法及びその装置
JPH03253899A (ja) 音声区間検出方式
EP1269462B1 (en) Voice activity detection apparatus and method
JPH0573090A (ja) 音声認識方法
JPS6334477B2 (ja)
CN114781460A (zh) 面向与通信信号耦合的干扰信号检测与识别方法及装置
US20080279394A1 (en) Noise suppressing apparatus and method for noise suppression
JPH04251299A (ja) 音声区間検出方法
CN115602190A (zh) 一种基于主体滤波的伪造语音检测算法及系统
JPH05264517A (ja) 航空機構造部材の損傷監視方法および装置

Legal Events

Date Code Title Description
FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080128

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090128

Year of fee payment: 9

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100128

Year of fee payment: 10

LAPS Cancellation because of no payment of annual fees