JPS5918999A - 音声信号の特徴抽出装置 - Google Patents

音声信号の特徴抽出装置

Info

Publication number
JPS5918999A
JPS5918999A JP12826282A JP12826282A JPS5918999A JP S5918999 A JPS5918999 A JP S5918999A JP 12826282 A JP12826282 A JP 12826282A JP 12826282 A JP12826282 A JP 12826282A JP S5918999 A JPS5918999 A JP S5918999A
Authority
JP
Japan
Prior art keywords
input
feature extraction
column
threshold
output
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP12826282A
Other languages
English (en)
Other versions
JPH0320760B2 (ja
Inventor
木村 正行
俊朗 江島
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Panasonic Holdings Corp
Original Assignee
Matsushita Electric Industrial Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Matsushita Electric Industrial Co Ltd filed Critical Matsushita Electric Industrial Co Ltd
Priority to JP12826282A priority Critical patent/JPS5918999A/ja
Publication of JPS5918999A publication Critical patent/JPS5918999A/ja
Publication of JPH0320760B2 publication Critical patent/JPH0320760B2/ja
Granted legal-status Critical Current

Links

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 本発明は入力音声信号より音声認識を行うだめの特徴を
抽出する特徴抽出装置に関する。
従来、音声の認識を行う場合に、音声信号の特徴パラメ
ータを抽出し、あらかじめ求めておいだ標準パターンの
特徴パラメータと比較し、最も一致する標準パターンを
認識結果とする方法が一般に用いられている。特徴パラ
メータとしては、線形予測係数、パーコール係数、相関
係数、キャブストラム係数、フォルマント周波数などが
用いられるが、入力音声信号からこれらの特徴パラメー
タを抽出するには非常に複雑な装置が必要であった。
ところで、近年、生体の情報処理機能が注目を集め、そ
の応用および工学的応用が盛んである。
その中で、聴覚神経系などにみられる並列情報処理機能
は工学的にも有用な機能の一つである。音声は禍牛の中
の基底膜で周波数分析され、有毛細胞によりパルス時系
列に変換される。聴覚神経系はこのように並列に入力さ
れるパルス時系列をう1く処理することによって音声の
認識を行っている。
本発明は以上の点に鑑み、生体の情報処理機能を工学的
にモデル化した一様構造の神経回路網を特徴抽出回路網
として用い、集積回路化の容易な音声信号の特徴抽出装
置を提供することを目的とする。
以下、本発明の実施例について説明するが、その前に本
発明において用いる4$徴抽出回路網について説明する
第1図に本発明において用いる特徴抽出回路網の説明図
を示す。図において、1は前処理部、2欠この前処理部
1を構成する記憶素子で、M +1段、2に+1列、配
設され、rOJ 、rIJの時系列パルスが入力として
初段(第0段)の記憶素子2に並列に加えられる。記憶
素子2はその記憶内容をクロックに同期して次段の記憶
素子2にシフトする。3は処理部、4はこの処理部3を
構成する閾値素子で、N−M段、2に+1列、配設され
、各閾値素子4は同一の閾値を有しており、入力信号が
所定の閾値以上のとき「1」、未満のときrOJの値を
出力する。各閾値素子4は、各閾値素子4の占める位置
の7段前から1段前でかつH列左からH列右までの領域
に位置する記憶素子2捷だは閾値素子4と、所定の重み
係数でそれぞれ接続され、結合された記憶素子2または
閾値素子4の各出力に前記重み係数を乗じた信号が入力
される。以上のような構成を有する前処理部1および処
理部3により特徴抽出回路網が構成されている。
前処理部1において、第p段、第q列(0<、pくM、
−にくq<:K)  の時刻tでの記憶素子2の出力0
1(p、q)は第1式で力えられる。
01(p、q)=Ot−i(p−1,q)−・・・・・
−<1)なお時刻tでの第0段の出力は時刻t−1にお
ける入力である。
処理部3において、第p段、第q列(M+1くp<N 
、 −K<q<、K )の時刻tでの閾値素子4の出力
0t(p 、q)は第2式で与えられる。
0((p 、q)=ICf(C(p 、q) 、R(p
 、q) 、L(p 、q) ) −h)・・・・・・
・・・・・・(2) ここで またhは正の定数で閾値素子−の閾値であシ、C(p、
q)、 R(p+  q)、L(p、q)はそれぞれ第
1図に5.6.7で示された領域に位置する記憶素子2
まだは閾値素子4の出力の和である。すなわち処理部3
の各閾値素子4の出力は当該閾値素子4の近傍(上近傍
、左上近傍、右上近傍)の記憶素子2または閾値素子4
の出力によって決まシ、しかもその出力の決め方はどの
閾値素子4においても同じであシ、この意味から本特徴
抽出回路網は一様構造を有している。
第2式における関数f (C(p、 q)、 R(p、
q)。
L(p、q))(以下、f(C,R,L)と記す)とし
ては、例えば以下に示すような6つの型がある。
(1)型 f(C,R,L)=C+λ(R−1−L )(11)型 f(C,R,L)=C−λ(R+ L )(用ン型 f(C,R,L)−、C−λ (R−L)OV)型 f(C,R,L)=C−λ IR−L  1(v)型 f(C,R,L)=C+λIR−L lなおλは重み係
数であり、正の定数である。
以下、前記5つの関数型を有する特命抽出回路網の特性
について説明する。
第2図は特徴抽出回路網の前処理部1の初段各列に加え
られる時系刈入カバターンを示している。
図において、til、l:時間軸であり、θは入カバタ
ーンが「1」となっている幅を示している。
第2図に示された入カバターンを(1)型の特徴抽出回
路網に加えた場合について説明する。
入力として「1」の系列が入力される列を91、この列
q1  を中心に幅2H+1の中に入る列の中で入力と
して「1」の系列が入力される列の個数をa (>1)
とする。このとき列q1 の素子の出力が「0」になら
ない条件は ○t(p、ql)=ICf(C(p、ql) 、R(p
、ql) 、L (p 、 ql))−h)1 である。すなわち、 f (C(p 、ql ) 、R(p 、ql ) 、
L(p 、ql )) −h=C(p 、ql )→−
λ(R(p、ql )+L(p、ql ))−h−■+
λ(a 1−1 ) V −h )O・・・・・・・・
・・・・・・・(3)である。h=h、Δとおくと、第
3式は1  〜 a、〉7(h−1)+1  ・=・−・−・・−(4)
となる。
次に、入力として「0」の系列が入力される列をqo 
、この列q0を中心に幅2H+1の中に入る列の中で入
力として「1」の系列が入力される列の個数をa。(〉
Q)とする。このとき列q。の素子の出力が「1」にな
らない条件は、01(p 、q□)=ICf(C(p 
、q(1) 、R(p 、q。) 、L(p 、q(1
)) −h〕=0 である。すなわち、 f(C(p 、qQ) 、R(p 、q(1) 、L(
p 、q□) ) −h=C(p、q。)+λ(R(p
、qo)+L(p、q。))−h−λao V −h 
<o    ・・・・・・・・・・・・・・・・・・・
・・・・・(6)である。h=h/′Vなので第5式は
、a o < 、! h  ・・・・・・・・・・・・
・・・・・・・・(6)となる。
第2図に示す入カバターンにより「1」が入力される素
子の列の中でal が最も小さくなるのは「1」が並ん
でいる列の両端の列であシ、その個数をm i n (
θ、H)とすると、第4式よりm1n(θ、H))T(
h−1)+1 =・・−・、−−−−・(7)が満足さ
れれば、「1」が入力される列の素子の出力は常に「1
」となる。同様に入力として「O」が入力される列の中
でa。が最大となる列は「1」が入力される列に隣接す
る列であり、その個数をm i n (θ、H)とする
と、第6式よりm i n (θ、H)く寺■ ・・・
・・・・・・・・・・・・・・・・・・・・・(8)が
満足されれば、「O」が入力される列の素子の出力は常
に「0」となる。
第3図は、第7式、第8式をパラメータ空間(θ、h)
J二に表示したもので、斜線部分8は、入カバターンが
特徴抽出回路網を通過してもその入カバターンが変形し
ない平衡状態の領域を示している。この平衡状態以外の
領域9においては、同図に図式的に示したように入カバ
ターンは変形する。例えば、■とじてh7の値を選んだ
ときにii、入カバターンの「1」の・くターンの幅θ
がθ7より小さいと特徴抽出回路網は「1」を出力しな
い、一方、θ 以上であれば入カバターンは平衡状態と
なり、入カバターンはその−1:外出力され2る。
(11)型〜(■)型の特徴抽出回路網についての同様
の特性をそれぞれ第4図〜第7図に示す。
次に第8図に示すような入力頻度分布を有する入カバタ
ーンを乱数を用いて作り、(1)型〜(■)型の特徴抽
出回路網に加えたときの出力頻度分布をそれぞれ第9図
〜第13図に示す。
(1)型の場合、第9図に示すように入力頻度の高い列
の集っている部分では「1」が常に出力されるが、入力
頻度の高い列でもその近傍の入力頻度が低い列では1は
出力されない。すなわち入力頻度の高い列が集っている
部分を抽出する。
(ii)型の場合、第1Q図に示す」こうに入カバター
ンの頻度分布において近傍との頻度差が大きい列では「
1」の値が出力される確率が高くなる。すなわち頻度差
の大きい部分を抽出する。
h)型の場合、第12図に示すようにガ1度の高い列の
中でその中央の列に「1」の値が出力される僅率が高く
なる。すなわち入力頻度の高い列が集っている部分の中
央部分を抽出する。
以−1・、前記した特性を有する特徴抽出回路網を用い
た音声信号の特徴抽出装置の一実施例について説明する
第14図は本発明における一実施例の特徴抽出装置のブ
ロック図である。
図において、10は音声信号が加えられる入力端子、1
1はそれぞれ100 Hzづつ異なる中心周波数を有す
る帯域幅200 Hzの帯域フィルタで、45個、並列
に並べることによりフィルタバンクを構成している。1
2は各帯域フィルタ11に接続され/ζ整流回路、13
は各整流回路12に接続された平滑回路で、帯域フィル
タ11の各出力化けをその出力値に応じた直流レベル信
号に変換する。14はパルス密度変調回路で、Iu流ワ
レベル信号レベルに比例しだパルス密度信号げ0」。
「1」からなるパルス系列)に変換する。16は特徴抽
出回路で、前処理部の初段の各列にパルス密度変調回路
14の各出力が加えられる。
以上のように構成される音声信−号の!1.′l′徴抽
出装置の入力端子10に、いま音声枯骨と゛して例えば
r KA Jと発声した信号を加える。第15図は、こ
の入力端子1oに加えられた);?声信)じが帯域フィ
ルタ11.整流回路12.平滑回路13およびパルス密
度変調回路14により処理されて特徴抽出回路網16に
加えられる入カバターンを示している。
特徴抽出回路網16として、前記した(1)型、 (i
i)型、0■)型の関数型を有する特徴抽出回路網15
を用いた場合の出力をそれぞれ第16図、第17図。
第18図に示す。
(i)型の場合、頻度の高い部分、すなわちrKJの破
裂部分および母音区間のパ1ノーの大きな周波数成分の
部分のみ高い頻度で「1」の値が出力される。
(11)型の場合、まわりとの頻度差が大きな列の部分
に高い頻度で「1」の値が出力される。この部分はいわ
ゆるフォルマントと呼ばれる部分に対応しており、この
(11)型の場合、音71+J信号のフォルマントの位
置を抽出することができる。
(1v)型の場合、(11)型と類似した出力となって
おり、フォルマントに対応する部分を抽出する。
以下、第2の実施例について説明する。
第1の実施例の特徴抽出回、蕗網、における前処理部は
、0段の記憶素子の各列毎に入力された信号を同列の次
段の記憶素子にシフトするように構成している。この前
処理部を本実施例においては第19図に示すように列方
向とφの角度を有する方向にシフトするように構成する
。このように構成することにより、入カバターンとして
は元のパターンに対しφの角度だけ傾いたものが入力さ
れたことと等化になる。
従って、第15図に示したような入カバターンについて
考えると、時間軸に対しφの角度だけ傾いたものが処理
部に入力されることになり、適当なφの値に応じた前処
理部を構成することにより、フォルマント周波数の変化
する部分を検出することができる。
特徴抽出回路網として、φの各種の値に対する複数の特
徴抽出回路網を設け、これらの特徴抽出回路網に対し並
列に入力信号を加えるようにすれば、各種のフォルマン
ト周波数の変化パターンを抽出することができる。
以上のように本発明は一様構造の特徴抽出回路網を用い
音声信号の特徴を抽出するように構成したので、容易に
集積回路化することができる。寸だ本発明の特徴抽出装
置は実時間で音声信号の特徴を抽出することができる。
【図面の簡単な説明】
第1図は本発明の特徴抽出装置において用いる特徴抽出
回路網の説明図、第2図は同特徴抽出回路網に加える入
カバターンを示す図、第3図〜第7図は各種の特徴抽出
回路網の特性図、第8図は特徴抽出回路網に加える時間
的に非定常な入カバターンを示す図、第9図〜第13図
は第8図に示した入カバターンを加えた場合の各種の!
1’、5徴抽出回路網の特性図、第14図は本発明にお
ける一実施例の音声信号の特徴抽出装置のブロック図、
第16図は同実施例における「KA」と発声しだ場合の
特徴抽出回路網の入カバターンを示す図、第16図〜第
18図は同実施例における特徴抽出回路網の出カバター
ンを示す図、第19図は他の実施例における前処理部の
構成を示す図である。 1・・・・・・前処理部、2・・・・・・記憶素子、3
・・・・・・処理部、4・・・・・・閾値素子、11・
・・・・・帯域フィルタ、14・・・・・・パルス密度
変調回路、15・・・・・・特徴抽出回路網。 特許出願人 木 村 正 行 ほか1名第1図 べ力 出刃 第2図 第3図 第4図 第6図 第7図 第8図 第11図 第14図 556 第15図 第17図 Q I″i引 第19図 0.○δδ凌8剣壮めか10M陵 =557

Claims (1)

  1. 【特許請求の範囲】 入力音声信号を所定の周波数帯域毎の信号に分割する音
    声信号分割手段と、分割された各音声信号をその信号値
    に応じた密度のパルス信号に変換するパルス密度変調手
    段と、記憶素子がM+1段。 2に+1列に配設され前記パルス密度変調手段の出力が
    初段の記憶素子に加えられる前処理部および同−閾値を
    有する閾値素子が前記前処理部に縦属してN−M段、2
    に+1列に配設された処理部よりなる特徴抽出回路網と
    を有し、前記前処理部は各記憶素子の記憶内容をクロッ
    クに同期して次段の記憶素子にシフトするように構成し
    7、前記処理部は、各閾値素子が各閾値素子の占める位
    置の7段前から1段前でかつH列左からH列右までの領
    域に位置する記憶素子または閾値素子と所定の重み係数
    でそれぞれ接続され、各閾値素子には当該閾値素子に結
    合された記憶素子まだは閾値素子の各出力に前記重み係
    数を乗じた信号が入力されるように構成したことを特徴
    とする音声信号の特徴抽出装置。
JP12826282A 1982-07-22 1982-07-22 音声信号の特徴抽出装置 Granted JPS5918999A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP12826282A JPS5918999A (ja) 1982-07-22 1982-07-22 音声信号の特徴抽出装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP12826282A JPS5918999A (ja) 1982-07-22 1982-07-22 音声信号の特徴抽出装置

Publications (2)

Publication Number Publication Date
JPS5918999A true JPS5918999A (ja) 1984-01-31
JPH0320760B2 JPH0320760B2 (ja) 1991-03-20

Family

ID=14980492

Family Applications (1)

Application Number Title Priority Date Filing Date
JP12826282A Granted JPS5918999A (ja) 1982-07-22 1982-07-22 音声信号の特徴抽出装置

Country Status (1)

Country Link
JP (1) JPS5918999A (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS6371193A (ja) * 1986-09-16 1988-03-31 Japan Organo Co Ltd ぶどう糖液あるいは水飴の精製方法
JPS63259695A (ja) * 1987-04-03 1988-10-26 アメリカン テレフォン アンド テレグラフ カムパニー 知覚分析方法

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS6371193A (ja) * 1986-09-16 1988-03-31 Japan Organo Co Ltd ぶどう糖液あるいは水飴の精製方法
JPH0636749B2 (ja) * 1986-09-16 1994-05-18 オルガノ株式会社 ぶどう糖液あるいは水飴の精製方法
JPS63259695A (ja) * 1987-04-03 1988-10-26 アメリカン テレフォン アンド テレグラフ カムパニー 知覚分析方法

Also Published As

Publication number Publication date
JPH0320760B2 (ja) 1991-03-20

Similar Documents

Publication Publication Date Title
KR101844932B1 (ko) 신호처리 알고리즘이 통합된 심층 신경망 기반의 음성인식 장치 및 이의 학습방법
Seneff A computational model for the peripheral auditory system: Application of speech recognition research
Nakkiran et al. Compressing deep neural networks using a rank-constrained topology.
US4536844A (en) Method and apparatus for simulating aural response information
CN110353702A (zh) 一种基于浅层卷积神经网络的情感识别方法及系统
CN107845389A (zh) 一种基于多分辨率听觉倒谱系数和深度卷积神经网络的语音增强方法
US20180197529A1 (en) Methods and systems for extracting auditory features with neural networks
CN110037683A (zh) 用于识别心律类型的改进卷积神经网络及其训练方法
Katthi et al. Deep canonical correlation analysis for decoding the auditory brain
CN103168479B (zh) 振鸣抑制装置、助听器、振鸣抑制方法和集成电路
CN106923825B (zh) 基于频域及相空间的脑电放松度识别方法及装置
Firmansyah et al. Comparison of windowing function on feature extraction using MFCC for speaker identification
Ariff et al. Study of adam and adamax optimizers on alexnet architecture for voice biometric authentication system
JPS5918999A (ja) 音声信号の特徴抽出装置
Van Doremalen et al. Spoken digit recognition using a hierarchical temporal memory.
Mueller et al. A machine for neural computation of acoustical patterns with application to real time speech recognition
Reyes-Gomez et al. Towards single-channel unsupervised source separation of speech mixtures: The layered harmonics/formants separation-tracking model
JP2736361B2 (ja) ニューラルネット構成方法
CN111816186A (zh) 一种声纹识别的特征参数提取系统及方法
Hyun et al. Optimization of mel-cepstrum for speech recognition
Ambikairajah et al. Neural networks for speech recognition
Alkhairy Characteristics-Based Design of Multi-Exponent Bandpass Filters
CN117520925B (zh) 基于脑电信号的个性化人机交互方法、装置、设备及介质
JPS6152478B2 (ja)
Bellur et al. Speech processing using adaptive auditory receptive fields