JP3174777B2 - 信号処理方法および装置 - Google Patents

信号処理方法および装置

Info

Publication number
JP3174777B2
JP3174777B2 JP2000015517A JP2000015517A JP3174777B2 JP 3174777 B2 JP3174777 B2 JP 3174777B2 JP 2000015517 A JP2000015517 A JP 2000015517A JP 2000015517 A JP2000015517 A JP 2000015517A JP 3174777 B2 JP3174777 B2 JP 3174777B2
Authority
JP
Japan
Prior art keywords
auditory
image
wavelet
signal
time interval
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2000015517A
Other languages
English (en)
Other versions
JP2000285104A (ja
Inventor
俊夫 入野
ロイ・ディ・パターソン
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Medical Research Council
Original Assignee
Medical Research Council
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Medical Research Council filed Critical Medical Research Council
Priority to JP2000015517A priority Critical patent/JP3174777B2/ja
Publication of JP2000285104A publication Critical patent/JP2000285104A/ja
Application granted granted Critical
Publication of JP3174777B2 publication Critical patent/JP3174777B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】この発明は、従来、自己回帰
モデル等の統計的手法やフーリエ変換によって行なわれ
てきた、時系列データの解析の改良に関する。本発明は
たとえば、楽音認識、音声による個人認識、音声認識、
建築音響の分析、ならびに音声または音楽の信号分析、
符号化、信号分離、および信号強調処理に応用できる。
本発明は、また音響信号等に限らず、機械音および地震
波等の機械的振動の解析、脳波、心臓拍動音、超音波エ
コー、および神経細胞信号等の生体信号解析、ならびに
一般的な時系列データを収集するためのセンサー信号の
解析等にも広範囲に応用される。
【0002】
【従来の技術】従来より、信号処理一般の情報処理の基
本として行なわれてきたのは、スペクトログラムつまり
「時間−周波数表現」を求めることであった。高速ディ
ジタル変換(たとえば高速フーリエ変換)を使っても、
線形予測分析を使っても、求めるものは、ある一時点で
の周波数表現としてのスペクトルに直接的に対応するベ
クトルであり、これを時系列で持つことにより、スペク
トログラムに相当する表現を用いていることになる。こ
れら表現は、フーリエ変換から始まる信号のスペクトル
表現に由来している。たとえば音声信号の特徴のための
表現として最もよく用いられているのはサウンドスペク
トログラム(sound spectrogram)であろう。サウンド
スペクトログラムとは、音声スペクトルの時間的な変化
を、濃淡図形表現、等高線表現、またはカラー表示など
を用いて見やすく表現したものである。
【0003】スペクトル表現は、波形自体で信号を表現
するよりも信号の特徴を良く表現できること、人間の聴
覚系は複数の正弦波からなる信号の相対的な位相関係に
はあまり敏感でないとされていること、それらを効率的
に計算できる計算手法が確立されていること等の特徴を
有しており、音声等の情報処理にはちょうど良く整合が
取れたために、広く使われるようになった。
【0004】従来はさまざまな信号処理において、あり
とあらゆることをもっぱら上記したスペクトル表現で見
ることによって極限まで性能向上を図ってきた。しか
し、すでに性能向上の限界に近くなっている感がある。
たとえば、音声認識装置では一般的に事前に多数の人間
の音声による学習が必要である。ところが、多数の大人
の男声・女声で学習を行なった音声認識装置に子供の声
を入力しても、ほとんど認識されないであろう。これ
は、基本的には、大人と子供とでは、声道や声帯の物理
的大きさが異なるために、それぞれの発する音声のスペ
クトル構造およびピッチ周期が異なり、その結果それぞ
れの音声から抽出される特徴ベクトルが異なってくるた
めである。
【0005】この問題を解決するために、その音声認識
装置に多数の子供の声を学習させたり、子供のためだけ
に特別に準備した音声認識装置を大人と子供とを判別す
るための装置とともに用意したりする方策がある。しか
し、子供の声の大規模データベースは現在は存在してい
ないので、そうした子供専用の音声認識装置を容易に準
備することはできない。さらに、仮にそうした子供の声
の大規模データベースを手間をかけて構築したとして
も、上記したような解決方法はあまり効率的とは言えな
い。
【0006】
【発明が解決しようとする課題】この問題を本質的に解
決するためには、スペクトログラムでは行ないにくい声
道や声帯の物理的大きさの正規化が自動的に行なえる表
現が不可欠である。ここでは、音声認識だけの例を挙げ
たが、たとえば楽器の発する音の分析およびエンジン音
の分析におけるように、音源の物理的大きさにかかわら
ず不変な音響的な特徴抽出が必要となる問題はさまざま
な局面で出ている。音響信号等に限らず、機械音および
地震波等の機械的振動の解析、脳波、心臓拍動音、超音
波エコーおよび神経細胞信号等の生体信号解析、一般的
な時系列データを収集するためのセンサー信号の解析
等、広範囲な分野でこうした問題に対する解決が必要で
ある。
【0007】それゆえに、本発明の目的は、振動源の物
理的な大きさに依存しない何らかの表現を利用すること
によって、上記の例に関連して述べたようなスペクトル
表現に由来する本質的な限界を超える信号処理を行なう
方法およびそれを利用した装置を提供することである。
【0008】
【課題を解決するための手段】請求項1に記載の発明に
かかる信号処理方法は、入力信号をコンピュータにおい
てウェーブレット変換するウェーブレット変換ステップ
と、ウェーブレット変換するステップの出力をコンピ
ュータにおいて入力信号の周期に同期させてメリン変換
することによって信号の特性を抽出する特性抽出ステッ
プとを含む。
【0009】請求項2に記載の発明にかかる信号処理方
法は、請求項1に記載の発明の構成に加えて、特性抽出
ステップは、ウェーブレット変換ステップによって得た
ランニングスペクトルに相当する表現を、入力信号の各
周期に同期させて時間的に安定化させて時間間隔−対数
周波数表現に変換するステップと、時間間隔−対数周波
数表現において、時間間隔と周波数との積または比の値
が一定となる線に沿って、メリン変換するステップとを
含む。
【0010】請求項3に記載の発明にかかる信号処理方
法は、請求項1〜請求項2のいずれかに記載の発明の構
成に加えて、ウェーブレット変換ステップは、人の聴覚
フィルタバンクの特性を模擬するように予めパラメータ
が設定されたウェーブレット変換のための核関数群を用
いて入力信号を積分変換するステップと、積分変換され
た入力信号を半波整流して出力するステップとを含む。
請求項4に記載の発明にかかる信号処理方法は、入力信
号の、原点が特定され時間間隔−対数周波数表現にお
いて、時間間隔軸を対数変換した対数時間間隔−対数周
波数表現をコンピュータを用いて得るステップと、さら
にコンピュータを用いて、対数時間間隔−対数周波数表
現を時間間隔と周波数との積を横軸に対数周波数を縦軸
に持つ新たな表現に変換し、その縦軸方向または横軸方
に沿って積分変換を行なうことによって信号の特性を
抽出するステップとを含む。
【0011】請求項に記載の発明にかかる信号処理方
法は、請求項に記載の発明の構成に加えて、積分変換
により抽出された入力信号の特性をベクトル表現し、さ
らにこれら表現ベクトルの時系列として入力信号の経時
的な特性を表現するステップをさらに含む。
【0012】
【0013】請求項6に記載の発明にかかる信号処理装
置は、コンピュータによって処理可能な予め定める形式
に変換した入力信号をウェーブレット変換するためのウ
ェーブレット変換手段と、ウェーブレット変換手段の出
力を前記入力信号の周期に同期させてメリン変換するこ
とによって信号の特性を抽出するための特性抽出手段と
を含む。
【0014】請求項7に記載の発明にかかる信号処理装
置は、請求項6に記載の発明の構成に加えて、特性抽出
手段は、ウェーブレット変換手段によって得たランニン
グスペクトルに相当する表現を、信号の各周期に同期さ
せて時間的に安定化させて時間間隔−対数周波数表現に
変換するための手段と、時間間隔−対数周波数表現にお
いて、時間間隔と周波数との積または比の値が一定とな
る線に沿って、メリン変換するための手段とを含む。
【0015】請求項8に記載の発明にかかる信号処理装
置は、請求項6〜請求項7のいずれかに記載の発明の構
成に加えて、ウェーブレット変換手段は、人の聴覚フィ
ルタバンクの特性を模擬するように予めパラメータが設
定されたウェーブレット変換のための核関数群を用いて
入力信号を積分変換するための手段と、積分変換された
入力信号を半波整流して出力するための手段とを含む。
請求項9に記載の発明にかかる信号処理装置は、コンピ
ュータによって処理可能な形式に変換した入力信号
の、原点が特定され時間間隔−対数周波数表現におい
て、時間間隔軸を対数変換した対数時間間隔−対数周波
数表現を得るための手段と、さらに対数時間間隔−対数
周波数表現を時間間隔と周波数との積を横軸に対数周波
数を縦軸に持つ新たな表現に変換し、その縦軸方向また
は横軸方向に沿って積分変換を行なうことによって入力
信号の特性を抽出するための手段とを含む。
【0016】請求項10に記載の発明にかかる信号処理
装置は、請求項に記載の発明の構成に加えて、さら
に、積分変換により得られた入力信号の特性をベクトル
表現し、さらにこれら表現ベクトルの時系列として入力
信号の経時的な特性を表現するための手段をさらに含
む。
【0017】
【0018】請求項11に記載の発明にかかる信号処理
装置は、各々入力信号を受けるように接続された、互い
に同一のウェーブレット核関数を持ちそれぞれ別個の周
波数を持つウェーブレットにより変換を行なう複数個の
ウェーブレットフィルタからなるウェーブレットフィル
バンクと、ウェーブレットフィルタバンクの出力を受
けるように接続され、ウェーブレットフィルタバンクの
出力から、聴覚図形を抽出するための聴覚図形抽出手段
と、聴覚図形抽出手段によって抽出された聴覚図形から
入力信号の寸法−形状イメージを生成するための寸法−
形状イメージ生成手段と、寸法−形状イメージから入力
信号の特徴を抽出するための特徴抽出手段とを含む。
【0019】請求項12に記載の発明にかかる信号処理
装置は、請求項11に記載の発明の構成に加えて、特徴
抽出手段は、寸法−形状イメージに対して、各ウェーブ
レットフィルタのインパルス応答線に沿ってフーリエ変
換を行なうことによりメリンイメージを生成するための
メリンイメージ生成手段を含む。
【0020】請求項13に記載の発明にかかる信号処理
装置は、請求項12に記載の発明の構成に加えて、聴覚
図形抽出手段は、ウェーブレットフィルタバンクの出力
に含まれる周期性を検出することにより、ウェーブレッ
トフィルタバンクの各チャンネルの出力に対して時間ス
トローブ積分を行ない安定化された聴覚イメージを生成
するための時間ストローブ積分手段と、時間ストローブ
積分手段の検出した周期性に基づいて、時間ストローブ
積分によって得られた安定化聴覚イメージのうちの一
期を聴覚図形として抽出するための安定化聴覚イメージ
抽出手段とを含む。
【0021】請求項14に記載の発明にかかる信号処理
装置は、請求項13に記載の発明の構成に加えて、安定
化聴覚イメージ抽出手段は、安定化聴覚イメージの一番
目の周期を聴覚図形として抽出するための手段を含む。
【0022】請求項15に記載の発明にかかる信号処理
装置は、請求項13に記載の発明の構成に加えて、安定
化聴覚イメージ抽出手段は、安定化聴覚イメージの
番目の周期を聴覚図形として抽出するための手段を含
む。
【0023】請求項16に記載の発明にかかる信号処理
装置は、請求項11に記載の発明の構成に加えてさら
に、ウェーブレットフィルタバンクの出力を半波整流し
聴覚図形抽出手段に与えるための手段を含む。
【0024】
【発明の実施の形態】[発明の背景をなす基本的事項]
まず、本発明、特に以下に述べる実施の形態の課題を明
確化するために、メリン変換と音響物理とについて述べ
る。 1.メリン変換 メリン(Mellin)変換は、フーリエ変換と同様な積分変
換の一種類であり、発明の実施の形態の説明の最後に添
付した付録Aに示される式で定義される(森口・宇田川
・一松著「数学公式II」岩波書店、1957年刊行、Titchm
arsh,"Introduction to the Theory of Fourier Integr
als," Oxford U.P., London, 2nd ed.)。付録Aの式
(A2)によっても表わされるように、分析する信号の
応答が相似形のまま時間的に拡大・縮小しても、メリン
変換して得た分布の絶対値は定数倍以外不変となること
がメリン変換の重要な特徴である。本願発明では、メリ
ン変換のこの特徴を利用して、たとえば声道の大きさの
相違に由来するスペクトル構造の相違およびピッチ周期
の相違にもかかわらず、音声認識が行えるような、適切
な信号処理を行なう。 2.音響管の物理 無損失な音響管を考える。その音響管を伝搬する波の解
は、その波を平面波で近似することによって得ることが
できる。均一の口径の音響管またはホーン形の音響管の
解析解は、初頭的な物理の教科書にも書いてあるほどよ
く知られている。また、音響管の断面積が変化する場合
でも、断面積関数を多数の微小な円筒で近似することに
よって、その音響管内を伝搬する波を数値的に解くこと
ができる。声道をそのような方法で近似して解くこと
は、音声生成モデルの教科書の教えるところである(例
えば、中田著「音声」コロナ社、改定版、1995)。
【0025】さて、その音響管の一端をインパルスで駆
動した場合の、他端でのインパルス応答を考える。ここ
で重要な特徴は、その音響管の大きさを比例的に拡大・
縮小した場合、そのインパルス応答波形が時間軸上で拡
大・縮小されることである。つまり物理的な音響管の大
きさは、そのインパルス応答と直接的に関係している。
【0026】大人の発声したある音韻と子供の発声した
同じ音韻とは、それぞれの音響管の大きさが全く違うの
にもかかわらず聞き手には同じように聞こえる。音声学
の教科書または英語の教科書には、発声される母音(vo
wel)とそれに対応した調音位置(place of articulati
on)との対応図が記載されている。しかしそうした対応
図には、その縮尺のようなものは記載されていない。そ
うした対応図は大人でも子供でも、かれらの調音器官の
大きさの相違にかかわらず共用できる。つまり、調音器
官の大きさの相違にかかわらず、相似的に調音のかまえ
を似たものにすれば、同じ音韻が発声できる。いいかえ
れば、声道の物理的な大きさが異なっても、声道断面積
関数の相似性を保つことにより同じ音韻が発声できる。
【0027】物理的に声道断面積関数が相似で、その全
長が異なる場合、声道のインパルス応答は、時間的に拡
大・縮小したものになる。そのため、大人の声に対して
子供の声は、声道のインパルス応答が時間軸上で縮小さ
れた音響管を音声パルスで駆動したことに相当する。も
ちろん個人差があるため、以上は理想的な話ではある
が、上記したようなインパルス応答の時間軸上での縮小
は、物理的考察に立った子供の音声の特徴の良い第一次
近似であるはずである。こうした類推は、音声において
妥当であるという理由ばかりでなく、大きさの異なるバ
イオリン、チェロおよびコントラバスが同じバイオリン
族の楽器として類似の音を発生すること、および同じ形
状で異なる大きさのエンジンが類似の音を発生すること
など、音声以外の事象の観察からも正当化できる。 3.課題の設定 もし、上記のような声道のインパルス応答の時間軸上で
の拡大・縮小に対し不変な内部表現を直接作り出すこと
ができれば、スペクトル分析を行なって抽出の難しい高
次ホルマントを利用することにより拡大・縮小の計算を
行なって正規化しなくてもよくなり、大人でも子供でも
同じ音韻は同じものとして処理することができる。この
ように時間軸上での波形の拡大および縮小に対して不変
な性質を有するという特徴は、上記で示したメリン変換
を通して得ることができるメリン表現の特徴に他ならな
い。すなわち、メリン変換およびメリン表現が、今求め
られている音声などの信号の解析において従来のスペク
トル表現に由来する分析とは本質的に異なる重要性を持
つことが分かる。
【0028】ところが、従来はメリン変換は信号処理で
はあまり実用的には使用されてこなかった。その理由
は、以下で述べるように、メリン変換は「シフト変動」
(shift varying)であり、その振幅が「シフト不変」
(sihft invariant)なフーリエ変換などに比べて扱い
づらかったためである。付録Aの式(A1)からも分か
るように、メリン変換では積分の起点(以下ではこれを
「解析の原点」と呼ぶ。)が確定している必要があり、
この解析の原点が移動するとその結果が異なってくる。
これが「シフト変動」という性質である。一方フーリエ
変換では(−∞,∞)の範囲で積分をすればよいので、
このような積分範囲の移動という問題がない。これが
「シフト不変」という性質である。
【0029】メリン変換についての研究に関しては、Um
eshらがメリン変換の性質から周波数軸だけの変形を提
案している(Umesh, Cohen, and Nelson, "Frequency-w
arping and speaker-normalization," IEEE Int. Conf.
Acoust., Speech Signal Processing (ICASSP-97),1
997; Umesh, Cohen, and Nelson,"Improved scale-ceps
tral analysis in speech," IEEE Int. Conf. Acoust.,
Speech Signal Processing (ICASSP-98),1998)、ま
たAltesはフーリエ変換とメリン変換との組み合わせを
提案している(Altes, "The Fourier-Mellin transform
and mammalianhearing," J. Acoust. Soc. Am., 63,p
p.174-183, 1978)、またメリン変換の音声認識への応
用(Chen, Xu, and Huang, "A novel robust feature o
f speechsignal based on the Mellin transform for s
peaker-independent speech recognition," ICASSP ユ9
8,1998)も提案されている。
【0030】しかしながら、これらはいずれも周波数振
幅情報を用いた周波数軸方向へのメリン変換であり、位
相情報すなわち時間的な情報の考察がない。したがって
これら論文はいずれも「シフト変動性」を克服するため
の解析の原点の特定の問題には触れておらず、音に対す
る安定な時間的な微細構造を保持した表現を求めていな
い。音の音色の情報は、主にこの微細時間構造に存在す
ると考えられるので、この情報を保持したまま、物理的
な音源寸法を正規化する手法が望まれる。
【0031】現状の音声認識装置等の信号処理の限界を
打開するためには、やはり音声や音響振動の本質に迫る
優秀な機能を持つメリン変換を、その「シフト変動」で
あるという欠点を克服して利用することにより信号処理
のための計算を正確に行なうことが必要である。本発
明、特に以下に記載した実施の形態の方法および装置の
目的は、時間的に安定な表現を導出することによりメリ
ン変換を計算可能にしてメリン表現を得ることにある。
【0032】[本発明の原理]以下、本発明、特に以下
に述べる発明の実施の形態の構成と動作との原理を明確
にするため、発明の基本的思想について述べる。 1.発明の概要 上記のメリン変換の「シフト変動」であるという欠点を
克服するためには、どの時点においても安定な原点を持
つ表現においてメリン変換を実行しなければならない。
図1を参照して、本発明での解決法を実現するための一
般的な装置は、入力信号1に対して、後述する安定化ウ
ェーブレット変換処理を行なうための安定化ウェーブレ
ット処理部2と、安定化ウェーブレット処理部2から出
力される安定化ウェーブレット処理された入力信号に対
してメリン変換を行なうためのメリン変換処理部3と、
メリン変換処理部3の出力に対してたとえば音声認識、
音声の符号化などの信号処理を行なって結果5を出力す
るための信号処理部4とを含む。安定化ウェーブレット
処理部2で行なわれる安定化ウェーブレット変換処理
は、入力信号をウェーブレットフィルタバンクを通して
時間周波数分析を行なうとともに、解析の原点を定め
る。安定化ウェーブレット処理部2によって解析の原点
を定めることにより、安定化ウェーブレット処理部2の
出力に対してメリン変換処理部3でメリン変換を行なう
ことが可能になる。
【0033】この装置では、入力信号1は、安定化ウェ
ーブレット処理部2によって安定化ウェーブレット変換
されて、さらにその出力に対して安定化ウェーブレット
処理部2で定められた解析の原点を積分の起点としてメ
リン変換3が行なわれ、メリン表現が得られる。得られ
たメリン表現は、音源の寸法や波形の周期性の変動に関
して正規化された音声信号の特徴表現である。この表現
は、従来の音声分析で主として利用されていたスペクト
ルや線形予測係数と同様に、ベクトルとしても表すこと
もできる。したがって、このメリン表現を、従来から用
いられてきたありとあらゆる信号処理に対する入力とし
て与えることができ、それらに対応する結果5が得られ
る。たとえば音声認識装置においては、メリン表現され
た多数の特徴ベクトルを予め準備しておき、入力された
特徴ベクトルとの間で従来と全く同様のマッチングを行
なうことにより音声認識を行なうことが可能となり、そ
のためのハードウェアも従来と同様でよい。 2.ウェーブレット変換 図2を参照して、本発明における安定化ウェーブレット
変換を計算するための安定化ウェーブレット処理部2
は、入力信号6(請求項1の入力信号1と同じであり、
通常は周期性を有することが想定されている。)に対し
てウェーブレット変換を行なうためのフィルタバンクか
らなるウェーブレット変換処理部7と、ウェーブレット
変換処理部7の出力の振幅を対数圧縮または指数圧縮に
より圧縮するための振幅圧縮部8と、振幅圧縮部8の出
力を受けて、周期性を表わす事象を検出して検出出力を
発生するための事象検出処理部9と、事象検出処理部9
の出力に応答して、前述した通り解析の原点を定めるよ
うに振幅圧縮部8の出力波形の時間間隔を安定化させて
安定化ウェーブレット変換出力11として出力するため
の時間間隔安定化処理部10とを含む。
【0034】ウェーブレット変換処理部7で行なわれる
ウェーブレット変換を定義する式は実施の形態の説明の
最後に添付した付録Bの式B1〜B7に示す。ウェーブ
レット変換は、フーリエ変換における基底関数である正
弦波に替えて、ウェーブレット核(「マザーウェーブレ
ット」とも呼ばれる。)と呼ばれる、波形の小片を定め
る関数を用いる。そしてこのウェーブレット核を時間軸
上で拡大、縮小した(互いに周波数が異なる)波形が、
解析対象となる波形にどの程度の大きさで含まれるかを
調べることにより、解析対象の波形を時間と周波数との
二次元に分けて解析することができる。
【0035】フーリエ変換では正弦波を用いている。正
弦波は時間軸上で(−∞,∞)の範囲に一様に広がった
周期関数である。そのため、フーリエ変換では入力信号
のある一部にどの周波数の信号がどの程度存在している
か、という局所的な情報を得ることはできない。それに
対してウェーブレット変換では、どの位置に、どの周波
数のウェーブレットが、どの程度の大きさで含まれてい
るかという局所的な情報を知ることができる。このた
め、ウェーブレット変換によって入力信号を時間と周波
数との二次元から解析できる。
【0036】またウェーブレット変換では、目的に応じ
てウェーブレット核を変え、応用ごとに適切な波形のウ
ェーブレット核を用いることができることが知られてい
る。たとえば、Daubechiesのウェーブレット、メキシカ
ンハット、フレンチハット、Shannonのウェーブレッ
ト、Haarのウェーブレット、Gaborのウェーブレット、M
eyerのウェーブレットなどが知られている。以下に述べ
る実施の形態では、特定のウェーブレットを用いている
が、応用に応じて上記した、およびここにあげていない
種々のウェーブレットを用いることが可能である。
【0037】多くの場合周期性を持つ(式B1)入力信
号1は、ウェーブレット変換処理部7によりウェーブレ
ット変換され解析される(Combes et al.(Eds.),"Wav
elets", Springer-Verlag,Berlin,1989)。ウェーブレ
ット核としては、例えば所定周波数で周波数変調され、
ガンマ分布を包絡線として持つガンマチャープ関数(式
B2)を選ぶことができる。このガンマチャープ関数
は、メリン変換において、最小不確定性の意味で最適な
関数であることが知られている(Irino and Patterso
n,"A time-domain, level-dependent auditory filter:
The gammachirp,"J. Acoust. Soc. Am., 101,pp.412-4
19, 1997)。なお、ウェーブレット核は上記したガンマ
チャープ関数に限定されるわけではなく、既に述べたよ
うに解析においてどの特徴を重視するかに応じて適切な
関数により定められる波形を用いることができる。
【0038】ウェーブレット核を時間軸上で伸縮したウ
ェーブレットフィルタ(式B3)の組を用いることによ
りウェーブレット変換処理部7のフィルタバンクを実現
できる。ここでは、最大周波数と帯域幅とが比例する定
Q型で、対数周波数軸上で等間隔に配置したフィルタバ
ンクの各フィルタと信号との間で畳み込み積分を行なう
(式B4)。
【0039】仮に、外界の信号が、時間的に圧縮または
伸長されても、ウェーブレット変換はその出力波形には
歪みを与えない。単にその信号の出力がより高い、また
はより低い最大周波数のフィルタの位置に移動するだけ
である。これは、ウェーブレットフィルタ自体が元のウ
ェーブレット核関数を時間軸上で拡大・縮小したもの
で、いずれも同じフィルタ形状を有するからである。
【0040】得られた各フィルタ出力の振幅値に対して
は、図2の振幅圧縮部8で対数圧縮(式B5)または指
数圧縮(式B6)が行なわれる。この時、目的に応じ、
波形の正負の部分の両方を残す場合と、半波整流して正
部分のみを残す場合とのふた通りが考えられる。以下に
示す各例では、半波整流した場合を示す。正負の両部分
を残す場合も、後の処理は基本的の以下の説明と同じで
ある。 3.メリン変換の前提と安定化ウェーブレット変換 既に延べ、式A1からわかるように、メリン変換は必ず
解析の原点を特定することが必要で、原点がずれると表
現も変わってしまう「シフト変動(shift-varying)」
な変換である。メリン変換がシフト変動である、という
点が、シフト不変なフーリエ変換に対して不利な点で、
これがメリン変換がいままであまり用いられてこなかっ
た理由でもある。しかし、上記のような、物理的大きさ
の変動に対して耐性があるという音声信号処理にとって
魅力ある性質をもっている。したがって、解析の原点を
確実かつ安定に決定できれば、シフト変動であるという
メリン変換の欠点を克服でき、メリン変換を音声信号処
理に有効に利用することが可能となる。本発明はそのた
めの一つの解決策を与える。
【0041】信号は常に時間的に流れているので、ウェ
ーブレット変換を行なった後の「ウェーブレットスペク
トル」も時間的に流れる「ランニングスペクトル」に相
当する。そのためウェーブレットスペクトルのみからで
は解析の原点を決められない。この解析の原点を事象検
出処理部9で決定する。以下、事象検出処理部9で行な
う処理の詳細について説明する。
【0042】周期信号(式B2)や疑似周期信号の場
合、各ウェーブレットフィルタ出力は、1周期に1つの
最大値を持つ。本願発明は、音源情報はそうした最大値
を固定して見た時の波形として表現されている点に着目
する。そのために本願発明では、フィルタ出力の周期性
を事象検出処理部9によって検出し、そこを原点にして
メリン変換を取ることにより振幅圧縮部8の出力信号の
時間間隔を安定化させる。
【0043】最大値検出の方法については既に報告がさ
れている(Irino and Patterson, "Temporal asymmerty
in the auditory sytem, "J.Acoust. Soc. Am., 99, p
p.2316-2331, 1996; Patterson and Irino," Modeling
temporal asymmerty in theauditory sytem," J.Acous
t. Soc. Am., 104, pp.2967-2979, 1998 )。それ以外
にもピッチ周期検出に関しては過去から多くの報告があ
る(たとえばHess, "Pitch Determination of Speech S
ignals," Springer-Verlag, NY, 1983)。
【0044】本願発明では、各チャンネルにおける最大
値の時点を、図2の時間間隔安定化処理部10で行なわ
れる時間積分の開始時点とする。時間間隔安定化処理部
10が行なう時間積分では、ある開始時点から次の開始
時点までを1周期として各ウェーブレットフィルタ出力
をコピーして、イメージバッファの対応するチャンネル
の既に存在する1周期分の表現に一点一点加えあわせる
ことによって新たな表現を生成する。この操作をストロ
ーブ時間積分(Patterson, Allerhand and Giguere, "T
ime-domain modelling of peripheral auditory proces
sing: a modular architecture and a software platfo
rm", J.Acoust. Soc. Am., 98,1890-1894, 1995; Patte
rson and Holdsworth, "Apparatus and methods for th
e generation of stabilised images from waveforms,"
United Kingdom Patent: 2232801 (1993), United S
tates Patent: 5,422,977 (1995), European Patent:
0473664 (1995))と呼び、ここまでの操作全体を安
定化ウェーブレット変換と呼ぶ。
【0045】安定化ウェーブレット変換によって、次周
期の各ウェーブレット出力、次々周期のウェーブレット
出力、さらに先の周期のウェーブレットフィルタ出力を
構成する各点の値はイメージバッファ内の同じ位置に加
算されるため、信号の流れが止まり安定な表現となる。
また、この表現では、横軸として一つ前のピークからの
時間間隔がとられるため、原点は常に零である。
【0046】周期信号(式B2)や疑似周期信号の安定
化ウェーブレット変換(式B7)は、その微細構造に音
源情報を保存していて周期的に繰返したパターンにな
る。ここで、安定化ウェーブレット変換により得られる
安定化された時間間隔パターンの1周期分を音源情報図
形(式B8)または聴覚図形と呼ぶことにする。この音
源情報図形は安定で、開始点が常に決まっているので、
シフト変動性の問題を回避して、この上でメリン変換を
取ることができる。すなわち、安定化ウェーブレット変
換は、メリン変換が音源情報を解析するのに必要な条件
を準備したことになる。 4.メリン変換の計算 メリン変換は、量子力学で使われるオペレータで表現で
きることが知られている(Cohen,"The scale transfor
m," IEEE Trans. Acoust. Speech and Signal Processi
ng, 1993; Irino, "An optimal auditory filter," IEE
E Workshop on Applications of Signal Processing to
Audio and Acoustics, 1995; Irino, "A'gammachirp'
function as as optimal auditory filter with the Me
llin transform," IEEE Int. Conf. Acoust., Speech S
ignal Processing (ICASSP-96), 1996)。その場合、
メリン変換は、Gaborが用いた時間オペレータと周波数
オペレータ(Gabor,"Theory of communication," J. IE
E (London),93,42-457,1946)との積をとった形式に
なっている。すなわち、時間と周波数との積がメリン変
換にとって重要な概念である。メリン変換を定義する式
を、実施の形態の最後に添付した付録Bの式B8〜B1
2に示す。
【0047】本発明では、原理的には、音源情報図形
(式B8)に対して、時間と周波数との積が一定となる
等値線(式B9)に沿ってメリン変換(式B10)を行
なう。ここで、メリン変換のパラメータPは複素数(式
B11)なので、式B10は式B12のように書き換え
ることができる。これにより、音源情報図形のメリン変
換として、横軸を時間間隔と周波数との積、縦軸をメリ
ン変換核の複素変数とした2次元表現を得ることができ
る。この表現をメリンイメージと呼ぶことにする。
【0048】この表現の上では、音源情報は正規化され
ていて音源の周期性や物理的大きさの拡大・縮小に対し
て不変の表現になっている。したがって、従来から提案
されている信号処理手法にしたがった信号処理部4に対
してこの正規化音源情報を与えることにより、より優れ
た信号処理が実現できる。
【0049】図3のフローチャートに以上の処理の流れ
を示す。メリン変換の計算に関しては、さらに詳しく第
1の実施の形態において述べる。図3を参照して、波形
入力を受けると、これらをウェーブレット変換のフィル
タバンクを通すことによりウェーブレット変換の計算が
行なわれる。
【0050】ウェーブレット変換の出力から信号周期情
報を抽出し、この情報をもとにウェーブレット変換の出
力を安定化させ、一つ前のピークからの時間間隔−対数
周波数表現の計算を行なうことにより、音源情報図形を
得る。
【0051】こうして得られた音源情報図形上の、時間
間隔と周波数との積が一定となる線に沿ってメリン変換
の計算を行なう。こうして、音源の周期性および物理的
大きさの拡大または縮小に対して不変な表現であるメリ
ンイメージが得られる。 5.メリンイメージの時系列 前節では、ある一時点の安定化ウェーブレット変換から
メリンイメージを計算する方法を示した。信号は時々刻
々変化しており、それに対応した安定化ウェーブレット
変換から得た音源情報図形も変化する。そこで、ある間
隔ごとに音源情報図形を抽出し、それをもとにそれぞれ
メリンイメージを計算する。このメリンイメージの各々
から1つの特徴ベクトルを抽出することができる。する
と、スペクトログラムのように、横軸に時間をとり、縦
軸にメリンイメージベクトルの軸をとって、メリンイメ
ージベクトルを並べた表現を作ることができる。これ
は、スペクトログラムとは全く異なるものではあるが、
形式的には同じとなるので、従来スペクトログラムを用
いてきた信号処理手法にそのまま入力でき、様々な分野
に容易に応用することができる。
【0052】[作用・効果]音源の物理的な大きさに依
存して、解析する波形が時間的に拡大・縮小しても、メ
リンイメージのスケール分布は不変である。これは、フ
ーリエスペクトルにはない性質である。また、同時にフ
ーリエスペクルとは表現は異なるものの、メリンイメー
ジベクトルによる表現は、解析の対象となる波形の拡大
・縮小以外の違いは明確に表わすことができる。音声の
場合は、異なる声道長の発声もメリンイメージベクトル
による表現では同様に扱うことができる。したがって逆
にメリンイメージベクトルによる表現を用いて音韻の違
いだけを強調することができる。たとえば、メリンイメ
ージベクトルによる表現を用いれば、大人のデータで学
習した音声認識装置をそのまま子供の認識に使うことが
できる可能性がある。これ以外にもメリンイメージベク
トルを用いた表現を適用することができる局面は多くあ
り、音声認識装置等の性能向上が期待できる。さらに、
メリンイメージベクトルによる表現を従来より用いられ
ているスペクトル分布と組み合わせて用いることによ
り、従来の性能を超えた音声信号処理を実現できる。ま
た、対象となる波形は、時系列データであれば何でもか
まわないので、音声や音楽といった音響信号ばかりでな
く、機械的振動、生体信号、および時系列的な計測デー
タのいずれにも本発明にかかる手法を応用することが可
能である。
【0053】以上において、本願発明の実施の形態の基
本的手法と、その背景とについて説明した。以下、本願
発明の実施の形態について詳細に説明する。 第1の実施の形態 図4を参照して、本発明の第1の実施の形態の音声認識
装置は、図1に示すものと同様、安定化ウェーブレット
処理部2と、メリン変換処理部3と、信号処理部4とを
含む。
【0054】安定化ウェーブレット処理部2は、音声信
号12を入力として受け、音声信号12に対してウェー
ブレット変換を行なって周波数分析を行なうための聴覚
フィルタバンク13と、聴覚フィルタバンク13の出力
に対して、聴神経での神経活性度に類似した出力を得る
ような変換を行なうための聴神経発火パターン変換部1
4と、時間積分を制御するために、ある近傍での最大値
を検出するための事象検出(ピッチ検出)回路15と、
事象検出(ピッチ検出)回路15の出力を合図(ストロ
ーブ)として、聴神経発火パターン変換部14の出力す
る現在の一定区間を取出して前述した時間積分を行なっ
て安定化聴覚イメージを生成し出力するための安定化聴
覚イメージ処理部16とを含む。これら各構成要素につ
いては後に詳述する。
【0055】メリン変換処理部3は、安定化聴覚イメー
ジ処理部16の出力する安定化聴覚イメージを変形し、
新しい表現である寸法−形状イメージを出力するための
寸法−形状イメージ処理部17と、寸法−形状イメージ
処理部17の出力する寸法−形状イメージからメリンイ
メージを計算し、メリンイメージベクトルに基づく表現
として出力するためのメリンイメージ処理部18とを含
む。
【0056】信号処理部4は、メリンイメージ処理部1
8の出力するメリンイメージベクトルに基づく表現を、
予め準備されたテンプレートとマッチングして音声認識
し音声認識結果20を出力するための音声認識回路19
を含む。
【0057】図4に示す装置において、入力される音声
信号12は、メリン変換処理部3によって安定化聴覚イ
メージ(Stabilized Auditory Image, SAI)に変換され
る。この安定化聴覚イメージは、安定化ウェーブレット
変換2で得られる表現の聴覚版である。安定化聴覚イメ
ージは、寸法−形状イメージ処理部17によって寸法−
形状イメージ17に変換され、さらにメリンイメージ処
理部18によってメリンイメージ18に変換される。こ
の処理は、メリン変換3に相当する。なお、以下に述べ
る聴覚イメージモデルをもとにした安定化ウェーブレッ
ト−メリン変換を示す式等については実施の形態の説明
の最後に添付した付録Cに記載してある。 1.安定化聴覚イメージの構成 この節では、安定化ウェーブレット処理部2の各構成要
素の動作について述べる。入力される音声信号12は、
聴覚フィルタバンク13で周波数分析される。この実施
の形態の装置では、聴覚フィルタバンク13の各々の聴
覚フィルタは、ガンマ分布関数の包絡線で周波数変調さ
れた搬送波を持つガンマチャープ(式C1)で近似でき
る。また、聴覚フィルタバンク13はおおよそ500H
z以上では最大周波数と帯域幅が比例する定Q型のフィ
ルタとなっている(式C2)。すなわち、聴覚フィルタ
バンクはガンマチャープ(式C1)を核関数としたウェ
ーブレット変換(式C3、式C4)になっていて、この
関数のパラメータは人間の聴覚フィルタを模擬するよう
に設定できる(Irino and Patterson,"A time-domain,
level-dependent auditory filter: The gammachirp,"
J. Acoust. Soc. Am., 101,pp.412-419, 1997)。聴覚
フィルタを並べた聴覚フィルタバンク13はIIRフィル
タで構成できる(たとえば特開平11−24696号公
報、特開平11−119797号公報を参照)。
【0058】聴覚フィルタバンク出力は、聴神経発火パ
ターン変換部14によって聴神経発火パターン(Neural
Activity Pattern, NAP)に変換される。具体的には、
聴覚フィルタバンク13の出力に対して半波整流が行な
われて、振幅が対数圧縮(式C5)または指数圧縮(式
C6)され、さらに適応処理により信号の立ち上がり部
分が強調されて、聴神経での神経活性度に類似した出力
を得る。
【0059】事象検出(ピッチ検出)回路15は、各チ
ャンネルの活性度を監視して、ある近傍での最大値を検
出して、時間積分を制御する。事象検出(ピッチ検出)
回路15での処理は例えば以下のようにして行なわれ
る。まず、活性度を平滑化して包絡線を計算する。得ら
れた包絡線の微分を計算して、その値(包絡線の勾配)
が正から負に変化する時点に近い、活性度の一番大きい
ピーク時点を近傍最大値時点とする(上記Irino and Pa
tterson, 1996)。この近傍最大値は、音声の有声音お
よび定常的な楽器音のように周期性や疑似周期性を持っ
た信号では、定常的に発生する。この近傍最大値を合図
(ストローブ)として、神経発火パターンの現在の一定
区間を取り出して、聴覚イメージ16のバッファの対応
するチャンネルに近傍最大値の時点をそろえて加えるこ
とを各区間ごとに繰返し行なうことにより時間積分が行
なわれる。こうした積分をストローブ時間積分(Strobe
d Temporal Integration, STI)と呼ぶ。
【0060】STIの処理は、神経発火パターン(NA
P)の時間軸を、直前の近傍最大値を基準とする時間間
隔軸に変換する役割を果たしている(式C7)。ストロ
ーブ時間積分を聴覚フィルタバンク13の全てのチャン
ネルについて行なえば、聴覚フィルタバンク13での縦
軸(対数周波数軸)の値を保ったまま、安定化された聴
覚イメージ16(式C7)が得られる。この安定化され
た聴覚イメージは、半減期約30msで全体が減衰する
ようにされており、入力信号がなくなった時点で自然に
イメージも消失する。
【0061】安定化聴覚イメージを時間方向に積分する
ことにより、スペクトル的な周辺分布が得られる。この
スペクトル的な周辺分布は従来からのスペクトログラム
のスペクトルベクトルと類似しているので、聴覚的スペ
クトログラムを構成でき音声認識にも応用できる(たと
えば、上記、Patterson et. al. 1995を参照)。 2.寸法−形状イメージの構成 この節では、寸法−形状イメージ処理部17で行なわれ
る処理の詳細について述べる。安定化聴覚イメージ処理
部16から出力される安定化された聴覚イメージは横軸
に線形の時間間隔軸、縦軸に対数周波数軸を持った表現
になっている。寸法−形状イメージ処理部17では、こ
の表現を変形することによって、新たな表現である寸法
−形状イメージを求める。これは次節のメリンイメージ
18を容易に計算できるようにする重要な段階である。
この処理を行なう寸法−形状イメージ処理部17の詳細
を図5のブロック図に示す。また、以下の処理の流れを
図6のフローチャートに示す。以下の説明では随時図5
および図6の記載を参照する。
【0062】図5を参照して、寸法−形状イメージ処理
部17は、安定化聴覚イメージ21に含まれるフィルタ
遅れを補正するためのフィルタ遅れ補正部22と、聴覚
イメージを全てのチャンネルについて垂直方向に加え合
わせて時間間隔軸上の総計活性度を計算するための活性
度計算部23と、活性度計算部23によって計算された
活性度の大きさに基づいて、聴覚イメージの周期性を検
出するための周期性検出部24と、周期性検出部24に
よって検出された周期性を用い、聴覚イメージの中から
後述する聴覚図形を抽出するための聴覚図形抽出部25
と、聴覚図形抽出部25によって抽出された聴覚図形の
横軸を線形の時間間隔軸から対数の時間間隔軸に変換す
るための対数時間間隔表現への変換部26と、対数時間
間隔表現への変換部26によって横軸が変換された聴覚
図形において観察される、直線のインパルス応答線が縦
軸と平行な向きとなるように各チャンネルごとに横軸を
移動させる処理を行なうインパルス応答分補正部27と
を含む。
【0063】聴覚イメージモデル(Auditory Image Mod
el, AIM) (上記、Patterson et. al. 1995)にしたがって求め
た、安定化された聴覚イメージの例としての安定化聴覚
イメージ21を図7に示す。図7は、10ms間隔、す
なわち周波数100Hz、で発生させたクリック系列音
に対する聴覚イメージを2周期強表示している。縦軸
は、フィルタの各チャンネルをそれらの最大周波数Hz
で表しており、疑似対数周波数軸になっている。横軸
は、ストローブ時間積分を開始した近傍最大値の時点か
らの時間間隔を表わし、ミリ秒単位で表されている。こ
こでは、時間間隔は線形の軸である。
【0064】図7を参照して、3つある垂直の線に沿っ
た活性度が高い所は、原波形の周期と同じ周期で配置さ
れている。横軸の0msの所は、ストローブ時間積分で
近傍最大値の活性度が転写される場所である。この近傍
最大値は、周期信号の場合は各々の周期を特定し、ま
た、非周期信号の場合は特徴の開始点を特定する。この
ようにしてストローブ時間積分は、メリン変換の解析の
開始時点、または零点を特定する。
【0065】メリン変換においては、初段の聴覚フィル
タバンク13を構成する各々のウェーブレットフィルタ
が合理的な基準で揃っていること、たとえば、聴覚フィ
ルタの包絡線の立ち上がり時点(式C1での時間t=0
の時点)が全てのチャンネルで揃っていることが理論的
には望ましい。ところが、ストローブ時間積分では、聴
覚フィルタの包絡線の立ち上がり自体を検出できるわけ
ではなく、応答の最大値でストローブをかけるので、包
絡線の立ち上がりに対して遅れ時間を生じる。このずれ
は、図7の垂直の活性度の各密集位置の左側に存在して
いる曲線上の活性度によって見ることができる。このフ
ィルタ分の時間遅れを補正することが処理を分かりやす
くする上で望ましい。
【0066】そのための補正を行なうのがフィルタ遅れ
補正部22である。この補正を行なうためには、単純に
聴覚フィルタの最大周波数の逆数の周期分、各々のチャ
ンネルの活性度を右に移動させてやれば良い(式C
8)。図7に対して補正を施した結果の聴覚イメージを
図8に示す。これによって、垂直に配置された所は、メ
リン変換の開始点の良い近似となる。なお、この補正を
行なわなくてもメリン変換の出力にそれほど影響がない
ことが分かっていることについては後述するとおりであ
る。
【0067】前述のように安定化聴覚イメージ処理部1
6で行なわれるストローブ時間積分(STI)は、周期
的な音によって聴神経発火パターン(NAP)にくりか
えし生じる時間間隔パターンを安定させて、図7の時間
間隔で0、10、20の所で示されるように聴覚イメー
ジ(SAI)の中で垂直の方向に活性度が集中する所を
生じさせる。図7を参照して明らかなように、この垂直
活性度線はもとの信号の周期と同じ間隔で、聴覚イメー
ジをいくつかの類似した区間に分割している。この一つ
の区間を、音源信号に対応する聴覚図形(AuditoryFigu
re, AF) (式C9)と呼ぶことにする。
【0068】活性度計算部23は、この聴覚イメージを
各々のチャンネル全てについて垂直方向に加え合わせ
て、時間間隔軸上の分布の総計活性度を計算する。周期
性検出部24は、この活性度の大きさによりパターンの
周期性を決定できる。この周期性情報を用いることによ
り、聴覚図形抽出部25はフィルタ分の補正を行なった
聴覚イメージ(図8、フィルタ遅れ22で補正した結果
に相当)中から聴覚イメージの1周期分に相当する聴覚
図形を抽出できる。
【0069】聴覚図形抽出部25によって抽出された聴
覚図形は横軸として線形の時間間隔軸を有する。この横
軸の時間間隔を対数変換すると後の処理を容易に行なう
ことができる。対数時間間隔表現への変換部26がこの
対数変換を行なう。すなわち対数時間間隔表現への変換
部26は、聴覚図形の横軸を対数時間間隔軸に変換する
(式C10)。この変換により、図9に示すように聴覚
フィルタのインパルス応答に相当する聴覚図形中の曲線
群を、500Hz以上ではほぼ平行で規則的に並んだ直
線群に変換することができる。図9は、図8内の最も左
側の聴覚図形を対数時間間隔軸にスプライン補間を用い
て変換した図である。
【0070】図9を参照して、この直線のインパルス応
答線はいずれも負の勾配を持ち、聴覚図形の対角線と同
様に傾いている。この表現は、横軸に対数時間間隔を、
縦軸に対数周波数を、それぞれ持っており、メリン変換
を容易に計算できるような形になっている。
【0071】メリン変換の計算と音源情報を示す表現を
わかりやすくするために、図9の対数時間間隔聴覚図形
(式C10)のインパルス応答線が縦軸と平行な線(横
軸に対して垂直となるので、以下これを「垂線」と呼ぶ
こととする。)になるように補正して図10を得る(式
C11)。この補正は対数時間間隔表現への変換部26
によって行なわれるものであり、各チャンネルごとに、
最大周波数の対数に比例した分だけ右方向に対数時間間
隔軸を移動することに相当する。図10での新しい横軸
は、時間間隔とチャンネル最大周波数との積h(式B
9)の対数で表わされている。縦軸は従来と同様対数軸
表示の最大周波数である。
【0072】図10を参照して、一番左の点線の垂線
は、時間間隔とチャンネル最大周波数との積hが1とな
る聴覚図形内の位置を示している。また、図10ではh
の値が1〜5に対応する垂線が破線で引いてあるが、そ
のいずれの上にも活性度が集中している。すなわち、図
10に示される表現においては全てのウェーブレットフ
ィルタのインパルス応答は、hの値が整数となる垂線上
に集中しており、したがってこの表現がウェーブレット
フィルタの拡大・縮小に依存しないことがわかる。これ
を容易に理解できるようにするため、横軸をhの線形軸
に直すと図11が得られる。
【0073】なお、図11に示される例では、対数変換
を用いないで直接図8の聴覚イメージから活性度を求め
たため、h=0に対応する垂線上の活性度も示されてい
る。この処理を行なうためには、図8に示される聴覚イ
メージにおいて、各チャンネルの最大周波数に比例した
サンプリング周波数でそれぞれの活性度の再サンプリン
グを行ない、そのサンプル点をそのまま2次元上に並べ
ればよいだけである。
【0074】前節で述べたとおり、この表現において
は、ウェーブレットフィルタはどのチャンネルでも同じ
表現になっているので、音源が相似でその結果波形がウ
ェーブレット的に拡大・縮小されている場合には、常に
同じ形状の表現が得られる。波形の拡大・縮小は、この
表現においては垂直の周波数軸の方向への、活性度の分
布の単なる平行移動という形で表される。したがって、
音源の大きさと形状との双方に関する情報を表現してい
るという意味で、この表現を寸法−形状イメージ(Size
-Shape Image, SSI)と呼ぶことにする。後で述べるよ
うに、この表現は母音の聴覚図形を表現する時に特に有
効である。以上の処理の流れが図6のフローチャートに
示されたものである。
【0075】図10・図11の寸法−形状イメージにお
ける聴覚図形は、図7の聴覚イメージの一番左の聴覚図
形から上記の一連の手続きによって求められたものであ
る。しかし、必ずしも一番左の聴覚図形でなくてもかま
わず、2番目の聴覚図形でも良いし、どの信号のどの1
周期分を表現する聴覚図形(式C9)でも手続きを進め
る上では問題ない。
【0076】ただし、この例のような単純なクリック音
系列の場合にはどこを選んでも同じであるが、音声や楽
音等に雑音が付加された場合にはむしろ2番目の聴覚図
形を選んだ方が信号のみの成分を抽出するには有利であ
る。これは、雑音と信号の成分の両方が1番目の聴覚図
形に集中するためである。
【0077】寸法−形状イメージの横軸のh軸に沿った
周辺分布は、各チャンネルで形状が同じウェーブレット
フィルタのインパルス応答が主になるので、インパルス
周辺分布(ImpulseProfile)と呼ぶことにする(式C1
2)。これに対して縦軸に沿ったものは、聴覚スペクト
ル周辺分布(Spectral Profile)である(式C13)。
インパルス周辺分布は、従来からのスペクトルベクトル
とは異なる音源情報を持っている。各周辺分布はある一
時点における寸法−形状イメージを代表するベクトルで
あるので、たとえば一定間隔ごと(たとえば、5〜30
ms程度ごと)にこれらのベクトルを計算して時系列と
してスペクトログラムの形式に並べれば、音声認識に応
用できるようになる。この表現は、寸法−形状イメージ
スペクトログラムと呼ぶことができよう。 3.メリンイメージの構成 この節では、寸法−形状イメージ処理部17から出力さ
れた寸法−形状イメージから、メリンイメージ処理部1
8がメリンイメージを求める理由と処理過程を述べ、こ
のメリンイメージが図1のメリン変換処理部3から出力
されるメリンイメージに相当することを示す。
【0078】寸法−形状イメージ処理部17の出力する
寸法−形状イメージは、聴覚ウェーブレットフィルタの
応答が分布のほとんどを占めている。クリック系列音以
外が入力された時にこれらのインパルス応答線の右側に
出力されたであろう音源情報は相対的に小さくしか表現
されない。我々が抽出したいのは音源情報自体であるの
で、何らかの手段で聴覚フィルタ情報を何らかの逆畳み
込み法で取り除きたい。このために、この寸法−形状イ
メージの各hごとに垂直ベクトルをフーリエ変換してそ
の空間周波数成分の振幅で各ベクトルを表すことを考え
る。寸法−形状イメージ内の聴覚ウェーブレットフィル
タ情報は図10からもわかるように、各チャンネルであ
まり変化しないことから、空間周波数が極めて低い所に
その情報が集中するであろう。これに対し、クリック系
統音以外の音源からの音情報は、ウェーブレットフィル
タを強制的に励振して色々な周波数に別々のリンギング
を起こすので、空間周波数が比較的高い所に出てくるで
あろう。これにより、音源情報をウェーブレットフィル
タ自体の情報から分離することができる。
【0079】この計算は、インパルス周辺分布の式C1
2の中にある荷重関数W(αfb,h)を式C14で示される
対数周波数上で定義される荷重付き複素正弦波に置き換
えることによって実現できる。このとき空間角周波数c
/2πをパラメータとして導入してW(αfb,h,c)とし、
式C12に代入することによって、2次元表現の式C1
5を得ることができる。式C15から得られる出力M
I(h,c)をメリンイメージ(Mellin Image)18と呼ぶ
ことにする。この時横軸は、寸法−形状イメージと同じ
hで、縦軸はフーリエ変換の空間周波数c/2πであ
る。寸法−形状イメージにおける垂直方向への平行移動
は、フーリエ変換を通すと単なる位相の変化となって振
幅情報は不変である。また、寸法−形状イメージにおい
ては、すでに音源の周期性は取り除かれていて、h軸方
向は大きさ不変である。したがって、このメリンイメー
ジによって表現された聴覚図形は、音源の大きさや音源
励振の周期性に依存しない音源の形状情報を表現してい
ることになる。
【0080】クリック系列音の寸法−形状イメージの図
11から求めたメリンイメージを図12に示す。図12
から分かるように、このクリック系列音のメリンイメー
ジにおいては、非常に低い空間周波数にのみ活性度が集
中していて、高い周波数の所にはほとんど活性度がな
い。これは、上述のとおりクリック音が寸法−形状イメ
ージの中では垂線上に低周波数のチャンネル以外ほぼ平
坦な活性度しか生じさせないことを反映している。そも
そもウェーブレットフィルタのインパルス応答をどのチ
ャンネルでも同じ形となるように正規化したのが寸法−
形状イメージであるので、理論的には、単一のクリック
のみが入力された場合、空間周波数が零の所にのみ振幅
値が存在する。 4.メリンイメージとメリン変換の対応づけ 減衰振動波や母音の解析の例に移る前に、メリンイメー
ジ処理部18の出力として得られる、本例での周波数領
域での積分で表されるメリンイメージ(式C15)と、
基本的な説明として述べた時間間隔領域での積分で表さ
れるメリン変換処理部3から出力されるメリンイメージ
(式B10)との関係を考える。時間間隔と最大周波数
との積が一定という基本的な制約条件(式B9)の対数
をとると式C16となり、その微分から式C17が得ら
れる。式C15にこの関係を代入して式C10、式C1
1を利用すると式C18が得られる。これは、定数以
外、式B10と同様な時間間隔領域での積分の式になっ
ている。この事実は、メリンイメージ処理部18の出力
として得られる、本例での周波数領域での積分で表され
るメリンイメージ(式C15)と、基本的な説明として
述べた時間間隔領域での積分で表されるメリン変換処理
部3から出力されるメリンイメージ(式B10)とが同
じであることを示している。 5.減衰振動波の聴覚イメージ・寸法−形状イメージ・
メリンイメージ 繰返しのある指数減衰正弦波の聴覚イメージを図13に
示す。この指数減衰正弦波は、2msの半減期の指数包
絡線を持ち、2kHzの周波数の正弦波の搬送波を持
ち、繰返し周波数は100Hzである。このパラメータ
を持つ減衰正弦波は単一ホルマントの母音に類似してい
る。繰返される立ち上がりの部分は、クリックに似た応
答を周波数領域で2kHzから離れた所で垂線上の活性
度として生じさせていて、2つの垂直活性度の間隔は信
号の周期性を示している。図13の聴覚イメージから
は、2kHzの領域では、減衰包絡を持つ共振によっ
て、応答が強調されて伸びていることがわかる。これ
は、音声を含む自然界の音では共通に見られる特徴であ
る。
【0081】この減衰正弦波の聴覚図形の寸法−形状イ
メージを図14に示す。2kHzから離れた所の活性度
は図11のクリック系列音の場合とあまり変わらない。
しかし、2kHz周辺のチャンネルでは、活性度は高い
hの値まで伸びており、hの値が増えるにつれて次第に
隣接活性度の列の傾きが増していることがわかる。この
ことは、2kHzのチャンネル以外のチャンネルでの瞬
時周波数がウェーブレットフィルタの周波数すなわち各
チャンネルのフィルタの搬送波周波数になっているわけ
でないことを示している。
【0082】この減衰正弦波のメリンイメージを図15
に示す。立ち上がりの部分はクリック的なのでクリック
系列音の場合(図11)と同様に空間周波数が非常に低
い所に活性度が集中する。寸法−形状イメージの2kH
z領域の共振に関係する活性度は、メリンイメージ上で
はさらに垂直の帯状の活性領域を増やしていて、hが大
きい部分で広い空間周波数の応答があることを示してい
る。帯状活性領域の幅はhが大きくなるにつれ広くな
り、これは、微細構造において観測される隣接する活性
度の間の傾きがhの増大につれて大きくなっていること
に対応している。これは単一共振または単一ホルマント
の音源の特徴である。
【0083】減衰正弦波のメリンイメージの帯状構造の
うちこれ以外のパラメータを持つものは、搬送波の周波
数・包絡線の半減期・信号の繰返し周波数によってあま
り変化しない。すなわち、上記した帯状構造の相違によ
って、寸法や繰返し周波数と独立に音源の形状の情報を
取り出していることになる。垂直の帯状領域の強さや広
がりは減衰正弦波の半減期の増加とともにゆるやかに増
加する。次節では、例をさらに拡張し、声道断面積関数
を用いて合成した母音について同様な解析を行なう。 6.4種類の母音'a'の聴覚イメージ・寸法−形状イメ
ージ・メリンイメージ 寸法−形状イメージとメリンイメージとの、音源の寸法
に対する不変特性を示すために、4種類の合成母音の'
a'を作成した。この合成母音はひとりの男性の声道断面
積関数(Yang C-S and Kasuya, H.(1995)."Dimension
differeces inthe vocal tract shapes measure from
MR images across boy, female and male subjects,"
J. Acoust. Soc. Jpn (E), 16, pp.41-44.)を使って
声道モデルから合成した母音である。この声道形状の特
徴を寸法−形状イメージ・メリンイメージで抽出するこ
とを考える。
【0084】4種類のうちの1組2音声は、その声道断
面積関数をそのまま用い、異なる2周波数100Hzと
160Hzとの声帯パルスで励振したものである。これ
らの聴覚イメージを図16と図17に示す。声道の共振
は、聴覚イメージ上での共振領域での応答の伸びとして
見ることができる。これこそ音声学で呼ぶホルマントで
ある。第2・第3ホルマントは、おおよそ1000Hz
と2200Hzとに中心周波数を持っている。図中の垂
直活性度の集中位置は図17の方が図16よりも互いに
近くなっているが、声帯振動周波数によってはホルマン
トの位置は変化していないことが分かる。
【0085】2組目の2音声は、上記で用いた同じ声道
断面積関数を相似に保ったまま、声道の長さを2/3に
縮小して合成した場合である。声帯振動周波数は前と同
様100Hzと160Hzである。これらの母音の聴覚
イメージを図18と図19に示す。これらの図同士では
第2・第3ホルマントは同じ位置にあるが、元の図16
と図17の場合と比べると、3/2倍の周波数1500
Hzと3300Hzとにそれぞれ移動している。これ
は、声道長が短くなったためである。垂直活性度の位置
は、図16と図18、図17と図19でそれぞれ同じに
なっている。
【0086】これらの4母音の寸法−形状イメージを図
20〜図23に聴覚イメージの順番どおりに示す。これ
らの聴覚図形では、聴覚図形の左にある声帯パルスに対
する応答と右側に伸びるホルマントとの区別が強調され
ている。元々の長い声道からの音声の情報のパターン
(図20と図21)は基本的には同じになる。しかし、
波形上の繰返し周波数によって決まる聴覚図形の右側の
境界の位置だけは互いに異なり、高いピッチの図21の
方が範囲が狭い。同様に、短い声道の母音(図22と図
23)の寸法−形状イメージでも両者のパターンは同じ
で、やはり右側の境界の位置だけが異なる。
【0087】さらに、長い声道と短い声道での寸法−形
状イメージを比べると、下から4つのホルマントの応答
パターンがそれぞれ非常に類似していることがわかる。
異なるのは、長い声道の図20と図21とのパターンに
くらべて短い声道の図22と図23とのパターンは周波
数の上方に平行移動している点である。長い声道の図2
0と図21の寸法−形状イメージで見える第5・第6ホ
ルマントは、図22と図23とでは上限周波数6000
Hzの上に同じ量だけ移動してしまって見えなくなって
いるが、図の周波数範囲を上方に広げれば見えるように
なる。
【0088】これらの4母音のメリンイメージを図24
〜図27に聴覚イメージや寸法−形状イメージの順番ど
おりに示す。メリンイメージの縦軸はメリン係数c/2
πで、これは寸法−形状イメージの垂直方向に対する空
間周波数に相当し、100Hzから6000Hzまでの
範囲での1周期が空間周波数1に対応する。あるhの値
に対するメリンイメージの値は、寸法−形状イメージの
垂直方向に複素正弦波を用いて積分した後の絶対値で、
空間周波数と活性度の分布とに最も合致するものが大き
くなる。
【0089】図20〜図23を参照して、母音'a'の寸
法−形状イメージのhの整数の5ぐらいまでは、声帯パ
ルスの応答が4サイクル/周波数範囲以下の低い空間周
波数に活性度が見られる。hが2以上になると、ホルマ
ントが寸法−形状イメージ中の別々の帯に値が大きい所
として現れる。hが2から8に増えると最も良く整合す
る周波数が6から18程度と、値が大きいところが出て
くる。hが8以上では、寸法−形状イメージでみると一
つしかホルマントがなく、それによってメリンイメージ
に幅広い帯状活性領域ができることがわかる。これが、
これらの4母音'a'のメリンイメージを示す図20〜図
23での、共通特性でもっとも特徴的である。 7.日本語の5母音'a,i,u,e,o'の寸法−形状イメージ
とメリンイメージ 寸法−形状イメージとメリンイメージとにおいて、異な
る母音がどのように表現されるか示すために、日本語5
母音の組を解析した。同一の声道モデルで同一の男性話
者であるが、異なる声道断面積関数(上記Yang and Kas
uya, 1995)を使って異なる5母音を合成した。すべ
て、計測通りの声道断面積・声道長を用いて、100H
zの声帯パルスで駆動することにより合成した。5母
音'a, e, i,o, u'についてこの順番で、聴覚イメージを
図28〜図32、寸法−形状イメージを図33〜図3
7、メリンイメージを図38〜図42に、それぞれ示
す。
【0090】聴覚イメージと寸法−形状イメージとを比
べると、時間間隔軸の対数変換が、ホルマントの強調の
仕方を変化させていることがわかる。たとえば、母音'
a'(図28)においては、第2ホルマントの共振の継続
長が第4ホルマントに対して3倍くらい長くなってい
る。しかし、寸法−形状イメージ(図33)においては
時間周波数積の軸hに対して第2ホルマントの共振の継
続長が第4ホルマントに対して同程度からやや短くなっ
ている。このような表現の変換がなければ、メリン変換
を周波数軸に対し直接取っても高次のホルマントの役割
はほとんど見えなくなるであろう。寸法−形状イメージ
におけるチャンネルの補正が、ウェーブレットインパル
ス応答と音源の性質による応答とを分けるのに有効に働
いている。
【0091】まず、前節で説明した'a'(図33と図3
8)と'e'(図34と図39)との寸法−形状イメージ
とメリンイメージとを比較する。'e'(図34)の寸法
−形状イメージの中の高次ホルマントは'a'のものより
も集まっていて、高いh値まで伸びている。これによ
り、'e'メリンイメージは'a'メリンイメージと異なり、
空間周波数c/2πが低い4のあたりと12〜16あた
りで値が大きく、さらにhの高い所までその値が伸びて
いる。
【0092】母音'i'(図35と図40)では、'e'と同
様高次ホルマントが群をなしているがさらに集中してい
る。これが、hの2〜6でのc/2πが8あたりの値の
大きい所を生じさせている。hが4以上ではc/2πが
15〜20くらいに活性領域が移動している。さら
に、'i'の寸法−形状イメージでの共振領域の伸びから
もわかるように、15以上の高いhの値まで幅広い帯状
領域が広がっている。
【0093】'o'の寸法−形状イメージ(図36)で
は、第1・第2ホルマントの組と残りの3ホルマントの
組との間(1200Hz〜2800Hz程度)に大きな
周波数の隔たりがある。これにより、図41の'o'のメ
リンイメージではc/2πが4以下の活性度はあまり大
きくない。第1ホルマントがある範囲、すなわち図36
でhが5までの範囲で、c/2πが5〜8くらいの所で
第1と第2ホルマントの間隔を反映している活性度があ
るが、第1ホルマントが消えるとc/2πが12〜20
くらいでの高次ホルマントの間隔を反映する活性度が主
になる。継続して続く高次ホルマントの群はhが高い所
での低い空間周波数の拡散した活性度に反映して、他の
母音との違いを示している。
【0094】母音'u'(図37と図42)は、他の母音
と比べ単純で、ホルマントの共振帯域幅が広いために、
寸法−形状イメージやメリンイメージでのhの値の大き
い所まで活性度が伸びていない。これが、この母音の特
徴を表しているのであろうが、それゆえhやc/2πが
大きい所での区別しやすい特徴を失っている。hが2〜
5の範囲ではc/2πが7あたりで強い活性度があり、
hが4〜5の範囲では13くらいにある。帯状領域はh
が10以上にほとんど存在せず、他の母音では'a'に近
い。
【0095】このように、各々の母音のメリンイメージ
は特徴的に異なり、これらの相違からそれぞれの違いを
容易に抽出できる。 8.音声認識装置 前節までで、音源が同じ形状ではほぼ同じになり、異な
る場合は特徴的に異なるという、メリンイメージの優れ
た特徴を示してきた。このようなメリンイメージの情報
を用いると、優れた音声認識装置を実現できる。たとえ
ば、メリンイメージの縦軸方向または横軸方向に向かっ
て活性度を加えあわせると、それぞれ1次元ベクトルの
周辺分布が得られる。これらのベクトルの両方または片
方を一列に並べて1次元ベクトルとすれば、聴覚イメー
ジのある一時点における特徴を表わす特徴ベクトルとな
る。
【0096】この特徴ベクトルを聴覚イメージのたとえ
ば一定間隔ごと(たとえば、5〜30ms程度ごと)に
計算して、順次縦軸に並べてスペクトログラムの形式に
すれば、メリンイメージスペクトログラムとでも呼べる
表現が得られる。前述の寸法−形状イメージスペクトロ
グラムと合わせても、現在広く使われている音声認識回
路19(図4)にそのまま入力できる。各々の周辺分布
は一時点の音源情報を代表するベクトルで、従来の振幅
スペクトルより豊かな情報量を持っている。これによ
り、従来より優れた音声認識結果20を得られる。これ
が本発明の最大の長所である。 第2の実施の形態 図43は、声道の大きさの違う大人・子供にかかわらず
応用できる、他言語の練習または障害からのリハビリテ
ーション用の発声練習装置に本発明を適用した実施の形
態の装置を示す。この装置は、入力される音声を電気信
号に変換するためのマイクロホン29と、マイクロホン
29の出力する電気信号を増幅するための増幅器30
と、増幅器30によって増幅された電気信号をアナログ
/デジタル変換するためのA−D変換器31と、A−D
変換器31から出力されるデジタル信号を受けて音声信
号処理を行なうためのプログラムを実行する汎用コンピ
ュータ32と、汎用コンピュータ32の出力に基づいて
音韻、単語文字、特徴量を表示するための音韻・単語文
字・特徴量表示装置33と、汎用コンピュータ32の出
力するデジタルの音声信号をアナログ信号に変換するた
めのD−A変換器34と、D−A変換器34によってア
ナログ信号に変換された音声信号を増幅するための増幅
器35と、増幅器35から与えられる音声信号を音声に
変換するためのスピーカまたはヘッドホン36とを含
む。
【0097】マイクロホン29の出力する、音声を表わ
す電気信号は増幅器30およびA−D変換器31を通っ
て汎用コンピュータ32に入力される。汎用コンピュー
タ32は、後述するような処理をこの電気信号に対して
行ない、その結果を表わす信号を音韻・単語文字・特徴
量表示装置33およびD−A変換器34に与える。汎用
コンピュータ32の出力は、音韻・単語文字・特徴量表
示装置33により視覚的に提示され、また、D−A変換
器34・増幅器35を通してスピーカまたはヘッドホン
36によって聴覚的に提示される。
【0098】この汎用コンピュータでは、図44のフロ
ーチャートに従った処理が行なわれる。まず、既に説明
した安定化ウェーブレット変換が行なわれる。その情報
を用いて、ピッチ周波数・寸法−形状イメージ・メリン
イメージが並列的に計算される。
【0099】寸法−形状イメージの計算では、話者の声
道長に関する情報が計算され、メリンイメージでは声道
長を正規化した表現が算出される。それらをあらかじめ
蓄積されている標準テンプレートと比較することによ
り、話者がしゃべった音韻や文字列を判断してそれを視
覚提示情報として出力したり、話者の声道長やピッチ情
報に合わせた合成音として聴覚提示情報として出力した
りする。
【0100】発声練習装置として用いるために、練習問
題の生成等の教示情報からも視覚・聴覚提示ができるよ
うになっている。これにより、標準テンプレートを大人
でも子供でもすべての場合に用意する必要がないにもか
かわらず正確な音韻判断ができるので、効率的な練習の
ための装置として有効である。 第3の実施の形態 図45は、大きさの違う青果・果物・食物の品質の自動
選別器に本発明を応用した実施の形態である。この自動
選別器は、選別の対象となる物体に対して音波を照射す
るためのスピーカ37、増幅器38およびD−A変換器
39と、選別する品物から戻ってくる音波を受信するた
めのマイクロホン40と、マイクロホン40の出力を増
幅するための増幅器41と、増幅器41の出力をデジタ
ル信号に変換するためのA−D変換器42と、A−D変
換器42から与えられる信号に対して後述する処理を行
なうためのコンピュータ43と、コンピュータ43から
出力される制御信号にしたがって品物の選別を行なうた
めの品質等級分別装置44と、コンピュータ43の出力
する情報を表示するための表示装置45と、コンピュー
タ43の出力にしたがって警告を発するためのアラーム
装置46とを含む。
【0101】コンピュータ43で行なわれる処理を図4
6に示す。コンピュータ43はスピーカ37から品物に
向けて発射される音声のための送信信号の生成を行な
い、D−A変換器39に与える。コンピュータ43はさ
らに、出力信号の生成パラメータと、スピーカ37から
発生された音声に応答して品物により反射され、マイク
ロホン40、増幅器41およびA−D変換器42を介し
て電気信号に変換されてコンピュータ43に与えられた
受信信号とに基づいて、安定化ウェーブレット変換、寸
法−形状イメージ、メリンイメージの計算を実行して、
品物の大きさに依存しない、品物の内部状態に関する表
現を得る。コンピュータ43は、得られた表現と、あら
かじめ蓄積してある標準テンプレートとを比較すること
により、品物の品質等級を決定して、その決定結果を出
力する。出力と標準テンプレートとのずれが所定の値よ
りも大きい場合には、コンピュータ43は品物に欠陥が
あると判断して表示装置45およびアラーム装置46に
よる診断結果の出力を行なう。
【0102】この実施の形態の装置により、ばらつきが
ある品物の大きさに依存せず、その内部状態だけに依存
した有効な選別ができるようになる。このシステムは、
上記のような品物だけではなく、身体の診断、鉄や金属
製品、陶磁器等の製品の欠陥判断にも適用できる。 第4の実施の形態 この第4の実施の形態の装置は、基本的には第3の実施
の形態と同じ構成を有し、コンピュータで計算されたイ
メージを表示するための表示装置45(モニタ等)をさ
らに含む。この表示装置45により、大きさを正規化し
た表現を視覚的に提示する手段が得られ、人間が対象物
の特性を直接判断できるようになる。また、欠陥判断を
してアラームを鳴らす装置46を設ければ、装置の欠陥
を自動診断できるようになる。これにより第3の実施の
形態だけではない、ソナー信号の処理一般に本発明を応
用することができる。
【0103】本発明の応用としては、他にもさまざまな
ものが考えられる。たとえば、本発明によって対象物の
大きさに依存しない表現が得られるため、建築の分野に
おいては、コンサートホールのミニチュアモデルで計測
を行なえば、建設後のコンサートホールの音響特性を予
測できる。建築構造物自体の音波による老朽化診断も挙
げられる。また、水中でのソナー信号の解析への応用も
可能となる。 第5の実施の形態 図47は、様々な大きさのエンジンの故障診断に本発明
を適用した第5の実施の形態である。自動車・船舶等の
エンジンに取り付けた振動センサかマイクロホン47の
出力信号を増幅器41、A−D変換器42を通してコン
ピュータ50に入力する。コンピュータ50によって欠
陥や故障の判断が行なわれその情報の表示装置51、ア
ラーム装置52、エンジンの制御装置53が制御され
る。また直接イメージ出力する装置54も付けられる。
【0104】このコンピュータ50では、図48で示さ
れる処理が行なわれている。図48を参照して、入力さ
れた準周期的な信号に基づいて、安定化ウェーブレット
変換が行なわれ、その結果から寸法−形状イメージ、お
よびメリンイメージが計算される。これらイメージと、
あらかじめ蓄積してある標準テンプレートとを比較する
ことにより、エンジンの状態を診断して結果を出力す
る。この時、結果として欠陥の有無という2値的な信号
が得らるようにすれば、この信号で欠陥・故障表示装置
やアラーム装置を制御することができる。これに対し、
標準パターンとの距離尺度をあらかじめ決定しておい
て、どれくらい類似しているかの距離を計算して連続量
として出力することもできる。この情報はエンジンの回
転等の異常の度合いを示すことになるのでエンジンの制
御装置を制御する信号として用いることができる。ま
た、直接イメージを出力すれば人間が視覚的に故障判断
を行なうこともできる。
【0105】エンジンの形状は同じでも、排気量は目的
に応じて変わる。同じエンジンの族ではたとえその寸法
が異なっていても本発明を用いると同じ表現を用いるこ
とによりその状態を判断できる。したがって本発明によ
るエンジン状態の判断装置は、種々の大きさのエンジン
について、有効に共通の故障原因などを判定することが
できる。
【0106】さらには、建築物に取り付けたセンサから
の出力を用いれば、建築物の欠陥診断にも応用でき、地
震波の信号を用いれば、震源の大きさに依存しない共通
の特徴をみつけることができる。また、本発明によれ
ば、人工物であるか自然物であるか、またはどのような
物理系により測定された信号かにかかわらず、信号源か
らの信号であれば何を入力としてもよい。例えば、心臓
拍動音や脳波信号等の生体信号をピックアップすれば、
その身体や頭の大きさに依存しない表現が得られるの
で、良好な診断結果を出すこともできる。
【0107】以上のようにこの発明による安定化ウェー
ブレット−メリン変換によれば、基本的に音源の物理的
な大きさに依存しない信号表現(例えば音声の場合、男
性・女性・子供によって異なる声道長を正規化した表
現)、または、時系列データの場合には自己相似性(フ
ラクタル性)を正規化した表現が得られる。すなわち、
大きな部分を構成する一部分がもとの大きな部分と共通
の構成を持っている事象については、大きな部分とそれ
を構成する小さな部分との双方について同じ表現が得ら
れるということである。これは従来の自己回帰モデルや
スペクトル分析では行ないづらかったことで、従来の時
系列データ処理の限界を超えうる信号処理が可能とな
る。また、この過程で正規化できない要素は逆に分離で
きるので音声であれば個人認証等に有効に活用できる。
このように音源の物理的大きさや自己相似性の正規化が
必要となる信号処理に広く利用できる。
【0108】今回開示された実施の形態はすべての点で
例示であって制限的なものではないと考えられるべきで
ある。本発明の範囲は上記した説明ではなくて特許請求
の範囲によって示され、特許請求の範囲と均等の意味お
よび範囲内でのすべての変更が含まれることが意図され
る。
【0109】以下は説明中で引用した付録である。
【0110】
【数1】
【0111】
【数2】
【0112】
【数3】
【0113】
【数4】
【図面の簡単な説明】
【図1】 この発明の原理を説明する概略ブロック図で
ある。
【図2】 図1の安定化ウェーブレット処理部2のブロ
ック図である。
【図3】 図1および図2に関連するフローチャートで
ある。
【図4】 この発明の第1の実施の形態の音声認識装置
の概略ブロック図である。
【図5】 図4の事象検出(ピッチ検出)回路15およ
び安定化聴覚イメージ処理部16のブロック図である。
【図6】 図4および図5に関連するフローチャートで
ある。
【図7】 クリック系列音の安定化聴覚イメージの例を
示す図である。
【図8】 図7からフィルタの遅れに相当する分だけ補
正した安定化聴覚イメージを示す図である。
【図9】 図8の横軸の時間間隔軸を対数変換して表示
した安定化聴覚イメージを示す図である。
【図10】 すべてのチャンネルでウェーブレットフィ
ルタのインパルス応答が縦方向にそろうように補正した
安定化聴覚イメージを示す図である。
【図11】 図10に示される安定化聴覚イメージを、
横軸の時間間隔周波数積hが線形軸となるように変換し
て表した図である。
【図12】 クリック系列音のメリンイメージを示す図
である。
【図13】 指数減衰正弦波の聴覚イメージを示す図で
ある。
【図14】 指数減衰正弦波の寸法−形状イメージを示
す図である。
【図15】 指数減衰正弦波のメリンイメージを示す図
である。
【図16】 測定した男性話者の声道断面積関数を用い
て声道モデルより合成した日本語母音'a'の聴覚イメー
ジ(声帯パルスの繰返し周波数100Hz)を示す図で
ある。
【図17】 図16と同じ条件だが、声帯パルスの繰返
し周波数160Hzで合成した、日本語母音'a'の聴覚
イメージを示す図である。
【図18】 図16の声道断面積関数に対して声道長を
2/3に縮小して、声道モデルより合成した日本語母
音'a'の聴覚イメージ(声帯パルスの繰返し周波数10
0Hz)を示す図である。
【図19】 図18と同じ条件だが、声帯パルスの繰返
し周波数160Hzで合成した、日本語母音'a'の聴覚
イメージを示す図である。
【図20】 図16に対する寸法−形状イメージを示す
図である。
【図21】 図17に対する寸法−形状イメージを示す
図である。
【図22】 図18に対する寸法−形状イメージを示す
図である。
【図23】 図19に対する寸法−形状イメージを示す
図である。
【図24】 図16に対するメリンイメージを示す図で
ある。
【図25】 図17に対するメリンイメージを示す図で
ある
【図26】 図18に対するメリンイメージを示す図で
ある。
【図27】 図19に対するメリンイメージを示す図で
ある。
【図28】 測定した声道断面積関数を用いて声道モデ
ルより合成した日本語母音'a'の聴覚イメージ(声帯パ
ルスの繰返し周波数100Hz。)を示す、図16と同
一の図である。
【図29】 図28と同じ男性話者で測定した'e'の声
道断面積関数を用いて声道モデルより合成した日本語母
音'e'の聴覚イメージ(声帯パルスの繰返し周波数10
0Hz)を示す図である。
【図30】 図28と同じ男性話者で測定した'i'の声
道断面積関数を用いて声道モデルより合成した日本語母
音'i'の聴覚イメージ(声帯パルスの繰返し周波数10
0Hz)を示す図である。
【図31】 図28と同じ男性話者で測定した'o'の声
道断面積関数を用いて声道モデルより合成した日本語母
音'o'の聴覚イメージ(声帯パルスの繰返し周波数10
0Hz)を示す図である。
【図32】 図28と同じ男性話者で測定した'u'の声
道断面積関数を用いて声道モデルより合成した日本語母
音'u'の聴覚イメージ(声帯パルスの繰返し周波数10
0Hz)を示す図である。
【図33】 図28に対する寸法−形状イメージを示す
図である。
【図34】 図29に対する寸法−形状イメージを示す
図である。
【図35】 図30に対する寸法−形状イメージを示す
図である。
【図36】 図31に対する寸法−形状イメージを示す
図である。
【図37】 図32に対する寸法−形状イメージを示す
図である。
【図38】 図28に対するメリンイメージを示す図で
ある。
【図39】 図29に対するメリンイメージを示す図で
ある。
【図40】 図30に対するメリンイメージを示す図で
ある。
【図41】 図31に対するメリンイメージを示す図で
ある。
【図42】 図32に対するメリンイメージを示す図で
ある。
【図43】 第2の実施の形態の発声練習装置のブロッ
ク図である。
【図44】 第2の実施の形態の汎用コンピュータが行
なっている処理のフローチャートである。
【図45】 第3の実施の形態の品物品質等級分別装置
および第4の実施の形態のソナーシステムのブロック図
である。
【図46】 第3の実施の形態・第4の実施の形態の
コンピュータが行なっている処理のフローチャートであ
る。
【図47】 第5の実施の形態のエンジン故障診断装置
のブロック図である。
【図48】 第5の実施の形態のコンピュータが行なっ
ている処理のフローチャートである。
【符号の説明】
2 安定化ウェーブレット変換処理部、3 メリン変換
処理部、4 信号処理部、7 ウェーブレット変換部、
8 振幅圧縮部、9 事象検出処理部、10時間間隔安
定化処理部、13 聴覚フィルタバンク、14 聴神経
発火パターン変換部、15 事象検出回路、16 安定
化聴覚イメージ処理部、17 寸法−形状イメージ処理
部、18 メリンイメージ処理部、19 音声認識回
路、 22 フィルタ遅れ補正部、25 聴覚図形抽出
部、26 対数時間間隔表現への変換部、27 インパ
ルス応答分補正部。
───────────────────────────────────────────────────── フロントページの続き (72)発明者 ロイ・ディ・パターソン イギリス、ダブリュ・1・エヌ 4・エ イ・エル ロンドン、パーク・クレセン ト、20 メディカル・リサーチ・カウン シル内 (56)参考文献 入野俊夫、「聴覚末梢系の計算理 論」、電子情報通信学会技術研究報告, Vol.95、No.140(SP95−40)、 p.23−p.30(1995.7) 森口、宇田川、一松、「岩波 数学公 式 ▲II▼ 級数・フーリェ解析」、 株式会社岩波書店(1987新装第1刷)、 p.307−p.310 (58)調査した分野(Int.Cl.7,DB名) G06F 17/14 G10L 15/02 G10L 19/02 JICSTファイル(JOIS)

Claims (16)

    (57)【特許請求の範囲】
  1. 【請求項1】 入力信号をコンピュータにおいてウェー
    ブレット変換するウェーブレット変換ステップと、 前記ウェーブレット変換するステップの出力をコンピ
    ュータにおいて前記入力信号の周期に同期させてメリン
    変換することによって信号の特性を抽出する特性抽出ス
    テップとを含む、信号処理方法。
  2. 【請求項2】 前記特性抽出ステップは、 前記ウェーブレット変換ステップによって得たランニン
    グスペクトルに相当する表現を、前記入力信号の各周期
    に同期させて時間的に安定化させて時間間隔−対数周波
    数表現に変換するステップと、 前記時間間隔−対数周波数表現において、時間間隔と周
    波数との積または比の値が一定となる線に沿って、メリ
    ン変換するステップとを含む、請求項1に記載の信号処
    理方法。
  3. 【請求項3】 前記ウェーブレット変換ステップは、 人の聴覚フィルタバンクの特性を模擬するように予めパ
    ラメータが設定されたウェーブレット変換のための核関
    数群を用いて前記入力信号を積分変換するステップと、 前記積分変換された前記入力信号を半波整流して出力す
    るステップとを含む、請求項1〜請求項2のいずれかに
    記載の信号処理方法。
  4. 【請求項4】 入力信号の、原点が特定され時間間隔
    −対数周波数表現において、時間間隔軸を対数変換した
    対数時間間隔−対数周波数表現をコンピュータを用いて
    得るステップと、 さらにコンピュータを用いて、前記対数時間間隔−対数
    周波数表現を時間間隔と周波数との積を横軸に対数周波
    数を縦軸に持つ新たな表現に変換し、その縦軸方向また
    は横軸方向に沿って積分変換を行なうことによって前記
    入力信号の特性を抽出するステップとを含む、信号処理
    方法。
  5. 【請求項5】 前記積分変換により抽出された前記入力
    信号の特性をベクトル表現し、さらにこれらベクトルの
    時系列として前記入力信号の経時的な特性を表現するス
    テップをさらに含む、請求項に記載の信号処理方法。
  6. 【請求項6】 コンピュータによって処理可能な予め定
    める形式に変換した入力信号をウェーブレット変換する
    ためのウェーブレット変換手段と、 前記ウェーブレット変換手段の出力を前記入力信号の周
    に同期させてメリン変換することによって信号の特性
    を抽出するための特性抽出手段とを含む、信号処理装
    置。
  7. 【請求項7】 前記特性抽出手段は、 前記ウェーブレット変換手段によって得たランニングス
    ペクトルに相当する表現を、前記信号の各周期に同期さ
    せて時間的に安定化させて時間間隔−対数周波数表現に
    変換するための手段と、 前記時間間隔−対数周波数表現において、時間間隔と周
    波数との積または比の値が一定となる線に沿って、メリ
    ン変換するための手段とを含む、請求項6に記載の信号
    処理装置。
  8. 【請求項8】 前記ウェーブレット変換手段は、 人の聴覚フィルタバンクの特性を模擬するように予めパ
    ラメータが設定されたウェーブレット変換のための核関
    数群を用いて前記入力信号を積分変換するための手段
    と、 前記積分変換された前記入力信号を半波整流して出力す
    るための手段とを含む、請求項6〜請求項7のいずれか
    に記載の信号処理装置。
  9. 【請求項9】 コンピュータによって処理可能な形式に
    変換した入力信号の、原点が特定され時間間隔−対
    数周波数表現において、時間間隔軸を対数変換した対数
    時間間隔−対数周波数表現を得るための手段と、 さらに前記対数時間間隔−対数周波数表現を時間間隔と
    周波数との積を横軸に対数周波数を縦軸に持つ新たな表
    現に変換し、その縦軸方向または横軸方向に沿って積分
    変換を行なうことによって前記入力信号の特性を抽出す
    るための手段とを含む、信号処理装置。
  10. 【請求項10】 さらに、前記積分変換により得られた
    前記入力信号の特性をベクトル表現し、さらにこれら
    現ベクトルの時系列として前記入力信号の経時的な特性
    表現するための手段をさらに含む、請求項に記載の
    信号処理装置。
  11. 【請求項11】 各々入力信号を受けるように接続され
    た、互いに同一のウェーブレット核関数を持ちそれぞれ
    別個の周波数を持つウェーブレットにより変換を行なう
    複数個のウェーブレットフィルタからなるウェーブレッ
    フィルタバンクと、 前記ウェーブレットフィルタバンクの出力を受けるよう
    に接続され、前記ウェーブレットフィルタバンクの出力
    から、聴覚図形を抽出するための聴覚図形抽出手段と、 前記聴覚図形抽出手段によって抽出された聴覚図形から
    前記入力信号の寸法−形状イメージを生成するための寸
    法−形状イメージ生成手段と、 前記寸法−形状イメージから前記入力信号の特徴を抽出
    するための特徴抽出手段とを含む、信号処理装置。
  12. 【請求項12】 前記特徴抽出手段は、前記寸法−形状
    イメージに対して、各前記ウェーブレットフィルタのイ
    ンパルス応答線に沿ってフーリエ変換を行なうことによ
    りメリンイメージを生成するためのメリンイメージ生成
    手段を含む、請求項11に記載の信号処理装置。
  13. 【請求項13】 前記聴覚図形抽出手段は、 前記ウェーブレットフィルタバンクの出力に含まれる周
    期性を検出することにより、前記ウェーブレットフィル
    タバンクの各チャンネルの出力に対して時間ストローブ
    積分を行ない安定化された聴覚イメージを生成するため
    の時間ストローブ積分手段と、 前記時間ストローブ積分手段の検出した周期性に基づい
    て、前記時間ストローブ積分によって得られた安定化さ
    れた聴覚イメージのうちの一周期を前記聴覚図形として
    抽出するための安定化聴覚イメージ抽出手段とを含む、
    請求項12に記載の信号処理装置。
  14. 【請求項14】 前記安定化聴覚イメージ抽出手段は、
    前記安定化聴覚イメージの一番目の周期を前記聴覚図形
    として抽出するための手段を含む、請求項13に記載の
    信号処理装置。
  15. 【請求項15】 前記安定化聴覚イメージ抽出手段は、
    前記安定化聴覚イメージの二番目の周期を前記聴覚図
    形として抽出するための手段を含む、請求項13に記載
    の信号処理装置。
  16. 【請求項16】 さらに、前記ウェーブレットフィルタ
    バンクの出力を半波整流して前記聴覚図形抽出手段に与
    えるための手段を含む、請求項11に記載の信号処理装
    置。
JP2000015517A 1999-01-28 2000-01-25 信号処理方法および装置 Expired - Fee Related JP3174777B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2000015517A JP3174777B2 (ja) 1999-01-28 2000-01-25 信号処理方法および装置

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
JP2013799 1999-01-28
JP11-20137 1999-01-28
JP2000015517A JP3174777B2 (ja) 1999-01-28 2000-01-25 信号処理方法および装置

Publications (2)

Publication Number Publication Date
JP2000285104A JP2000285104A (ja) 2000-10-13
JP3174777B2 true JP3174777B2 (ja) 2001-06-11

Family

ID=26357043

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2000015517A Expired - Fee Related JP3174777B2 (ja) 1999-01-28 2000-01-25 信号処理方法および装置

Country Status (1)

Country Link
JP (1) JP3174777B2 (ja)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2010038386A1 (ja) * 2008-09-30 2010-04-08 パナソニック株式会社 音判定装置、音検知装置及び音判定方法
WO2010038385A1 (ja) * 2008-09-30 2010-04-08 パナソニック株式会社 音判定装置、音判定方法、及び、音判定プログラム
JP2013511045A (ja) * 2009-11-12 2013-03-28 ポール リード スミス ギターズ、リミテッド パートナーシップ デジタル信号処理のための方法、コンピュータ可読ストレージ媒体および信号処理システム
US9390066B2 (en) 2009-11-12 2016-07-12 Digital Harmonic Llc Precision measurement of waveforms using deconvolution and windowing
US9600445B2 (en) 2009-11-12 2017-03-21 Digital Harmonic Llc Precision measurement of waveforms

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
SE517026C2 (sv) * 2000-11-17 2002-04-02 Forskarpatent I Syd Ab Metod och anordning för talanalys
JP2004012322A (ja) * 2002-06-07 2004-01-15 Japan Atom Power Co Ltd:The 半導体検出器の劣化診断装置
GB0214729D0 (en) * 2002-06-26 2002-08-07 Koninkl Philips Electronics Nv Digital receiver arrangement and related method
US7516074B2 (en) * 2005-09-01 2009-04-07 Auditude, Inc. Extraction and matching of characteristic fingerprints from audio signals
CN113589208A (zh) * 2021-07-23 2021-11-02 深圳市联影高端医疗装备创新研究院 射频系统的频率确定方法、装置、磁共振设备及存储介质

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
入野俊夫、「聴覚末梢系の計算理論」、電子情報通信学会技術研究報告,Vol.95、No.140(SP95−40)、p.23−p.30(1995.7)
森口、宇田川、一松、「岩波 数学公式 ▲II▼ 級数・フーリェ解析」、株式会社岩波書店(1987新装第1刷)、p.307−p.310

Cited By (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2010038386A1 (ja) * 2008-09-30 2010-04-08 パナソニック株式会社 音判定装置、音検知装置及び音判定方法
WO2010038385A1 (ja) * 2008-09-30 2010-04-08 パナソニック株式会社 音判定装置、音判定方法、及び、音判定プログラム
JP4545233B2 (ja) * 2008-09-30 2010-09-15 パナソニック株式会社 音判定装置、音判定方法、及び、音判定プログラム
JP4547042B2 (ja) * 2008-09-30 2010-09-22 パナソニック株式会社 音判定装置、音検知装置及び音判定方法
JPWO2010038385A1 (ja) * 2008-09-30 2012-02-23 パナソニック株式会社 音判定装置、音判定方法、及び、音判定プログラム
JPWO2010038386A1 (ja) * 2008-09-30 2012-02-23 パナソニック株式会社 音判定装置、音検知装置及び音判定方法
JP2013511045A (ja) * 2009-11-12 2013-03-28 ポール リード スミス ギターズ、リミテッド パートナーシップ デジタル信号処理のための方法、コンピュータ可読ストレージ媒体および信号処理システム
US9279839B2 (en) 2009-11-12 2016-03-08 Digital Harmonic Llc Domain identification and separation for precision measurement of waveforms
US9390066B2 (en) 2009-11-12 2016-07-12 Digital Harmonic Llc Precision measurement of waveforms using deconvolution and windowing
US9600445B2 (en) 2009-11-12 2017-03-21 Digital Harmonic Llc Precision measurement of waveforms

Also Published As

Publication number Publication date
JP2000285104A (ja) 2000-10-13

Similar Documents

Publication Publication Date Title
Irino et al. Segregating information about the size and shape of the vocal tract using a time-domain auditory model: The stabilised wavelet-Mellin transform
Banbrook et al. Speech characterization and synthesis by nonlinear methods
JP6290858B2 (ja) 発話の入力オーディオエンコーディングを、対象歌曲にリズム的に調和する出力へと自動変換するための、コンピュータ処理方法、装置、及びコンピュータプログラム製品
EP0219109B1 (en) Method of analyzing input speech and speech analysis apparatus therefor
US6862558B2 (en) Empirical mode decomposition for analyzing acoustical signals
US8280724B2 (en) Speech synthesis using complex spectral modeling
JP4516157B2 (ja) 音声分析装置、音声分析合成装置、補正規則情報生成装置、音声分析システム、音声分析方法、補正規則情報生成方法、およびプログラム
US6675140B1 (en) Mellin-transform information extractor for vibration sources
Chaki Pattern analysis based acoustic signal processing: a survey of the state-of-art
JP3174777B2 (ja) 信号処理方法および装置
Narendra et al. Robust voicing detection and F 0 estimation for HMM-based speech synthesis
JP3673507B2 (ja) 音声波形の特徴を高い信頼性で示す部分を決定するための装置およびプログラム、音声信号の特徴を高い信頼性で示す部分を決定するための装置およびプログラム、ならびに擬似音節核抽出装置およびプログラム
Narendra et al. Estimation of the glottal source from coded telephone speech using deep neural networks
WO2002065157A2 (en) Empirical mode decomposition for analyzing acoustical signals
CN108369803A (zh) 用于形成基于声门脉冲模型的参数语音合成系统的激励信号的方法
Cherif et al. Pitch detection and formant analysis of Arabic speech processing
Rodriguez et al. A fuzzy information space approach to speech signal non‐linear analysis
JP2010060846A (ja) 合成音声評価システム及び合成音声評価方法
Rodet et al. Spectral envelopes and additive+ residual analysis/synthesis
Wang et al. Beijing opera synthesis based on straight algorithm and deep learning
Orio A model for human-computer interaction based on the recognition of musical gestures
KR100484666B1 (ko) 성도특성 변환을 이용한 음색변환장치 및 방법
JP4177751B2 (ja) 声質モデル生成方法、声質変換方法、並びにそれらのためのコンピュータプログラム、当該プログラムを記録した記録媒体、及び当該プログラムによりプログラムされたコンピュータ
JP7079455B1 (ja) 音響モデル学習装置、方法およびプログラム、並びに、音声合成装置、方法およびプログラム
TWI395200B (zh) 一種不用樣本能辨認所有語言的辨認方法

Legal Events

Date Code Title Description
TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20010313

R150 Certificate of patent or registration of utility model

Ref document number: 3174777

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313117

R371 Transfer withdrawn

Free format text: JAPANESE INTERMEDIATE CODE: R371

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313117

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080330

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090330

Year of fee payment: 8

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090330

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100330

Year of fee payment: 9

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100330

Year of fee payment: 9

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110330

Year of fee payment: 10

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120330

Year of fee payment: 11

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120330

Year of fee payment: 11

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130330

Year of fee payment: 12

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140330

Year of fee payment: 13

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

S531 Written request for registration of change of domicile

Free format text: JAPANESE INTERMEDIATE CODE: R313531

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

LAPS Cancellation because of no payment of annual fees