JPS6088327A - 音響解析装置の主スペクトル抽出装置 - Google Patents
音響解析装置の主スペクトル抽出装置Info
- Publication number
- JPS6088327A JPS6088327A JP58195828A JP19582883A JPS6088327A JP S6088327 A JPS6088327 A JP S6088327A JP 58195828 A JP58195828 A JP 58195828A JP 19582883 A JP19582883 A JP 19582883A JP S6088327 A JPS6088327 A JP S6088327A
- Authority
- JP
- Japan
- Prior art keywords
- frequency
- spectrum
- memory
- main
- extraction
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000001228 spectrum Methods 0.000 title claims abstract description 105
- 238000000605 extraction Methods 0.000 claims abstract description 48
- 238000004458 analytical method Methods 0.000 claims abstract description 32
- 239000000284 extract Substances 0.000 claims abstract description 9
- 238000001514 detection method Methods 0.000 claims abstract description 8
- 230000003595 spectral effect Effects 0.000 claims description 27
- 238000000034 method Methods 0.000 claims description 14
- 230000015572 biosynthetic process Effects 0.000 claims description 13
- 238000003786 synthesis reaction Methods 0.000 claims description 13
- 230000008859 change Effects 0.000 abstract description 3
- 238000010586 diagram Methods 0.000 description 10
- 230000008569 process Effects 0.000 description 3
- 230000002194 synthesizing effect Effects 0.000 description 3
- 239000002131 composite material Substances 0.000 description 2
- 238000001208 nuclear magnetic resonance pulse sequence Methods 0.000 description 2
- 238000005070 sampling Methods 0.000 description 2
- 230000001755 vocal effect Effects 0.000 description 2
- 102100030551 Protein MEMO1 Human genes 0.000 description 1
- 101710176845 Protein MEMO1 Proteins 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 230000009194 climbing Effects 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 238000013075 data extraction Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 230000004044 response Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Computational Linguistics (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Measurement Of Mechanical Vibrations Or Ultrasonic Waves (AREA)
Abstract
(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。
め要約のデータは記録されません。
Description
【発明の詳細な説明】
(1)発明の技術分野
本発明は音の分析、抽出9合成を行なうため、分析装置
、主スペクトル抽出装置1舎成装置を具え、とくに非調
和性の音に対し高速に解析できる音響解析装置における
主スペクトル抽出装置の改良に関するものである。
、主スペクトル抽出装置1舎成装置を具え、とくに非調
和性の音に対し高速に解析できる音響解析装置における
主スペクトル抽出装置の改良に関するものである。
(2)従来技術と問題点
一般に自然音に対しては、解析は余シなされていないが
、音声波形はそのスペクトルエンベロープ(声道の周波
数特性)と音源に分離して考え、情報成分としてのスペ
クトルエンベロープを帯域フィルタ詳によって分析抽出
し、エネルギー成分としての音源をパルス系列とランダ
ム雑音に分離する。この2つの情報すなわちスペクトル
情報と音源情報を記録しまたは伝送する。合成側では音
源情報から音源をパルス系列とランダム雑音で近似し、
その各周波数成分をスペクトル情報によって振幅変調し
、それを分析に対応した帯域フィルタ群を通して加え合
せて音声波形を再生する。
、音声波形はそのスペクトルエンベロープ(声道の周波
数特性)と音源に分離して考え、情報成分としてのスペ
クトルエンベロープを帯域フィルタ詳によって分析抽出
し、エネルギー成分としての音源をパルス系列とランダ
ム雑音に分離する。この2つの情報すなわちスペクトル
情報と音源情報を記録しまたは伝送する。合成側では音
源情報から音源をパルス系列とランダム雑音で近似し、
その各周波数成分をスペクトル情報によって振幅変調し
、それを分析に対応した帯域フィルタ群を通して加え合
せて音声波形を再生する。
このようなボコーダ方式や、ターミナルアナ四グ。
声道アナログ方式等のアナログ方式や、PA几00rt
等のデジタル方式がすでに提案または実用されている。
等のデジタル方式がすでに提案または実用されている。
しかし、これらは全て音声という調和性の音。
すなわち倍音関係が整数倍となる音に限られており、ま
たそれに対する解析方法として開発されてきたものであ
る。ここで前述の方式をトランペットやトロンポン等調
和性の高い音の解析に適用した場合には有効であると考
えられる。しかし、ピアノやチャイムで代表されるよう
な非調和性の音に対する解析には適しないし、また非常
に困難なことである。このため、自然音全体に対しとく
に非調和性の音に対して解析可能な方式が望まれている
。この場合、従来の調和性の音と同程度に情報量を減少
させることも重要であシかつ高速処理が望まれる。
たそれに対する解析方法として開発されてきたものであ
る。ここで前述の方式をトランペットやトロンポン等調
和性の高い音の解析に適用した場合には有効であると考
えられる。しかし、ピアノやチャイムで代表されるよう
な非調和性の音に対する解析には適しないし、また非常
に困難なことである。このため、自然音全体に対しとく
に非調和性の音に対して解析可能な方式が望まれている
。この場合、従来の調和性の音と同程度に情報量を減少
させることも重要であシかつ高速処理が望まれる。
これに対し、本出願人は別提案により、詳しくは後述す
るような音響解析装置を提案した。その概略を述べると
、要部は分析装置と主スペクトル抽出装置と合成装置よ
シ成シ、分析装置では音響信号のデジタルサンプル値を
所定の時間窓で切取υ、これをずらしながら時系列的に
スペクトルを算出し、主スペクトル抽出装置ではこの算
出された周波数スペクトルからスペクトルエンベロープ
をめ、これにより最も近似するN個以内の正弦波成分を
表わす主スペクトル成分の周波数値と振幅値と位相値を
時系列的に抽出し、次に合成装置ではこれらの主スペク
トル成分値に基づき、N個分のデジタル正弦波発生器に
よシ周波数1位相。
るような音響解析装置を提案した。その概略を述べると
、要部は分析装置と主スペクトル抽出装置と合成装置よ
シ成シ、分析装置では音響信号のデジタルサンプル値を
所定の時間窓で切取υ、これをずらしながら時系列的に
スペクトルを算出し、主スペクトル抽出装置ではこの算
出された周波数スペクトルからスペクトルエンベロープ
をめ、これにより最も近似するN個以内の正弦波成分を
表わす主スペクトル成分の周波数値と振幅値と位相値を
時系列的に抽出し、次に合成装置ではこれらの主スペク
トル成分値に基づき、N個分のデジタル正弦波発生器に
よシ周波数1位相。
振幅を設定し音響波形を合成するものである。この提案
発明により、非調和性の音に対しても調和性の音の場合
と同様に少ない情−粗景で高速処理することができるよ
うになった。しかし、ここで提案された主スペクトル抽
出装置では、そのスペクトル抽出方法としてたとえばピ
ーク順に行なった場合には周波数データが極端に変化す
る場合が起り、これを合成装置で合成した場合ノイズ発
生の原因となる。そこでN個分の主スペクトル成分値の
抽出順序を周波数データの極端な変化を避けるようにす
ることが望ましい。
発明により、非調和性の音に対しても調和性の音の場合
と同様に少ない情−粗景で高速処理することができるよ
うになった。しかし、ここで提案された主スペクトル抽
出装置では、そのスペクトル抽出方法としてたとえばピ
ーク順に行なった場合には周波数データが極端に変化す
る場合が起り、これを合成装置で合成した場合ノイズ発
生の原因となる。そこでN個分の主スペクトル成分値の
抽出順序を周波数データの極端な変化を避けるようにす
ることが望ましい。
(3)発明の目的
木登BBの8削1)1′白伏嵜仝仕シ?に兆鯛嘩口袢の
音に対し分析、抽出1合成を高速に行なうことのできる
音響解析装置において、N個分の主スペクトル成分値の
抽出71%序を周波数の極端な変化を避けるようにした
主スペクトル抽出装置を提供することである。
音に対し分析、抽出1合成を高速に行なうことのできる
音響解析装置において、N個分の主スペクトル成分値の
抽出71%序を周波数の極端な変化を避けるようにした
主スペクトル抽出装置を提供することである。
(4)発明の構成
前記目的を達成するため、本発明の音響解析装置の主ス
ペクトル抽出装置は音響信号のディジタルサンプル値を
所定の時間窓で切取り、これをずらして周波数スペクト
ルを算出する分析装置と、該周波数スペクトルのエンベ
四−プより音響信号に近似する正弦波成分を表わすN個
ずつの周波数。
ペクトル抽出装置は音響信号のディジタルサンプル値を
所定の時間窓で切取り、これをずらして周波数スペクト
ルを算出する分析装置と、該周波数スペクトルのエンベ
四−プより音響信号に近似する正弦波成分を表わすN個
ずつの周波数。
位相、振幅データよυ成る主スペクトル成分値を抽出す
る主スペクトル抽出装置と、該主スペクトル成分値に基
づきN個分の正弦波発生器によシ音響波形を合成する合
成装置より成る音響解析装置において、前記主スペクト
ル抽出装置がスペクトルエンベローフテータを記憶スる
スペクトルエンベロープメモリと、基準となるN個の周
波数を記憶する基準周波数メモリと、該メモリの示す周
波数に対し前記スペクトルエンベロープデータのうち最
も近い周波数のピークレベルを検出するサイドピークレ
ベル検出手段と、該手段に応じて順々にN個の振幅デー
タを抽出する振幅抽出手段と、周波数データを抽出する
周波数抽出手段と、位相データを抽出する位相抽出手段
とを具え、前記周波数抽出手段によシ抽出された周波数
データを前記基準周波数メモリに一時記憶して次回の抽
出の基準周波数とし、さらに初期状態において所定の基
準周波数を前記基準周波数メモリにセットする初期化手
段を具え、該初期化に基づき基準周波数に追従したN個
の主スペクトルを順次抽出することを特徴とするもので
ある。
る主スペクトル抽出装置と、該主スペクトル成分値に基
づきN個分の正弦波発生器によシ音響波形を合成する合
成装置より成る音響解析装置において、前記主スペクト
ル抽出装置がスペクトルエンベローフテータを記憶スる
スペクトルエンベロープメモリと、基準となるN個の周
波数を記憶する基準周波数メモリと、該メモリの示す周
波数に対し前記スペクトルエンベロープデータのうち最
も近い周波数のピークレベルを検出するサイドピークレ
ベル検出手段と、該手段に応じて順々にN個の振幅デー
タを抽出する振幅抽出手段と、周波数データを抽出する
周波数抽出手段と、位相データを抽出する位相抽出手段
とを具え、前記周波数抽出手段によシ抽出された周波数
データを前記基準周波数メモリに一時記憶して次回の抽
出の基準周波数とし、さらに初期状態において所定の基
準周波数を前記基準周波数メモリにセットする初期化手
段を具え、該初期化に基づき基準周波数に追従したN個
の主スペクトルを順次抽出することを特徴とするもので
ある。
(5)発ツ」の実施例
第1図は本発明の基本となる別提案の音響解析装置全体
の概略説明図である。音響信号は分析装+gtiooに
入力し、ここで入力信号の周波数スペクトル成分が算出
される。入力信号はディジタル変換された後一定時間窓
のサンプル区間を1ブロツクとして分析される。続いて
、数サンプルずつずらして次々分析を行なう。これによ
り、時系列的な周波数スペクトルが得られる。この分析
結果は、いくつもの山(フォルマント)を持つスペクト
ルエンベロープで表わされる。この山は、分析区間に対
し波形周期が非整数倍であることやフーリエ変換で用い
られる窓関数による影響で生じるものである。このため
、山のピークに相当するスペクトル成分を抽出し、さら
に有効な数のスペクトラムにデータ圧縮を行なう。
の概略説明図である。音響信号は分析装+gtiooに
入力し、ここで入力信号の周波数スペクトル成分が算出
される。入力信号はディジタル変換された後一定時間窓
のサンプル区間を1ブロツクとして分析される。続いて
、数サンプルずつずらして次々分析を行なう。これによ
り、時系列的な周波数スペクトルが得られる。この分析
結果は、いくつもの山(フォルマント)を持つスペクト
ルエンベロープで表わされる。この山は、分析区間に対
し波形周期が非整数倍であることやフーリエ変換で用い
られる窓関数による影響で生じるものである。このため
、山のピークに相当するスペクトル成分を抽出し、さら
に有効な数のスペクトラムにデータ圧縮を行なう。
ここで、まとめてこの明細1で用いる主要な波形用語を
第2図(α)〜(c)によシ説明をしておく。同図(α
)は横軸の周波数に対し縦軸に音響1g号のデジタルサ
ンプル値をとったいわゆる周波数スペクトルを示す。単
に1−スペクトル」というときは個々の周波数スペクト
ルと同意の各線スペクトルを指している。これに対し、
「周波数スペクトル」というときは、このスペクトルの
集合した状態を示し、この周波数スペクトルには周波数
、振幅2位相の各情報を含んでいる。次に「スペクトル
エンベロープ」は同図(b)に示すように周波数スペク
トルの包絡線を指すものである。さらに、以下に示す「
主スペクトル」は本発明では新用語として用いるもので
、同図(C)に示すように、前記スペクトルエンベロー
プよシ抽出した線スペクトルであシ、N個以内の最も近
似した周波数の正弦波成分に対応し、合成するだめの周
波数1位相、振幅データを表わす線スペクトルを示すも
のである。
第2図(α)〜(c)によシ説明をしておく。同図(α
)は横軸の周波数に対し縦軸に音響1g号のデジタルサ
ンプル値をとったいわゆる周波数スペクトルを示す。単
に1−スペクトル」というときは個々の周波数スペクト
ルと同意の各線スペクトルを指している。これに対し、
「周波数スペクトル」というときは、このスペクトルの
集合した状態を示し、この周波数スペクトルには周波数
、振幅2位相の各情報を含んでいる。次に「スペクトル
エンベロープ」は同図(b)に示すように周波数スペク
トルの包絡線を指すものである。さらに、以下に示す「
主スペクトル」は本発明では新用語として用いるもので
、同図(C)に示すように、前記スペクトルエンベロー
プよシ抽出した線スペクトルであシ、N個以内の最も近
似した周波数の正弦波成分に対応し、合成するだめの周
波数1位相、振幅データを表わす線スペクトルを示すも
のである。
主スペクトル抽出装置200は、分析装置100より出
力されるスペクトルエンベロープを表わすデータのその
データ数より相当に少ない数N個の主スペクトルを抽出
する。N個の主スペクトルは周波数、振幅2位相データ
よシ成り、合成装置500に転送される。谷成装@30
0は周波数振幅2位相を任意に制御できるN個の正弦波
発振器を有し、前述のN個の抽出された主スペクトルデ
ータがN個の発振器にそれぞれ割当てられ、分析と同様
の時間間隔で音色の変化する波形を時々刻々合成し、次
にサウンドシステム400で音響が再生される。
力されるスペクトルエンベロープを表わすデータのその
データ数より相当に少ない数N個の主スペクトルを抽出
する。N個の主スペクトルは周波数、振幅2位相データ
よシ成り、合成装置500に転送される。谷成装@30
0は周波数振幅2位相を任意に制御できるN個の正弦波
発振器を有し、前述のN個の抽出された主スペクトルデ
ータがN個の発振器にそれぞれ割当てられ、分析と同様
の時間間隔で音色の変化する波形を時々刻々合成し、次
にサウンドシステム400で音響が再生される。
このように音響解析装置において、分析から合成までの
過程はフーリエ変換した音響信号の周波数スペクトルの
中から、重要でかつ相当に少ない数N個の主スペクトル
を限定的に抽出し、これを合成再生することによりなさ
れる。
過程はフーリエ変換した音響信号の周波数スペクトルの
中から、重要でかつ相当に少ない数N個の主スペクトル
を限定的に抽出し、これを合成再生することによりなさ
れる。
たとえば、1回の分析区間を1024サンプルとすると
、分析結果の周波数スペクトラムは最大512個算出さ
れる。
、分析結果の周波数スペクトラムは最大512個算出さ
れる。
Xk=Σ r、、 w −’ (w= exp (j2
π/M ) )6 上記X&で示されるスペクトルエンベロープ(周波数ス
ペクトラムの全体の包絡曲線)よ#)N個のたとえば6
2個の主スペクトルを抽出する。この時、主スペクトル
の値は補間されたスペクトルエンベロープやその形状か
ら推理する方法によって算出した値でもよい。続いて抽
出した周波数1位相、振幅を含む主スペクトルは、62
個の独立した正弦波発振器にそれぞれ割当てられ、x(
t)=ΣcL、 s+n (ωqt+0q)(ay賑幅
、ω9:周波数、θq:位相)によシ示される波形x(
t)が合成される。また、32個一組のαQ +ti)
Q l ’Qは所定の時間間隔たとえば10m5(イ)
毎に、分析結果に応じて変化してゆく。
π/M ) )6 上記X&で示されるスペクトルエンベロープ(周波数ス
ペクトラムの全体の包絡曲線)よ#)N個のたとえば6
2個の主スペクトルを抽出する。この時、主スペクトル
の値は補間されたスペクトルエンベロープやその形状か
ら推理する方法によって算出した値でもよい。続いて抽
出した周波数1位相、振幅を含む主スペクトルは、62
個の独立した正弦波発振器にそれぞれ割当てられ、x(
t)=ΣcL、 s+n (ωqt+0q)(ay賑幅
、ω9:周波数、θq:位相)によシ示される波形x(
t)が合成される。また、32個一組のαQ +ti)
Q l ’Qは所定の時間間隔たとえば10m5(イ)
毎に、分析結果に応じて変化してゆく。
このようにして、単に62倍音の調和性倍音の合成のみ
ならず、非調和性音の合成や有効なデータのみを利用す
るため、たとえば方形波においては偶数倍音を含まない
ため、実質的には62個の合成において、64倍音まで
再生可能となシ高品質な合成が行なえる。
ならず、非調和性音の合成や有効なデータのみを利用す
るため、たとえば方形波においては偶数倍音を含まない
ため、実質的には62個の合成において、64倍音まで
再生可能となシ高品質な合成が行なえる。
第3図は分析装置100の実施例の詳細説明図である。
音響入力信号はADOlolでアナログ−ディジタル変
換された後一旦波形メモリ102に記憶される。波形メ
モリ102はたとえばサンプリング周波数512KHz
で5秒間記憶できるものであれば256にワードの波形
メモリである。記憶された波形は時間窓の1ブロツクと
してたとえば1024サンプルずつ高速フーリエ変換(
Fast Fwrier ’J’ransform )
するFFT fiA3に入力し、周波数スペクトルが算
出される。このブロックを順次数ワードずつずらして同
様に演η、することによシ、時間的に変化するいくつも
のスペクトルエンベロープが算出される。
換された後一旦波形メモリ102に記憶される。波形メ
モリ102はたとえばサンプリング周波数512KHz
で5秒間記憶できるものであれば256にワードの波形
メモリである。記憶された波形は時間窓の1ブロツクと
してたとえば1024サンプルずつ高速フーリエ変換(
Fast Fwrier ’J’ransform )
するFFT fiA3に入力し、周波数スペクトルが算
出される。このブロックを順次数ワードずつずらして同
様に演η、することによシ、時間的に変化するいくつも
のスペクトルエンベロープが算出される。
このスペクトルデータは主スペクトル抽出装置200に
転送される。
転送される。
第4図は主スペクトル抽出装置200の実施例の詳細説
明図である。分析装置100によシ算出されたスペクト
ルデータは、各時刻毎に1組のスペクトルエンベロープ
をスペクトルエンベロープメモリ201に転送する。
明図である。分析装置100によシ算出されたスペクト
ルデータは、各時刻毎に1組のスペクトルエンベロープ
をスペクトルエンベロープメモリ201に転送する。
次にn次ピークレベル検出回路202にょシ、スペクト
ルエンベロープメモリニするスペクトルエンベロープの
山のピーク値を検出し、最大のものから順にN個たとえ
ば32個のピークレベルが検出される。これによシ、そ
の検出される32個の点での掘幅値と周波数値と位相値
がそれぞれ振幅抽出回路2061周波数抽出回路2o4
1位相抽出回路205により抽出される。
ルエンベロープメモリニするスペクトルエンベロープの
山のピーク値を検出し、最大のものから順にN個たとえ
ば32個のピークレベルが検出される。これによシ、そ
の検出される32個の点での掘幅値と周波数値と位相値
がそれぞれ振幅抽出回路2061周波数抽出回路2o4
1位相抽出回路205により抽出される。
ここで62個の主スペクトル成分は、その波形を最も良
く代表する成分が選択される。
く代表する成分が選択される。
次に抽出されたN個の主スペクトルデータは合成装@3
00にあるN個たとえば62個の正弦波発振器に割当て
られる。
00にあるN個たとえば62個の正弦波発振器に割当て
られる。
第5図はスペクトルエンベロープよシ8個の主スペクト
ルを抽出する方法を示す波形図である。
ルを抽出する方法を示す波形図である。
多数のポイント(たとえば512ポイント)で示される
。
。
なめらかなスペクトルエンベロープよシ山ノ最大レベル
を示す点が■〜■にその順位で示される。
を示す点が■〜■にその順位で示される。
ここで、抽出周波数範囲をf6までにすると、7番目の
スペクトルは不要となシ、かわシに9番目の19が抽出
される。
スペクトルは不要となシ、かわシに9番目の19が抽出
される。
このように抽出周波数帯域を制限することによって、小
さなレベルのスペクトルも抽出できるようになシ利用可
能性が向上する。このようにレベル類で検出された周波
数に基づいて、位相、振幅も同時に抽出される。取シこ
ほされたスペクトルは相当にレベルの低いものであり、
全体の音の特徴にはそれ程3j要なものではない。この
ため少ないスペクトルで合成しても十分な再現性を得る
ことができる。
さなレベルのスペクトルも抽出できるようになシ利用可
能性が向上する。このようにレベル類で検出された周波
数に基づいて、位相、振幅も同時に抽出される。取シこ
ほされたスペクトルは相当にレベルの低いものであり、
全体の音の特徴にはそれ程3j要なものではない。この
ため少ないスペクトルで合成しても十分な再現性を得る
ことができる。
第6図は合成装置300の実施例の詳細説明図である。
主スペクトル抽出装置200により各時刻毎に抽出され
た主スペクトルデータ(振幅1位相。
た主スペクトルデータ(振幅1位相。
周波数)は全て抽出データメモリ601に一旦記憶され
る。これは各時刻毎の分析および抽出が実時間で行なわ
れずその時間間隔には間に合わず次の処理にはいシ込む
だめである。また、何度もpJ生するために、全抽出デ
ータは一時記憶しておくことが必要となる。
る。これは各時刻毎の分析および抽出が実時間で行なわ
れずその時間間隔には間に合わず次の処理にはいシ込む
だめである。また、何度もpJ生するために、全抽出デ
ータは一時記憶しておくことが必要となる。
このため、メモリ容景はたとえば5秒間の音響信号を1
011L!lcc間隔で分析し、62個ずつの周波数。
011L!lcc間隔で分析し、62個ずつの周波数。
位相、振幅の主スペクトルデータを抽出した場合、(5
000/10)X32X3=48000ワードのメモリ
となる。
000/10)X32X3=48000ワードのメモリ
となる。
次にアドレス制御回路502は合成に用いる速度とは無
関係な速度で、所定の時刻の周波数2位相。
関係な速度で、所定の時刻の周波数2位相。
」辰幅より成る62飼の生スペクトルデータを各時刻毎
に周波数メモ’) 505.位相メモリ304.振幅メ
そす603にそれぞれ転送し、分析における速度と同じ
速度で音響の再合成が可能となるように、一時各データ
が各メモリにストアされる。
に周波数メモ’) 505.位相メモリ304.振幅メ
そす603にそれぞれ転送し、分析における速度と同じ
速度で音響の再合成が可能となるように、一時各データ
が各メモリにストアされる。
次に周波数メモリ605には、角速度を決定するN個(
以下32個を例に取る)の周波数データωq(q=i
、 2 、・・・・・・32)がストアされ、所定の時
r#IJ間隔で更新される。このデータは、所定のクロ
ック(たとえば分析装置におけるザンプリングクロツク
)El波数でまた320時分割で常に周波数累算器50
6によりMWされ、時刻tにおける位相角ωqtが算出
される。次に、この出力W9tは、位相加算器307に
入力し、もう一方の入力である位aメモリ304よシ出
力される位相データ0q(q=1.2.・・・32)と
加算され、(ω9t+09)が算出される。次に位相加
r)、器3070出力によシー周期の正弦波をディジタ
ル的に記憶する正弦波テーブル308より正弦波値SI
N(wqt+09)なる値を読み出し、この出力に振幅
メモリ303よシ出力される振幅データ α9(q=1
.2.・32 )と乗算器609で乗算され、cLq8
1n (DJq’l −1−θq)なる合成スペクトル
が出力される。次に乗算器309より出力される32個
の時分割された合成スペクトル波形データをスペクトル
累算器610で累算し、x(t’l=Σ〜sin (ω
9t+θq)なるディジタル合−1 成波形を算出し、さらにDAO311によシデイジタル
ーアナログ変換された後、サウンドシステム400から
音響出力される。
以下32個を例に取る)の周波数データωq(q=i
、 2 、・・・・・・32)がストアされ、所定の時
r#IJ間隔で更新される。このデータは、所定のクロ
ック(たとえば分析装置におけるザンプリングクロツク
)El波数でまた320時分割で常に周波数累算器50
6によりMWされ、時刻tにおける位相角ωqtが算出
される。次に、この出力W9tは、位相加算器307に
入力し、もう一方の入力である位aメモリ304よシ出
力される位相データ0q(q=1.2.・・・32)と
加算され、(ω9t+09)が算出される。次に位相加
r)、器3070出力によシー周期の正弦波をディジタ
ル的に記憶する正弦波テーブル308より正弦波値SI
N(wqt+09)なる値を読み出し、この出力に振幅
メモリ303よシ出力される振幅データ α9(q=1
.2.・32 )と乗算器609で乗算され、cLq8
1n (DJq’l −1−θq)なる合成スペクトル
が出力される。次に乗算器309より出力される32個
の時分割された合成スペクトル波形データをスペクトル
累算器610で累算し、x(t’l=Σ〜sin (ω
9t+θq)なるディジタル合−1 成波形を算出し、さらにDAO311によシデイジタル
ーアナログ変換された後、サウンドシステム400から
音響出力される。
このように、合成装置600は32個の主スペクトル成
分を時分割で合成再生可能で、さらに各スペクトル毎に
任意の周波数1位相、振幅を設定できる装置である。
分を時分割で合成再生可能で、さらに各スペクトル毎に
任意の周波数1位相、振幅を設定できる装置である。
さらに、抽出データメモリ301とアドレス制御回路3
02は合成の速度とは無関係な速度でデータ転送が行な
われるため、装置606〜611を複数系列でもつこと
によシ容易に複音化するととも可能である。
02は合成の速度とは無関係な速度でデータ転送が行な
われるため、装置606〜611を複数系列でもつこと
によシ容易に複音化するととも可能である。
以上は別提案の音響解析装置のオlり成と動作を説明し
たものであり、これによシ従来解析や合成が困難であっ
た非調和性の音を含む自然音全体の音の解析を比較的少
ないN個の情報量を用いて冒速処理が可能となるもので
ある。
たものであり、これによシ従来解析や合成が困難であっ
た非調和性の音を含む自然音全体の音の解析を比較的少
ないN個の情報量を用いて冒速処理が可能となるもので
ある。
ここで用いた第6図による主スペクトル抽出装置は、ピ
ーク類に並べて見た場合、各時刻において常にその周波
数の関係が一定していない。つまシ、スペクトルエンベ
ロープの形状に従って1,2゜3、・・・倍音の順で抽
出されるような場合や、3,1,2゜・・・倍音の植で
抽出される場合とさまざまなパターンとなシノイズ発生
の原因となる。そこで合成装置の各チャンネルに振り分
は合成する場合、不連続なデータの極端な変化を避ける
ような抽出方法をとることによシ、ノイズの発生も抑え
ることが可能となる。本発明では上述の点に主眼をおり
てなされたものであり、前の回に抽出した周波数を基準
とし、次回においてはこれに追従するような近い周波数
に設定しN個の主スペクトル成分を抽出するようにした
ものである。
ーク類に並べて見た場合、各時刻において常にその周波
数の関係が一定していない。つまシ、スペクトルエンベ
ロープの形状に従って1,2゜3、・・・倍音の順で抽
出されるような場合や、3,1,2゜・・・倍音の植で
抽出される場合とさまざまなパターンとなシノイズ発生
の原因となる。そこで合成装置の各チャンネルに振り分
は合成する場合、不連続なデータの極端な変化を避ける
ような抽出方法をとることによシ、ノイズの発生も抑え
ることが可能となる。本発明では上述の点に主眼をおり
てなされたものであり、前の回に抽出した周波数を基準
とし、次回においてはこれに追従するような近い周波数
に設定しN個の主スペクトル成分を抽出するようにした
ものである。
第7図は本発明の要部である主スペクトル抽出装置i
200’の実施例説明図である。分析装置100により
算出されたスペクトルデータは各時刻毎に1組のスペク
トルエンベロープをスペクトルエンベロープメモリ20
1に転送される。まず、初期設定を行なうため適凸な部
分の波形を分析し、一旦そのスペクトルがスペクトルエ
ンベロープメモリ201エンベロープメモvrichる
スペクトルエンベロープの山のピーク値を検出し最大の
ものから願にN個、たとえば32個のピークレベルが検
出される。
200’の実施例説明図である。分析装置100により
算出されたスペクトルデータは各時刻毎に1組のスペク
トルエンベロープをスペクトルエンベロープメモリ20
1に転送される。まず、初期設定を行なうため適凸な部
分の波形を分析し、一旦そのスペクトルがスペクトルエ
ンベロープメモリ201エンベロープメモvrichる
スペクトルエンベロープの山のピーク値を検出し最大の
ものから願にN個、たとえば32個のピークレベルが検
出される。
これによりその検出される32個の点での振幅値と周波
数値と1位相値がそれぞれ振幅抽出回路2Q31周波数
抽出回路2049位相抽出回路205によυ抽出される
。
数値と1位相値がそれぞれ振幅抽出回路2Q31周波数
抽出回路2049位相抽出回路205によυ抽出される
。
ここで、抽出された周波数値は−H基準周波数メモリ2
10に記憶される。次にこの基準周波数をもとにして、
本来の主スペクトル抽出が行なわれる。
10に記憶される。次にこの基準周波数をもとにして、
本来の主スペクトル抽出が行なわれる。
スペクトルエンベロープメモリ201の内容と基準周波
数メモリ210の内容を1〜N個順に比較し、基準周波
数に最も近いスペクトルエンベロープの山のピーク値を
検出するのがサイドピークレベル検出回路211であシ
、これによシ基準周波数のパターンに最も近い周波数パ
ターンの主スペクトルが抽出される。さらに今回の抽出
された周波数値は次回の基準周波数として基準MJ波数
メモリ21Dに記憶される。この様にして111次側ず
つの主スペクトルデータが以前の周波数に追従するよう
にして抽出されてbく。
数メモリ210の内容を1〜N個順に比較し、基準周波
数に最も近いスペクトルエンベロープの山のピーク値を
検出するのがサイドピークレベル検出回路211であシ
、これによシ基準周波数のパターンに最も近い周波数パ
ターンの主スペクトルが抽出される。さらに今回の抽出
された周波数値は次回の基準周波数として基準MJ波数
メモリ21Dに記憶される。この様にして111次側ず
つの主スペクトルデータが以前の周波数に追従するよう
にして抽出されてbく。
(6)発明の効果
以上説ツJしたように、本発明によれば、前記提案によ
る分析装置と、主スペクトル抽出装置と、合成装置とよ
シ成る音l#解析装置において、前記主スペクトル抽出
装置の主スペクトル成分を抽出する方法が前の回に抽出
した周波数を基準とし、次回においてこれに最も近い周
波数を設定するようにして周波数の極端な変化を避ける
ようにしたものである。これによりノイズの発生を有効
に抑えることができる。
る分析装置と、主スペクトル抽出装置と、合成装置とよ
シ成る音l#解析装置において、前記主スペクトル抽出
装置の主スペクトル成分を抽出する方法が前の回に抽出
した周波数を基準とし、次回においてこれに最も近い周
波数を設定するようにして周波数の極端な変化を避ける
ようにしたものである。これによりノイズの発生を有効
に抑えることができる。
第1図は本発明の基本となる提案側概略説明図、第2図
は波形に関する用語の説明図、第6図、第4図、第6図
はそれぞれ第1図の要部の詳細構成説ツj図、第5図は
第6図に関連する動作波形図、第7図は本発明の要部の
詳細説明図を示し、図中100は分析装置、101はA
DC!、 102は波形メモリ、103はFFT演η演
目4回路00 、200’は主スペクトル抽出装置、2
01はスペクトルエンベロープメモリ、202はn次ピ
ークレベル検主回路、203は振幅抽出回路、204は
周波数抽出回路、205は位相抽出回路、210は基準
周波数メモリ、211はサイドピークレベル検出回路、
600は合成装置、601は抽出データメモリ、602
はアドレス制御回路、606は振幅メモ1,1.304
は位相メモリ、505は周波数メモIJ、306は周波
数累算器、307は位相加算MS、608は正弦波テー
ブル、609は乗算器、310はスペクトル累算器、5
11はDAO,400はサウンドシステムを示す。 特許出願人 株式会社 河合楽器製作所代理人 弁理士
1)坂 善 重 第電図 第2図 (a) 振 1戸 (b) 時限 □周波数 (C) 上スペクトル番号 第3図 第4図
は波形に関する用語の説明図、第6図、第4図、第6図
はそれぞれ第1図の要部の詳細構成説ツj図、第5図は
第6図に関連する動作波形図、第7図は本発明の要部の
詳細説明図を示し、図中100は分析装置、101はA
DC!、 102は波形メモリ、103はFFT演η演
目4回路00 、200’は主スペクトル抽出装置、2
01はスペクトルエンベロープメモリ、202はn次ピ
ークレベル検主回路、203は振幅抽出回路、204は
周波数抽出回路、205は位相抽出回路、210は基準
周波数メモリ、211はサイドピークレベル検出回路、
600は合成装置、601は抽出データメモリ、602
はアドレス制御回路、606は振幅メモ1,1.304
は位相メモリ、505は周波数メモIJ、306は周波
数累算器、307は位相加算MS、608は正弦波テー
ブル、609は乗算器、310はスペクトル累算器、5
11はDAO,400はサウンドシステムを示す。 特許出願人 株式会社 河合楽器製作所代理人 弁理士
1)坂 善 重 第電図 第2図 (a) 振 1戸 (b) 時限 □周波数 (C) 上スペクトル番号 第3図 第4図
Claims (2)
- (1)音響信ぢのディジタルサンプル値を所定の時間窓
で切取り、これをずらして周波数スペクトルを算出する
分析装置と、該周波数スペクトルのエンペローブよシ音
管信号に近似する正弦波成分台を表わすN個ずつの周波
数1位相、振幅データより成る主スペクトル成分値を抽
出する主スペクトル抽出装置と、該主スペクトル成分値
に基づきN個分の正弦波発生器により音響波形を合成す
る合成装置よシ成る音響解析装置において、前記主スペ
クトル抽出装置がスペクトルエンベロープデータを記憶
するスペクトルエンベロープメモリと、基準となるN
11ωの周波数を記憶する基準周波数メモリと、該メモ
リの示す周波数に対し前記スペクトルエンベロープデー
タのうち最も近い周波数のピークレベルを検出するサイ
ドピークレベル検出手段と、該手段に応じて順々にN個
の振幅データを抽出する振幅抽出手段と、周波数データ
を抽出する周波数抽出手段と、位相データを抽出する位
相抽出手段とを具え、前記周波数抽出手段により抽出さ
れた周波数データを前記基準周波数メモリに一時記憶し
て次回の抽出の基準周波数とし、さらに初期状態におい
て所定の基準周波数を前記基準周波数メモリにセットす
る初期化手段を具え、該初期化に基づいて基準周波数に
追従したN個の主スペクトルを順次抽出することを特徴
とする音響解析装置の主スペクトル抽出装置。 - (2) 前記初期化手段が前記スペクトルエンベロープ
の示すn番目のピークレベルを検出する1次ピークレベ
ル検出手段であシ、これによpN個の初期の基準周波数
を抽出し前記基準周波数メモリに記憶しておくことを特
徴とする特許請求の範囲第1項記載の音響解析装置の主
スペクトル抽出装置。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP58195828A JPS6088327A (ja) | 1983-10-19 | 1983-10-19 | 音響解析装置の主スペクトル抽出装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP58195828A JPS6088327A (ja) | 1983-10-19 | 1983-10-19 | 音響解析装置の主スペクトル抽出装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
JPS6088327A true JPS6088327A (ja) | 1985-05-18 |
Family
ID=16347680
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP58195828A Pending JPS6088327A (ja) | 1983-10-19 | 1983-10-19 | 音響解析装置の主スペクトル抽出装置 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JPS6088327A (ja) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH01169443A (ja) * | 1987-12-25 | 1989-07-04 | Fuji Photo Film Co Ltd | 焦点距離切換えカメラ |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS5651795A (en) * | 1979-10-03 | 1981-05-09 | Nippon Telegraph & Telephone | Sound synthesizer |
JPS57182798A (en) * | 1981-05-06 | 1982-11-10 | Nippon Telegraph & Telephone | Voice synthesizer |
JPS58147798A (ja) * | 1982-02-27 | 1983-09-02 | 松下電工株式会社 | 音声合成装置 |
-
1983
- 1983-10-19 JP JP58195828A patent/JPS6088327A/ja active Pending
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS5651795A (en) * | 1979-10-03 | 1981-05-09 | Nippon Telegraph & Telephone | Sound synthesizer |
JPS57182798A (en) * | 1981-05-06 | 1982-11-10 | Nippon Telegraph & Telephone | Voice synthesizer |
JPS58147798A (ja) * | 1982-02-27 | 1983-09-02 | 松下電工株式会社 | 音声合成装置 |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH01169443A (ja) * | 1987-12-25 | 1989-07-04 | Fuji Photo Film Co Ltd | 焦点距離切換えカメラ |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP2763322B2 (ja) | 音声処理方法 | |
JP6290858B2 (ja) | 発話の入力オーディオエンコーディングを、対象歌曲にリズム的に調和する出力へと自動変換するための、コンピュータ処理方法、装置、及びコンピュータプログラム製品 | |
US5029509A (en) | Musical synthesizer combining deterministic and stochastic waveforms | |
JP2006215204A (ja) | 音声合成装置およびプログラム | |
US20210375248A1 (en) | Sound signal synthesis method, generative model training method, sound signal synthesis system, and recording medium | |
Bonada et al. | Sample-based singing voice synthesizer by spectral concatenation | |
JPS6097397A (ja) | 音響解析装置 | |
JP4214842B2 (ja) | 音声合成装置及び音声合成方法 | |
JP3511360B2 (ja) | 音楽音響信号分離方法、その装置およびそのプログラム記録媒体 | |
JP3775319B2 (ja) | 音楽波形のタイムストレッチ装置および方法 | |
JPH04358200A (ja) | 音声合成装置 | |
JPS6088327A (ja) | 音響解析装置の主スペクトル抽出装置 | |
Arroabarren et al. | Instantaneous frequency and amplitude of vibrato in singing voice | |
JPH0715640B2 (ja) | 音響解析装置の合成装置 | |
JPS6088326A (ja) | 音響解析装置 | |
JPH05119782A (ja) | 音源装置 | |
JP2000003200A (ja) | 音声信号処理装置及び音声信号処理方法 | |
JPS6097398A (ja) | 音響解析装置 | |
JPH052390A (ja) | 楽音変調装置および楽音変調装置を用いた電子楽器 | |
JPH11143460A (ja) | 音楽演奏に含まれる旋律の分離方法、分離抽出方法および分離除去方法 | |
JPH1031496A (ja) | 楽音発生装置 | |
JP4012410B2 (ja) | 楽音生成装置および楽音生成方法 | |
JP2504179B2 (ja) | ノイズ音発生装置 | |
JP3294192B2 (ja) | 音声変換装置及び音声変換方法 | |
JP2806047B2 (ja) | 自動採譜装置 |