JPH03293700A - サウンドシンセサイザー - Google Patents

サウンドシンセサイザー

Info

Publication number
JPH03293700A
JPH03293700A JP2409368A JP40936890A JPH03293700A JP H03293700 A JPH03293700 A JP H03293700A JP 2409368 A JP2409368 A JP 2409368A JP 40936890 A JP40936890 A JP 40936890A JP H03293700 A JPH03293700 A JP H03293700A
Authority
JP
Japan
Prior art keywords
block
coefficients
cluster
signal
representative
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2409368A
Other languages
English (en)
Inventor
Paul A Rosenstrach
ポール・エイ・ローゼンストラック
Michael A Deaett
マイケル・エイ・ディーエット
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Raytheon Co
Original Assignee
Raytheon Co
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Raytheon Co filed Critical Raytheon Co
Publication of JPH03293700A publication Critical patent/JPH03293700A/ja
Pending legal-status Critical Current

Links

Classifications

    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03MCODING; DECODING; CODE CONVERSION IN GENERAL
    • H03M7/00Conversion of a code where information is represented by a given sequence or number of digits to a code where the same, similar or subset of information is represented by a different sequence or number of digits
    • H03M7/30Compression; Expansion; Suppression of unnecessary data, e.g. redundancy reduction
    • H03M7/3082Vector coding
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10HELECTROPHONIC MUSICAL INSTRUMENTS; INSTRUMENTS IN WHICH THE TONES ARE GENERATED BY ELECTROMECHANICAL MEANS OR ELECTRONIC GENERATORS, OR IN WHICH THE TONES ARE SYNTHESISED FROM A DATA STORE
    • G10H7/00Instruments in which the tones are synthesised from a data store, e.g. computer organs
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10KSOUND-PRODUCING DEVICES; METHODS OR DEVICES FOR PROTECTING AGAINST, OR FOR DAMPING, NOISE OR OTHER ACOUSTIC WAVES IN GENERAL; ACOUSTICS NOT OTHERWISE PROVIDED FOR
    • G10K15/00Acoustics not otherwise provided for
    • G10K15/02Synthesis of acoustic waves
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10HELECTROPHONIC MUSICAL INSTRUMENTS; INSTRUMENTS IN WHICH THE TONES ARE GENERATED BY ELECTROMECHANICAL MEANS OR ELECTRONIC GENERATORS, OR IN WHICH THE TONES ARE SYNTHESISED FROM A DATA STORE
    • G10H2250/00Aspects of algorithms or signal processing methods without intrinsic musical character, yet specifically adapted for or used in electrophonic musical processing
    • G10H2250/005Algorithms for electrophonic musical instruments or musical processing, e.g. for automatic composition or resource allocation
    • G10H2250/015Markov chains, e.g. hidden Markov models [HMM], for musical processing, e.g. musical analysis or musical composition
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10HELECTROPHONIC MUSICAL INSTRUMENTS; INSTRUMENTS IN WHICH THE TONES ARE GENERATED BY ELECTROMECHANICAL MEANS OR ELECTRONIC GENERATORS, OR IN WHICH THE TONES ARE SYNTHESISED FROM A DATA STORE
    • G10H2250/00Aspects of algorithms or signal processing methods without intrinsic musical character, yet specifically adapted for or used in electrophonic musical processing
    • G10H2250/131Mathematical functions for musical analysis, processing, synthesis or composition
    • G10H2250/211Random number generators, pseudorandom generators, classes of functions therefor
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10HELECTROPHONIC MUSICAL INSTRUMENTS; INSTRUMENTS IN WHICH THE TONES ARE GENERATED BY ELECTROMECHANICAL MEANS OR ELECTRONIC GENERATORS, OR IN WHICH THE TONES ARE SYNTHESISED FROM A DATA STORE
    • G10H2250/00Aspects of algorithms or signal processing methods without intrinsic musical character, yet specifically adapted for or used in electrophonic musical processing
    • G10H2250/541Details of musical waveform synthesis, i.e. audio waveshape processing from individual wavetable samples, independently of their origin or of the sound they represent
    • G10H2250/571Waveform compression, adapted for music synthesisers, sound banks or wavetables
    • G10H2250/601Compressed representations of spectral envelopes, e.g. LPC [linear predictive coding], LAR [log area ratios], LSP [line spectral pairs], reflection coefficients

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • General Health & Medical Sciences (AREA)
  • Theoretical Computer Science (AREA)
  • General Engineering & Computer Science (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Electrophonic Musical Instruments (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】
[0001]
【発明の分野】
本発明は、再帰的(リカーシブ)フィルターの係数の集
合である記憶されたデータからの信号の合成に関するも
のであり、各集合は固定期間そのフィルターに加えられ
、その期間は合成された信号の持続時間の合計である。 さらに詳細には、係数の集合はベクトル量子化線形予測
符合化(LPC)のモデリング係数の集合上でのマルコ
フ遷移による過渡的音響(サウンド)の非反復的アンサ
ンプルの差熱的モデリングを包含する。 [0002]
【背景技術】
本出願と同じ譲受人に譲渡された米国特許出願番号33
2,414において、シングル・アナログ・サウンド過
渡現象は等しい長さのタイムブロックに分割され、そし
て各ブロックに対して線形予測符合化(LPG)回路の
係数の集合が得られた。回路は信号の良好なレプリカ(
複製)を提供した。そのレプリカからのLPGモデリン
グ係数は、線形予測フィルターの入力に加えられたラン
ダムノイズソースにより発生された不規則性のために、
連続合成信号の小さな音響変化が生じた。 [0003] 非定常音響記号(過渡信号と称する)のモデリングは検
出プロセッサの設計やソナートレーナ−そして試、験タ
ーゲットジェネレータ用の合成信号の正確な生成に非常
に重要なものである。接触の存在の認識や操作状態を扱
うソナー訓練は接触シンセサイザーにより忠実に発生さ
れなければならない過渡的接触放射の正確な翻訳(イン
タープリチージョン)を要求する。現在そのような音響
は磁気テーププレーヤーにより提供されており、それは
使用するのに扱いにくく、展開するシナリオに同期され
ず、そして記録された背景ノイズのため歪んだ結果を生
成する。別の方法で静寂接触を識別するための手段を提
供する過渡検出処理は高忠実度のものだけでなく、さら
に処理効率的である検出方法の基本を提供する過渡記号
モデルを要求する。 [0004] 過渡現象として分類されたものは恐らく数時間のこれら
の記号であり、高速で尚統計的に規則的な、スペクトル
エネルギー変動のパターンを表す。モデル化される音響
の例はハツチの閉まり、小エビの跳ね上がり、氷解、船
体の札み、積み荷の移動、アクチュエータ操縦全散音を
包含する。 [0005] LPG分析分析7合績果として、オリジナルサウンドの
適正な複製が達成される。所望の合成は前記米国出願の
図2に示されるように再帰的フィルターにより達成され
る。合成を実施するために必要とされる算術的負担は相
当なものである。各出力サンプルは(N+1)の掛は算
累積を必要とし、ここでNはフィルター係数の数である
。もし出力データ速度が毎秒Fsサンプルであるならば
、毎秒(N+1)Fsの掛は算累積が必要となる。実施
的見地からさらに重要な因子は記号を合成するために必
要とされるモデリングフィルター係数の合計数である。 これらの係数は制限された大きさのシンセサイザーメモ
リ内に記憶されねばならないので、重大な実施負担とな
る。例えば、8ミリ秒の時間の各ブロックは約10の係
数と一つのゲイン値を必要とする。LPG合成用の係数
メモリの結果のビット数は故に、Nc=(16)  (
125)  (11)Ts=22000Tsのメモリの
ビットとなり、ここで16ビツトワードが使用され、毎
秒125ブロツクが処理され、ブロック毎に11ワード
が必要とされ、そしてTsは秒単位で記号合成の合計時
間となる。仮想の16KHzサンプル速度における記憶
サンプルからの直接合成に対して、所望のビット数はN
d=(16)(1,6X104)Ts=256.0OO
Tsビツトとなるので、10:1のデータ圧縮が達成さ
れる。但し、−メガビットのRAMメモリはLPG合成
サウンドを45秒しか支持できないことが理解されよう
。数時間継続する非定常サウンドの合成の要求が存在す
るので、当然、追加的データ圧縮が望まれる。 [0006]
【発明の概要】
故に、顕著なサウンド特性を分離し、そしてそれらを差
熱的モデルを介してパラメーターで表すことが本発明の
モデリング法の目的である。 [0007] 本来非反復的である疑似ランダム記号を合成する方法を
提供することが本発明の目的である。従来技術のシンセ
サイザーは発生毎にほとんど同一である発生記号を生成
する。この反復は自在的では無い。それゆえに、サウン
ドのクラス内に存在する変化の基本パターンを収集する
ことは重要であり、本発明により提供される。 [0008] 直接LPG技術は許容できる記号に導くが、利用された
係数集合はさらなるモデリング分離で容易に調べられな
い大容量データベースとなる。故に、データ低減のさら
なるステップがこのデータベースを、その中でモデリン
グ係数集合の全てがマツプ可能となるモデリング係数の
小さな集合にするために必要とされる。 このマツピングは、ゆう度比歪み測度により評価される
微々たるものであるが、合成された信号のさらなる歪み
を誘導する。採用されるマツピングプロセスはシングル
ベクトル量子化であり、それにより許容合成記号は「ク
ラスター」係数集合と呼ばれる限定された数の代表係数
集合を利用することにより生成されることが可能である
。「クラスター観察シーケンス」と呼ばれるクラスター
割り当ての時系列は、各ブロックのLPG係数のマッス
ングをクラスター表示で表すこととなる。 [0009] 前述の米国出願の合成方法は過渡サウンドにより生成さ
れたクラスター観察シーケンスの非反復的アンサンプル
から得られるマルコフ遷移の作用による差熱的モデルを
包含するところまで拡張されている。そのように特徴付
けられるサウンドは二つの特性的励起状態、つまりバッ
クグラウンド発生と見なされている。各特性状態におい
て、クラスター観察シーケンスの連続的展開は時変マル
コフ遷移マトリックスにより制御されるマルコフ連鎖と
して見られる″。サウンド記号の二つの異なるクラス、
周期的及びポアソン励起がモデル化される。キャビテー
ションなどの周期的プロセスの場合、過渡的状態は連続
的に現われ、そして遷移マトリックスの周期的シーケン
スは反復的にそのサウンドの特性を表す。長期間の過渡
現象の場合、過渡発生状態はポアソン事象プロセスによ
り開始される。過渡状態間で、明瞭な遷移マトリックス
により特徴付けられるバックグラウンドが開始される。 マルコフ遷移マトリックスと共にクラスター表示モデリ
ングフィルター係数の結果の集合が長期過渡記号合成の
効果的方法を提供するために本発明に採用される。 [0010]
【実施例】
追加的データ圧縮のこのゴールに到達するためのステッ
プがベクトル量子化を利用することにより行なわれる。 ベクトル量子化において、もしLPG係数集合が僅かに
変形されているならば、ある付加的歪みが生じるが、も
し変形が小さなものであるならば、その結果の歪みは重
要でないことは認識されている。本発明に利用される歪
みの測度は主観的認識に関連しており、そしてゆう度比
歪み測度である。この測度は最適フィルターの使用によ
り受ける最小エラーに対して非最適フィルターの使用に
より受ける付加的モデリングエラーの比を取ることによ
り計算される。どのLPG集合に対しても、この残留モ
デリングエラーは次の式で計算される。 [0011]
【式1】 はフィルター係数a (k) の自己相関であり、 来、ここでPはモデリングフィルター係数の数である。 rX(k)はまたデータ自己相関関数;のブロック内の
サンプル数である。例えば、レビンソン帰納により決定
される係数の最適集合に対しては、残留モデリングエラ
ーはEpである。1;は係数の最適集合からの残留エラ
ーである。 よう度比歪み測度はD (A、A)= (E、−E、)
/Epとして計算される。Aはブロックに対する係数の
最適集合であり、そしてAはそれぞれの前のブロックに
対して選択された係数の集合(クラスター)の一つであ
る。D (A、人)の典型的値は0.5から2の範囲内
に有り、その値は合成信号を生成し、合成サウンドがオ
リジナルサウンドの有用な複製とするのに十分低い歪み
となり、そこからデータが合成工程のために得られた。 [0012] LPGブロックを基本とする分析において、数多くの係
数集合が発生される。 データの全ブロックを表すためにこれらの集合の部分集
合を選択することによりいくらかの付加的歪みを犠牲に
して、低減された数の係数が合成のために記憶されても
良い。より小数の標本(代表)係数集合が分離プロセス
中に調査されねばならなく、それにより確率的記号モデ
ルが達成される。本発明においては、それゆえに、各記
号データブロックをクラスター標本(代表)に割り当て
るためにクラスター分析プロセスが採用されるので、歪
みは所定スレッショルドよりも小さくなる。以前に決定
されたクラスター標本の何れかのLPG係数によりデー
タブロックの表示がスレッショルド以下の歪みを生成で
きないならば、調査されているデータブロックに基づい
た新クラスターが確立される。もしスレッショルドが超
過しないならば、最小表示歪みを生成するクラスター標
本が利用される。このベクトル量子化プロセスの結果は
クラスターの集合である、つまり、分析表示のためにク
ラスター標本Ciに割り当てられたデータブロックのグ
ループでありのに番目係数である。ベクトル量子化を通
じて利用できるデータ圧縮の一例として、キャビテーシ
ョン記号が512ブロツクのデータを表すために18係
数集合を使用して何とかベクトル量子化された。これは
直通LPG分析のものを超えるほとんど30:1の圧縮
比である。その比は、必要とされるクラスター数はレコ
ード長と共に線形的に増加しないので、分析されている
記号レコード長により制限される。これらの18のクラ
スター標本は集合を形成し、その上で、さらにマルコフ
プロセスによるモデリング分離が達成される。特定的に
、クラスターへのデータブロックのマツピングはクラス
ター観察シーケンスで表示可能である。マルコフ記号分
析の目的はクラスター割り当てに渡って記号プロセスの
時間展開を正確に説明する差熱的モデルを生成すること
である。 [0013] 図1において、ハツチカバーを閉めることにより生成さ
れたものなどの過渡サウンド信号の波形1.2.310
0. Nが示されており、各信号波形は閉動作毎に生成
されている。他の例として、各波形はプロペラの回転に
より生成されたキャビテーションノイズの一周期である
。各波形の全体の特徴は時間軸に沿って方向付けられて
いるので、それらは大体適時応答する。例えば、ハツチ
カバーを閉じることにより生成された信号波形の場合に
は、ハツチを連続的に閉じたときのそれぞれに対するサ
ウンド波形の開始は同時、1=0に応答すべきである。 プロペラの回転により生成されるキャビテーション信号
の場合には、波形周期の開始はそれほど容易に決定する
ことは出来ない。但し、その波形は異なるサイクル開始
時間を使用する連続LPG分析による本発明に従って最
小の合計クラスター集合数となる開始ポイントをその周
期の開始として選択することにより周期の開始を確立す
るためにLPG分析されても良い。ハツチカバーの各閉
鎖あるいはプロペラの周期により生成されるアナログ信
号の波形は一般に異なるが、全ての波形のLPG分析か
ら得られる係数の異なる集合の合計数(クラスター)は
本発明の方法に従い低減されよう。 [0014] 図1に示された波形は対応時間で周期の開始に適切に近
接していると仮定される。米国特許出願番号332,4
14で説明されているように各波形のLPG分析はブロ
ック1から128で実行され、そこではもし各ブロック
が8ミリ秒の期間で、分析されるべき波形の合計期間が
1秒、そして波形数Nが10であると仮定されるならば
、1280の係数集合が必要とされる。分析されている
波形が、例えば、−分間など、長期間のものである場合
は、係数の集合数はかなり大きく(この例では60倍)
なり、そして十分なメモリが米国出願と同様に各集合の
それぞれの係数をデジタル的に記憶するために利用され
なければならない。 [0015] 係数の集合数の低減するために、集合はベクトル量子化
されるので、10の波形に対する1280のLPG係数
の集合に関する直前の実例はより小数の係数集合(又は
クラスター)により表される。−クラスターに属する係
数の集合は歪みの許容限度により決定され、そこでその
スレッショルド値が前述の等式により決定されたように
、よう度比歪み測度により評価される。このように、実
例としてそして容認できる歪みのレベルにより、128
0の係数の集合は十分に低減されよう。 しかしながら、ベクトル量子化だけを使用して発生され
た記号は反復的であり、実記号の複数サンプルはランダ
ム変動を示すだろう。 [0016] 図1の波形1.2110. Nのそれぞれは1.2.3
1.、、  128と付けられた8ミリ秒ブロックに分
割されて示されている。LPG分析を受けるとき各波形
の各ブロックは、ベクトル量子化後、各波形1111.
 Nに対して可能な128の係数の集合よりも数の少な
いLPG係数のクラスターを提供する係数の集合を生成
する。波形1に対して、ブロック1と2に対する係数の
集合は係数C1の一集合にクラスター化されると仮定さ
れ、ここでC1はブロック1に対して計算される係数で
あり、係数の計算はLPG分析により実行される。波形
1のブロック2に対して得られたLPC係数の集合は係
数01の集合と比較すると、前述の量よりも小さいエラ
ーとなると仮定され、ここでクラスターC1の係数はブ
ロック2に対して計算された係数と置き換えられる。波
形1のブロック3の計算されたLPG係数は、クラスタ
ー01が使用されている時には前述の許容エラー外に属
すると仮定される。故に、ブロック3に対する計算LP
G係数はクラスターC2として指定される。このプロセ
スは全波形1.2.3100. Nの全ブロックに対し
て続けられ、その計算LPG係数は追加クラスターLP
C係数が確立される必要があるかどうかを決定するため
に全ての以前のクラスターLPG係数(この例ではC1
、C2)に関して評価される。全波形の最初の4波形は
クラスター値C116,C4を有すると仮定される。図
2A−Dは各波形1〜3そしてNに対する各ブロック1
〜4のクラスターC1〜C4の分布をそれぞれ示す。実
例として、図2A−Dは、全波形のブロック1はクラス
ターC1又はC2における係数により置き換えられても
良い計算LPG係数を有することを示しここでブロック
2はクラスター1.2、又は3の係数により置き換えら
れても良い計算LPC係数を有する。 [0017] 本発明の好適形態において使用されているアルゴリズム
は先行技術のこれらのものと異なり、そして図11のブ
ロー図に示されるクラスター化アルゴリズムである。プ
ログラムは入力として、クラスター構成歪みスレッショ
ルドと同じように歪み分析を開始するために使用される
べき初期ブロックのインデックス、分析されるべきブロ
ック数、ブロック時間、そしてLPG係数の数を必要と
する。これらの入力で、分析がデータ内のブロックの連
続的シーケンスに制限される。アルゴリズムはメモリ内
の第一ブロックLPG係数自己相関関数(ACF)デー
タを記憶することにより開始する。サンプルデータの次
のブロックはメモリがら検索され、そしてこのブロック
に対するLPG係数ACFはサンプルデータのACFと
同様に計算される。この情報を利用して、レビンソン帰
納により得られる最適集合の代わりにLPG係数の第一
集合を使用することにより受ける表示歪みが計算される
。もしこの歪みがクラスター確立スレッショルドを超え
ると、新クラスターが確立され、新データブロックのL
PG係数により表される。さらに、新クラスターに対す
るLPG係数Aはメモリ内に記憶される。もし歪みがそ
の限度を超えないならば、データブロックは第一クラス
ターに割り当てられる。反復的に、このプロセスは繰り
返される。各サンプルデータブロックはメモリから読み
取られ、そして以前に確立されたクラスター標本の各集
合を利用することにより受ける歪みを計算するプロセス
が計算される。もしクラスター確立スレッショルドがそ
れぞれの現存するクラスター標本により超えられるなら
ば、新クラスターが確立され、そして係数データが再び
メモリ内に読み込まれる。もしそうでなければ、データ
ブロックは最小表示歪みを受けるクラスターに割り当て
られる。各データブロックに対して、またLPGゲイン
値、ブロックインデックス、そしてクラスター割り当て
がメモリに読み込まれるので、ベクトル量子化記号の合
成が達成される。そのプロセスは、全データフ宅ツクが
調査される迄継続される。最後に、各クラスターに対す
るLPG係数がまた合成に使用するためにメモリにイン
デックス方式で読み込まれる。このアルゴリズムにより
確立されたクラスター数は主として選択されたクラスタ
ー確立スレッショルドの関数であることに留意すべきで
ある。もし許容されるクラスターの最大数が、全データ
が調査される前に超過するならば、アルゴリズムは停止
し、そしてより高いクラスター確立スレッショルドでの
再試行が命令される。実際には、連続的低確立スレッシ
ョルドでの連続パスが、所望のクラスター数が得られる
進行なわれる。 [0018] このアルゴリズムは非常に効果的であることを証明する
。例えば、それは、それぞれが129サンプルを包含す
る8ミリ秒時間の512データブロツクのシングルパス
を実行するために4分しか要さなかった。実サウンドの
8秒を表す512データブロツクの全ては調査された長
期非定常信号の全てに対して2ダース以下の係数集合で
表されることが解かっている。 [0019] 遷移マトリックスは要素Pk (i、j)のマトリック
スであり、ここでPk (i、j)はブロックkにおけ
るクラスターiがらブロックに+1におけるクラスター
jへの遷移の確率である。初期状態占有ベクトル(それ
ぞれの状態はクラスターに関連付けられている)はP 
 (i、j)である。これらの確率密度は複数過渡記号
リアリゼーションの観察アンサンプルから予測され、そ
のそれぞれは記録され、そしてデジタル化される。各ブ
ロック遷移に対して異なる遷移マトリックスと各過渡記
号タイプに対して遷移マトリックスの異なる順序の集合
が存在する。 [00201 図3A−Dにおいて、現在ブロックから次連続ブロック
の波形を合成することが望まれる時、一つのクラスター
値と同値あるいは異なるクラスター値開の遷移に対する
遷移確率マトリックスが示されている。例えば、図2A
−Dにおいて、ブロック1でのクラスター値からブロッ
ク2でのクラスター値への遷移に対して波形1からNに
対してはクラスター値は波形1のクラスターCIへの遷
移とクラスターC1から波形2のクラスターC2への遷
移とで波形1と2に対してC1であることが解かる。波
形3とNが波形3のブロック2に対するクラスター値C
2と波形Nのブロック2に対するクラスター値C3とで
ブロック1でクラスター値C2を有することが解かる。 これらのクラスター値をブロック1からブロック2への
遷移に対して図3Bに示された遷移確率マトリックスに
適用すると、クラスターC1からクラスターC2への遷
移が1/2で発生し、そしてクラスター02への遷移も
1/2で発生することが解かる。同様に、クラスターC
2からクラスターC2への遷移は1/2で発生し、そし
てクラスターC2からクラスターC3への遷移は1/2
で発生する。考慮されている波形の限定数に対して、ブ
ロック1のクラスターC3、C4からブロック2のクラ
スターC4への遷移は無い。 故に、これらの対応する行と列はゼロ確率を有する。 [0021]
【式2】 [0022] 図4A−Dに示された累積確率マトリックスは図3A−
Dの遷移確率マトリックスのそれぞれから直接的に得る
ことが可能である。図3の遷移確率マトリックスの行の
各列は図4に示されるように確率密度を逐次に累積する
。図4は本発明の合成工程において利用される。ランダ
ム数を提供するためにOから1を含む値を有するランダ
ム数ジェネレータを利用することによって、−ブロック
から−ブロック内で特別クラスター値を与えられた次ブ
ロックへのクラスター遷移が確率マトリックスに従って
決定される。例えば、図4Bにおいて、ブロック1は合
成工程でクラスター02を利用したと仮定される。ブロ
ック2は合成工程でクラスター02を利用するか又はC
3を利用するかどうかが次に議論されるべきランダム数
ジェネレータにより決定される。もしランダム数ジェネ
レータがブロック2へ割り当てられる期間にOと0.5
を含む間にある数を生成するならば、図4Bによるブロ
ック2はブロック2に対応する期間中LPGフィルター
に適用される係数としてクラスターグループC2を利用
するだろう。但し、もしランダム数ジェネレータが0.
5よりも大きく、且つ1に等しいか、それ以下の数を生
成していたならば、クラスター集合C3が合成信号を発
生するためにブロック2に割り当てられる時間中利用さ
れていたであろう。クラスターの発生の相対周波数と同
様に図3A−D及び図4A〜Dと関連付けられた確率は
−ブロックから次連続ブロックへの遷移において可能で
あるクラスター数に依存することが当業者には明白であ
ろう。 [0023] しかしながら、もし代わりに、図2A−Dのブロック1
は波形3とNについてはクラスター値C2を有した、そ
してブロック2は4つの波形に対してそれぞれクラスタ
ー値C1、C2、C3、C4を有することが仮定される
ならば、図3Bは、遷移確率マトリックスがブロック1
のクラスターC2からブロック2の各クラスターC1−
C4への遷移の等確率を示す図、5Aに示されるように
なるように変形されるだろう。図5Bは図5Aの遷移確
率マトリックスに対応する累積確率マトリックスを示し
、それはランダム数ジェネレータとの関連で利用される
時どのクラスターC1〜C4がブロック2での信号を合
成するのに利用されるかを等確率で選択する。 [0024] 図6は二つの連続ブロック、図4と図5において示され
たものよりももつと一般的なブロックにとブロック(k
+1)に対する累積確率マトリックスを表す。 図6はまた各ブロックk、(k+1)に対してそれぞれ
クラスターデータを記憶し、そして提供するメモリセク
ター68.69が如何に統制されるかの表示である。ポ
インター61はブロックkに割り当てられたメモリのセ
クター68の行1を選択すると仮定される。行1の選択
はブロックにのLPG合成で使用するクラスター5を提
供する。LPG係数は図7において示されたメモリ70
内に包含され、そこでクラスタ一番号はLPG係数a 
 1.、a  5を包含するメモリ0   °    
 n 70内の行5を示す。図7のLPG係数メモリ70はR
OMメモリで構成可能である。行1に適用されたポイン
ター61はまた疑似ランダムジェネレータ63からの他
の入力を有するコンパレータ62に提供される累積確率
P1..P11   。 1、を提供する。もてジェネレータ63により提供され
るランダム数が累積確率値P1゜とPI3を包含する間
にあると仮定すると、コンパレータはポインター64と
して提供される列3に対応する出力をブロック(k+1
)に対応するメモリセグメントの行3に提供する。ポイ
ンター64は、対応する時間において、ブロック(k+
1)に対してクラスター25を提供し、そして全累積確
率値P31′P36′ をブロック(k+1)に対応す
る時間に対して一クラスター値の選択のためのコンパレ
ータ65にもまた提供する。可能クラスター値の異なる
数に対応する列の異なる数がブロックにとブロック(k
+1)メモリセクター68と69のそれぞれに現れるこ
とに留意すべきである。ブロックにの累積遷移確率と関
連して疑似ランダム数ジェネレータ63はブロック(k
+1)  そして続いて全ブロックに対する行(そして
クラスター)の選択を提供するように見られることが解
かる。 [0025] 本発明のマルコフシンセサイザー80のブロック図が図
8に示されている。タイミングパルスジェネレータ81
はブロック時間に対応するTミリ秒毎にパルスを生成し
、ここでTはこの出願では8ミリ秒となるように選択さ
れている。パルスは疑似ランダム数ジェネレータ63と
逐次ブロック数ジェネレータ82に提供される。逐次ブ
ロック数ジェネレータ82は逐次的にブロックアドレス
を選択しどのブロックメモリセクター(図6のセクター
68.69など)がブロックメモリ83内で選択される
かを決定する。図6に関して以前に説明されたように、
ブロックkに対応するメモリ83のセクター内に包含さ
れたクラスター数は逐次ブロック数ジェネレータ82に
より選択され、そしてブロックkに対するポインターは
メモリ83から読みだされ、図7のクラスター係数メモ
リ70内に読み込まれる。同セクターにより提供された
累積確率はコンパレータ62に提供されてその他の入力
はランダム数ジェネレータ63により提供され、クラス
ター数とブロック(k+1)の累積確率などを提供する
。メモリ70内に包含されているブロックにのLPG係
数はメモリ83からのクラスター数、ブロックkにより
選択され、そして所望過渡合成記号をその出力に提供す
る参考特許出願で詳細に説明されたLPC再帰シンセサ
イザーフィルター84に提供される。 [0026] 要約すれば、直接マルコフ技術を使用して疑似ランダム
記号を合成するためには、疑似ランダム観察シーケンス
が背景技術のセクションで議論されたマルコフモデルか
ら発生されなければならない。このモデルは、図9に示
されるように状態の集合、初期確率ベクトル、そして遷
移マトリックスの集合からなる本質的に時変マルコフ連
鎖である。各マトリックスは遷移確率の行と列から構成
され、例えば、k番目のマトリックス内のPijはジェ
ネレータがブロックにのブロックi内にあるという前提
でブロックに+1の行jを入力する確率を示す。故に、
そのエントリーは離散的確率密度である。さらに各行は
クラスター集合ポインターのためのエントリーを包含す
る。もしその行が選択されるならば、このエントリーは
LPG係数の集合がブロックにのための信号を合成する
ために使用されることを指示する。 [0027] 図10と図12は前述したプロセスステップを異なる形
で提示する本発明の合成と合成プロセスのそれぞれのフ
ロー図である。 それぞれの線形予測符合化係数クラスターと結合的に量
子化されるのは量子化ゲイン因子rAlであり、ここで
Aは参照される米国特許出願番号332.414で議論
されている。ゲイン因子Aの量子化はゲイン因子AとA
の許容値の指示された集合との間の最小差により決定さ
れる。このように、クラスター係数と共に量子化ゲイン
値は標本クラスター係数の集合から構成される。本発明
の好適形態を説明することにより、その概念を取り入れ
る他の形態が使用されるかも知れないことは当業者には
明白であろう。故に、本発明は開示された形態に制限さ
れるべきものでなく、むしろ添付の請求の範囲の精神に
よってのみ限定されるべきものである。
【図面の簡単な説明】
本発明自体と同じように、本発明の前述の特徴は図面の
次の詳細な説明により完全に理解されよう。
【図1】 再帰的フィルターのブロックのクラスター化線形予測係
数を得るために分析前に使用される過渡信号の図形表示
である。
【図2】 図1の4波形のクラスター化係数の分布を図形的に示す
【図3】 一つのブロック内の一つのクラスターから次連続ブロッ
クの可能クラスターの一つへの遷移の確率を示す。
【図4】 一つのブロック内の一つのクラスターから次連続ブロッ
クの可能クラスターの一つへの遷移の累積確率を示す。
【図5】 図3A〜Dと図4A−Dのそれぞれに対して仮定された
以外の異なる確率分布に対するクラスター遷移確率と累
積遷移確率のそれぞれを示す。
【図6】 累積確率値から連続ブロックまでのクラスターを選択す
るための装置をブロック図で示す。
【図7】 係数メモリ内のクラスター化された係数を示す。
【図8】 本発明のシンセサイザーのブロック図である。
【図9】 メモリセクターの遷移マトリックスを示す。
【図10】 本発明に記録する信号を合成するのに使用されるステッ
プのフロー図である。
【図111 本発明において利用されるクラスター化された係数を得
るためのステップを示すフロー図である。 【符号の説明】 61 ポインター 62 コンパレータ 63 疑似ランダム数ジェネレータ 64 ポインター 65 コンパレータ 68 メモリ(ブロックk) 69 メモリ(ブロック(k+1)) 70 クラスター係数メモリ 81 タイミングパルスジェネレータ 82 逐次ブロック数ジェネレータ 83 ブロックメモリ
【書類芯】
図面
【図1】
【図2】 7℃ツクシ皮形1 フ′口・ラフ5史形3 フ]ゴツクシ良Jsz 7°゛シツク4え形4 ρ
【図3】 フ117ft67″rJツ72へ
【図4】 C1 クラスターへ C2c/3 ククス7−へ C2C3 7”′口・772つ゛らフ゛°ロッ73へt Z″77スタ ー2   C3 7ノスターヘ 2  C3 クラスターへ 02   C3 7゛ロツク3つ゛らフ”口・774へ I クツベタ−へ C2C3
【図6】
【図7】 LPG 係数
【図8】
【図9】
【図101 【図11】

Claims (8)

    【特許請求の範囲】
  1. 【請求項1】非反復的疑似ランダム信号合成を提供する
    方法において、ソースからの複数の信号を分析し、各信
    号は順次ブロックに分割される、ステップ、 各信号ブロックをサンプリングし、そして前記各信号の
    各ブロックの再帰的フィルターの線形予測符合化係数集
    合を決定するためにサンプルの前記各ブロックを分析す
    るステップ、 前記各ブロックのクラスター化代表係数集合を得るため
    に前記ブロックの全ての前記係数の各集合をベクトル量
    子化し、各クラスター化代表係数集合はベクトル量子化
    線形予測符合化係数集合の全クラスターを表すステップ
    、一ブロックの位置クラスター代表から前記各信号の全
    ブロックに対する後続ブロックの次クラスター代表への
    遷移の確率を決定するステップ、各信号の対応ブロック
    の各遷移に対して累積確率値を提供するステップ、前記
    累積遷移確率値と前記クラスター代表係数を記憶するス
    テップ、合成されるべき信号の各逐次ブロックに対して
    確率値を逐次発生するステップ、 後続ブロックの累積確率値の対応集合に関しメモリから
    読みだすためにブロックのクラスター代表を提供するス
    テップ、 前記後続ブロックに対する選択クラスター代表を決定す
    るために前記の後続ブロックに対して記憶された前記累
    積確率値で前記の後続ブロックに対する前記の逐次的に
    発生された確率値を比較するステップ、前記選択クラス
    ター代表に対応する前記クラスター代表係数を包含する
    メモリから読み取るクラスター代表係数の集合を提供す
    るステップ、前記ブロックに対応する時間ノイズ励起再
    帰的フィルターへ前記選択クラスター係数を提供するス
    テップ、そして 前記合成信号を提供するために逐次ブロックに対して上
    記プロセスを繰り返すステップから構成される方法。
  2. 【請求項2】再帰的フィルターの線形予測符合化に対し
    て疑似ランダムクラスター化係数集合を提供する方法に
    おいて、ソースからの複数の信号を分析し、各信号は逐
    次ブロックに分割される、ステップ、 各信号ブロックをサンプリングし、そして前記各信号の
    各ブロックの再帰的フィルターの線形予測符合化係数集
    合を決定するために各ブロックサンプルを分析するステ
    ップ、 前記各ブロックのクラスター化代表係数集合を得るため
    に前記ブロックの全ての前記係数の各集合をベクトル量
    子化し、少なくとも一つのブロックと関連付けられた各
    クラスター係数集合はクラスター代表と呼ぶステップ、
    一ブロックの一クラスター代表から前記各信号の全ブロ
    ックに対する後続ブロックの第二クラスター代表への遷
    移の確率を決定するステップ、各信号の対応ブロックの
    各遷移に対して累積確率値を提供するステップ、前記累
    積遷移確率値と前記クラスター代表係数を記憶するステ
    ップから構成される方法。
  3. 【請求項3】非反復的疑似ランダム信号合成を提供する
    方法において、合成されるべき信号の各逐次ブロックに
    対して確率値を逐次発生するステップ後続ブロックの累
    積確率値の対応集合をメモリから読みだすためにブロッ
    クのクラスター代表を提供するステップ、 前記の後続ブロックに対する選択クラスター代表を決定
    するために前記の後続ブロックに対して記憶された前記
    累積確率値で前記の後続ブロックに対する逐次的に発生
    された確率値を比較するステップ、前記選択クラスター
    代表に対応する前記クラスター代表係数を包含するメモ
    リから読み取るクラスター代表係数の集合を提供するス
    テップ、前記ブロックに対応する時間再帰的フィルター
    へ前記選択クラスター係数を提供するステップ、そして 前記合成信号を提供するために逐次ブロックに対して上
    記プロセスを繰り返すステップから構成される方法。
  4. 【請求項4】再帰的フィルターのクラスター化線形予測
    符合化係数を提供する装置において、 複数の信号を提供する手段、 前記各信号の各時間ブロックの線形予測符合化係数の集
    合を得る手段、集合数を低減し、それにより係数の代表
    クラスター化集合を提供するために前記集合をベクトル
    量子化する手段、 ブロックの前記代表クラスター化集合の各一つから後続
    ブロックの係数の前記代表クラスター化集合の各一つへ
    の遷移累積確率を決定する手段、そして遷移の前記累積
    確率と前記クラスター代表係数の前記集合と各逐次ブロ
    ックの逐次クラスター係数の前記集合を記憶するメモリ
    手段から構成される装置。
  5. 【請求項5】指示された時間ブロックで線形予測符合化
    係数を再帰的フィルターに適用することにより疑似ラン
    ダム信号を合成する装置において、クラスター化LPC
    係数の集合を記憶する第一メモリ手段、ブロックのクラ
    スター化係数の選択集合の関数として後続ブロックのク
    ラスター化係数の集合の累積確率を前記の各ブロックに
    対して記憶するレコードメモリ手段、 後続ブロックで使用されるべきクラスター化係数の集合
    に対する前記累積確率の一つを選択する手段、 各連続ブロックに対するクラスター化係数の集合の選択
    を反復する手段、そして 前記合成信号を提供するためにブロックに続いて前記再
    帰的フィルターにクラスター化係数の前記選択集合を提
    供する手段から構成される装置。
  6. 【請求項6】クラスター化線形予測符合化係数を提供す
    るための方法において、 複数の信号のそれぞれに初期と最終ブロックインデック
    ス番号を確立し、各信号はブロック、クラスター確立ス
    レッショルド、線形予測符合化係数の数、そして所望の
    クラスター数に分割されるステップ、前記信号の一つの
    初期ブロックをサンプリングするステップ、前記信号の
    一つの初期ブロックの自己相関データから係数のクラス
    ターを提供するために初期ブロックの線形予測符合化係
    数を演算するステップ、前記信号の一つの次ブロックを
    読み取るステップ、各クラスターの表示歪みを演算する
    ステップ、前記次ブロックの自己相関から最小表示歪み
    を確立するステップ、歪みが所定スレッショルド値より
    も小さいかどうかを決定するステップ、もしそれが小さ
    いならば、各クラスターとゲインをブロックレコードデ
    ータベース内に入力し、そしてクラスター統計を更新し
    、もしそうでなければ、新クラスターを確立し、そして
    係数自己相関データをファイル内にロードし、 クラスターの最大数が超過しないかどうかを決定するス
    テップ、もし超過しなければ、全データブロックが分析
    されているかどうかを決定し、もし超過するならば、ク
    ラスター代表データをデータベースにロードし、そして
    クラスター統計を出力し、そして もしデータブロックが完了しないならば、次ブロックを
    読み取るこのステップに戻り、そして全ての連続ステッ
    プを反復するステップから構成される方法。
  7. 【請求項7】再帰的フィルターのブロックのクラスター
    化線形予測符合化係数からの信号を合成するための方法
    において、第一ブロックの遷移マトリックスからの初期
    状態分布ベクトルを使用して初期クラスターを選択する
    ステップ、 ランダム数と比較することによりアドレス指定されたベ
    クトル量子化係数集合を決定するステップ、 メモリから係数集合を読み取るステップ、 ブロック更新速度に対応する時間で前記係数集合を前記
    再帰的フィルターに提供するステップ、 現在選択行への次状態遷移マトリックスを選択し、そし
    て行累積確率ベクトルを構成するステップ、 ランダム数を発生するステップ、そして 前記ランダム数と前記行累積確率ベクトルを比較するこ
    とによりベクトル量子化係数集合を決定することで始ま
    る上記ステップを繰り返すステップから構成される方法
  8. 【請求項8】再帰的フィルターの確率重み付けクラスタ
    ー化線形予測符合化係数を提供するための方法において
    、 複数の信号の各時間ブロックの複数のサンプルを提供す
    るステップ、各前記時間ブロックの前記の複数の前記サ
    ンプルからの再帰的フィルターの線形予測符合化係数集
    合を決定するステップ、クラスター化集合として参照さ
    れる低減された集合数を提供するために許容歪み限度を
    超過せずに以前に決定された集合で前記の各集合を置き
    換えるステップ、 前記の複数の信号のそれぞれの各対応ブロックに対して
    一ブロックの一クラスター化集合から後続ブロックの前
    記クラスター化集合の一つへの遷移の確率を決定するス
    テップ、 前記クラスター化集合のそれぞれ一つから前記クラスタ
    ー化集合のそれぞれ一つの遷移の各ブロックに対する累
    積確率を提供するステップ、そして各ブロックに対して
    前記累積確率を異なるメモリセクター内に記憶するステ
    ップから構成される方法。
JP2409368A 1990-01-02 1990-12-28 サウンドシンセサイザー Pending JPH03293700A (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US45942090A 1990-01-02 1990-01-02
US459420 1990-01-02

Publications (1)

Publication Number Publication Date
JPH03293700A true JPH03293700A (ja) 1991-12-25

Family

ID=23824698

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2409368A Pending JPH03293700A (ja) 1990-01-02 1990-12-28 サウンドシンセサイザー

Country Status (4)

Country Link
EP (1) EP0436397B1 (ja)
JP (1) JPH03293700A (ja)
CA (1) CA2031965A1 (ja)
DE (1) DE69029030T2 (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002123299A (ja) * 2000-08-09 2002-04-26 Sony Corp 音声処理装置および音声処理方法、学習装置および学習方法、並びにプログラムおよび記録媒体
US7912711B2 (en) 2000-08-09 2011-03-22 Sony Corporation Method and apparatus for speech data

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6471420B1 (en) 1994-05-13 2002-10-29 Matsushita Electric Industrial Co., Ltd. Voice selection apparatus voice response apparatus, and game apparatus using word tables from which selected words are output as voice selections

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
FR2510288B1 (fr) * 1981-07-24 1986-10-31 Labo Cent Telecommunicat Procede et dispositif de generation de bruits sous-marins, en particulier pour la simulation de bruits sonar
AU588334B2 (en) * 1985-07-18 1989-09-14 Raytheon Company Digital sound synthesizer and method

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002123299A (ja) * 2000-08-09 2002-04-26 Sony Corp 音声処理装置および音声処理方法、学習装置および学習方法、並びにプログラムおよび記録媒体
US7912711B2 (en) 2000-08-09 2011-03-22 Sony Corporation Method and apparatus for speech data
JP4736266B2 (ja) * 2000-08-09 2011-07-27 ソニー株式会社 音声処理装置および音声処理方法、学習装置および学習方法、並びにプログラムおよび記録媒体

Also Published As

Publication number Publication date
DE69029030T2 (de) 1997-06-05
EP0436397B1 (en) 1996-10-30
CA2031965A1 (en) 1991-07-03
EP0436397A3 (en) 1992-09-02
EP0436397A2 (en) 1991-07-10
DE69029030D1 (de) 1996-12-05

Similar Documents

Publication Publication Date Title
Ross et al. Average magnitude difference function pitch extractor
US4709390A (en) Speech message code modifying arrangement
US4813074A (en) Method of and device for segmenting an electric signal derived from an acoustic signal
US5740320A (en) Text-to-speech synthesis by concatenation using or modifying clustered phoneme waveforms on basis of cluster parameter centroids
EP0555545A1 (en) Speech recognition apparatus which predicts word classes from context and words from word classes
US20020035469A1 (en) Method and configuration for determining a descriptive feature of a speech signal
Ljolje et al. Synthesis of natural sounding pitch contours in isolated utterances using hidden Markov models
CN101276583A (zh) 语音合成系统和语音合成方法
US5119425A (en) Sound synthesizer
EP0453649A2 (en) Method and apparatus for modeling words with composite Markov models
CA2241549C (en) Waveform synthesis
CN117672176A (zh) 基于语音自监督学习表征的重读可控语音合成方法及装置
US5005204A (en) Digital sound synthesizer and method
US4388491A (en) Speech pitch period extraction apparatus
CN111667805B (zh) 一种伴奏音乐的提取方法、装置、设备和介质
US5822724A (en) Optimized pulse location in codebook searching techniques for speech processing
JPH03293700A (ja) サウンドシンセサイザー
US5822721A (en) Method and apparatus for fractal-excited linear predictive coding of digital signals
US6009384A (en) Method for coding human speech by joining source frames and an apparatus for reproducing human speech so coded
Donovan Segment pre-selection in decision-tree based speech synthesis systems
WO2006127968A1 (en) Restoring audio signals corrupted by impulsive noise
JP3282693B2 (ja) 声質変換方法
O'Leary et al. A two level montage approach to sound texture synthesis with treatment of unique events.
CN112767968A (zh) 基于区分性互补信息的语音客观评价最优特征组筛选方法
JP3471889B2 (ja) 音声符号化方法及び装置