JP3513414B2 - フォルマント・シフト補償音響シンセサイザおよびその操作方法 - Google Patents

フォルマント・シフト補償音響シンセサイザおよびその操作方法

Info

Publication number
JP3513414B2
JP3513414B2 JP05342299A JP5342299A JP3513414B2 JP 3513414 B2 JP3513414 B2 JP 3513414B2 JP 05342299 A JP05342299 A JP 05342299A JP 5342299 A JP5342299 A JP 5342299A JP 3513414 B2 JP3513414 B2 JP 3513414B2
Authority
JP
Japan
Prior art keywords
bias
circuit
frequency
waveform
periodic waveform
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP05342299A
Other languages
English (en)
Other versions
JPH11338500A (ja
Inventor
デー.カーチン スチーヴン
Original Assignee
ルーセント テクノロジーズ インコーポレーテッド
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by ルーセント テクノロジーズ インコーポレーテッド filed Critical ルーセント テクノロジーズ インコーポレーテッド
Publication of JPH11338500A publication Critical patent/JPH11338500A/ja
Application granted granted Critical
Publication of JP3513414B2 publication Critical patent/JP3513414B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10HELECTROPHONIC MUSICAL INSTRUMENTS; INSTRUMENTS IN WHICH THE TONES ARE GENERATED BY ELECTROMECHANICAL MEANS OR ELECTRONIC GENERATORS, OR IN WHICH THE TONES ARE SYNTHESISED FROM A DATA STORE
    • G10H7/00Instruments in which the tones are synthesised from a data store, e.g. computer organs
    • G10H7/08Instruments in which the tones are synthesised from a data store, e.g. computer organs by calculating functions or polynomial approximations to evaluate amplitudes at successive sample points of a tone waveform
    • G10H7/10Instruments in which the tones are synthesised from a data store, e.g. computer organs by calculating functions or polynomial approximations to evaluate amplitudes at successive sample points of a tone waveform using coefficients or parameters stored in a memory, e.g. Fourier coefficients

Landscapes

  • Physics & Mathematics (AREA)
  • Mathematical Physics (AREA)
  • Engineering & Computer Science (AREA)
  • Algebra (AREA)
  • General Physics & Mathematics (AREA)
  • Mathematical Analysis (AREA)
  • Mathematical Optimization (AREA)
  • Pure & Applied Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Electrophonic Musical Instruments (AREA)

Description

【発明の詳細な説明】
【0001】
【発明の技術分野】本発明は、概して、音響合成に関
し、特に、その内部で、一つまたはそれ以上の線形予測
符号化(Linar Predictive Coding:LPC)フィル
タを使用しなくてもフォルマント・シフト(formant shi
ft) が軽減する音響の合成システムおよび方法に関す
る。
【0002】
【発明の背景】音声は、情報および情緒の両方を伝達す
ることができる通信の基本的形式である。情報は語によ
り伝達され、一方、情緒は、通常、話し手の音声の抑揚
により伝達される。人間の場合、音声の波形は、話し手
の咽頭に位置している声帯により発生する。音声波形
は、その後、話し手の喉、口および鼻の通路を含む一連
の柔軟な様々な形をした管からなる発声空洞内を伝播す
る。話し手の唇および種々の他の構造体のところで、波
形の一部がさらに伝達され、一方、他の部分が反射され
る。波形の流れは、有意に制限することができるし、ま
たは話し手の口蓋垂、歯、舌または唇により完全に遮断
することもできる。
【0003】母音のような有声音は、声帯が規則正しい
波形を発生するときに発生する。子音のような無声音
は、発声空洞のある部分が引き締められ、波形の伝達が
制限されるときに発生する。
【0004】発生した波形は、周波数および振幅を含
む、多くのパラメータにより特徴づけることができる。
フーリエ分析により、音声波形は、スペクトル成分から
なるスペクトル・フレームとしての周波数領域により表
すことができる。スペクトル・フレームは、高調波(基
本周波数の倍数のところで発生するスペクトル成分)と
共に、波形の最も低い、すなわち、基本周波数を含む。
弦楽器および音声の母音からのスペクトル成分は、通
常、基本周波数の整数倍の付近で発生する。一方、打楽
器からのスペクトル成分は、多くの場合、基本周波数の
整数倍でないところで発生する。
【0005】人間は、スペクトル・フレームの全体の形
の中の頂上と谷間に特に敏感に反応する。周波数領域内
においては、スペクトル・フレームの形の特徴は、多数
のフォルマントによるものである。本発明を説明するた
めの一つフォルマントは、その内部において、スペクト
ル成分の振幅が有意に大きくなったり、小さくなったり
する、二つまたはそれ以上の高調波にまたがる一つの周
波数領域と定義される。楽器の場合には、フォルマント
は、共鳴体の形により形成される。異なる音符が演奏さ
れる場合基本周波数が変化し、一方、フォルマントは一
定のままである。フォルマントのパターンが上記のよう
に一定のままであるので、聴衆は、異なる楽器を容易に
聞き分けることができ、他の点では同じ楽器(ストラデ
ィヴァリウスのような)を他の楽器と区別することがで
きる。
【0006】音声の場合には、フォルマントは、話し手
の舌および顎の位置を含めて、話し手の発声空洞の形に
より形成される。音声の弁別の基本的な単位は、子音お
よび母音のレベルで音として定義される音素である。一
つの音素は、特定のフォルマント・パターンを持つ一つ
のスペクトル・フレームとしての周波数領域により表す
ことができる。発声空洞を変化させることにより、話し
手は異なるフォルマントを形成することができ、そのた
め、異なる音素、二重母音、シラブル(syllable)および
語を形成することができる。
【0007】マルチメディア機能を持つコンピュータが
広く普及したので、コンピュータにより、人間の音声お
よび楽器の音の両方を再生または合成することができれ
ば便利である。コンピュータは、音響を発生するのに多
数の異なる技術を使用する。二つの広く使用されている
技術は、周波数変調(FM)合成およびウエーブテーブ
ル合成である。
【0008】デジタル楽器およびマルチメディア装置で
広く使用されているFM合成技術は、通常、正弦波キャ
リア信号の周波数を変調するのに、一つまたはそれ以上
の周期変調信号を使用する。印象的な新しい合成音を発
生するのには役に立つが、FM合成技術は、自然音を忠
実にうまく再生することができないことが分かってい
る。
【0009】任意の合成技術を使用する際の重要な一つ
の要因は、発生した音をどの程度制御することができる
かということである。例えば、ウエーブテーブル合成(w
avetable synthesis) システムは、音質の高い音のサン
プルをデジタル的に記憶し、その後で、必要な場合、音
を再生することができる。波形整形合成は、ユーザが、
出力信号のスペクトル・フレームに対して、高度の制御
を行うことができるようにする他の方法である。標本化
した音は、デジタル化され、はっきりしたフォルマント
・パターンを含む、スペクトル・フレームとしての周波
数領域により表される。スペクトル・フレームは、従来
の技術を使用して、非線形伝達関数として表すこともで
きる。波形整形合成は、基本周波数の正弦波信号によ
り、非線形伝達関数を駆動することにより行われる。波
形整形合成技術は、ブクラ400(Buchla 400)シリー
ズ、またもっと最近ではコーグ01/W(Korg 01/W) の
ようないくつかの初期のデジタル音楽シンセサイザで使
用された。
【0010】FMおよびウエーブテーブル合成は、優れ
たマルチメディア合成方法である。波形整形合成は、人
間の音声の再生を含む種々の用途に使用することもでき
る、もう一つの技術である。特定の音質を持つ音素を作
るためには、ユーザは、最初、スペクトル・フレームお
よびフォルマント・パターン情報を含む適当な伝達関数
を選択しなければならない。その後で、適当な基本周波
数で、伝達関数を駆動することにより楽音が作られる。
【0011】情緒的な内容を伝える場合、人間の音声は
抑揚に大きく依存している。それ故、抑揚がないと不都
合なことになる。音声に抑揚をつけると、音声の基本周
波数がシフトする。しかし、基本周波数がシフトする
と、フォルマント・パターンに対応するシフトが起こる
ことになる。もちろん、フォルマント・パターンは、聞
き取ることができるように、結果として得られる音声
に、何等の本質的な変化を起こさないで再生しなければ
ならない。それ故、フォルマント・パターンにシフトが
起こると、音声を聞き取ることができないものにし、ま
た不自然なものにする。
【0012】聞き取ることができる状態を維持しながら
抑揚を与えることができる音声合成の一つの方法として
は、線形予測符号化(LPC)、すなわち、発声空洞を
一連のフィルタとしてモデル化する、高度に機械的なプ
ロセスがある。LPCは、基本周波数とは独立して、フ
ィルタの係数を計算する。それ故、抑揚による基本周波
数のシフトにより、上記フィルタにより作られたフォル
マント・パターンに影響を受けない。LPCは、一般的
なモデルの抑揚を含む音声を供給することができるが、
特定の話し手の音声を再生するのに必要な複雑なフィル
タを使用すると、その計算コストが余りに高すぎて、と
ても実用化できない。その結果、大部分の現在の音声合
成技術は、もっと簡単なフィルタを使用してきたが、そ
のため、合成された音声は、ロボットのような人工的な
音声で、情緒的な内容を含んでいない。
【0013】従って、この技術において必要なものは、
フォルマント・パターンに対応するシフトを起こさせな
いで、また聞き取ることができ、耳で聞いて自然な感じ
を持つように、音声合成の際に抑揚を含ませるためのシ
ステムおよび方法である。
【0014】
【発明の概要】従来技術の上記欠点を解決するために、
本発明は、周期的な波形を発生する波源と、周期的波形
の周波数シフトを行う周波数シフト回路と、上記周期的
波形をフォルマントを含む波形に変換する波形整形回路
とを有し、周波数シフトが、フォルマントの変位を起こ
させるシンセサイザで使用する上記変位を補償する回路
および方法、および上記回路および方法を使用するシン
セサイザを提供する。一実施例の場合には、上記回路
は、音波源および周波数シフト回路に接続していて、周
波数シフト回路が、周期的波形をシフトさせた程度に基
づいて周期的波形にバイアスを導入するバイアス回路を
含む。上記バイアスはそれに応じてフォルマントが変位
する程度を軽減する。
【0015】それ故、本発明は、結果として得られる波
形が、周波数シフトした場合に起こる恐れがあるすべて
のフォルマント・シフトを補償する、周期的波形の以降
の波形整形が行われる前に、周期的波形に対するバイア
スの広いコンセプトを導入する。本発明の好ましい実施
例の場合には、上記バイアスは、すべてのフォルマント
の周波数シフトを完全に補償し、フォルマントの同一性
および特徴をそのままに維持し、それにより、結果とし
て得られる音が理解でき、元の音として聞こえるように
する。
【0016】本発明の一実施例においては、上記バイア
スは直流バイアスである。この実施例の場合には、直流
バイアスは、その振幅または周波数を変えないで、周期
的波形を垂直にシフトする。
【0017】本発明の一実施例においては、上記周波数
シフト回路が、周期的波形を負の方向に周波数シフトし
た場合(すなわち、周期的波形の周波数を低くした場
合)、上記バイアス回路は、正のバイアスを導入する。
同様に、上記周波数シフト回路が、周期的波形を正の方
向に周波数シフトした場合(すなわち、周期的波形の周
波数を高くした場合)、上記バイアス回路は、負のバイ
アスを導入する。
【0018】本発明の一実施例においては、周期的波形
は正弦波である。他の実施例の場合、周期的波形は、低
い高調波を含む波形であり、その結果、スペクトルを容
易に予測することができる。もちろん、周期的波形は、
正弦波でない任意の周期的波形であってもよい。実際、
周期的波形は、数サイクルの間周期的に変化しさえすれ
ばよいので、パルスの形をしていてもよい。
【0019】本発明の一実施例においては、周期的波形
は、デジタル的に表され、バイアス回路は、周期的波形
を表すデジタル数にバイアスを加えたり、差し引いたり
する。別の方法としては、周期的波形としてアナログを
使用することができ、上記バイアスは周期的波形の平均
電圧を変化させる。
【0020】本発明の一実施例においては、波形整形回
路は、参照用テーブルの形に配列された複数の波形整形
伝達関数を含むメモリを備える。当業者であれば、波形
整形伝達関数を含む参照用テーブルについて周知であ
る。本発明は、参照用テーブルと一緒に使用することが
できるが、別な方法でも使用することができる。
【0021】本発明の一実施例においては、上記バイア
スと上記シフトの程度との間には直線的な関係がある。
別の方法としては、ある種の用途の場合、結果として得
られる波形の、非常に大きな周波数シフトを正しく補償
するためには、上記バイアスと上記シフトの程度との間
の関係が、非直線的にならざるをえない場合もでてく
る。
【0022】すでに、本発明の好ましいおよびいくつか
の特徴をどちらかというと広義に説明してきたので、当
業者であれば、以下の本発明の詳細な説明をよりよく理
解することができるだろう。本発明の特許請求の範囲の
主題を形成する、本発明の他の特徴については、以下に
説明する。当業者は、本発明の同じ目的を実行するため
に、他の構造体を設計または修正するためのベースとし
て、開示のコンセプトおよび特定の実施例を容易に使用
することができることを理解されたい。また、当業者で
あれば、同じ構造体が、最も広義の場合、本発明の精神
および範囲内に含まれることも理解されたい。
【0023】本発明をもっとよく理解するために、以下
の説明を添付の図面を参照しながら以下の説明を参照さ
れたい。
【0024】
【発明の詳細な記述】図1について説明すると、この図
は、本発明の原理に基づいて組み立てた、音を合成する
ための、全体を参照番号100で示す方法のフローチャ
ートである。この方法は、スタート・ステップ110か
らスタートする。標本化ステップ120においては、ア
ナログ波形を捕捉し、そこから標本化した信号を作るた
めに、従来のデジタル標本化技術が使用される。普通に
使用される一つの標本化技術は、パルス符号変調(Pul
se Code Modulation:PCM)であり、この場合、上
記アナログ波形は、デジタル数のシーケンスを作るため
に標本化され、量子化される。音声信号の場合には、好
ましいには、信号振幅の関数として対数的に増大するス
テップを含む従来の量子化方法を使用することが好まし
い。
【0025】次に、時間−周波数分析ステップ130に
おいては、標本化された信号が、時間領域信号から周波
数領域信号、または「スペクトル・フレーム」に変換さ
れる。上記標本化された信号を変換するために通常使用
される一つの方法は、標本化信号を一組のフーリエ係数
で表すことができるフーリエ変換である。
【0026】次に、波形整形伝達関数生成ステップ14
0においては、上記スペクトル・フレームが、従来の方
法により波形整形伝達関数に変換される。通常使用され
る一つの方法であるスペクトル整合波形整形は、高調波
をチェビィシェフ多項式の対応する合計で調整を行う。
それ故、結果として得られる非線形波形整形伝達関数
は、スペクトル・フレームおよびそのフォルマント・パ
ターンを表す。
【0027】次に、フォルマント・シフト決定ステップ
150においては、周波数シフトの計算が行われる。音
声関連の用途の場合には、周波数シフトは、合成音声に
必要な抑揚の大きさに対応する。その後、フォルマント
シフト補償ステップ160においては、適当な基本周波
数の正弦波(以下により詳細に説明する)が、周波数お
よびバイアスの両方に変換される。
【0028】音声の場合には、上向き抑揚は、上記正弦
波の基本周波数を増大し、上記正弦波を負の方向にバイ
アスすることにより導入される。同様に、下向き抑揚
は、上記正弦波の基本周波数を減少し、上記正弦波を正
の方向にバイアスすることにより導入される。上記バイ
アスを上記正弦波に導入すると、結果として得られる出
力音の認識フォルマントの中心が上昇または下降し、そ
のため、基本周波数のシフトによるフォルマント・パタ
ーンの変化が(部分的に、または完全に)打ち消され
る。当業者であれば、フォルマント・シフト補償ステッ
プ160の周波数シフトおよびバイアス導入は、同時に
行うこともできれば、任意の順序で順次起こすこともで
きること、またフォルマント・シフト決定ステップ15
0、およびフォルマント・シフト補償ステップ160
は、また、波形整形伝達関数生成ステップ140の前の
任意の時間に、または同時に行うことができることを理
解することができるだろう。
【0029】次に、出力音生成ステップ170において
は、シフトした正弦波は、波形整形伝達関数に適用さ
れ、その結果、必要なフォルマント・パターン、および
必要な周波数シフトの両方を持つ出力音が得られる。音
声合成の用途の場合には、結果として得られる音声は、
フォルマント・パターンが変化していないので、聞き取
ることができるし、基本周波数のシフトにより抑揚も含
む。この方法は、最終ステップ108で終了する。
【0030】図2について説明すると、この図は、図1
の方法に関連する単純化した波形の例である。より詳し
く説明すると、図2Aは、ある時間領域内の標本化した
信号120である。図2Bは、上記標本化信号210の
スペクトル・フレーム220である。図2Cは、スペク
トル・フレーム220からの波形整形伝達関数230で
ある。図2Dは、出力音の基本周波数を持つ正弦波24
0である。図2Eは、出力音サンプル250である。
【0031】図1についてさらに説明を続けると、標本
化信号210は、標本化ステップ120により捕捉され
る。時間−周波数分析ステップ130において、スペク
トル・フレーム220、すなわち、標本化信号210の
周波数領域表現の発生が行われる。その後、波形整形伝
達関数生成ステップ140は、上記スペクトル・フレー
ム220を波形整形伝達関数230に変換するために使
用される。その後、フォルマント・シフト決定ステップ
150において、周波数シフトの計算が行われると、フ
ォルマント・シフト補償ステップ160において、フォ
ルマント・シフトを補償するために、正弦波240の周
波数およびバイアス両方のシフトが行われる。出力音サ
ンプル250は、その後、波形整形伝達関数230に正
弦波240を適用することにより、出力音生成ステップ
170において生成される。
【0032】図3について説明すると、この図は、本発
明の原理に基づいて組み立てた、音声合成システム、す
なわち、シンセサイザ300の一実施例のブロック図で
ある。シンセサイザ300は、音声標本化装置315、
および分析装置320を有する時間領域入力装置310
を含む。音声標本化装置315は、入力音声源から入力
信号を受信し、この信号から標本化信号を生成する。本
発明の一実施例の場合には、音声標本化装置315は、
PCM、すなわち、アナログ入力を捕捉し、それをデジ
タル数のシーケンスに変換する従来のデジタル標本化技
術を使用する。もちろん、他の標本化技術の使用も、本
発明の広い範囲内に含まれる。音声標本化装置315に
接続している、分析装置320は、その後、上記入力信
号のスペクトル・フレームを生成するために、標本化信
号に対して、時間−周波数分析を行う。上記分析は、専
用電子回路(例えば、特定用途向けIC(Application
Specific Integrated Circut:ASIC)、または
デジタル信号処理(Digital Signal Processing:D
SP)回路)により行うこともできるし、単に、汎用パ
ソコンの従来のプロセッサにより行うこともできる。
【0033】シンセサイザ300は、また、スペクトル
・フレームにフォルマントの中心および幅を指定するこ
とにより、ユーザが、シンセサイザ300にスペクトル
・フレームを直接入力することができる、パラメトリッ
ク入力装置325を含む。当業者であれば、シンセサイ
ザ300が、パラメトリック入力装置325、および時
間領域入力装置310の両方を含むことができ、また
は、別の方法としては、シンセサイザ300は、パラメ
トリック入力装置325、または時間領域入力装置31
0の一方だけを含むこともできることを理解することが
できるだろう。もちろん、パラメトリック入力装置32
5も、時間領域入力装置310も、本発明にとって絶対
必要な装置ではない。
【0034】シンセサイザ300は、さらに、時間領域
入力装置310、およびパラメトリック入力装置325
に接続しているコンバータ330を含む。上記コンバー
タは、スペクトル・フレームを波形整形伝達関数に変換
する。スペクトル・フレームを波形整形伝達関数に変換
するための従来の方法は、当業者にとって周知であるの
で、これ以上の説明は省略する。シンセサイザ300
は、さらに、波形整形伝達関数を記憶している記憶装置
(メモリ)340を含む。好ましい実施例の場合には、
波形整形伝達関数は、参照用テーブルに配置される。当
業者であれば、ハード・ドライブ、ディスケット、読み
出し専用メモリ(ROM)およびランダム・アクセス・
メモリ(RAM)のような種々の従来の記憶装置につい
て周知である。
【0035】シンセサイザ300は、さらに、生成する
音声を分析し、そこから必要な抑揚の大きさおよび方向
を決定する抑揚決定回路350を含む。シンセサイザ3
00は、さらに、音声の基本周波数を選択する基本周波
数決定回路355を含む。選択された基本周波数は、合
成音声が男性または女性の音声を表すためのものである
かどうかのような種々の要因により異なる。男性は、通
常、基本周波数が80乃至160Hzの有声音を発生
し、一方、女性は、通常、200Hzまたはそれ以上の
基本周波数を発生する。
【0036】シンセサイザ300は、さらに、抑揚決定
回路350および基本周波数決定回路355に接続して
いる周波数発生器360を含む。周波数発生器360
は、音声の基本周波数で周期的波形を発生することがで
きる、波源362を含む。好ましい実施例の場合には、
波源362は、正弦波を発生する。もちろん、他の周期
的波形の使用も、本発明の広い範囲内に含まれる。周波
数発生器360は、さらに、必要な抑揚の大きさおよび
方向に基づいて、周期的波形の周波数をシフトするため
の波源362に接続している、周波数シフト回路364
を含む。周波数発生器360は、さらに、波源362お
よび周波数シフト回路364に接続しているバイアス回
路366を含む。上記バイアス回路は、周期的波形の周
波数がシフトされる程度に基づいて周期的波形にバイア
スを導入する。
【0037】本発明の一実施例の場合には、導入された
バイアスは、周期的波形の周波数シフト(周期的波形が
周波数シフトする度合)に対して直線的な関係を持つ。
別の方法の場合、非常に大きな周波数シフトを必要とす
るある種の用途の場合には、上記バイアスは周波数シフ
トに対して非直線的な関係を持つ。それ故、周波数発生
器360は、抑揚決定装置350および基本周波数決定
装置355からの情報に基づいて、適当な周波数および
バイアスを持つ基本周波数を発生する。上向き抑揚の場
合には、周波数発生器360は、基本周波数を増大させ
るが、一方、そのバイアスは低くする。逆に、下向き抑
揚の場合、周波数発生器360は、基本周波数を低減す
る一方で、バイアスを高くする。基本周波数のバイアス
をシフトさせると、認識フォルマントの中心が上昇した
り、下降したりし、基本周波数でのシフトによるフォル
マント・パターンの変化を打ち消す。好ましい実施例の
場合には、周期的波形は、デジタル的に表され、バイア
ス回路366は、周期的波形を表すデジタル数にバイア
スを加えたり、または差し引いたりする。別の方法とし
ては、周期的波形として、アナログ信号を使用すること
ができ、バイアス回路366は、周期的波形の平均電圧
を変更するために、直流オフセットまたは直流バイアス
を導入する。ここでもまた、周期的波形の周波数シフト
およびバイアスは、相互に交換可能な順序で順次行うこ
とも、同時に行うこともできることに注意することが重
要である。
【0038】シンセサイザ300は、さらに、記憶装置
340および周波数発生器360の両方に接続してい
る、波形整形回路370を含む。波形整形回路370
は、基本周波数を入力し、フォルマント・パターンを含
む波形を生成するために、波形整形伝達関数を適用す
る。本発明の一実施例の場合には、波形整形回路370
は、多数の波形整形伝達関数を記憶している記憶装置3
40を含む。別の方法としては、波形整形回路370お
よび記憶装置340を別々の回路とすることもできる。
その後、波形を出力音に変換し、スピーカのような出力
装置380に送ることができる。シンセサイザ300
は、それ故、計算コストが高くつくフィルタを使用しな
いで、聞く人が理解できる状態に維持しながら、自然の
抑揚をつけて音声を合成することができる。
【0039】当業者であれば、本明細書に記載したシン
セサイザの用途が、音声を含む用途に制限されないで、
その基本周波数を変化させながら、特定のフォルマント
・パターンを元のままの状態に維持する必要がある、す
べての用途に使用できることを理解することができるだ
ろう。音声および音合成をさらによりよく理解するに
は、下記文献を参照されたい。すなわち、D.アーフィ
ブ(D.Arfib)の「非線形歪曲正弦波の乗算による複合ス
ペクトルのデジタル合成(Digital synthesis ofComplex
Spectra by Means of Mutiplication of Non-Linear D
istored Sine Waves)」(1978年、国際コンピュータ音
楽会議議事録(Processings of the International Comp
uter Music Conference)、ノースウェスタン大学(North
western University)、J.W.ボーシャン(J.W. Beau
champ)の「非線形高調波間の関係を利用するコルネット
の音の分析と合成(Analysis and Synthesis of Cornet
Tones Using Non-Linear Interharmonic Relationshi
p)」(1979年、オーディオ・エンジニアリング協会ジャ
ーナル(Journal of the Audio Engineering Society)第
23巻第6号)、ジェームズ・ボーシャン(James Beauc
hamp)の「非線形関数とのスペクトル展開整合によるブ
ラス音の合成(Brass Tone Synthesis by Spectrum Evol
ution Matchig with Non-Linear Functions)」(1979
年、コンピュータ音楽ジャーナル(Computer Music Jour
nal)、第3巻第2号)、ジョン F.コーゲル・ブフォ
ード(Jone F. Koegel Buford)の「マルチメディア・シ
ステム(Multimedia System)」(1994年、ACMプレス
(ACM Press)発行)、チャールズ・ドッジ(Charles Dodg
e)およびトーマス A.ジャース(Thomas A, Jerse)の
「コンピュータ音楽(Computer Music)」(1985年、シャ
ーマー・ブック社(Schirmer Books)発行)、マルク・ル
ブラン(Marc LeBrun)の「デジタル波形整形合成(Digita
l Waveshaping Synthesis)」(1979年、オーディオ・エ
ンジニアリング協会ジャーナル(Journal of the Audio
Engineering Society)、第27巻第4号)、ヴェルナー
・カエギ(Werner kaegi)およびスタン・テンペラース(S
tan Tempelaars)の「VOSIN−−新しいサウンド合
成システム(VOSIN -- A New Sound Synthesis Syste
m)」(1978年、オーディオ・エンジニアリング協会ジャ
ーナル(Journal of the Audio Engineering Society)第
26巻第6号)、F.リチャード・ムーア(F.Richard M
oore)の「コンピュータ音楽の要素(Elements of Compue
r Music)」(1990年、プレンティス・ホール社(Prentic
e Hall)発行)、C.ローズ(C.Roads)の「コンピュータ
音楽に関する論文(The Computer Music Tutorial)」(1
996年、MITプレス(MIT Press)社発行)、X・ロデッ
ト(X.rodet)の「時間領域フォルマント−波形−関数合
成(Time-domain Formant-Wave-Functions Synthesis)」
(1979年7月)、Actes du NATO−ASI
Bonas)、C.Y.スーエン(C.Y.Suen)の「非線
形回路の高調波式の偏差(Derivation of Harmonic Equa
tions in Non-Linear Circuits)」(1970年、オーディ
オ・エンジニアリング協会ジャーナル(Journal of the
Audio Engineering Society)第18巻第6号)である。
上記文献は、引用によって本明細書の記載に援用する。
【0040】本発明を詳細に説明してきたが、当業者で
あれば、その広い意味において、本発明の精神および範
囲から逸脱することなしに、種々の変更、置き換え、修
正を行うことができることを理解されたい。
【図面の簡単な説明】
【図1】本発明の原理に基づいて組み立てた音を合成す
る方法のフローチャートを示す図である。
【図2A】ある時間領域内の標本化した信号を示す図で
ある。
【図2B】上記標本化した信号のスペクトル・フレーム
を示す図である。
【図2C】上記スペクトル・フレームからの波形整形伝
達関数を示す図である。
【図2D】出力音の基本周波数の正弦波を示す図であ
る。
【図2E】出力音のサンプルを示す図である。
【図3】本発明の原理に基づいて組み立てた音声合成シ
ステム、すなわち、「シンセサイザ」を示す図である。
───────────────────────────────────────────────────── フロントページの続き (58)調査した分野(Int.Cl.7,DB名) G10L 19/02

Claims (20)

    (57)【特許請求の範囲】
  1. 【請求項1】 周期的波形を発生する波源と、該周期的
    波形を周波数シフトする周波数シフト回路と、該周期的
    波形をフォルマントを含む波形に変換する波形整形回路
    とを有し、該周波数シフトが該フォルマントの変位を引
    き起こすようになっているシンセサイザで使用する、該
    変位を補償する回路であって、 該波源と該周波数シフト回路に接続され、該周波数シフ
    ト回路が周期的波形を周波数シフトする度合に基づい
    て、該周期的波形にバイアスを導入するバイアス回路で
    あって、該バイアスが、該フォルマントが対応して周波
    数シフトされる度合を低減するよう作用するものである
    バイアス回路とを含むことを特徴とする回路。
  2. 【請求項2】 請求項1に記載の回路において、該バイ
    アスは直流バイアスである回路。
  3. 【請求項3】 請求項1に記載の回路において、該周波
    数シフト回路が、該周期的波形を負の方向に周波数シフ
    トさせるときに、該バイアス回路は正のバイアスを導入
    する回路。
  4. 【請求項4】 請求項1に記載の回路において、該周期
    的波形が正弦波である回路。
  5. 【請求項5】 請求項1に記載の回路において、該周期
    的波形がデジタル的に表示され、該バイアス回路が該周
    期的波形を表すデジタル数に該バイアスを加えたりまた
    は差し引いたりする回路。
  6. 【請求項6】 請求項1に記載の回路において、該波形
    整形回路が参照用テーブルに配置された複数の波形整形
    伝達関数を含むメモリからなる回路。
  7. 【請求項7】 請求項1に記載の回路において、該バイ
    アスと該度合の間の関係が直線的である回路。
  8. 【請求項8】 周期的波形を発生する波源と、該周期的
    波形を周波数シフトする周波数シフト回路と、記周期的
    波形をフォルマントを含む波形に変換する波形整形回路
    とを有し、該周波数シフトが該フォルマントの変位を引
    き起こすようになっているシンセサイザで使用する、該
    変位を補償する方法であって、 該周波数シフト回路が該周期的波形を周波数シフトする
    度合に基づいて、該周期的波形にバイアスを導入するス
    テップと、 該波形を周波数シフトするステップであって、該バイア
    スが、該フォルマントが対応して周波数シフトされる度
    合を低減するよう作用するステップと、を含むことを特
    徴とする方法。
  9. 【請求項9】 請求項8に記載の方法において、該バイ
    アスを導入するステップは該周期的波形へ直流バイアス
    を導入するステップからなる方法。
  10. 【請求項10】 請求項8に記載の方法において、該バ
    イアスステップが、該周波数シフト回路が該周期的波形
    を負の方向に周波数シフトさせたとき、正のバイアスを
    導入するステップからなる方法。
  11. 【請求項11】 請求項8に記載の方法において、該周
    期的波形は正弦波である方法。
  12. 【請求項12】 請求項8に記載の方法において、該周
    期的波形がデジタル的に表現され、該バイアス導入ステ
    ップが該周期的波形を表すデジタル数に該バイアスを加
    えたりまたは差し引いたりするようになっている方法。
  13. 【請求項13】 請求項8に記載の方法において、該波
    形整形回路が、参照用テーブルに配置された複数の波形
    整形伝達関数を含むメモリからなる方法。
  14. 【請求項14】 請求項8に記載の方法において、該バ
    イアスおよび該度合の間の関係が直線的である方法。
  15. 【請求項15】 シンセサイザであって、 正弦波を発生する波源と、 該正弦波を周波数シフトする周波数シフト回路と、 該正弦波をフォルマントを含む波形に変換する波形整形
    回路であって、該周波数シフトが該フォルマントの変位
    を引き起こすよう作用する波形整形回路と、 該波源および該周波数シフト回路に接続され、該周波数
    シフト回路が該正弦波を周波数シフトさせる度合に基づ
    いて、該正弦波にバイアスを導入するバイアス回路であ
    って、該バイアスが、該フォルマントが対応して変位す
    る度合を低減するよう作用するものであるバイアス回路
    とを含むことを特徴とするシンセサイザ。
  16. 【請求項16】 請求項15に記載のシンセサイザにお
    いて、該バイアスが直流バイアスであるシンセサイザ。
  17. 【請求項17】 請求項15に記載のシンセサイザにお
    いて、該周波数シフト回路が該正弦波を負の方向に周波
    数シフトさせるときには、該バイアス回路は正のバイア
    スを導入するシンセサイザ。
  18. 【請求項18】 請求項15に記載のシンセサイザにお
    いて、該正弦波がデジタル的に表現され、該バイアス回
    路は該正弦波を表すデジタル数に該バイアスを加えたり
    または差し引いたりするようになっているシンセサイ
    ザ。
  19. 【請求項19】 請求項15記載のシンセサイザにおい
    て、該波形整形回路が、参照用テーブルに配置された複
    数の波形整形伝達関数を含むメモリからなるシンセサイ
    ザ。
  20. 【請求項20】 請求項15記載の回路において、該バ
    イアスと該度合の間の関係が直線的であるシンセサイ
    ザ。
JP05342299A 1998-03-02 1999-03-02 フォルマント・シフト補償音響シンセサイザおよびその操作方法 Expired - Fee Related JP3513414B2 (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US09/034,158 US6101469A (en) 1998-03-02 1998-03-02 Formant shift-compensated sound synthesizer and method of operation thereof
US09/034158 1998-03-02

Publications (2)

Publication Number Publication Date
JPH11338500A JPH11338500A (ja) 1999-12-10
JP3513414B2 true JP3513414B2 (ja) 2004-03-31

Family

ID=21874664

Family Applications (1)

Application Number Title Priority Date Filing Date
JP05342299A Expired - Fee Related JP3513414B2 (ja) 1998-03-02 1999-03-02 フォルマント・シフト補償音響シンセサイザおよびその操作方法

Country Status (4)

Country Link
US (1) US6101469A (ja)
EP (1) EP0940799B1 (ja)
JP (1) JP3513414B2 (ja)
TW (1) TW444470B (ja)

Families Citing this family (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6502066B2 (en) 1998-11-24 2002-12-31 Microsoft Corporation System for generating formant tracks by modifying formants synthesized from speech units
JP3365354B2 (ja) * 1999-06-30 2003-01-08 ヤマハ株式会社 音声信号または楽音信号の処理装置
JP3815347B2 (ja) * 2002-02-27 2006-08-30 ヤマハ株式会社 歌唱合成方法と装置及び記録媒体
TWI252468B (en) * 2004-02-13 2006-04-01 Mediatek Inc Wavetable synthesis system with memory management according to data importance and method of the same
US8744853B2 (en) * 2009-05-28 2014-06-03 International Business Machines Corporation Speaker-adaptive synthesized voice
US10565973B2 (en) * 2018-06-06 2020-02-18 Home Box Office, Inc. Audio waveform display using mapping function
US11837212B1 (en) 2023-03-31 2023-12-05 The Adt Security Corporation Digital tone synthesizers

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2595235B2 (ja) * 1987-03-18 1997-04-02 富士通株式会社 音声合成装置
JP2504179B2 (ja) * 1989-04-13 1996-06-05 ヤマハ株式会社 ノイズ音発生装置
DE69029128T2 (de) * 1990-01-08 1997-03-20 Milliken Res Corp Zwischenprodukte und Farbstoffe mit vermehrt primären Hydroxylgruppen enthaltenden Poly(oxyalkylen)-Resten sowie deren Herstellung
CA2050019A1 (en) * 1991-08-27 1993-02-28 John Bery Hines Colorants and intermediates therefor having branched poly(oxyalkylene) moieties, and their manufacture
JP2712963B2 (ja) * 1991-12-06 1998-02-16 ヤマハ株式会社 フォルマント音発生装置
US5641929A (en) * 1994-06-21 1997-06-24 Kawai Musical Inst. Mfg. Co., Ltd. Apparatus for and method of generating musical tones
US5691496A (en) * 1995-02-14 1997-11-25 Kawai Musical Inst. Mfg. Co., Ltd. Musical tone control apparatus for filter processing a musical tone waveform ONLY in a transient band between a pass-band and a stop-band

Also Published As

Publication number Publication date
JPH11338500A (ja) 1999-12-10
US6101469A (en) 2000-08-08
EP0940799A1 (en) 1999-09-08
TW444470B (en) 2001-07-01
EP0940799B1 (en) 2003-05-14

Similar Documents

Publication Publication Date Title
JP2003255998A (ja) 歌唱合成方法と装置及び記録媒体
JP6733644B2 (ja) 音声合成方法、音声合成システムおよびプログラム
US5862232A (en) Sound pitch converting apparatus
JP3711880B2 (ja) 音声分析及び合成装置、方法、プログラム
JP3513414B2 (ja) フォルマント・シフト補償音響シンセサイザおよびその操作方法
JP2564641B2 (ja) 音声合成装置
US5969282A (en) Method and apparatus for adjusting the pitch and timbre of an input signal in a controlled manner
Bonada et al. Singing voice synthesis combining excitation plus resonance and sinusoidal plus residual models
Lansky et al. Synthesis of timbral families by warped linear prediction
JPH03136100A (ja) 音声処理方法及び装置
Sundberg Singing and timbre
Gentilucci et al. Composing vocal distortion: A tool for real-time generation of roughness
JP2001508197A (ja) 構成信号にノイズを加算してlpc原理により符号化された音声のオーディオ再生のための方法及び装置
JP4757971B2 (ja) ハーモニー音付加装置
JP4349316B2 (ja) 音声分析及び合成装置、方法、プログラム
US20030046079A1 (en) Voice synthesizing apparatus capable of adding vibrato effect to synthesized voice
JP2011090218A (ja) 音素符号変換装置、音素符号データベース、および音声合成装置
JP2000010597A (ja) 音声変換装置及び音声変換方法
Yim et al. Spectral transformation for musical tones via time domain filtering
JP2000003200A (ja) 音声信号処理装置及び音声信号処理方法
JP3294192B2 (ja) 音声変換装置及び音声変換方法
JPS58168097A (ja) 音声合成装置
JPS5880699A (ja) 音声合成方式
JPH1031496A (ja) 楽音発生装置
Siivola A survey of methods for the synthesis of the singing voice

Legal Events

Date Code Title Description
A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20040109

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080116

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090116

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100116

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110116

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110116

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120116

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130116

Year of fee payment: 9

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130116

Year of fee payment: 9

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

LAPS Cancellation because of no payment of annual fees