JP3888315B2 - Sound synthesis apparatus and program - Google Patents

Sound synthesis apparatus and program Download PDF

Info

Publication number
JP3888315B2
JP3888315B2 JP2003060515A JP2003060515A JP3888315B2 JP 3888315 B2 JP3888315 B2 JP 3888315B2 JP 2003060515 A JP2003060515 A JP 2003060515A JP 2003060515 A JP2003060515 A JP 2003060515A JP 3888315 B2 JP3888315 B2 JP 3888315B2
Authority
JP
Japan
Prior art keywords
output
signal
original signal
output means
pitch period
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2003060515A
Other languages
Japanese (ja)
Other versions
JP2004271750A (en
Inventor
靖雄 吉岡
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Yamaha Corp
Original Assignee
Yamaha Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Yamaha Corp filed Critical Yamaha Corp
Priority to JP2003060515A priority Critical patent/JP3888315B2/en
Priority to TW093105888A priority patent/TWI254276B/en
Priority to KR1020040015257A priority patent/KR100620484B1/en
Priority to CNB2004100282324A priority patent/CN100565667C/en
Priority to CNU2004200079068U priority patent/CN2699429Y/en
Publication of JP2004271750A publication Critical patent/JP2004271750A/en
Priority to HK05101891.3A priority patent/HK1068185A1/en
Application granted granted Critical
Publication of JP3888315B2 publication Critical patent/JP3888315B2/en
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Classifications

    • BPERFORMING OPERATIONS; TRANSPORTING
    • B60VEHICLES IN GENERAL
    • B60NSEATS SPECIALLY ADAPTED FOR VEHICLES; VEHICLE PASSENGER ACCOMMODATION NOT OTHERWISE PROVIDED FOR
    • B60N2/00Seats specially adapted for vehicles; Arrangement or mounting of seats in vehicles
    • B60N2/58Seat coverings
    • B60N2/5816Seat coverings attachments thereof
    • B60N2/5825Seat coverings attachments thereof by hooks, staples, clips, snap fasteners or the like
    • BPERFORMING OPERATIONS; TRANSPORTING
    • B60VEHICLES IN GENERAL
    • B60NSEATS SPECIALLY ADAPTED FOR VEHICLES; VEHICLE PASSENGER ACCOMMODATION NOT OTHERWISE PROVIDED FOR
    • B60N2/00Seats specially adapted for vehicles; Arrangement or mounting of seats in vehicles
    • B60N2/70Upholstery springs ; Upholstery

Landscapes

  • Engineering & Computer Science (AREA)
  • Aviation & Aerospace Engineering (AREA)
  • Transportation (AREA)
  • Mechanical Engineering (AREA)
  • Electrophonic Musical Instruments (AREA)
  • Stereophonic System (AREA)

Description

【0001】
【発明の属する技術分野】
本発明は、所望の音を表す信号を、複数種類の信号を加算することによって生成する音合成装置、およびコンピュータをこの音合成装置として機能させるためのプログラムに関する。
【0002】
【従来の技術】
人間の声や楽器の演奏音といった所望の音を合成する技術が従来から提案されている。CSM(Composite Sinusoidal Modeling)による音合成方法(以下「CSM音合成方法」という)は、この種の技術において広く利用されている方法のひとつである(例えば特許文献1参照)。この方法によれば、所望の音を表す信号(以下「合成音信号」という)の波高値ytは、以下の式(1)に示されるように、それぞれ角周波数および振幅が異なる複数の正弦波の和として表される。
yt=a1 sin ω1 t+a2 sin ω2 t+……+an sin ωn t (1)
なお、上式(1)において、「ai(iは1≦i≦nを満たす整数)」および「ωi」は、それぞれ第i次正弦波の振幅および角周波数である。また、「t」は時刻を表す整数であり、「n」は加算されるべき正弦波の個数(いわゆるCSM次数)を表している。
【0003】
図7は、このCSM音合成方法を利用して音を合成する装置の構成を示すブロック図である。同図に示すように、この音合成装置は、音合成部70と制御装置80とを有する。このうち音合成部70は、各々が正弦波を発生して出力するn個(ここではn=4とする)の正弦波出力ユニット71(71-1、71-2、71-3および71-4)と、各正弦波出力ユニット71からの出力信号を加算して出力する加算器72と、加算器72から出力された信号に特定のエンベロープを乗算したうえで合成音信号Sとして出力するエンベロープ処理部73とを備えている。各正弦波出力ユニット71は、指示された角周波数の正弦波を発生する正弦波発生器71aと、この正弦波に対して指示された振幅値を乗算する乗算器71bとを含んでいる。一方、図7に示す制御装置80は、合成すべき音の内容に応じた角周波数および振幅値を各正弦波出力ユニット71の正弦波発生器71aと乗算器71bとに対してそれぞれ指示するとともに、合成音の音高(ピッチ)に応じた時間長(以下「ピッチ周期」という)Tをエンベロープ処理部73に対して指示する。
【0004】
この構成のもと、4個の正弦波発生器71aは、図8(a)から(d)に示すように、ピッチ周期Tの開始時点の到来を契機として一斉に正弦波の発生を開始する。すなわち、ピッチ周期の開始時点における各正弦波の位相は、すべての正弦波発生器71aについて「0」となる。そして、これらの正弦波に振幅値を乗算した信号(以下「原信号」という)を加算したもの(図8(e))と、ピッチ周期Tの時間長を有するエンベロープ(図8(f))とがエンベロープ処理部73によって乗算されることによって、図8(g)に波形を示した合成音信号Sが得られる。図9(a)および(b)は、この合成音信号Sの波形およびスペクトログラムをそれぞれ示す図である。すなわち、図9(a)においては横軸が時間を表し、縦軸が信号強度を表している。また、図9(b)においては横軸が時間を表し、縦軸が周波数を表し、色の明暗が信号強度の分布を表している。
【0005】
【特許文献1】
特開平11−231875号公報(特に第3頁および第1図)
【0006】
【発明が解決しようとする課題】
しかしながら、図7に示す構成のもとで得られる合成音信号Sは、図9(a)に示すように信号強度がレベル「0」を基準として一方の側(ここでは「+」側)に偏ったものとなり、しかも図9(b)に示すようにピッチ周期Tの開始時点の近くで周波数の高いノイズ成分が顕著に現れるものとなる。そして、このような信号に基づいて発せられる音は、ノイズを含んだ耳障りなものとなるという問題があった。一方、信号強度の偏りやノイズ成分を抑えるために、合成音信号Sに対して各種のフィルタ処理を施すことも考えられる。しかしながら、この場合には合成音信号Sを得るための構成に加えてフィルタを別途に設ける必要が生じ、処理量の増大や構成の煩雑化を招くという問題が生じ得る。
【0007】
本発明は、このような事情に鑑みてなされたものであり、簡易な構成によって自然な音を合成することができる音合成装置、およびコンピュータを楽音合成装置として機能させるためのプログラムを提供することを目的としている。
【0008】
【課題を解決するための手段】
上述したように、図7に示した構成によって得られる合成音信号Sは、その信号強度がレベル「0」を基準として一方の側に偏ったものとなり、しかもピッチ周期の開始時点近傍にノイズを含むものとなる。本願発明者は、合成音信号Sがこのような性質をもった信号になる原因のひとつは、ピッチ周期の開始直後においてすべての原信号が一斉に増加を開始することにあるとの知見を得るに至った。
【0009】
すなわち、すべての原信号がピッチ周期の開始時点において一斉に増加を開始するために、合成音信号の波形は各ピッチ周期の境界時点において急激かつ不連続的に変化する。より具体的には、図9(a)を時間軸方向に拡大した同図(c)に示されるように、合成音信号の波形はピッチ周期の開始時点において不連続となる。この不連続の結果として、合成音信号はピッチ周期の開始時点にノイズを含むものとなるのである。
【0010】
また、エンベロープの波形は、一般的に、すべての原信号が一斉に増加するピッチ周期の開始直後において最大となる一方、その後は減衰していく。このため、すべての原信号を加算した信号とエンベロープとを乗算した合成音信号においては、レベル「0」を基準として「+」となる部分の積分値が、「−」となる部分の積分値と比べて大きくなる。この積分値の不均一に起因して、合成音信号の信号強度は一方の側に偏ったものとなるのである。
【0011】
【課題を解決するための手段】
本発明は、このような知見に基づいてなされたものであり、レベルが周期的に変化する原信号を、生成されるべき合成音の音高に応じた時間長であるピッチ周期ごとに出力する複数の出力手段と、前記複数の出力手段から出力された原信号を加算することによって、合成音を表す合成音信号を生成する合成音生成手段と、前記複数の出力手段の各々に対して当該出力手段が出力すべき原信号の振幅、周波数、初期位相、ピッチ周期を指示する手段であって、前記複数の出力手段のうち一部の出力手段から出力される原信号のレベルが前記ピッチ周期の開始直後において増加する一方、他の出力手段から出力される原信号のレベルが前記ピッチ周期の開始直後において減少するように、前記各出力手段に対して指示を与える指示手段とを具備し、前記指示手段は、前記複数の出力手段に対して指示するピッチ周期を同一とするとともに、前記複数の出力手段が出力する原信号の位相を前記ピッチ周期の開始時点が到来するたびに前記指示された初期位相により更新することを特徴とする。
【0012】
この構成のもとでは、ピッチ周期の開始直後における原信号のレベルの増減が1以上の出力手段ごとに異なるように、指示手段が各出力手段に対して原信号の態様を指示する。すなわち、すべての原信号がピッチ周期の開始直後において一斉に増加を開始する事態が回避されるのである。したがって、本発明によれば、合成音信号に対するフィルタ処理などを要することなく、信号強度の偏りやピッチ周期ごとのノイズを抑えて自然な音を得ることができる。
【0013】
本発明において、一部の出力手段から出力される原信号と他の出力手段から出力される原信号とについてピッチ周期の開始直後におけるレベルの増減を異ならせるための構成としては、例えば以下の構成が考えられる。すなわち、一部の出力手段から出力される原信号と他の出力手段から出力される原信号とにおいてピッチ周期の開始時点における位相が異なるように、指示手段が各出力手段に対して原信号の位相を指示する構成を採用し得る。また、各出力手段が、レベルが周期的に変化する信号に振幅値を乗算し、これにより得られた信号を原信号として出力する構成のもとでは、指示手段が、一部の出力手段と他の出力手段とに対し、当該各出力手段における乗算に供される振幅値として、符号が異なる振幅値をそれぞれ指示する構成を採用しても良い。あるいは、各出力手段が、前記ピッチ周期に相当する時間長を有するとともに原信号の振幅値の時間的な変化を表すエンベロープを振幅値の乗算によって得られた信号に反映させ、これにより得られた信号を原信号として出力する構成のもとでは、指示手段が、一部の出力手段と他の出力手段とに対し、各々の示す振幅値の符号が異なるエンベロープをそれぞれ指示する構成としてもよい。
【0014】
さらに、複数の出力手段が、それぞれ角周波数の異なる原信号を出力するものであれば、複数の出力手段のうち出力する原信号の角周波数が小さいものから数えて奇数番目に相当する1以上の出力手段を上記「一部の出力手段」とし、偶数番目に相当する1以上の出力手段を上記一部の出力手段を上記「他の出力手段」とすることが望ましい。
【0015】
また、各出力手段が、それぞれ波形が異なる複数種類の信号を生成し得る信号発生手段を備えるとともに、この信号発生手段によって生成された信号に基づいて原信号を出力する構成のもとでは、指示手段が、各出力手段に対して、上記複数種類の信号のうちいずれかを当該出力手段の信号発生手段が生成すべき信号として指示する構成としてもよい。この構成によれば、複数種類の信号のいずれかに基づいて原信号が出力されるから、これによって得られる合成音の音質(音色)を多様なものとすることができる。さらにこの構成において、指示手段が、各出力手段に対して、複数種類の信号のうち利用者によって選択された信号を当該出力手段の信号発生手段が生成すべき信号として指示する構成とすれば、利用者の好みの合成音を得ることができる。
【0016】
なお、本発明は、コンピュータを本発明に係る音合成装置として機能させるためのプログラムとしても特定される。このプログラムは、ネットワークを介してコンピュータに提供されるものであってもよいし、光ディスクに代表される記録媒体に格納された形態で提供されてコンピュータにインストールされるものであってもよい。
【0017】
【発明の実施の形態】
以下、図面を参照して、本発明の実施形態について説明する。
【0018】
<A:実施形態の構成>
図1は、本発明の実施形態に係る音合成装置の構成を示すブロック図である。同図に示すように、この音合成装置100は、制御装置10と、記憶装置20と、入力装置30と、音合成部40と、スピーカ50とを有する。このうち記憶装置20、入力装置30および音合成部40は、それぞれバス11を介して制御装置10に接続されている。また、スピーカ50は音合成部40に接続されている。
【0019】
制御装置10は、音合成装置100の全体を制御するための装置である。具体的には、制御装置10は、プログラムを実行することによって各部の制御や各種の演算処理を行なうCPU(Central Processing Unit)と、このCPUによって実行されるプログラムが格納されたROM(Read Only Memory)と、CPUによって作業領域として使用されるRAM(Random Access Memory)とを備えている。
【0020】
記憶装置20は、制御装置10によって実行されるプログラムやその実行時に使用されるデータを記憶するための手段である。例えばハードディスク装置や光ディスク装置といった各種の装置が記憶装置20として採用され得る。この記憶装置20には、音合成部40に音の合成を行なわせるためのプログラム(以下「音合成プログラム」という)が記憶されている。制御装置10は、この音合成プログラムを実行することにより、音の合成に関わる各種の指示を音合成部40に与える手段として機能する。
【0021】
入力装置30は、マウスなどのポインティングデバイスや、文字または記号を入力するためのキーボードなどを備え、利用者による操作に応じた信号を制御装置10に出力する。利用者は、この入力装置30を操作することによって、例えば合成されるべき音の音高(ピッチ)や音合成に供されるべき信号の波形などを適宜に選択することができる。
【0022】
音合成部40は、制御装置10から与えられた指示に応じて、複数の原信号から合成音信号を生成して出力する手段である。スピーカ50は、音合成部40から出力された合成音信号に応じた音を出力する。なお、ここでは音を出力するための装置としてスピーカ50を例示したが、これに代えて、利用者の耳に装着されるイヤホンやヘッドホンを設けてもよい。
【0023】
図2は、音合成部40の具体的な構成を示すブロック図である。同図に示すように、この音合成部40は、複数の原信号出力ユニット41(41-1、41-2、41-3および41-4)と加算器42とエンベロープ処理部43とを有する。原信号出力ユニット41は、CSM音合成方法において加算の対象となる信号の数(すなわちCSM次数n)に対応する数だけ設けられている。ただし、本実施形態においては、4つの原信号出力ユニット41が設けられた場合を想定する。また、以下では、各原信号出力ユニット41を特に区別して表記する場合には変数iを用いて「原信号出力ユニット41-i」と表記する。
【0024】
これらの原信号出力ユニット41は、それぞれ角周波数や振幅値が異なる原信号Sbを生成して出力するための手段である。各原信号出力ユニット41は信号発生器41aと乗算器41bとを有する。このうち信号発生器41aは、レベルが周期的に変動する信号(以下「周期信号」という)Saを生成して出力する。本実施形態における信号発生器41aは、正弦波、三角波および矩形波など、それぞれ波形の態様が異なる複数種類の信号のいずれかを周期信号Saとして選択的に生成する機能を有する。具体的には、信号発生器41aは、各種類の信号における1周期分の波形を表す波形データが予め記憶されたメモリを備えている。そして、いずれかの波形データが表す波形を時系列的に連続させることによって特定の波形を有する信号を生成するのである。一方、乗算器41bは、この信号発生器41aから出力された周期信号Saに振幅値を乗算したうえで原信号Sbとして出力する。
【0025】
加算器42は、4つの原信号出力ユニット41から出力された原信号Sbを加算し、これにより得られた信号Scを出力する。エンベロープ処理部43は、加算器42から出力された信号Scにおける振幅値のエンベロープを変更するための手段である。すなわち、エンベロープ処理部43は、振幅値の時間的な変化を表すエンベロープを生成するエンベロープジェネレータ43aを備え、これによって生成されたエンベロープを加算器42から出力された信号Scに対して乗算したものを合成音信号Sdとして出力する。
【0026】
<B:実施形態の動作>
利用者によって入力装置30に所定の操作がなされると、制御装置10は、記憶装置20に記憶された音合成プログラムをRAMに読み込んだうえでこれを順次に実行する。以下、この音合成プログラムの実行に伴なう音合成動作を説明する。
【0027】
利用者は、音合成が開始される前に入力装置30に所定の操作を行なうことによって、各信号発生器41aが発生すべき周期信号Saの種類を選択することができる。この操作を検知すると、制御装置10は、選択された信号の種類を表すデータ(以下「波形選択データ」という)Dsを各原信号出力ユニット41の信号発生器41aに対して出力する。一方、各信号発生器41aは、この波形選択データDsによって、当該信号発生器41aが生成すべき信号を特定する。また、利用者は、音合成が行なわれている任意の時点において、信号発生器41aから出力される周期信号Saの種類を選択することができる。この操作がなされるたびに、選択された信号の種類を表す波形選択データDsが制御装置10から各信号発生器41aに出力されて、これらの信号発生器41aから出力されるべき周期信号Saの種類が特定されることとなる。
【0028】
一方、利用者により入力装置30に所定の操作がなされて音合成の開始指示が与えられると、制御装置10は、各信号発生器41aに対して信号発生の開始指示を与える。さらに、制御装置10は、予め定められた時間長(例えば5msから30ms程度)を有する期間ごとに、合成すべき音の内容に応じたフレームパラメータを算定して音合成部40に出力する。このフレームパラメータは、図2に示すように、角周波数ωi(ω1、ω2、ω3およびω4)、初期位相pi(p1、p2、p3およびp4)、振幅値ai(a1、a2、a3およびa4)、ならびにピッチ周期Tを含んでいる。このうちピッチ周期Tは、合成すべき音の音高に応じた時間長であり、エンベロープ処理部43に供給される。また、角周波数ωiおよび初期位相piは、各原信号出力ユニット41の信号発生器41aに対して供給される。すなわち、原信号出力ユニット41-1の信号発生器41aには角周波数ω1および初期位相p1が指示され、原信号出力ユニット41-2の信号発生器41aには角周波数ω2および初期位相p2が指示されるといった具合である。角周波数ωiは、原信号出力ユニット41-iの信号発生器41aが出力すべき周期信号Saの角周波数を示している。なお、本実施形態においては、原信号出力ユニット41-1の信号発生器41aに供給される角周波数ω1が最小であり、ω2、ω3、ω4と続くにつれて大きい値となるものとする。一方、初期位相piは、原信号出力ユニット41-iの信号発生器41aが出力すべき周期信号Saのうちピッチ周期の開始時点における位相を示している。また、振幅値aiは、乗算器41bが信号発生器41aから出力された信号に乗算すべき振幅値であり、各原信号出力ユニット41の乗算器41bに対して供給される。例えば、原信号出力ユニット41-1の乗算器41bには振幅値a1が指示され、原信号出力ユニット41-2の乗算器41bには振幅値a2が指示されるといった具合である。
【0029】
音合成部40は、ピッチ周期の開始時点が到来するたびに、フレームパラメータの値を合成音に反映させる。ここで、図3(a)においては、フレームパラメータの供給されるタイミングが下向きの矢印にて示されている。ピッチ周期Tの開始時点が到来すると、音合成部40は、その直前に供給されたフレームパラメータを合成音に反映させるようになっている。すなわち、図3(a)に示すタイミングで順次に供給されるフレームパラメータのうち「〇」が付されたタイミングで供給されたフレームパラメータのみが合成音に影響を与えることとなる。なお、図3(a)においては、フレームパラメータが供給される時間間隔がピッチ周期Tの時間長よりも短い場合を例示している。ただし、このフレームパラメータが供給される時間間隔は、合成すべき音の内容に応じて予め定められる時間長であり、ピッチ周期Tよりも長い時間長とされる場合もある。
【0030】
一方、制御装置10によるフレームパラメータの出力と並行して、各原信号出力ユニット41は、フレームパラメータに応じた原信号を生成して出力する。すなわち、各原信号出力ユニット41の信号発生器41aは、波形選択データDsによって指定された種類の信号であって、フレームパラメータとして指示された角周波数ωiを有する周期信号Saを出力する。この周期信号Saの出力動作はピッチ周期Tごとに行なわれる。すなわち、各信号発生器41aは、ピッチ周期Tの開始時点から周期信号Saの出力を開始する。さらに、各信号発生器41aは、ピッチ周期の開始時点における周期信号Saの位相を、フレームパラメータとして指示された初期位相piに設定する。各信号発生器41aから出力された周期信号Saは、乗算器41bにおける振幅値aiの乗算を経た後に原信号Sbとして出力される。
【0031】
本実施形態においては、4つの原信号出力ユニット41のうち指示される角周波数ωiが小さいものから数えて奇数番目の原信号出力ユニット41-1および41-3(以下、単に「奇数番目の原信号出力ユニット41」という)に指示される初期位相p1およびp3の値は「0」に設定されている。これに対し、4つの原信号出力ユニット41のうち角周波数ωiが小さいものから数えて偶数番目の原信号出力ユニット41-2および41-4(以下、単に「偶数番目の原信号出力ユニット41」という)に指示される初期位相p2およびp4は「π」に設定されている。ここで、図4は、各原信号出力ユニット41における周期信号Saの位相の変化を表すタイミングチャートである。同図においては、横軸が時間を表し、縦軸が各周期信号Saの位相を表している。図3および図4に示すように、奇数番目の原信号出力ユニット41における周期信号Saはピッチ周期の開始時点が到来するたびにその位相が「0」に更新される一方、偶数番目の原信号出力ユニット41における周期信号Sbはピッチ周期の開始時点が到来するたびにその位相が「π」に更新される。この結果、奇数番目の原信号出力ユニット41から出力される原信号Sbのレベルは各ピッチ周期の開始直後において増加する一方、偶数番目の原信号出力ユニット41から出力される原信号Sbのレベルは各ピッチ周期の開始直後において減少することとなる(図3参照)。
【0032】
一方、4つの原信号出力ユニット41から出力された原信号Sbは、加算器42によって加算されたうえで信号Scとしてエンベロープ処理部43に供給される。エンベロープ処理部43は、エンベロープジェネレータ43aによって生成されたエンベロープを信号Scに乗算し、これにより得られた信号を合成音信号Sdとして出力する。ここで、エンベロープジェネレータ43aは、制御装置10からフレームパラメータとして指示されたピッチ周期Tと同一の時間長を有するエンベロープを生成する。そして、スピーカ50は、エンベロープ処理部43から出力された合成音信号Sdに基づいて合成音を出力する。
【0033】
このように、本実施形態においては、4つの原信号出力ユニット41のうちの一部(原信号出力ユニット41-1および41-3)から出力される原信号Sbがピッチ周期の開始直後に増加する一方、他の原信号(原信号出力ユニット41-2および41-4からの原信号)がピッチ周期の開始直後に減少するようになっている。換言すれば、すべての原信号がピッチ周期の開始直後において一斉に増加(または減少)する事態が回避されるのである。この結果、本実施形態によれば、図9に示した信号強度の振幅値の偏りやピッチ周期の開始時点におけるノイズを抑えて自然な合成音を得ることができる。この点について図5を参照して詳述する。
【0034】
ここで、図5(a)はエンベロープ処理部43から出力された合成音信号Sdの波形を表すグラフであり、図5(b)はこの信号Sdのスペクトログラムである。図5(a)においては横軸が時間を表し、縦軸が信号強度を表している。一方、図5(b)においては横軸が時間を表し、縦軸が周波数を表し、色の明暗が信号強度の分布(明るい部分は信号強度が大きい)を表している。図5(a)を図9(a)と比較すれば明らかな通り、本実施形態においては、信号強度がレベル「0」を基準として「+」側および「−」側の双方に均等に分布している。これは、奇数番目の原信号出力ユニット41から出力された原信号Sbがピッチ周期の開始直後において増加することに起因した「+」側への信号強度の偏りと、偶数番目の原信号出力ユニット41から出力された原信号Sbがピッチ周期の開始直後において減少することに起因した「−」側への信号強度の偏りとが相殺されるためであると考えられる。さらに、図5(b)に示すように、本実施形態における合成音信号Sdは、図9(b)に示した従来の合成音信号Sと比較して、ピッチ周期の開始時点における高周波成分(ノイズ)が低減されている。このことは、図5(a)を時間軸方向に拡大した図5(c)に示すように、合成音信号の波形がピッチ周期の開始時点において連続となることからも明らかである。このように、本実施形態によれば、図9に示した信号強度の偏りやピッチ周期の開始時点におけるノイズを抑えて自然な合成音を得ることができ、しかも信号強度の偏りやピッチ周期の開始時点におけるノイズを抑えるためのフィルタ処理は不要である。
【0035】
また、本実施形態においては、それぞれ波形が異なる複数種類の信号のうちいずれかが選択されて周期信号Saとして出力されるから、これに基づいて得られる合成音の音質(特に音色)を多様化することができる。しかも、この複数種類の信号のいずれかが利用者によって選択されるようになっているから、利用者の好みの音質を有する合成音が得られる。
【0036】
<C:変形例>
以上に説明した実施の形態はあくまでも例示であり、この形態に対しては本発明の趣旨から逸脱しない範囲で種々の変形を加えることができる。具体的な変形としては、例えば以下に示す態様が考えられる。
【0037】
<C−1:変形例1>
上記実施形態においては、初期位相piを「0」または「π」とした構成を例示したが、初期位相piの値はこれに限られない。すなわち、奇数番目の原信号出力ユニット41から出力された原信号がピッチ周期の開始直後において増加することに起因した「+」側への信号強度の偏りと、偶数番目の原信号出力ユニット41から出力された原信号がピッチ周期の開始直後において減少することに起因した「−」側への信号強度の偏りとが相殺されて信号強度がレベル「0」を基準として双方の側に均等に分布するように、適宜に各初期位相piの値が選定されることが望ましい。
【0038】
また、上記実施形態においては、ピッチ周期の開始時点における各原信号の位相を制御する構成を例示したが、すべての原信号がピッチ周期の開始時点において一斉に増加する事態を回避するための構成はこれに限られない。この構成に代えて、例えば以下に示す構成を採用することができる。
【0039】
(1)態様1
奇数番目の原信号出力ユニット41に指示される振幅値の符号と、偶数番目の原信号出力ユニット41に指示される振幅値の符号とを異ならせる構成としてもよい。例えば、図2示す構成において、振幅値a1およびa3の符号を「+」とする一方、振幅値a2およびa4の符号を「−」とするといった具合である。この構成においても、奇数番目の原信号出力ユニット41からの原信号と偶数番目の原信号出力ユニット41からの原信号との位相差を実質的に「π」だけずらすことになるから、各原信号の波形は図3(b)に示した波形と同一となる。したがって、上記実施形態と同様の効果が得られる。
【0040】
(2)態様2
4つの原信号出力ユニット41のうち奇数番目の原信号出力ユニット41の乗算器41bから出力された信号と、偶数番目の原信号出力ユニット41の乗算器41bから出力された信号とに、それぞれ符号が異なるエンベロープを乗算したうえで原信号として出力する構成としてもよい。すなわち、図6に示すように、4つの原信号出力ユニット41の各々に、制御装置10から指示されたエンベロープを乗算器41bからの出力信号に乗算するエンベロープ処理部41cを設ける。具体的には、奇数番目の原信号出力ユニット41のエンベロープ処理部41cにおいては、ピッチ周期の開始時点から「+」側に立ち上がり、その後に減少してピッチ周期の終了時点で「0」に至るエンベロープが用いられる。一方、偶数番目の原信号出力ユニット41のエンベロープ処理部41cにおいては、ピッチ周期の開始時点から「−」側に立ち下がり、その後に増加してピッチ周期の終了時点で「0」に至るエンベロープが用いられる。したがって、奇数番目の原信号出力ユニット41から出力される原信号はピッチ周期の開始直後において増加する一方、偶数番目の原信号出力ユニット41から出力される原信号をピッチ周期の開始直後において減少することとなる。すなわち、すべての原信号がピッチ周期の開始直後において一斉に増加する事態が回避されるから、上記実施形態と同様の効果が得られる。
【0041】
このように、本発明においては、複数の原信号のうち一部の原信号のレベルがピッチ周期の開始直後において増加する一方、他の原信号のレベルがピッチ周期の開始直後において減少する構成であれば足り、原信号のレベルをこのように設定するための構成の如何は不問である。
【0042】
<C−2:変形例2>
上記実施形態および変形例においては、音合成部40が4つの原信号出力ユニット41を有する構成を例示したが、原信号出力ユニット41の数はこれに限られない。要するに、複数の原信号出力ユニット41が音合成部40に設けられた構成であればよい。
【0043】
また、上記実施形態においては、複数の原信号出力ユニット41のうち原信号の角周波数が小さいものから数えて奇数番目の原信号出力ユニット41と偶数番目の原信号出力ユニット41とについて、ピッチ周期の開始直後における原信号の増減を異ならせる構成を例示したが、原信号出力ユニット41の区分の仕方は任意である。例えば、原信号出力ユニット41が4つである場合に、第1番目および第4番目の原信号出力ユニット41からなる組と、第2番目および第3番目の原信号出力ユニット41からなる組とに区分し、両者の組についてピッチ周期の開始直後における原信号の増減を異ならせる構成としてもよい。あるいは、ひとつの原信号出力ユニット41とその他の原信号出力ユニット41とに区分して、両者について原信号のピッチ周期の開始直後における増減を異ならせる構成としてもよい。要するに、複数の原信号出力ユニット41のうち1以上の原信号出力ユニット41とその他の1以上の原信号出力ユニット41とについて、ピッチ周期の開始直後における原信号の増減を異ならせる構成であれば足りる。
【0044】
<C−3:変形例3>
上記実施形態および各変形例においては、音合成部40をDSPによって構成した場合を例示したが、CPUなどのハードウェアと当該CPUが実行するプログラムとの協働によって、原信号を出力するための手段(原信号出力ユニット41)や原信号を加算して合成音信号を生成する手段(加算器42)が実現される構成としても良い。
【0045】
【発明の効果】
以上説明したように、本発明によれば、簡易な構成によって自然な音を合成することができる。
【図面の簡単な説明】
【図1】 本発明の実施形態に係る音合成装置の構成を示すブロック図である。
【図2】 同音合成装置における音合成部の構成を示すブロック図である。
【図3】 各出力ユニットの信号発生器から出力される信号を表すタイミングチャートである。
【図4】 各出力ユニットの信号発生器から出力される信号の位相を表すタイミングチャートである。
【図5】 合成音信号の波形およびスペクトログラムを表す図である。
【図6】 同実施形態の変形例に係る音合成装置の構成を示すブロック図である。
【図7】 従来の音合成装置の構成を示すブロック図である。
【図8】 従来の音合成装置において処理に供される信号の波形を示すタイミングチャートである。
【図9】 従来の合成音信号の波形およびスペクトログラムを表す図である。
【符号の説明】
100……音合成装置、10……制御装置(指示手段)、20……記憶装置、30……入力装置、40……音合成部、50……スピーカ、41(41-1,41-2,41-3,41-4)……原信号出力ユニット(出力手段)、41a……信号発生器(信号発生手段)、41b……乗算器、41c,43……エンベロープ処理部、42……加算器(合成音生成手段)、43……エンベロープ処理部、Sa……周期信号、Sb……原信号、Sd……合成音信号。
[0001]
BACKGROUND OF THE INVENTION
The present invention relates to a sound synthesizer that generates a signal representing a desired sound by adding a plurality of types of signals, and a program for causing a computer to function as the sound synthesizer.
[0002]
[Prior art]
Techniques for synthesizing desired sounds such as human voices and musical instrument performance sounds have been proposed. A sound synthesis method by CSM (Composite Sinusoidal Modeling) (hereinafter referred to as “CSM sound synthesis method”) is one of the methods widely used in this kind of technology (see, for example, Patent Document 1). According to this method, the peak value yt of a signal representing a desired sound (hereinafter referred to as “synthetic sound signal”) is a plurality of sine waves having different angular frequencies and amplitudes as shown in the following equation (1). Expressed as the sum of
yt = a1 sin ω1 t + a2 sin ω2 t + …… + an sin ωnt (1)
In the above equation (1), “ai (i is an integer satisfying 1 ≦ i ≦ n)” and “ωi” are the amplitude and angular frequency of the i-th sine wave, respectively. “T” is an integer representing time, and “n” represents the number of sine waves to be added (so-called CSM order).
[0003]
FIG. 7 is a block diagram showing the configuration of an apparatus for synthesizing sound using this CSM sound synthesizing method. As shown in the figure, the sound synthesizer includes a sound synthesizer 70 and a control device 80. Among them, the sound synthesizer 70 generates n (here, n = 4) sine wave output units 71 (71-1, 71-2, 71-3 and 71-) each generating and outputting a sine wave. 4), an adder 72 that adds and outputs the output signals from the sine wave output units 71, and an envelope that is output as a synthesized sound signal S after multiplying a signal output from the adder 72 by a specific envelope And a processing unit 73. Each sine wave output unit 71 includes a sine wave generator 71a that generates a sine wave having an instructed angular frequency, and a multiplier 71b that multiplies the sine wave by an instructed amplitude value. On the other hand, the control device 80 shown in FIG. 7 instructs the sine wave generator 71a and the multiplier 71b of each sine wave output unit 71 to indicate the angular frequency and the amplitude value according to the content of the sound to be synthesized. The envelope processing unit 73 is instructed with a time length (hereinafter referred to as “pitch period”) T corresponding to the pitch (pitch) of the synthesized sound.
[0004]
With this configuration, the four sine wave generators 71a start generating sine waves all at once when the start time of the pitch period T arrives, as shown in FIGS. . That is, the phase of each sine wave at the start of the pitch period is “0” for all sine wave generators 71a. Then, a signal obtained by multiplying these sine waves by an amplitude value (hereinafter referred to as “original signal”) (FIG. 8E) and an envelope having a time length of the pitch period T (FIG. 8F). Are multiplied by the envelope processing unit 73 to obtain a synthesized sound signal S whose waveform is shown in FIG. FIGS. 9A and 9B are diagrams showing the waveform and spectrogram of the synthesized sound signal S, respectively. That is, in FIG. 9A, the horizontal axis represents time, and the vertical axis represents signal intensity. In FIG. 9B, the horizontal axis represents time, the vertical axis represents frequency, and the brightness of the color represents the signal intensity distribution.
[0005]
[Patent Document 1]
Japanese Patent Laid-Open No. 11-231875 (especially page 3 and FIG. 1)
[0006]
[Problems to be solved by the invention]
However, the synthesized sound signal S obtained under the configuration shown in FIG. 7 has a signal intensity on one side (here, “+” side) with reference to the level “0” as shown in FIG. 9A. In addition, as shown in FIG. 9B, a noise component having a high frequency appears prominently near the start time of the pitch period T. And the sound emitted based on such a signal has a problem that it becomes annoying including noise. On the other hand, various filter processes may be applied to the synthesized sound signal S in order to suppress signal intensity deviation and noise components. However, in this case, it is necessary to separately provide a filter in addition to the configuration for obtaining the synthesized sound signal S, which may cause a problem that the processing amount increases and the configuration becomes complicated.
[0007]
The present invention has been made in view of such circumstances, and provides a sound synthesizer capable of synthesizing natural sounds with a simple configuration, and a program for causing a computer to function as a musical sound synthesizer. It is an object.
[0008]
[Means for Solving the Problems]
As described above, the synthesized sound signal S obtained by the configuration shown in FIG. 7 has a signal intensity biased to one side with respect to the level “0”, and noise is generated near the start point of the pitch period. It will be included. The inventor of the present application obtains knowledge that one of the causes that the synthesized sound signal S becomes a signal having such a property is that all the original signals start increasing at once immediately after the start of the pitch period. It came to.
[0009]
That is, since all the original signals start to increase at the same time at the start of the pitch period, the waveform of the synthesized sound signal changes rapidly and discontinuously at the boundary time of each pitch period. More specifically, as shown in FIG. 9C in which FIG. 9A is enlarged in the time axis direction, the waveform of the synthesized sound signal becomes discontinuous at the start of the pitch period. As a result of this discontinuity, the synthesized sound signal contains noise at the start of the pitch period.
[0010]
Further, the envelope waveform generally becomes maximum immediately after the start of the pitch period in which all the original signals increase at the same time, but thereafter attenuates. For this reason, in the synthesized sound signal obtained by multiplying the signal obtained by adding all the original signals and the envelope, the integral value of the portion that becomes “+” with respect to the level “0” is the integral value of the portion that becomes “−”. Larger than Due to this non-uniform integration value, the signal intensity of the synthesized sound signal is biased to one side.
[0011]
[Means for Solving the Problems]
The present invention has been made based on such knowledge, and outputs an original signal whose level changes periodically for each pitch period which is a time length corresponding to the pitch of the synthesized sound to be generated. A plurality of output means, a synthesized sound generating means for generating a synthesized sound signal representing a synthesized sound by adding the original signals output from the plurality of output means, and each of the plurality of output means The means for instructing the amplitude, frequency, initial phase, and pitch period of the original signal to be output by the output means, wherein the level of the original signal output from some of the plurality of output means is the pitch period Instruction means for giving an instruction to each output means so that the level of the original signal output from the other output means decreases immediately after the start of the pitch period. The instruction means, While making the pitch cycle instructed to the plurality of output means the same, The phase of the original signal output by the plurality of output means is updated with the instructed initial phase every time the start point of the pitch period arrives.
[0012]
Under this configuration, the instruction unit instructs each output unit on the mode of the original signal so that the increase or decrease in the level of the original signal immediately after the start of the pitch period differs for each of the one or more output units. That is, it is possible to avoid a situation in which all the original signals start increasing all at once immediately after the start of the pitch period. Therefore, according to the present invention, it is possible to obtain a natural sound by suppressing the bias of the signal intensity and the noise for each pitch period without requiring a filtering process on the synthesized sound signal.
[0013]
In the present invention, as a configuration for differentiating the level increase / decrease immediately after the start of the pitch period between the original signal output from some output means and the original signal output from other output means, for example, the following configuration Can be considered. That is, the instruction means sends the original signal to each output means so that the original signals output from some output means and the original signals output from other output means have different phases at the start of the pitch period. A configuration indicating the phase may be employed. Further, in a configuration in which each output unit multiplies a signal whose level changes periodically by an amplitude value, and outputs the signal obtained thereby as an original signal, the instruction unit includes a part of the output unit and You may employ | adopt the structure which each designates the amplitude value from which a code | symbol differs with respect to another output means as an amplitude value used for the multiplication in each said output means. Alternatively, each output means has a time length corresponding to the pitch period and reflects an envelope representing a temporal change in the amplitude value of the original signal in the signal obtained by multiplication of the amplitude value, and thus obtained. Under a configuration in which a signal is output as an original signal, the instruction unit may instruct a part of output units and other output units to specify envelopes having different signs of amplitude values.
[0014]
Further, if the plurality of output units output original signals having different angular frequencies, one or more corresponding to odd numbers counted from the plurality of output units having the smaller angular frequency of the original signal to be output. It is desirable that the output means is the “partial output means”, and the one or more output means corresponding to even numbers are the other output means.
[0015]
In addition, each output unit includes a signal generation unit that can generate a plurality of types of signals having different waveforms, and outputs an original signal based on the signal generated by the signal generation unit. The means may instruct each output means as any one of the plurality of types of signals as a signal to be generated by the signal generation means of the output means. According to this configuration, since the original signal is output based on any of a plurality of types of signals, the tone quality (timbre) of the synthesized sound obtained thereby can be varied. Furthermore, in this configuration, if the instruction unit instructs each output unit to select a signal selected by the user from among a plurality of types of signals as a signal to be generated by the signal generation unit of the output unit, The user's favorite synthesized sound can be obtained.
[0016]
The present invention is also specified as a program for causing a computer to function as the sound synthesizer according to the present invention. This program may be provided to the computer via a network, or may be provided in a form stored in a recording medium represented by an optical disc and installed in the computer.
[0017]
DETAILED DESCRIPTION OF THE INVENTION
Embodiments of the present invention will be described below with reference to the drawings.
[0018]
<A: Configuration of Embodiment>
FIG. 1 is a block diagram showing a configuration of a sound synthesizer according to an embodiment of the present invention. As shown in the figure, the sound synthesizer 100 includes a control device 10, a storage device 20, an input device 30, a sound synthesizer 40, and a speaker 50. Among these, the storage device 20, the input device 30, and the sound synthesizer 40 are each connected to the control device 10 via the bus 11. The speaker 50 is connected to the sound synthesizer 40.
[0019]
The control device 10 is a device for controlling the entire sound synthesizer 100. Specifically, the control device 10 includes a CPU (Central Processing Unit) that controls each unit and performs various arithmetic processes by executing a program, and a ROM (Read Only Memory) that stores a program executed by the CPU. ) And a RAM (Random Access Memory) used as a work area by the CPU.
[0020]
The storage device 20 is a means for storing a program executed by the control device 10 and data used during the execution. For example, various devices such as a hard disk device and an optical disk device may be employed as the storage device 20. The storage device 20 stores a program (hereinafter referred to as “sound synthesis program”) for causing the sound synthesis unit 40 to synthesize sound. The control device 10 functions as means for giving the sound synthesizer 40 various instructions related to sound synthesis by executing the sound synthesis program.
[0021]
The input device 30 includes a pointing device such as a mouse, a keyboard for inputting characters or symbols, and the like, and outputs a signal corresponding to an operation by the user to the control device 10. The user can appropriately select, for example, the pitch (pitch) of the sound to be synthesized and the waveform of the signal to be used for sound synthesis by operating the input device 30.
[0022]
The sound synthesizer 40 is means for generating and outputting a synthesized sound signal from a plurality of original signals in accordance with an instruction given from the control device 10. The speaker 50 outputs a sound corresponding to the synthesized sound signal output from the sound synthesizer 40. Here, the speaker 50 is illustrated as an apparatus for outputting sound, but instead of this, an earphone or a headphone worn on the user's ear may be provided.
[0023]
FIG. 2 is a block diagram showing a specific configuration of the sound synthesizer 40. As shown in the figure, the sound synthesizer 40 includes a plurality of original signal output units 41 (41-1, 41-2, 41-3 and 41-4), an adder 42, and an envelope processor 43. . The original signal output units 41 are provided in a number corresponding to the number of signals to be added in the CSM sound synthesis method (that is, the CSM order n). However, in the present embodiment, it is assumed that four original signal output units 41 are provided. In the following description, when each original signal output unit 41 is particularly distinguished and described, it is expressed as “original signal output unit 41-i” using a variable i.
[0024]
These original signal output units 41 are means for generating and outputting original signals Sb having different angular frequencies and amplitude values. Each original signal output unit 41 includes a signal generator 41a and a multiplier 41b. Among these, the signal generator 41a generates and outputs a signal whose level varies periodically (hereinafter referred to as “periodic signal”) Sa. The signal generator 41a in the present embodiment has a function of selectively generating any one of a plurality of types of signals having different waveform forms, such as a sine wave, a triangular wave, and a rectangular wave, as the periodic signal Sa. Specifically, the signal generator 41a includes a memory in which waveform data representing a waveform for one period in each type of signal is stored in advance. And the signal which has a specific waveform is produced | generated by making the waveform which one of waveform data represents time-sequentially. On the other hand, the multiplier 41b multiplies the periodic signal Sa output from the signal generator 41a by the amplitude value, and outputs the result as the original signal Sb.
[0025]
The adder 42 adds the original signals Sb output from the four original signal output units 41 and outputs a signal Sc obtained thereby. The envelope processing unit 43 is means for changing the envelope of the amplitude value in the signal Sc output from the adder 42. That is, the envelope processing unit 43 includes an envelope generator 43a that generates an envelope that represents a temporal change in the amplitude value, and is obtained by multiplying the signal Sc output from the adder 42 by the envelope generated thereby. Output as synthesized sound signal Sd.
[0026]
<B: Operation of Embodiment>
When a predetermined operation is performed on the input device 30 by the user, the control device 10 reads the sound synthesis program stored in the storage device 20 into the RAM and sequentially executes it. In the following, the sound synthesis operation accompanying the execution of this sound synthesis program will be described.
[0027]
The user can select the type of the periodic signal Sa to be generated by each signal generator 41a by performing a predetermined operation on the input device 30 before sound synthesis is started. When this operation is detected, the control device 10 outputs data (hereinafter referred to as “waveform selection data”) Ds representing the type of the selected signal to the signal generator 41 a of each original signal output unit 41. On the other hand, each signal generator 41a specifies a signal to be generated by the signal generator 41a based on the waveform selection data Ds. Further, the user can select the type of the periodic signal Sa output from the signal generator 41a at an arbitrary time when sound synthesis is performed. Each time this operation is performed, waveform selection data Ds indicating the type of the selected signal is output from the control device 10 to each signal generator 41a, and the periodic signal Sa to be output from these signal generators 41a. The type will be specified.
[0028]
On the other hand, when the user performs a predetermined operation on the input device 30 to give a sound synthesis start instruction, the control apparatus 10 gives a signal generation start instruction to each signal generator 41a. Further, the control device 10 calculates a frame parameter corresponding to the content of the sound to be synthesized and outputs it to the sound synthesizer 40 for each period having a predetermined time length (for example, about 5 ms to 30 ms). As shown in FIG. 2, the frame parameters include an angular frequency ωi (ω1, ω2, ω3, and ω4), an initial phase pi (p1, p2, p3, and p4), and an amplitude value ai (a1, a2, a3, and a4). , As well as the pitch period T. Among these, the pitch period T is a time length corresponding to the pitch of the sound to be synthesized, and is supplied to the envelope processing unit 43. Further, the angular frequency ωi and the initial phase pi are supplied to the signal generator 41a of each original signal output unit 41. That is, the angular frequency ω1 and the initial phase p1 are instructed to the signal generator 41a of the original signal output unit 41-1, and the angular frequency ω2 and the initial phase p2 are instructed to the signal generator 41a of the original signal output unit 41-2. It is such a condition. The angular frequency ωi indicates the angular frequency of the periodic signal Sa to be output by the signal generator 41a of the original signal output unit 41-i. In the present embodiment, it is assumed that the angular frequency ω1 supplied to the signal generator 41a of the original signal output unit 41-1 is the smallest, and increases as ω2, ω3, and ω4 continue. On the other hand, the initial phase pi indicates the phase at the start time of the pitch period in the periodic signal Sa to be output by the signal generator 41a of the original signal output unit 41-i. The amplitude value ai is an amplitude value to be multiplied by the signal output from the signal generator 41a by the multiplier 41b, and is supplied to the multiplier 41b of each original signal output unit 41. For example, the amplitude value a1 is instructed to the multiplier 41b of the original signal output unit 41-1, and the amplitude value a2 is instructed to the multiplier 41b of the original signal output unit 41-2.
[0029]
The sound synthesis unit 40 reflects the value of the frame parameter in the synthesized sound every time the start point of the pitch period arrives. Here, in FIG. 3A, the timing at which the frame parameter is supplied is indicated by a downward arrow. When the start time of the pitch period T arrives, the sound synthesizer 40 reflects the frame parameter supplied immediately before it in the synthesized sound. That is, only the frame parameters supplied at the timing indicated by “◯” among the frame parameters sequentially supplied at the timing shown in FIG. 3A affect the synthesized sound. FIG. 3A illustrates a case where the time interval at which the frame parameter is supplied is shorter than the time length of the pitch period T. However, the time interval at which this frame parameter is supplied is a predetermined time length according to the content of the sound to be synthesized, and may be longer than the pitch period T.
[0030]
On the other hand, in parallel with the output of the frame parameter by the control device 10, each original signal output unit 41 generates and outputs an original signal corresponding to the frame parameter. That is, the signal generator 41a of each original signal output unit 41 outputs a periodic signal Sa which is a signal of the type specified by the waveform selection data Ds and has the angular frequency ωi specified as the frame parameter. The operation of outputting the periodic signal Sa is performed every pitch period T. That is, each signal generator 41a starts outputting the periodic signal Sa from the start time of the pitch period T. Further, each signal generator 41a sets the phase of the periodic signal Sa at the start point of the pitch period to the initial phase pi designated as the frame parameter. The periodic signal Sa output from each signal generator 41a is output as the original signal Sb after being multiplied by the amplitude value ai in the multiplier 41b.
[0031]
In the present embodiment, odd-numbered original signal output units 41-1 and 41-3 (hereinafter simply referred to as “odd-numbered original signals” counted from the four original signal output units 41 having the smallest designated angular frequency ωi. The values of the initial phases p1 and p3 instructed to the signal output unit 41 ”) are set to“ 0 ”. On the other hand, even-numbered original signal output units 41-2 and 41-4 (hereinafter simply referred to as “even-numbered original signal output units 41”) counted from the four original signal output units 41 having the smallest angular frequency ωi. The initial phases p2 and p4 indicated in the above are set to “π”. Here, FIG. 4 is a timing chart showing a change in the phase of the periodic signal Sa in each original signal output unit 41. In the figure, the horizontal axis represents time, and the vertical axis represents the phase of each periodic signal Sa. As shown in FIGS. 3 and 4, the periodic signal Sa in the odd-numbered original signal output unit 41 is updated to “0” every time the start point of the pitch period arrives, while the even-numbered original signal output The phase of the periodic signal Sb in the unit 41 is updated to “π” every time the start point of the pitch period arrives. As a result, the level of the original signal Sb output from the odd-numbered original signal output unit 41 increases immediately after the start of each pitch period, while the level of the original signal Sb output from the even-numbered original signal output unit 41 is It decreases immediately after the start of each pitch period (see FIG. 3).
[0032]
On the other hand, the original signals Sb output from the four original signal output units 41 are added by the adder 42 and then supplied to the envelope processing unit 43 as a signal Sc. The envelope processing unit 43 multiplies the signal Sc by the envelope generated by the envelope generator 43a, and outputs the resultant signal as a synthesized sound signal Sd. Here, the envelope generator 43a generates an envelope having the same length as the pitch period T instructed from the control device 10 as a frame parameter. The speaker 50 outputs a synthesized sound based on the synthesized sound signal Sd output from the envelope processing unit 43.
[0033]
Thus, in the present embodiment, the original signal Sb output from a part of the four original signal output units 41 (original signal output units 41-1 and 41-3) increases immediately after the start of the pitch period. On the other hand, other original signals (original signals from the original signal output units 41-2 and 41-4) decrease immediately after the start of the pitch period. In other words, a situation in which all the original signals increase (or decrease) all at once immediately after the start of the pitch period is avoided. As a result, according to the present embodiment, it is possible to obtain a natural synthesized sound while suppressing the deviation of the amplitude value of the signal intensity and the noise at the start time of the pitch period shown in FIG. This point will be described in detail with reference to FIG.
[0034]
Here, FIG. 5A is a graph showing the waveform of the synthesized sound signal Sd output from the envelope processing unit 43, and FIG. 5B is a spectrogram of the signal Sd. In FIG. 5A, the horizontal axis represents time, and the vertical axis represents signal intensity. On the other hand, in FIG. 5B, the horizontal axis represents time, the vertical axis represents frequency, and the brightness of the color represents the distribution of signal intensity (the bright part has a high signal intensity). As is clear when FIG. 5A is compared with FIG. 9A, in this embodiment, the signal intensity is evenly distributed on both the “+” side and the “−” side with reference to the level “0”. is doing. This is because the signal strength bias toward the “+” side caused by the increase in the original signal Sb output from the odd-numbered original signal output unit 41 immediately after the start of the pitch period, and the even-numbered original signal output unit. This is probably because the bias of the signal intensity toward the “−” side caused by the decrease in the original signal Sb output from 41 immediately after the start of the pitch period is offset. Further, as shown in FIG. 5 (b), the synthesized sound signal Sd in the present embodiment is compared with the conventional synthesized sound signal S shown in FIG. Noise) has been reduced. This is also clear from the fact that the waveform of the synthesized sound signal becomes continuous at the start of the pitch period, as shown in FIG. 5C, which is an enlarged view of FIG. 5A in the time axis direction. As described above, according to this embodiment, it is possible to obtain a natural synthesized sound by suppressing noise at the start time of the signal intensity and the pitch period shown in FIG. Filter processing for suppressing noise at the start time is unnecessary.
[0035]
In the present embodiment, since any one of a plurality of types of signals having different waveforms is selected and output as the periodic signal Sa, the tone quality (especially the timbre) of the synthesized sound obtained based on this is diversified. can do. Moreover, since any one of the plurality of types of signals is selected by the user, a synthesized sound having the sound quality desired by the user can be obtained.
[0036]
<C: Modification>
The embodiment described above is merely an example, and various modifications can be made to this embodiment without departing from the spirit of the present invention. As specific modifications, for example, the following modes can be considered.
[0037]
<C-1: Modification 1>
In the above embodiment, the configuration in which the initial phase pi is set to “0” or “π” is exemplified, but the value of the initial phase pi is not limited to this. That is, the deviation of the signal intensity toward the “+” side caused by the increase in the original signal output from the odd-numbered original signal output unit 41 immediately after the start of the pitch period, and the even-numbered original signal output unit 41 from The bias of the signal intensity to the “−” side caused by the decrease in the output original signal immediately after the start of the pitch period is canceled out, and the signal intensity is evenly distributed on both sides with reference to the level “0”. Thus, it is desirable that the value of each initial phase pi is appropriately selected.
[0038]
Further, in the above embodiment, the configuration for controlling the phase of each original signal at the start time of the pitch cycle is exemplified, but the configuration for avoiding a situation in which all the original signals increase at the start time of the pitch cycle at the same time. Is not limited to this. Instead of this configuration, for example, the following configuration can be adopted.
[0039]
(1) Aspect 1
The sign of the amplitude value instructed to the odd-numbered original signal output unit 41 may be different from the sign of the amplitude value instructed to the even-numbered original signal output unit 41. For example, in the configuration shown in FIG. 2, the signs of the amplitude values a1 and a3 are “+”, while the signs of the amplitude values a2 and a4 are “−”. Also in this configuration, the phase difference between the original signal from the odd-numbered original signal output unit 41 and the original signal from the even-numbered original signal output unit 41 is substantially shifted by “π”. The waveform of the signal is the same as that shown in FIG. Therefore, the same effect as the above embodiment can be obtained.
[0040]
(2) Aspect 2
Of the four original signal output units 41, a signal output from the multiplier 41 b of the odd-numbered original signal output unit 41 and a signal output from the multiplier 41 b of the even-numbered original signal output unit 41 are respectively coded May be configured to output the original signal after multiplying by different envelopes. That is, as shown in FIG. 6, each of the four original signal output units 41 is provided with an envelope processing unit 41c that multiplies the output signal from the multiplier 41b by the envelope instructed by the control device 10. Specifically, the envelope processing unit 41c of the odd-numbered original signal output unit 41 rises to the “+” side from the start point of the pitch cycle, and then decreases to “0” at the end point of the pitch cycle. An envelope is used. On the other hand, in the envelope processing unit 41c of the even-numbered original signal output unit 41, there is an envelope that falls to the “−” side from the start point of the pitch cycle and then increases to “0” at the end point of the pitch cycle. Used. Accordingly, the original signal output from the odd-numbered original signal output unit 41 increases immediately after the start of the pitch period, while the original signal output from the even-numbered original signal output unit 41 decreases immediately after the start of the pitch period. It will be. That is, since the situation where all the original signals increase at once immediately after the start of the pitch period is avoided, the same effect as in the above embodiment can be obtained.
[0041]
Thus, in the present invention, the level of some of the plurality of original signals increases immediately after the start of the pitch period, while the level of other original signals decreases immediately after the start of the pitch period. Any configuration is sufficient to set the level of the original signal in this way.
[0042]
<C-2: Modification 2>
In the said embodiment and modification, although the sound synthesis part 40 illustrated the structure which has the four original signal output units 41, the number of the original signal output units 41 is not restricted to this. In short, a configuration in which a plurality of original signal output units 41 are provided in the sound synthesizer 40 may be used.
[0043]
Further, in the above embodiment, the pitch period of the odd-numbered original signal output units 41 and the even-numbered original signal output units 41 counted from the plurality of the original signal output units 41 having the smaller angular frequency of the original signals. Although the configuration in which the increase / decrease in the original signal immediately after the start of the signal is changed is illustrated, the method of dividing the original signal output unit 41 is arbitrary. For example, when there are four original signal output units 41, a set consisting of the first and fourth original signal output units 41 and a set consisting of the second and third original signal output units 41 It is good also as a structure which makes the increase and decrease of the original signal differ immediately after the start of a pitch period about both sets. Or it is good also as a structure which divides into one original signal output unit 41 and the other original signal output unit 41, and makes the increase / decrease differ just after the start of the pitch period of an original signal about both. In short, one or more of the plurality of original signal output units 41 and one or more other original signal output units 41 are configured so that the increase or decrease of the original signal immediately after the start of the pitch period is different. It ’s enough.
[0044]
<C-3: Modification 3>
In the above-described embodiment and each modified example, the case where the sound synthesizer 40 is configured by a DSP has been exemplified, but for outputting an original signal by cooperation of hardware such as a CPU and a program executed by the CPU. Means (original signal output unit 41) and means (adder 42) for generating a synthesized sound signal by adding the original signals may be realized.
[0045]
【The invention's effect】
As described above, according to the present invention, natural sounds can be synthesized with a simple configuration.
[Brief description of the drawings]
FIG. 1 is a block diagram showing a configuration of a sound synthesizer according to an embodiment of the present invention.
FIG. 2 is a block diagram showing a configuration of a sound synthesizer in the sound synthesizer.
FIG. 3 is a timing chart showing signals output from a signal generator of each output unit.
FIG. 4 is a timing chart showing a phase of a signal output from a signal generator of each output unit.
FIG. 5 is a diagram illustrating a waveform and a spectrogram of a synthesized sound signal.
FIG. 6 is a block diagram showing a configuration of a sound synthesizer according to a modification of the embodiment.
FIG. 7 is a block diagram showing a configuration of a conventional sound synthesizer.
FIG. 8 is a timing chart showing waveforms of signals used for processing in a conventional sound synthesizer.
FIG. 9 is a diagram illustrating a waveform and a spectrogram of a conventional synthesized sound signal.
[Explanation of symbols]
DESCRIPTION OF SYMBOLS 100 ... Sound synthesizer, 10 ... Control apparatus (instruction means), 20 ... Memory | storage device, 30 ... Input device, 40 ... Sound synthesizer, 50 ... Speaker, 41 (41-1, 41-2) 41-3, 41-4)... Original signal output unit (output means), 41a... Signal generator (signal generation means), 41b... Multiplier, 41c, 43. Adder (synthesized sound generating means), 43... Envelope processing unit, Sa... Periodic signal, Sb... Original signal, Sd.

Claims (8)

レベルが周期的に変化する原信号を、生成されるべき合成音の音高に応じた時間長であるピッチ周期ごとに出力する複数の出力手段と、
前記複数の出力手段から出力された原信号を加算することによって、合成音を表す合成音信号を生成する合成音生成手段と、
前記複数の出力手段の各々に対して当該出力手段が出力すべき原信号の振幅、周波数、初期位相、ピッチ周期を指示する手段であって、前記複数の出力手段のうち一部の出力手段から出力される原信号のレベルが前記ピッチ周期の開始直後において増加する一方、他の出力手段から出力される原信号のレベルが前記ピッチ周期の開始直後において減少するように、前記各出力手段に対して指示を与える指示手段とを具備し、
前記指示手段は、前記複数の出力手段に対して指示するピッチ周期を同一とするとともに、前記複数の出力手段が出力する原信号の位相を前記ピッチ周期の開始時点が到来するたびに前記指示された初期位相により更新することを特徴とする音合成装置。
A plurality of output means for outputting an original signal whose level changes periodically for each pitch period which is a time length corresponding to the pitch of the synthesized sound to be generated;
A synthesized sound generating means for generating a synthesized sound signal representing a synthesized sound by adding the original signals output from the plurality of output means;
Means for instructing the amplitude, frequency, initial phase, and pitch period of the original signal to be output to each of the plurality of output means from a part of the plurality of output means; For each of the output means, the level of the original signal output increases immediately after the start of the pitch period, while the level of the original signal output from other output means decreases immediately after the start of the pitch period. Instruction means for giving instructions,
The instruction means makes the same pitch period to be instructed to the plurality of output means, and is instructed to indicate the phase of the original signal output by the plurality of output means every time the start time of the pitch period arrives. A sound synthesizer characterized by updating the initial phase.
前記指示手段は、前記一部の出力手段から出力される原信号と前記他の出力手段から出力される原信号とにおいて前記ピッチ周期の開始時点における位相が異なるように、前記各出力手段に対して原信号の初期位相を指示することを特徴とする請求項1に記載の音合成装置。  The instructing means is provided for each output means so that the original signal output from the some output means and the original signal output from the other output means have different phases at the start time of the pitch period. The sound synthesizer according to claim 1, wherein an initial phase of the original signal is indicated. 前記各出力手段は、レベルが周期的に変化する信号に振幅値を乗算し、これにより得られた信号を前記原信号として出力する一方、
前記指示手段は、前記一部の出力手段と前記他の出力手段とに対し、当該各出力手段における乗算に供される振幅値として、符号が異なる振幅値をそれぞれ指示することを特徴とする請求項1に記載の音合成装置。
Each output means multiplies a signal whose level changes periodically by an amplitude value, and outputs a signal obtained thereby as the original signal,
The instructing unit instructs each of the output units and the other output units to use amplitude values having different signs as amplitude values to be used for multiplication in the output units. Item 2. The sound synthesizer according to Item 1.
前記各出力手段は、前記ピッチ周期に相当する時間長を有するとともに前記原信号の振幅値の時間的な変化を表すエンベロープを、レベルが周期的に変化する信号に反映させ、これにより得られた信号を前記原信号として出力する一方、
前記指示手段は、前記一部の出力手段と前記他の出力手段とに対し、各々の示す振幅値の符号が異なるエンベロープをそれぞれ指示する
ことを特徴とする請求項1に記載の音合成装置。
Each of the output means has a time length corresponding to the pitch period and reflects an envelope representing a temporal change in the amplitude value of the original signal in a signal whose level changes periodically. While outputting the signal as the original signal,
The sound synthesizing apparatus according to claim 1, wherein the instruction unit instructs each of the output units and the other output units of envelopes having different signs of amplitude values.
前記複数の出力手段は、それぞれ角周波数が異なる原信号を出力するものであり、
前記一部の出力手段は、前記複数の出力手段のうち出力する原信号の角周波数が小さいものから数えて奇数番目に相当する1以上の出力手段であり、前記他の出力手段は、前記複数の出力手段のうち出力する原信号の角周波数が小さいものから数えて偶数番目に相当する1以上の出力手段である
ことを特徴とする請求項1から4のいずれかに記載の音合成装置。
The plurality of output means output original signals having different angular frequencies.
The part of the output means is one or more output means corresponding to an odd number counted from the plurality of output means having a low angular frequency of the original signal to be output, and the other output means is the plurality of output means. 5. The sound synthesizer according to claim 1, wherein the output synthesizer is one or more output means corresponding to an even number counted from a low angular frequency of the output original signal.
前記各出力手段は、それぞれ波形が異なる複数種類の信号を生成し得る信号発生手段を備えるとともに、当該信号発生手段によって生成された信号に基づいて前記原信号を出力するものであり、
前記指示手段は、前記各出力手段に対して、前記複数種類の信号のうちいずれかを当該出力手段の信号発生手段が生成すべき信号として指示する
ことを特徴とする請求項1から5のいずれかに記載の音合成装置。
Each of the output means includes a signal generation means capable of generating a plurality of types of signals having different waveforms, and outputs the original signal based on the signal generated by the signal generation means.
6. The instruction unit according to claim 1, wherein the instruction unit instructs each of the output units as one of the plurality of types of signals as a signal to be generated by the signal generation unit of the output unit. A sound synthesizer according to claim 1.
前記指示手段は、前記各出力手段に対して、前記複数種類の信号のうち利用者によって選択された信号を当該出力手段の信号発生手段が生成すべき信号として指示する
ことを特徴とする請求項6に記載の音合成装置。
The instruction means instructs the output means to select a signal selected by a user from the plurality of types of signals as a signal to be generated by the signal generation means of the output means. 6. The sound synthesizer according to 6.
コンピュータを、
レベルが周期的に変化する原信号を、生成されるべき合成音の音高に応じた時間長であるピッチ周期ごとに出力する複数の出力手段と、
前記複数の出力手段から出力された原信号を加算することによって、合成音を表す合成音信号を生成する合成音生成手段と、
前記複数の出力手段の各々に対して当該出力手段が出力すべき原信号の振幅、周波数、初期位相、ピッチ周期を指示する手段であって、前記複数の出力手段のうち一部の出力手段から出力される原信号のレベルが前記ピッチ周期の開始直後において増加する一方、他の出力手段から出力される原信号のレベルが前記ピッチ周期の開始直後において減少するように、前記各出力手段に対して指示を与える指示手段として機能させるプログラムであって、
前記指示手段は、前記複数の出力手段に対して指示するピッチ周期を同一とするとともに、前記複数の出力手段が出力する原信号の位相を前記ピッチ周期の開始時点が到来するたびに前記指示された初期位相により更新する指示手段として機能させるためのプログラム。
Computer
A plurality of output means for outputting an original signal whose level changes periodically for each pitch period which is a time length corresponding to the pitch of the synthesized sound to be generated;
A synthesized sound generating means for generating a synthesized sound signal representing a synthesized sound by adding the original signals output from the plurality of output means;
Means for instructing the amplitude, frequency, initial phase, and pitch period of the original signal to be output to each of the plurality of output means from a part of the plurality of output means; For each of the output means, the level of the original signal output increases immediately after the start of the pitch period, while the level of the original signal output from other output means decreases immediately after the start of the pitch period. A program that functions as an instruction means for giving instructions.
The instruction means makes the same pitch period to be instructed to the plurality of output means, and is instructed to indicate the phase of the original signal output by the plurality of output means every time the start time of the pitch period arrives. A program for functioning as an instruction means for updating with the initial phase.
JP2003060515A 2003-03-06 2003-03-06 Sound synthesis apparatus and program Expired - Fee Related JP3888315B2 (en)

Priority Applications (6)

Application Number Priority Date Filing Date Title
JP2003060515A JP3888315B2 (en) 2003-03-06 2003-03-06 Sound synthesis apparatus and program
TW093105888A TWI254276B (en) 2003-03-06 2004-03-05 Sound synthesizer and recording medium to record the program
KR1020040015257A KR100620484B1 (en) 2003-03-06 2004-03-06 Sound synthesizing device and storage medium storing program
CNB2004100282324A CN100565667C (en) 2003-03-06 2004-03-08 Speech synthesizing device
CNU2004200079068U CN2699429Y (en) 2003-03-06 2004-03-08 Sound synthesizing apparatus and storage media with stored program
HK05101891.3A HK1068185A1 (en) 2003-03-06 2005-03-04 Sound synthesizing device

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2003060515A JP3888315B2 (en) 2003-03-06 2003-03-06 Sound synthesis apparatus and program

Publications (2)

Publication Number Publication Date
JP2004271750A JP2004271750A (en) 2004-09-30
JP3888315B2 true JP3888315B2 (en) 2007-02-28

Family

ID=33123035

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2003060515A Expired - Fee Related JP3888315B2 (en) 2003-03-06 2003-03-06 Sound synthesis apparatus and program

Country Status (5)

Country Link
JP (1) JP3888315B2 (en)
KR (1) KR100620484B1 (en)
CN (2) CN100565667C (en)
HK (1) HK1068185A1 (en)
TW (1) TWI254276B (en)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100957710B1 (en) * 2008-05-22 2010-05-13 주식회사 다날 an apparatus for receiving star voice messages
KR100968090B1 (en) * 2008-05-27 2010-07-05 한국과학기술원 Programable sound synthesis apparatus and programable sound synthesis method
CN113362864B (en) * 2021-06-16 2022-08-02 北京字节跳动网络技术有限公司 Audio signal processing method, device, storage medium and electronic equipment

Also Published As

Publication number Publication date
KR100620484B1 (en) 2006-09-13
CN100565667C (en) 2009-12-02
TWI254276B (en) 2006-05-01
TW200425056A (en) 2004-11-16
CN2699429Y (en) 2005-05-11
JP2004271750A (en) 2004-09-30
CN1527279A (en) 2004-09-08
KR20040079330A (en) 2004-09-14
HK1068185A1 (en) 2005-04-22

Similar Documents

Publication Publication Date Title
JP4702392B2 (en) Resonant sound generator and electronic musical instrument
JP5104553B2 (en) Impulse response processing device, reverberation imparting device and program
JP3888315B2 (en) Sound synthesis apparatus and program
JP4736046B2 (en) Waveform data production method, waveform data production apparatus, program, and waveform memory production method
JPH05181485A (en) Electronic musical instrument
JP3430719B2 (en) Apparatus and method for setting parameters of musical sound synthesizer
JP3715069B2 (en) Music signal synthesis method and apparatus, and recording medium
JP2621466B2 (en) Sampling device
JP3898944B2 (en) Electronic musical instruments
JP4385401B2 (en) Low frequency oscillation device and low frequency oscillation processing program
JP4179243B2 (en) Waveform generator and program
JP2003255951A (en) Waveform processing method and apparatus
JP2794561B2 (en) Waveform data generator
JP3727110B2 (en) Music synthesizer
JP3752855B2 (en) Waveform data creation method
JP3404953B2 (en) Music synthesizer
JP2002006853A (en) Resonance device
JP5035388B2 (en) Resonant sound generator and electronic musical instrument
JP5909416B2 (en) Tempo sound generator and tempo sound generator
JP3201553B2 (en) Electronic musical instrument
JP3556423B2 (en) A tone control device for electronic musical instruments using a harmonic synthesis type sound source.
JP2007034099A (en) Musical sound synthesizer
JPH04133099A (en) Musical sound synthesizer
JPH07175475A (en) Electronic musical instrument
JPH10198383A (en) Device and method for synthesizing musical sound

Legal Events

Date Code Title Description
A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20060328

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20060425

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20060626

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20060815

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20061012

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20061107

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20061120

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

S531 Written request for registration of change of domicile

Free format text: JAPANESE INTERMEDIATE CODE: R313532

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20101208

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20101208

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20111208

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20111208

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20121208

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20131208

Year of fee payment: 7

LAPS Cancellation because of no payment of annual fees