JP2004271750A - Sound synthesizer and program - Google Patents

Sound synthesizer and program Download PDF

Info

Publication number
JP2004271750A
JP2004271750A JP2003060515A JP2003060515A JP2004271750A JP 2004271750 A JP2004271750 A JP 2004271750A JP 2003060515 A JP2003060515 A JP 2003060515A JP 2003060515 A JP2003060515 A JP 2003060515A JP 2004271750 A JP2004271750 A JP 2004271750A
Authority
JP
Japan
Prior art keywords
signal
output
output means
sound
original signal
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2003060515A
Other languages
Japanese (ja)
Other versions
JP3888315B2 (en
Inventor
Yasuo Yoshioka
靖雄 吉岡
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Yamaha Corp
Original Assignee
Yamaha Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Yamaha Corp filed Critical Yamaha Corp
Priority to JP2003060515A priority Critical patent/JP3888315B2/en
Priority to TW093105888A priority patent/TWI254276B/en
Priority to KR1020040015257A priority patent/KR100620484B1/en
Priority to CNB2004100282324A priority patent/CN100565667C/en
Priority to CNU2004200079068U priority patent/CN2699429Y/en
Publication of JP2004271750A publication Critical patent/JP2004271750A/en
Priority to HK05101891.3A priority patent/HK1068185A1/en
Application granted granted Critical
Publication of JP3888315B2 publication Critical patent/JP3888315B2/en
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Classifications

    • BPERFORMING OPERATIONS; TRANSPORTING
    • B60VEHICLES IN GENERAL
    • B60NSEATS SPECIALLY ADAPTED FOR VEHICLES; VEHICLE PASSENGER ACCOMMODATION NOT OTHERWISE PROVIDED FOR
    • B60N2/00Seats specially adapted for vehicles; Arrangement or mounting of seats in vehicles
    • B60N2/58Seat coverings
    • B60N2/5816Seat coverings attachments thereof
    • B60N2/5825Seat coverings attachments thereof by hooks, staples, clips, snap fasteners or the like
    • BPERFORMING OPERATIONS; TRANSPORTING
    • B60VEHICLES IN GENERAL
    • B60NSEATS SPECIALLY ADAPTED FOR VEHICLES; VEHICLE PASSENGER ACCOMMODATION NOT OTHERWISE PROVIDED FOR
    • B60N2/00Seats specially adapted for vehicles; Arrangement or mounting of seats in vehicles
    • B60N2/70Upholstery springs ; Upholstery

Landscapes

  • Engineering & Computer Science (AREA)
  • Aviation & Aerospace Engineering (AREA)
  • Transportation (AREA)
  • Mechanical Engineering (AREA)
  • Electrophonic Musical Instruments (AREA)
  • Stereophonic System (AREA)

Abstract

<P>PROBLEM TO BE SOLVED: To provide a sound synthesizer and a program that can synthesize a natural sound with simple constitution. <P>SOLUTION: A sound synthesis part has a plurality of source signal output units 41. Each source signal output unit 41 is equipped with a signal generator 41a which generates a signal Sa cyclically varying in level and a multiplier 41b which multiplies the signal Sa by an amplitude value. A controller 10 indicates a phase (p) of the signal Sa at the start of a pitch cycle to respective signal generators 41a. At this time, "0" is indicated as a phase (p) to signal generators 41a of odd-numbered source signal output units 41 and "π" is indicated as a phase (p) to signal generators 41a of even-numbered source signal output units 41. <P>COPYRIGHT: (C)2004,JPO&NCIPI

Description

【0001】
【発明の属する技術分野】
本発明は、所望の音を表す信号を、複数種類の信号を加算することによって生成する音合成装置、およびコンピュータをこの音合成装置として機能させるためのプログラムに関する。
【0002】
【従来の技術】
人間の声や楽器の演奏音といった所望の音を合成する技術が従来から提案されている。CSM(Composite Sinusoidal Modeling)による音合成方法(以下「CSM音合成方法」という)は、この種の技術において広く利用されている方法のひとつである(例えば特許文献1参照)。この方法によれば、所望の音を表す信号(以下「合成音信号」という)の波高値ytは、以下の式(1)に示されるように、それぞれ角周波数および振幅が異なる複数の正弦波の和として表される。
yt=a1 sin ω1 t+a2 sin ω2 t+……+an sin ωn t (1)
なお、上式(1)において、「ai(iは1≦i≦nを満たす整数)」および「ωi」は、それぞれ第i次正弦波の振幅および角周波数である。また、「t」は時刻を表す整数であり、「n」は加算されるべき正弦波の個数(いわゆるCSM次数)を表している。
【0003】
図7は、このCSM音合成方法を利用して音を合成する装置の構成を示すブロック図である。同図に示すように、この音合成装置は、音合成部70と制御装置80とを有する。このうち音合成部70は、各々が正弦波を発生して出力するn個(ここではn=4とする)の正弦波出力ユニット71(71−1、71−2、71−3および71−4)と、各正弦波出力ユニット71からの出力信号を加算して出力する加算器72と、加算器72から出力された信号に特定のエンベロープを乗算したうえで合成音信号Sとして出力するエンベロープ処理部73とを備えている。各正弦波出力ユニット71は、指示された角周波数の正弦波を発生する正弦波発生器71aと、この正弦波に対して指示された振幅値を乗算する乗算器71bとを含んでいる。一方、図7に示す制御装置80は、合成すべき音の内容に応じた角周波数および振幅値を各正弦波出力ユニット71の正弦波発生器71aと乗算器71bとに対してそれぞれ指示するとともに、合成音の音高(ピッチ)に応じた時間長(以下「ピッチ周期」という)Tをエンベロープ処理部73に対して指示する。
【0004】
この構成のもと、4個の正弦波発生器71aは、図8(a)から(d)に示すように、ピッチ周期Tの開始時点の到来を契機として一斉に正弦波の発生を開始する。すなわち、ピッチ周期の開始時点における各正弦波の位相は、すべての正弦波発生器71aについて「0」となる。そして、これらの正弦波に振幅値を乗算した信号(以下「原信号」という)を加算したもの(図8(e))と、ピッチ周期Tの時間長を有するエンベロープ(図8(f))とがエンベロープ処理部73によって乗算されることによって、図8(g)に波形を示した合成音信号Sが得られる。図9(a)および(b)は、この合成音信号Sの波形およびスペクトログラムをそれぞれ示す図である。すなわち、図9(a)においては横軸が時間を表し、縦軸が信号強度を表している。また、図9(b)においては横軸が時間を表し、縦軸が周波数を表し、色の明暗が信号強度の分布を表している。
【0005】
【特許文献1】
特開平11−231875号公報(特に第3頁および第1図)
【0006】
【発明が解決しようとする課題】
しかしながら、図7に示す構成のもとで得られる合成音信号Sは、図9(a)に示すように信号強度がレベル「0」を基準として一方の側(ここでは「+」側)に偏ったものとなり、しかも図9(b)に示すようにピッチ周期Tの開始時点の近くで周波数の高いノイズ成分が顕著に現れるものとなる。そして、このような信号に基づいて発せられる音は、ノイズを含んだ耳障りなものとなるという問題があった。一方、信号強度の偏りやノイズ成分を抑えるために、合成音信号Sに対して各種のフィルタ処理を施すことも考えられる。しかしながら、この場合には合成音信号Sを得るための構成に加えてフィルタを別途に設ける必要が生じ、処理量の増大や構成の煩雑化を招くという問題が生じ得る。
【0007】
本発明は、このような事情に鑑みてなされたものであり、簡易な構成によって自然な音を合成することができる音合成装置、およびコンピュータを楽音合成装置として機能させるためのプログラムを提供することを目的としている。
【0008】
【課題を解決するための手段】
上述したように、図7に示した構成によって得られる合成音信号Sは、その信号強度がレベル「0」を基準として一方の側に偏ったものとなり、しかもピッチ周期の開始時点近傍にノイズを含むものとなる。本願発明者は、合成音信号Sがこのような性質をもった信号になる原因のひとつは、ピッチ周期の開始直後においてすべての原信号が一斉に増加を開始することにあるとの知見を得るに至った。
【0009】
すなわち、すべての原信号がピッチ周期の開始時点において一斉に増加を開始するために、合成音信号の波形は各ピッチ周期の境界時点において急激かつ不連続的に変化する。より具体的には、図9(a)を時間軸方向に拡大した同図(c)に示されるように、合成音信号の波形はピッチ周期の開始時点において不連続となる。この不連続の結果として、合成音信号はピッチ周期の開始時点にノイズを含むものとなるのである。
【0010】
また、エンベロープの波形は、一般的に、すべての原信号が一斉に増加するピッチ周期の開始直後において最大となる一方、その後は減衰していく。このため、すべての原信号を加算した信号とエンベロープとを乗算した合成音信号においては、レベル「0」を基準として「+」となる部分の積分値が、「−」となる部分の積分値と比べて大きくなる。この積分値の不均一に起因して、合成音信号の信号強度は一方の側に偏ったものとなるのである。
【0011】
本発明は、このような知見に基づいてなされたものであり、レベルが周期的に変化する原信号を、生成されるべき合成音の音高に応じた時間長であるピッチ周期ごとに出力する複数の出力手段と、前記複数の出力手段から出力された原信号を加算することによって、合成音を表す合成音信号を生成する合成音生成手段と、前記複数の出力手段の各々に対して当該出力手段が出力すべき原信号を指示する手段であって、前記複数の出力手段のうち一部の出力手段から出力される原信号のレベルが前記ピッチ周期の開始直後において増加する一方、他の出力手段から出力される原信号のレベルが前記ピッチ周期の開始直後において減少するように、前記各出力手段に対して指示を与える指示手段とを具備することを特徴としている。
【0012】
この構成のもとでは、ピッチ周期の開始直後における原信号のレベルの増減が1以上の出力手段ごとに異なるように、指示手段が各出力手段に対して原信号の態様を指示する。すなわち、すべての原信号がピッチ周期の開始直後において一斉に増加を開始する事態が回避されるのである。したがって、本発明によれば、合成音信号に対するフィルタ処理などを要することなく、信号強度の偏りやピッチ周期ごとのノイズを抑えて自然な音を得ることができる。
【0013】
本発明において、一部の出力手段から出力される原信号と他の出力手段から出力される原信号とについてピッチ周期の開始直後におけるレベルの増減を異ならせるための構成としては、例えば以下の構成が考えられる。すなわち、一部の出力手段から出力される原信号と他の出力手段から出力される原信号とにおいてピッチ周期の開始時点における位相が異なるように、指示手段が各出力手段に対して原信号の位相を指示する構成を採用し得る。また、各出力手段が、レベルが周期的に変化する信号に振幅値を乗算し、これにより得られた信号を原信号として出力する構成のもとでは、指示手段が、一部の出力手段と他の出力手段とに対し、当該各出力手段における乗算に供される振幅値として、符号が異なる振幅値をそれぞれ指示する構成を採用しても良い。あるいは、各出力手段が、前記ピッチ周期に相当する時間長を有するとともに原信号の振幅値の時間的な変化を表すエンベロープを振幅値の乗算によって得られた信号に反映させ、これにより得られた信号を原信号として出力する構成のもとでは、指示手段が、一部の出力手段と他の出力手段とに対し、各々の示す振幅値の符号が異なるエンベロープをそれぞれ指示する構成としてもよい。
【0014】
さらに、複数の出力手段が、それぞれ角周波数の異なる原信号を出力するものであれば、複数の出力手段のうち出力する原信号の角周波数が小さいものから数えて奇数番目に相当する1以上の出力手段を上記「一部の出力手段」とし、偶数番目に相当する1以上の出力手段を上記一部の出力手段を上記「他の出力手段」とすることが望ましい。
【0015】
また、各出力手段が、それぞれ波形が異なる複数種類の信号を生成し得る信号発生手段を備えるとともに、この信号発生手段によって生成された信号に基づいて原信号を出力する構成のもとでは、指示手段が、各出力手段に対して、上記複数種類の信号のうちいずれかを当該出力手段の信号発生手段が生成すべき信号として指示する構成としてもよい。この構成によれば、複数種類の信号のいずれかに基づいて原信号が出力されるから、これによって得られる合成音の音質(音色)を多様なものとすることができる。さらにこの構成において、指示手段が、各出力手段に対して、複数種類の信号のうち利用者によって選択された信号を当該出力手段の信号発生手段が生成すべき信号として指示する構成とすれば、利用者の好みの合成音を得ることができる。
【0016】
なお、本発明は、コンピュータを本発明に係る音合成装置として機能させるためのプログラムとしても特定される。このプログラムは、ネットワークを介してコンピュータに提供されるものであってもよいし、光ディスクに代表される記録媒体に格納された形態で提供されてコンピュータにインストールされるものであってもよい。
【0017】
【発明の実施の形態】
以下、図面を参照して、本発明の実施形態について説明する。
【0018】
<A:実施形態の構成>
図1は、本発明の実施形態に係る音合成装置の構成を示すブロック図である。同図に示すように、この音合成装置100は、制御装置10と、記憶装置20と、入力装置30と、音合成部40と、スピーカ50とを有する。このうち記憶装置20、入力装置30および音合成部40は、それぞれバス11を介して制御装置10に接続されている。また、スピーカ50は音合成部40に接続されている。
【0019】
制御装置10は、音合成装置100の全体を制御するための装置である。具体的には、制御装置10は、プログラムを実行することによって各部の制御や各種の演算処理を行なうCPU(Central Processing Unit)と、このCPUによって実行されるプログラムが格納されたROM(Read Only Memory)と、CPUによって作業領域として使用されるRAM(Random Access Memory)とを備えている。
【0020】
記憶装置20は、制御装置10によって実行されるプログラムやその実行時に使用されるデータを記憶するための手段である。例えばハードディスク装置や光ディスク装置といった各種の装置が記憶装置20として採用され得る。この記憶装置20には、音合成部40に音の合成を行なわせるためのプログラム(以下「音合成プログラム」という)が記憶されている。制御装置10は、この音合成プログラムを実行することにより、音の合成に関わる各種の指示を音合成部40に与える手段として機能する。
【0021】
入力装置30は、マウスなどのポインティングデバイスや、文字または記号を入力するためのキーボードなどを備え、利用者による操作に応じた信号を制御装置10に出力する。利用者は、この入力装置30を操作することによって、例えば合成されるべき音の音高(ピッチ)や音合成に供されるべき信号の波形などを適宜に選択することができる。
【0022】
音合成部40は、制御装置10から与えられた指示に応じて、複数の原信号から合成音信号を生成して出力する手段である。スピーカ50は、音合成部40から出力された合成音信号に応じた音を出力する。なお、ここでは音を出力するための装置としてスピーカ50を例示したが、これに代えて、利用者の耳に装着されるイヤホンやヘッドホンを設けてもよい。
【0023】
図2は、音合成部40の具体的な構成を示すブロック図である。同図に示すように、この音合成部40は、複数の原信号出力ユニット41(41−1、41−2、41−3および41−4)と加算器42とエンベロープ処理部43とを有する。原信号出力ユニット41は、CSM音合成方法において加算の対象となる信号の数(すなわちCSM次数n)に対応する数だけ設けられている。ただし、本実施形態においては、4つの原信号出力ユニット41が設けられた場合を想定する。また、以下では、各原信号出力ユニット41を特に区別して表記する場合には変数iを用いて「原信号出力ユニット41−i」と表記する。
【0024】
これらの原信号出力ユニット41は、それぞれ角周波数や振幅値が異なる原信号Sbを生成して出力するための手段である。各原信号出力ユニット41は信号発生器41aと乗算器41bとを有する。このうち信号発生器41aは、レベルが周期的に変動する信号(以下「周期信号」という)Saを生成して出力する。本実施形態における信号発生器41aは、正弦波、三角波および矩形波など、それぞれ波形の態様が異なる複数種類の信号のいずれかを周期信号Saとして選択的に生成する機能を有する。具体的には、信号発生器41aは、各種類の信号における1周期分の波形を表す波形データが予め記憶されたメモリを備えている。そして、いずれかの波形データが表す波形を時系列的に連続させることによって特定の波形を有する信号を生成するのである。一方、乗算器41bは、この信号発生器41aから出力された周期信号Saに振幅値を乗算したうえで原信号Sbとして出力する。
【0025】
加算器42は、4つの原信号出力ユニット41から出力された原信号Sbを加算し、これにより得られた信号Scを出力する。エンベロープ処理部43は、加算器42から出力された信号Scにおける振幅値のエンベロープを変更するための手段である。すなわち、エンベロープ処理部43は、振幅値の時間的な変化を表すエンベロープを生成するエンベロープジェネレータ43aを備え、これによって生成されたエンベロープを加算器42から出力された信号Scに対して乗算したものを合成音信号Sdとして出力する。
【0026】
<B:実施形態の動作>
利用者によって入力装置30に所定の操作がなされると、制御装置10は、記憶装置20に記憶された音合成プログラムをRAMに読み込んだうえでこれを順次に実行する。以下、この音合成プログラムの実行に伴なう音合成動作を説明する。
【0027】
利用者は、音合成が開始される前に入力装置30に所定の操作を行なうことによって、各信号発生器41aが発生すべき周期信号Saの種類を選択することができる。この操作を検知すると、制御装置10は、選択された信号の種類を表すデータ(以下「波形選択データ」という)Dsを各原信号出力ユニット41の信号発生器41aに対して出力する。一方、各信号発生器41aは、この波形選択データDsによって、当該信号発生器41aが生成すべき信号を特定する。また、利用者は、音合成が行なわれている任意の時点において、信号発生器41aから出力される周期信号Saの種類を選択することができる。この操作がなされるたびに、選択された信号の種類を表す波形選択データDsが制御装置10から各信号発生器41aに出力されて、これらの信号発生器41aから出力されるべき周期信号Saの種類が特定されることとなる。
【0028】
一方、利用者により入力装置30に所定の操作がなされて音合成の開始指示が与えられると、制御装置10は、各信号発生器41aに対して信号発生の開始指示を与える。さらに、制御装置10は、予め定められた時間長(例えば5msから30ms程度)を有する期間ごとに、合成すべき音の内容に応じたフレームパラメータを算定して音合成部40に出力する。このフレームパラメータは、図2に示すように、角周波数ωi(ω1、ω2、ω3およびω4)、初期位相pi(p1、p2、p3およびp4)、振幅値ai(a1、a2、a3およびa4)、ならびにピッチ周期Tを含んでいる。このうちピッチ周期Tは、合成すべき音の音高に応じた時間長であり、エンベロープ処理部43に供給される。また、角周波数ωiおよび初期位相piは、各原信号出力ユニット41の信号発生器41aに対して供給される。すなわち、原信号出力ユニット41−1の信号発生器41aには角周波数ω1および初期位相p1が指示され、原信号出力ユニット41−2の信号発生器41aには角周波数ω2および初期位相p2が指示されるといった具合である。角周波数ωiは、原信号出力ユニット41−iの信号発生器41aが出力すべき周期信号Saの角周波数を示している。なお、本実施形態においては、原信号出力ユニット41−1の信号発生器41aに供給される角周波数ω1が最小であり、ω2、ω3、ω4と続くにつれて大きい値となるものとする。一方、初期位相piは、原信号出力ユニット41−iの信号発生器41aが出力すべき周期信号Saのうちピッチ周期の開始時点における位相を示している。また、振幅値aiは、乗算器41bが信号発生器41aから出力された信号に乗算すべき振幅値であり、各原信号出力ユニット41の乗算器41bに対して供給される。例えば、原信号出力ユニット41−1の乗算器41bには振幅値a1が指示され、原信号出力ユニット41−2の乗算器41bには振幅値a2が指示されるといった具合である。
【0029】
音合成部40は、ピッチ周期の開始時点が到来するたびに、フレームパラメータの値を合成音に反映させる。ここで、図3(a)においては、フレームパラメータの供給されるタイミングが下向きの矢印にて示されている。ピッチ周期Tの開始時点が到来すると、音合成部40は、その直前に供給されたフレームパラメータを合成音に反映させるようになっている。すなわち、図3(a)に示すタイミングで順次に供給されるフレームパラメータのうち「〇」が付されたタイミングで供給されたフレームパラメータのみが合成音に影響を与えることとなる。なお、図3(a)においては、フレームパラメータが供給される時間間隔がピッチ周期Tの時間長よりも短い場合を例示している。ただし、このフレームパラメータが供給される時間間隔は、合成すべき音の内容に応じて予め定められる時間長であり、ピッチ周期Tよりも長い時間長とされる場合もある。
【0030】
一方、制御装置10によるフレームパラメータの出力と並行して、各原信号出力ユニット41は、フレームパラメータに応じた原信号を生成して出力する。すなわち、各原信号出力ユニット41の信号発生器41aは、波形選択データDsによって指定された種類の信号であって、フレームパラメータとして指示された角周波数ωiを有する周期信号Saを出力する。この周期信号Saの出力動作はピッチ周期Tごとに行なわれる。すなわち、各信号発生器41aは、ピッチ周期Tの開始時点から周期信号Saの出力を開始する。さらに、各信号発生器41aは、ピッチ周期の開始時点における周期信号Saの位相を、フレームパラメータとして指示された初期位相piに設定する。各信号発生器41aから出力された周期信号Saは、乗算器41bにおける振幅値aiの乗算を経た後に原信号Sbとして出力される。
【0031】
本実施形態においては、4つの原信号出力ユニット41のうち指示される角周波数ωiが小さいものから数えて奇数番目の原信号出力ユニット41−1および41−3(以下、単に「奇数番目の原信号出力ユニット41」という)に指示される初期位相p1およびp3の値は「0」に設定されている。これに対し、4つの原信号出力ユニット41のうち角周波数ωiが小さいものから数えて偶数番目の原信号出力ユニット41−2および41−4(以下、単に「偶数番目の原信号出力ユニット41」という)に指示される初期位相p2およびp4は「π」に設定されている。ここで、図4は、各原信号出力ユニット41における周期信号Saの位相の変化を表すタイミングチャートである。同図においては、横軸が時間を表し、縦軸が各周期信号Saの位相を表している。図3および図4に示すように、奇数番目の原信号出力ユニット41における周期信号Saはピッチ周期の開始時点が到来するたびにその位相が「0」に更新される一方、偶数番目の原信号出力ユニット41における周期信号Sbはピッチ周期の開始時点が到来するたびにその位相が「π」に更新される。この結果、奇数番目の原信号出力ユニット41から出力される原信号Sbのレベルは各ピッチ周期の開始直後において増加する一方、偶数番目の原信号出力ユニット41から出力される原信号Sbのレベルは各ピッチ周期の開始直後において減少することとなる(図3参照)。
【0032】
一方、4つの原信号出力ユニット41から出力された原信号Sbは、加算器42によって加算されたうえで信号Scとしてエンベロープ処理部43に供給される。エンベロープ処理部43は、エンベロープジェネレータ43aによって生成されたエンベロープを信号Scに乗算し、これにより得られた信号を合成音信号Sdとして出力する。ここで、エンベロープジェネレータ43aは、制御装置10からフレームパラメータとして指示されたピッチ周期Tと同一の時間長を有するエンベロープを生成する。そして、スピーカ50は、エンベロープ処理部43から出力された合成音信号Sdに基づいて合成音を出力する。
【0033】
このように、本実施形態においては、4つの原信号出力ユニット41のうちの一部(原信号出力ユニット41−1および41−3)から出力される原信号Sbがピッチ周期の開始直後に増加する一方、他の原信号(原信号出力ユニット41−2および41−4からの原信号)がピッチ周期の開始直後に減少するようになっている。換言すれば、すべての原信号がピッチ周期の開始直後において一斉に増加(または減少)する事態が回避されるのである。この結果、本実施形態によれば、図9に示した信号強度の振幅値の偏りやピッチ周期の開始時点におけるノイズを抑えて自然な合成音を得ることができる。この点について図5を参照して詳述する。
【0034】
ここで、図5(a)はエンベロープ処理部43から出力された合成音信号Sdの波形を表すグラフであり、図5(b)はこの信号Sdのスペクトログラムである。図5(a)においては横軸が時間を表し、縦軸が信号強度を表している。一方、図5(b)においては横軸が時間を表し、縦軸が周波数を表し、色の明暗が信号強度の分布(明るい部分は信号強度が大きい)を表している。図5(a)を図9(a)と比較すれば明らかな通り、本実施形態においては、信号強度がレベル「0」を基準として「+」側および「−」側の双方に均等に分布している。これは、奇数番目の原信号出力ユニット41から出力された原信号Sbがピッチ周期の開始直後において増加することに起因した「+」側への信号強度の偏りと、偶数番目の原信号出力ユニット41から出力された原信号Sbがピッチ周期の開始直後において減少することに起因した「−」側への信号強度の偏りとが相殺されるためであると考えられる。さらに、図5(b)に示すように、本実施形態における合成音信号Sdは、図9(b)に示した従来の合成音信号Sと比較して、ピッチ周期の開始時点における高周波成分(ノイズ)が低減されている。このことは、図5(a)を時間軸方向に拡大した図5(c)に示すように、合成音信号の波形がピッチ周期の開始時点において連続となることからも明らかである。このように、本実施形態によれば、図9に示した信号強度の偏りやピッチ周期の開始時点におけるノイズを抑えて自然な合成音を得ることができ、しかも信号強度の偏りやピッチ周期の開始時点におけるノイズを抑えるためのフィルタ処理は不要である。
【0035】
また、本実施形態においては、それぞれ波形が異なる複数種類の信号のうちいずれかが選択されて周期信号Saとして出力されるから、これに基づいて得られる合成音の音質(特に音色)を多様化することができる。しかも、この複数種類の信号のいずれかが利用者によって選択されるようになっているから、利用者の好みの音質を有する合成音が得られる。
【0036】
<C:変形例>
以上に説明した実施の形態はあくまでも例示であり、この形態に対しては本発明の趣旨から逸脱しない範囲で種々の変形を加えることができる。具体的な変形としては、例えば以下に示す態様が考えられる。
【0037】
<C−1:変形例1>
上記実施形態においては、初期位相piを「0」または「π」とした構成を例示したが、初期位相piの値はこれに限られない。すなわち、奇数番目の原信号出力ユニット41から出力された原信号がピッチ周期の開始直後において増加することに起因した「+」側への信号強度の偏りと、偶数番目の原信号出力ユニット41から出力された原信号がピッチ周期の開始直後において減少することに起因した「−」側への信号強度の偏りとが相殺されて信号強度がレベル「0」を基準として双方の側に均等に分布するように、適宜に各初期位相piの値が選定されることが望ましい。
【0038】
また、上記実施形態においては、ピッチ周期の開始時点における各原信号の位相を制御する構成を例示したが、すべての原信号がピッチ周期の開始時点において一斉に増加する事態を回避するための構成はこれに限られない。この構成に代えて、例えば以下に示す構成を採用することができる。
【0039】
(1)態様1
奇数番目の原信号出力ユニット41に指示される振幅値の符号と、偶数番目の原信号出力ユニット41に指示される振幅値の符号とを異ならせる構成としてもよい。例えば、図2示す構成において、振幅値a1およびa3の符号を「+」とする一方、振幅値a2およびa4の符号を「−」とするといった具合である。この構成においても、奇数番目の原信号出力ユニット41からの原信号と偶数番目の原信号出力ユニット41からの原信号との位相差を実質的に「π」だけずらすことになるから、各原信号の波形は図3(b)に示した波形と同一となる。したがって、上記実施形態と同様の効果が得られる。
【0040】
(2)態様2
4つの原信号出力ユニット41のうち奇数番目の原信号出力ユニット41の乗算器41bから出力された信号と、偶数番目の原信号出力ユニット41の乗算器41bから出力された信号とに、それぞれ符号が異なるエンベロープを乗算したうえで原信号として出力する構成としてもよい。すなわち、図6に示すように、4つの原信号出力ユニット41の各々に、制御装置10から指示されたエンベロープを乗算器41bからの出力信号に乗算するエンベロープ処理部41cを設ける。具体的には、奇数番目の原信号出力ユニット41のエンベロープ処理部41cにおいては、ピッチ周期の開始時点から「+」側に立ち上がり、その後に減少してピッチ周期の終了時点で「0」に至るエンベロープが用いられる。一方、偶数番目の原信号出力ユニット41のエンベロープ処理部41cにおいては、ピッチ周期の開始時点から「−」側に立ち下がり、その後に増加してピッチ周期の終了時点で「0」に至るエンベロープが用いられる。したがって、奇数番目の原信号出力ユニット41から出力される原信号はピッチ周期の開始直後において増加する一方、偶数番目の原信号出力ユニット41から出力される原信号をピッチ周期の開始直後において減少することとなる。すなわち、すべての原信号がピッチ周期の開始直後において一斉に増加する事態が回避されるから、上記実施形態と同様の効果が得られる。
【0041】
このように、本発明においては、複数の原信号のうち一部の原信号のレベルがピッチ周期の開始直後において増加する一方、他の原信号のレベルがピッチ周期の開始直後において減少する構成であれば足り、原信号のレベルをこのように設定するための構成の如何は不問である。
【0042】
<C−2:変形例2>
上記実施形態および変形例においては、音合成部40が4つの原信号出力ユニット41を有する構成を例示したが、原信号出力ユニット41の数はこれに限られない。要するに、複数の原信号出力ユニット41が音合成部40に設けられた構成であればよい。
【0043】
また、上記実施形態においては、複数の原信号出力ユニット41のうち原信号の角周波数が小さいものから数えて奇数番目の原信号出力ユニット41と偶数番目の原信号出力ユニット41とについて、ピッチ周期の開始直後における原信号の増減を異ならせる構成を例示したが、原信号出力ユニット41の区分の仕方は任意である。例えば、原信号出力ユニット41が4つである場合に、第1番目および第4番目の原信号出力ユニット41からなる組と、第2番目および第3番目の原信号出力ユニット41からなる組とに区分し、両者の組についてピッチ周期の開始直後における原信号の増減を異ならせる構成としてもよい。あるいは、ひとつの原信号出力ユニット41とその他の原信号出力ユニット41とに区分して、両者について原信号のピッチ周期の開始直後における増減を異ならせる構成としてもよい。要するに、複数の原信号出力ユニット41のうち1以上の原信号出力ユニット41とその他の1以上の原信号出力ユニット41とについて、ピッチ周期の開始直後における原信号の増減を異ならせる構成であれば足りる。
【0044】
<C−3:変形例3>
上記実施形態および各変形例においては、音合成部40をDSPによって構成した場合を例示したが、CPUなどのハードウェアと当該CPUが実行するプログラムとの協働によって、原信号を出力するための手段(原信号出力ユニット41)や原信号を加算して合成音信号を生成する手段(加算器42)が実現される構成としても良い。
【0045】
【発明の効果】
以上説明したように、本発明によれば、簡易な構成によって自然な音を合成することができる。
【図面の簡単な説明】
【図1】本発明の実施形態に係る音合成装置の構成を示すブロック図である。
【図2】同音合成装置における音合成部の構成を示すブロック図である。
【図3】各出力ユニットの信号発生器から出力される信号を表すタイミングチャートである。
【図4】各出力ユニットの信号発生器から出力される信号の位相を表すタイミングチャートである。
【図5】合成音信号の波形およびスペクトログラムを表す図である。
【図6】同実施形態の変形例に係る音合成装置の構成を示すブロック図である。
【図7】従来の音合成装置の構成を示すブロック図である。
【図8】従来の音合成装置において処理に供される信号の波形を示すタイミングチャートである。
【図9】従来の合成音信号の波形およびスペクトログラムを表す図である。
【符号の説明】
100……音合成装置、10……制御装置(指示手段)、20……記憶装置、30……入力装置、40……音合成部、50……スピーカ、41(41−1,41−2,41−3,41−4)……原信号出力ユニット(出力手段)、41a……信号発生器(信号発生手段)、41b……乗算器、41c,43……エンベロープ処理部、42……加算器(合成音生成手段)、43……エンベロープ処理部、Sa……周期信号、Sb……原信号、Sd……合成音信号。
[0001]
TECHNICAL FIELD OF THE INVENTION
The present invention relates to a sound synthesizer that generates a signal representing a desired sound by adding a plurality of types of signals, and a program that causes a computer to function as the sound synthesizer.
[0002]
[Prior art]
2. Description of the Related Art Techniques for synthesizing desired sounds such as human voices and musical sounds of musical instruments have been conventionally proposed. A sound synthesis method by CSM (Composite Sinusoidal Modeling) (hereinafter referred to as “CSM sound synthesis method”) is one of the methods widely used in this kind of technology (for example, see Patent Document 1). According to this method, a peak value yt of a signal representing a desired sound (hereinafter, referred to as a “synthesized sound signal”) is expressed by a plurality of sine waves having different angular frequencies and amplitudes as shown in the following equation (1). Expressed as the sum of
yt = a1 sin ω1 t + a2 sin ω2 t +... + an sin ωnt (1)
In the above equation (1), “ai (i is an integer satisfying 1 ≦ i ≦ n)” and “ωi” are the amplitude and angular frequency of the i-th sine wave, respectively. “T” is an integer representing time, and “n” represents the number of sine waves to be added (so-called CSM order).
[0003]
FIG. 7 is a block diagram showing a configuration of an apparatus for synthesizing sound using the CSM sound synthesizing method. As shown in the figure, this sound synthesizer has a sound synthesizer 70 and a control device 80. The sound synthesizing unit 70 generates n (here, n = 4) sine wave output units 71 (71-1, 71-2, 71-3, and 71-), each of which generates and outputs a sine wave. 4), an adder 72 for adding and outputting the output signals from the respective sine wave output units 71, and an envelope for multiplying the signal output from the adder 72 by a specific envelope and outputting as a synthesized sound signal S And a processing unit 73. Each sine wave output unit 71 includes a sine wave generator 71a that generates a sine wave having a designated angular frequency, and a multiplier 71b that multiplies the sine wave by a designated amplitude value. On the other hand, the control device 80 shown in FIG. 7 instructs the sine wave generator 71a and the multiplier 71b of each sine wave output unit 71 of the angular frequency and the amplitude value according to the content of the sound to be synthesized, respectively. , A time length (hereinafter, referred to as “pitch cycle”) T according to the pitch (pitch) of the synthesized sound is instructed to the envelope processing unit 73.
[0004]
With this configuration, the four sine wave generators 71a simultaneously start generating sine waves when the start of the pitch period T arrives, as shown in FIGS. 8A to 8D. . That is, the phase of each sine wave at the start of the pitch cycle is "0" for all sine wave generators 71a. Then, a signal obtained by multiplying these sine waves by an amplitude value (hereinafter referred to as “original signal”) is added (FIG. 8E) and an envelope having a time length of the pitch period T (FIG. 8F) Is multiplied by the envelope processing unit 73 to obtain a synthesized sound signal S having a waveform shown in FIG. FIGS. 9A and 9B are diagrams showing a waveform and a spectrogram of the synthesized sound signal S, respectively. That is, in FIG. 9A, the horizontal axis represents time, and the vertical axis represents signal intensity. In FIG. 9B, the horizontal axis represents time, the vertical axis represents frequency, and the brightness of the color represents the distribution of signal intensity.
[0005]
[Patent Document 1]
JP-A-11-231875 (especially page 3 and FIG. 1)
[0006]
[Problems to be solved by the invention]
However, as shown in FIG. 9A, the synthesized sound signal S obtained under the configuration shown in FIG. 7 has a signal strength on one side (here, on the “+” side) based on the level “0”. As shown in FIG. 9B, a noise component having a high frequency appears remarkably near the start point of the pitch period T as shown in FIG. 9B. Then, there is a problem that a sound emitted based on such a signal is unpleasant including noise. On the other hand, in order to suppress the bias of the signal strength and the noise component, it is conceivable to perform various kinds of filtering processing on the synthesized sound signal S. However, in this case, it is necessary to separately provide a filter in addition to the configuration for obtaining the synthesized sound signal S, which may cause a problem that the processing amount is increased and the configuration is complicated.
[0007]
The present invention has been made in view of such circumstances, and provides a sound synthesizer capable of synthesizing natural sounds with a simple configuration, and a program for causing a computer to function as a musical sound synthesizer. It is an object.
[0008]
[Means for Solving the Problems]
As described above, the synthesized sound signal S obtained by the configuration shown in FIG. 7 has a signal strength that is biased to one side with reference to the level “0”, and furthermore, noise is generated near the start of the pitch period. Will be included. The inventor of the present application obtains the knowledge that one of the causes of the synthesized sound signal S having such a property is that all the original signals start increasing at the same time immediately after the start of the pitch period. Reached.
[0009]
That is, since all the original signals start increasing at the same time at the start of the pitch cycle, the waveform of the synthesized sound signal changes abruptly and discontinuously at the boundary of each pitch cycle. More specifically, as shown in FIG. 9C in which FIG. 9A is enlarged in the time axis direction, the waveform of the synthesized sound signal is discontinuous at the start of the pitch period. As a result of this discontinuity, the synthesized sound signal contains noise at the start of the pitch period.
[0010]
In addition, the waveform of the envelope generally becomes maximum immediately after the start of the pitch period in which all the original signals increase at the same time, and then attenuates thereafter. Therefore, in the synthesized sound signal obtained by multiplying the envelope obtained by multiplying the signal obtained by adding all the original signals and the envelope, the integral value of the portion that becomes “+” with respect to the level “0” becomes the integral value of the portion that becomes “−”. It is larger than. Due to the non-uniformity of the integrated value, the signal strength of the synthesized sound signal is biased to one side.
[0011]
The present invention has been made based on such knowledge, and outputs an original signal whose level changes periodically for each pitch period that is a time length corresponding to the pitch of a synthesized sound to be generated. A plurality of output means, a synthesized sound generation means for generating a synthesized sound signal representing a synthesized sound by adding the original signals output from the plurality of output means, and Means for indicating an original signal to be output by the output means, wherein the level of the original signal output from some of the plurality of output means increases immediately after the start of the pitch period, while the other Instruction means for giving an instruction to each of the output means so that the level of the original signal output from the output means decreases immediately after the start of the pitch period.
[0012]
Under this configuration, the instructing means instructs each output means on the form of the original signal such that the increase or decrease in the level of the original signal immediately after the start of the pitch cycle differs for each of the one or more output means. That is, it is possible to avoid a situation where all the original signals start increasing at the same time immediately after the start of the pitch period. Therefore, according to the present invention, it is possible to obtain a natural sound by suppressing the bias of the signal strength and the noise for each pitch period without requiring a filtering process or the like for the synthesized sound signal.
[0013]
In the present invention, as a configuration for changing the level increase / decrease immediately after the start of the pitch period between the original signal output from some output units and the original signal output from other output units, for example, the following configuration is used. Can be considered. In other words, the indicating means sends the output signal of the original signal to each output means so that the phase at the start of the pitch period differs between the original signal output from some output means and the original signal output from the other output means. A configuration for indicating the phase may be adopted. Further, in a configuration in which each output unit multiplies a signal whose level periodically changes by an amplitude value and outputs a signal obtained as an original signal, the instruction unit includes some output units. A configuration may be adopted in which, for the other output means, amplitude values having different signs are respectively designated as amplitude values to be used for multiplication in each output means. Alternatively, each output means reflects an envelope having a time length corresponding to the pitch period and representing a temporal change in the amplitude value of the original signal in a signal obtained by multiplying the amplitude value, and thereby obtaining In a configuration in which a signal is output as an original signal, the instruction unit may be configured to instruct, to some output units and another output unit, envelopes each having a different sign of the indicated amplitude value.
[0014]
Further, if the plurality of output means output original signals having different angular frequencies, one or more of the plurality of output means corresponding to the odd-numbered ones counted from the one having the smaller angular frequency of the output original signal are output. It is desirable that the output means be the "partial output means" and the one or more output means corresponding to the even number be the "other output means".
[0015]
Further, in a configuration in which each output unit includes a signal generation unit that can generate a plurality of types of signals having different waveforms, and outputs an original signal based on the signal generated by the signal generation unit, The means may indicate to each output means any one of the plurality of types of signals as a signal to be generated by the signal generation means of the output means. According to this configuration, since the original signal is output based on one of the plurality of types of signals, the sound quality (tone color) of the synthesized sound obtained thereby can be varied. Further, in this configuration, if the instruction means is configured to instruct each output means of a signal selected by a user among a plurality of types of signals as a signal to be generated by the signal generation means of the output means, It is possible to obtain the user's favorite synthesized sound.
[0016]
Note that the present invention is also specified as a program for causing a computer to function as the sound synthesizer according to the present invention. This program may be provided to a computer via a network, or may be provided in a form stored in a recording medium represented by an optical disk and installed in the computer.
[0017]
BEST MODE FOR CARRYING OUT THE INVENTION
Hereinafter, embodiments of the present invention will be described with reference to the drawings.
[0018]
<A: Configuration of Embodiment>
FIG. 1 is a block diagram illustrating a configuration of a sound synthesizer according to an embodiment of the present invention. As shown in FIG. 1, the sound synthesizer 100 includes a control device 10, a storage device 20, an input device 30, a sound synthesizer 40, and a speaker 50. The storage device 20, the input device 30, and the sound synthesizer 40 are connected to the control device 10 via the bus 11, respectively. The speaker 50 is connected to the sound synthesis unit 40.
[0019]
The control device 10 is a device for controlling the entire sound synthesis device 100. Specifically, the control device 10 includes a CPU (Central Processing Unit) that controls each unit and executes various arithmetic processes by executing a program, and a ROM (Read Only Memory) in which a program executed by the CPU is stored. ) And a RAM (Random Access Memory) used as a work area by the CPU.
[0020]
The storage device 20 is a means for storing a program executed by the control device 10 and data used when the program is executed. For example, various devices such as a hard disk device and an optical disk device can be adopted as the storage device 20. The storage device 20 stores a program for causing the sound synthesis unit 40 to synthesize sounds (hereinafter, referred to as a “sound synthesis program”). By executing the sound synthesis program, the control device 10 functions as means for giving various instructions related to sound synthesis to the sound synthesis unit 40.
[0021]
The input device 30 includes a pointing device such as a mouse, a keyboard for inputting characters or symbols, and the like, and outputs a signal according to a user operation to the control device 10. By operating the input device 30, the user can appropriately select, for example, the pitch (pitch) of a sound to be synthesized, the waveform of a signal to be subjected to sound synthesis, and the like.
[0022]
The sound synthesizer 40 is a means for generating and outputting a synthesized sound signal from a plurality of original signals in accordance with an instruction given from the control device 10. The speaker 50 outputs a sound according to the synthesized sound signal output from the sound synthesis unit 40. Here, the speaker 50 is illustrated as an example of a device for outputting a sound, but instead, an earphone or a headphone worn on a user's ear may be provided.
[0023]
FIG. 2 is a block diagram showing a specific configuration of the sound synthesis unit 40. As shown in the figure, the sound synthesizer 40 has a plurality of original signal output units 41 (41-1, 41-2, 41-3 and 41-4), an adder 42, and an envelope processor 43. . The original signal output units 41 are provided in a number corresponding to the number of signals to be added in the CSM sound synthesis method (that is, the CSM order n). However, in the present embodiment, it is assumed that four original signal output units 41 are provided. Further, in the following, when each of the original signal output units 41 is particularly distinguished, the original signal output unit 41 is represented as “original signal output unit 41-i” using the variable i.
[0024]
These original signal output units 41 are means for generating and outputting original signals Sb having different angular frequencies and different amplitude values. Each original signal output unit 41 has a signal generator 41a and a multiplier 41b. Among them, the signal generator 41a generates and outputs a signal Sa whose level periodically changes (hereinafter, referred to as a “periodic signal”). The signal generator 41a according to the present embodiment has a function of selectively generating, as the periodic signal Sa, one of a plurality of types of signals having different waveforms, such as a sine wave, a triangular wave, and a rectangular wave. Specifically, the signal generator 41a includes a memory in which waveform data representing a waveform of one cycle of each type of signal is stored in advance. Then, a signal having a specific waveform is generated by making the waveform represented by any of the waveform data continuous in time series. On the other hand, the multiplier 41b multiplies the periodic signal Sa output from the signal generator 41a by an amplitude value and outputs the result as an original signal Sb.
[0025]
The adder 42 adds the original signals Sb output from the four original signal output units 41, and outputs a signal Sc obtained as a result. The envelope processing unit 43 is a unit for changing the envelope of the amplitude value in the signal Sc output from the adder 42. That is, the envelope processing unit 43 includes an envelope generator 43a that generates an envelope representing a temporal change of the amplitude value, and multiplies the generated envelope by the signal Sc output from the adder 42. It is output as a synthesized sound signal Sd.
[0026]
<B: Operation of Embodiment>
When a predetermined operation is performed on the input device 30 by the user, the control device 10 reads the sound synthesis programs stored in the storage device 20 into the RAM and sequentially executes the programs. Hereinafter, a sound synthesis operation accompanying the execution of the sound synthesis program will be described.
[0027]
The user can select the type of the periodic signal Sa to be generated by each signal generator 41a by performing a predetermined operation on the input device 30 before the sound synthesis is started. Upon detecting this operation, the control device 10 outputs data (hereinafter referred to as “waveform selection data”) Ds indicating the type of the selected signal to the signal generator 41 a of each original signal output unit 41. On the other hand, each signal generator 41a specifies a signal to be generated by the signal generator 41a based on the waveform selection data Ds. Further, the user can select the type of the periodic signal Sa output from the signal generator 41a at any time when the sound synthesis is being performed. Each time this operation is performed, the waveform selection data Ds representing the type of the selected signal is output from the control device 10 to each of the signal generators 41a, and the periodic signal Sa to be output from these signal generators 41a is output. The type will be specified.
[0028]
On the other hand, when a user performs a predetermined operation on input device 30 and gives an instruction to start sound synthesis, control device 10 gives an instruction to start signal generation to each signal generator 41a. Further, the control device 10 calculates a frame parameter corresponding to the content of the sound to be synthesized for each period having a predetermined time length (for example, about 5 ms to 30 ms) and outputs the frame parameter to the sound synthesis unit 40. As shown in FIG. 2, the frame parameters include an angular frequency ωi (ω1, ω2, ω3, and ω4), an initial phase pi (p1, p2, p3, and p4), and an amplitude value ai (a1, a2, a3, and a4). , As well as the pitch period T. The pitch period T is a time length corresponding to the pitch of the sound to be synthesized, and is supplied to the envelope processing unit 43. The angular frequency ωi and the initial phase pi are supplied to the signal generator 41a of each original signal output unit 41. That is, the angular frequency ω1 and the initial phase p1 are instructed to the signal generator 41a of the original signal output unit 41-1, and the angular frequency ω2 and the initial phase p2 are instructed to the signal generator 41a of the original signal output unit 41-2. And so on. The angular frequency ωi indicates the angular frequency of the periodic signal Sa to be output by the signal generator 41a of the original signal output unit 41-i. In the present embodiment, it is assumed that the angular frequency ω1 supplied to the signal generator 41a of the original signal output unit 41-1 is minimum, and increases as ω2, ω3, and ω4 continue. On the other hand, the initial phase pi indicates the phase of the periodic signal Sa to be output by the signal generator 41a of the original signal output unit 41-i at the start of the pitch cycle. The amplitude value ai is an amplitude value to be multiplied by the signal output from the signal generator 41a by the multiplier 41b, and is supplied to the multiplier 41b of each original signal output unit 41. For example, the amplitude value a1 is instructed to the multiplier 41b of the original signal output unit 41-1 and the amplitude value a2 is instructed to the multiplier 41b of the original signal output unit 41-2.
[0029]
The sound synthesizer 40 reflects the value of the frame parameter on the synthesized sound every time the start time of the pitch cycle arrives. Here, in FIG. 3A, the timing at which the frame parameter is supplied is indicated by a downward arrow. When the start time of the pitch cycle T arrives, the sound synthesizer 40 reflects the frame parameter supplied immediately before the synthesized sound to the synthesized sound. That is, of the frame parameters sequentially supplied at the timing shown in FIG. 3A, only the frame parameters supplied at the timing marked with “〇” affect the synthesized sound. FIG. 3A illustrates a case where the time interval at which the frame parameter is supplied is shorter than the time length of the pitch period T. However, the time interval at which the frame parameter is supplied is a predetermined time length according to the content of the sound to be synthesized, and may be longer than the pitch period T in some cases.
[0030]
On the other hand, in parallel with the output of the frame parameter by the control device 10, each original signal output unit 41 generates and outputs an original signal corresponding to the frame parameter. That is, the signal generator 41a of each of the original signal output units 41 outputs a periodic signal Sa of a type specified by the waveform selection data Ds and having the angular frequency ωi specified as a frame parameter. The output operation of the periodic signal Sa is performed every pitch period T. That is, each signal generator 41a starts outputting the periodic signal Sa from the start of the pitch period T. Further, each signal generator 41a sets the phase of the periodic signal Sa at the start of the pitch period to the initial phase pi specified as a frame parameter. The periodic signal Sa output from each signal generator 41a is output as an original signal Sb after having been multiplied by the amplitude value ai in the multiplier 41b.
[0031]
In the present embodiment, odd-numbered original signal output units 41-1 and 41-3 (hereinafter simply referred to as “odd-numbered original The values of the initial phases p1 and p3 specified to the signal output unit 41) are set to “0”. On the other hand, among the four original signal output units 41, even-numbered original signal output units 41-2 and 41-4 (hereinafter simply referred to as "even-numbered original signal output units 41") counting from the one having the lower angular frequency ωi. ) Are set to "π". Here, FIG. 4 is a timing chart showing a change in the phase of the periodic signal Sa in each of the original signal output units 41. In the figure, the horizontal axis represents time, and the vertical axis represents the phase of each periodic signal Sa. As shown in FIGS. 3 and 4, the phase of the periodic signal Sa in the odd-numbered original signal output unit 41 is updated to “0” each time the start point of the pitch period arrives, while the even-numbered original signal output The phase of the periodic signal Sb in the unit 41 is updated to “π” each time the start point of the pitch period arrives. As a result, the level of the original signal Sb output from the odd-numbered original signal output unit 41 increases immediately after the start of each pitch cycle, while the level of the original signal Sb output from the even-numbered original signal output unit 41 becomes It decreases immediately after the start of each pitch cycle (see FIG. 3).
[0032]
On the other hand, the original signals Sb output from the four original signal output units 41 are added by the adder 42 and then supplied to the envelope processing unit 43 as a signal Sc. The envelope processing unit 43 multiplies the signal Sc by the envelope generated by the envelope generator 43a, and outputs the signal obtained as a synthesized sound signal Sd. Here, the envelope generator 43a generates an envelope having the same time length as the pitch period T instructed by the control device 10 as a frame parameter. Then, the speaker 50 outputs a synthesized sound based on the synthesized sound signal Sd output from the envelope processing unit 43.
[0033]
As described above, in the present embodiment, the original signals Sb output from some of the four original signal output units 41 (the original signal output units 41-1 and 41-3) increase immediately after the start of the pitch period. On the other hand, other original signals (the original signals from the original signal output units 41-2 and 41-4) decrease immediately after the start of the pitch period. In other words, it is possible to avoid a situation where all the original signals increase (or decrease) at the same time immediately after the start of the pitch period. As a result, according to the present embodiment, a natural synthesized sound can be obtained by suppressing the bias of the amplitude value of the signal strength and the noise at the start of the pitch period shown in FIG. This point will be described in detail with reference to FIG.
[0034]
Here, FIG. 5A is a graph showing a waveform of the synthesized sound signal Sd output from the envelope processing unit 43, and FIG. 5B is a spectrogram of this signal Sd. In FIG. 5A, the horizontal axis represents time, and the vertical axis represents signal intensity. On the other hand, in FIG. 5B, the horizontal axis represents time, the vertical axis represents frequency, and the brightness of the color represents the distribution of signal intensity (brighter portions have higher signal intensity). As is clear from the comparison of FIG. 5A with FIG. 9A, in the present embodiment, the signal intensity is evenly distributed on both the “+” side and the “−” side based on the level “0”. are doing. This is because the original signal Sb output from the odd-numbered original signal output unit 41 increases immediately after the start of the pitch period, and the signal strength is biased to the “+” side. This is considered to be because the bias of the signal strength toward the “−” side due to the decrease of the original signal Sb output from the signal generator 41 immediately after the start of the pitch period is offset. Further, as shown in FIG. 5B, the synthesized sound signal Sd in the present embodiment is different from the conventional synthesized sound signal S shown in FIG. Noise) has been reduced. This is apparent from the fact that the waveform of the synthesized sound signal is continuous at the start of the pitch period, as shown in FIG. 5C in which FIG. 5A is enlarged in the time axis direction. As described above, according to the present embodiment, a natural synthesized sound can be obtained by suppressing the bias of the signal strength and the noise at the start of the pitch period shown in FIG. Filtering for suppressing noise at the start is unnecessary.
[0035]
Further, in the present embodiment, since one of a plurality of types of signals having different waveforms is selected and output as the periodic signal Sa, the sound quality (especially the timbre) of the synthesized sound obtained based on this is diversified. can do. In addition, since any one of the plurality of types of signals is selected by the user, a synthesized sound having the user's favorite sound quality can be obtained.
[0036]
<C: Modification>
The embodiment described above is merely an example, and various modifications can be made to this embodiment without departing from the spirit of the present invention. As a specific modification, for example, the following modes can be considered.
[0037]
<C-1: Modification 1>
In the above embodiment, the configuration in which the initial phase pi is set to “0” or “π” is exemplified, but the value of the initial phase pi is not limited to this. That is, the deviation of the signal strength toward the “+” side caused by the increase of the original signal output from the odd-numbered original signal output unit 41 immediately after the start of the pitch period, and the difference from the even-numbered original signal output unit 41 The deviation of the signal strength toward the "-" side due to the output original signal decreasing immediately after the start of the pitch period is canceled out, and the signal strength is evenly distributed on both sides based on the level "0". Therefore, it is desirable that the value of each initial phase pi is appropriately selected.
[0038]
Further, in the above-described embodiment, the configuration in which the phase of each original signal is controlled at the start point of the pitch cycle has been exemplified. However, the configuration for avoiding the situation where all the original signals increase at the start point of the pitch cycle at the same time. Is not limited to this. Instead of this configuration, for example, the following configuration can be adopted.
[0039]
(1) Aspect 1
The sign of the amplitude value indicated to the odd-numbered original signal output unit 41 may be different from the sign of the amplitude value indicated to the even-numbered original signal output unit 41. For example, in the configuration shown in FIG. 2, the signs of the amplitude values a1 and a3 are “+”, and the signs of the amplitude values a2 and a4 are “−”. Also in this configuration, the phase difference between the original signal from the odd-numbered original signal output unit 41 and the original signal from the even-numbered original signal output unit 41 is substantially shifted by "π". The waveform of the signal is the same as the waveform shown in FIG. Therefore, the same effects as in the above embodiment can be obtained.
[0040]
(2) Aspect 2
The signal output from the multiplier 41b of the odd-numbered original signal output unit 41 of the four original signal output units 41 and the signal output from the multiplier 41b of the even-numbered original signal output unit 41 are respectively encoded. May be multiplied by different envelopes and then output as an original signal. That is, as shown in FIG. 6, each of the four original signal output units 41 is provided with an envelope processing unit 41c for multiplying the output signal from the multiplier 41b by the envelope specified by the control device 10. Specifically, the envelope processing unit 41c of the odd-numbered original signal output unit 41 rises to the “+” side from the start of the pitch cycle, then decreases and reaches “0” at the end of the pitch cycle. An envelope is used. On the other hand, in the envelope processing unit 41c of the even-numbered original signal output unit 41, the envelope which falls to the “−” side from the start of the pitch cycle and then increases and reaches “0” at the end of the pitch cycle is generated. Used. Therefore, the original signal output from the odd-numbered original signal output unit 41 increases immediately after the start of the pitch period, while the original signal output from the even-numbered original signal output unit 41 decreases immediately after the start of the pitch period. It will be. That is, it is possible to avoid a situation in which all the original signals increase at the same time immediately after the start of the pitch period, so that the same effect as in the above embodiment can be obtained.
[0041]
Thus, the present invention employs a configuration in which the level of some of the plurality of original signals increases immediately after the start of the pitch cycle, while the level of the other original signals decreases immediately after the start of the pitch cycle. It suffices to have a configuration for setting the level of the original signal in this manner.
[0042]
<C-2: Modification 2>
In the above-described embodiment and the modified example, the configuration in which the sound synthesis unit 40 includes the four original signal output units 41 is illustrated, but the number of the original signal output units 41 is not limited thereto. In short, any configuration may be used as long as the plurality of original signal output units 41 are provided in the sound synthesis unit 40.
[0043]
In the above-described embodiment, the odd-numbered original signal output units 41 and the even-numbered original signal output units 41 counted from the plurality of original signal output units 41 whose angular frequency is smaller are the pitch periods. Although the configuration in which the increase / decrease of the original signal is made immediately after the start of the above is exemplified, the way of dividing the original signal output unit 41 is arbitrary. For example, when the number of the original signal output units 41 is four, a set including the first and fourth original signal output units 41 and a set including the second and third original signal output units 41 It is also possible to adopt a configuration in which the increase / decrease of the original signal immediately after the start of the pitch period is different for both sets. Alternatively, a configuration may be adopted in which one original signal output unit 41 and another original signal output unit 41 are divided and the increase / decrease of the two immediately after the start of the pitch cycle of the original signal is made different. In other words, if at least one of the plurality of original signal output units 41 and one or more other original signal output units 41 are configured to differ in the increase or decrease of the original signal immediately after the start of the pitch period. Is enough.
[0044]
<C-3: Modification 3>
In the above-described embodiment and each modified example, the case where the sound synthesis unit 40 is configured by the DSP is illustrated. However, the cooperation of hardware such as a CPU and a program executed by the CPU causes the sound synthesis unit 40 to output the original signal. Means (the original signal output unit 41) and means for adding the original signals to generate a synthesized sound signal (adder 42) may be realized.
[0045]
【The invention's effect】
As described above, according to the present invention, a natural sound can be synthesized with a simple configuration.
[Brief description of the drawings]
FIG. 1 is a block diagram illustrating a configuration of a sound synthesis device according to an embodiment of the present invention.
FIG. 2 is a block diagram showing a configuration of a sound synthesizer in the sound synthesizer.
FIG. 3 is a timing chart showing signals output from a signal generator of each output unit.
FIG. 4 is a timing chart showing a phase of a signal output from a signal generator of each output unit.
FIG. 5 is a diagram illustrating a waveform and a spectrogram of a synthesized sound signal.
FIG. 6 is a block diagram showing a configuration of a sound synthesizer according to a modification of the embodiment.
FIG. 7 is a block diagram showing a configuration of a conventional sound synthesizer.
FIG. 8 is a timing chart showing waveforms of signals used for processing in a conventional sound synthesizer.
FIG. 9 is a diagram illustrating a waveform and a spectrogram of a conventional synthesized sound signal.
[Explanation of symbols]
100 sound synthesizer, 10 control device (instruction means), 20 storage device, 30 input device, 40 sound synthesizer, 50 speaker, 41 (41-1 and 41-2) , 41-3, 41-4) original signal output unit (output means), 41a signal generator (signal generating means), 41b multiplier, 41c, 43 ... envelope processing unit, 42 ... Adder (synthesized sound generating means), 43... Envelope processing unit, Sa... Periodic signal, Sb... Original signal, Sd.

Claims (8)

レベルが周期的に変化する原信号を、生成されるべき合成音の音高に応じた時間長であるピッチ周期ごとに出力する複数の出力手段と、
前記複数の出力手段から出力された原信号を加算することによって、合成音を表す合成音信号を生成する合成音生成手段と、
前記複数の出力手段の各々に対して当該出力手段が出力すべき原信号を指示する手段であって、前記複数の出力手段のうち一部の出力手段から出力される原信号のレベルが前記ピッチ周期の開始直後において増加する一方、他の出力手段から出力される原信号のレベルが前記ピッチ周期の開始直後において減少するように、前記各出力手段に対して指示を与える指示手段と
を具備することを特徴とする音合成装置。
A plurality of output means for outputting an original signal whose level periodically changes, for each pitch period having a time length corresponding to a pitch of a synthesized sound to be generated,
Synthetic sound generating means for generating a synthetic sound signal representing a synthetic sound by adding the original signals output from the plurality of output means,
Means for instructing each of the plurality of output means an original signal to be output by the output means, wherein the level of the original signal output from some of the plurality of output means is equal to the pitch Instruction means for giving an instruction to each of the output means so that the level of the original signal output from the other output means decreases immediately after the start of the pitch cycle while increasing immediately after the start of the cycle. A sound synthesizer characterized by the above.
前記指示手段は、前記一部の出力手段から出力される原信号と前記他の出力手段から出力される原信号とにおいて前記ピッチ周期の開始時点における位相が異なるように、前記各出力手段に対して原信号の位相を指示することを特徴とする請求項1に記載の音合成装置。The instructing means is configured such that the original signal output from the some output means and the original signal output from the other output means have different phases at the start of the pitch period, 2. The sound synthesizing device according to claim 1, wherein the phase of the original signal is indicated by using the signal. 前記各出力手段は、レベルが周期的に変化する信号に振幅値を乗算し、これにより得られた信号を前記原信号として出力する一方、
前記指示手段は、前記一部の出力手段と前記他の出力手段とに対し、当該各出力手段における乗算に供される振幅値として、符号が異なる振幅値をそれぞれ指示することを特徴とする請求項1に記載の音合成装置。
Each of the output means multiplies a signal whose level periodically changes by an amplitude value, and outputs a signal obtained thereby as the original signal.
The instructing means instructs the partial output means and the other output means, respectively, with amplitude values having different signs as amplitude values to be used for multiplication in the respective output means. Item 2. The sound synthesizer according to Item 1.
前記各出力手段は、前記ピッチ周期に相当する時間長を有するとともに前記原信号の振幅値の時間的な変化を表すエンベロープを、レベルが周期的に変化する信号に反映させ、これにより得られた信号を前記原信号として出力する一方、
前記指示手段は、前記一部の出力手段と前記他の出力手段とに対し、各々の示す振幅値の符号が異なるエンベロープをそれぞれ指示する
ことを特徴とする請求項1に記載の音合成装置。
Each of the output means has a time length corresponding to the pitch period and reflects an envelope representing a temporal change in the amplitude value of the original signal in a signal whose level periodically changes. While outputting the signal as the original signal,
2. The sound synthesizer according to claim 1, wherein the instruction unit instructs the partial output unit and the other output unit with envelopes each having a different sign of the amplitude value indicated. 3.
前記複数の出力手段は、それぞれ角周波数が異なる原信号を出力するものであり、
前記一部の出力手段は、前記複数の出力手段のうち出力する原信号の角周波数が小さいものから数えて奇数番目に相当する1以上の出力手段であり、前記他の出力手段は、前記複数の出力手段のうち出力する原信号の角周波数が小さいものから数えて偶数番目に相当する1以上の出力手段である
ことを特徴とする請求項1から4のいずれかに記載の音合成装置。
The plurality of output units output original signals having different angular frequencies, respectively.
The part of the output means is one or more output means corresponding to an odd number of the plurality of output means, which counts from the lowest angular frequency of the original signal to be output, and the other output means includes the plurality of output means. 5. The sound synthesizing apparatus according to claim 1, wherein said output means is one or more output means corresponding to an even number counted from the one having a lower angular frequency of the output original signal.
前記各出力手段は、それぞれ波形が異なる複数種類の信号を生成し得る信号発生手段を備えるとともに、当該信号発生手段によって生成された信号に基づいて前記原信号を出力するものであり、
前記指示手段は、前記各出力手段に対して、前記複数種類の信号のうちいずれかを当該出力手段の信号発生手段が生成すべき信号として指示する
ことを特徴とする請求項1から5のいずれかに記載の音合成装置。
Each of the output units includes a signal generation unit capable of generating a plurality of types of signals having different waveforms, and outputs the original signal based on the signal generated by the signal generation unit.
6. The apparatus according to claim 1, wherein the instructing unit instructs each of the plurality of types of signals as a signal to be generated by the signal generating unit of the outputting unit. A sound synthesizing device according to any of the claims.
前記指示手段は、前記各出力手段に対して、前記複数種類の信号のうち利用者によって選択された信号を当該出力手段の信号発生手段が生成すべき信号として指示する
ことを特徴とする請求項6に記載の音合成装置。
2. The method according to claim 1, wherein the instruction unit instructs the output unit to select a signal selected by a user from the plurality of types of signals as a signal to be generated by the signal generation unit of the output unit. 7. The sound synthesizer according to 6.
コンピュータを、
レベルが周期的に変化する原信号を、生成されるべき合成音の音高に応じた時間長であるピッチ周期ごとに出力する複数の出力手段と、
前記複数の出力手段から出力された原信号を加算することによって、合成音を表す合成音信号を生成する合成音生成手段と、
前記複数の出力手段の各々に対して当該出力手段が出力すべき原信号を指示する手段であって、前記複数の出力手段のうち一部の出力手段から出力される原信号のレベルが前記ピッチ周期の開始直後において増加する一方、他の出力手段から出力される原信号のレベルが前記ピッチ周期の開始直後において減少するように、前記各出力手段に対して指示を与える指示手段と
として機能させるためのプログラム。
Computer
A plurality of output means for outputting an original signal whose level periodically changes, for each pitch period having a time length corresponding to a pitch of a synthesized sound to be generated,
Synthetic sound generating means for generating a synthetic sound signal representing a synthetic sound by adding the original signals output from the plurality of output means,
Means for instructing each of the plurality of output means an original signal to be output by the output means, wherein the level of the original signal output from some of the plurality of output means is equal to the pitch Function as instruction means for giving an instruction to each output means so that the level of the original signal output from another output means decreases immediately after the start of the pitch cycle while increasing immediately after the start of the cycle. Program for.
JP2003060515A 2003-03-06 2003-03-06 Sound synthesis apparatus and program Expired - Fee Related JP3888315B2 (en)

Priority Applications (6)

Application Number Priority Date Filing Date Title
JP2003060515A JP3888315B2 (en) 2003-03-06 2003-03-06 Sound synthesis apparatus and program
TW093105888A TWI254276B (en) 2003-03-06 2004-03-05 Sound synthesizer and recording medium to record the program
KR1020040015257A KR100620484B1 (en) 2003-03-06 2004-03-06 Sound synthesizing device and storage medium storing program
CNB2004100282324A CN100565667C (en) 2003-03-06 2004-03-08 Speech synthesizing device
CNU2004200079068U CN2699429Y (en) 2003-03-06 2004-03-08 Sound synthesizing apparatus and storage media with stored program
HK05101891.3A HK1068185A1 (en) 2003-03-06 2005-03-04 Sound synthesizing device

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2003060515A JP3888315B2 (en) 2003-03-06 2003-03-06 Sound synthesis apparatus and program

Publications (2)

Publication Number Publication Date
JP2004271750A true JP2004271750A (en) 2004-09-30
JP3888315B2 JP3888315B2 (en) 2007-02-28

Family

ID=33123035

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2003060515A Expired - Fee Related JP3888315B2 (en) 2003-03-06 2003-03-06 Sound synthesis apparatus and program

Country Status (5)

Country Link
JP (1) JP3888315B2 (en)
KR (1) KR100620484B1 (en)
CN (2) CN2699429Y (en)
HK (1) HK1068185A1 (en)
TW (1) TWI254276B (en)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113362864A (en) * 2021-06-16 2021-09-07 北京字节跳动网络技术有限公司 Audio signal processing method, device, storage medium and electronic equipment

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100957710B1 (en) * 2008-05-22 2010-05-13 주식회사 다날 an apparatus for receiving star voice messages
KR100968090B1 (en) * 2008-05-27 2010-07-05 한국과학기술원 Programable sound synthesis apparatus and programable sound synthesis method

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113362864A (en) * 2021-06-16 2021-09-07 北京字节跳动网络技术有限公司 Audio signal processing method, device, storage medium and electronic equipment
CN113362864B (en) * 2021-06-16 2022-08-02 北京字节跳动网络技术有限公司 Audio signal processing method, device, storage medium and electronic equipment

Also Published As

Publication number Publication date
CN100565667C (en) 2009-12-02
TWI254276B (en) 2006-05-01
HK1068185A1 (en) 2005-04-22
CN2699429Y (en) 2005-05-11
JP3888315B2 (en) 2007-02-28
TW200425056A (en) 2004-11-16
KR20040079330A (en) 2004-09-14
CN1527279A (en) 2004-09-08
KR100620484B1 (en) 2006-09-13

Similar Documents

Publication Publication Date Title
JP4702392B2 (en) Resonant sound generator and electronic musical instrument
JP5104553B2 (en) Impulse response processing device, reverberation imparting device and program
JP3888315B2 (en) Sound synthesis apparatus and program
JP4736046B2 (en) Waveform data production method, waveform data production apparatus, program, and waveform memory production method
JP4649888B2 (en) Voice effect imparting device and voice effect imparting program
JP4385401B2 (en) Low frequency oscillation device and low frequency oscillation processing program
JP2010190990A (en) Impulse response modification device, reverberation adding device and program
JP3430719B2 (en) Apparatus and method for setting parameters of musical sound synthesizer
JP3715069B2 (en) Music signal synthesis method and apparatus, and recording medium
JP3844214B2 (en) Modulation waveform generator
JP4179243B2 (en) Waveform generator and program
JP3898944B2 (en) Electronic musical instruments
JP5909416B2 (en) Tempo sound generator and tempo sound generator
JP2009025476A (en) Additive synthesis sound source device and its control method
JP3489713B2 (en) Musical sound synthesizer and method
JP5035388B2 (en) Resonant sound generator and electronic musical instrument
JP3556423B2 (en) A tone control device for electronic musical instruments using a harmonic synthesis type sound source.
JP3752855B2 (en) Waveform data creation method
JP3646854B2 (en) Music synthesizer
Tubb Controlling rhythm in the frequency domain
JP2022049019A (en) Electronic musical instrument, musical tone generation method and program
JP4172369B2 (en) Musical sound processing apparatus, musical sound processing method, and musical sound processing program
JP3125626B2 (en) Music signal synthesizer
JP2010190989A (en) Impulse response modification device, reverberation adding device and program
JP2007034099A (en) Musical sound synthesizer

Legal Events

Date Code Title Description
A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20060328

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20060425

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20060626

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20060815

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20061012

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20061107

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20061120

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

S531 Written request for registration of change of domicile

Free format text: JAPANESE INTERMEDIATE CODE: R313532

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20101208

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20101208

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20111208

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20111208

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20121208

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20131208

Year of fee payment: 7

LAPS Cancellation because of no payment of annual fees