JP5479823B2

JP5479823B2 - 効果装置

Info

Publication number: JP5479823B2
Application number: JP2009201008A
Authority: JP
Inventors: 高博阿江
Original assignee: Roland Corp
Current assignee: Roland Corp
Priority date: 2009-08-31
Filing date: 2009-08-31
Publication date: 2014-04-23
Anticipated expiration: 2029-08-31
Also published as: JP2011053371A; US8457969B2; US20110054886A1

Description

本発明は効果装置に関し、特に、歌唱の特徴であるしゃくりを模擬する頻度や態様を、実際の歌唱に似せることで、歌唱の斉唱効果（ダブリング効果）を効果的に得ることができる効果装置に関するものである。

従来、入力された音声信号に効果を付与した効果音声信号を生成し、その効果音声信号を入力された音声信号と混合することで、入力された楽音信号に対して（単独の歌唱に対して）、あたかも複数人で同じメロディを歌唱しているような効果（斉唱効果、またはダブリング効果）を付与する効果装置（ダブリングエフェクタ）が知られている。また、ＣＤなどのレコーディング現場では、通常の単独歌唱に対して、その単独歌唱をダブリングエフェクタに通して得た効果音を、例えば歌唱で盛り上がるサビの部分で元の単独歌唱に付与して、サビの部分の歌声が特に浮きだって聴こえるような効果をつけることも一般的に行なわれている。このようなアプリケーションで使用されるダブリングエフェクタでは、一般的に、まず入力された音声信号に遅延をかけることが行なわれる。遅延をかけた音声信号をもとの音声信号に混合することで、手軽に斉唱効果を得ることが出来ることは公知の手法である。しかし、単に遅延効果のみを常に一定の割合で歌唱に与えるだけの変調で得られる効果音では、得られる斉唱効果は単調であり機械的で面白みに欠ける。

このような単調さをなくして、より人間の歌唱による斉唱効果のような変化に富んだ斉唱効果を得るために、さらにいくつかの手法が導入されている。例えば、特許３９０３９７５号記載の楽音処理装置で示されるように、歌唱の歌い始め（アタック）を検出し、その歌唱の歌い始め部分で入力された音声信号のピッチを大きく変化させて、しゃくり効果を模擬した効果音声信号を生成する手法がある。この手法では、入力された音声信号の音量レベルを検出し、その音量レベルが、閾値未満から閾値以上に変化した場合にのみ、入力された音声信号のピッチを大きく変化させて、しゃくり効果を模擬した効果音声信号を生成している。このような手法は、人間の歌唱の特徴を模擬することで、より自然な斉唱効果を得ようとするアプローチである。なお、ここで言う「しゃくり」とは、歌の歌い始めにおいて、歌唱のピッチが本来のピッチから若干外れ、時間の経過と共に、歌手が自ら発した歌声のピッチを耳で聴いて、自らの歌唱のピッチを、歌唱（発声）を持続させながら本来のピッチに収束させていく一種のフィードバック現象を示すものである。

特許３９０３９７５号記載の楽音処理装置は、上記以外にも、次のようにして、ダブリングエフェクタの効果音声信号を生成している。即ち、入力された音声信号を分析して、入力された音声信号のピッチ、音量レベルおよびスペクトルの抽出を行う。そして、抽出したスペクトルから、入力された音声信号が有声音か無声音かの判別を行い、無声音である場合には、入力された音声信号のピッチや音量レベルに対して擬似ランダム信号による変調を行い、ダブリングエフェクタの効果音声信号を生成している。なお、有声音とは、母音（ａ，ｉ，ｕ，ｅ，ｏの各音）に加え、破裂音の一部（ｂ，ｄ，ｇの各音）、摩擦音の一部（ｖ，ｚの各音）、鼻音（ｍ，ｎの各音）、流音（ｌ，ｒの各音）を示し、無声音とは、破裂音の一部（ｐ，ｔ，ｋの各音）および摩擦音の一部（ｆ，ｓ）を示している。

特許３９０３９７５号

従来のダブリングエフェクタによると、前述したように、しゃくりを模擬した効果を含む効果音声信号は、入力された音声信号の音量レベルが閾値未満から閾値以上に変化した場合にのみ生成される。よって、入力された入力信号の音量レベルが閾値以上の状態が続くとき、すなわち歌唱が継続して行なわれている状態（歌い続けている途中の状態）では、効果音声信号が生成されず、しゃくりを模擬することができない。ところが、実際の歌唱では、音量レベルが閾値以上の状態が続く歌唱の途中であっても、例えばある音節における子音から母音に切り換わるときなどのタイミングで、しゃくりが発生する場合があることがわかっている。つまり、従来のダブリングエフェクタが斉唱効果を付与する場合、従来技術では、しゃくりを模擬する頻度が実際の歌唱と比べて低いため、効果音声信号を元の歌唱に混合して得られる、一人の歌唱による斉唱効果が効果的に得られないという問題点があった。

また、特許３９０３９７５号記載の楽音処理装置では、入力された音声信号が無声音である場合に、ダブリングエフェクタの効果音声信号を生成している。よって、入力された音声信号が、有声音から有声音へ変化する状態では、具体的には、例えば、鼻音や流音から母音へ変化する状態では、効果音声信号が生成されない。つまり、従来技術では、ダブリング効果を得る頻度は限られており、効果音声信号をもとの歌唱に混合して得られる、一人の歌唱による斉唱効果が効果的に得られないという問題点があった。

本発明は、上述した問題点を解決するためになされたものであり、しゃくりを模擬する頻度を高めて、実際の歌唱の特徴をより正確に模擬することにより、一人の歌唱による斉唱効果を効果的に得ることができる効果装置を提供することを目的としている。

この目的を達成するために請求項１記載の効果装置は、音声信号が入力される入力手段と、その入力手段から入力された音声信号を所定タイミング毎に取得し、その取得した音声信号に効果を付与する効果付与手段と、その効果付与手段により効果が付与された音声信号である効果音声信号を、前記入力手段から入力された音声信号と混合して出力する出力手段とを備えたものであって、前記効果付与手段は、前記入力手段に入力された音声信号が母音または子音であるかを前記所定タイミングに対応して判別する判別手段と、その判別手段により判別された音声信号が、子音から母音へ切り換わったことを検出する検出手段と、少なくとも、前記音声信号の子音から母音への切り換わりが前記検出手段によって検出された場合に、前記所定タイミングで取得される音声信号のピッチを変更する変更手段と、その変更手段により前記音声信号のピッチが変更される場合、前記音声信号のピッチの変更量を、所定の関数で示される度合いで規定量に収束させる収束手段と、その収束手段により前記ピッチの収束が行われている音声信号を前記効果音声信号として前記出力手段へ出力する出力実行手段とを備えている。

請求項２記載の効果装置は、請求項１記載の効果装置において、前記効果付与手段は、前記音声信号の子音から母音への切り換わりが前記検出手段によって検出される場合に、その母音へ切り換わった前記音声信号の振幅を検出し、その検出した振幅が第１閾値以上であるかを判定する振幅判定手段を備え、前記変更手段は、前記母音へ切り換わる音声信号の振幅が第１閾値以上であると前記振幅判定手段によって判定された場合に、前記所定タイミングで取得される音声信号のピッチを変更する。なお、振幅は、音量レベルを示している。

請求項３記載の効果装置は、請求項１または２に記載の効果装置において、前記効果付与手段は、前記入力手段に入力された音声信号が母音であると前記判別手段により判別された場合に、その入力された母音の音声信号における振幅が第２閾値以上であるかを判定する母音振幅判定手段と、前記入力された母音の音声信号における振幅が前記第２閾値以上であると前記母音振幅判定手段によって判定された場合に、前記判別手段により前回判別された音声信号も母音であったかを検出する連続母音検出手段と、前回判別された音声信号も母音であったと前記連続母音検出手段によって検出された場合に、前記入力された母音の音声信号における振幅増加量を検出し、その検出した振幅増加量が所定値以上であるかを判定する振幅増加量判定手段とを備え、前記変更手段は、前記入力された母音の音声信号における振幅増加量が所定値以上であると前記振幅増加量判定手段により判定された場合に、前記所定タイミングで取得される音声信号のピッチを変更する。なお、第２閾値は、請求項２記載の第１閾値と同一値であっても良いし、前記第１閾値とは異なる値であっても良い。

請求項４記載の効果装置は、請求項３記載の効果装置において、前記効果付与手段は、前記入力された母音の音声信号における振幅が前記第２閾値よりも小さいと前記母音振幅判定手段によって連続して判定され続けた時間と、前記入力手段に入力された音声信号が子音であると前記判別手段によって連続して判別され続けた時間との合計時間を計時する計時手段と、その計時手段により計時された前記合計時間が所定時間を超えたかを判定する計時判定手段とを備え、前記変更手段は、前記合計時間が前記所定時間を超えたと前記計時判定手段によって判定された場合に、前記所定タイミングで取得される音声信号のピッチ変更を許可する時間判定許可手段を備えている。

請求項１記載の効果装置によれば、少なくとも、音声信号の子音から母音への切り換わりが検出手段によって検出された場合には、所定タイミングで取得される音声信号のピッチが変更手段によって変更される。このとき、変更手段により変更された楽音信号のピッチの変更量は、所定の関数で示される度合いで収束手段によって規定量に収束される。この収束手段によりピッチの収束が行われている音声信号は、出力実行手段によって、効果音声信号として出力手段へ出力される。そして、出力手段は、この効果音声信号を、入力手段から入力された音声信号と混合して出力する。このように、音声信号の子音から母音への切り換わりが検出手段によって検出された場合には、所定タイミングで取得される音声信号のピッチを変更することで、しゃくりを模擬した効果を含む効果音声信号（以下、効果音声信号Ａと称する）を生成することができる。ここで、子音とは、母音（ａ，ｉ，ｕ，ｅ，ｏの各音）以外の音、即ち、破裂音（ｂ，ｄ，ｇ，ｐ，ｔ，ｋの各音）、摩擦音（ｖ，ｚ，ｆ，ｓの各音）、鼻音（ｍ，ｎの各音）、流音（ｌ，ｒの各音）である。よって、音声信号の子音から母音への切り換わりが検出手段によって検出されさえすれば、入力された入力信号の音量レベルに関係なく、その切り換わりが、例えば、有声音である鼻音や流音から有声音である母音へ変化する状態であっても、しゃくりを模擬した効果を含む効果音声信号Ａを生成することができる。従って、しゃくりを模擬する頻度を高め、歌唱の斉唱効果（ダブリング効果）を効果的に得ることができるという効果がある。なお、規定量は、変更量よりも少ない量を示しており、ゼロを例示することができる。これは、請求項３も同様である。

請求項２記載の効果装置によれば、請求項１記載の効果装置の奏する効果に加え、子音から母音へ切り換わる音声信号の振幅が第１閾値以上であると振幅判定手段によって判定された場合、変更手段により、所定タイミングで取得される音声信号のピッチが変更変更される。よって、音声信号が子音から母音へ切り換わる場合でも、その母音の振幅が、即ち、母音の音量レベルが、第１閾値以上となる大きさのときに限って、効果音声信号Ａを生成することができる。よって、請求項１記載の効果装置で生成するしゃくりを模擬した効果を含む効果音声信号Ａと比較して、しゃくりを模擬した効果を得る頻度は減ることになるが、逆にこれは、本来の人間の歌唱で実際に発生するしゃくりの頻度により近づく結果となり都合が良い。なぜならば、実際の歌唱では、歌手がしゃくりを入れる場所は通常、歌い始めや、歌の途中で感情を込めてある程度の大きな声でお腹で声を支えながらしっかりとアクセントをつけて歌う箇所に集中しており、歌の途中で比較的小さな声で軽くさらりと流して歌う箇所には通常しゃくりが入らないことは、歌唱を分析的に鑑賞することで容易に認識できる周知の事実であり、請求項２記載の効果装置は、このような歌唱の特性をほぼ正確に模擬するものだからである。従って、子音から母音へ切り換わる音声信号の振幅に関わらず、音声信号が子音から母音へ切り換わる度に、毎回しゃくりを模擬した効果を含む効果音声信号Ａを生成する場合と比較して、しゃくりを模擬した効果を含む効果音声信号Ａの生成の頻度を、違和感のない範囲に留めることができるという効果がある。

請求項３記載の効果装置によれば、請求項１または２に記載の効果装置の奏する効果に加え、入力された母音の音声信号における振幅が第２閾値以上であると母音振幅判定手段によって判定された場合には、連続母音検出手段は、判別手段により前回判別された音声信号も母音であったかを検出する。そして、前回判別された音声信号も母音であったと連続母音検出手段によって検出された場合には、振幅増加量判定手段は、入力された母音の音声信号における振幅増加量を検出し、その検出した振幅増加量が所定値以上であるかを判定する。その後、入力された母音の音声信号における振幅増加量が所定値以上であると振幅増加量判定手段により判定された場合には、所定タイミングで取得される音声信号のピッチが変更手段によって変更される。このとき、変更手段により変更された楽音信号のピッチの変更量は、所定の関数で示される度合いで収束手段によって規定量に収束される。この収束手段によりピッチの収束が行われている音声信号を、出力実行手段は、出力手段に出力させる。このように、判別手段により前回判別された音声信号も母音であり、入力された母音の音声信号における振幅が第２閾値以上である上に、入力された母音の音声信号における振幅増加量が所定値以上であった場合には、所定タイミングで取得される音声信号のピッチを変更する。よって、音声信号が子音から母音へと変化しない場合においても、その前後の母音の音声レベルが第２閾値以上となる大きさであり、且つ、その変化した母音の振幅増加量が所定値以上であるときには、しゃくりを模擬した効果を含む効果音声信号Ａを生成することができる。よって、音声信号が子音から母音へと変化する場合のみならず、音声信号が上述した条件を満たした上で母音から母音へと変化する場合にも、しゃくりを模擬した効果を付与して、その頻度を高めることができるという効果がある。

請求項４記載の効果装置によれば、請求項３記載の効果装置の奏する効果に加え、計時手段は、入力された母音の音声信号における振幅が第２閾値よりも小さいと母音振幅判定手段によって連続して判定され続けた時間と、入力手段に入力された音声信号が子音であると判別手段によって連続して判別され続けた時間との合計時間を計時する。そして、計時判定手段は、計時手段により計時された合計時間が所定時間を超えたかを判定する。その結果、合計時間が所定時間を超えたと計時判定手段によって判定された場合には、時間判定許可手段は、所定タイミングで取得される音声信号の変更手段によるピッチ変更を許可する。このように、計時手段により計時された合計時間が所定時間を超えた場合に限り、時間判定許可手段は、所定タイミングで取得された音声信号の変更手段によるピッチ変更を許可して、しゃくりを模擬した効果を含む効果音声信号Ａの生成を許可する。よって、計時手段により計時された合計時間が所定時間を超えたかを判定することなく、しゃくりを模擬した効果を含む効果音声信号Ａを生成する場合、即ち、音声信号が子音から母音へ切り換わる度に、或いは、音声信号が請求項２の条件を満たした上で子音から母音へと変化する度に、または請求項３記載の条件を満たした上で母音から母音へと変化する度に、頻繁に、しゃくりを模擬した効果を含む効果音声信号Ａを生成する場合と比較して、しゃくりを模擬した効果を含む効果音声信号Ａの生成の頻度は減ることになるが、逆にこれは、本来の人間の歌唱で実際に発生するしゃくりの頻度により近づく結果となり都合が良い。なぜならば、これもまた、実際の歌唱でのしゃくり発生の頻度により近づける効果的な手法であるからである。実際の歌唱では、歌手がしゃくりを入れる場合は、しゃくりを効果的に歌唱効果として生かすために、歌い始めの音節、あるいは歌詞が続く途中の音節において十分な時間をかけてしゃくりを入れる場合がほとんどである。テンポ１２０位のミディアムテンポの曲の歌唱を例に取ると、しゃくりの長さ（しゃくりが開始してから収束するまでの継続時間）は、通常８分音符程度かそれ以上の十分な長さをかけてじっくりと付与される。特にこぶしを利かすことで歌唱の雰囲気を盛り上げる手法を取ることが多い演歌の歌唱ではこの傾向が顕著に観察できる。また、歌唱の途中にしゃくりを連続して各音節に入れることは不自然であり、思いを込めてここぞと思う箇所にだけ入れることが歌唱の一つのテクニックである。これより、歌唱中で発生するしゃくりの前後では別のしゃくりは連続して発生することが稀だということがわかる。また、別の観点からしゃくりを分析すると、１つの音節のしゃくり効果に十分な時間がかかるということは、しゃくりの発生する時間間隔という観点からは、しゃくりは短い音節では発生することが少ないということである。例えばミディアムテンポの歌唱において、１６分音符のタイミングで連続的に歌唱される場合は、しゃくり効果を付与することは稀である。これらの傾向は、しゃくりを入れる歌唱を分析的に鑑賞することで容易に認識できる周知の事実であり、請求項４記載の効果装置は、このような歌唱の特性をほぼ正確に模擬するものだからである。以上より、請求項４に記載の効果装置は、しゃくり発生の頻度を違和感のない範囲に留めることができるという効果がある。

本発明の効果装置の一例であるダブリングエフェクタの電気的構成を示したブロック図である。ＤＳＰで実行される信号処理を、機能ブロックを用いて模式的に示した図である。ＤＳＰで実行される信号処理であるダブリング処理を示したフローチャートである。可変遅延部で実行される可変遅延処理を示したフローチャートである。

以下、本発明の好ましい実施例について、添付図面を参照して説明する。図１は、本発明の効果装置の一例であるダブリングエフェクタ１の電気的構成を示したブロック図である。このダブリングエフェクタ１は、従来の一般的なダブリングエフェクタと比較して、しゃくりを模擬する頻度を高めることができるものである。

ダブリングエフェクタ１は、アナログデジタルコンバータ（以下、「Ａ／Ｄコンバータ」と称す）１１と、デジタルシグナルプロセッサ（以下、「ＤＳＰ」と称す）１２と、デジタルアナログコンバータ（以下、「Ｄ／Ａコンバータ」と称す）１３と、ＣＰＵ１４と、ＲＯＭ１５と、ＲＡＭ１６と、表示器１７と、操作子１８とを有している。

Ａ／Ｄコンバータ１１は、ＩＮ端子から入力された音声信号を、アナログ信号からデジタル信号へ変換して、ＤＳＰ＿ＩＮ端子へ出力するコンバータである。ＤＳＰ１２は、ＤＳＰ＿ＩＮ端子から入力された音声信号（デジタル信号）を分配し、分配した一方の音声信号（デジタル信号）に効果を付与し、その効果を付与した音声信号である効果音声信号（デジタル信号）を、分配した他方の音声信号（デジタル信号）と混合して、ＤＳＰ＿ＯＵＴ端子へ出力するプロセッサである。Ｄ／Ａコンバータ１３は、ＤＳＰ＿ＯＵＴ端子から入力された混合信号（音声信号と効果音声信号とが混合された信号）を、デジタル信号からアナログ信号へ変換して、ＯＵＴ端子へ出力するコンバータである。

なお、ＤＳＰ１２には、制御端子と書込端子と取得端子とが更に設けられている。制御端子は、ＤＳＰ１２の各種制御を行うＣＰＵ１４からの制御信号を入力する端子であり、各素子１４〜１８が接続されている。ここで、ＣＰＵ１４は、ＤＳＰ１２および各素子１５〜１８を制御する中央制御装置である。ＲＯＭ１５は、このダブリングエフェクタ１で実行される制御プログラム等を格納した書換不能なメモリである。図３で後述するＤＳＰ１２による信号処理は、制御プログラムとして、ＲＯＭ１５に記憶されている。ＲＡＭ１６は、各種のデータを一時的に記憶するためのメモリである。ＲＡＭ１６には、データを入力する入力端子とデータを出力する出力端子が設けられている。入力端子には、ＤＳＰ１２の書込端子が接続されている。ここで、ＲＡＭ１６のうち、ＤＳＰ１２の書込端子から入力端子を介して入力される音声信号が読み書きされる音声信号バッファ部分は、リングバッファで構成される。なお、リングバッファの読み書き動作を制御することによって、記憶された信号の遅延やピッチ変化を得ることは公知である。この音声信号バッファでは、予め定められた書込アドレスポインタの書込速度（単位時間当たりの書込アドレス歩進数）に対応して、書込端子から出力される音声信号（ＤＳＰ＿ＩＮ端子から入力された音声信号）が、出力の時間順に連続して記憶される。（なお、以後、ＲＡＭ１６に記憶された音声信号を、「分割音声信号」と称す。）また、ＲＡＭ１６の出力端子には、ＤＳＰ１２の読出端子が接続されている。これにより、ＤＳＰ１２は、読出アドレスポインタの読出速度（単位時間当たりの読出アドレス歩進数）に対応して、分割音声信号を、読出端子を介してＲＡＭ１６から連続して読出すことができる。この時、読出アドレスポインタの読出アドレスを書込ポイントのアドレスよりも前のアドレスを指定することで遅延が生じ、また、読出アドレスポインタによる読出速度を書込アドレスポインタによる書込速度よりも早くすることでピッチが上がり、逆に遅くすることでピッチが下がる。

表示器１７は、ダブリングエフェクタ１の設定状態や動作状態等の各種状態を表示するＬＣＤである。操作子１８は、ダブリングエフェクタ１の設定変更や動作変更等の各種変更の操作を行う入力装置である。

次に、図２を参照して、ＤＳＰ１２の信号処理について説明する。図２は、ＤＳＰ１２で実行される信号処理を、機能ブロックを用いて模式的に示した図である。ＤＳＰ１２は、機能ブロックとして、子音判別部２１と、レベル検出部２２と、効果音声制御部２３と、可変遅延部２４と、ランダム信号発生部２５と、固定遅延部２６と、クロスフェード部２７と、ミキサ２８と、振幅制御部２９と、音声信号アンプ３０と、最終段ミキサ３１とを有している。

なお、本実施形態のダブリングエフェクタ１は、特に一人歌唱の場合に自然な斉唱効果を得ることに重点を置いたものである。この自然な斉唱効果を得るための効果音声信号に求められる要素として、大きく分けて次の４つが考えられる。まず、第１の要素として、タイミングのずれ（遅延）が考えられる。この要素は、可変遅延部２４、固定遅延部２６で実現している。第２の要素として、ビブラート（ピッチ変動１）が考えられる。この要素は、可変遅延部２４中のビブラート処理で実現している。第３の要素として、しゃくり（ピッチ変動２）が考えられる。この要素は、可変遅延部２４中のしゃくり初期値設定処理およびしゃくり減衰設定処理で実現している。最後に、第４の要素として、音量のゆらぎ（レベル変動）が考えられる。この要素は、振幅制御部２９で実現している。本実施形態におけるダブリングエフェクタ１は、上述した４つの要素（タイミングのずれ、ビブラート、しゃくり、音量のゆらぎ）を、それぞれ図２に示したブロックで実現している。この４つの要素のうち、ビブラート、しゃくり、音量のゆらぎについては、ランダム信号発生部２５からのランダム信号を受けて、それぞれランダムに変動が発生するような構成としている。また、タイミングのずれについては、後述するように、しゃくり効果のしゃくり初期値としゃくり減衰関数とをランダムに設定する結果として、しゃくりが発生した場合にランダムな遅延が発生することになる。歌手の歌唱を注意深く聴くと、同じ歌手が同じ曲の同じ歌詞を繰返し歌うたびに毎回ニュアンスが異なって聴こえるが、これは上述した４つの要素が、繰返し歌うたびにランダムに発生していることによるものとみなすことができる。これは、歌手の歌唱というものが持つ本質的な特徴と考えてもよい。歌手が人間である以上、上述の４つの歌唱のニュアンスをまったく同じように再現することはきわめて困難であり、厳密に言えば２度と同じニュアンスを持った歌唱をすることはできないのである。以上より、上記のようなランダム変動を持つ構成を取ることは、ダブリングエフェクトの効果をより自然なものにするアプローチであり、本実施形態のダブリングエフェクタ１は、このような歌唱の本質的特徴をより自然に模擬するための方法として、本発明の目的であるしゃくりを模擬する頻度を高めることに加えて、上述の４つの要素をランダムな変動量として得ることにより、一人の歌唱による斉唱効果をより効果的に得ることができる。

子音判別部２１は、ＤＳＰ＿ＩＮ端子から入力された音声信号が、母音または子音であるかを判別し、その判別結果を、効果音声制御部２３へ出力するものである。また、レベル検出部２２は、ＤＳＰ＿ＩＮ端子から入力された音声信号の振幅を検出して、入力された音声信号の音声レベルを、効果音声制御部２３へ出力するものである。なお、子音判別部２１による判別およびレベル検出部２２による検出は、後述するダブリング処理（図３参照）内で、所定タイミング毎に繰り返し実行される。

効果音声制御部２３は、子音判別部２１による判別結果とレベル検出部２２による検出結果とに応じて、点線矢印で示すように、可変遅延部２４へ、しゃくり初期値設定処理を指示する信号、即ち、しゃくりトリガを出力する。また、効果音声制御部２３は、クロスフェード部２７に対してクロスフェード制御を行なう。このクロスフェード制御については後述する。

可変遅延部２４は、分割音声信号が母音かつ音量レベルが閾値を超える場合に、後述する固定遅延部２６と同様の所定の時間の遅延に、更に、ピッチ最終変化設定処理による最終ピッチ変化量を加えた効果音声信号Ａを生成して、その効果音声信号Ａを、クロスフェード部２７のアンプ２７ａへ出力するものである。

ここで、可変遅延部２４と対になる固定遅延部２６は、分割音声信号が子音または音量レベルが閾値以下の場合に、読出アドレスポインタの位置を書込アドレスポインタの位置よりも所定の時間、例えば２０ｍｓの遅延が生じる位置に設定して、書込ポインタの書込速度と同じ速度でＲＡＭ１６から分割音声信号の読出を行ない、効果音信号Ｂを生成して、その効果音声信号Ｂをクロスフェード部２７のアンプ２７ｂへ出力するものである。

なお、可変遅延部２４および固定遅延部２６による分割音声信号の読出は常時行なわれるが、後述するクロスフェード部２７は、クロスフェード動作時以外の定常状態では、可変遅延部２４からの効果音声信号Ａと固定遅延部２６からの効果音声信号Ｂとを排他的にどちらか一方のみをミキサ２８に出力する。

また、可変遅延部２４は、しゃくりトリガを効果音声制御部２３から受けない限りは、固定遅延部２６と同様である所定の時間（例えば、２０ｍｓ）遅らせる遅延処理に、後述するビブラート処理によるピッチ変化量を加えて分割音声信号をＲＡＭ１６から読出し、得られた効果音声信号Ａをクロスフェード部２７に出力する。ここで遅延処理に着目すると、分割音声信号、即ち、ＤＳＰ＿ＩＮ端子から入力された音声信号は、可変遅延部２４または固定遅延部２６のいずれか一方を経由してクロスフェード部２７へ出力されるので、可変遅延部２４がしゃくりトリガを効果音声制御部２３から受けない限りは、結局入力された音声信号は所定の時間分遅延した後に出力されることになる。よって、この遅延が生じている間に、前述したようなしゃくり処理を行なうか否かの判定、すなわち音量変化の閾値判定処理や母音・子音の判別判定処理などの一連の処理を、時間的な余裕を持って行うことが出来て都合が良い。

また、可変遅延部２４は、特に、しゃくりトリガを効果音声制御部２３から受けた場合、固定遅延部２６と同様である所定の時間（例えば、２０ｍｓ）遅らせる遅延処理に、後述するピッチ最終変化決定処理で得られた最終ピッチ変化量を加えて、分割音声信号をＲＡＭ１６から読出し、得られた効果音声信号Ａをクロスフェード部２７に出力する。

すなわち、可変遅延部２４は、特にしゃくりトリガを効果音声制御部２３から受けた場合には、しゃくり初期値設定処理と、しゃくり減衰設定処理と、ビブラート処理との３つのそれぞれの処理結果を合算した結果であるピッチ最終変化設定処理が遅延処理に加えられて実行される。このピッチ最終変化設定処理を構成する３つの処理を次に個別に説明する。

１つ目のしゃくり初期値設定処理では、ＲＡＭ１６から取得される分割音声信号のピッチを高く変更するか、或いは低く変更するか（以後、「ピッチの変更方向」と称す）を決定すると共に、ピッチの変更量を決定する。

２つ目のしゃくり減衰設定処理では、しゃくり初期値設定処理で決定されたピッチの変更方向およびピッチの変更量で、分割音声信号のピッチを変更する場合に、経過時間に対応するその変更量（ピッチの収束速度）をゼロに収束させるための度合いを示す減衰関数を決定する。

３つ目のビブラート処理では、決定されたピッチの変更方向およびピッチの変更量で、分割音声信号のピッチを変更する場合に、その変更するピッチに付与するピッチの揺れの量（ビブラート）を決定する。ピッチ最終変化決定処理では、これら３つの処理結果を合算してピッチの変更方向の情報も含めた最終ピッチ変更量を求める。

次に、求められた最終ピッチ変更量が遅延処理に加えられる処理について説明する。まず遅延処理であるが、これは読出しポインタのスタート位置を所定の時間における遅延を実現する位置にまで遡って設定することにより行なわれる。この時の、デフォルトのアドレス読出位置は、本実施形態では固定遅延部２６で設定される所定の時間の遅延を実現するアドレスと同じとする。また、デフォルトのアドレス読出速度は、ピッチ変更量がゼロとなるようにアドレス書込速度と同じアドレス読出速度とする。この遅延設定により設定される読出しポインタの位置を基準に、さらにピッチ最終変化決定処理で求められた最終ピッチ変更量に応じて、読出アドレスポインタの読出位置をジャンプさせるとともに、アドレス読出速度をデフォルト値から増減させる。この時、ピッチ最終変化設定処理によるピッチ変更量がランダムに変化すると、しゃくり発生時の遅延量とピッチの収束速度もランダムに変化することは自明である。

例えば、しゃくりトリガを効果音声制御部２３から受けた場合に、ピッチ最終変化設定処理によるピッチ変更方向が負、つまりしゃくり初期値のピッチがデフォルト値よりも低い場合であれば、アドレス読出し位置はデフォルトのアドレス読出位置よりもさらにアドレス書込位置に近い方にジャンプすると共に、アドレス読出速度はデフォルトのアドレス読出速度よりも遅く設定される。アドレス読出し位置がデフォルトのアドレス読出位置よりもさらにアドレス書込位置に近い方にジャンプすることで、遅延時間はデフォルトの遅延時間よりも短くなる。その後、しゃくり減衰設定処理で決定された減衰関数に従ってピッチの変化量が減衰していくにつれ、アドレス読出速度は徐々に早くなり、仮にしゃくり発生の如何にかかわらず常時行われているビブラート処理によるピッチの変化量を除いて考えると、最終的にはデフォルトのアドレス読出位置に戻ると共に（遅延時間がデフォルトの遅延時間に戻ると共に）、アドレス読出速度もデフォルトの読出速度に戻る（ピッチ変化量がゼロに収束する）。このようにして、可変遅延部２４（ＤＳＰ１２）は、分割音声信号をＲＡＭ１６から読み出す。

この結果、可変遅延部２４がＲＡＭ１６から読み出すことにより得られる分割音声信号は、そのピッチが、本来のピッチ（デフォルトのアドレス読出位置からデフォルトの読出速度で読み出される分割音声信号のピッチ）に対して、大きく変更されたものとなると共に、変更したピッチが減衰関数に従って本来のピッチに戻るものであり、最終的にはピッチの変更量はゼロに収束し、デフォルトの遅延のみになって、更に、ビブラートが付与されたものとなる。なお、可変遅延部２４による分割音声信号の取得は、規定時間毎に繰り返し実行されるが、この詳細は図４を参照して後述する。

ランダム信号発生部２５は、ランダムな信号を発生するものであり、それぞれ別々のランダム信号を発生させる３つの発生部Ｒａ（２５ａ），Ｒｂ（２５ｂ），Ｒｃ（２５ｃ）を有している。発生部Ｒａ（２５ａ）は、点線矢印で示すように、しゃくり初期値設定処理およびしゃくり減衰設定処理で使用するランダム信号を発生させるものである。発生部Ｒａ（２５ａ）で発生させたランダム信号により、しゃくり初期値設定処理で決定するピッチの変更方向およびピッチの変更量と、しゃくり減衰設定処理で決定する減衰関数を、しゃくりトリガの入力の度に、ランダムにすることができる。（即ち、ピッチ最終変化決定処理で決定される最終ピッチ変更量を、しゃくりトリガの入力の度に、ランダムにすることができる。）この発生部Ｒａ（２５ａ）により、効果音声信号で模擬するしゃくりの程度や継続時間を変化に富んだものにして、結果、実際の歌唱でのしゃくりの変化のニュアンスに近づけることができるので、しゃくりの模擬を自然なものにすることができる。

発生部Ｒｂ（２５ｂ）は、点線矢印で示すように、ビブラート処理で使用するランダム信号を発生させるものである。発生部Ｒｂ（２５ｂ）で発生させたランダム信号により、ビブラート処理で決定する揺れの量を、ランダムにすることができる。この発生部Ｒｂ（２５ｂ）により、効果音声信号で模擬するしゃくりに、ランダムなビブラートを付与することができる。従って、しゃくりの際のピッチのゆれを実際の歌唱でのしゃくりの変化のニュアンスに近づけることができるので、しゃくりの模擬をより自然なものにすることができる。

発生部Ｒｃ（２５ｃ）は、点線矢印で示すように、後述する振幅制御部２９で使用するランダム信号を発生させるものである。発生部Ｒｃ（２５ｃ）で発生させたランダム信号により、振幅制御部２９で制御する信号の振幅変化量を、ランダムにすることができる。

クロスフェード部２７は、可変遅延部２４から出力された効果音声信号Ａと固定遅延部２６から出力された効果音声信号Ｂとをクロスフェードさせて、ミキサ２８へ出力するものである。クロスフェード部２７は、効果音声信号Ａの増幅を行うアンプ２７ａと、効果音声信号Ｂの増幅を行うアンプ２７ｂとを有している。アンプ２７ａおよびアンプ２７ｂは、点線矢印で示すように、各々別々に、効果音声制御部２３からの制御信号が入力される構成であり、入力された制御信号に応じた増幅率で、各々別々に、効果音声信号の増幅を行う。具体的には、効果音声信号Ｂから、効果音声信号Ａへと、ミキサ２８へ出力する信号を切り換える場合には、アンプ２７ｂの増幅率を連続的に徐々に減少させる制御信号が効果音声制御部２３から出力される一方で、アンプ２７ａの増幅率を連続的に徐々に増加させる制御信号が効果音声制御部２３から出力される。これにより、クロスフェード部２７では、効果音声信号Ｂの音声レベルを連続的に徐々に音量ゼロへ減少させる一方で、効果音声信号Ａの音声レベルを音量ゼロから連続的に徐々に増加させることができる。即ち、効果音声信号Ｂから効果音声信号Ａへと、ミキサ２８へ出力する信号をクロスフェードすることができる。なお、この場合にしゃくりが発生すると、しゃくりの模擬を含む効果音声信号Ａのピッチが急激に変更されることがある。これはしゃくりが発生すると、しゃくり初期値設定処理によりランダムに設定されるピッチ変化の度合いが大きくなることが頻繁に発生するため、可変遅延部２４の読出しポインタの位置がしゃくり発生直前の位置からしゃくり発生開始直後の読出し位置へと大きくジャンプすることに起因する。よってこの瞬間、読出し波形の急激な変化によるノイズが生じ、可変遅延部２４から出力される場合がある。しかし、このノイズが発生した時、クロスフェード部２７によるクロスフェード動作は開始された直後となり、ミキサ２８へ出力されるしゃくりの模擬を含む効果音声信号Ａの音声レベルは音量ゼロ近くに抑えられている。よって、上述したように可変遅延部２４からノイズが出力されても、そのノイズを、クロスフェード部２７で抑制することができる。

ミキサ２８は、アンプ２７ａから出力された効果音声信号Ａと、アンプ２７ｂから出力された効果音声信号Ｂとを混合した混合信号を、振幅制御部２９へ出力するものである。

振幅制御部２９は、ミキサ２８で混合された混合信号の振幅を、発生部Ｒｃ（２５ｃ）から出力されたランダム信号に対応して変化させ、さらに所定の増幅率を乗算した振幅の調整を行なった上で最終段ミキサ３１へ出力するものである。この振幅制御部２９の振幅変化により、混合信号の音声レベルをランダムに変化させるとともに、混合信号の音声レベルの最終調整を行うことができる。音声信号アンプ３０は、ＤＳＰ＿ＩＮ端子へ入力した音声信号を増幅して、最終段ミキサ３１へ出力するものである。最終段ミキサ３１は、振幅制御部２９から出力される混合信号（効果音声信号Ａと効果音声信号Ｂとが混合された信号）と、音声信号アンプ３０から出力される音声信号（ＤＳＰ＿ＩＮ端子へ入力した音声信号）とを入力し、それらを混合した混合信号を、ＤＳＰ＿ＯＵＴ端子へ出力するものである。

次に、図３を参照して、ＤＳＰ１２で実行される信号処理について説明する。図３は、ＤＳＰ１２で実行される信号処理であるダブリング処理を示したフローチャートである。このダブリング処理は、ダブリングエフェクタ１の電源オン中、繰返し実行される。なお、ダブリング処理では、Ｎｏｗ＿Ｃｏｎ＿ＦｌａｇおよびＯｌｄ＿Ｃｏｎ＿Ｆｌａｇの２つのフラグと、Ｎｏｗ＿Ｌｅｖｅｌ、Ｏｌｄ＿Ｌｅｖｅｌおよびｔの３つの変数を使用する。

Ｎｏｗ＿Ｃｏｎ＿Ｆｌａｇは、ＤＳＰ＿ＩＮ端子に入力された音声信号の判別結果が子音であるかを示すフラグであり、判別結果が子音である場合には、「１」となる一方、判別結果が子音でない場合には（母音である場合には）、「０」に設定される。

Ｏｌｄ＿Ｃｏｎ＿Ｆｌａｇは、ＤＳＰ＿ＩＮ端子に入力された音声信号の前回の判別結果が子音であるかを示すフラグであり、前回の判別結果が子音である場合には、「１」となる一方、前回の判別結果が子音でない場合には（母音である場合には）、「０」に設定される。なお、Ｎｏｗ＿Ｃｏｎ＿ＦｌａｇおよびＯｌｄ＿Ｃｏｎ＿Ｆｌａｇは、何れも、ＲＡＭ１６の所定領域に設けられている。

Ｎｏｗ＿Ｌｅｖｅｌは、ＤＳＰ＿ＩＮ端子に入力された音声信号の入力レベル（音量レベル）を示す変数であり、Ｏｌｄ＿Ｌｅｖｅｌは、ＤＳＰ＿ＩＮ端子に入力された音声信号の前回の入力レベル（音量レベル）を示す変数である。また、ｔは、ＲＡＭ１６に設けられたカウンタ（図示せず）のカウント値を示す変数である。なお、このカウンタは、ＤＳＰ＿ＩＮ端子に入力された音声信号が子音であると判別された場合に、或いは、ＤＳＰ＿ＩＮ端子に入力された音声信号の入力レベル（音量レベル）が閾値Ｌｃ以下である場合に、カウントアップが開始される。また、それ以外の場合、即ち、ＤＳＰ＿ＩＮ端子に入力された音声信号が母音と判別され、且つ、ＤＳＰ＿ＩＮ端子に入力された音声信号の入力レベル（音量レベル）が閾値Ｌｃを超える場合に、カウントアップが停止してゼロクリアされる。なお、このカウンタは、カウントアップが開始されると、Ｓ７の処理を経由するたびに（実行するたびに）、カウント値ｔをカウントアップする。

図３に示すように、ダブリング処理では、まず、初期化処理を実行する（Ｓ１）。具体的には、Ｎｏｗ＿Ｃｏｎ＿ＦｌａｇおよびＯｌｄ＿Ｃｏｎ＿Ｆｌａｇの各フラグと、Ｎｏｗ＿Ｌｅｖｅｌ、Ｏｌｄ＿Ｌｅｖｅｌおよびｔの各変数とを、ゼロに設定する（Ｓ１）。

次に、Ｏｌｄ＿Ｃｏｎ＿Ｆｌａｇの値をＮｏｗ＿Ｃｏｎ＿Ｆｌａｇへ代入し、Ｏｌｄ＿Ｌｅｖｅｌの値をＮｏｗ＿Ｌｅｖｅｌへ代入して（Ｓ２）、ＤＳＰ＿ＩＮ端子に入力された音声信号を検出する（Ｓ３）。そして、検出した音声信号の入力レベル（音声レベル）の値を、Ｎｏｗ＿Ｌｅｖｅｌに設定する（Ｓ４）。

その後、Ｓ３で検出した音声信号が子音であるか母音であるかの判別を行う（Ｓ５）。なお、Ｓ５における判別は、例えば、特許２５２９２０７号に記載の公知技術や特開平１１−２４９６５８号に記載の公知技術を用いて行う。

Ｓ５の判別が肯定される場合、即ち、Ｓ３で検出した音声信号が子音である場合には（Ｓ５：Ｙｅｓ）、Ｎｏｗ＿Ｃｏｎ＿Ｆｌａｇを「１」に設定して（Ｓ６）、カウンタによるカウントアップを開始する（Ｓ７）。そして、効果音声信号Ｂを固定遅延部２６から出力する処理である固定遅延処理を実行する（Ｓ８）。具体的には、読出アドレスポインタの位置を書込アドレスポインタの位置よりも所定の時間、例えば２０ｍｓの遅延が生じる位置に設定して、書込ポインタの書込速度と同じ速度でＲＡＭ１６から分割音声信号の読出を行ない、ＲＡＭ１６から分割音声信号を取得し、その取得した分割音声信号を、効果音声信号Ｂとしてクロスフェード部２７のアンプ２７ｂへ出力する。その後、Ｓ１７の処理へ移行する。

一方、Ｓ５の判別が否定される場合、即ち、Ｓ３で検出した音声信号が母音である場合であるが（Ｓ５：Ｎｏ）、以下に述べる２つの場合にしゃくり初期設定処理１３が行なわれることを説明する。Ｓ３で検出した音声信号が母音である場合は、Ｎｏｗ＿Ｃｏｎ＿Ｆｌａｇを「０」に設定して（Ｓ９）、Ｎｏｗ＿Ｌｅｖｅｌの値が閾値Ｌｃより大きいか否かを判定する（Ｓ１０）。Ｓ１０の判定が肯定される場合、即ち、Ｎｏｗ＿Ｌｅｖｅｌの値が閾値Ｌｃより大きい場合（Ｓ１０：Ｙｅｓ）、次の処理として以下の第１あるいは第２のような２つの処理が想定される。

まず、第１の処理として、Ｏｌｄ＿Ｃｏｎ＿Ｆｌａｇが「１」であるか否か、即ち、前回判別した音声信号が子音であるか否かが判定される（Ｓ１１）。そして、Ｏｌｄ＿Ｃｏｎ＿Ｆｌａｇが「１」であると判定されると（Ｓ１１：Ｙｅｓ）、前回の音声信号が子音であったのが今回新たに子音から母音に切り換わったものとみなし、次のＳ１２の処理が行われる。Ｓ１２では、カウンタのカウント値を示す変数ｔが、即ち、カウンタのカウント開始からの経過時間が、予め定められた時間Ｔｓ以上となっているか否かを判定する。変数ｔが、時間Ｔｓ以上である場合には（Ｓ１２：Ｙｅｓ）、効果音声制御部２３から可変遅延部２４へ、しゃくりトリガを出力して、ピッチの変更方向およびピッチの変更量を決定するしゃくり初期値設定処理を実行する（Ｓ１３）。

ただし、変数ｔが、予め定められた時間Ｔｓ未満である場合には（Ｓ１２：Ｎｏ）、効果音声信号Ａが過度に頻繁に生成されることを防止するために、Ｓ１３のしゃくり初期値設定処理に移行することなく、Ｓ１５の処理へ移行する。

第２の処理として、Ｓ１１の判定で、Ｏｌｄ＿Ｃｏｎ＿Ｆｌａｇが「０」であると判定された場合には、即ち、ＤＳＰ＿ＩＮ端子に入力された音声信号が母音であると前回判別されていた場合には（Ｓ１１：Ｎｏ）、Ｏｌｄ＿Ｌｅｖｅｌの値が閾値Ｌｃよりも大きいか否かが判定される（Ｓ１４）。そして、Ｏｌｄ＿Ｌｅｖｅｌの値が閾値Ｌｃ以下であると判定されると（Ｓ１４：Ｎｏ）、Ｓ１２の判定へ移行し、Ｓ１２の判定が肯定された場合には（Ｓ１２：Ｙｅｓ）、しゃくり初期値設定処理を実行する。つまり、しゃくり初期値設定処理は、前回判別された音声信号が母音であり、今回判別された分割音声信号も母音であるときに、前回判別された母音の入力レベルが閾値Ｌｃ以下であり、且つ、今回判別された母音の入力レベルが閾値Ｌｃを超える場合に、変数ｔが予め定められた時間Ｔｓ以上であれば、しゃくり初期値設定処理が実行される。なお、Ｓ１４の判定が肯定された場合には（Ｓ１４：Ｙｅｓ）、母音の入力レベルが閾値Ｌｃよりも大きい状態が前回から今回にかけて継続しているので、Ｓ１２の処理へ移行せず（Ｓ１３のしゃくり初期値設定処理を中止して）、Ｓ１５の処理へ移行する。

上述した第１の処理および第２の処理は、即ち、Ａ．Ｓ３で検出した音声信号の音量レベルが閾値Ｌｃを超え（Ｓ１０：Ｙｅｓ）、更に音声信号が子音から母音に新たに変化した場合（Ｓ１１：Ｙｅｓ）、Ｂ．Ｓ３で検出した音声信号の音量レベルが閾値Ｌｃを超え（Ｓ１０：Ｙｅｓ）、かつ母音であり（Ｓ５：Ｎｏ）、かつ母音が継続している状態で（Ｓ１１：Ｎｏ）、更にその音量レベルが前回は閾値Ｌｃ以下（Ｓ１４：Ｙｅｓ）だったのが今回新たに閾値Ｌｃを超えて変化した場合（Ｓ１４：Ｎｏ）、という２つの場合に加え、更に子音または音量が閾値以下の状態が予め定められた時間Ｔｓ以上継続した場合（Ｓ１２：Ｙｅｓ）に、しゃくり初期値設定処理（Ｓ１３）が行われるということである。

なお、Ｓ１０の判定で、Ｎｏｗ＿Ｌｅｖｅｌの値が閾値Ｌｃ以下であると判定された場合には（Ｓ１０：Ｎｏ）、ＤＳＰ＿ＩＮ端子に入力された音声信号が母音であっても、その母音の入力レベルは小さいものに過ぎないので、しゃくりを模擬した効果を付与する対象とはみなされず、Ｓ７の処理を実行する（Ｓ１３のしゃくり初期値設定処理に移行することなく、Ｓ７の処理を実行する）。なお、ダブリング処理では、Ｓ３で検出した音声信号が無音である場合にも、Ｓ１０の判別でＮｏと判定される。

Ｓ１２による否定の判定後、Ｓ１３の実行後、或いは、Ｓ１４による肯定の判定後、カウントを停止すると共にカウンタをゼロクリアし（Ｓ１５）、可変遅延処理を実行する（Ｓ１６）。その後、Ｓ１７の処理へ移行する。

ここで、図４を参照して、可変遅延処理について説明する。図４は、可変遅延部２４で実行される可変遅延処理を示したフローチャートである。この可変遅延処理（Ｓ１６）では、しゃくり初期値設定処理（Ｓ１３）が実行された場合は、後述するＳ２０〜Ｓ２４の全ての処理が実行される。しかし、しゃくり初期値設定処理（Ｓ１３）が実行されない場合（例えば入力された音声信号の音量レベルが前回も今回も閾値Ｌｃを超えており、かつ前回も今回も母音である場合や、特に閾値Ｌｃを超える音量レベルで母音が十分長い時間継続している場合など）は、しゃくりの模擬によるピッチ変化は、しゃくり減衰設定処理によって十分に収束した状態となっているので、可変遅延処理では、固定遅延部２６と同様の遅延処理（Ｓ２０）に加えて、発生部Ｒｂからの変調信号によるビブラートを加えるビブラート処理（Ｓ２１）のみが行われる。よって、可変遅延部２４から出力される効果音声信号Ａは、しゃくりを模擬した効果を含まず、遅延処理とビブラート処理によるピッチ変更とが行われた信号となる。

可変遅延処理では、まず、遅延処理を実行する。この遅延処理では、固定遅延部２６で設定される所定の時間と同じ時間、遅延を行う。次に、ビブラート処理を実行する（Ｓ２１）。このビブラート処理では、Ｓ１３の処理で決定されたピッチの変更方向およびピッチの変更量で、分割音声信号のピッチを変更する場合に、その変更するピッチに付与する揺れの量（ビブラート）を決定する。

次に、しゃくり減衰設定処理を実行する（Ｓ２２）。このしゃくり減衰設定処理では、しゃくり初期値設定処理で決定されたピッチの変更方向およびピッチの変更量で、分割音声信号のピッチを変更する場合に、経過時間に対応するその変更量をゼロに収束させるための減衰の度合い（減衰速度）を示す減衰関数を決定する。

そして、ピッチ最終変化決定処理を実行する（Ｓ２３）。このピッチ最終変化決定処理では、しゃくり初期値設定処理（Ｓ１３）、ビブラート処理（Ｓ２１）およびしゃくり減衰設定処理（Ｓ２２）の３つの処理結果を合算してピッチの変更方向の情報も含めた最終ピッチ変更量を求める。

最後に、分割音声信号取得処理を実行する（Ｓ２４）。この分割音声信号取得処理では、Ｓ２３の処理で決定された最終ピッチ変更量に応じて、遅延処理（Ｓ２０）により設定される読出しポインタの位置を基準に、読出アドレスポインタの読出位置をジャンプさせるとともに、アドレス読出速度をデフォルト値から増減させる。そして、読出アドレスポインタの読出位置とアドレス読出速度とに対応して、可変遅延部２４は、ＲＡＭ１６から分割音声信号を取得し、その取得した分割音声信号を、効果音声信号Ａとして、クロスフェード部２７のアンプ２７ａへ出力する。その後、この可変遅延処理を終了する。

このように、可変遅延部２４では、ピッチ最終変化決定処理の実行による遅延およびピッチ変化が、最終的に、処理効果信号Ａに対して付与される。なお、ビブラート処理のランダム変調を除くピッチ最終変化決定処理での遅延処理（Ｓ２０）については、例えば前述したような閾値Ｌｃを超える音量レベルで母音が十分長い時間継続しているような場合であって、しゃくり初期値設定処理（Ｓ１３）が実行されない状態では、固定遅延部２６の遅延処理と同一の遅延処理を行うことで、クロスフェード部２７による効果音信号A、B間の経路切換え時に互いの信号の位相をそろえる効果を得る。これにより自然なクロスフェード処理が可能となる。

図３の説明に戻る。可変遅延処理（Ｓ１６）、または、固定遅延処理（Ｓ８）の実行後、クロスフェード処理を実行する（Ｓ１７）。このクロスフェード処理では、可変遅延部２４から出力された効果音声信号Ａと固定遅延部２６から出力された効果音声信号Ｂとを、クロスフェード部２７でクロスフェードした後に、ミキサ２８へ出力する。その後、振幅のランダム変調処理を実行する（Ｓ１８）。この振幅のランダム変調処理では、ミキサ２８で混合された混合信号の振幅を、ランダム信号発生部２５の発生部Ｒｃ（２５ｃ)から出力されたランダム信号に対応して変化させ、最終段ミキサ３１へ出力する。Ｓ１８の実行後、Ｓ２の処理へ戻る。

上述した通り、本実施形態のダブリングエフェクタ１によれば、入力された音声信号が子音から母音へ切り換わり、かつその切り換わった母音の入力レベルが閾値Ｌｃよりも大きく、更には、変数ｔが予め定められた時間Ｔｓ以上である場合には、しゃくり初期値設定処理を実行して、その後、可変遅延処理を実行する。この、しゃくり初期値設定処理および可変遅延処理で、分割音声信号のピッチを変更することで、しゃくりを模擬した効果を含む効果音声信号Ａを生成することができる。ここで、子音とは、母音（ａ，ｉ，ｕ，ｅ，ｏの各音）以外の音、即ち、破裂音（ｂ，ｄ，ｇ，ｐ，ｔ，ｋの各音）、摩擦音（ｖ，ｚ，ｆ，ｓの各音）、鼻音（ｍ，ｎの各音）、流音（ｌ，ｒの各音）である。よって、音声信号の子音から母音への切り換わりが、例えば、有声音である鼻音や流音から、有声音である母音へと変化する状態であってもなお、効果音声信号Ａを生成することができる。従って、ダブリングエフェクタ１によれば、有声音と無声音を判断して同様のしゃくりを模擬する場合に比べて、よりしゃくりを模擬する頻度を高めることができる。

また、ダブリングエフェクタ１によれば、前回判別された音声信号が母音であり、今回判別された分割音声信号も母音であるときに、前回判別された母音の入力レベルが閾値Ｌｃ以下であり、且つ、今回判別された母音の入力レベルが閾値Ｌｃを超える場合に（今回判別された母音の入力レベルの増加量が所定量を超える場合に）、変数ｔが予め定められた時間Ｔｓ以上であれば、このときも、しゃくり初期値設定処理を実行し、その後、可変遅延処理を実行して効果音声信号Ａを生成する。よって、入力された音声信号が子音から母音へと変化する場合のみならず、入力された音声信号が上述した条件を満たした上で母音から母音へと変化する場合にもやはりしゃくりを模擬して、その頻度を高めることができる。

また、ダブリングエフェクタ１によれば、入力された音声信号が母音であることが検出された場合でも、その母音の入力レベルが閾値Ｌｃ以下である場合には（Ｓ１０：Ｎｏ）、Ｓ１３のしゃくり初期値設定処理を行わない一方で、効果音声信号Ｂを生成する。よって、検出された母音の入力レベルに関わらず、入力された音声信号が子音から母音へ切り換わる度に、過度に頻繁に効果音声信号Ａを生成する場合と比較して、音量が小さい場合にはしゃくりを入れない処理を行うことでしゃくりの発生する頻度を減らし、効果音声信号Ａの生成を実際の歌唱で生ずるしゃくりの頻度に近づけて、より違和感のない範囲の頻度に留めることができる。

また、ダブリングエフェクタ１では、入力された音声信号の子音から母音への切り換わりが検出され、その切り換わった母音の入力レベルが閾値Ｌｃよりも大きい場合であっても、或いは、前回判別された音声信号が母音であり、今回判別された分割音声信号も母音であるときに、今回判別された母音の入力レベルの増加量が所定量を超える場合であっても、変数ｔが予め定められた時間Ｔｓ未満であれば、しゃくり初期値設定処理を実行しない（しゃくり初期値設定処理の実行を中止する）。よって、変数ｔが予め定められた時間Ｔｓ以上であるかを判定することなく効果音声信号Ａを生成する場合、即ち、入力された音声信号が子音から母音へ切り換わる度に、或いは、入力された音声信号が母音から母音へと変化する度に、その都度頻繁に、効果音声信号Ａを生成する場合と比較して、しゃくりの発生する頻度は減り、効果音声信号Ａの生成を違和感のない範囲に留めることができる。このことは、実際の歌唱でのしゃくりが入る場合をより正確に模擬することができる制御である。なぜなら、実際の歌唱を分析すると、歌手がしゃくりを入れる時は、例えば歌い始めの場面で、あるいは歌詞の途中でも特に強調したい歌詞の最初などで、歌手はしゃくりに十分な時間をかけて、歌い手としての思いを、例えばこぶしを利かせるようにしてしゃくりを強調しつつ歌う場面が多いことからである。歌詞の途中で、早い言葉で、たとえばミディアムテンポで１６分音符のようなリズムで歌う歌詞の音節の一節一節にしゃくりが入ることはまずないこともわかっている。本願のダブリングエフェクタ１は、このような実際の歌唱の模擬をより正確に行なうことが出来るというわけである。

また、ダブリングエフェクタ１では、可変遅延部２４および固定遅延部２６は、ＤＳＰ＿ＩＮ端子からの音声信号の入力開始から、デフォルト設定としてある所定の時間、例えば２０ｍｓ遅延して、分割音声信号の取得を開始する。可変遅延部２４については、前述したようにしゃくりが模擬されると、ピッチ最終変化幅決定処理でランダムに処理されたピッチ変更幅に応じた遅延量が２０ｍｓ遅延に加算される。可変遅延部２４および固定遅延部２６からの分割音声信号をクロスフェード処理することにより、入力された音声信号と混合される効果音声信号を、入力された音声信号に対して、常時遅延させることができる。ここで、遅延させた歌唱をもとの歌唱に加算する手法は、もっとも簡単で手軽に斉唱効果を得る方法として公知の手法である。よって、クロスフェード処理後得られる分割音声信号が常時遅延されることで、ＤＳＰ＿ＩＮ端子から音声信号が入力されている期間中、常時、斉唱効果を付与することができる。また、可変遅延部２４および固定遅延部２６の分割音声信号の取得が、音声信号の入力開始から２０ｍｓ遅延していることは、この２０ｍｓの間に、入力された音声信号の音量変化の閾値判定処理や母音・子音の判別判定処理などの一連の処理のための時間を確保できるという点で有利である。よって、システムに負担をかけることなく、かつ簡易な構成で子音または母音の判別処理やしゃくり生成処理を行うことができる。

また、ダブリングエフェクタ１では、ピッチ最終変化決定処理で決定される最終ピッチ変更量を、しゃくりトリガの入力の度にランダムに変化させることで、読出アドレスポインタの読出位置およびアドレス読出速度を、ランダムに変化させることができる。このように、読出アドレスポインタの読出位置およびアドレス読出速度をランダムにさせるという簡易な構成で、効果音声信号で模擬するしゃくりを変化の富んだものにすることができるので、その結果得られる斉唱効果を、決められた一定の変調を効果音声信号で繰り返すのではなく変化の富んだものにすることができる。従って、簡易な構成で、しゃくりの模擬を自然なものにすることができると共に、斉唱効果も、自然なものにすることができる。

また、ダブリングエフェクタ１では、Ｓ１２の判定で用いられる時間Ｔｓを短くすることで、しゃくり初期値設定処理の実行頻度を上げ（しゃくりの頻度を上げ）、逆に、時間Ｔｓを長くすることで、しゃくり初期値設定処理の実行頻度を下げるようにして（しゃくりの頻度を下げるようにして）、歌唱に合わせてしゃくりの頻度を調整することができる。

更に、ダブリングエフェクタ１では、Ｓ１０およびＳ１４の判定で用いられる閾値Ｌｃを小さくすることで、しゃくり初期値設定処理の実行頻度を上げ（しゃくりの頻度を上げ）、逆に、閾値Ｌｃを大きくすることで、しゃくり初期値設定処理の実行頻度を下げるようにして（しゃくりの頻度を下げるようにして）、歌唱に合わせてしゃくりの頻度を調整することができる。

以上、本実施形態に基づき本発明を説明したが、本発明は上記形態に何ら限定されるものではなく、本発明の趣旨を逸脱しない範囲内で種々の変形改良が可能であることは容易に推察できるものである。

また、上述した実施形態のダブリングエフェクタ１では、しゃくり減衰設定処理で決定される減衰関数は、しゃくり初期値設定処理（Ｓ１３）で設定される分割音声信号のピッチの変更量の初期値を、ゼロに収束させるための関数であったが、減衰関数が収束させる値は、これに限られるものではない。即ち、減衰関数が収束させる値は、ゼロに限らず、しゃくり初期値設定処理（Ｓ１３）で設定されたピッチの変更量よりも少ない変更量となる値であれば良い。

また、上述した実施形態のダブリングエフェクタ１で使用した時間Ｔｓと閾値Ｌｃとの両方を、或いは、いずれか一方のみを、個別の変調信号、例えば数ヘルツ程度の正弦波を用いて変調をかけたり、さらにその変調波自体をランダムに変調にすることで、しゃくりが発生する条件設定そのものにゆらぎを持たせてもよい。この場合、ダブリングエフェクタは、上述した実施形態のダブリングエフェクタ１と比較して、更に変化にとんだしゃくりを発生させることができる。

上述した実施形態のダブリングエフェクタ１では、前回判別された音声信号が母音であり、今回判別された分割音声信号も母音であるときに、前回判別された母音の入力レベルが閾値Ｌｃ以下であり（Ｓ１４：Ｎｏ）、且つ、今回判別された母音の入力レベルが閾値Ｌｃを超える場合に（Ｓ１０：Ｙｅｓ）、Ｓ１２の判定を実行したが、これに限られるものではない。即ち、Ｓ１０およびＳ１４の２つの判定を実行することなく、前回判別された母音の入力レベルから今回判別された母音の入力レベルの増加分（変化分）を算出し、その増加分が、規定の値を超えていれば、Ｓ１２の処理を実行するように構成しても良い。この構成によれば、Ｓ１２の処理への移行を、母音の入力レベルの増加分で判定することができる。

１ダブリングエフェクタ（効果装置）
１２ＤＳＰ（効果付与手段の一部、出力手段の一部）
１６ＲＡＭ（遅延取得手段の一部）
２１子音判別部（判別手段）
２２レベル検出部（振幅判定手段）
２４可変遅延部（変更手段、収束手段の一部、出力実行手段の一部）
２５ａ発生部Ｒａ（ピッチ変化手段、収束変化手段）
２５ｂ発生部Ｒｂ（揺れ付与手段）
Ｓ５ダブリング処理（検出手段の一部）
Ｓ１０ダブリング処理（母音振幅判定手段）
Ｓ１１ダブリング処理（連続母音検出手段）
Ｓ１２ダブリング処理（計時判定手段）
Ｓ１２：Ｙｅｓダブリング処理（時間判定許可手段）
Ｓ１４ダブリング処理（振幅増加量判定手段）
Ｓ１６可変遅延処理（収束手段の一部、遅延取得手段の一部）
Ｓ２３ピッチ最終変化決定処理（収束手段の一部、出力実行手段の一部、）
ＩＮ端子（入力手段）
ＯＵＴ端子（出力手段の一部）
Ｎｏｗ＿Ｃｏｎ＿Ｆｌａｇ（検出手段の一部）
Ｏｌｄ＿Ｃｏｎ＿Ｆｌａｇ（検出手段の一部）
カウンタ（計時手段）
ダブリング処理（効果付与手段の一部）

Claims

音声信号が入力される入力手段と、その入力手段から入力された音声信号を所定タイミング毎に取得し、その取得した音声信号に効果を付与する効果付与手段と、その効果付与手段により効果が付与された音声信号である効果音声信号を、前記入力手段から入力された音声信号と混合して出力する出力手段とを備えた効果装置において、
前記効果付与手段は、
前記入力手段に入力された音声信号が母音または子音であるかを前記所定タイミングに対応して判別する判別手段と、
その判別手段により判別された音声信号が、子音から母音へ切り換わったことを検出する検出手段と、
少なくとも、前記音声信号の子音から母音への切り換わりが前記検出手段によって検出された場合に、前記所定タイミングで取得される音声信号のピッチを変更する変更手段と、
その変更手段により前記音声信号のピッチが変更される場合、前記音声信号のピッチの変更量を、所定の関数で示される度合いで規定量に収束させる収束手段と、
その収束手段により前記ピッチの収束が行われている音声信号を前記効果音声信号として前記出力手段へ出力する出力実行手段とを備えていることを特徴とする効果装置。
前記効果付与手段は、
前記音声信号の子音から母音への切り換わりが前記検出手段によって検出される場合に、その母音へ切り換わった前記音声信号の振幅を検出し、その検出した振幅が第１閾値以上であるかを判定する振幅判定手段を備え、
前記変更手段は、
前記母音へ切り換わる音声信号の振幅が第１閾値以上であると前記振幅判定手段によって判定された場合に、前記所定タイミングで取得される音声信号のピッチを変更することを特徴とする請求項１記載の効果装置。
前記効果付与手段は、
前記入力手段に入力された音声信号が母音であると前記判別手段により判別された場合に、その入力された母音の音声信号における振幅が第２閾値以上であるかを判定する母音振幅判定手段と、
前記入力された母音の音声信号における振幅が前記第２閾値以上であると前記母音振幅判定手段によって判定された場合に、前記判別手段により前回判別された音声信号も母音であったかを検出する連続母音検出手段と、
前回判別された音声信号も母音であったと前記連続母音検出手段によって検出された場合に、前記入力された母音の音声信号における振幅増加量を検出し、その検出した振幅増加量が所定値以上であるかを判定する振幅増加量判定手段とを備え、
前記変更手段は、
前記入力された母音の音声信号における振幅増加量が所定値以上であると前記振幅増加量判定手段により判定された場合に、前記所定タイミングで取得される音声信号のピッチを変更することを特徴とする請求項１または２に記載の効果装置。
前記効果付与手段は、
前記入力された母音の音声信号における振幅が前記第２閾値よりも小さいと前記母音振幅判定手段によって連続して判定され続けた時間と、前記入力手段に入力された音声信号が子音であると前記判別手段によって連続して判別され続けた時間との合計時間を計時する計時手段と、
その計時手段により計時された前記合計時間が所定時間を超えたかを判定する計時判定手段とを備え、
前記変更手段は、
前記合計時間が前記所定時間を超えたと前記計時判定手段によって判定された場合に、前記所定タイミングで取得される音声信号のピッチ変更を許可する時間判定許可手段を備えていることを特徴とする請求項３記載の効果装置。