JP4654616B2 - 音声効果付与装置及び音声効果付与プログラム - Google Patents

音声効果付与装置及び音声効果付与プログラム Download PDF

Info

Publication number
JP4654616B2
JP4654616B2 JP2004186014A JP2004186014A JP4654616B2 JP 4654616 B2 JP4654616 B2 JP 4654616B2 JP 2004186014 A JP2004186014 A JP 2004186014A JP 2004186014 A JP2004186014 A JP 2004186014A JP 4654616 B2 JP4654616 B2 JP 4654616B2
Authority
JP
Japan
Prior art keywords
spectrum
frequency
intensity
spectrum intensity
distribution region
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2004186014A
Other languages
English (en)
Other versions
JP2006010908A (ja
Inventor
靖雄 吉岡
ロスコス アレックス
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Yamaha Corp
Original Assignee
Yamaha Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Yamaha Corp filed Critical Yamaha Corp
Priority to JP2004186014A priority Critical patent/JP4654616B2/ja
Publication of JP2006010908A publication Critical patent/JP2006010908A/ja
Application granted granted Critical
Publication of JP4654616B2 publication Critical patent/JP4654616B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Description

本発明は、入力音声に効果を付与する音声効果付与装置及び音声効果付与プログラムに関する。
入力音声に効果を付与して音声変換を行う方法として、SMS(スペクトルモデリング合成)技術の応用で、残差成分の大きさをコントロールすることにより、音声のざらざら感をコントロールすることができることは知られている。SMS技術については、特許文献1を参照されたい。
例えば、入力する制御パラメータに基づき、合成対象音声の調和成分・非調和成分の大きさをそれぞれ制御し、気息性の大きさを制御することが提案されている(特許文献2)。
一方、周波数スペクトル上で検出した局所的ピークを含むスペクトル分布領域を指定し、入力音符ピッチに応じてこの領域を移動し、この移動に対応して位相スペクトルも修正して、合成音声に変換する方式(フェーズボコーダ方式)が知られている(特許文献3)。
特開平07−325583号公報 特開2003−288095号公報 特開2003−255998号公報
上述のように、SMS技術を応用して、残差成分の大きさをコントロールすることにより、音声のざらざら感をコントロールすることは可能であるが、これをその他様々な種類の音声変換に対応させることは難しい。
また、正弦波成分と残差成分に分離するため両者の一体感を保ったままの音声変換は困難である。
そこで本発明は、様々な音声変換を行うことができる音声効果付与装置及び音声効果付与プログラムを提供することを目的としている。
上記目的を達成するために、本発明の音声効果付与装置は、入力音声信号を周波数分析して、その周波数スペクトルの局所的ピークを検出し、各局所的ピークごとに局所的ピークとその前後の周波数のスペクトルを含む周波数の区間であるスペクトル分布領域を決定する手段と、各スペクトル分布領域におけるスペクトル強度の変更の内容を規定するスペクトル強度変更テーブル又は関数を、入力音声に付与する効果の種類に対応して複数記憶する記憶手段と、前記記憶手段に記憶されているスペクトル強度変更テーブル又は関数の選択、及び、該選択されたスペクトル強度変更テーブル又は関数による処理によりスペクトル強度が変更される周波数の幅やスペクトル強度の変更量を示すパラメータの指定を行うパラメータ指定手段と、各スペクトル分布領域のスペクトルに対して、前記選択されたスペクトル強度変更テーブル又は関数と前記指定されたパラメータに基づいて、そのスペクトル強度を変更する演算を実行するスペクトル変形手段と、前記スペクトル変形手段によりスペクトル強度が変更されたスペクトルを時間領域の信号に変換して出力する手段とを有するものである。
また、前記パラメータを前記スペクトル分布領域のピーク周波数又はピーク強度に応じて変更する手段を有するものである。
さらに、本発明の音声効果付与プログラムは、コンピュータに、入力音声信号を周波数分析して、その周波数スペクトルの局所的ピークを検出し、各局所的ピークごとに局所的ピークとその前後の周波数のスペクトルを含む周波数の区間であるスペクトル分布領域を決定するステップと、各スペクトル分布領域におけるスペクトル強度の変更の内容を規定するスペクトル強度変更テーブル又は関数を、入力音声に付与する効果の種類に対応して複数記憶する記憶手段から、スペクトル強度変更テーブル又は関数を選択し、該選択したスペクトル強度変更テーブル又は関数による処理によりスペクトル強度が変更される周波数の幅やスペクトル強度の変更量を示すパラメータの指定を行うパラメータ指定ステップと、各スペクトル分布領域スペクトルに対して、前記選択されたスペクトル強度変更テーブル又は関数と前記指定されたパラメータに基づいて、そのスペクトル強度を変更する演算を実行するスペクトル変形ステップと、前記スペクトル変形ステップによりスペクトル強度が変更されたスペクトルを時間領域の信号に変換して出力するステップとを実行させるものである。
このような本発明の音声効果付与装置及び音声効果付与プログラムによれば、入力信号をスペクトル分布領域に分割する方式(フェーズボコーダ方式)において、各スペクトル分布領域のスペクトルに適用するテーブル又は関数を変更することにより、同一の構成で様々な効果を付与することが可能となる。
また、正弦波成分と残差成分を分離したりせずに、両者を同時に扱うため、変換後の不自然さ(分離したための一体感のなさ)が少なくなる。
図1は、本発明の音声効果付与装置の一実施の形態の構成を示す機能ブロック図である。
この図において、1は音声信号を入力する入力部、2は該入力音声を各フレームごとにFFT(高速フーリエ変換)して周波数スペクトルを得るフーリエ変換部、3は該フーリエ変換部2から出力される周波数スペクトルの局所的ピークを検出し、各局所的ピークごとに該局所的ピークとその前後の周波数のスペクトルを含む周波数の区間である複数のスペクトル分布領域を決定するピーク検出及びスペクトル分布領域指定部である。
また、4は各スペクトル分布領域のスペクトルを変形するスペクトル変形処理部、5は変換の種類に応じて用意された各種テーブルである。この各種テーブル5については後述するが、スペクトル強度変更の内容を規定するスペクトル強度変更テーブルやピーク周波数や入力のピッチなどの情報に応じてそのスペクトル強度変更テーブルに応じたパラメータを変更するための周波数−パラメータテーブルなどが含まれている。
6は前記各種テーブル5に含まれているテーブルの選択や各々のテーブルに応じたパラメータを与えるパラメータ指定部、7は前記スペクトル変形処理部4から出力される変換後の新しいスペクトルを時間領域に変換して1フレームの時間波形に変換する逆フーリエ変換部、8は前記逆フーリエ変換部7から出力される各フレームの時間波形をオーバラップ及び加算処理により連続波形とするオーバラップ加算再合成処理部、9は該オーバラップ加算再合成処理部8からの連続波形を出力する出力部である。
なお、これらの構成要素は、それぞれ個別の処理部として実現することもできるが、コンピュータにおけるプログラム処理により実現することもできる。
このように、本発明の音声効果付与装置においては、周波数領域において入力音声のスペクトルを変形することにより音声変換を行うようにしている。
そして、前記各種テーブル5にそれぞれ付与する効果に対応して格納されているスペクトル強度変更テーブルを選択し、該選択されたテーブルに基づいて各スペクトル分布領域のスペクトルを変形することにより、所望の音声変換を行う。
なお、上記においては各種テーブル5にそれぞれの効果に対応するスペクトル強度変更テーブルを記憶するようにしていたが、テーブルに代えて、各スペクトル強度変更内容を規定する関数を記憶しておき、前記スペクトル変形部4で付与したい効果に対応する関数を用いてスペクトルの変形を行うようにしてもよい。
次に、前記各種テーブル5に格納されているテーブル又は関数の例について説明する。
図2は、前記各種テーブル5に格納されているテーブルの第1の例を説明するための図である。この図において、(a)は入力信号のスペクトルであり、図示するように、それぞれ局所的ピークを含む複数のスペクトル分布領域に分けられている。(b)は、そのうちの一つのスペクトル分布領域(i)を拡大して示す図であり、実線は、入力信号のスペクトル強度を示している。(c)は、この例において適用されるスペクトル強度変更テーブルの特性を示す図であり、図示するように、入力スペクトルの強度を局所的ピークの近傍で所定量だけ減衰させるものである。前記スペクトル変形部4においてこのスペクトル強度変更テーブルを対応する周波数のFFTビン(bin)と乗算してスペクトルを変形すると、図2の(b)の破線のように局所的ピークの近傍のスペクトル強度が低下される。
また、他のスペクトル分布領域についても、同様に、(c)に示すテーブルに従ってスペクトル強度を変更する。
これにより、各スペクトル分布領域のメインローブの強度が抑えられることとなり、ノイズ成分が相対的に大きくなるため、入力音声が息っぽい(Breathyな)音声に変換されることとなる。
ここで、図2の(c)に示す縦方向と横方向の矢印は、このスペクトル強度変更テーブルによる処理におけるパラメータを示しており、スペクトル強度が減少させられる周波数の幅を規定するFFTビン(bin)の個数、及び、スペクトル強度の減衰量を示す強度をパラメータとして前記パラメータ指定部6から指定することができる。このパラメータの値を制御することにより、効果を調整することができる。
図3は、前記スペクトル強度変更テーブルの他の例について示す図であり、(a)は一つのスペクトル分布領域における入力スペクトル(実線)と変形された後のスペクトル(破線)を示し、(b)はこの例のスペクトル強度変更テーブルの内容を示している。
図示するように、この例では、ピーク周波数では減衰せず、ピーク周波数から離れるにしたがって減衰量が大きくなるようにスペクトルを変形させている。
この場合には、メインローブ以外のスペクトル(ノイズ成分と考えられる。)が小さくなることにより、入力成分のノイズ成分が減少し、クリアな音声とする効果を付与することができる。
このスペクトル強度変更テーブルの場合には、図中に矢印で示す傾きが前記パラメータ指定部6により指定されるパラメータであり、これを制御することによりその効果の効き具合を調整することができる。
なお、(b)とは逆に、ピーク周波数から離れるに従って強度を大きくする特性の場合には、ノイズ成分が大きくなり、入力音声をざらざらした声質に変換することができる。
このように、入力音声に付与したい効果に対応したスペクトル強度変更テーブル又は関数を選択することにより、入力音声に対して、同一の構成で様々な効果を付与することができる。
また、それぞれのスペクトル強度変更テーブルに応じて対応するパラメータを制御することにより、その効果の効き具合を調整することができる。
なお、前記パラメータ指定部6により、前記スペクトル強度変更テーブルの指定と前記パラメータの指定の両方を行うようにしてもよいし、あるいは、前記スペクトル強度変更テーブルの指定は、別の手段により行うようにしてもよい。
さて、上述した各例においては、全てのスペクトル分布領域について、同様にスペクトル強度を変更するものとしていたが、これに限られることはなく、スペクトル分布領域のうちの一部(例えば、所定の周波数以下)のスペクトル分布領域についてのみ、上述したスペクトル変形処理を行うようにしてもよい。
また、前記パラメータについても、入力音声のピッチや振幅、おのおののスペクトル分布領域のピーク周波数やピーク強度に応じて、各々のパラメータを変更するようにしてもよい。
図4は、スペクトル分布領域のピーク周波数に応じてパラメータを変更するための、周波数−パラメータテーブルの一例を示す図である。このテーブルも、前述した各種テーブル5内に記憶されている。
この例においては、縦軸は、前記図3に示した例における傾きの大きさを示しており、ピーク周波数がf1であるスペクトル分布領域については、前記図3(b)に示したスペクトル強度変更テーブルの傾きが最も大きくなるようになされている。
このようにスペクトル分布領域のピーク周波数に応じてパラメータの大きさを制御することにより、より効果的に音声変換をすることが可能となる。
この周波数−パラメータテーブルも前記各種テーブル5内に複数記憶しておき、外部からどのテーブルを使用するかを選択することができるようにすることにより、よりよい効果を得ることができる。
さらにまた、入力音声のピッチや振幅、各スペクトル分布領域のピーク周波数やピーク強度に応じて、パラメータではなく、使用するスペクトル強度変更テーブルそのものを変更するようにしてもよい。この場合には、ピーク周波数などとスペクトル強度変更テーブルの対応表を記憶しておき、これに基づいて使用するスペクトル強度変更テーブルを選択するようにすればよい。
また、パラメータの選択はスペクトル分布領域のピーク周波数などに限るものではなく、領域の最小周波数や最高周波数などの特定の周波数によるものとしてもよい。
本発明の音声効果付与装置の一実施の形態の構成を示す機能ブロック図である。 スペクトル強度変更テーブルの一例について説明するための図であり、(a)は入力スペクトル、(b)は入力スペクトルと変更されたスペクトルの拡大図、(c)は強度変更テーブルの内容を示す図である。 スペクトル強度変更テーブルの他の例について説明するための図であり、(a)は入力スペクトルと変更されたスペクトルの拡大図、(b)は強度変更テーブルの内容を示す図である。 周波数−パラメータテーブルの内容の一例を示す図である。
符号の説明
1:入力部、2:フーリエ変換部、3:ピーク検出及びスペクトル分布領域指定部、4:スペクトル変形部、5:各種テーブル、6:パラメータ指定部、7:逆フーリエ変換部、8:オーバラップ加算再合成部、9:出力部

Claims (3)

  1. 入力音声信号を周波数分析して、その周波数スペクトルの局所的ピークを検出し、各局所的ピークごとに局所的ピークとその前後の周波数のスペクトルを含む周波数の区間であるスペクトル分布領域を決定する手段と、
    各スペクトル分布領域におけるスペクトル強度の変更の内容を規定するスペクトル強度変更テーブル又は関数を、入力音声に付与する効果の種類に対応して複数記憶する記憶手段と、
    前記記憶手段に記憶されているスペクトル強度変更テーブル又は関数の選択、及び、該選択されたスペクトル強度変更テーブル又は関数による処理によりスペクトル強度が変更される周波数の幅やスペクトル強度の変更量を示すパラメータの指定を行うパラメータ指定手段と、
    スペクトル分布領域のスペクトルに対して、前記選択されたスペクトル強度変更テーブル又は関数と前記指定されたパラメータに基づいて、そのスペクトル強度を変更する演算を実行するスペクトル変形手段と、
    前記スペクトル変形手段によりスペクトル強度が変更されたスペクトルを時間領域の信号に変換して出力する手段と
    を有することを特徴とする音声効果付与装置。
  2. 前記パラメータを前記スペクトル分布領域のピーク周波数又はピーク強度に応じて変更する手段を有することを特徴とする請求項記載の音声効果付与装置。
  3. コンピュータに、
    入力音声信号を周波数分析して、その周波数スペクトルの局所的ピークを検出し、各局所的ピークごとに局所的ピークとその前後の周波数のスペクトルを含む周波数の区間であるスペクトル分布領域を決定するステップと、
    各スペクトル分布領域におけるスペクトル強度の変更の内容を規定するスペクトル強度変更テーブル又は関数を、入力音声に付与する効果の種類に対応して複数記憶する記憶手段から、スペクトル強度変更テーブル又は関数を選択し、該選択したスペクトル強度変更テーブル又は関数による処理によりスペクトル強度が変更される周波数の幅やスペクトル強度の変更量を示すパラメータの指定を行うパラメータ指定ステップと、
    各スペクトル分布領域スペクトルに対して、前記選択されたスペクトル強度変更テーブル又は関数と前記指定されたパラメータに基づいて、そのスペクトル強度を変更する演算を実行するスペクトル変形ステップと、
    前記スペクトル変形ステップによりスペクトル強度が変更されたスペクトルを時間領域の信号に変換して出力するステップと
    を実行させることを特徴とする音声効果付与プログラム。
JP2004186014A 2004-06-24 2004-06-24 音声効果付与装置及び音声効果付与プログラム Expired - Fee Related JP4654616B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2004186014A JP4654616B2 (ja) 2004-06-24 2004-06-24 音声効果付与装置及び音声効果付与プログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2004186014A JP4654616B2 (ja) 2004-06-24 2004-06-24 音声効果付与装置及び音声効果付与プログラム

Publications (2)

Publication Number Publication Date
JP2006010908A JP2006010908A (ja) 2006-01-12
JP4654616B2 true JP4654616B2 (ja) 2011-03-23

Family

ID=35778264

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2004186014A Expired - Fee Related JP4654616B2 (ja) 2004-06-24 2004-06-24 音声効果付与装置及び音声効果付与プログラム

Country Status (1)

Country Link
JP (1) JP4654616B2 (ja)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP5211437B2 (ja) * 2006-05-19 2013-06-12 ヤマハ株式会社 音声処理装置およびプログラム
JP6038918B2 (ja) * 2012-07-23 2016-12-07 山形カシオ株式会社 音声変換装置、及びプログラム

Citations (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH04328795A (ja) * 1991-04-30 1992-11-17 Casio Comput Co Ltd 音声変調装置および音声変調装置を内蔵した電子楽器
JPH04352196A (ja) * 1991-05-30 1992-12-07 Casio Comput Co Ltd ディストーション装置
JPH0777979A (ja) * 1993-06-30 1995-03-20 Casio Comput Co Ltd 音声制御音響変調装置
JPH07107053A (ja) * 1993-10-07 1995-04-21 Hitachi Denshi Ltd 信号処理方法
JPH086596A (ja) * 1994-06-21 1996-01-12 Mitsubishi Electric Corp 音声強調装置
JPH1049167A (ja) * 1996-08-06 1998-02-20 Kawai Musical Instr Mfg Co Ltd 電子楽器の音色制御装置
JP2002062886A (ja) * 2000-08-14 2002-02-28 Kazumi Komiya 感度調整機能を有する音声受信装置
JP2002169600A (ja) * 2000-12-04 2002-06-14 Megafusion Corp 音声変調装置
JP2002215195A (ja) * 2000-11-06 2002-07-31 Matsushita Electric Ind Co Ltd 音楽信号処理装置
JP2003050582A (ja) * 2001-08-06 2003-02-21 Yamaha Corp 楽音信号処理装置
JP2003099065A (ja) * 2001-09-21 2003-04-04 Yamaha Corp 波形データ編集方法、波形データ編集装置、プログラムおよび波形メモリの生産方法
JP2003255998A (ja) * 2002-02-27 2003-09-10 Yamaha Corp 歌唱合成方法と装置及び記録媒体
JP2004038071A (ja) * 2002-07-08 2004-02-05 Yamaha Corp 歌唱合成装置、歌唱合成方法及び歌唱合成用プログラム
JP2004061617A (ja) * 2002-07-25 2004-02-26 Fujitsu Ltd 受話音声処理装置

Patent Citations (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH04328795A (ja) * 1991-04-30 1992-11-17 Casio Comput Co Ltd 音声変調装置および音声変調装置を内蔵した電子楽器
JPH04352196A (ja) * 1991-05-30 1992-12-07 Casio Comput Co Ltd ディストーション装置
JPH0777979A (ja) * 1993-06-30 1995-03-20 Casio Comput Co Ltd 音声制御音響変調装置
JPH07107053A (ja) * 1993-10-07 1995-04-21 Hitachi Denshi Ltd 信号処理方法
JPH086596A (ja) * 1994-06-21 1996-01-12 Mitsubishi Electric Corp 音声強調装置
JPH1049167A (ja) * 1996-08-06 1998-02-20 Kawai Musical Instr Mfg Co Ltd 電子楽器の音色制御装置
JP2002062886A (ja) * 2000-08-14 2002-02-28 Kazumi Komiya 感度調整機能を有する音声受信装置
JP2002215195A (ja) * 2000-11-06 2002-07-31 Matsushita Electric Ind Co Ltd 音楽信号処理装置
JP2002169600A (ja) * 2000-12-04 2002-06-14 Megafusion Corp 音声変調装置
JP2003050582A (ja) * 2001-08-06 2003-02-21 Yamaha Corp 楽音信号処理装置
JP2003099065A (ja) * 2001-09-21 2003-04-04 Yamaha Corp 波形データ編集方法、波形データ編集装置、プログラムおよび波形メモリの生産方法
JP2003255998A (ja) * 2002-02-27 2003-09-10 Yamaha Corp 歌唱合成方法と装置及び記録媒体
JP2004038071A (ja) * 2002-07-08 2004-02-05 Yamaha Corp 歌唱合成装置、歌唱合成方法及び歌唱合成用プログラム
JP2004061617A (ja) * 2002-07-25 2004-02-26 Fujitsu Ltd 受話音声処理装置

Also Published As

Publication number Publication date
JP2006010908A (ja) 2006-01-12

Similar Documents

Publication Publication Date Title
CN113241082B (zh) 变声方法、装置、设备和介质
JP2019120892A5 (ja) 音声合成方法、音声合成システムおよびプログラム
JP2008139631A (ja) 音声合成方法、装置、プログラム
US20170024495A1 (en) Method of modeling characteristics of a musical instrument
KR20070100334A (ko) 오디오 파형처리장치, 방식 및 프로그램
JP4654616B2 (ja) 音声効果付与装置及び音声効果付与プログラム
JP6520108B2 (ja) 音声合成装置、方法、およびプログラム
US8492639B2 (en) Audio processing apparatus and method
JP4214842B2 (ja) 音声合成装置及び音声合成方法
JP2015161774A (ja) 音合成方法及び音合成装置
US20140236602A1 (en) Synthesizing Vowels and Consonants of Speech
JP4649888B2 (ja) 音声効果付与装置及び音声効果付与プログラム
EP3772224B1 (en) Vibration signal generation apparatus and vibration signal generation program
JPWO2008010413A1 (ja) 音声合成装置、方法、およびプログラム
JP4428435B2 (ja) ピッチ変換装置とプログラム
JP5251381B2 (ja) 音処理装置およびプログラム
JP4089665B2 (ja) ピッチ変換装置とプログラム
JP5163606B2 (ja) 音声分析合成装置、及びプログラム
JP4513556B2 (ja) 音声分析合成装置、及びプログラム
JP4468506B2 (ja) 音声データ作成装置および声質変換方法
JP3649398B2 (ja) 波形処理方法および装置
WO2017164216A1 (ja) 音響処理方法および音響処理装置
KR100620484B1 (ko) 소리 합성 장치 및 프로그램을 기억한 기억 매체
JP4168700B2 (ja) 音声合成装置、方法及びプログラム
US20230215407A1 (en) Electronic musical instrument, method of generating musical sound, and computer-readable storage medium

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20070323

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20100323

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20100524

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20101124

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20101207

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140107

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

LAPS Cancellation because of no payment of annual fees