JP2011203483A - 音声処理装置 - Google Patents

音声処理装置 Download PDF

Info

Publication number
JP2011203483A
JP2011203483A JP2010070616A JP2010070616A JP2011203483A JP 2011203483 A JP2011203483 A JP 2011203483A JP 2010070616 A JP2010070616 A JP 2010070616A JP 2010070616 A JP2010070616 A JP 2010070616A JP 2011203483 A JP2011203483 A JP 2011203483A
Authority
JP
Japan
Prior art keywords
interpolation
reading
dsp
audio data
processing
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2010070616A
Other languages
English (en)
Inventor
Yukinari Yasuma
幸成 安間
Takayasu Kondo
高康 近藤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Yamaha Corp
Original Assignee
Yamaha Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Yamaha Corp filed Critical Yamaha Corp
Priority to JP2010070616A priority Critical patent/JP2011203483A/ja
Publication of JP2011203483A publication Critical patent/JP2011203483A/ja
Pending legal-status Critical Current

Links

Images

Landscapes

  • Reverberation, Karaoke And Other Acoustics (AREA)

Abstract

【課題】音声信号のピッチを変換する技術において、音質と演算負荷のバランスを調整することのできる技術を提供する。
【解決手段】音声処理装置のDSP19は、波形メモリ18からの音声データの読出速度を変更することによって音声データのピッチを変換する。補間部24は、波形メモリ18から読み出された音声データを、演算負荷の異なる複数の補間処理アルゴリズムのいずれかを用いて補間を行う。DSP負荷計測部23は、DSP19の処理負荷を計測する。制御部22は、DSP負荷計測部23の計測結果に応じて補間部24が行う補間処理を切り替える。
【選択図】図4

Description

本発明は、音声信号のピッチを変換する技術に関する。
カラオケ装置においては、自分の音域に合わないなどの理由により、歌唱者自身が歌いやすいキー(調)で歌唱することを可能にすべく伴奏音のキーをシフトさせる、いわゆるキーコントロールと呼ばれる機能を備えたものがある。特許文献1には、音声波形を表す音声データのバッファへの書込速度と読出速度とを異ならせることにより、音声信号のピッチを変換する技術が開示されている。特許文献1に記載の技術においては、読出速度を変化させることによって音声波形の時間軸方向の伸縮が発生するため、音声データを線形補間やラグランジュ補間等によって補間する処理が行われている。
特許第3451900号公報
ところで、音声データを補間する場合において、ラグランジュ補間などの高次補間は線形補間よりも計算精度が高いため、音質は良いが計算負荷が重いという問題がある。一方、線形補間を用いる場合は、計算負荷は軽いものの音質が悪くなるという問題がある。
本発明は上述した背景の下になされたものであり、音声信号のピッチを変換する技術において、音質と演算負荷のバランスを調整することのできる技術を提供することを目的とする。
上述した課題を解決するため、本発明は、音声波形を表す音声データが予め定められた書込速度で順次書き込まれるバッファと、前記バッファに書き込まれた音声データを、前記書込速度と異なる読出速度で、複数の異なる読出位置から並行して読み出す読出手段と、前記書込速度と等しい速度で読み出しを行う場合の読出位置を基準位置として、前記読出手段が予め定められた時間だけ前記音声データの読み出しを行う毎に、前記読出手段の読出位置を当該基準位置の方向に移動させる読出制御手段と、当該音声処理装置の処理負荷を計測する計測手段と、前記読出手段によって読み出された複数の音声データのそれぞれを、演算負荷の異なる複数の補間態様のいずれかで補間する補間手段であって、前記計測手段の計測結果に応じて前記補間態様を切り替える補間手段と、前記補間手段によって補間された複数の音声データをクロスフェードさせて合成する合成手段とを具備することを特徴とする音声処理装置を提供する。
本発明の好適な態様において、前記補間手段は、前記計測手段によって計測された処理負荷が予め定められた閾値未満である場合には、予め定められた第1のアルゴリズムに従って補間処理を行う一方、それ以外の場合には、前記第1のアルゴリズムよりも処理負荷の低い第2のアルゴリズムに従って補間処理を行ってもよい。
本発明の更に好ましい態様において、前記補間手段は、前記計測手段によって計測される処理負荷の時間変化を計測し、計測結果が予め定められた条件を満たす場合に、前記補間態様を切り替えてもよい。
また、本発明の更に好ましい態様において、利用者によって操作される操作手段から出力される信号に基づいて、前記処理負荷が高くなるか否かを推定する推定手段を具備し、前記補間手段は、前記推定手段によって前記処理負荷が高くなると推定された場合に、前記補間処理に用いるアルゴリズムを処理負荷の低いものに切り替えてもよい。
本発明によれば、音声信号のピッチを変換する技術において、音質と演算負荷のバランスを調整することができる。
音声処理装置のハードウェア構成の一例を示すブロック図である。 ピッチ変換処理の内容を説明するための概念図である。 2系統のバッファ出力信号の読出アドレスとゲインの時間的変化を示す図である。 DSPの機能的構成の一例を示すブロック図である。 DSPの機能的構成の一例を示すブロック図である。
<音声処理装置の構成>
図1は、この発明の一実施形態である音声処理装置1のハードウェア構成を例示したブロック図である。音声処理装置1は、例えば、カラオケ伴奏を再生するカラオケ装置や、パーソナルコンピュータ等の汎用コンピュータである。図において、CPU(Central Processing Unit)11は、ROM(Read Only Memory)12に記憶されているコンピュータプログラムを読み出してRAM(Random Access Memory)13にロードし、これを実行することにより、音声処理装置1の各部を制御する。外部記憶装置14は、ハードディスクや光ディスク等の大容量の記憶手段である。通信I/F15は、通信回線で結ばれた他の装置(例えば、カラオケ装置の管理室のサーバ等)との間でデータの授受を行うインターフェースである。
表示回路16は、液晶ディスプレイ等の表示装置に画像を表示するための回路である。具体的には、例えば、音声処理装置1がカラオケ装置である場合には、動画像や設定画面を表示装置に表示するための回路が表示回路16に相当し、音声処理装置1が汎用コンピュータである場合には、ビデオカードが表示回路16に相当する。入力装置17は、操作された内容に応じた操作信号を出力する操作入力装置である。具体的には、例えば、音声処理装置1がカラオケ装置である場合には、リモコンや装置本体付属の操作子が入力装置17に相当し、音声処理装置1が汎用コンピュータである場合には、キーボードやマウスが入力装置17に相当する。
波形メモリ18は、DSP(Digital Signal Processor)19の処理対象となるデータを一時的に記憶するバッファである。この実施形態では、波形メモリ18は、リング状に書き込み/読み出しを行うリングバッファである。波形メモリ18には、通信I/F15を介して取得される楽曲データや、マイクロホン(図示略)で収音された音声を表す音声信号がA(Analog)/D(Digital)変換されたデータ、外部記憶装置14に記憶された楽曲データ等の、音声波形を表すデータ(以下「音声データ」と称する)が一時的に蓄積される。波形メモリ18としては、音声データのビットデータをサンプリングタイムで入出力する速度に対応できるものが必要である。
DSP19は、波形メモリ18に記憶された音声データに対してピッチ変換処理等の各種デジタル信号処理を行う。D/A変換器20は、DSP19から出力されるデジタル信号をアナログ信号に変換し、アナログの出力信号を取り出す。この出力信号は、増幅器(図示略)を介してスピーカ(図示略)へ出力される。
<ピッチ変換処理の概要>
次に、DSP19が行うピッチ変換処理の概要について図面を参照しつつ説明する。DSP19は、波形メモリ18からの音声データの読出速度を変更することによってピッチの変更を行う。具体的には、DSP19は、ピッチを高くする場合には音声データの読出速度を速くし、ピッチを低くする場合には音声データの読出速度を遅くする。
図2は、DSP19が行うピッチ変換処理の内容を説明するための概念図である。図2において、横軸は経過時間を示し、縦軸は波形メモリ18内のアドレスを示す。すなわち、図2は、時間の経過に伴う音声データの読出位置の変化を概略的に示す図である。図2において、直線S1は、書込速度と等しい速度で読出を行った場合の読出位置(以下「基準位置」)の遷移を示すものである。
波形メモリ18への書き込み及び波形メモリ18からの読み出しは、同一の方向に沿ってリング状に行われる。波形メモリ18へは、予め定められた書込速度(基準のサンプリング周波数)で順次書き込みが行われる。一方、読出を行う場合は、DSP19は、ピッチの変更量に応じて読出速度を変更する。具体的には、ピッチを上げる場合には、DSP19は、書込速度よりも速い速度(図2の直線S2参照)で音声データを読み出す。また、ピッチを下げる場合には、音声処理装置1は、書込速度よりも遅い速度(図2の直線S3参照)で音声データを読み出す。
ここで、読出速度を変更することにより発生する問題点とその対応について図面を参照しつつ説明する。図2に示すように、ピッチアップしたときの波形読出アドレスの遷移(図2の直線S2参照)は、ピッチシフトしない場合(図2の直線S1参照)よりも速くアドレスが進む。すなわち、読出速度を速くした場合には音声データの再生時間が短くなってしまう。一方、ピッチダウンしたときの波形読出アドレスの遷移(図2の直線S3参照)は、ピッチシフトしない場合よりも遅くなる。すなわち、読出速度を遅くした場合には音声データの再生時間が長くなってしまう。このように、波形の読出速度を変更することにより時間の伸縮が発生してしまい、音声のテンポが変化してしまう。更に、読出位置がアドレスの書込位置を追い抜いてしまい、リングバッファの1周期前のデータを読み出してしまう可能性がある。
そこで、この実施形態では、DSP19は、書込速度と等しい速度で読み出した場合の読出位置(基準位置)からのずれが大きくなったときに、読出位置を基準位置に戻すことにより時間的な伸縮の発生を回避する。すなわち、DSP19は、予め定められた時間だけ音声データの読出を行う毎に、読出位置(アドレス)を基準位置に移動させる(ジャンプさせる)処理を行う。具体的には、図2に示す例においてピッチを上げる場合には、DSP19は、時刻t1,t2,t3,t4,t5において波形アドレスの読出位置を基準位置にジャンプさせる(図2のS4参照)。ピッチを下げる場合も同様であり、DSP19は、時刻t1,t2,t3,t4,t5において波形アドレスの読出位置を基準位置にジャンプさせる(図2のS5参照)。
次いで、アドレス(読出位置)をジャンプさせることにより発生する問題点とその対応について図面を参照しつつ説明する。読出アドレスを所定間隔毎にジャンプさせる処理を行うことによって、アドレスをジャンプさせるタイミングにおいて波形の不連続が発生する。この波形の不連続によって出力音声にノイズが発生してしまう。そこで、この実施形態では、ノイズの発生を軽減するために、波形の読出処理を2系統設け、その2系統の出力を交互にクロスフェードすることにより、波形不連続によるノイズの発生を軽減させる。クロスフェードとは、2つの信号のうちひとつをフェードアウトし、他方をフェードインして継ぎ目なく信号を接続する技術である。
図3は、2系統のバッファ出力信号(以下、「バッファ出力信号18A、18B」という)のそれぞれの読出アドレス(以下「読出アドレス24A、24B」という)とゲインの時間的変化を示す図である。図3の(A)は、バッファ出力信号18Aのゲインの時間変化を表す図であり、横軸は経過時間を示し、縦軸はゲインを示す。(B)は、基準位置に対するバッファ出力信号18Aの読出位置の差分の変化を表す図であり、横軸は経過時間を示し、縦軸は基準位置に対するバッファ出力信号18Aの読出位置のアドレス差を示す。(C)は、バッファ出力信号18Bのゲインの時間変化を表す図であり、横軸は経過時間を示し、縦軸はゲインを示す。(D)は、基準位置に対するバッファ出力信号18Bの差分の変化を表す図であり、横軸は経過時間を示し、縦軸は基準位置に対するバッファ出力信号18Bの読出位置のアドレス差を示す。
ところで、上述した図2に示す例においては、DSP19は、基準位置からのずれが大きくなったときに、読出アドレスを基準位置にジャンプさせるようにしたが、図3の(B),(D)に示す例においては、DSP19は、基準位置からのずれが大きくなったときに、読出アドレスを基準位置の方向に予め定められた量だけ移動させる処理を行う。DSP19が行う読出アドレスのジャンプ処理の態様は、図2に例示する態様であってもよく、また、図3に例示する態様であってもよく、また、これ以外の態様であってもよく、要は、DSP19は、予め定められた時間だけ音声データの読出を行う毎に、読出位置を基準位置の方向に移動させる(ジャンプさせる)処理を行うものであればよい。
DSP19は、バッファ出力信号の読出アドレスをジャンプさせるタイミングで、ジャンプする側のバッファ出力信号のゲインを0%にする一方、他方の出力を100%にする。これにより、アドレスのジャンプによるノイズが軽減される。具体的には、図3において、バッファ出力信号18Aの読出アドレス24Aをジャンプさせるタイミング(図3(B)の時刻t12,t14,t16,t18,t20参照)で、バッファ出力信号18Aのゲインが常にゼロとなるように制御する(図3(A)の時刻t12,t14,t16,t18,t20参照)。これにより、バッファ出力信号18Aの波形不連続によるノイズの発生が軽減される。バッファ出力信号18Bについても同様であり、バッファ出力信号18Bの読出アドレス24Bをジャンプさせるタイミング(図3(D)の時刻t11,t13,t15,t17,t19参照)で、バッファ出力信号18Bのゲインが常にゼロとなるように制御する(図3(D)の時刻t11,t13,t15,t17,t19参照)。これにより、バッファ出力信号18Bの波形不連続によるノイズの発生が軽減される。
また、図示のように、読出アドレス24A、24Bのジャンプを発生させる時刻を異ならせている。これにより、アドレスのジャンプの発生時刻が重ならないから、アドレスのジャンプによるノイズが軽減される。
ピッチを下げる場合には、図3において読出アドレス24A、24Bのグラフは基準位置S1に対して反転した形状となる。
以上がこの実施形態においてDSP19が行うピッチ変換処理の概要である。
<DSPの構成>
次に、図4を参照しつつ、上述したピッチ変換処理に係るDSP19の機能的構成について詳述する。図において、ピッチ変換部191は、入力する音声データのピッチを変換するものである。なお、DSP19はピッチ変換処理以外にも種々の処理を実行するが、図4においては、説明の理解を容易にするため、ピッチ変換部191のみを図示しており、その他の処理に係る構成についてはその記載を省略する。図において、波形解析部21は、音声データの波形を解析するものである。波形解析部21は、LPF211と基本周期検出部212とアタック検出部213とを備えている。LPF211は音声データから低周波成分のみを取り出すためのフィルタである。音声データをLPF211に通すことによって高周波成分がカットされ、基本周期の検出が容易になる。基本周期検出部212は、LPF211を通した音声データから基本周期を検出し、検出結果を制御部22へ送る。基本周期検出部212の基本周期の検出の方法としては、例えばFFT変換により信号の周波数成分を検出することにより行う。アタック検出部213は、音声データからアタックを検出する。ここで、アタックとは、平均的な音声の波高レベルよりも極端に高い部分又は振幅上昇が急激な信号の区間である。アタック検出部213は、所定の時間間隔毎に切り出した音声データのエネルギー和をそれぞれ計算し、平均的な音声の波高レベルより極端に高い区間、又はエネルギーの増加が急激な区間を、アタックとして検出する。アタック検出部213は、アタックの検出結果を示す信号を制御部22に出力する。
DSP負荷計測部23は、DSP19によって行われる処理の負荷を計測し、当該計測値を出力する。負荷の計測は、例えば、DSP19の処理速度であるMIPS(Million Instructions Per Second)値を計測することによって行われる。すなわち、DSP19が1命令を実行する時間を計測し、1秒間に実行される命令数を算出することによって計測される。なお、DSP19の処理負荷を計測する方法はこれに限定されるものではなく、他の方法で処理負荷を計測してもよい。
制御部22は、波形解析部21の解析結果及びDSP負荷計測部23の計測結果に基づいて、補間部24やクロスフェードゲイン計算部26に指示を送る。具体的には、例えば、制御部22は、基本周期検出部212の検出した周期に基づいてクロスフェード時に合成するバッファ出力信号18A、18Bの基本周期の位相が合うように、クロスフェード開始時、終了時を調整する指示をクロスフェードゲイン計算部26に送る。また、急峻に音量が変動するアタックの場合には、アタックの部分は急激な音量変化を伴うため、波形の接続により2度打ちが生じやすいことから、クロスフェード合成部27の動作をとめて、バッファ出力信号18A、18Bのいずれかの出力をそのまま出すように、クロスフェードゲイン計算部26に指示を送る。また、制御部22は、DSP負荷計測部23の計測結果に基づいて、補間部24の補間処理の処理態様を切り替えるように補間部24を制御する。
読出アドレス制御部25は、制御部22からの指示に基づいて、波形メモリ18における音声データの読出位置を算出して、読出アドレスを指示する。上述したように、読出アドレス制御部25は、ピッチを上げる場合には読出速度を速くする一方、ピッチを下げる場合には読出速度を遅くする。バッファ出力信号18A、18Bは、読出アドレス制御部25の指示に従って波形メモリ18から読み出され、補間部24に送られる。
なお、読出速度を速めたり、遅くしたりしてバッファ出力信号の時間軸圧伸を行う場合には、指定されたピッチ変換率に正確に対応する圧伸を行おうとすると読出アドレスは小数点以下を含むことになる。そこで、波形メモリ18の出力を補間部24で合成する。
補間部24は、制御部22の制御の下、波形メモリ18から読み出された複数の音声データのそれぞれを、演算負荷の異なる複数の補間処理のいずれかで補間を行う。より具体的には、この実施形態では、補間部24は、制御部22の指示に応じて、線形補間又はラグランジュ補間によって補間処理を行う。補間部24は、補間処理を施した音声データをクロスフェード合成部27に供給する。
制御部22は、DSP負荷計測部23の計測結果に基づいて、補間部24の補間処理の処理態様を切り替えるように補間部24を制御する。より具体的には、この実施形態では、制御部22は、DSP負荷計測部23によって計測された処理負荷が予め定められた閾値未満である場合には、ラグランジュ補間処理を行うように補間部24に指示を送る一方、それ以外の場合(処理負荷が閾値以上である場合)には、ラグランジュ補間よりも処理負荷の低い線形補間を行うように補間部24に指示を送る。この判定処理に用いられる閾値は、DSP19がラグランジュ補間処理を行う場合に増加する処理負荷を考慮して予め設定された値であることが好ましい。制御部22は、補間アルゴリズムを切り替えるか否かの判定処理を、予め定められた単位時間毎に行い、切り替える場合にはその旨を指示する信号を補間部24に送る。
クロスフェードゲイン計算部26は、クロスフェード合成部27におけるクロスフェードのゲインカーブを計算し、クロスフェード合成部27にゲインの指示を行う。クロスフェード合成部27は、クロスフェードゲイン計算部26の指示に基づいて、バッファ出力信号18A、18Bのゲインをそれぞれ調整し、ゲインが調整されたバッファ出力信号18A、18Bを加算し、D/A変換器20に出力する。すなわち、クロスフェード合成部27は、バッファ出力信号18A、18Bをクロスフェードさせて合成する。
このとき、クロスフェードゲイン計算部26は、ゲイン一定の区間がなく連続的に小刻みにクロスフェードを行うようゲイン調整しているので、ジャンプするアドレス量が小さくなり、音色のずれを小さくすることができる。このように連続的にクロスフェードさせる場合には、いずれのクロスフェード時間においてもクロスフェードする信号の基本周期の位相をそろえた方が滑らかにクロスフェードさせることができる。そこで、クロスフェード時の基本周期の位相をそろえるため、図1で説明した基本周期検出部212は、基本周期を求めている。制御部22は、この基本周期をクロスフェードゲイン計算部26に指示する。クロスフェードゲイン計算部26は、この基本周期の位相をそろえるため、バッファ出力信号18Aのゲインをフェードアウトさせるとき、フェードアウト区間長をこの基本周期の整数倍とする。また、クロスフェードゲイン計算部26は、これに合わせてバッファ出力信号18Bのゲインをフェードインさせるとき、フェードイン区間長をこの基本周期の整数倍とする。バッファ出力信号18Aのゲインをフェードインさせるときも同様である。
ところで、補間処理において、ラグランジュ補間などの高次補間は線形補間よりも計算精度が高いため、音質は良いが計算負荷が重いという問題がある。そのため、DSP19の処理状況によっては使用率が100%に近くなってしまう場合がある。一方、線形補間を用いる場合は、計算負荷は軽いものの音質が悪くなってしまう場合がある。
それに対しこの実施形態では、DSP19の処理負荷を計測し、計測結果に応じて補間処理の処理アルゴリズムを切り替えるから、これにより、ピッチを変換する装置において、処理負荷が重くなりすぎるのを防ぎつつ、高音質の音声データを出力することができる。
<変形例>
以上、本発明の実施形態について説明したが、本発明は上述した実施形態に限定されることなく、他の様々な形態で実施可能である。以下にその一例を示す。なお、以下の各態様を適宜に組み合わせてもよい。
(1)上述の実施形態では、DSP19は、2系統のバッファ出力信号18A、18Bを合成して出力したが、合成する音声データの数は2に限らず、3以上の出力タップを設け、3以上の音声データを合成するようにしてもよい。
(2)上述の実施形態において、制御部22が、DSP19の処理負荷が予め定められた閾値を予め定められた時間以上継続して下回っているか否かを判定するようにしてもよい。より具体的には、制御部22は、DSP19の処理負荷が予め定められた閾値を予め定められた時間以上継続して上回っている場合に補間処理アルゴリズムを線形補間アルゴリズムに切り替えるようにしてもよい。このようにすることで、補間アルゴリズムが不必要に頻繁に切り替えられるのを防ぐことができる。
(3)上述の実施形態では、DSP19は、線形補間とラグランジュ補間との2種類の補間アルゴリズムのうちのいずれかを用いて補間処理を行ったが、補間処理の態様はこれに限らず、例えばスプライン補間等の他の補間アルゴリズムを用いて補間処理を行うようにしてもよい。また、DSP19が用いる補間アルゴリズムの数は2に限らず、これより多くてもよい。要は、DSP19は、演算負荷の異なる複数の補間処理のいずれかで補間するものであって、DSP負荷計測部23の計測結果に応じて補間処理の態様を切り替えるものであればよい。
また、補間アルゴリズムの切替処理においては、補間アルゴリズムそのものを切り替えるようにしてもよく、また、例えば、補間アルゴリズムで用いるパラメータの数や種類を切り替えるようにしてもよい。
(4)上述の実施形態において、DSP19は、音声データの振幅がゼロになるタイミングで補間アルゴリズムを切り替えるようにしてもよい。このようにすることによって、波形の不連続によるノイズの発生をより軽減することができる。
(5)上述の実施形態において、制御部22が、DSP負荷計測部23によって計測される処理負荷の時間変化を計測し、計測結果が予め定められた条件を満たす場合に、補間処理の処理態様を切り替えるようにしてもよい。すなわち、現在の処理負荷を補間処理に反映させるのではなく、過去の処理負荷の変化から将来の処理負荷を予測し、予め将来の処理負荷に備えて、必要ならば適切な補間処理に切り替えておくのである。具体的には、例えば、制御部22が、計測された処理負荷の微分値(傾き)を算出し、算出した傾きが所定時間以上継続して閾値を上回った場合に、測定以後の処理負荷が高くなると判定して処理負荷の低い補間処理に切り替えるようにしてもよい。また、例えば、制御部22が、算出した微分値が所定時間以上継続して増加している場合に、処理負荷の低い補間処理に切り替えるようにしてもよい。
(6)上述の実施形態において、CPU11又はDSP19が、音声処理装置1の利用者の操作に応じて処理負荷の変化を推定し、推定結果に応じて、補間アルゴリズムを切り替えるか否かを判定するようにしてもよい。この態様においては、CPU11又はDSP19が、利用者によって操作される入力装置17から出力される信号に基づいて、処理負荷の変化を推定する。この推定処理としては、例えば、処理負荷が高くなると推定される操作内容をリストで予め保持しておき、入力装置17から出力される信号に対応する操作内容をこのリストと照合することによって判定してもよい。また、例えば、操作内容とその操作内容に対応する処理負荷値とを対応付けたテーブルを予め保持しておき、入力装置17から出力される信号に対応する操作内容から処理負荷値を特定するようにしてもよい。
(7)上述の実施形態において、補間処理の切替判定に用いる閾値を、音声処理装置1の利用者が入力装置17を用いて設定できるようにしてもよい。また、例えば、楽曲データに閾値を付加しておく構成とし、制御部22が、楽曲データに付与された閾値を用いて補間処理の切替判定を行うようにしてもよい。
(8)上述の実施形態において、DSP19が、複数の音声データに対してピッチ変換処理を並行して行うようにしてもよい。この場合のDSP19の機能的構成について、図5を参照しつつ説明する。図5は、DSP19の機能的構成の一例を示すブロック図であり、上述した実施形態における図4に対応するものである。図5において、図4と同様の構成については同じ符号を付して適宜その説明を省略する。図5に示す例では、DSP19は、カラオケ伴奏を行う際に、ガイドボーカル音声データ、伴奏Aの音声データ、伴奏Bの音声データの3種類の音声データに対してそれぞれ個別にピッチ変換処理を行う。図5において、ピッチ変換部191A,191B,191Cはそれぞれ、図4に示したピッチ変換部191と同様の構成を有するものであり、ここではその詳細な説明を省略する。ピッチ変換部191Aは、ガイドボーカル音声データに対してピッチ変換処理を施すものである。ピッチ変換部191Bは、伴奏Aの音声データに対してピッチ変換処理を施すものである。ピッチ変換部191Cは伴奏Bの音声データに対してピッチ変換処理を施すものである。合成部192は、ピッチ変換部191A,191B,191Cから出力される、ピッチ変換処理が施された音声データを合成して、D/A変換器20に出力する。
ピッチ変換部191A,191B,191Cも上述した図4に示したピッチ変換部191と同様に、DSP19の処理負荷を計測し、計測結果に応じて補間処理に用いる補間アルゴリズムを切り替える処理を行う。
図5に示す例では、DSP19は、3種類の音声データ(ガイドボーカル音声データ、伴奏Aの音声データ、伴奏Bの音声データ)に対するピッチ変換処理を並行して行うため、DSP19に対する処理負荷が大きくなりすぎる場合がある。この態様においては、DSP19が処理負荷を計測し、計測結果に応じて補間処理を行う際の補間アルゴリズムを切り替えるから、これにより、DSP19に対する処理負荷が重くなりすぎるのを防ぎつつ、高品質の音声データを出力することができる。
図5に示す態様において、補間処理の切替判定の態様を、ピッチ変換部191A,191B,191Cのそれぞれで異ならせるようにしてもよい。具体的には、例えば、補間処理の切替判定に用いる閾値を、ピッチ変換部191A,191B,191Cのそれぞれで異ならせるようにしてもよい。より具体的には、例えば、音質を重視すべき音声データについては閾値を高く設定しておいて可能な限り精度の高い補間処理を行うようにする一方、それ以外の音声データについては閾値を低く設定しておくようにしてもよい。
この態様において、複数の閾値は予め定められた値が設定されていてもよく、また、楽曲データの各々に閾値を付加しておく構成としてもよい。また、どの音声データの閾値を高くするか(すなわちどの音声データの音質を優先させるか)を利用者が入力装置17を用いて設定できるようにしてもよい。このようにすることで、利用者の所望する態様(例えば、ガイドボーカルの音質をできるだけ高くしたい等)の音声データを出力することができる。
(9)上述の実施形態における音声処理装置1のCPU11、DSP19によって実行されるプログラムは、磁気記録媒体(磁気テープ、磁気ディスクなど)、光記録媒体(光ディスクなど)、光磁気記録媒体、半導体メモリなどの、コンピュータが読取可能な記録媒体に記録した状態で提供し得る。また、インターネットのようなネットワーク経由で音声処理装置1にダウンロードさせることも可能である。
1…音声処理装置、11…CPU、12…ROM、13…RAM、14…外部記憶装置、15…通信I/F、16…表示回路、17…入力装置、18…波形メモリ、19…DSP、20…D/A変換器、21…波形解析部、22…制御部、23…DSP負荷計測部、24…補間部、25…読出アドレス制御部、26…クロスフェードゲイン計算部、27…クロスフェード合成部、191…ピッチ変換部、192…合成部、211…LPF、212…基本周期検出部、213…アタック検出部。

Claims (3)

  1. 音声波形を表す音声データが予め定められた書込速度で順次書き込まれるバッファと、
    前記バッファに書き込まれた音声データを、前記書込速度と異なる読出速度で、複数の異なる読出位置から並行して読み出す読出手段と、
    前記書込速度と等しい速度で読み出しを行う場合の読出位置を基準位置として、前記読出手段が予め定められた時間だけ前記音声データの読み出しを行う毎に、前記読出手段の読出位置を当該基準位置の方向に移動させる読出制御手段と、
    当該音声処理装置の処理負荷を計測する計測手段と、
    前記読出手段によって読み出された複数の音声データのそれぞれを、演算負荷の異なる複数の補間態様のいずれかで補間する補間手段であって、前記計測手段の計測結果に応じて前記補間態様を切り替える補間手段と、
    前記補間手段によって補間された複数の音声データをクロスフェードさせて合成する合成手段と
    を具備することを特徴とする音声処理装置。
  2. 前記補間手段は、前記計測手段によって計測された処理負荷が予め定められた閾値未満である場合には、予め定められた第1のアルゴリズムに従って補間処理を行う一方、それ以外の場合には、前記第1のアルゴリズムよりも処理負荷の低い第2のアルゴリズムに従って補間処理を行う
    ことを特徴とする請求項1に記載の音声処理装置。
  3. 前記補間手段は、前記計測手段によって計測される処理負荷の時間変化を計測し、計測結果が予め定められた条件を満たす場合に、前記補間態様を切り替える
    ことを特徴とする請求項1又は2に記載の音声処理装置。
JP2010070616A 2010-03-25 2010-03-25 音声処理装置 Pending JP2011203483A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2010070616A JP2011203483A (ja) 2010-03-25 2010-03-25 音声処理装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2010070616A JP2011203483A (ja) 2010-03-25 2010-03-25 音声処理装置

Publications (1)

Publication Number Publication Date
JP2011203483A true JP2011203483A (ja) 2011-10-13

Family

ID=44880181

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2010070616A Pending JP2011203483A (ja) 2010-03-25 2010-03-25 音声処理装置

Country Status (1)

Country Link
JP (1) JP2011203483A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2020187377A (ja) * 2013-12-27 2020-11-19 ソニー株式会社 復号化装置および方法、並びにプログラム

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3451900B2 (ja) * 1997-09-22 2003-09-29 ヤマハ株式会社 ピッチ/テンポ変換方法及び装置
JP2005292375A (ja) * 2004-03-31 2005-10-20 Yamaha Corp オーディオ再生装置およびクロック周波数制御方法
JP2008249971A (ja) * 2007-03-30 2008-10-16 Kenwood Corp 音声信号処理装置、音声信号処理方法及びプログラム
JP2009025340A (ja) * 2007-07-17 2009-02-05 Nec Electronics Corp オーディオデータ再生装置及びオーディオデータ再生速度制御方法

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3451900B2 (ja) * 1997-09-22 2003-09-29 ヤマハ株式会社 ピッチ/テンポ変換方法及び装置
JP2005292375A (ja) * 2004-03-31 2005-10-20 Yamaha Corp オーディオ再生装置およびクロック周波数制御方法
JP2008249971A (ja) * 2007-03-30 2008-10-16 Kenwood Corp 音声信号処理装置、音声信号処理方法及びプログラム
JP2009025340A (ja) * 2007-07-17 2009-02-05 Nec Electronics Corp オーディオデータ再生装置及びオーディオデータ再生速度制御方法

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2020187377A (ja) * 2013-12-27 2020-11-19 ソニー株式会社 復号化装置および方法、並びにプログラム
JP2021177260A (ja) * 2013-12-27 2021-11-11 ソニーグループ株式会社 復号化装置および方法、並びにプログラム
JP7215534B2 (ja) 2013-12-27 2023-01-31 ソニーグループ株式会社 復号化装置および方法、並びにプログラム
US11705140B2 (en) 2013-12-27 2023-07-18 Sony Corporation Decoding apparatus and method, and program

Similar Documents

Publication Publication Date Title
US9087501B2 (en) Sound signal analysis apparatus, sound signal analysis method and sound signal analysis program
US20100260353A1 (en) Noise reducing device and noise determining method
JP2007133035A (ja) デジタル録音装置,デジタル録音方法,そのプログラムおよび記憶媒体
JP2012032648A (ja) 機械音抑圧装置、機械音抑圧方法、プログラムおよび撮像装置
JP2011237753A (ja) 信号処理装置および方法、並びにプログラム
KR20000068955A (ko) 음성처리방법, 음성처리장치 및 기록재생장치
US10535363B2 (en) Audio processing apparatus and control method thereof
WO2015020025A1 (ja) 音高補正装置及び音高補正方法
JP4622908B2 (ja) 信号処理装置
JP2010020122A (ja) ディジタル音響信号処理方法及び処理装置
WO2020105195A1 (ja) 映像制御装置、及び映像制御方法
US9087503B2 (en) Sampling device and sampling method
JP2011203483A (ja) 音声処理装置
JP3008922B2 (ja) 楽音発生装置および楽音発生方法
JP2013170936A (ja) 音源位置判定装置、音源位置判定方法、プログラム
JP2011203482A (ja) 音声処理装置
JP2009229921A (ja) 音響信号分析装置
JP2014186347A (ja) 話者速度変換システムおよびその方法ならびに速度変換装置
US10891966B2 (en) Audio processing method and audio processing device for expanding or compressing audio signals
US11348596B2 (en) Voice processing method for processing voice signal representing voice, voice processing device for processing voice signal representing voice, and recording medium storing program for processing voice signal representing voice
JP5287509B2 (ja) フレーム補間装置、フレーム補間方法、及び、フレーム補間プログラム
JP7275711B2 (ja) オーディオ信号の処理方法
JP5807419B2 (ja) 信号処理装置
JP4206409B2 (ja) 音声処理装置、その方法、プログラム、及びそのプログラムを記録した記録媒体
JP5407745B2 (ja) オーディオ再生装置

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20130121

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20130913

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20130924

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20131111

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20140212