JP2000305600A - 音声信号処理装置及び方法、情報媒体 - Google Patents
音声信号処理装置及び方法、情報媒体Info
- Publication number
- JP2000305600A JP2000305600A JP11113861A JP11386199A JP2000305600A JP 2000305600 A JP2000305600 A JP 2000305600A JP 11113861 A JP11113861 A JP 11113861A JP 11386199 A JP11386199 A JP 11386199A JP 2000305600 A JP2000305600 A JP 2000305600A
- Authority
- JP
- Japan
- Prior art keywords
- frequency
- audio signal
- signal
- pitch
- processing unit
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Landscapes
- Reverberation, Karaoke And Other Acoustics (AREA)
- Electrophonic Musical Instruments (AREA)
Abstract
(57)【要約】
【課題】 従来に比べて簡単な回路構成で処理時間も比
較的短く、しかも音質の劣化がなくて個人の声の特徴を
維持したままの自然な音声音程変換を可能とする。 【解決手段】 処理単位分割部23はデジタル音声信号
をフレーム毎に切り出す。基本周期抽出部31はフレー
ムの音声信号の基本(ピッチ)周波数を抽出する。変換
部24はフレームの音声信号を周波数領域の信号へ変換
する。音程変換部25は全周波数帯域を高域側または低
域側にシフトする。倍音構造操作部26はピッチ周波数
に基づいて音声信号の倍音構造を操作する。逆変換部2
7は倍音構造が操作された信号を時間領域の信号に逆変
換する。処理単位間接続部28はフレームの初期位相と
ピッチ周期に基づいて逆変後のフレーム位間を接続す
る。
較的短く、しかも音質の劣化がなくて個人の声の特徴を
維持したままの自然な音声音程変換を可能とする。 【解決手段】 処理単位分割部23はデジタル音声信号
をフレーム毎に切り出す。基本周期抽出部31はフレー
ムの音声信号の基本(ピッチ)周波数を抽出する。変換
部24はフレームの音声信号を周波数領域の信号へ変換
する。音程変換部25は全周波数帯域を高域側または低
域側にシフトする。倍音構造操作部26はピッチ周波数
に基づいて音声信号の倍音構造を操作する。逆変換部2
7は倍音構造が操作された信号を時間領域の信号に逆変
換する。処理単位間接続部28はフレームの初期位相と
ピッチ周期に基づいて逆変後のフレーム位間を接続す
る。
Description
【0001】
【発明の属する技術分野】本発明は、いわゆるカラオケ
装置や音響映像編集装置等に使用され、音声の音の高さ
(音程、すなわちピッチ周波数、基本周波数)を変換す
る音声信号処理装置及び方法、並びに情報媒体に係り、
特に、音質の劣化が無く、かつ個人の声の特徴を残した
ままで音声の音程を容易に変換することのできる音声信
号処理装置及び方法、並びに、その音程変換を実現する
ためのプログラムデータを記録若しくは伝送する情報媒
体に関する。
装置や音響映像編集装置等に使用され、音声の音の高さ
(音程、すなわちピッチ周波数、基本周波数)を変換す
る音声信号処理装置及び方法、並びに情報媒体に係り、
特に、音質の劣化が無く、かつ個人の声の特徴を残した
ままで音声の音程を容易に変換することのできる音声信
号処理装置及び方法、並びに、その音程変換を実現する
ためのプログラムデータを記録若しくは伝送する情報媒
体に関する。
【0002】
【従来の技術】従来より、いわゆるカラオケ装置等で
は、歌う人の音域に合わせるために、演奏される伴奏の
音程を自由に変化させて設定することができるキーコン
トロールと呼ばれる機能が付いている。これは、伴奏と
して再生されるアナログ音声信号の再生速度を変化させ
ることにより、音程を変化させている。
は、歌う人の音域に合わせるために、演奏される伴奏の
音程を自由に変化させて設定することができるキーコン
トロールと呼ばれる機能が付いている。これは、伴奏と
して再生されるアナログ音声信号の再生速度を変化させ
ることにより、音程を変化させている。
【0003】また、近年では、センタに曲のデータを蓄
積しておき、このセンタに複数接続されている遠隔地の
端末装置に必要に応じて曲のデータを送信して、端末装
置で曲を再生する通信カラオケが開発されている。
積しておき、このセンタに複数接続されている遠隔地の
端末装置に必要に応じて曲のデータを送信して、端末装
置で曲を再生する通信カラオケが開発されている。
【0004】この通信カラオケのセンタから端末装置に
送信される曲のデータは、曲に合わせて歌詞を表示する
と共に、その表示色を変更するための文字データと、曲
の伴奏を再生するために端末装置のシンセサイザを動作
させるMIDI信号と、男性又は女性の声による肉声バ
ックコーラスを端末装置で再生するための圧縮された音
声信号とで構成されている。そして、この通信カラオケ
の端末装置において、演奏される伴奏の音程を変える場
合、MIDI信号で再生されるシンセサイザの音程を、
全体的に上げる(又は下げる)ように設定することによ
り、再生速度を変えることなく音程を自由に変えて再生
することができる。
送信される曲のデータは、曲に合わせて歌詞を表示する
と共に、その表示色を変更するための文字データと、曲
の伴奏を再生するために端末装置のシンセサイザを動作
させるMIDI信号と、男性又は女性の声による肉声バ
ックコーラスを端末装置で再生するための圧縮された音
声信号とで構成されている。そして、この通信カラオケ
の端末装置において、演奏される伴奏の音程を変える場
合、MIDI信号で再生されるシンセサイザの音程を、
全体的に上げる(又は下げる)ように設定することによ
り、再生速度を変えることなく音程を自由に変えて再生
することができる。
【0005】ところが、肉声のバックコーラスは、MI
DI信号でないため、音程に関連するデータを備えてお
らず、再生速度を変えない状態で、音質の劣化がなく、
しかも個人の声の特徴を残したままで、音声の音程を変
換することは困難であった。
DI信号でないため、音程に関連するデータを備えてお
らず、再生速度を変えない状態で、音質の劣化がなく、
しかも個人の声の特徴を残したままで、音声の音程を変
換することは困難であった。
【0006】また、近年の音響映像編集装置は、デジタ
ル信号の状態で編集作業を行うものも開発されてきてい
るが、高品質を維持したままで音声の音程を変化させる
のは困難であった。
ル信号の状態で編集作業を行うものも開発されてきてい
るが、高品質を維持したままで音声の音程を変化させる
のは困難であった。
【0007】これまでの音声の再生速度を一定に保った
ままで音声の音程を変換する方法としては、主として二
通りの方法が考えられている。
ままで音声の音程を変換する方法としては、主として二
通りの方法が考えられている。
【0008】一つは、音声波形を時間領域で操作する方
法であり、例えばピッチ周波数を2倍に上げる場合、音
声信号を所定時間毎に切り出して、この切り出し区間毎
に2倍の速度でデータを読み出すようにしている。そし
て、この場合、切り出した区間のデータからピッチ周波
数(ピーク周波数のうち最も低い周波数)を求め、2倍
のピッチ周波数である波形を付け加えることで、時間を
変えずにピッチ周波数のみ2倍に上げることができる。
さらに、このような処理をした切り出し区間をスムーズ
につなげることによって、音程変換を実現することがで
きるが、現実には、つなげ方によって音質を損ねたり、
個人の声の特徴が維持されず不自然な音声となってしま
うので、現在も各種改善方法が提案されている状態であ
る。
法であり、例えばピッチ周波数を2倍に上げる場合、音
声信号を所定時間毎に切り出して、この切り出し区間毎
に2倍の速度でデータを読み出すようにしている。そし
て、この場合、切り出した区間のデータからピッチ周波
数(ピーク周波数のうち最も低い周波数)を求め、2倍
のピッチ周波数である波形を付け加えることで、時間を
変えずにピッチ周波数のみ2倍に上げることができる。
さらに、このような処理をした切り出し区間をスムーズ
につなげることによって、音程変換を実現することがで
きるが、現実には、つなげ方によって音質を損ねたり、
個人の声の特徴が維持されず不自然な音声となってしま
うので、現在も各種改善方法が提案されている状態であ
る。
【0009】もう一つは、フーリエ変換を用いて周波数
領域で操作する方法である。音声信号を所定時間毎に切
り出し、フーリエ変換によって周波数の振幅成分と周波
数の位相成分とを抽出する。次に、全周波数帯域を所望
のシフト量分だけ周波数シフト及び位相シフトし、逆フ
ーリエ変換した後、切り出し区間をつなげていく方法で
ある。しかし、この方法によっても不自然な音声となっ
てしまい、うまく音程変換ができない。
領域で操作する方法である。音声信号を所定時間毎に切
り出し、フーリエ変換によって周波数の振幅成分と周波
数の位相成分とを抽出する。次に、全周波数帯域を所望
のシフト量分だけ周波数シフト及び位相シフトし、逆フ
ーリエ変換した後、切り出し区間をつなげていく方法で
ある。しかし、この方法によっても不自然な音声となっ
てしまい、うまく音程変換ができない。
【0010】なお、フーリエ変換後、ピークスペクトル
(ピッチ周波数)を検出し、このピークスペクトル付近
の周波数信号のみをシフトする方法が本出願人により既
に提案され、特開昭59−204096号公報に開示さ
れている。また、それに加えて、本出願人は特開平9−
185392号公報において、処理単位(フレームと表
現している)間で波形を滑らかに繋げるために、窓関数
を用いて接続を行う方法を開示している。
(ピッチ周波数)を検出し、このピークスペクトル付近
の周波数信号のみをシフトする方法が本出願人により既
に提案され、特開昭59−204096号公報に開示さ
れている。また、それに加えて、本出願人は特開平9−
185392号公報において、処理単位(フレームと表
現している)間で波形を滑らかに繋げるために、窓関数
を用いて接続を行う方法を開示している。
【0011】
【発明が解決しようとする課題】ところで、ピークスペ
クトル付近の周波数信号のみをシフトする方法は、ピー
クスペクトルの倍音成分がそのまま残っているため、聴
覚において元の音程が容易に想像されてしまい、倍音成
分による元の音程とシフトした後の音程との2重の音程
が聞こえてしまうという問題がある。
クトル付近の周波数信号のみをシフトする方法は、ピー
クスペクトルの倍音成分がそのまま残っているため、聴
覚において元の音程が容易に想像されてしまい、倍音成
分による元の音程とシフトした後の音程との2重の音程
が聞こえてしまうという問題がある。
【0012】また、処理単位間で波形を滑らかに繋げる
ために、窓関数を用いて接続を行う方法では、音程変換
された後の信号の周期によっては出力の振幅が極めて小
さくなることが起こり得る。このため、再生される音
は、音質の点で問題が多い。
ために、窓関数を用いて接続を行う方法では、音程変換
された後の信号の周期によっては出力の振幅が極めて小
さくなることが起こり得る。このため、再生される音
は、音質の点で問題が多い。
【0013】さらに、例えばVTRやテープレコーダ等
において、解説やナレーション等の音声を高速再生する
際に、高くなってしまうピッチ周波数を元に戻して、聞
き取りやすくするなど、カラオケのキーコントロール以
外でも、音声のピッチ周波数を自由に変換したいという
要求もある。
において、解説やナレーション等の音声を高速再生する
際に、高くなってしまうピッチ周波数を元に戻して、聞
き取りやすくするなど、カラオケのキーコントロール以
外でも、音声のピッチ周波数を自由に変換したいという
要求もある。
【0014】そこで、本発明は、上述の課題に鑑みてな
されたものであり、従来に比べて簡単な回路構成で処理
時間も比較的短く、しかも音質の劣化がなくて個人の声
の特徴を維持したままの自然な音声音程変換を可能とす
る、高品質な音声信号処理方法及び装置、並びにその音
程変換を実現するプログラムデータを記録若しくは伝送
する情報媒体を提供することを目的とする。
されたものであり、従来に比べて簡単な回路構成で処理
時間も比較的短く、しかも音質の劣化がなくて個人の声
の特徴を維持したままの自然な音声音程変換を可能とす
る、高品質な音声信号処理方法及び装置、並びにその音
程変換を実現するプログラムデータを記録若しくは伝送
する情報媒体を提供することを目的とする。
【0015】
【課題を解決するための手段】請求項1に記載の本発明
に係る音声信号処理方法は、上述の課題を解決するため
に、デジタル入力された音声信号を所定の処理単位毎に
切り出す分割手段と、前記分割手段から出力された音声
信号の基本周波数を抽出する基本周波数抽出手段と、前
記分割手段から出力された音声信号を時間領域の信号か
ら周波数領域の信号へ変換する変換手段と、前記変換手
段により出力された音声信号の全周波数帯域を高域側ま
たは低域側にシフトする周波数シフト手段と、前記基本
周波数抽出手段により抽出された基本周波数に基づい
て、前記周波数シフト手段により全周波数帯域をシフト
された音声信号の倍音の構造を操作する倍音構造操作手
段と、前記倍音構造操作手段より出力された音声信号を
時間領域の信号に逆変換する逆変換手段と、各処理単位
の初期位相と基本周波数に基づいて、前記逆変換後の前
記所定の処理単位間を接続する処理単位間接続手段とを
有する。
に係る音声信号処理方法は、上述の課題を解決するため
に、デジタル入力された音声信号を所定の処理単位毎に
切り出す分割手段と、前記分割手段から出力された音声
信号の基本周波数を抽出する基本周波数抽出手段と、前
記分割手段から出力された音声信号を時間領域の信号か
ら周波数領域の信号へ変換する変換手段と、前記変換手
段により出力された音声信号の全周波数帯域を高域側ま
たは低域側にシフトする周波数シフト手段と、前記基本
周波数抽出手段により抽出された基本周波数に基づい
て、前記周波数シフト手段により全周波数帯域をシフト
された音声信号の倍音の構造を操作する倍音構造操作手
段と、前記倍音構造操作手段より出力された音声信号を
時間領域の信号に逆変換する逆変換手段と、各処理単位
の初期位相と基本周波数に基づいて、前記逆変換後の前
記所定の処理単位間を接続する処理単位間接続手段とを
有する。
【0016】請求項2に記載の本発明に係る音声信号処
理装置は、上述の課題を解決するために、デジタル入力
された音声信号を所定の処理単位毎に切り出し、前記処
理単位毎に分割された音声信号の基本周波数を抽出し、
前記処理単位毎に分割された音声信号を時間領域の信号
から周波数領域の信号へ変換し、前記時間領域の信号か
ら周波数領域の信号へ変換された音声信号の全周波数帯
域を高域側または低域側にシフトし、前記抽出された基
本周波数に基づいて、前記全周波数帯域を高域側または
低域側にシフトされた音声信号の倍音の構造を操作し、
前記倍音の構造が操作された音声信号を時間領域の信号
に逆変換し、各処理単位の初期位相と基本周波数に基づ
いて、前記逆変換後の前記所定の処理単位間を接続す
る。
理装置は、上述の課題を解決するために、デジタル入力
された音声信号を所定の処理単位毎に切り出し、前記処
理単位毎に分割された音声信号の基本周波数を抽出し、
前記処理単位毎に分割された音声信号を時間領域の信号
から周波数領域の信号へ変換し、前記時間領域の信号か
ら周波数領域の信号へ変換された音声信号の全周波数帯
域を高域側または低域側にシフトし、前記抽出された基
本周波数に基づいて、前記全周波数帯域を高域側または
低域側にシフトされた音声信号の倍音の構造を操作し、
前記倍音の構造が操作された音声信号を時間領域の信号
に逆変換し、各処理単位の初期位相と基本周波数に基づ
いて、前記逆変換後の前記所定の処理単位間を接続す
る。
【0017】請求項3に記載の本発明に係る情報媒体
は、上述の課題を解決するために、デジタル入力された
音声信号を所定の処理単位毎に切り出す分割工程と、前
記分割工程により得られる音声信号の基本周波数を抽出
する基本周波数抽出工程と、前記分割工程により得られ
る音声信号を時間領域の信号から周波数領域の信号へ変
換する変換工程と、前記変換工程により得られる音声信
号の全周波数帯域を高域側または低域側にシフトする周
波数シフト工程と、前記基本周波数抽出工程により抽出
される基本周波数に基づいて、前記周波数シフト工程に
より全周波数帯域をシフトされた音声信号の倍音の構造
を操作する倍音構造操作工程と、前記倍音構造操作工程
により得られる音声信号を時間領域の信号に逆変換する
逆変換工程と、各処理単位の初期位相と基本周波数に基
づいて、前記逆変換後の前記所定の処理単位間を接続す
る処理単位間接続工程とを、演算装置に対して実行させ
るプログラムデータを記録、若しくは伝送する。
は、上述の課題を解決するために、デジタル入力された
音声信号を所定の処理単位毎に切り出す分割工程と、前
記分割工程により得られる音声信号の基本周波数を抽出
する基本周波数抽出工程と、前記分割工程により得られ
る音声信号を時間領域の信号から周波数領域の信号へ変
換する変換工程と、前記変換工程により得られる音声信
号の全周波数帯域を高域側または低域側にシフトする周
波数シフト工程と、前記基本周波数抽出工程により抽出
される基本周波数に基づいて、前記周波数シフト工程に
より全周波数帯域をシフトされた音声信号の倍音の構造
を操作する倍音構造操作工程と、前記倍音構造操作工程
により得られる音声信号を時間領域の信号に逆変換する
逆変換工程と、各処理単位の初期位相と基本周波数に基
づいて、前記逆変換後の前記所定の処理単位間を接続す
る処理単位間接続工程とを、演算装置に対して実行させ
るプログラムデータを記録、若しくは伝送する。
【0018】
【発明の実施の形態】以下、本発明に係る音程変換装置
の好ましい実施の形態について、図面を参照しながら詳
細に説明する。
の好ましい実施の形態について、図面を参照しながら詳
細に説明する。
【0019】本発明の音声信号処理装置及び方法が適用
される一実施の形態としての音程変換装置の概略構成を
図1に示す。
される一実施の形態としての音程変換装置の概略構成を
図1に示す。
【0020】この図1において、入力端子21には、4
4.1KHzのサンプリング周波数でサンプリング処理
されたデジタル音声信号が供給される。このデジタル音
声信号は、処理単位分割部23及び基本周期抽出部31
に送られる。
4.1KHzのサンプリング周波数でサンプリング処理
されたデジタル音声信号が供給される。このデジタル音
声信号は、処理単位分割部23及び基本周期抽出部31
に送られる。
【0021】基本周波数抽出部31は、詳細については
後述するが、供給されたデジタル音声信号の低域成分の
みを取り出した後、所定の処理単位毎に切り出し、その
処理単位毎のデジタル音声信号の基本周波数(ピッチ周
波数、ピッチ周期)を抽出する。なお、当該基本周波数
抽出部での所定の処理単位を、以下、抽出フレームと呼
ぶことにする。
後述するが、供給されたデジタル音声信号の低域成分の
みを取り出した後、所定の処理単位毎に切り出し、その
処理単位毎のデジタル音声信号の基本周波数(ピッチ周
波数、ピッチ周期)を抽出する。なお、当該基本周波数
抽出部での所定の処理単位を、以下、抽出フレームと呼
ぶことにする。
【0022】処理単位分割部23は、入力されたデジタ
ル音声信号を所定の処理単位毎に分割し、この処理単位
毎のデジタル音声信号を変換部24に送出する。なお、
当該処理単位分割部23での所定の処理単位を、以下、
変換フレームと呼ぶことにする。この変換フレームは、
処理単位分割部23の後段における変換部24及び更に
その後段の逆変換部27にて行われる変換及び逆変換処
理の単位である。変換フレームと抽出フレームは必ずし
も同じである必要はないが、本実施の形態では変換フレ
ームと抽出フレームを同じとしている。
ル音声信号を所定の処理単位毎に分割し、この処理単位
毎のデジタル音声信号を変換部24に送出する。なお、
当該処理単位分割部23での所定の処理単位を、以下、
変換フレームと呼ぶことにする。この変換フレームは、
処理単位分割部23の後段における変換部24及び更に
その後段の逆変換部27にて行われる変換及び逆変換処
理の単位である。変換フレームと抽出フレームは必ずし
も同じである必要はないが、本実施の形態では変換フレ
ームと抽出フレームを同じとしている。
【0023】変換部24は、時間領域のデジタル音声信
号を周波数領域の信号に変換する。具体的には、処理単
位分割部23からの変換フレーム毎の時間領域のデジタ
ル音声信号を、いわゆる高速フーリエ変換(FFT)処
理によって、変換フレーム毎の周波数領域の信号に変換
する。この変換部24によるFFT処理にて得られた周
波数領域の信号は、音程変換部25に送られる。
号を周波数領域の信号に変換する。具体的には、処理単
位分割部23からの変換フレーム毎の時間領域のデジタ
ル音声信号を、いわゆる高速フーリエ変換(FFT)処
理によって、変換フレーム毎の周波数領域の信号に変換
する。この変換部24によるFFT処理にて得られた周
波数領域の信号は、音程変換部25に送られる。
【0024】なおこのとき、時間領域に対応していた各
サンプルは、各周波数に対応し、サンプル番号と周波数
とが対応することになる。すなわち、サンプリング周波
数fsの音声信号データをN個のサンプル毎に切り出し
て処理する場合、変換部24から出力される信号の周波
数pHzを示すサンプル番号は、第(p×N/fs)番
目となる。より具体的な例として、サンプリング周波数
44.1KHzのデジタル音声信号を例えば4096サ
ンプル毎に変換フレーム化して切り出すようにしたとす
ると、周波数pHzを示すサンプル番号は第(p×40
96/44100)番目となる(小数点以下は四捨五
入)。
サンプルは、各周波数に対応し、サンプル番号と周波数
とが対応することになる。すなわち、サンプリング周波
数fsの音声信号データをN個のサンプル毎に切り出し
て処理する場合、変換部24から出力される信号の周波
数pHzを示すサンプル番号は、第(p×N/fs)番
目となる。より具体的な例として、サンプリング周波数
44.1KHzのデジタル音声信号を例えば4096サ
ンプル毎に変換フレーム化して切り出すようにしたとす
ると、周波数pHzを示すサンプル番号は第(p×40
96/44100)番目となる(小数点以下は四捨五
入)。
【0025】音程変換部25は、変換部24でのFFT
処理により得られた周波数領域の信号の実部と虚部とを
所望のピッチシフト量だけ移動させるような周波数シフ
ト処理を行う。当該音程変換部25にて周波数シフト処
理された信号は、倍音構造操作部26に送られる。
処理により得られた周波数領域の信号の実部と虚部とを
所望のピッチシフト量だけ移動させるような周波数シフ
ト処理を行う。当該音程変換部25にて周波数シフト処
理された信号は、倍音構造操作部26に送られる。
【0026】ここで、この周波数シフト処理において、
例えば1オクターブ(12半音)高い方へ移動させると
いうことは、周波数を2倍にすることと同意であるの
で、h半音上げるには全体の周波数を2h/12倍に上げれ
ば良いことになる。より具体的な例として、例えば3半
音高い方へ音程を上げるような場合は、全体の周波数を
23/12倍(約1.19倍)にすれば良い。その結果、第
n番目のサンプルの値は第(1.19×n)番目のサン
プルに移動されることになる。このとき、ピッチ周波数
をp1Hzとすると、h半音シフトした後のピッチ周波
数を示すサンプル番号は、第(p1×2h/12×N/f
s)番目となる。
例えば1オクターブ(12半音)高い方へ移動させると
いうことは、周波数を2倍にすることと同意であるの
で、h半音上げるには全体の周波数を2h/12倍に上げれ
ば良いことになる。より具体的な例として、例えば3半
音高い方へ音程を上げるような場合は、全体の周波数を
23/12倍(約1.19倍)にすれば良い。その結果、第
n番目のサンプルの値は第(1.19×n)番目のサン
プルに移動されることになる。このとき、ピッチ周波数
をp1Hzとすると、h半音シフトした後のピッチ周波
数を示すサンプル番号は、第(p1×2h/12×N/f
s)番目となる。
【0027】ところで、本実施の形態において、同じ人
物が音程を変えて発音した声を分析したところ、音程が
高くなるにつれてピッチ周波数の倍音成分のレベルが比
較的小さく、逆に音程が低くなると倍音成分のレベルが
大きくなり、豊富に出現することを発見した。そして、
このピッチ周波数の倍音成分のレベルが再生される音声
品質に影響を与えることが判ったので、周波数全体の移
動後にこの倍音成分のレベルを操作すれば、高品質の音
声を得ることができる。
物が音程を変えて発音した声を分析したところ、音程が
高くなるにつれてピッチ周波数の倍音成分のレベルが比
較的小さく、逆に音程が低くなると倍音成分のレベルが
大きくなり、豊富に出現することを発見した。そして、
このピッチ周波数の倍音成分のレベルが再生される音声
品質に影響を与えることが判ったので、周波数全体の移
動後にこの倍音成分のレベルを操作すれば、高品質の音
声を得ることができる。
【0028】したがって、倍音構造操作部26では、基
本周期抽出部31にて抽出されたピッチ周波数が0であ
る(ピッチ周波数が抽出されない)場合、音程変換部2
5から供給された信号に対して何も操作せずに、そのま
ま後段の逆変換部27に送出する。
本周期抽出部31にて抽出されたピッチ周波数が0であ
る(ピッチ周波数が抽出されない)場合、音程変換部2
5から供給された信号に対して何も操作せずに、そのま
ま後段の逆変換部27に送出する。
【0029】一方、基本周期抽出部31にて抽出された
ピッチ周波数が0でない(ピッチ周波数が存在する)場
合、倍音構造操作部26では、ピッチ周波数の倍音成分
(ピッチ周波数の整数倍の周波数を示すサンプル)のレ
ベルを操作する。すなわち、基本周期抽出部31にて抽
出されたピッチ周波数が0でない場合の倍音構造操作部
26は、音程変換部25にて周波数全体を例えば高い方
へシフト(シフト量≧1)したならば、当該ピッチシフ
トした後の信号の倍音成分のレベルを減少させるように
し、一方、音程変換部25にて周波数全体を例えば低い
方へシフト(シフト量<1)したならば、当該ピッチシ
フトした後の信号の倍音成分のレベルを増加させるよう
な倍音構造の操作処理を行う。
ピッチ周波数が0でない(ピッチ周波数が存在する)場
合、倍音構造操作部26では、ピッチ周波数の倍音成分
(ピッチ周波数の整数倍の周波数を示すサンプル)のレ
ベルを操作する。すなわち、基本周期抽出部31にて抽
出されたピッチ周波数が0でない場合の倍音構造操作部
26は、音程変換部25にて周波数全体を例えば高い方
へシフト(シフト量≧1)したならば、当該ピッチシフ
トした後の信号の倍音成分のレベルを減少させるように
し、一方、音程変換部25にて周波数全体を例えば低い
方へシフト(シフト量<1)したならば、当該ピッチシ
フトした後の信号の倍音成分のレベルを増加させるよう
な倍音構造の操作処理を行う。
【0030】より具体的な例として、基本周波数抽出部
31にて抽出されたピッチ周波数が例えば200Hzで
あるとし、また、音程変換部25にて周波数全体を例え
ば高い方へ3半音シフトした(ピッチシフト量が1倍以
上)とし、さらに、倍音構造操作部26における倍音成
分のレベル変化量として例えば+10dB又は−10d
Bを例に挙げる。この場合、音程変換部25にてシフト
した後のピッチ周波数は200×1.19Hzとなるの
で、このシフトした後の音声信号の倍音成分は、200
×1.19×m(mは2以上の整数)Hzとなる。した
がって、倍音構造操作部26では、この周波数を示すサ
ンプル番号の実部及び虚部を各々100. 5又は10-0.5
乗算することにより、約±10dBのレベル操作を行う
ことになる。これを一般化すると、ピッチ周波数p1H
zのときのh半音シフトした後のm倍音成分を示すサン
プル番号は、第(m×p1×2h/12×N/fs)番目と
なるので、このサンプル番号のデータの実部及び虚部を
各々100.5又は10-0.5を乗算することにより、±1
0dBのレベル操作が可能となる。
31にて抽出されたピッチ周波数が例えば200Hzで
あるとし、また、音程変換部25にて周波数全体を例え
ば高い方へ3半音シフトした(ピッチシフト量が1倍以
上)とし、さらに、倍音構造操作部26における倍音成
分のレベル変化量として例えば+10dB又は−10d
Bを例に挙げる。この場合、音程変換部25にてシフト
した後のピッチ周波数は200×1.19Hzとなるの
で、このシフトした後の音声信号の倍音成分は、200
×1.19×m(mは2以上の整数)Hzとなる。した
がって、倍音構造操作部26では、この周波数を示すサ
ンプル番号の実部及び虚部を各々100. 5又は10-0.5
乗算することにより、約±10dBのレベル操作を行う
ことになる。これを一般化すると、ピッチ周波数p1H
zのときのh半音シフトした後のm倍音成分を示すサン
プル番号は、第(m×p1×2h/12×N/fs)番目と
なるので、このサンプル番号のデータの実部及び虚部を
各々100.5又は10-0.5を乗算することにより、±1
0dBのレベル操作が可能となる。
【0031】この倍音構造操作部26による処理後の信
号が供給される逆変換部27では、先の変換部24での
変換処理に対応する逆変換処理、すなわち、周波数領域
の信号を時間領域のデジタル音声信号に変換する処理を
行う。より具体的には、周波数領域の信号を、逆高速フ
ーリエ変換(IFFT)処理によって、時間領域のデジ
タル音声信号に変換する。当該逆変換部27でのIFF
T処理により得られた変換フレーム毎のデジタル音声信
号は、処理単位間接続部28に送られる。
号が供給される逆変換部27では、先の変換部24での
変換処理に対応する逆変換処理、すなわち、周波数領域
の信号を時間領域のデジタル音声信号に変換する処理を
行う。より具体的には、周波数領域の信号を、逆高速フ
ーリエ変換(IFFT)処理によって、時間領域のデジ
タル音声信号に変換する。当該逆変換部27でのIFF
T処理により得られた変換フレーム毎のデジタル音声信
号は、処理単位間接続部28に送られる。
【0032】処理単位間接続部28は、基本周期抽出部
31にて抽出されたピッチ周波数に基づいて、逆変換部
27でのIFFT処理により得られた変換フレーム毎の
デジタル音声信号を接続する。当該処理単位間接続部2
8によって変換フレームが接続されたデジタル音声信号
は、出力端子30から音程変換後のデジタル音声信号と
して出力され、図示しないD/A(デジタル/アナロ
グ)変換器等に送出されることになる。
31にて抽出されたピッチ周波数に基づいて、逆変換部
27でのIFFT処理により得られた変換フレーム毎の
デジタル音声信号を接続する。当該処理単位間接続部2
8によって変換フレームが接続されたデジタル音声信号
は、出力端子30から音程変換後のデジタル音声信号と
して出力され、図示しないD/A(デジタル/アナロ
グ)変換器等に送出されることになる。
【0033】以下に、処理単位間接続部28における処
理単位(変換フレーム)の接続方法を、図2を参照しな
がら説明する。
理単位(変換フレーム)の接続方法を、図2を参照しな
がら説明する。
【0034】図2の(a)は、図1の変換部24にてF
FT処理された後で且つ音程変換部25で音程変換処理
(周波数シフト処理)される前の信号の処理単位(変換
フレーム)を表しており、図2の(b)は、図1の音程
変換部25による音程変換(周波数シフト処理)後の信
号の処理単位(変換フレーム)を表し、図2の(c)
は、図1の基本周期抽出部31にて抽出された基本周期
(ピッチ)Rを表している。
FT処理された後で且つ音程変換部25で音程変換処理
(周波数シフト処理)される前の信号の処理単位(変換
フレーム)を表しており、図2の(b)は、図1の音程
変換部25による音程変換(周波数シフト処理)後の信
号の処理単位(変換フレーム)を表し、図2の(c)
は、図1の基本周期抽出部31にて抽出された基本周期
(ピッチ)Rを表している。
【0035】この図2の例において、ある処理単位(変
換フレーム)の初期位相をθとし、その次の処理単位
(変換フレーム)の初期位相をφとすると、処理単位間
接続部28では、基本周期抽出部31にて抽出された基
本周波数(基本周期)Rに基づいて、下記式にて位相φ
となる点(時刻)Pを求める。なお、θ,φ共に絶対時
刻に対応する位相回転角が加味されているとする。
換フレーム)の初期位相をθとし、その次の処理単位
(変換フレーム)の初期位相をφとすると、処理単位間
接続部28では、基本周期抽出部31にて抽出された基
本周波数(基本周期)Rに基づいて、下記式にて位相φ
となる点(時刻)Pを求める。なお、θ,φ共に絶対時
刻に対応する位相回転角が加味されているとする。
【0036】φ=θ+(基本周期Rの整数倍)+Δφ処
理単位間接続部28では、当該式から求めた位相φとな
る点Pで、2つの処理単位を繋ぐ(連結する)ようにす
る。これにより、処理単位(変換フレーム)間で波形が
滑らかに繋がり、良好な音質を得ることが可能となる。
つまり、前フレームの終わりの位相と現フレームの始ま
りの位相とを合わせることで、フレーム間での信号の不
連続性を避けることができる。
理単位間接続部28では、当該式から求めた位相φとな
る点Pで、2つの処理単位を繋ぐ(連結する)ようにす
る。これにより、処理単位(変換フレーム)間で波形が
滑らかに繋がり、良好な音質を得ることが可能となる。
つまり、前フレームの終わりの位相と現フレームの始ま
りの位相とを合わせることで、フレーム間での信号の不
連続性を避けることができる。
【0037】なお、上述した実施の形態では、処理単位
の一例として4096サンプルを例に挙げているが、こ
れ以外のサンプル数でも良いのはもちろんである。しか
しながら、種々の実験を行った結果、1サンプル当たり
10Hz〜25Hz程度となるように処理区間を設定す
るのが音質上最も良いことが判った。そして、フーリエ
変換等のデジタル処理を行うことを考慮すると、処理区
間は2のn乗サンプルにするのが良い。
の一例として4096サンプルを例に挙げているが、こ
れ以外のサンプル数でも良いのはもちろんである。しか
しながら、種々の実験を行った結果、1サンプル当たり
10Hz〜25Hz程度となるように処理区間を設定す
るのが音質上最も良いことが判った。そして、フーリエ
変換等のデジタル処理を行うことを考慮すると、処理区
間は2のn乗サンプルにするのが良い。
【0038】したがって、本実施の形態のようにサンプ
リング周波数44.1KHzのデジタル音声信号の場
合、2048サンプリング(21.5Hz/1サンプ
ル)または4096サンプル(10.8Hz/1サンプ
ル)とするのが良く、例えばMPEG2オーディオ等で
使用されるサンプリング周波数22.05KHzのデジ
タル音声信号の場合は、1024サンプリング(21.
5Hz/1サンプル)または2048サンプル(10.
8Hz/1サンプル)とするのが良い。
リング周波数44.1KHzのデジタル音声信号の場
合、2048サンプリング(21.5Hz/1サンプ
ル)または4096サンプル(10.8Hz/1サンプ
ル)とするのが良く、例えばMPEG2オーディオ等で
使用されるサンプリング周波数22.05KHzのデジ
タル音声信号の場合は、1024サンプリング(21.
5Hz/1サンプル)または2048サンプル(10.
8Hz/1サンプル)とするのが良い。
【0039】実際に、サンプリング周波数44.1KH
zのデジタル音声信号について、処理単位を512,1
02,2048,4096,8192の各サンプルで実
験したところ、512サンプルでは音程が一つに定まら
ず、1024サンプルでは音質が非常に悪かった。そし
て、8192サンプルでは所望の音程にはなったもの
の、ディレイがかかったような2重の音声となってしま
い、処理区間は2048又は4096サンプルのときが
最も高音質の結果を得ることが出来る。
zのデジタル音声信号について、処理単位を512,1
02,2048,4096,8192の各サンプルで実
験したところ、512サンプルでは音程が一つに定まら
ず、1024サンプルでは音質が非常に悪かった。そし
て、8192サンプルでは所望の音程にはなったもの
の、ディレイがかかったような2重の音声となってしま
い、処理区間は2048又は4096サンプルのときが
最も高音質の結果を得ることが出来る。
【0040】次に、図1の基本周期抽出部31につい
て、以下の図3〜図6を用いて説明する。
て、以下の図3〜図6を用いて説明する。
【0041】図3には、基本周期抽出部31の構成例を
示す。
示す。
【0042】この図3において、入力端子1には、図1
の入力端子21を介した44.1kHzのサンプリング
周波数でサンプリング処理されたデジタル音声信号が供
給される。このデジタル音声信号は、フィルタ回路3に
送られる。
の入力端子21を介した44.1kHzのサンプリング
周波数でサンプリング処理されたデジタル音声信号が供
給される。このデジタル音声信号は、フィルタ回路3に
送られる。
【0043】当該フィルタ回路3は、IIR(巡回型)
若しくはFIR(非巡回型)のデジタルフィルタであ
り、例えばカットオフ周波数が300Hzの周波数特性
を有する低域濾波器(ローパスフィルタ)である。この
フィルタ回路3からの出力データは、バッファメモリ4
に送られる。
若しくはFIR(非巡回型)のデジタルフィルタであ
り、例えばカットオフ周波数が300Hzの周波数特性
を有する低域濾波器(ローパスフィルタ)である。この
フィルタ回路3からの出力データは、バッファメモリ4
に送られる。
【0044】このバッファメモリ4は、フィルタ回路3
からのデータを蓄積し、後段のピークサーチ回路5にお
ける処理単位時間(抽出フレーム)分毎に出力、すなわ
ち抽出フレーム分に対応するサンプル数毎のデータを出
力する。バッファメモリ4から出力された抽出フレーム
毎のデータは、ピークサーチ回路5に送られる。
からのデータを蓄積し、後段のピークサーチ回路5にお
ける処理単位時間(抽出フレーム)分毎に出力、すなわ
ち抽出フレーム分に対応するサンプル数毎のデータを出
力する。バッファメモリ4から出力された抽出フレーム
毎のデータは、ピークサーチ回路5に送られる。
【0045】このピークサーチ回路5では、供給された
各サンプルデータを1サンプル毎に比較し、その比較出
力に基づいて、デジタル音声信号のピークを抽出する。
各サンプルデータを1サンプル毎に比較し、その比較出
力に基づいて、デジタル音声信号のピークを抽出する。
【0046】具体的に言うと、該ピークサーチ回路5で
は、デジタル音声信号の各サンプル毎に、現在のデジタ
ル音声信号とその1サンプル前のデジタル音声信号とを
比較し、現在のサンプル値がその1サンプル前のサンプ
ル値よりも大きいことを示す比較結果が続いた後、現在
のサンプル値がその1サンプル前のサンプル値よりも小
さくなったことを示す比較結果が得られたとき、或い
は、現在のサンプル値がその1サンプル前のサンプル値
よりも小さいことを示す比較結果が続いた後、現在のサ
ンプル値がその1サンプル前のサンプル値よりも大きく
なったことを示す比較結果が得られたときに、それら比
較結果の変化時点をデジタル音声信号のピークとして検
出する。
は、デジタル音声信号の各サンプル毎に、現在のデジタ
ル音声信号とその1サンプル前のデジタル音声信号とを
比較し、現在のサンプル値がその1サンプル前のサンプ
ル値よりも大きいことを示す比較結果が続いた後、現在
のサンプル値がその1サンプル前のサンプル値よりも小
さくなったことを示す比較結果が得られたとき、或い
は、現在のサンプル値がその1サンプル前のサンプル値
よりも小さいことを示す比較結果が続いた後、現在のサ
ンプル値がその1サンプル前のサンプル値よりも大きく
なったことを示す比較結果が得られたときに、それら比
較結果の変化時点をデジタル音声信号のピークとして検
出する。
【0047】すなわち、現在のサンプル値がその1サン
プル前のサンプル値よりも大きいことを示す比較結果が
続いた後、現在のサンプル値がその1サンプル前のサン
プル値よりも小さくなった時点の当該現在のサンプル値
の1つ前のサンプル値がローカルマキシマム(極大値)
を示し、一方で、現在のサンプル値がその1サンプル前
のサンプル値よりも小さいことを示す比較結果が続いた
後、現在のサンプル値がその1サンプル前のサンプル値
よりも大きくなった時点の当該現在のサンプル値の1つ
前のサンプル値がローカルミニマム(極小値)を示す。
したがって、当該ピークサーチ回路5では、このように
サンプル比較結果の変化に基づいて、デジタル音声信号
のローカルマキシマムのサンプルデータ、及びローカル
ミニマムのサンプルデータを検出する。このピークサー
チ回路5により検出されたローカルマキシマム及びロー
カルミニマムのサンプルデータは符号データ化回路6に
送られる。
プル前のサンプル値よりも大きいことを示す比較結果が
続いた後、現在のサンプル値がその1サンプル前のサン
プル値よりも小さくなった時点の当該現在のサンプル値
の1つ前のサンプル値がローカルマキシマム(極大値)
を示し、一方で、現在のサンプル値がその1サンプル前
のサンプル値よりも小さいことを示す比較結果が続いた
後、現在のサンプル値がその1サンプル前のサンプル値
よりも大きくなった時点の当該現在のサンプル値の1つ
前のサンプル値がローカルミニマム(極小値)を示す。
したがって、当該ピークサーチ回路5では、このように
サンプル比較結果の変化に基づいて、デジタル音声信号
のローカルマキシマムのサンプルデータ、及びローカル
ミニマムのサンプルデータを検出する。このピークサー
チ回路5により検出されたローカルマキシマム及びロー
カルミニマムのサンプルデータは符号データ化回路6に
送られる。
【0048】符号データ化回路6は、ピークサーチ回路
5より供給された各ローカルマキシマムのサンプルデー
タに対してはそれぞれ正(+)の符号を付加し、各ロー
カルミニマムのサンプルデータに対してはそれぞれ負
(−)の符号を付加する。この符号データ化回路6にて
符号データ化されたローカルマキシMA及びローカルミ
ニマムの各サンプルデータは、データ分析回路7に送ら
れる。
5より供給された各ローカルマキシマムのサンプルデー
タに対してはそれぞれ正(+)の符号を付加し、各ロー
カルミニマムのサンプルデータに対してはそれぞれ負
(−)の符号を付加する。この符号データ化回路6にて
符号データ化されたローカルマキシMA及びローカルミ
ニマムの各サンプルデータは、データ分析回路7に送ら
れる。
【0049】このデータ分析回路7では、符号データ化
回路6にて正(+)の符号が付加された各ローカルマキ
シマム間の時間間隔(サンプル数)、及び、符号データ
化回路6にて負(−)の符号が付加された各ローカルミ
ニマム(極小値)間の時間間隔(サンプル数)を求め、
次いで、それら求めた各ローカルマキシマム間の時間間
隔(サンプル数)と各ローカルミニマム間の時間間隔
(サンプル数)を統計的に分析する。
回路6にて正(+)の符号が付加された各ローカルマキ
シマム間の時間間隔(サンプル数)、及び、符号データ
化回路6にて負(−)の符号が付加された各ローカルミ
ニマム(極小値)間の時間間隔(サンプル数)を求め、
次いで、それら求めた各ローカルマキシマム間の時間間
隔(サンプル数)と各ローカルミニマム間の時間間隔
(サンプル数)を統計的に分析する。
【0050】すなわち、データ分析回路7では、正
(+)の符号が付加された各ローカルマキシマムについ
て、あるローカルマキシマムからそれ以降の各ローカル
マキシマムまでの時間間隔(サンプル数)を求めること
を、それぞれのローカルマキシマムについて行う。同様
に、データ分析回路7では、負(−)の符号が付加され
た各ローカルミニマムについて、あるローカルミニマム
からそれ以降の各ローカルミニマムまでの時間間隔(サ
ンプル数)を求めることを、それぞれのローカルミニマ
ムについて行う。
(+)の符号が付加された各ローカルマキシマムについ
て、あるローカルマキシマムからそれ以降の各ローカル
マキシマムまでの時間間隔(サンプル数)を求めること
を、それぞれのローカルマキシマムについて行う。同様
に、データ分析回路7では、負(−)の符号が付加され
た各ローカルミニマムについて、あるローカルミニマム
からそれ以降の各ローカルミニマムまでの時間間隔(サ
ンプル数)を求めることを、それぞれのローカルミニマ
ムについて行う。
【0051】次いで、データ分析回路7では、正(+)
の符号が付加された各ローカルマキシマムについてそれ
ぞれ求めた時間間隔(サンプル数)と、負(−)の符号
が付加された各ローカルミニマムについてそれぞれ求め
た時間間隔(サンプル数)の両方を用いて、統計的な分
析を行う。
の符号が付加された各ローカルマキシマムについてそれ
ぞれ求めた時間間隔(サンプル数)と、負(−)の符号
が付加された各ローカルミニマムについてそれぞれ求め
た時間間隔(サンプル数)の両方を用いて、統計的な分
析を行う。
【0052】具体的に言うと、該データ分析回路7で
は、正(+)の符号が付加された各ローカルマキシマム
間の各時間間隔に対応するサンプル数と、負(−)の符
号が付加された各ローカルミニマム間の各時間間隔に対
応するサンプル数の両方を用いて、ヒストグラムを作成
し、該ヒストグラムの最瀕値を求め、この最瀕値に対応
するサンプル数の時間間隔を統計分析結果として出力す
る。
は、正(+)の符号が付加された各ローカルマキシマム
間の各時間間隔に対応するサンプル数と、負(−)の符
号が付加された各ローカルミニマム間の各時間間隔に対
応するサンプル数の両方を用いて、ヒストグラムを作成
し、該ヒストグラムの最瀕値を求め、この最瀕値に対応
するサンプル数の時間間隔を統計分析結果として出力す
る。
【0053】データ分析回路7での統計分析により求め
られた時間間隔出力は、ピッチ決定回路8に送られる。
該ピッチ決定回路8では、データ分析回路7から供給さ
れた時間間隔出力に基づいて、入力デジタル音声信号の
ピッチ周波数(ピッチ周期)を決定する。当該決定され
たピッチ周波数(ピッチ周期)が端子9から図1の倍音
構造操作部26や処理単位間接続部28に送られる。
られた時間間隔出力は、ピッチ決定回路8に送られる。
該ピッチ決定回路8では、データ分析回路7から供給さ
れた時間間隔出力に基づいて、入力デジタル音声信号の
ピッチ周波数(ピッチ周期)を決定する。当該決定され
たピッチ周波数(ピッチ周期)が端子9から図1の倍音
構造操作部26や処理単位間接続部28に送られる。
【0054】この図3に示した基本周期抽出部31にお
けるピッチ周波数(ピッチ周期)検出動作の流れの一例
をフローチャートにて表すと、図4に示すようになる。
けるピッチ周波数(ピッチ周期)検出動作の流れの一例
をフローチャートにて表すと、図4に示すようになる。
【0055】この図4において、先ず、ステップS1の
処理として、フィルタ回路3では、入力端子1に供給さ
れたデジタル音声信号から所望の周波数帯域のみを取り
出す低域濾波処理を行い、バッファメモリ4では、その
低域濾波後のデジタル音声信号を単位時間(抽出フレー
ム)毎に切り出す。
処理として、フィルタ回路3では、入力端子1に供給さ
れたデジタル音声信号から所望の周波数帯域のみを取り
出す低域濾波処理を行い、バッファメモリ4では、その
低域濾波後のデジタル音声信号を単位時間(抽出フレー
ム)毎に切り出す。
【0056】次に、ステップS2の処理として、ピーク
サーチ回路5ではローカルマキシマム(極大点)とロー
カルミニマム(極小点)を抽出し、さらに符号データ化
回路6ではローカルマキシマムに正(+)の符号を付加
し、ローカルミニマムに負(−)の符号を付加する符号
データ化を行う。
サーチ回路5ではローカルマキシマム(極大点)とロー
カルミニマム(極小点)を抽出し、さらに符号データ化
回路6ではローカルマキシマムに正(+)の符号を付加
し、ローカルミニマムに負(−)の符号を付加する符号
データ化を行う。
【0057】ステップS3の処理として、データ分析回
路7では、正(+)の符号が付加されたローカルマキシ
マムと負(−)の符号が付加されたローカルミニマムの
二者を用いて、それぞれ時間間隔(サンプル数)を求
め、得られた時間間隔からヒストグラムを作成する。
路7では、正(+)の符号が付加されたローカルマキシ
マムと負(−)の符号が付加されたローカルミニマムの
二者を用いて、それぞれ時間間隔(サンプル数)を求
め、得られた時間間隔からヒストグラムを作成する。
【0058】その後、ステップS4の処理として、デー
タ分析回路7では、ヒストグラムの最瀕値を求め、ピッ
チ決定回路8では、当該ヒストグラムの最瀕値からピッ
チ周期を決定する。
タ分析回路7では、ヒストグラムの最瀕値を求め、ピッ
チ決定回路8では、当該ヒストグラムの最瀕値からピッ
チ周期を決定する。
【0059】この図4のフローチャートの処理例によれ
ば、デジタル音声信号の相関を求めることなく、その波
形の特徴から少ない演算量で、且つローカルマキシマ
ム、ローカルミニマムのサンプル点の振幅に左右されず
に、精度の高いピッチ周波数検出が可能である。
ば、デジタル音声信号の相関を求めることなく、その波
形の特徴から少ない演算量で、且つローカルマキシマ
ム、ローカルミニマムのサンプル点の振幅に左右されず
に、精度の高いピッチ周波数検出が可能である。
【0060】また、図3に示した基本周期抽出部31で
は、図5に示すような流れでピッチ周波数検出を行うこ
ともできる。なお、この図5のステップS1及びステッ
プS2の処理は、図4のフローチャートのステップS1
及びステップS2の処理と同じであり、その説明は省略
する。
は、図5に示すような流れでピッチ周波数検出を行うこ
ともできる。なお、この図5のステップS1及びステッ
プS2の処理は、図4のフローチャートのステップS1
及びステップS2の処理と同じであり、その説明は省略
する。
【0061】この図5において、データ分析回路7で
は、ステップS13の処理として、符号データ化回路6
にて正(+)の符号が付加された各ローカルマキシマム
(極大値)の振幅の絶対値と、負(−)の符号が付加さ
れた各ローカルミニマム(極小値)の振幅の絶対値と
を、それぞれ求め、抽出フレーム内においてそれら振幅
の絶対値が最も大きい第1ローカルマキシマムと第1ロ
ーカルミニマムを求める。
は、ステップS13の処理として、符号データ化回路6
にて正(+)の符号が付加された各ローカルマキシマム
(極大値)の振幅の絶対値と、負(−)の符号が付加さ
れた各ローカルミニマム(極小値)の振幅の絶対値と
を、それぞれ求め、抽出フレーム内においてそれら振幅
の絶対値が最も大きい第1ローカルマキシマムと第1ロ
ーカルミニマムを求める。
【0062】次に、データ分析回路7では、ステップS
14の処理として、振幅の絶対値が最大の第1ローカル
マキシマムに対応した所定範囲内に、その振幅値が入っ
ている全ての第2ローカルマキシマムを求め、それらの
第1ローカルマキシマム及び第2ローカルマキシマムを
用いて各時間間隔(サンプル数)を測定し、その時間間
隔からヒストグラムを作成する。
14の処理として、振幅の絶対値が最大の第1ローカル
マキシマムに対応した所定範囲内に、その振幅値が入っ
ている全ての第2ローカルマキシマムを求め、それらの
第1ローカルマキシマム及び第2ローカルマキシマムを
用いて各時間間隔(サンプル数)を測定し、その時間間
隔からヒストグラムを作成する。
【0063】次に、データ分析回路7では、ステップS
15の処理として、振幅の絶対値が最大の第1ローカル
ミニマムに対応した所定範囲内に、その振幅値が入って
いる全ての第2ローカルミニマムを求め、それらの第1
ローカルミニマム及び第2ローカルミニマムを用いて各
時間間隔(サンプル数)を測定し、その時間間隔を、ス
テップS14のヒストグラムに加える。
15の処理として、振幅の絶対値が最大の第1ローカル
ミニマムに対応した所定範囲内に、その振幅値が入って
いる全ての第2ローカルミニマムを求め、それらの第1
ローカルミニマム及び第2ローカルミニマムを用いて各
時間間隔(サンプル数)を測定し、その時間間隔を、ス
テップS14のヒストグラムに加える。
【0064】その後、ステップS16の処理として、デ
ータ分析回路7では、ヒストグラムの最瀕値を求め、ピ
ッチ決定回路8では、当該ヒストグラムの最瀕値からピ
ッチ周期を決定する。
ータ分析回路7では、ヒストグラムの最瀕値を求め、ピ
ッチ決定回路8では、当該ヒストグラムの最瀕値からピ
ッチ周期を決定する。
【0065】この図5のフローチャートの処理例によれ
ば、デジタル音声信号の相関を求めることなく、その波
形の特徴から少ない演算量で精度の高いピッチ周波数
(ピッチ周期)検出が可能である。また、この処理例に
よれば、全てのローカルマキシマム及びローカルミニマ
ムを用いて時間間隔を測定する場合よりも、少ない演算
量でピッチ検出が可能となっている。
ば、デジタル音声信号の相関を求めることなく、その波
形の特徴から少ない演算量で精度の高いピッチ周波数
(ピッチ周期)検出が可能である。また、この処理例に
よれば、全てのローカルマキシマム及びローカルミニマ
ムを用いて時間間隔を測定する場合よりも、少ない演算
量でピッチ検出が可能となっている。
【0066】さらに、図3に示した基本周期抽出部31
では、図6に示すような流れでピッチ周波数検出を行う
こともできる。なお、この図6のステップS1乃至ステ
ップS13の処理は、図5のフローチャートのステップ
S1乃至ステップS13の処理と同じであり、その説明
は省略する。
では、図6に示すような流れでピッチ周波数検出を行う
こともできる。なお、この図6のステップS1乃至ステ
ップS13の処理は、図5のフローチャートのステップ
S1乃至ステップS13の処理と同じであり、その説明
は省略する。
【0067】この図6において、データ分析回路7で
は、ステップS24の処理として、振幅の絶対値が最大
の第1ローカルマキシマムに対応した所定範囲よりも、
その振幅値が大きい全ての第3ローカルマキシマムを求
め、それら第1ローカルマキシマム及び第3ローカルマ
キシマムを用いて各時間間隔を測定し、その時間間隔か
らヒストグラムを作成する。
は、ステップS24の処理として、振幅の絶対値が最大
の第1ローカルマキシマムに対応した所定範囲よりも、
その振幅値が大きい全ての第3ローカルマキシマムを求
め、それら第1ローカルマキシマム及び第3ローカルマ
キシマムを用いて各時間間隔を測定し、その時間間隔か
らヒストグラムを作成する。
【0068】次に、データ分析回路7では、ステップS
25の処理として、振幅の絶対値が最大の第1ローカル
マキシマムに対応した所定範囲よりも、その振幅値が小
さい全ての第4ローカルマキシマムを求め、それら第1
ローカルマキシマム及び第4ローカルマキシマムを用い
て各時間間隔を測定し、その時間間隔をステップS24
のヒストグラムに追加する。
25の処理として、振幅の絶対値が最大の第1ローカル
マキシマムに対応した所定範囲よりも、その振幅値が小
さい全ての第4ローカルマキシマムを求め、それら第1
ローカルマキシマム及び第4ローカルマキシマムを用い
て各時間間隔を測定し、その時間間隔をステップS24
のヒストグラムに追加する。
【0069】次に、データ分析回路7では、ステップS
26の処理として、振幅の絶対値が最大の第1ローカル
ミニマムに対応した所定範囲よりも、その振幅値が大き
い全ての第3ローカルミニマムを求め、それら第1ロー
カルミニマム及び第3ローカルミニマムを用いて各時間
間隔を測定し、その時間間隔からヒストグラムを作成す
る。
26の処理として、振幅の絶対値が最大の第1ローカル
ミニマムに対応した所定範囲よりも、その振幅値が大き
い全ての第3ローカルミニマムを求め、それら第1ロー
カルミニマム及び第3ローカルミニマムを用いて各時間
間隔を測定し、その時間間隔からヒストグラムを作成す
る。
【0070】次に、データ分析回路7では、ステップS
27の処理として、振幅の絶対値が最大の第1ローカル
ミニマムに対応した所定範囲よりも、その振幅値が小さ
い全ての第4ローカルミニマムを求め、それら第1ロー
カルミニマム及び第4ローカルミニマムを用いて各時間
間隔を測定し、その時間間隔をステップS26のヒスト
グラムに追加する。
27の処理として、振幅の絶対値が最大の第1ローカル
ミニマムに対応した所定範囲よりも、その振幅値が小さ
い全ての第4ローカルミニマムを求め、それら第1ロー
カルミニマム及び第4ローカルミニマムを用いて各時間
間隔を測定し、その時間間隔をステップS26のヒスト
グラムに追加する。
【0071】その後、ステップS28の処理として、デ
ータ分析回路7では、ヒストグラムの最瀕値を求め、ピ
ッチ決定回路8では、当該ヒストグラムの最瀕値からピ
ッチ周期を決定する。
ータ分析回路7では、ヒストグラムの最瀕値を求め、ピ
ッチ決定回路8では、当該ヒストグラムの最瀕値からピ
ッチ周期を決定する。
【0072】この図6のフローチャートの処理例によれ
ば、デジタル音声信号の相関を求めることなく、その波
形の特徴から少ない演算量で精度の高いピッチ検出が可
能である。また、この処理例によれば、全てのローカル
マキシマム及びローカルミニマムを用いて時間間隔を測
定する場合よりも、少ない演算量でピッチ検出が可能と
なっている。
ば、デジタル音声信号の相関を求めることなく、その波
形の特徴から少ない演算量で精度の高いピッチ検出が可
能である。また、この処理例によれば、全てのローカル
マキシマム及びローカルミニマムを用いて時間間隔を測
定する場合よりも、少ない演算量でピッチ検出が可能と
なっている。
【0073】ところで、本発明の音声信号処理方法及び
装置は、例えばいわゆるカラオケ装置において、歌唱者
の声やコーラスの声のピッチを検出し、その声のピッチ
をシフトする(声の高さを高くしたり低くしたりする)
際に適用可能である。すなわち、カラオケ装置において
は、歌唱者による歌の調及び各音の高さを前述したよう
にピッチを検出することによって求め、本来の楽曲の調
及び音の高さに合うようにシフトさせてから変換フレー
ム間を滑らかに繋ぎ、その後、スピーカから出力するよ
うなことが可能である。
装置は、例えばいわゆるカラオケ装置において、歌唱者
の声やコーラスの声のピッチを検出し、その声のピッチ
をシフトする(声の高さを高くしたり低くしたりする)
際に適用可能である。すなわち、カラオケ装置において
は、歌唱者による歌の調及び各音の高さを前述したよう
にピッチを検出することによって求め、本来の楽曲の調
及び音の高さに合うようにシフトさせてから変換フレー
ム間を滑らかに繋ぎ、その後、スピーカから出力するよ
うなことが可能である。
【0074】図7には、このカラオケ装置の機能を、い
わゆるパーソナルコンピュータにて実現する場合の概略
構成例を示す。なお、この図7に示すパーソナルコンピ
ュータは、前述したFFT,IFFT処理、周波数シフ
ト処理、基本周期抽出処理、倍音構造操作処理、フレー
ムの接続処理等の各種動作を実現するためのアプリケー
ションデータをインストール或いはダウンロードするこ
とで、それら何れの動作をも実現可能である。
わゆるパーソナルコンピュータにて実現する場合の概略
構成例を示す。なお、この図7に示すパーソナルコンピ
ュータは、前述したFFT,IFFT処理、周波数シフ
ト処理、基本周期抽出処理、倍音構造操作処理、フレー
ムの接続処理等の各種動作を実現するためのアプリケー
ションデータをインストール或いはダウンロードするこ
とで、それら何れの動作をも実現可能である。
【0075】この図7において、I/Oポート59は、
例えば外部通信回線と接続される外部端子であり、この
I/Oポート59及び通信回線を介して、後述する外部
のサーバやいわゆる通信カラオケ用放送センタ等に接続
可能となっている。I/Oポート59はI/F回路60
と接続されている。なお、通信カラオケとは、通信カラ
オケ用放送センタに複数の楽曲のデータを蓄積してお
き、この放送センタに複数接続されている遠隔地の端末
装置に必要に応じて楽曲のデータを送信して、端末装置
で楽曲の演奏(再生)を可能とするシステムのことであ
る。したがって、この図7の例ではパーソナルコンピュ
ータを例に挙げたが、該通信カラオケにおける端末装置
であってもよい。
例えば外部通信回線と接続される外部端子であり、この
I/Oポート59及び通信回線を介して、後述する外部
のサーバやいわゆる通信カラオケ用放送センタ等に接続
可能となっている。I/Oポート59はI/F回路60
と接続されている。なお、通信カラオケとは、通信カラ
オケ用放送センタに複数の楽曲のデータを蓄積してお
き、この放送センタに複数接続されている遠隔地の端末
装置に必要に応じて楽曲のデータを送信して、端末装置
で楽曲の演奏(再生)を可能とするシステムのことであ
る。したがって、この図7の例ではパーソナルコンピュ
ータを例に挙げたが、該通信カラオケにおける端末装置
であってもよい。
【0076】このI/F回路60は、I/Oポート59
を介した外部通信回線と、内部CPU(中央処理ユニッ
ト)54との間のインターフェイスである。
を介した外部通信回線と、内部CPU(中央処理ユニッ
ト)54との間のインターフェイスである。
【0077】当該I/Oポート59には、該パーソナル
コンピュータからのデータ要求に応じて、カラオケ用M
IDIデータや前述した周波数シフト処理や基本周期抽
出処理、倍音構造操作処理等の各種の動作を実現するた
めのアプリケーションデータ(以下、カラオケ用アプリ
ケーションデータと呼ぶ)が通信回線を介して供給され
る。
コンピュータからのデータ要求に応じて、カラオケ用M
IDIデータや前述した周波数シフト処理や基本周期抽
出処理、倍音構造操作処理等の各種の動作を実現するた
めのアプリケーションデータ(以下、カラオケ用アプリ
ケーションデータと呼ぶ)が通信回線を介して供給され
る。
【0078】これらカラオケ用MIDIデータやカラオ
ケ用アプリケーションデータは、I/F回路60を介し
てCPU54に送られ、一旦、ハードディスクドライブ
(HDD)56内のハードディスクに記録される。
ケ用アプリケーションデータは、I/F回路60を介し
てCPU54に送られ、一旦、ハードディスクドライブ
(HDD)56内のハードディスクに記録される。
【0079】なお、カラオケ用MIDIデータやカラオ
ケ用アプリケーションデータは、通信回線ではなく、例
えばいわゆるCD−ROM等の光ディスクやフロッピィ
ディスクに記録された状態で図7のパーソナルコンピュ
ータに供給される場合もある。この場合は、該光ディス
クやフロッピィディスクがディスクドライブ61に装填
され、このディスクドライブ61にて読み出されてCP
U54に送られる。もちろん、光ディスクやフロッピィ
ディスクから読み出されたカラオケ用MIDIデータや
カラオケ用アプリケーションデータをハードディスクド
ライブ56に送って記録させることも可能である。図7
の例では、データ転送速度を考慮して、カラオケ用MI
DIデータやカラオケ用アプリケーションデータをハー
ドディスクドライブ56に記録することとする。
ケ用アプリケーションデータは、通信回線ではなく、例
えばいわゆるCD−ROM等の光ディスクやフロッピィ
ディスクに記録された状態で図7のパーソナルコンピュ
ータに供給される場合もある。この場合は、該光ディス
クやフロッピィディスクがディスクドライブ61に装填
され、このディスクドライブ61にて読み出されてCP
U54に送られる。もちろん、光ディスクやフロッピィ
ディスクから読み出されたカラオケ用MIDIデータや
カラオケ用アプリケーションデータをハードディスクド
ライブ56に送って記録させることも可能である。図7
の例では、データ転送速度を考慮して、カラオケ用MI
DIデータやカラオケ用アプリケーションデータをハー
ドディスクドライブ56に記録することとする。
【0080】CPU54は、例えばマウスやキーボード
からなる操作部55からの操作に応じて、パーソナルコ
ンピュータの全体の動作を制御するものであり、図7の
例のようにパーソナルコンピュータをカラオケ装置とし
て動作させる場合には、先ず、ハードディスクドライブ
56に記録(インストール或いはダウンロード)された
カラオケ用アプリケーションデータを読み出し、信号処
理回路53に送る。
からなる操作部55からの操作に応じて、パーソナルコ
ンピュータの全体の動作を制御するものであり、図7の
例のようにパーソナルコンピュータをカラオケ装置とし
て動作させる場合には、先ず、ハードディスクドライブ
56に記録(インストール或いはダウンロード)された
カラオケ用アプリケーションデータを読み出し、信号処
理回路53に送る。
【0081】一方、端子50はアナログ音声信号の外部
入力端子であり、この端子50を介して、歌唱者の声を
マイクロホンにて音響/電気変換したアナログ音声信号
が供給される。このアナログ音声信号は、アナログ/デ
ジタル変換器51にてデジタル信号に変換され、信号処
理回路53に送られる。
入力端子であり、この端子50を介して、歌唱者の声を
マイクロホンにて音響/電気変換したアナログ音声信号
が供給される。このアナログ音声信号は、アナログ/デ
ジタル変換器51にてデジタル信号に変換され、信号処
理回路53に送られる。
【0082】信号処理回路53は、前述した周波数シフ
ト処理や基本周期抽出処理、倍音構造操作処理等を、カ
ラオケ用アプリケーションデータに基づいてソフトウェ
ア上で実現可能な高速演算処理回路である。もちろん、
信号処理回路53では、カラオケ装置として通常備えて
いる歌詞やイメージ映像を表示する為の画像データを生
成することも可能である。
ト処理や基本周期抽出処理、倍音構造操作処理等を、カ
ラオケ用アプリケーションデータに基づいてソフトウェ
ア上で実現可能な高速演算処理回路である。もちろん、
信号処理回路53では、カラオケ装置として通常備えて
いる歌詞やイメージ映像を表示する為の画像データを生
成することも可能である。
【0083】メモリ52は、信号処理回路53での信号
処理に必要なデータや演算途中のデータ、生成した画像
データ等を一時的に蓄えるためのメモリであり、図4の
バッファメモリ3としての機能をも備える。
処理に必要なデータや演算途中のデータ、生成した画像
データ等を一時的に蓄えるためのメモリであり、図4の
バッファメモリ3としての機能をも備える。
【0084】また、信号処理回路53にて生成された各
種画像データは端子62からモニタに送られ、また、端
子50を介して入力され、アナログ/デジタル変換器5
1にてデジタル信号に変換された歌唱者の声の音声信号
は、デジタル/アナログ(D/A)変換器57にてアナ
ログ音声信号に戻され、音声出力端子58から出力さ
れ、スピーカ等に送られる。
種画像データは端子62からモニタに送られ、また、端
子50を介して入力され、アナログ/デジタル変換器5
1にてデジタル信号に変換された歌唱者の声の音声信号
は、デジタル/アナログ(D/A)変換器57にてアナ
ログ音声信号に戻され、音声出力端子58から出力さ
れ、スピーカ等に送られる。
【0085】次に、図8には、外部からの要求に応じて
カラオケ用MIDIデータやカラオケ用アプリケーショ
ンデータを伝送するデータ伝送装置の構成例を示してい
る。すなわち、この伝送装置は、例えば図7のパーソナ
ルコンピュータや通信カラオケ用端末装置に対して、カ
ラオケ用MIDIデータやカラオケ用アプリケーション
データを伝送する、サーバ或いは通信カラオケ用放送セ
ンタに適用可能である。
カラオケ用MIDIデータやカラオケ用アプリケーショ
ンデータを伝送するデータ伝送装置の構成例を示してい
る。すなわち、この伝送装置は、例えば図7のパーソナ
ルコンピュータや通信カラオケ用端末装置に対して、カ
ラオケ用MIDIデータやカラオケ用アプリケーション
データを伝送する、サーバ或いは通信カラオケ用放送セ
ンタに適用可能である。
【0086】この図8において、MIDI格納部70に
はカラオケ用の複数の楽曲のMIDIデータが格納さ
れ、送信プログラム格納部71には予め作成されたカラ
オケ用アプリケーションデータが格納されており、それ
ぞれバスに接続されている。なお、ここではMIDIデ
ータ及びカラオケ用アプリケーションデータがMIDI
格納部70及び送信プログラム格納部71に格納された
例を挙げているが、これらMIDIデータ及びカラオケ
用アプリケーションデータはCD−ROM等の光ディス
クやフロッピィディスクに記録されていてもよく、この
場合の光ディスクやフロッピィディスクは、バスに接続
されたディスクドライブ74に装填される。
はカラオケ用の複数の楽曲のMIDIデータが格納さ
れ、送信プログラム格納部71には予め作成されたカラ
オケ用アプリケーションデータが格納されており、それ
ぞれバスに接続されている。なお、ここではMIDIデ
ータ及びカラオケ用アプリケーションデータがMIDI
格納部70及び送信プログラム格納部71に格納された
例を挙げているが、これらMIDIデータ及びカラオケ
用アプリケーションデータはCD−ROM等の光ディス
クやフロッピィディスクに記録されていてもよく、この
場合の光ディスクやフロッピィディスクは、バスに接続
されたディスクドライブ74に装填される。
【0087】ROM72及びRAM73、並びにハード
ディスクドライブ80は、バスを介してCPU79と接
続され、これらROM72、RAM73、ハードディス
クドライブ80は、CPU79が図8の例の伝送装置を
制御する際の各種データを格納或いは記憶するためのも
のである。
ディスクドライブ80は、バスを介してCPU79と接
続され、これらROM72、RAM73、ハードディス
クドライブ80は、CPU79が図8の例の伝送装置を
制御する際の各種データを格納或いは記憶するためのも
のである。
【0088】I/Oポート78は、外部通信回線と接続
される外部端子であり、このI/Oポート78及び通信
回線を介して、例えば図7のパーソナルコンピュータや
通信カラオケ端末装置に接続可能となっている。I/O
ポート78はI/F回路77と接続されている。
される外部端子であり、このI/Oポート78及び通信
回線を介して、例えば図7のパーソナルコンピュータや
通信カラオケ端末装置に接続可能となっている。I/O
ポート78はI/F回路77と接続されている。
【0089】このI/F回路77は、I/Oポート78
を介した外部通信回線と、内部送受信データ処理回路7
6との間のインターフェイスである。
を介した外部通信回線と、内部送受信データ処理回路7
6との間のインターフェイスである。
【0090】以下、図9のフローチャートを参照しなが
ら、図8の伝送装置がMIDIデータやカラオケ用アプ
リケーションデータを通信回線に送信する流れを説明す
る。なお、この図9のフローチャートでは、通常のデー
タ通信にて行われる、接続管理やトラフィック管理、さ
らに情報収集や料金徴収等については省略している。
ら、図8の伝送装置がMIDIデータやカラオケ用アプ
リケーションデータを通信回線に送信する流れを説明す
る。なお、この図9のフローチャートでは、通常のデー
タ通信にて行われる、接続管理やトラフィック管理、さ
らに情報収集や料金徴収等については省略している。
【0091】この図9のフローチャート及び図8の伝送
装置においては、先ず、ステップS51の処理として、
外部通信回線を介して、MIDIデータやカラオケ用ア
プリケーションデータの送信要求を受信すると、その送
信要求は、送受信データ処理回路76を介してCPU7
9に送られる。
装置においては、先ず、ステップS51の処理として、
外部通信回線を介して、MIDIデータやカラオケ用ア
プリケーションデータの送信要求を受信すると、その送
信要求は、送受信データ処理回路76を介してCPU7
9に送られる。
【0092】CPU79は、送信要求を受け取ると、ス
テップS52の処理として、カラオケ用アプリケーショ
ンデータを送信プログラム格納部71から読み出し、次
いでステップS53にて該送信要求にて要求されている
楽曲のMIDIデータをMIDI格納部70から読み出
す。
テップS52の処理として、カラオケ用アプリケーショ
ンデータを送信プログラム格納部71から読み出し、次
いでステップS53にて該送信要求にて要求されている
楽曲のMIDIデータをMIDI格納部70から読み出
す。
【0093】これら読み出されたMIDIデータ及びカ
ラオケ用アプリケーションデータは、送受信データ処理
回路76に転送される。この送受信データ処理回路76
では、ステップS54の処理として、それらMIDIデ
ータ及びカラオケ用アプリケーションデータを例えばパ
ケット化し、さらにクロック発振器75からの搬送波を
変調して、I/F回路77に送る。
ラオケ用アプリケーションデータは、送受信データ処理
回路76に転送される。この送受信データ処理回路76
では、ステップS54の処理として、それらMIDIデ
ータ及びカラオケ用アプリケーションデータを例えばパ
ケット化し、さらにクロック発振器75からの搬送波を
変調して、I/F回路77に送る。
【0094】これにより、I/F回路77からは、ステ
ップS55の処理として、パケット化されたMIDIデ
ータ及びカラオケ用アプリケーションデータが送信され
る。
ップS55の処理として、パケット化されたMIDIデ
ータ及びカラオケ用アプリケーションデータが送信され
る。
【0095】その後は、ステップS56の処理として、
送信完了の確認が行われる。
送信完了の確認が行われる。
【0096】なお、この図8及び図9にて説明したデー
タ伝送装置では、MIDI格納部70から読み出したM
IDIデータと送信プログラム格納部71から読み出し
たカラオケ用アプリケーションデータをパケット化して
通信回線から送信したが、これらMIDIデータとカラ
オケ用アプリケーションデータを、記録可能な光ディス
クやフロッピィディスクに記録し、それら記録可能な光
デジタルやフロッピィディスクを利用者に提供すること
も可能である。この場合は、MIDI格納部70から読
み出したMIDIデータと送信プログラム格納部71か
ら読み出したカラオケ用アプリケーションデータを、例
えばディスクドライブ74に送り、このディスクドライ
ブ74にて記録可能な光ディスクやフロッピィディスク
に記録する。
タ伝送装置では、MIDI格納部70から読み出したM
IDIデータと送信プログラム格納部71から読み出し
たカラオケ用アプリケーションデータをパケット化して
通信回線から送信したが、これらMIDIデータとカラ
オケ用アプリケーションデータを、記録可能な光ディス
クやフロッピィディスクに記録し、それら記録可能な光
デジタルやフロッピィディスクを利用者に提供すること
も可能である。この場合は、MIDI格納部70から読
み出したMIDIデータと送信プログラム格納部71か
ら読み出したカラオケ用アプリケーションデータを、例
えばディスクドライブ74に送り、このディスクドライ
ブ74にて記録可能な光ディスクやフロッピィディスク
に記録する。
【0097】ここまでの説明では、本発明を例えばカラ
オケ装置等に適用する例を説明したが、その他、レコー
ディングスタジオにおける編集装置当にも本発明を適用
することが可能である。
オケ装置等に適用する例を説明したが、その他、レコー
ディングスタジオにおける編集装置当にも本発明を適用
することが可能である。
【0098】最後に本発明は一例として説明した上述の
実施の形態に限定されることはなく、本発明に係る技術
的思想を逸脱しない範囲であれば、設計等に応じて種々
の変更が可能であることは勿論である。
実施の形態に限定されることはなく、本発明に係る技術
的思想を逸脱しない範囲であれば、設計等に応じて種々
の変更が可能であることは勿論である。
【0099】
【発明の効果】請求項1に記載の本発明に係る音声信号
処理装置は、分割手段にてデジタル音声信号を所定の処
理単位毎に切り出し、基本周波数抽出手段にてその処理
単位の音声信号の基本周波数を抽出し、変換手段にて処
理単位の音声信号を時間領域の信号から周波数領域の信
号へ変換し、周波数シフト手段にて全周波数帯域を高域
側または低域側にシフトし、倍音構造操作手段におい
て、抽出された基本周波数に基づいて全周波数帯域をシ
フトされた音声信号の倍音の構造を操作し、逆変換手段
にて倍音構造が操作された音声信号を時間領域の信号に
逆変換し、処理単位間接続手段にて、各処理単位の初期
位相と基本周期に基づいて逆変後の所定の処理単位間を
接続することにより、従来に比べて簡単な回路構成で処
理時間も比較的短く、しかも音質の劣化がなくて個人の
声の特徴を維持したままの自然な音声音程変換が可能で
ある。
処理装置は、分割手段にてデジタル音声信号を所定の処
理単位毎に切り出し、基本周波数抽出手段にてその処理
単位の音声信号の基本周波数を抽出し、変換手段にて処
理単位の音声信号を時間領域の信号から周波数領域の信
号へ変換し、周波数シフト手段にて全周波数帯域を高域
側または低域側にシフトし、倍音構造操作手段におい
て、抽出された基本周波数に基づいて全周波数帯域をシ
フトされた音声信号の倍音の構造を操作し、逆変換手段
にて倍音構造が操作された音声信号を時間領域の信号に
逆変換し、処理単位間接続手段にて、各処理単位の初期
位相と基本周期に基づいて逆変後の所定の処理単位間を
接続することにより、従来に比べて簡単な回路構成で処
理時間も比較的短く、しかも音質の劣化がなくて個人の
声の特徴を維持したままの自然な音声音程変換が可能で
ある。
【0100】請求項2に記載の本発明に係る音声信号処
理装置は、デジタル入力された音声信号を所定の処理単
位毎に切り出し、その切り出した音声信号の基本周波数
を抽出し、また、切り出した音声信号を時間領域の信号
から周波数領域の信号へ変換し、得られた周波数領域の
信号の全周波数帯域を高域側または低域側にシフトし、
抽出された基本周波数に基づいて、全周波数帯域をシフ
トされた音声信号の倍音の構造を操作した後に時間領域
の信号に逆変換し、各処理単位の初期位相と基本周期に
基づいて、その逆変換後の前記所定の処理単位間を接続
することにより、従来に比べて簡単な回路構成で処理時
間も比較的短く、しかも音質の劣化がなくて個人の声の
特徴を維持したままの自然な音声音程変換が可能であ
る。
理装置は、デジタル入力された音声信号を所定の処理単
位毎に切り出し、その切り出した音声信号の基本周波数
を抽出し、また、切り出した音声信号を時間領域の信号
から周波数領域の信号へ変換し、得られた周波数領域の
信号の全周波数帯域を高域側または低域側にシフトし、
抽出された基本周波数に基づいて、全周波数帯域をシフ
トされた音声信号の倍音の構造を操作した後に時間領域
の信号に逆変換し、各処理単位の初期位相と基本周期に
基づいて、その逆変換後の前記所定の処理単位間を接続
することにより、従来に比べて簡単な回路構成で処理時
間も比較的短く、しかも音質の劣化がなくて個人の声の
特徴を維持したままの自然な音声音程変換が可能であ
る。
【0101】請求項3に記載の本発明に係る情報媒体
は、デジタル入力された音声信号を所定の処理単位毎に
切り出す分割工程と、処理単位毎の音声信号の基本周波
数を抽出する基本周波数抽出工程と、処理単位毎の音声
信号を時間領域の信号から周波数領域の信号へ変換する
変換工程と、音声信号の全周波数帯域を高域側または低
域側にシフトする周波数シフト工程と、基本周波数に基
づいて全周波数帯域をシフトされた音声信号の倍音の構
造を操作する倍音構造操作工程と、倍音構造が操作され
た音声信号を時間領域の信号に逆変換する逆変換工程
と、各処理単位の初期位相と基本周期に基づいて、逆変
換後の処理単位間を接続する処理単位間接続工程とを、
演算装置に対して実行させるプログラムデータを記録、
若しくは伝送することにより、演算装置において、従来
に比べて簡単な回路構成で処理時間も比較的短く、しか
も音質の劣化がなくて個人の声の特徴を維持したままの
自然な音声音程変換が可能となる。
は、デジタル入力された音声信号を所定の処理単位毎に
切り出す分割工程と、処理単位毎の音声信号の基本周波
数を抽出する基本周波数抽出工程と、処理単位毎の音声
信号を時間領域の信号から周波数領域の信号へ変換する
変換工程と、音声信号の全周波数帯域を高域側または低
域側にシフトする周波数シフト工程と、基本周波数に基
づいて全周波数帯域をシフトされた音声信号の倍音の構
造を操作する倍音構造操作工程と、倍音構造が操作され
た音声信号を時間領域の信号に逆変換する逆変換工程
と、各処理単位の初期位相と基本周期に基づいて、逆変
換後の処理単位間を接続する処理単位間接続工程とを、
演算装置に対して実行させるプログラムデータを記録、
若しくは伝送することにより、演算装置において、従来
に比べて簡単な回路構成で処理時間も比較的短く、しか
も音質の劣化がなくて個人の声の特徴を維持したままの
自然な音声音程変換が可能となる。
【図1】本発明に係る音声信号処理装置及び方法が適用
される一実施の形態の音程変換装置の概略構成を示すブ
ロック図である。
される一実施の形態の音程変換装置の概略構成を示すブ
ロック図である。
【図2】図1の音程変換装置の処理単位間接続部におけ
る処理単位(変換フレーム)の接続方法の説明に用いる
図である。
る処理単位(変換フレーム)の接続方法の説明に用いる
図である。
【図3】本実施の形態の音程変換装置の基本周期抽出部
の具体的構成例を示すブロック図である。
の具体的構成例を示すブロック図である。
【図4】基本周期抽出部の一動作例の流れを示すフロー
チャートである。
チャートである。
【図5】基本周期抽出部の他の動作例の流れを示すフロ
ーチャートである。
ーチャートである。
【図6】基本周期抽出部のさらに他の動作例の流れを示
すフローチャートである。
すフローチャートである。
【図7】本発明に係る音声信号処理装置が適用されるパ
ーソナルコンピュータの概略構成を示すブロック図であ
る。
ーソナルコンピュータの概略構成を示すブロック図であ
る。
【図8】本発明に係るプログラムデータ等を伝送する伝
送装置の概略構成を示すブロック図である。
送装置の概略構成を示すブロック図である。
【図9】図8の伝送装置の動作の流れを示すフローチャ
ートである。
ートである。
3…フィルタ回路、4…バッファメモリ、5…ピークサ
ーチ回路、6…符号データ化回路、7…データ分析回
路、8…ピッチ検出回路、23…処理単位分割部、24
…変換部、25…音程変換部、26…倍音構造操作部、
27…逆変換部、28…処理単位間接続部、31…基本
周期抽出部、51…アナログ/デジタル変換器、52…
メモリ、53…信号処置回路、54…CPU、55…操
作部、56…ハードディスクドライブ、57…デジタル
/アナログ変換器、60…I/F回路、72…ROM、
61…ディスクドライブ、70…MIDI格納部、73
…RAM、71…送信プログラム格納部、74…ディス
クドライブ、77…I/F回路、75…クロック発振
器、76…送受信データ処理回路、80…ハードディス
クドライブ
ーチ回路、6…符号データ化回路、7…データ分析回
路、8…ピッチ検出回路、23…処理単位分割部、24
…変換部、25…音程変換部、26…倍音構造操作部、
27…逆変換部、28…処理単位間接続部、31…基本
周期抽出部、51…アナログ/デジタル変換器、52…
メモリ、53…信号処置回路、54…CPU、55…操
作部、56…ハードディスクドライブ、57…デジタル
/アナログ変換器、60…I/F回路、72…ROM、
61…ディスクドライブ、70…MIDI格納部、73
…RAM、71…送信プログラム格納部、74…ディス
クドライブ、77…I/F回路、75…クロック発振
器、76…送受信データ処理回路、80…ハードディス
クドライブ
───────────────────────────────────────────────────── フロントページの続き Fターム(参考) 5D045 BA01 5D108 BE03 BF06 5D378 AD63 KK02 QQ01 9A001 BB01 BB03 BB04 EE05 GG05 HH15 HH16 HH18 JJ27 KK37 KK43 KK45 LL02
Claims (3)
- 【請求項1】 デジタル入力された音声信号を所定の処
理単位毎に切り出す分割手段と、 前記分割手段から出力された音声信号の基本周波数を抽
出する基本周波数抽出手段と、 前記分割手段から出力された音声信号を時間領域の信号
から周波数領域の信号へ変換する変換手段と、 前記変換手段により出力された音声信号の全周波数帯域
を高域側または低域側にシフトする周波数シフト手段
と、 前記ピッチ周波数抽出手段により抽出された基本周波数
に基づいて、前記周波数シフト手段により全周波数帯域
をシフトされた音声信号の倍音の構造を操作する倍音構
造操作手段と、 前記倍音構造操作手段より出力された音声信号を時間領
域の信号に逆変換する逆変換手段と、 各処理単位の初期位相と前記基本周波数に基づいて、前
記逆変換後の前記所定の処理単位間を接続する処理単位
間接続手段とを有することを特徴とする音声信号処理装
置。 - 【請求項2】 デジタル入力された音声信号を所定の処
理単位毎に切り出し、 前記処理単位毎に分割された音声信号の基本周波数を抽
出し、 前記処理単位毎に分割された音声信号を時間領域の信号
から周波数領域の信号へ変換し、 前記時間領域の信号から周波数領域の信号へ変換された
音声信号の全周波数帯域を高域側または低域側にシフト
し、 前記抽出された基本周波数に基づいて、前記全周波数帯
域を高域側または低域側にシフトされた音声信号の倍音
の構造を操作し、 前記倍音の構造が操作された音声信号を時間領域の信号
に逆変換し、 各処理単位の初期位相と前記基本周波数に基づいて、前
記逆変換後の前記所定の処理単位間を接続することを特
徴とする音声信号処理方法。 - 【請求項3】 デジタル入力された音声信号を所定の処
理単位毎に切り出す分割工程と、 前記分割工程により得られる音声信号の基本周波数を抽
出する基本周波数抽出工程と、 前記分割工程により得られる音声信号を時間領域の信号
から周波数領域の信号へ変換する変換工程と、 前記変換工程により得られる音声信号の全周波数帯域を
高域側または低域側にシフトする周波数シフト工程と、 前記基本周波数抽出工程により抽出される基本周波数に
基づいて、前記周波数シフト工程により全周波数帯域を
シフトされた音声信号の倍音の構造を操作する倍音構造
操作工程と、 前記倍音構造操作工程により得られる音声信号を時間領
域の信号に逆変換する逆変換工程と、 各処理単位の初期位相と前記基本周波数に基づいて、前
記逆変換後の前記所定の処理単位間を接続する処理単位
間接続工程とを、 演算装置に対して実行させるプログラムデータを記録、
若しくは伝送することを特徴とする情報媒体。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP11113861A JP2000305600A (ja) | 1999-04-21 | 1999-04-21 | 音声信号処理装置及び方法、情報媒体 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP11113861A JP2000305600A (ja) | 1999-04-21 | 1999-04-21 | 音声信号処理装置及び方法、情報媒体 |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2000305600A true JP2000305600A (ja) | 2000-11-02 |
Family
ID=14622937
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP11113861A Pending JP2000305600A (ja) | 1999-04-21 | 1999-04-21 | 音声信号処理装置及び方法、情報媒体 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2000305600A (ja) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2011237602A (ja) * | 2010-05-11 | 2011-11-24 | Dainippon Printing Co Ltd | 符号化音声データの音高変換装置 |
-
1999
- 1999-04-21 JP JP11113861A patent/JP2000305600A/ja active Pending
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2011237602A (ja) * | 2010-05-11 | 2011-11-24 | Dainippon Printing Co Ltd | 符号化音声データの音高変換装置 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US5641927A (en) | Autokeying for musical accompaniment playing apparatus | |
JP4940588B2 (ja) | ビート抽出装置および方法、音楽同期画像表示装置および方法、テンポ値検出装置および方法、リズムトラッキング装置および方法、音楽同期表示装置および方法 | |
KR101094687B1 (ko) | 노래학습 기능을 갖는 노래방 시스템 | |
US8198525B2 (en) | Collectively adjusting tracks using a digital audio workstation | |
CN1148230A (zh) | 卡拉ok计分的方法和系统 | |
WO2007086417A1 (ja) | ビート抽出装置及びビート抽出方法 | |
KR100256718B1 (ko) | 음피치 변환 장치 | |
JP3659489B2 (ja) | デジタル音声処理装置及びコンピュータプログラム記録媒体 | |
Dutilleux et al. | Time‐segment Processing | |
JP3925349B2 (ja) | 音声データと演奏データの同期再生を行うための装置および方法 | |
JP2000305600A (ja) | 音声信号処理装置及び方法、情報媒体 | |
JP4049465B2 (ja) | 波形再生装置のピッチ制御装置 | |
JP3969249B2 (ja) | 音声データと演奏データの同期再生を行うための装置および方法 | |
JPH09146587A (ja) | 話速変換装置 | |
JPH01152499A (ja) | 倍速再生装置 | |
JP3879684B2 (ja) | 曲データ変換装置および曲データ変換プログラム | |
JPH07287576A (ja) | 音楽再生方法 | |
JP2629739B2 (ja) | 音声信号減衰装置 | |
JP3610732B2 (ja) | 反響音発生装置 | |
JP2002215163A (ja) | 波形データ解析方法、波形データ解析装置および記録媒体 | |
KR0147185B1 (ko) | 영상가요재생시스템의 점수산정제어장치 | |
JPH11305795A (ja) | 音声信号処理装置及び情報媒体 | |
JPH11175097A (ja) | ピッチ検出方法及び装置、判定方法及び装置、データ伝送方法、並びに記録媒体 | |
JP3747850B2 (ja) | 電子音楽装置 | |
JP3351263B2 (ja) | ビブラート付加装置 |