JPH10319947A

JPH10319947A - 音域制御装置

Info

Publication number: JPH10319947A
Application number: JP9139194A
Authority: JP
Inventors: Tsutomu Saito; 勉斉藤; Hiroshi Kato; 寛加藤; Yoichi Kondo; 近藤　　洋一
Original assignee: Kawai Musical Instrument Manufacturing Co Ltd
Current assignee: Kawai Musical Instrument Manufacturing Co Ltd
Priority date: 1997-05-15
Filing date: 1997-05-15
Publication date: 1998-12-04
Also published as: US6629067B1

Abstract

(57)【要約】（修正有）【課題】入力音声の音域を広げた場合に、音声の持ち
主の声色のの感じを崩さないようにし、また最終的な出
力音声の音量を入力音声の音量レベルになるように修正
する音域制御装置。【解決手段】歌唱音声を入力する入力手段１と、入力
音声の基本周波数を抽出する手段２と、抽出された基本
周波数が所定の周波数になるように入力音声のピッチを
制御する手段３と、音声のフォルマントを抽出する手段
４と、ピッチ制御された音声に対し、抽出されたフォル
マントに納まるようにフィルタ演算を行うフォルマント
フィルタ手段５と、入力音声の音量を検出する手段６
と、フィルタ演算された音声の音量を、検出された入力
音声の音量に合わせるように制御する手段７と、歌唱の
対象となる曲の曲情報を記憶している手段８と、その曲
情報を読み出して、曲のメロディ情報及び伴奏情報や各
種音響効果情報を出力する自動再生手段９とを有する。

Description

【発明の詳細な説明】

【０００１】

【発明の属する技術分野】本発明は、入力された音声の
音域を広げる音域制御装置に係り、特にカラオケなどに
おける歌唱の支援システムに用いることができ、また詩
吟・読経・外国語などの発音支援システムとしても利用
できる装置に関する。

【０００２】

【従来の技術】カラオケにおける歌唱支援システムとし
ては、表示装置による歌詞のリアルタイム表示（指示）
及び／又はメロディラインの伴奏などがある。従ってあ
る程度音感のある人ならば、表示された歌詞を見ながら
バックに流れるメロディラインを時々意識することで、
人に聞いてもらえる程度の歌唱ができるはずである。

【０００３】ところが、実際音感はあっても歌唱者の声
帯の個人差は大きく、特に発音できる音域が狭い場合に
は、上記歌唱支援システムを用いたとしても、思ったよ
うな歌唱ができないことが多い。このような問題は、ト
ランスポーズ（移調）機能により歌唱者の音域に合わせ
ることができたとしても、発音帯域を広げることにはな
らず、いかんともし難い。

【０００４】

【発明が解決しようとする課題】上記のような問題を解
決するため、特開平４−２９４３９４号などで、入力さ
れた音声信号に対して、手本となる楽音乃至音声信号デ
ータのピッチに合わせてリアルタイムでピッチ制御を行
い、音域を広げることができるようにする構成が提案さ
れている。

【０００５】しかし、以上のようなピッチ制御を単純に
行っただけでは、入力した音声の声色が変化してしまっ
て、音声を入力した者のそれとは全く別なものになり、
非常に聞きづらくなる。

【０００６】本発明は従来技術の以上のような問題に鑑
み創案されたもので、その第１の目的は、入力音声の音
域を広げた場合に、その音声の持ち主の声色の感じを崩
さないようにする音域制御装置を提供せんとするもので
ある。またその第２の目的は、上記処理により最終的に
出力されてくる音声の音量が違ってきた場合に、入力音
声の音量レベルになるように修正する構成を提供しよう
とするものである。

【０００７】

【課題を解決するための手段】そのため本発明に係る音
域制御装置の構成は、音声を入力する入力手段と、入力
された前記音声の基本周波数を抽出する基本周波数抽出
手段と、抽出された基本周波数を所定の周波数になるよ
うに入力音声のピッチ制御を行うピッチ制御手段と、入
力音声のフォルマントを抽出するフォルマント抽出手段
と、ピッチ制御された音声に対し、抽出されたフォルマ
ントに納まるようにフィルタ演算を行うフォルマントフ
ィルタ手段とを有することを基本的特徴としている。前
記ピッチ制御手段により、入力された音声の発音ピッチ
（基本周波数）を、手本となる任意の音高データの周波
数に変換制御することで、入力音声の音域を、該手本に
応じて広げることができるのは、前記構成と同様であ
る。しかし本構成では、更にフォルマント抽出手段によ
って、予め入力された音声のフォルマントを抽出してお
き、ピッチ制御後に再度そのフォルマントになるように
フォルマントフィルタ手段によって修正できるようにし
たことに特徴があり、それにより、ピッチ制御後に声色
が変化することを防止できるようにした。

【０００８】更に請求項２の構成では、上記ピッチ制御
手段によるピッチ制御を行う場合に、手本となる音高デ
ータは、複数の選択可能な音高シーケンスデータとし、
これを基準音高として記憶手段に予め記憶しておくと共
に、該基準音高を適宜選択して順次読み出す読出手段を
更に有することで、該読出手段により記憶手段から基準
音高の読み出しを行い、手本となる音高データの抑揚を
表した基準音高（音高シーケンスデータ）の周波数にな
るように、抽出された基本周波数のピッチ制御を行うよ
うにした。

【０００９】一方フォルマント修正を行った音声は、そ
の音量が入力音声の音量と違ってくることになる。その
ため請求項３の構成は、請求項１の構成と同様な構成を
有する他、入力された前記音声の音量を検出する入力音
量検出手段と、フィルタ演算された前記音声の音量を、
検出された入力音声の音量に合わせるように制御する音
量制御手段とを有する構成とし、該音量制御手段によっ
て、最終的にフォルマント修正後の音量を、入力音声の
音量レベルになるように制御することとした。

【００１０】加えて請求項４の構成では、請求項３のよ
うな構成で、請求項２の構成と同様、前記記憶手段と読
出手段の構成を有し、上記ピッチ制御手段によるピッチ
制御を行う場合に、読出手段により記憶手段から基準音
高の読み出しを行い、手本となる音高データの抑揚を表
した基準音高（音高シーケンスデータ）の周波数になる
ように、抽出された基本周波数のピッチ制御を行うよう
にしたものである。

【００１１】上記構成のうち請求項２及び４の構成にお
いて、基準音高を記憶した前記記憶手段は、イベント変
化に対応した記憶を行うと共に、ビブラート及び／又は
それに類するピッチの周期的変化を伴う音響効果のデー
タの記憶につき、時間とデプスとスピードというパラメ
ータで記憶するようにすると、データ量が少なくて済
み、従って記憶できる基準音高の数を増やすことが可能
となる。

【００１２】前記フォルマント抽出手段による入力音声
のフォルマント抽出は、順次行うこともできるし、任意
の瞬間にのみ抽出することも可能であるし、また任意の
時間をおいてインターバルで行ったり、ランダムにその
抽出を行うようにしても良い。

【００１３】前記音量制御手段による音量制御は、後述
する実施形態で詳述するように、フォルマントフィルタ
演算された音声音量と、前記入力音量検出手段により検
出された音声音量との比率に基づき行うようにしても良
い。

【００１４】以上の構成を歌唱支援システムの構成とし
て用いた場合、歌唱者は、自分の声色を損なうことな
く、自分の出せる音域よりも広い音域で歌唱することが
でき、更に自分が歌唱した通りの音量レベルにてスピー
カなどから放音することができるようになる。また上記
構成を詩吟・読経・外国語などの発音支援システムとし
て用いれば、基本的に初心者が熟練者と同じイントネー
ション（抑揚）で、且つ自分の声色を崩すことなく放音
することが可能となる。

【００１５】

【発明の実施の形態】以下本発明の実施の形態を添付図
面に基づいて説明する。図１は、本発明の構成をカラオ
ケの歌唱支援システムとして利用した場合における各構
成の機能ブロックを示している。該構成では、後述する
入力手段１として、カラオケの歌唱音声入力用のマイク
１１及びＡ／Ｄ変換器１２が使用され、また記憶手段及
び読出手段としては、内部・外部記憶装置及びホストＣ
ＰＵで構成され、それら以外は、全部ＤＳＰ（Digital
Signal Processor）で構成されている。そのためまずカ
ラオケシステムの基本的な構成につき説明する。

【００１６】本カラオケシステムは、歌唱の対象となる
曲の曲情報（歌詞・映像・メロディ・伴奏など）を記憶
している曲情報記憶手段８と、その曲情報を読み出し
て、曲のメロディ情報及び伴奏情報や各種音響効果情報
（リバーブ情報・定位情報）などを出力する自動再生手
段９と、歌唱音声入力用のマイク１１及びそれに捉えら
れた音声のアナログ信号をデジタル信号に変換するＡ／
Ｄ変換器１２からなる入力手段１と、該伴奏情報に基づ
き楽音を発生せしめる楽音発生手段２００と、出力され
た楽音信号（又は一部系列の楽音信号のみ）に対し、上
記各種音響効果情報に基づいてその曲や音色にあった音
響効果（例えばトレモロ・コーラス・ロータリスピーカ
・ディストーションなど）を付加し、より自然な楽音信
号を作成する効果付加手段２１０と、ＤＳＰ側から２４
ＫＨｚ１６ビットで出力された音声信号を入力して楽音
信号と同等な４８ＫＨｚ２０ビットレベルに合わせるオ
ーバーサンプリング手段２２０と、それらの楽音信号と
音声信号を受けてリバーブやエコー効果を付加するリバ
ーブ手段２３０と、音響効果の付加された楽音信号と音
声信号のデジタル信号をアナログ信号に変換するＤ／Ａ
変換器２４０と、該アナログ信号をＬ／Ｒ独立して増幅
するアンプ２５１ａ、２５１ｂ及びそれら歌唱音声及び
伴奏楽音をＬ／Ｒ独立して放音するスピーカ２５２ａ、
２５２ｂからなる放音手段２５０を有している。また操
作検出手段２６２によりパネル操作子２６１の状態を検
出し、その操作・選択の検出結果に基づき、曲選択手段
２６３、予約手段２６４、強制終了手段２６５、トラン
スポーズ手段２６６に操作・選択された各種操作選択情
報を送り、これらの各手段から、前記自動再生手段９に
対して、選曲、曲予約、選曲スタート、曲演奏ストッ
プ、移調、リバーブ深さ、音声定位などの指示を与える
ことで、自動再生手段９に選曲、曲予約、選曲のスター
ト、強制終了（ストップ）、トランスポーズなどを行わ
しめるようになっている（この他後述するようにフォル
マント抽出指示キーを有する場合は、フォルマント抽出
のトリガ信号を後述するフォルマント抽出手段４に送出
する）。上記構成の内、操作検出手段２６２、曲選択手
段２６３、予約手段２６４、強制終了手段２６５、トラ
ンスポーズ手段２６６、自動再生手段９及び曲情報記憶
手段８の各構成は、ホストＣＰＵ及びその内部記憶装置
・外部記憶装置からなり、楽音発生手段２００は音源Ｌ
ＳＩで構成され、また効果付加手段２１０、オーバーサ
ンプリング手段２２０及びリバーブ手段２３０はＡＳＰ
（Audio Signal Processor）で構成されている。

【００１７】上記構成では、上記曲情報記憶手段８が本
発明の構成である記憶手段に、また自動再生手段９が同
読出手段に、入力手段１が同入力手段に相当している。
更に入力手段１に入力された音声信号がオーバーサンプ
リング手段２２０に入力されるまでの間に、１つのＤＳ
Ｐによって構成することができる次のような構成を備え
ている。即ち、入力された前記音声の基本周波数を抽出
する基本周波数抽出手段２と、抽出された基本周波数が
所定の周波数になるように入力音声のピッチを制御する
ピッチ制御手段３と、入力された前記音声のフォルマン
トを抽出するフォルマント抽出手段４と、ピッチ制御さ
れた音声に対し、抽出されたフォルマントに納まるよう
にフィルタ演算を行うフォルマントフィルタ手段５と、
入力された前記音声の音量を検出する入力音量検出手段
６と、フィルタ演算された前記音声の音量を、検出され
た入力音声の音量に合わせるように制御する音量制御手
段７とを有している。その他、本構成では、Ａ／Ｄ変換
器１２と、基本周波数抽出手段２、ピッチ制御手段３、
フォルマント抽出手段４、入力音量検出手段６との間に
第１バッファ１００を、またフォルマントフィルタ手段
５と音量制御手段７との間に第２バッファ１０１を備
え、更にこの第２バッファ１０１から分岐してフォルマ
ントフィルタ演算がなされた音声信号の内部音量を検出
する内部音量検出手段１１０を備え、その検出信号は音
量制御手段７に出力されることになる。

【００１８】上述のように、上記曲情報記憶手段８が本
発明の構成である記憶手段に、また自動再生手段９が同
読出手段に相当しているため、曲情報記憶手段８に記憶
された曲情報が、基準音高を構成する選択可能な音高シ
ーケンスデータであり、これらのデータは複数あるもの
の中から、パネル操作子２６１からの操作信号で曲選択
手段２６３（乃至予約手段２６４を介して曲選択手段２
６３）により選択され、自動再生手段９によって読み出
されることになる。そして上記音高シーケンスデータ
は、イベント変化に対応して記憶されるデータであり、
更にビブラート及びそれに類するピッチの周期的変化を
伴う音響効果のデータについては、時間とデプスとスピ
ードというパラメータで記憶され、全体のデータ量を軽
いものにしている。

【００１９】更に前記入力手段１のマイク１１は、歌唱
音声を入力し、アナログの電気信号に変換する。また同
手段１のＡ／Ｄ変換器１２は、そのアナログ信号をデジ
タル信号（２４ＫＨｚサンプリング１６ビット）に変
換して、ＤＳＰなどによる信号処理ができるようにす
る。

【００２０】また前記ＤＳＰは、入力された音声がオー
バーサンプリング手段２２０によって処理されるまでの
間に、該音声の音域を広げると共に、声色を変化させず
に、音量も入力音声レベルに維持して、自然な歌唱がで
きるように信号処理を行う。この音域を広げる処理は、
ＤＳＰで構成される前記基本周波数抽出手段２及びピッ
チ制御手段３によってなされる。また声色を変化させな
いようにする処理も、ＤＳＰで構成される前記フォルマ
ント抽出手段４及びフォルマントフィルタ手段５によっ
てなされる。更に音量を維持する処理も、ＤＳＰで構成
される前記入力音量検出手段６及び音量制御手段７によ
ってなされる。

【００２１】即ち、Ａ／Ｄ変換器１２から出力されてく
る歌唱音声のデジタル信号は第１バッファ１００に入力
され時系列に記憶される。そして基本周波数抽出手段２
により入力音声の基本周波数（ピッチ）が抽出される。
また自動再生手段９から出力されてくる曲情報（メロデ
ィ情報）を手本となる基準音高（基準ピッチ）として、
ピッチ制御手段３に入力すると共に、入力音声の基本周
波数も該ピッチ制御手段３に入力し、同手段３にて、前
記基準音高と基本周波数が照らし合わされ、入力音声の
周波数（ピッチ）を基準音高に合わせる処理がなされ
る。このような処理によって、歌唱者は、自分の出せな
い音域においても、手本とずれない音程で歌唱できるよ
うになる。尚、第１バッファ１００は最低２０ｍｓ分の
音声信号を記憶可能とし（第２バッファ１０１について
も同じ）、それにより後述するフォルマント抽出手段４
による１００Ｈｚ付近〜１ＫＨｚ付近までのフォルマン
トの抽出を可能としている。

【００２２】上記のようにしてピッチ制御された音声信
号は、歌唱者のフォルマントが移動し、そのまま放音さ
れると声色が変わってしまうことになる。そのため、フ
ォルマント抽出手段４により、入力音声のフォルマント
を抽出すると共に、フォルマントフィルタ手段５によ
り、ピッチ制御された前記音声に対して、抽出されたフ
ォルマント特性になるようにフィルタ演算を行う。その
うちフォルマント抽出手段４は、通常リアルタイムで逐
次フォルマントを抽出し、それによって得られたフォル
マントパラメータは、移動平均を取って有効とする。ま
たフォルマントフィルタ演算処理は、グラフィックイコ
ライザー的な処理を行い、ある帯域の音声信号は削り、
ある帯域の同信号については付加する処理を行う。この
ような構成によって、ピッチ制御後に再度入力音声のフ
ォルマントになるように修正を加えることができ、ピッ
チ制御により声色が変化するのを防ぐことが可能とな
る。

【００２３】フィルタ演算の行われた音声信号は一旦第
２バッファ１０１に記憶される。このフィルタリング処
理された音声信号は、音声としては歌唱者のものに似る
が、音量が入力音声の音量とずれてくる可能性が高い。
そのため、入力音量検出手段６により入力音声の音量を
検出すると共に、フィルタ演算された音声の音量を前記
内部音量検出手段１１０により検出し、音量制御手段７
においてこれらの音量を比較して、フィルタ演算された
音声の音量を入力音声の音量と等しくなるように制御
し、出力する（２４ＫＨｚサンプリング１６ビッ
ト）。このような音量制御手段７によって、最終的にフ
ォルマント修正後の音量を、入力音声の音量レベルにな
るようにした。

【００２４】以上の処理がなされた音声信号は、オーバ
ーサンプリング手段２２０によって、カラオケシステム
から発せられる楽音信号と同等の４８ＫＨｚ２０ビット
のデジタル信号に変換され、リバーブ手段２３０でこれ
らの信号に必要なリバーブ・エコー効果が付加されて、
最終的にＤ／Ａ変換器２４０によってアナログ信号に変
換され、放音手段２５０のスピーカ２５２ａ、２５２ｂ
から出力されることになる。

【００２５】図２に上記ＤＳＰで実行されるメインルー
チンを示す。このメインルーチンは、約２０ｍｓ分（４
８０サンプル）の音声（歌唱）信号を記憶した前記第１
バッファ１００及び第２バッファ１０１の内容に基づい
て、図３に示されるＤＳＰ割り込みルーチンによりリア
ルタイム（２４ＫＨｚサンプリング）で実行される第１
バッファ１００への音声信号の書き込み・異なるアドレ
ス信号からの音声信号の読み出し処理、該音声信号のフ
ォルマントフィルタ演算処理、該演算後の音量（Ｌｏｕ
ｄｎｅｓｓ）制御処理などの各処理を実行できるように
するための、係数α、ｇ（）、βを演算する。またこ
のＤＳＰメインルーチンは１０ｍｓ程度で一回りできる
ものとする。

【００２６】パワーＯＮ後、ステップＳ１で初期化（イ
ニシャライズ）を行い、ステップＳ２で、第１バッファ
１００に記憶された約２０ｍｓ分の音声データに対し、
ハニング窓又はハミング窓などの切り出しを行い、時間
窓長が周期の整数倍にないスペクトルも正確に分析でき
る状態とする。

【００２７】ステップＳ３でフォルマント抽出を行う。
これは上記の窓により切り出した音声波形データのパワ
ースペクトルを２０ｍｓ間隔で多数記憶し、その平均化
（移動平均）により求める。尚、このフォルマント抽出
はメインルーチンで毎回行わなくても良く、その場合は
前述の如く、パネル操作子２６１に設けられたフォルマ
ント抽出指示キーに基づくフォルマント抽出指示を受け
た時のみ、フォルマント抽出のトリガ信号をフォルマン
ト抽出手段４に送出することで行っても良い。ステップ
Ｓ２とステップＳ３との間に記載された「フォルマント
抽出指示有り？」という分岐判断は、この場合を想定し
ている。

【００２８】ステップＳ４で、第１バッファ１００の切
り取り波形データ群から基本周波数ｆ₁を抽出する。

【００２９】ステップＳ５で、抽出された基本周波数ｆ
₁とメロディ情報中の基準音高の標準周波数ｆｍとを比
較して、第１バッファ１００に記憶された音声波形デー
タに対する読出アドレスの歩進レート（上記係数α）を
算出する。

【００３０】ステップＳ６で、複数の時系列に並んで記
憶された第１バッファ１００の入力音声波形データ（サ
ンプル値）の絶対値を加算（積算）することで、入力音
声の音量（ｌ₁）を検出する。

【００３１】ステップＳ７で、同様にしてフォルマント
フィルタ演算後の第２バッファ１０１に記憶された音声
波形データ（サンプル値）の絶対値を加算（積算）する
ことで、該音声波形データの音量（ｌ₂）を検出する。

【００３２】ステップＳ８で、入力波形のレベルに戻す
音量補正値（ラウドネス補正値）βを、上記音量ｌ₁と
音量ｌ₂から算出する。その後前記ステップＳ２に戻
る。

【００３３】他方、ＤＳＰの割り込みルーチンの処理
は、図３に示すようにして行われる。まずステップＳ１
０で入力信号を第１バッファ１００へ取り込み、記憶さ
せる｛（ＡＰｉ）←ＩＮＰＵＴ｝。ステップＳ１１で、
第１バッファ１００の記憶アドレスを更新する（ＡＰｉ
＝ＡＰｉ＋１）。ステップＳ１２で、第１バッファ１０
０から記憶されたデータを読み出す｛ＲＤ₁←（Ａ
Ｐ₀）｝。ステップＳ１３で、読出アドレスを歩進させ
る（ＡＰ₀＝ＡＰ₀＋α）。ステップＳ１４で、読み出し
た音声サンプルデータをフォルマントフィルタ（ＥＱ
Ｕ）に通す｛ＲＤ₂＝ｇ（ＲＤ₁）｝。そしてステップＳ
１５及びステップＳ１６は共に音量検出のために必要な
処理で、まずステップＳ１５で、フィルタリングされた
サンプルデータを第２バッファ１０１へ記憶させる
｛（ＢＰｉ）←ＲＤ₂｝。ステップＳ１６で、第２バッ
ファ１０１の記憶アドレスを更新させる（ＢＰｉ←ＢＰ
ｉ＋１）。ステップＳ１７で、フィルタリングされたサ
ンプルデータのラウドネス制御（音量制御）を行う（Ｒ
Ｄ₃＝β＊ＲＤ₂）。更にステップＳ１８で、ラウドネス
制御されたサンプルデータを出力する（ＯＵＴＰＵＴ←
ＲＤ₃）。

【００３４】図４にホストＣＰＵの送出するメロディ情
報の形体とその形体に基づきＤＳＰにて作成される基準
音高の標準周波数ｆｍを示す。メロディ情報は伴奏情報
と同様にＭＩＤＩデータであり、特にビブラートなどの
ＭＩＤＩ規格で詳細な規定のないものは、ＭＯＤＳＰ
ＥＥＤ、ＭＯＤＤＥＰＴＨというような少ないパラメ
ータで済ませる。更に、図５のように、Ｆａｄｅｉｎ
ｔｉｍｅとＦａｄｅｏｕｔｔｉｍｅのようなパラメー
タを付加しても良い。

【００３５】次に上述したカラオケシステムで使用され
ているパネル操作子２６１、ホストＣＰＵ、音源ＬＳ
Ｉ、ＡＳＰの各構成につき、詳述する。パネル操作子２
６１の各キーは、選曲のためのテンキー、選曲終了を指
示する（曲をスタートさせる）ためのエンターキー、曲
を強制的にストップさせるためのクリアキー（ストップ
キー）、自分の帯域で歌唱するために曲の音高情報を移
調するトランスポーズキー、リバーブ深さを制御するＲ
ｅｖＤｅｐｔｈキーや歌唱者の定位（奥行き感）を任意
に設定するためのＰｏｓｉｔｉｏｎキー（及び必要に応
じて１乃至数回のみのフォルマント抽出の指示を行わし
めるフォルマント抽出指示キー）を有している（本構成
ではフォルマント抽出は常時行われており、通常は上記
フォルマント抽出指示キーによる抽出指示は行われな
い）。

【００３６】また前述のように、音高シーケンスデータ
は、イベント変化に対応して記憶されるデータであり、
そのためホストＣＰＵの出力形態はそれに対応してイベ
ント方式であり、ＭＩＤＩ規格（又はその上位互換的な
仕様）で出力される。

【００３７】音源ＬＳＩは一般的に電子楽器で採用され
ている３２〜６４音ポリフォニック音源で構成され、ホ
ストＣＰＵから演奏情報を受け取りステレオのデジタル
楽音信号（４８ＫＨｚサンプリング２０ビット）とし
て出力される。

【００３８】効果付加手段２１０、オーバーサンプリン
グ手段２２０及びリバーブ手段２３０を構成するＡＳＰ
は、ＤＳＰの構成と略同じであるが、一般的にＡＳＰの
プログラムステップ数は１サンプリングタイム内にＡＳ
Ｐが処理可能なステップ数程度しかなく、ＤＳＰにおい
て行われるようなサンプリングタイムより長い周期にて
抽出される基本周波数やフォルマントなどの処理には不
向きである。又リバーブ手段２３０は、ホストＣＰＵか
らの情報により全体のリバーブのかかり具合（ＲｅｖＤ
ｅｐｔｈ）を制御すると共に、音声信号のみを伴奏音系
の楽音信号とは異なるＤｅｌａｙ系・フィードバック系
を経由させることで、パネル操作子２６１にて指示され
た定位（奥行き感）を持たせるようにしている。このＡ
ＳＰの出力は、一般的なデジタルオーディオ信号（ＦＤ
Ｃフォーマット）に合わせてＬ／Ｒのステレオ信号をシ
リアル信号で時分割にて行う。

【００３９】上述のように、フォルマント抽出は、通常
リアルタイムで逐次行われ、それによって得られたフォ
ルマントパラメータは移動平均をとって有効としている
が、歌唱とは別のタイミングで（例えば歌う前に）、パ
ネル操作子２６１のフォルマント抽出指示キーの操作に
基づき１回だけフォルマントを抽出し、歌唱中は全てそ
のフォルマントに合わせるようにすることもできる。そ
の場合は歌唱者とは異なる人のフォルマントを抽出させ
ておくことで、声色も変更することもできる。

【００４０】本構成におけるＤＳＰの処理は、ＰＣＭ波
形のピッチ制御並びにフィルタ処理を中心にした例であ
るが、これに限定されず、例えば図６に示すように、第
１バッファ１００に記憶された音声データを高調波係数
作成手段１０に入力し、周波数フーリエ変換（ＦＦＴ）
を用いた高調波係数レベルで先にフォルマント係数制御
をしてから、変更されたピッチでリアルタイムに高調波
係数合成（サイン合成）を行って音声波形に戻し、その
後音量制御を行わしめるようにしても良い。

【００４１】尚、本構成のカラオケの歌唱支援システム
では、その曲の演奏スピード（テンポ）は、曲のライブ
ラリィに記憶されたデフォルト値を使うことを前提とし
ているが、パネル操作子２６１の操作によって演奏スピ
ードを変更することは容易である。但しＤＳＰにおける
音声波形をＰＣＭデータとして処理する方式では、第１
バッファ１００に記憶された音声波形サンプルデータに
対し、ピッチを上げるため一部を飛び越して繰り返し読
み出したり（シーケンスアドレスを間引きしてデータを
読み出したり）、ピッチを下げるために音声波形の各サ
ンプルを１度以上多数回読み出す処理が行われる場合
に、そのピッチ制御が難しくなる。これらの処理を行う
場合は、常に次の音声波形とは滑らかに連続するように
処理する必要がある。尚、この点に関し、前述のように
一度高調波係数に置き換えてサイン合成によって元に戻
す方式では、何ら問題になることはない。

【００４２】

【発明の効果】以上詳述した本発明に係る音域制御装置
の構成によれば、入力された音声の音域を広げた場合
に、その声の持ち主の音声の感じを崩さないようにする
ことができ、またこれらの処理により最終的に出力され
てくる音声の音量を、入力音声の音量レベルになるよう
に修正することもできるようになる。そして、以上の構
成を歌唱支援システムの構成として用いれば、歌唱者
は、自分の声色を損なうことなく、自分の出せる音域よ
りも広い音域で歌唱することができるようになり、更に
自分が歌唱した通りの音量レベルにてスピーカなどから
放音することができるようになる。加えて上記構成を詩
吟・読経・外国語などの発音支援システムとして用いれ
ば、自分の声色を崩すことなく、基本的に初心者が熟練
者と同じイントネーションで放音することが可能とな
る。もちろん所定の時にのみ入力音声のフォルマント抽
出を行うようにすれば、他人の声色で、歌唱したり、詩
吟・読経・外国語などの発音をすることもできるように
なる。

【図面の簡単な説明】

【図１】本発明の構成をカラオケの歌唱支援システムと
して利用した場合における各構成の機能ブロック図であ
る。

【図２】ＤＳＰで実行されるメインルーチンの処理フロ
ーを示すフローチャートである。

【図３】同じくＤＳＰで実行される割り込みルーチンの
処理フローを示すフローチャートである。

【図４】ホストＣＰＵの送出するメロディ情報の形体と
その形体に基づきＤＳＰにて作成される基準音高の標準
周波数ｆｍを示す説明図である。

【図５】メロディ情報に付加される効果のパラメータの
一例を示す説明図である。

【図６】音声情報を一度高調波係数に置き換えてサイン
合成によって元に戻すＤＳＰの他の処理方式を示す機能
ブロック図である。

【符号の説明】

１入力手段２基本周波数抽出手段３ピッチ制御手段４フォルマント抽出手段５フォルマントフィルタ手段６入力音量検出手段７音量制御手段８曲情報記憶手段９自動再生手段１０高調波係数作成手段１１マイク１２Ａ／Ｄ変換器１００第１バッファ１０１第２バッファ１１０内部音量検出手段２００楽音発生手段２１０効果付加手段２２０オーバーサンプリング手段２３０リバーブ手段２４０Ｄ／Ａ変換器２５０放音手段２５１ａ、２５１ｂアンプ２５２ａ、２５２ｂスピーカ２６１パネル操作子２６２操作検出手段２６３曲選択手段２６４予約手段２６５強制終了手段２６６トランスポーズ手段

Claims

【特許請求の範囲】

【請求項１】音声を入力する入力手段と、入力された
前記音声の基本周波数を抽出する基本周波数抽出手段
と、抽出された基本周波数を所定の周波数になるように
入力音声のピッチ制御を行うピッチ制御手段と、入力音
声のフォルマントを抽出するフォルマント抽出手段と、
ピッチ制御された音声に対し、抽出されたフォルマント
に納まるようにフィルタ演算を行うフォルマントフィル
タ手段とを有することを特徴とする音域制御装置。
【請求項２】音声を入力する入力手段と、入力された
前記音声の基本周波数を抽出する基本周波数抽出手段
と、抽出された基本周波数を所定の周波数になるように
入力音声のピッチ制御を行うピッチ制御手段と、入力音
声のフォルマントを抽出するフォルマント抽出手段と、
ピッチ制御された音声に対し、抽出されたフォルマント
に納まるようにフィルタ演算を行うフォルマントフィル
タ手段とを有すると共に、複数の選択可能な音高シーケ
ンスデータを基準音高として記憶した記憶手段と、該基
準音高を適宜選択して順次読み出す読出手段とを有する
ことで、前記ピッチ制御手段により、抽出された基本周
波数のピッチ制御を行う場合に、前記読出手段により記
憶手段から基準音高の読み出しを行い、該基準音高の周
波数になるように、抽出された基本周波数のピッチ制御
を行うことを特徴とする音域制御装置。
【請求項３】音声を入力する入力手段と、入力された
前記音声の基本周波数を抽出する基本周波数抽出手段
と、抽出された基本周波数を所定の周波数になるように
入力音声のピッチ制御を行うピッチ制御手段と、入力さ
れた前記音声のフォルマントを抽出するフォルマント抽
出手段と、ピッチ制御された音声に対し、抽出されたフ
ォルマントに納まるようにフィルタ演算を行うフォルマ
ントフィルタ手段と、入力された前記音声の音量を検出
する入力音量検出手段と、フィルタ演算された前記音声
の音量を、検出された入力音声の音量に合わせるように
制御する音量制御手段とを有することを特徴とする音域
制御装置。
【請求項４】音声を入力する入力手段と、入力された
前記音声の基本周波数を抽出する基本周波数抽出手段
と、抽出された基本周波数を所定の周波数になるように
入力音声のピッチ制御を行うピッチ制御手段と、入力さ
れた前記音声のフォルマントを抽出するフォルマント抽
出手段と、ピッチ制御された音声に対し、抽出されたフ
ォルマントに納まるようにフィルタ演算を行うフォルマ
ントフィルタ手段と、入力された前記音声の音量を検出
する入力音量検出手段と、フィルタ演算された前記音声
の音量を、検出された入力音声の音量に合わせるように
制御する音量制御手段とを有すると共に、複数の選択可
能な音高シーケンスデータを基準音高として記憶した記
憶手段と、該基準音高を適宜選択して順次読み出す読出
手段とを有することで、前記ピッチ制御手段により、抽
出された基本周波数のピッチ制御を行う場合に、前記読
出手段により記憶手段から基準音高の読み出しを行い、
該基準音高の周波数になるように、抽出された基本周波
数のピッチ制御を行うことを特徴とする音域制御装置。
【請求項５】前記音量制御手段は、フォルマントフィ
ルタ演算された音声音量と、前記入力音量検出手段によ
り検出された音声音量との比率に基づき制御することを
特徴とする請求項３乃至４記載の音域制御装置。
【請求項６】前記フォルマント抽出手段による入力音
声のフォルマント抽出を順次行うことを特徴とする請求
項１乃至５記載の音域制御装置。
【請求項７】基準音高を記憶した前記記憶手段は、イ
ベント変化に対応した記憶を行うと共に、ビブラート及
び／又はそれに類するピッチの周期的変化を伴う音響効
果のデータの記憶については、時間とデプスとスピード
というパラメータで記憶することを特徴とする請求項２
又は４記載の音域制御装置。