JP6060869B2 - カラオケ装置、プログラム - Google Patents

カラオケ装置、プログラム Download PDF

Info

Publication number
JP6060869B2
JP6060869B2 JP2013209192A JP2013209192A JP6060869B2 JP 6060869 B2 JP6060869 B2 JP 6060869B2 JP 2013209192 A JP2013209192 A JP 2013209192A JP 2013209192 A JP2013209192 A JP 2013209192A JP 6060869 B2 JP6060869 B2 JP 6060869B2
Authority
JP
Japan
Prior art keywords
performance
music
karaoke
voice
synthesized
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2013209192A
Other languages
English (en)
Other versions
JP2015072432A (ja
Inventor
哲也 水谷
哲也 水谷
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Brother Industries Ltd
Original Assignee
Brother Industries Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Brother Industries Ltd filed Critical Brother Industries Ltd
Priority to JP2013209192A priority Critical patent/JP6060869B2/ja
Publication of JP2015072432A publication Critical patent/JP2015072432A/ja
Application granted granted Critical
Publication of JP6060869B2 publication Critical patent/JP6060869B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Reverberation, Karaoke And Other Acoustics (AREA)

Description

本発明は、MIDIデータに基づきカラオケ楽曲の演奏を行うとともに、圧縮音声データに基づき音声合成にて生成した合成音声を前記カラオケ楽曲の演奏に合わせて出力するカラオケ装置に関する。
特許文献1には、カラオケ楽曲のカラオケ演奏中に、歌唱者の音声データに基づいて音声合成したガイドボーカルを出力して歌唱支援を行うガイドボーカル機能を有するカラオケ装置について記載されている。
特開2009−244789号公報
しかし、特許文献1に記載の技術では、次のような問題があった。すなわち、上述のようなガイドボーカルを生成するために行われる音声合成については、カラオケ装置が備えるCPUなどの処理装置での処理負荷が大きいため、一時停止や早送り、巻き戻しなどのいわゆるトリックプレイから通常の再生状態に復帰する際に、音声合成がカラオケ演奏に間に合わずに、利用者に不快感を与えるという問題があった。なお、音声データに含まれる発音数の密度が高いほど音声合成のための処理装置での処理負荷は大きくなり、カラオケ演奏に対する合成音声の遅れが顕著となる。
本発明は、このような課題に鑑みなされたものであり、その目的とするところは、一時停止や早送り、巻き戻しなどのいわゆるトリックプレイから通常の再生状態に復帰する際に、カラオケ演奏に対するガイドボーカルなどの合成音声の遅れを極力小さくして、利用者に与える不快感を最小限にする技術を提供することにある。
上記課題を解決するためになされた本発明のカラオケ装置は、楽曲データに基づき、所定の演奏速度でカラオケ楽曲の演奏を行う楽曲演奏手段と、音声合成用データに基づき音声合成にて、前記カラオケ楽曲を歌唱する合成音声を生成し、生成した合成音声を前記楽曲演奏手段によるカラオケ楽曲の演奏とともに前記カラオケ楽曲の演奏速度と同じ値の速度で出力する音声合成処理手段と、前記楽曲演奏手段によるカラオケ楽曲の演奏、前記音声合成処理手段による合成音声の生成、および前記音声合成処理手段による合成音声の出力を制御する制御手段と、前記楽曲演奏手段によるカラオケ楽曲の演奏速度を一時変更する旨の変更指示およびその変更を解除する旨の解除指示を受け付ける指示受付手段と、を備える。
前記指示受付手段が前記変更指示を受け付けた際には、前記制御手段が、前記楽曲演奏手段によるカラオケ楽曲の演奏速度を変更するとともに、前記音声合成処理手段による合成音声の生成および前記音声合成処理手段による合成音声の出力を停止する。
その後、前記指示受付手段が前記解除指示を受け付けた際には、前記制御手段が、前記楽曲演奏手段によるカラオケ楽曲の演奏速度を元に戻すとともに、前記音声合成処理手段による合成音声の出力を前記楽曲演奏手段によるカラオケ楽曲の演奏に同期させるタイミングである合成音声同期タイミングを設定して、前記合成音声同期タイミングに合わせて前記音声合成処理手段による合成音声の生成および前記音声合成処理手段による合成音声の出力を行う。
なお、前記音声合成処理手段による合成音声の生成が前記合成音声同期タイミングに間に合わなかった場合には、前記制御手段が、前記音声合成処理手段による合成音声の生成が前記楽曲演奏手段によるカラオケ楽曲の演奏に追いつくまで前記音声合成処理手段による合成音声の生成を前記カラオケ楽曲の演奏速度より大きい値の速度で行う。
このように構成された本発明のカラオケ装置によれば、一時停止や早送り、巻き戻しなどのいわゆるトリックプレイから通常の再生状態に復帰する際に、カラオケ演奏に対するガイドボーカルなどの合成音声の遅れを極力小さくして、利用者に与える不快感を最小限にすることができる。
また、本発明のカラオケ装置は、圧縮音声データに基づきカラオケ楽曲のデジタル音声信号を生成し、生成したデジタル音声信号を前記楽曲演奏手段によるカラオケ楽曲の演奏とともに前記カラオケ楽曲の演奏速度と同じ値の速度で出力する生音再生処理手段を備え、前記制御手段は、前記生音再生処理手段によるデジタル音声信号の生成、および前記生音再生処理手段によるデジタル音声信号の出力を制御する。
前記指示受付手段が前記変更指示を受け付けた際には、前記制御手段が、前記生音再生処理手段によるデジタル音声信号の生成および前記生音再生処理手段によるデジタル音声信号の出力を停止し、その後、前記指示受付手段が前記解除指示を受け付けた際には、前記制御手段が、前記生音再生処理手段によるデジタル音声信号の出力を前記楽曲演奏手段によるカラオケ楽曲の演奏に同期させるタイミングである音声信号同期タイミングを設定して、前記音声信号同期タイミングに合わせて前記生音再生処理手段によるデジタル音声信号の生成および前記生音再生処理手段によるデジタル音声信号の出力を行うが、前記合成音声同期タイミングについては、前記音声信号同期タイミングが設定された時刻よりも所定時間だけ遅らせた時刻に設定するようにしている。
このように構成された本発明のカラオケ装置によれば、前記音声合成処理手段による合成音声の生成が前記合成音声同期タイミングに間に合わなかった場合に、前記生音再生処理手段によるデジタル音声信号の生成が先行して行われ、デジタル音声信号の生成が開始され、そのデジタル音声信号の生成の終了後には、前記音声合成処理手段による合成音声の生成に注力されるので、前記音声合成処理手段による合成音声の生成が、前記楽曲演奏手段によるカラオケ楽曲の演奏に追いつくのが早まる。したがって、カラオケ演奏に対するガイドボーカルなどの合成音声の遅れを極力小さくして、利用者に与える不快感を最小限にすることができる。
また、本発明のカラオケ装置は、前記制御手段は、前記音声合成処理手段による合成音声の生成が前記合成音声同期タイミングに間に合わなかった場合には、前記音声合成処理手段による合成音声の生成が前記楽曲演奏手段によるカラオケ楽曲の演奏に追いつくまで前記音声合成処理手段による合成音声の出力レベルを低減することを特徴とする。
このように構成された本発明のカラオケ装置によれば、一時停止や早送り、巻き戻しなどのいわゆるトリックプレイから通常の再生状態に復帰する際に、カラオケ演奏に対するガイドボーカルなどの合成音声の遅れを利用者に極力感じさせないようにすることができ、利用者に与える不快感を最小限にすることができる。
また、本発明は、楽曲データに基づき、所定の演奏速度でカラオケ楽曲の演奏を行う楽曲演奏処理と、音声合成用データに基づき音声合成にて、前記カラオケ楽曲を歌唱する合成音声を生成し、生成した合成音声を前記カラオケ楽曲の演奏とともに前記カラオケ楽曲の演奏速度と同じ値の速度で出力する音声合成処理と、前記カラオケ楽曲の演奏速度を一時変更する旨の変更指示およびその変更を解除する旨の解除指示を受け付ける指示受付処理と、前記変更指示を受け付けた際には、前記カラオケ楽曲の演奏速度を変更するとともに、前記合成音声の生成および前記合成音声の出力を停止し、その後、前記解除指示を受け付けた際には、前記カラオケ楽曲の演奏速度を元に戻すとともに、前記合成音声の出力を前記カラオケ楽曲の演奏に同期させるタイミングである合成音声同期タイミングを設定して、前記合成音声同期タイミングに合わせて前記合成音声の生成および前記合成音声の出力を行い、前記合成音声の生成が前記合成音声同期タイミングに間に合わなかった場合には、前記合成音声の生成が前記カラオケ楽曲の演奏に追いつくまで前記合成音声の生成を前記カラオケ楽曲の演奏速度より大きい値の速度で行う制御処理と、をコンピュータに実行させるためのプログラムとしても実現できる。
実施形態のカラオケ装置1の概略構成を示すブロック図である。 入力受付処理の手順を示すフローチャートである。 ハードMIDI演奏処理の手順を示すフローチャートである。 生音演奏処理の手順を示すフローチャートである。 ソフトMIDI演奏処理の手順を示すフローチャートである。 歌声音声合成再生処理の手順を示すフローチャートである。 メイン制御部10が実行する各種処理を説明する説明図である。 メイン制御部10が実行する各種処理を説明する説明図である。
以下、本発明の一実施形態を図面に基づいて説明する。
[1.カラオケ装置1の構成の説明]
カラオケ装置1は、図1に示すように、メイン制御部10、ハードディスクドライブ(HDD)20、音声処理モジュール30、操作処理部40、操作部41、通信インタフェース部42、マイクアンプ43、アナログ−デジタル変換部(ADC)44、映像処理部45等を備える。また、カラオケ装置1には、モニタ50、スピーカアンプ51、スピーカ52、マイクロフォン53が接続されている。
[1.1.メイン制御部10およびHDD20の構成の説明]
メイン制御部10は、カラオケ装置1全体の制御を司る情報処理デバイスである。メイン制御部10は、CPU、ROM、RAM、I/O等を中心に構成されており、HDD20から読込んだプログラムやデータに基づき、種々の処理を実行する。
HDD20は、カラオケの伴奏内容を示す楽曲データや歌詞を示す歌詞データを多数収録したカラオケデータベースや、カラオケ装置1の動作を制御するシステムプログラムやアプリケーションプログラム、各種の情報コンテンツの再生に用いられるデータ等の各種データを記憶する。HDD20が記憶する楽曲データには、MIDI規格で作成された伴奏楽音の演奏データ(MIDIデータ)、伴奏の生音を所定の圧縮音声方式によりデジタルデータに変換した圧縮音声データ、ガイドボーカル用の楽譜データと音声合成用のパラメータと音素データとからなる音声合成用データ、が用意されている。
メイン制御部10は、カラオケ楽曲の演奏に関する機能的構成として、生音再生処理部11、MIDIシーケンサ12、MIDI演奏制御部13、ソフトウェアMIDI音源部14および音声合成処理部15を備える。これらの構成は、メイン制御部10が実行するプログラムによって具現化される。
このうち、生音再生処理部11は、HDD20から読込まれた圧縮音声データの楽曲データをデコードしてカラオケ楽曲を生成してカラオケ楽曲の演奏速度と同じ値の速度で出力する、いわゆる生音再生を行うための音楽再生機能である。生音再生処理部11から出力される楽曲のデジタル音声信号は、音声処理モジュール30のキーコントロール部31に入力される。
MIDIシーケンサ12は、音声処理モジュール30に実装されたMIDI音源32に対して、MIDIデータに基づく楽曲の演奏をさせるためのソフトウェアシーケンサである。このMIDIシーケンサ12は、HDD20から読込まれたMIDIデータに基づき、音声処理モジュール30のMIDI音源32に対して演奏制御データ(MIDIメッセージ)を送出し、MIDI音源32に楽曲の楽音を発生させる。発生された楽音は、本実施形態では楽音のPCMデータとしている。
MIDI演奏制御部13は、メイン制御部10のソフトウェアMIDI音源部14に対して、MIDIデータに基づく所定の演奏速度でのカラオケ楽曲の演奏をさせるためのソフトウェアシーケンサである。
ソフトウェアMIDI音源部14は、メイン制御部10のCPUで実行されるプログラムによってMIDI音源をシミュレートし、MIDIデータに基づく楽音のデジタル音声信号(PCMデータ等)を出力するソフトウェアである。
音声合成処理部15は、ガイドボーカル用の楽譜データと音声合成用のパラメータと音素データからなる音声合成用データに基づいて、楽曲についての理想的な歌唱音声を、音素データを提供したユーザの音声により実現するように音声合成した合成音声を生成して、カラオケ楽曲の演奏速度と同じ値の速度で出力するための音声合成エンジンを備える、ソフトウェアシーケンサである。
なお、楽譜データ、音声合成用パラメータと、音素データや波形データから、音声合成エンジンによって歌唱音声を生成する技術については、例えば、特開平09−90966号、特開2013―114131号、特開2013―190473号など、複数の先行技術が開示されており、既に周知であるため、ここでは詳細に述べない。
本実施形態のカラオケ装置1では、圧縮音声データに基づく生音再生、ハードウェアMIDI音源、ソフトウェアMIDI音源、および音声合成用データに基づく合成音声の再生を同時に使用して、複数音源による楽曲の演奏を行うことを想定している。そのため、メイン制御部10は、生音再生処理部11、MIDIシーケンサ12、MIDI演奏制御部13および音声合成処理部15の各部の処理を並行して行う。
なお、メイン制御部10が、楽曲演奏手段、音声合成処理手段、生音再生処理手段、制御手段、指示受付手段に該当する。また、メイン制御部10が行う処理が、楽曲演奏処理、音声合成処理、指示受付処理および制御処理に該当する。
[1.2.音声処理モジュール30の構成の説明]
音声処理モジュール30は、メイン制御部10からの各音源に対応する入力信号、およびカラオケ装置1に接続されたマイクロフォン53を通じて入力された歌唱音声のデジタル音声信号に対して、各種デジタル音声処理する音声制御デバイスである。音声処理モジュール30は、キーコントロール部31、MIDI音源32、ミュートスイッチ部33、エフェクト部34、ミキサ35、デジタルアナログ変換部(DAC)36、ミュートスイッチ部37を備える。
キーコントロール部31は、メイン制御部10の生音再生処理部11から出力された生音再生のデジタル音声信号に対して、操作部41等を介してユーザにより設定された演奏音のキーの音高に合わせて再生音の音高を変更し、ミキサ35に出力する。なお、ハードウェアMIDI音源およびソフトウェアMIDI音源におけるキーの音高の調節は、メイン制御部10のMIDIシーケンサ12およびMIDI演奏制御部13が行う。
MIDI音源32は、MIDIシーケンサ12から送出されるMIDIメッセージに基づいて、楽曲の楽音のデジタル音声信号を生成し、ミキサ35に出力する。MIDI音源32の機能は、カラオケ装置等に実装される周知のハードウェアMIDI音源と同様である。
ミュートスイッチ部33は、メイン制御部10のソフトウェアMIDI音源部14から出力されるデジタル音声信号の出力経路の途中にあるスイッチである。ミュートスイッチ部33は、MIDI演奏制御部13からの制御に応じて、ソフトウェアMIDI音源部14からのデジタル音声信号のミキサ35への入力を入り切りする。
エフェクト部34は、ADC44によって変換されたマイク入力音のデジタル音声信号に対して、エコー等の音響効果を付加してミキサ35に出力する。
ミキサ35は、キーコントロール部31、MIDI音源32、ミュートスイッチ部33、エフェクト部34およびミュートスイッチ部37の各部から入力された複数音源のデジタル音声信号を、音量や音色等のバランスを調節してミキシングし、ミキシングしたデジタル音声信号をDAC36に出力する。
DAC36は、ミキサ35によりミキシングされて生成されたデジタル音声信号を、アナログ音声信号に変換する。DAC36により変換されたアナログ音声信号は、カラオケ装置1に接続されたスピーカアンプ51によって増幅され、スピーカアンプ51に接続されたスピーカ52から放音される。
ミュートスイッチ部37は、メイン制御部10の音声合成処理部15から出力される合成音声の出力経路の途中にあるスイッチである。ミュートスイッチ部37は、音声合成処理部15からの制御に応じて、音声合成処理部15からの合成音声のミキサ35への入力を入り切りする。
[1.3.カラオケ装置1の他の構成等の説明]
操作部41は、演奏するカラオケ楽曲を指定する操作や、演奏中にキーの音高を変更する操作、演奏速度を一時変更する操作(変更指示)、演奏速度の一時変更を解除する操作(解除指示)等の各種操作を行うための入力装置である。なお、演奏速度を一時変更する操作としては、一時停止、早送り、巻き戻しなどのいわゆるトリックプレイが挙げられる。操作処理部40は、操作部41からの信号を処理してメイン制御部10に入力する。通信インタフェース部42は、カラオケ装置1をLAN100に接続し、他のカラオケ装置や、リモコン端末、外部のサーバ等の情報処理装置との間で通信を行うための構成である。
マイクアンプ43は、カラオケ装置1に接続されるマイクロフォン53から入力される歌唱者の音声(アナログ音声信号)を増幅する増幅器である。
ADC44は、マイクアンプ43からのアナログ音声信号を、デジタル音声信号に変換する変換器である。
映像処理部45は、画像情報を映像化するグラフィックエンジンや圧縮形式の映像データを再生するデコーダからなる映像処理装置である。映像処理部45によって映像化された画像情報は、カラオケ装置1に接続されたモニタ50に表示される。
なお、カラオケ装置1におけるその他の機能や構成については公知技術に従っているので、ここでの詳細な説明は省略する。
[2.メイン制御部10の各種処理の説明]
次に、メイン制御部10が実行する各種処理について、以下に順に説明する。なお、これら各種処理では、早送りの操作入力を受け付けた場合を例に説明するが、早送りの操作入力だけでなく、巻き戻しや一時停止などの他のトリックプレイの操作入力を受け付けた場合も同様である。
[2.1.入力受付処理の説明]
メイン制御部10が実行する入力受付処理の手順について、図2のフローチャートを参照しながら説明する。この処理は、メイン制御部10が実行する他の処理と同時に並行して実行される。
最初のステップS110では、操作部41に対して早送りを実行する旨の入力(早送り入力)があったか否かを判断する。早送り入力があったと判断された場合には(S110:YES)、S120に移行する。一方、早送り入力がなかったと判断された場合には(S110:NO)、S130に移行する。
S120では、ハードMIDI演奏処理、生音演奏処理、ソフトMIDI演奏処理および歌声音声合成再生処理に、早送り入力があった旨を通知する。その後、S110に移行する。
S130では、操作部41に対して早送りを解除する旨の入力(早送り解除)があったか否かを判断する。早送り解除があったと判断された場合には(S130:YES)、S140に移行する。一方、早送り解除がなかったと判断された場合には(S130:NO)、早送りの入力解除があるまで待機するため、S110に移行する。
S140では、生音本数(生音再生処理部11による楽曲のデジタル音声信号の同時出力数)に応じてソフトMIDI演奏用の復帰シーク位置を算出する。なお、ソフトMIDI演奏用の復帰シーク位置とは、ソフトウェアMIDI音源部14によるMIDIデータに基づく楽音のデジタル音声信号の出力をMIDI音源32による楽音の演奏(カラオケ楽曲の演奏)に同期させるタイミングのことである。ここでは、ソフトMIDI演奏用の復帰シーク位置を、現在の演奏位置から、生音の本数と予め実験等により設定した所定値とを掛け合わせた値だけ遅らせた位置として算出する。その後、S150に移行する。
S150では、S140で算出したソフトMIDI演奏用の復帰シーク位置を基に、生音演奏用の復帰シーク位置(音声信号同期タイミング)を算出する。なお、生音演奏用の復帰シーク位置とは、生音再生処理部11による楽曲のデジタル音声信号の出力をMIDI音源32による楽音の演奏(カラオケ楽曲の演奏)に同期させるタイミングのことである。ここでは、生音演奏用の復帰シーク位置を、ソフトMIDI演奏用の復帰シーク位置から、予め実験等により設定した所定値だけ遅らせた位置として算出する。その後、S160に移行する。
S160では、ソフトMIDI演奏用の復帰シーク位置を基に、歌唱合成演奏用の復帰シーク位置(合成音声同期タイミング)を算出する。なお、歌唱合成演奏用の復帰シーク位置とは、音声合成処理部15による合成音声の出力をMIDI音源32による楽音の演奏(カラオケ楽曲の演奏)に同期させるタイミングのことである。ここでは、歌唱合成演奏用の復帰シーク位置を、ソフトMIDI演奏用の復帰シーク位置から、予め実験等により設定した所定値だけ遅らせた位置として算出する。なお、この歌唱合成演奏用の復帰シーク位置については、生音演奏用の復帰シーク位置が設定された時刻よりも所定時間だけ遅らせた時刻に設定されるようにする。その後、S170に移行する。
S170では、ハードMIDI演奏処理、生音演奏処理、ソフトMIDI演奏処理および歌声音声合成再生処理の各処理に、早送り解除があった旨を通知するとともに、S140で算出したソフトMIDI演奏用の復帰シーク位置をソフトMIDI演奏処理に通知し、S150で算出した生音演奏用の復帰シーク位置を生音演奏処理に通知し、S160で算出した歌唱合成演奏用の復帰シーク位置を歌声音声合成再生処理に通知する。その後、次の早送りの入力に備えるため、S110に移行する。
[2.2.ハードMIDI演奏処理の説明]
次に、メイン制御部10が実行するハードMIDI演奏処理の手順について、図3のフローチャートを参照しながら説明する。この処理は、メイン制御部10が実行する他の処理と同時に並行して実行される。
最初のステップS210では、入力受付処理から早送り入力の通知があったか否かを判断する。早送り入力の通知があったと判断された場合には(S210:YES)、カラオケ楽曲の演奏速度を早送りの速度に変更し、S220に移行する。一方、早送り入力の通知がなかったと判断された場合には(S210:NO)、S240に移行する。
S220では、入力受付処理から早送り解除の通知があったか否かを判断する。早送り解除の通知があったと判断された場合には(S220:YES)、S240に移行する。一方、早送り解除の通知がなかったと判断された場合には(S220:NO)、S230に移行する。
S230では、MIDI音源32による楽音の演奏(カラオケ楽曲の演奏)を早送り時の演奏速度にて行う早送り演奏を実行する。その後、早送り解除に備えるため、S210に移行する。
S240では、生音演奏処理によって生音系の演奏、具体的には、生音再生部11からのデータの出力、ソフトウェアMIDI音源部11からのデータの出力、もしくは、歌声合成部15からのデータの出力が行われているか否かを判断する。生音系の演奏が行われていないと判断された場合には(S240:NO)、S250に移行する。一方、生音系の演奏が行われていると判断された場合には(S240:YES)、S260に移行する。
なお、生音再生部11からのデータ出力、ソフトウェアMIDI音源部11からのデータ出力、もしくは、歌声合成部15からのデータ出力を行うために、各データを生成する処理については後述する。
S250では、MIDI音源32による楽音の演奏(カラオケ楽曲の演奏)を再生時の演奏速度にて行う定速演奏を実行する。その後、S210に移行する。
S260では、MIDI音源32による楽音の演奏(カラオケ楽曲の演奏)を再生時の演奏速度にて行う定速演奏を、生音演奏処理によって行われている生音系の演奏と同期させながら実行する。その後、S210に移行する。
[2.3.生音演奏処理の説明]
次に、メイン制御部10が実行する生音演奏処理の手順について、図4のフローチャートを参照しながら説明する。この処理は、メイン制御部10が実行する他の処理と同時に並行して実行される。
最初のステップS310では、入力受付処理から早送り入力の通知があったか否かを判断する。早送り入力の通知があったと判断された場合には(S310:YES)、生音再生を停止し、S320に移行する。一方、早送り入力の通知がなかったと判断された場合には(S310:NO)、S350に移行する。
S320では、入力受付処理から早送り解除の通知があったか否かを判断する。早送り解除の通知がなかったと判断された場合には(S320:NO)、早送り解除の通知がなされるまで待機するために当該S320を再度実行する。一方、早送り解除の通知があったと判断された場合には(S320:YES)、S330に移行する。
S330では、入力受付処理から生音演奏用の復帰シーク位置を受け取る。その後、S340に移行する。
S340では、S330で受け取った生音演奏用の復帰シーク位置からのデコードを準備する。これは、理想的な演奏動作では演奏を開始(再開)したらすぐに演奏音が発生するが(図7(a)参照)、生音の場合、実際には演奏を開始(再開)してもすぐには演奏音は発生せず、タイムラグがあるからである(図7(b)参照)。その後、S350に移行する。
S350では、S310から移行した場合には現在の演奏位置から生音データ(圧縮音声データの楽曲データ)を順次デコードして、PCM(Pulse Code Modulatuion)データを生成し、S340から移行した場合には生音演奏用の復帰シーク位置から生音データ(圧縮音声データの楽曲データ)をデコードし、PCMデータを生成する。その後、S360に移行する。
S360では、(S350で生音データを順次デコードすることで生成したPCMデータ)生成データを、音声処理モジュール30に渡す。その後、S310に移行する。
[2.4.ソフトMIDI演奏処理の説明]
次に、メイン制御部10が実行するソフトMIDI演奏処理の手順について、図5のフローチャートを参照しながら説明する。この処理は、メイン制御部10が実行する他の処理と同時に並行して実行される。
最初のステップS410では、入力受付処理から早送り入力の通知があったか否かを判断する。早送り入力の通知があったと判断された場合には(S410:YES)、カラオケ楽曲の演奏速度を早送りの速度に変更し、S420に移行する。一方、早送り入力の通知がなかったと判断された場合には(S410:NO)、S450に移行する。
S420では、入力受付処理から早送り解除の通知があったか否かを判断する。早送り解除の通知がなかったと判断された場合には(S420:NO)、早送り解除の通知がなされるまで待機するために当該S420を再度実行する。一方、早送り解除の通知があったと判断された場合には(S420:YES)、S430に移行する。
S430では、入力受付処理からソフトMIDI演奏用の復帰シーク位置を受け取る。その後、S440に移行する。
S440では、S430で受け取ったソフトMIDI演奏用の復帰シーク位置からの解釈・レンダリングを準備する。その後、S450に移行する。
S450では、S410から移行した場合には現在の演奏位置からMIDIデータを解釈してレンダリングを行うことで生成した、ソフトMIDIによる楽音のPCMデータを生成し、一方、S440から移行した場合にはソフトMIDI演奏用の復帰シーク位置からMIDIデータを解釈してレンダリングを行うことで生成した、ソフトMIDIによる楽音のPCMデータを生成する。その後、S460に移行する。
S460では、(S450でMIDIデータを解釈してレンダリングを行うことで生成したPCMデータ)生成データを音声処理モジュール30に渡す。その後、S410に移行する。
[2.5.歌声音声合成再生処理の説明]
次に、メイン制御部10が実行する歌声音声合成再生処理の手順について、図6のフローチャートを参照しながら説明する。この処理は、メイン制御部10が実行する他の処理と同時に並行して実行される。
最初のステップS510では、入力受付処理から早送り入力の通知があったか否かを判断する。早送り入力の通知があったと判断された場合には(S510:YES)、合成音声の再生を停止し、S520に移行する。一方、早送り入力の通知がなかったと判断された場合には(S510:NO)、S560に移行する。
S520では、入力受付処理から早送り解除の通知があったか否かを判断する。早送り解除の通知がなかったと判断された場合には(S520:NO)、早送り解除の通知がなされるまで待機するために当該S520を再度実行する。一方、早送り解除の通知があったと判断された場合には(S520:YES)、S530に移行する。
S530では、入力受付処理から歌唱音声合成用の復帰シーク位置を受け取る。その後、S540に移行する。
S540では、S530で受け取った歌唱音声合成用の復帰シーク位置からの歌唱音声合成を準備する。これは、理想的な演奏動作では演奏を開始(再開)したらすぐに演奏音が発生するが(図7(a)参照)、音声合成の場合、生音の場合と同様に、実際には演奏を開始(再開)してもすぐには演奏音は発生せず、タイムラグがあるからである(図7(b)参照)。その後、S550に移行する。
S550では、全体の進み具合から遅れているか否かを判断する。具体的には、カラオケ楽曲の演奏位置と合成音声の再生位置とを比較して、合成音声の再生位置がカラオケ楽曲の演奏位置から遅れているか否かを判断する。全体の進み具合から遅れていないと判断された場合には(S550:NO)、S560に移行する。一方、全体の進み具合から遅れていると判断された場合には(S550:YES)、S580に移行する。
また、この処理で上述のように全体の進み具合から遅れていると判断された場合には(S550:YES)、音声処理モジュール30のミュートスイッチ部37がオンされる。なお、ミュートスイッチ部37のオン、オフ制御についての詳細は後述する。
S560では、S510から移行した場合には現在の演奏位置から楽譜・歌詞データ(音声合成用データ)を解釈して、音声合成用のパラメータと、音素データと、から歌声音声を等速(カラオケ演奏の演奏速度と同じ)で音声合成する。同様に、S550から移行した場合にも、歌唱音声合成用の復帰シーク位置から楽譜・歌詞データ(音声合成用データ)を解釈して、音声合成用のパラメータと、音素データと、から歌声音声を等速(カラオケ演奏の演奏速度と同じ)で合成する。その後、S570に移行する。
S570では、(S560で楽譜・歌詞データを解釈して歌声音声を等速で音声合成によって生成した、歌声音声のPCMデータである)生成データを、音声処理モジュール30に渡す。その後、S510に移行する。
S580では、楽譜・歌詞データ(音声合成用データ)を解釈して歌声音声を最速(カラオケ演奏の演奏速度よりも大きい値の速度にて)で音声合成して、合成された歌声音声の生成データを生成して出力し、生成データを音声処理モジュールに渡す。その後、S550に移行する。
このとき、メイン制御部10は、歌声音声合成再生処理において、全体の進み具合から遅れている期間、つまり、S550の処理で肯定判断されてから再びS550へ移行しているループの期間は、音声処理モジュール30に対して、ミュートスイッチ部37のミュートはオンする指示を与える。このため、この期間において、合成音声の音量は消音、もしくは、低減されることとなる。
また、メイン制御部10は、歌声音声合成再生処理において、S550の処理で否定判断されて全体の進み具合から遅れていない状態となったときに、音声処理モジュール30に対して、ミュートスイッチ部37のミュートを、オンからオフに変更し、ミュートを解除する指示を与える。なおこのとき、生成データはミキサ35に入力が再開される。そしてミキサ35に対する合成音声の入力音量は消音から復旧、もしくは低減が解消される。
[3.音声処理モジュール30が実行する処理の説明]
次に、音声合成された歌唱音声を含んだカラオケ楽曲の出力を行う、音声処理モジュール30の処理について説明する。すなわち、音声処理モジュール30においては、メイン制御部10からミュートスイッチ部33,37にミュートオン/オフする制御信号が入力されると、この制御信号に基づきミキサ35への各生成データの入力が制御され、かつ、各生成データがミキサ35で混合されて出力デバイス(DAC36)に出力される。そして、出力デバイス(DAC36)で可聴可能な音楽信号に変換されてスピーカアンプ51に入力されることで、スピーカ52から、音声合成された歌唱音声を含んだカラオケ楽曲が出力される。
[4.効果]
このように本実施形態のカラオケ装置1によれば、上述した各種処理を実行することにより、次のような効果を有する。
すなわち、カラオケ楽曲の演奏速度を一時変更する旨の変更指示(トリックプレイ実行指示)を受け付けた際には、カラオケ楽曲の演奏速度を変更するとともに、合成音声の生成および合成音声の出力を停止し、その後、カラオケ楽曲の演奏速度の変更を解除する旨の解除指示(トリックプレイ終了指示)を受け付けた際には、カラオケ楽曲の演奏速度を元に戻すとともに、合成音声の出力をカラオケ楽曲の演奏に同期させるタイミング(合成音声同期タイミング)を設定して、合成音声同期タイミングに合わせて合成音声の生成および合成音声の出力を行う(図8(a)参照、トリックプレイとして一時停止を例示)。合成音声の生成が合成音声同期タイミングに間に合わなかった場合には、デジタル音声信号の生成が先行して行われ、デジタル音声信号の生成の終了後には、合成音声の生成に注力して、合成音声の生成がカラオケ楽曲の演奏に追いつくまで合成音声の生成をカラオケ楽曲の演奏速度より大きい値の速度で行うとともに合成音声の出力レベルをミュートする(図8(b)参照、トリックプレイとして一時停止を例示)。
したがって、本実施形態のカラオケ装置1によれば、一時停止や早送り、巻き戻しなどのいわゆるトリックプレイから通常の再生状態に復帰する際に、カラオケ演奏に対するガイドボーカルなどの合成音声の遅れを極力小さくするとともに、合成音声の遅れを利用者に極力感じさせないようにすることができ、利用者に与える不快感を最小限にすることができる。
[5.他の実施形態]
以上、本発明の一実施形態について説明したが、本発明は上記実施形態に限定されるものではなく、以下のような様々な態様にて実施することが可能である。
上記実施形態では、合成音声の生成が合成音声同期タイミングに間に合わなかった場合には、合成音声の生成がカラオケ楽曲の演奏に追いつくまで合成音声の出力レベルをミュートするようにしているが、これには限られず、合成音声の生成がカラオケ楽曲の演奏に追いつくまで合成音声の出力レベルを低減するようにしてもよい。
このように構成しても合成音声の遅れを利用者に極力感じさせないようにすることができ、利用者に与える不快感を最小限にすることができる。
1…カラオケ装置、10…メイン制御部、11…生音再生処理部、12…MIDIシーケンサ、13…MIDI演奏制御部、14…ソフトウェアMIDI音源部、15…音声合成処理部、20…HDD、30…音声処理モジュール、31…キーコントロール部、32…MIDI音源、33…ミュートスイッチ部、34…エフェクト部、35…ミキサ、36…DAC、37…ミュートスイッチ部、40…操作処理部、41…操作部、42…通信インタフェース部、43…マイクアンプ、44…ADC、45…映像処理部、50…モニタ、51…スピーカアンプ、52…スピーカ、53…マイクロフォン、100…LAN。

Claims (4)

  1. 楽曲データに基づき、所定の演奏速度でカラオケ楽曲の演奏を行う楽曲演奏手段と、
    音声合成用データに基づき音声合成にて、前記カラオケ楽曲を歌唱する合成音声を生成し、生成した合成音声を前記楽曲演奏手段によるカラオケ楽曲の演奏とともに前記カラオケ楽曲の演奏速度と同じ値の速度で出力する音声合成処理手段と、
    前記楽曲演奏手段によるカラオケ楽曲の演奏、前記音声合成処理手段による合成音声の生成、および前記音声合成処理手段による合成音声の出力を制御する制御手段と、
    前記楽曲演奏手段によるカラオケ楽曲の演奏速度を一時変更する旨の変更指示およびその変更を解除する旨の解除指示を受け付ける指示受付手段と、
    を備え、
    前記制御手段は、
    前記指示受付手段が前記変更指示を受け付けた際には、前記楽曲演奏手段によるカラオケ楽曲の演奏速度を変更するとともに、前記音声合成処理手段による合成音声の生成および前記音声合成処理手段による合成音声の出力を停止し、
    その後、前記指示受付手段が前記解除指示を受け付けた際には、前記楽曲演奏手段によるカラオケ楽曲の演奏速度を元に戻すとともに、前記音声合成処理手段による合成音声の出力を前記楽曲演奏手段によるカラオケ楽曲の演奏に同期させるタイミングである合成音声同期タイミングを設定して、前記合成音声同期タイミングに合わせて前記音声合成処理手段による合成音声の生成および前記音声合成処理手段による合成音声の出力を行い、
    前記音声合成処理手段による合成音声の生成が前記合成音声同期タイミングに間に合わなかった場合には、前記音声合成処理手段による合成音声の生成が前記楽曲演奏手段によるカラオケ楽曲の演奏に追いつくまで前記音声合成処理手段による合成音声の生成を前記カラオケ楽曲の演奏速度より大きい値の速度で行うこと
    を特徴とするカラオケ装置。
  2. 請求項1に記載のカラオケ装置において、
    さらに、
    圧縮音声データに基づきカラオケ楽曲のデジタル音声信号を生成し、生成したデジタル音声信号を前記楽曲演奏手段によるカラオケ楽曲の演奏とともに前記カラオケ楽曲の演奏速度と同じ値の速度で出力する生音再生処理手段を備え、
    前記制御手段は、
    前記生音再生処理手段によるデジタル音声信号の生成、および前記生音再生処理手段によるデジタル音声信号の出力を制御し、
    前記指示受付手段が前記変更指示を受け付けた際には、前記生音再生処理手段によるデジタル音声信号の生成および前記生音再生処理手段によるデジタル音声信号の出力を停止し、
    その後、前記指示受付手段が前記解除指示を受け付けた際には、前記生音再生処理手段によるデジタル音声信号の出力を前記楽曲演奏手段によるカラオケ楽曲の演奏に同期させるタイミングである音声信号同期タイミングを設定して、前記音声信号同期タイミングに合わせて前記生音再生処理手段によるデジタル音声信号の生成および前記生音再生処理手段によるデジタル音声信号の出力を行うが、
    前記合成音声同期タイミングについては、前記音声信号同期タイミングが設定された時刻よりも所定時間だけ遅らせた時刻に設定すること
    を特徴とするカラオケ装置。
  3. 請求項1または請求項2に記載のカラオケ装置において、
    前記制御手段は、前記音声合成処理手段による合成音声の生成が前記合成音声同期タイミングに間に合わなかった場合には、前記音声合成処理手段による合成音声の生成が前記楽曲演奏手段によるカラオケ楽曲の演奏に追いつくまで前記音声合成処理手段による合成
    音声の出力レベルを低減すること
    を特徴とするカラオケ装置。
  4. 楽曲データに基づき、所定の演奏速度でカラオケ楽曲の演奏を行う楽曲演奏処理と、
    音声合成用データに基づき音声合成にて、前記カラオケ楽曲を歌唱する合成音声を生成し、生成した合成音声を前記カラオケ楽曲の演奏とともに前記カラオケ楽曲の演奏速度と同じ値の速度で出力する音声合成処理と、
    前記カラオケ楽曲の演奏速度を一時変更する旨の変更指示およびその変更を解除する旨の解除指示を受け付ける指示受付処理と、
    前記変更指示を受け付けた際には、前記カラオケ楽曲の演奏速度を変更するとともに、前記合成音声の生成および前記合成音声の出力を停止し、その後、前記解除指示を受け付けた際には、前記カラオケ楽曲の演奏速度を元に戻すとともに、前記合成音声の出力を前記カラオケ楽曲の演奏に同期させるタイミングである合成音声同期タイミングを設定して、前記合成音声同期タイミングに合わせて前記合成音声の生成および前記合成音声の出力を行い、前記合成音声の生成が前記合成音声同期タイミングに間に合わなかった場合には、前記合成音声の生成が前記カラオケ楽曲の演奏に追いつくまで前記合成音声の生成を前記カラオケ楽曲の演奏速度より大きい値の速度で行う制御処理と、
    をコンピュータに実行させるためのプログラム。
JP2013209192A 2013-10-04 2013-10-04 カラオケ装置、プログラム Active JP6060869B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2013209192A JP6060869B2 (ja) 2013-10-04 2013-10-04 カラオケ装置、プログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2013209192A JP6060869B2 (ja) 2013-10-04 2013-10-04 カラオケ装置、プログラム

Publications (2)

Publication Number Publication Date
JP2015072432A JP2015072432A (ja) 2015-04-16
JP6060869B2 true JP6060869B2 (ja) 2017-01-18

Family

ID=53014824

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2013209192A Active JP6060869B2 (ja) 2013-10-04 2013-10-04 カラオケ装置、プログラム

Country Status (1)

Country Link
JP (1) JP6060869B2 (ja)

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH09134188A (ja) * 1995-11-10 1997-05-20 Matsushita Electric Ind Co Ltd 歌声合成装置および音楽再生装置
JP3265995B2 (ja) * 1996-07-24 2002-03-18 ヤマハ株式会社 歌唱音声合成装置及び方法
JP4168621B2 (ja) * 2001-12-03 2008-10-22 沖電気工業株式会社 歌唱音声合成を用いた携帯電話装置及び携帯電話システム
JP4236533B2 (ja) * 2003-07-18 2009-03-11 クリムゾンテクノロジー株式会社 楽音発生装置及びそのプログラム

Also Published As

Publication number Publication date
JP2015072432A (ja) 2015-04-16

Similar Documents

Publication Publication Date Title
JP2017021125A (ja) 音声対話装置
CN114067768A (zh) 播放控制方法及播放控制系统
US9087503B2 (en) Sampling device and sampling method
JP2007183442A (ja) 楽音合成装置及びプログラム
JP2007316269A (ja) 楽音合成装置及びプログラム
JP4539594B2 (ja) 再生録音装置
JP6060869B2 (ja) カラオケ装置、プログラム
JP2011215292A (ja) 歌唱判定装置およびカラオケ装置
JP2004302011A (ja) 指揮棒の振りタイミングに同期させて演奏する装置
JP2000047677A (ja) カラオケ装置
JP5106437B2 (ja) カラオケ装置及びその制御方法並びにその制御プログラム
JP5754404B2 (ja) Midi演奏装置
JPH09134188A (ja) 歌声合成装置および音楽再生装置
JP2006261920A (ja) ミキシング装置
JP5375869B2 (ja) 楽曲再生装置、楽曲再生方法及びプログラム
JP4168391B2 (ja) カラオケ装置、音声処理方法及びプログラム
JP2005037848A (ja) 楽音発生装置及びそのプログラム
JP2010054856A (ja) 電子楽器
JP4479635B2 (ja) オーディオ装置及びカラオケ装置
JP3867579B2 (ja) マルチメディアシステム及び再生装置
JP2007093658A (ja) オーディオ装置及びカラオケ装置
JP2017015957A (ja) 演奏記録装置およびプログラム
JP6264660B2 (ja) 音源制御装置、カラオケ装置、音源制御プログラム
JP6485955B2 (ja) 歌唱音声の放音遅延に対応したカラオケシステム
JP5273402B2 (ja) カラオケ装置

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20150325

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20160405

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20160603

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20161115

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20161128

R150 Certificate of patent or registration of utility model

Ref document number: 6060869

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150