JP4949899B2 - ピッチ表示制御装置 - Google Patents

ピッチ表示制御装置 Download PDF

Info

Publication number
JP4949899B2
JP4949899B2 JP2007064110A JP2007064110A JP4949899B2 JP 4949899 B2 JP4949899 B2 JP 4949899B2 JP 2007064110 A JP2007064110 A JP 2007064110A JP 2007064110 A JP2007064110 A JP 2007064110A JP 4949899 B2 JP4949899 B2 JP 4949899B2
Authority
JP
Japan
Prior art keywords
pitch
representative value
image data
data
reference data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2007064110A
Other languages
English (en)
Other versions
JP2008225117A (ja
Inventor
幹男 中川
伸悟 神谷
拓弥 ▲高▼橋
聡 橘
豪 矢吹
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Yamaha Corp
Daiichikosho Co Ltd
Original Assignee
Yamaha Corp
Daiichikosho Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Yamaha Corp, Daiichikosho Co Ltd filed Critical Yamaha Corp
Priority to JP2007064110A priority Critical patent/JP4949899B2/ja
Publication of JP2008225117A publication Critical patent/JP2008225117A/ja
Application granted granted Critical
Publication of JP4949899B2 publication Critical patent/JP4949899B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Reverberation, Karaoke And Other Acoustics (AREA)

Description

本発明は、音声のピッチを表示するための技術に関する。
カラオケ装置においては、歌唱者の歌唱の巧拙を採点するための方法が種々提案されている。例えば、特許文献1においては、歌唱とそのお手本となるリファレンスを比較するにあたって、歌唱のタイミングとリファレンスのタイミングがずれている場合には、歌唱音声データとリファレンスデータを時間軸方向にずらして相互相関を求め、相互相関の最も高い位置で各音符について採点する方法が提案されている。この方法によれば、歌唱者が「ため」や「ルバート」の歌唱技法を用いて歌唱した場合でも、歌唱タイミングをリファレンスのタイミングに合わせて比較して採点することができる。
特開2005−107330号公報
しかしながら、特許文献1に記載の技術においては、歌唱者の歌唱の巧拙を採点することができるものの、歌唱者は、その採点結果を見ても、曲中のどの箇所がどのように悪いのかを把握することができなかった。歌唱者が自身の歌唱を確認するための一例として、歌唱者のピッチの時間的な変化を表すグラフを画面に表示することも考えられるが、歌唱音声の周波数は不安定であり、音声の周波数の変化をそのまま表示しても、歌唱者がその内容を理解することは難しい場合が多い。
本発明は上述した背景の下になされたものであり、歌唱者のピッチを、より理解し易い形式で表示する技術を提供することを目的とする。
上記課題を解決するため、本発明の好適な態様であるピッチ表示制御装置は、音声のピッチを複数の区間に区分し、各区間の代表値を特定する代表値特定手段と、収音された音声を表すオーディオ信号から、該オーディオ信号のピッチを検出するピッチ検出手段と、前記ピッチ検出手段によって前記ピッチが検出されなかった時間区間がある場合に、該時間区間の直後に検出されたピッチで、該ピッチの検出が開始されたときから予め定められた時間前までの間のピッチを補間するピッチ補間手段と、前記ピッチ補間手段により補間がなされたピッチに対して、該ピッチが含まれる区間の代表値を前記代表値特定手段を用いて特定し、ピッチを、前記代表値特定手段を用いて特定された代表値に変換するピッチ丸め手段と、前記ピッチ丸め手段により変換された代表値の時間的変化を表す画像データを生成する画像データ生成手段と、前記画像データ生成手段により生成された画像データを表示手段に出力する画像データ出力手段とを具備することを特徴とする。
また、本発明の好適な態様であるピッチ表示制御装置は、音声のピッチを複数の区間に区分し、各区間の代表値を特定する代表値特定手段と、収音された音声を表すオーディオ信号から、該オーディオ信号のピッチを検出するピッチ検出手段と、前記ピッチ検出手段により検出されたピッチが含まれる区間の代表値を前記代表値特定手段を用いて特定し、前記ピッチ検出手段により検出されたピッチを、前記代表値特定手段を用いて特定された代表値に変換するピッチ丸め手段と、前記ピッチ丸め手段によって変換された代表値の時間的な変化を解析し、同一の代表値が予め定められた時間以上継続している場合には、該代表値を選択する一方、それ以外の場合には、直前に選択された代表値を継続して選択する代表値選択手段と、前記代表値選択手段により選択された代表値の時間的変化を表す画像データを生成する画像データ生成手段と、前記画像データ生成手段により生成された画像データを表示手段に出力する画像データ出力手段とを具備することを特徴とする
また、上述の態様において、前記画像データ生成手段は、前記代表値の高低をその表示位置で示すとともに該代表値の継続時間長をその形状で示す帯状図形を含む画像を表す画像データを生成してもよい。
また、上述の態様において、模範となるピッチの時間的変化を表すリファレンスデータを記憶するリファレンスデータ記憶手段を備え、前記画像データ生成手段は、前記ピッチ丸め手段により変換された代表値の時間的変化と、前記リファレンスデータ記憶手段に記憶されたリファレンスデータの示すピッチの時間的変化とが、比較可能な態様で表示されるような画像データを生成してもよい。
また、上述の態様において、前記画像データ生成手段は、前記ピッチ丸め手段により変換された代表値の時間的変化と前記リファレンスデータ記憶手段に記憶されたリファレンスデータの示すピッチの時間的変化とが、一致する場合と一致しない場合とで異なる態様で表示されるような画像データを生成してもよい。
また、上述の態様において、模範となるピッチの時間的変化を示すリファレンスデータを記憶するリファレンスデータ記憶手段を備え、前記画像データ生成手段は、前記代表値選択手段により選択された代表値の時間的変化と、前記リファレンスデータ記憶手段に記憶されたリファレンスデータの示すピッチの時間的変化とが、比較可能な態様で表示されるような画像データを生成してもよい。
本発明によれば、歌唱者のピッチを、より理解し易い形式で表示することができる。
<A:構成>
図1は、この発明の一実施形態であるカラオケ装置1のハードウェア構成を示すブロック図である。図において、制御部11は、CPU(Central Processing Unit)や、ROM(Read Only Memory)、RAM(Random Access Memory)を備え、ROM又は記憶部12に記憶されているコンピュータプログラムを読み出して実行することにより、バスBUSを介してカラオケ装置1の各部を制御する。記憶部12は、制御部11によって実行されるコンピュータプログラムやその実行時に使用されるデータを記憶するための記憶手段であり、例えばハードディスク装置である。表示部13は、液晶パネル等を備え、制御部11による制御の下に各種の画像を表示する。操作部14は、カラオケ装置1の利用者による操作に応じた信号を制御部11に出力する。マイクロホン15は、収音し、収音した音声を表すオーディオ信号(アナログ信号)を出力する収音手段である。音声処理部16は、マイクロホン15が出力するオーディオ信号(アナログ信号)をデジタルデータに変換する。また、音声処理部16は、デジタルデータをアナログ信号に変換してスピーカ17に出力する。スピーカ17は、音声処理部16でデジタルデータからアナログ信号に変換され出力されるオーディオ信号に応じた強度で放音する放音手段である。
なお、この実施形態では、マイクロホン15とスピーカ17とがカラオケ装置1に含まれている場合について説明するが、音声処理部16に入力端子及び出力端子を設け、オーディオケーブルを介してその入力端子に外部マイクロホンを接続する構成としても良く、同様に、オーディオケーブルを介してその出力端子に外部スピーカを接続するとしても良い。また、この実施形態では、マイクロホン15から音声処理部16へ入力されるオーディオ信号及び音声処理部16からスピーカ17へ出力されるオーディオ信号がアナログオーディオ信号である場合について説明するが、デジタルオーディオデータを入出力するようにしても良い。このような場合には、音声処理部16にてA/D変換やD/A変換を行う必要はない。表示部13、操作部14についても同様であり、カラオケ装置1に内蔵される形式であってもよく、外付けされる形式であってもよい。
カラオケ装置1の記憶部12は、図1に示すように、楽曲データ記憶領域121と、背景画データ記憶領域122とを有している。楽曲データ記憶領域121には、楽曲の伴奏音や歌詞を表す楽曲データが記憶されている。背景画データ記憶領域122には、カラオケ伴奏時に背景として表示される動画像を表す背景画データが記憶されている。
ここで、楽曲データ記憶領域121に記憶された楽曲データの内容の一例について説明する。楽曲データは、図2に示すように、ヘッダと複数のトラックとを有しており、複数のトラックには、利用者が歌唱すべき旋律(ピッチ)の内容を表すリファレンスデータが記述されたリファレンスデータトラック、カラオケ演奏音の内容を表す演奏データが記述された演奏トラック、歌詞の内容を表す歌詞データが記述された歌詞トラックがある。また、ヘッダ部分には、図2に示すように楽曲を特定する曲番号データ、楽曲の曲名を示す曲名データ、ジャンルを示すジャンルデータ、楽曲の演奏時間を示す演奏時間データ等が含まれている。以上の楽曲データは、MIDIフォーマットに従って記述されている。
次に、リファレンスデータトラックに記述されているリファレンスデータの具体例について説明する。図3は行と列のマトリックスになっているので、まず、列について説明する。第1列のデルタタイムは、イベントとイベントとの時間間隔を示しており、テンポクロックの数で表される。デルタタイムが「0」の場合は、直前のイベントと同時に実行される。第2列には演奏データの各イベントが持つメッセージの内容が記述されている。このメッセージには、発音イベントを示すノートオンメッセージ(NoteOn)や消音イベントを示すノートオフメッセージ(NoteOff)の他、コントロールチェンジメッセージ等が含まれる。なお、図3に示す例では、コントロールチェンジメッセージは含まれていない。
第3列にはチャネルの番号が記述されている。ここでは、説明の簡略のためリファレンスデータトラックのチャンネル番号を「1」としている。
第4列には、ノートナンバ(NoteNum)あるいはコントロールナンバ(CtrlNum)が記述されるが、どちらが記述されるかはメッセージの内容により異なる。例えば、ノートオンメッセージ又はノートオフメッセージであれば、ここには音階を表すノートナンバが記述され、またコントロールチェンジメッセージであればその種類を示すコントロールナンバが記述されている。
第5列にはMIDIメッセージの具体的な値(データ)が記述されている。例えばノートオンメッセージであれば、ここには音の強さを表すベロシティの値が記述され、ノートオフメッセージであれば、音を消す速さを表すベロシティの値が記述され、またコントロールチェンジメッセージであればコントロールナンバに応じたパラメータの値が記述されている。
次に、図3に示す各行は、歌唱すべきメロディの各音符の属性を示す楽音パラメータとなっており、ノートオンイベント、ノートオフイベントで構成される。
図3に示す例では、デルタタイム480の長さを4分音符の長さとしている。この場合、第1行、第2行のイベント処理によりC4音が4分音符の長さにわたって発音されることが示され、第3行、第4行のイベント処理によりG4音が4分音符の長さにわたって発音されることが示される。そして、第5行、第6行の処理によりF4音が2分音符の長さにわたって発音されることが示される。
利用者が楽曲指定操作を行うと、曲番号データを基にして、指定された楽曲データが楽曲データ記憶領域121から読み出され、RAMに転送される。制御部11がRAM内の楽曲データを順次読み出して処理することで楽曲の演奏が進行する。このとき、リファレンスデータも楽曲の進行と同期して読み出され、制御部11はリファレンスデータのノートとベロシティに応じてリファレンスピッチデータRPを生成する。
一方、マイクロホン15に入力された歌唱者の音声は、歌唱音声信号となり、アンプ(図示略)を介してスピーカ17より出力されるとともに、音声処理部16に入力される。音声処理部16がこの歌唱音声信号をA/D変換した後、制御部11は、歌唱音声のピッチを抽出し、歌唱ピッチデータSPとして出力する。この場合、歌唱音声のピッチの抽出処理はおよそ30msごとに行われるようになっている。
<B:動作>
次に、この実施形態の動作について、図4に示すフローチャートを参照しつつ以下に説明する。利用者が操作部14を用いて楽曲指定操作を行うと、指定された楽曲の楽曲データが楽曲データ記憶領域121からRAMへ転送される。制御部11は、RAM内の楽曲データのイベントを順次読み出すことによりカラオケ伴奏や歌詞表示処理を実行する(ステップS1)。具体的には、楽曲データの演奏トラックに記述されたイベントデータを音声処理部16に出力するとともに、歌詞トラックの歌詞データを表示部13に出力する。この結果、カラオケ伴奏音がスピーカ17から出力される一方、歌詞データの表す歌詞が表示部13に表示される。
一方、制御部11は、楽曲の進行に応じて読み出したリファレンスデータのノートオンイベント(NoteOn)のノートナンバ及びベロシティから、歌唱すべきピッチを示すリファレンスピッチデータRPを生成する(ステップS2)。なお、この実施形態では、制御部11が、楽曲データ記憶領域121に記憶された楽曲データに含まれるリファレンスデータからリファレンスピッチデータRPを生成するが、これに代えて、模範となるピッチを表すリファレンスピッチデータを予め記憶部12に記憶しておくようにしてもよい。
歌唱者は、スピーカ17から放音される伴奏音に併せて歌唱を行う。歌唱者の歌唱音声はマイクロホン15によってオーディオ信号に変換され、音声処理部16でA/D変換される。制御部11は、音声処理部16でA/D変換されたオーディオデータ(以下「歌唱者音声データ」という)からピッチを抽出し、歌唱ピッチデータSPとして出力する(ステップS3)。
図5は、歌唱ピッチデータSPの示すピッチの時間的変化の一例を示す図である。図において、横軸は時刻を示し、縦軸はピッチを示している。図5に示す例においては、歌唱者が「あるひたびだ…」と歌唱した場合に検出されたピッチの時間的変化の一例が示されている。
次いで、制御部11は、歌唱ピッチデータSPとリファレンスピッチデータRPとを比較し、比較結果に基づいて、歌唱ピッチデータSPに対してピッチの丸め処理を行う(ステップS4)。この実施形態では、制御部11は、予め用意されている関数(又はテーブル)であって音声のピッチを複数の区間に区分し各区間の代表値を特定するための関数を用いて、歌唱ピッチデータSPが含まれる区間の代表値を特定し、歌唱ピッチデータSPの値を特定した代表値に変換することによって、ピッチの丸め処理を行う。
ここで、このピッチ丸め処理の具体的な一例について以下に説明する。この実施形態では、制御部11は、歌唱ピッチデータSPとリファレンスピッチデータRPとの差値が75(cent)未満である場合には、歌唱ピッチデータSPの値をリファレンスピッチデータRPの値に差し替える。すなわち、この実施形態では、リファレンスピッチデータRPの±75(cent)に含まれるピッチ区間の代表値が、リファレンスピッチデータRPの値となる。一方、それ以外の場合、すなわち歌唱ピッチデータSPとリファレンスピッチデータRPとの差値が75(cent)以上である場合には、制御部11は、歌唱ピッチデータSPが含まれるピッチ区間の代表値を、記憶部12に予め記憶されたピッチ丸め関数を用いて特定する。このピッチ丸め関数は、ピッチを複数の区間に区分し、各区間の代表値を特定するための関数である。具体的には、例えば、この関数を用いることにより、150〜249(cent)の区間の代表値は200(cent)と特定され、また、例えば、250〜349(cent)の区間の代表値は300(cent)と特定される。この場合は、歌唱ピッチデータSPの値は、半音(100(cent))単位で丸められることになる。
図6は、図5に例示した歌唱ピッチデータSPに対してピッチ丸め処理が施された結果の一例を示す図である。図において、横軸は時刻を表し、縦軸はピッチを示している。図示のように、歌唱ピッチデータSPの値が、半音単位で丸められている。
次いで、制御部11は、歌唱ピッチデータSPに対してノイズ除去処理を行う(ステップS5)。具体的には、制御部11は、ステップS4の処理が施された歌唱ピッチデータSPの示すピッチの時間的な変化を解析し、同一のピッチが予め定められた時間(例えば、100msec)以上継続している場合にはそのピッチを選択する一方、それ以外の場合には、直前に選択されたピッチを継続して選択する(ステップS5)。すなわち、制御部11は、一定時間(例えば、100msec)以上同じ音高が継続していない場合には、ノイズとみなして、以前の音を継続して発音していると判断する。この実施形態では、具体的には、例えば、図6に示す例において、制御部11は、時間区間t1においては、所定時間以上同一のピッチが継続していると判断し、この時間区間t1においては歌唱ピッチデータSPの示すピッチp1を選択する。一方、制御部11は、時間区間t2においては、所定時間以上同一のピッチが継続していないと判断し、この時間区間t2においては、直前に選択されたピッチp1を採用する。
図7は、図6に例示した歌唱ピッチデータSPに対してノイズ除去処理が施された結果の一例を示す図である。図において、横軸は時刻を示し、縦軸はピッチを示している。図示のように、一定の期間の間にピッチがゆらいでいる区間は、ノイズとみなされ、その直前のピッチが採用されることによって、ノイズが除去される。
次いで、制御部11は、子音区間のピッチを補間する処理を行う(ステップS6)。具体的には、制御部11は、歌唱ピッチデータSPの示すピッチについて、ピッチが検出されなかった時間区間がある場合に、その時間区間の直後に検出されたピッチで、そのピッチの検出が開始されたときから予め定められた時間前までの間のピッチを補間する。例えば、図7に示されるように、歌唱音声の「る」にあたる時間区間の先頭部分の時間区間t3や、「ひ」にあたる時間区間の先頭部分の時間区間t4は、子音が発音された部分であり、これらの時間区間ではピッチが検出されない。この場合、制御部11は、例えば時間区間t3については、その直後に検出されたピッチp2で、時間区間t3の最後尾から所定時間T1(例えば、100msec)前までの間のピッチを補間する。もちろん、T1の時間値はピッチが検出されなかった時間t3をそのまま代入してもよい。
図8は、図7に例示したピッチデータに対して子音区間のピッチ補間処理が施された結果を示す図である。図において、横軸は時刻を示し、縦軸はピッチを示している。図示のように、歌唱音声に含まれるそれぞれの音素の子音部分のピッチが補間される。
次いで、制御部11は、ステップS6に示す処理が施された歌唱ピッチデータSPの示すピッチとリファレンスピッチデータRPの示すピッチとが、一致する場合と一致しない場合とで異なる態様で表示されるような画像データを生成し(ステップS7)、歌詞データと生成した画像データとを表示部13に出力する(ステップS8)。表示部13は、制御部11から供給される画像データに基づいて、歌詞テロップを表示するとともに歌唱ピッチデータSPとリファレンスピッチデータRPとを表す画像を表示する。
図9は、表示部13に表示される画面の一例を示す図である。図示のように、この画面には、歌詞テロップW1が表示されるとともに、リファレンスデータのピッチを示す帯状図形Z1,Z2,Z3,…が表示される。帯状図形Z1,Z2,Z3,…は、音素(ノートデータ)毎に描画され、ピッチの高低がその表示位置で示されるとともに、ノートの長さがその横幅で示されている。より具体的には、図9に示す例においては、帯状図形Z1,Z2,Z3,…は、その表示位置が図中上部にあるほどピッチが高いことを示し、また、その横幅が長いほど音の長さが長いことを示す。
このとき、この画面では、基本色C1と一致色C2との2色の色が用いられる。歌唱者が未歌唱の区間については、リファレンスデータのピッチを示す帯状図形Z1,Z2,Z3,…は基本色C1で描画される。一方、歌唱ピッチデータSPとリファレンスピッチデータRPとが一致する区間については一致色C2で描画され、一方、歌唱ピッチデータSPとリファレンスピッチデータRPとが一致しない区間においては基本色C1で描画される。
制御部11は、カラオケ伴奏が終了していない場合には(ステップS9;NO)、ステップS2の処理に戻る。すなわち、制御部11は、歌唱者の歌唱音声が収音されてオーディオ信号が生成されると、その楽曲のカラオケ伴奏が終了する(ステップS9;YES)まで、ステップS2〜ステップS9の処理を所定時間単位で繰り返し実行し、処理結果をリアルタイムに表示部13に表示させる。
これにより、歌唱者は、歌唱している最中に、自身の歌唱音声のピッチとリファレンスデータのピッチとの相違箇所を、表示部13をみることで直感的に把握することができる。
以上説明したようにこの実施形態によれば、制御部11が、収音した音声を表すオーディオ信号からピッチを検出し、検出したピッチに対してピッチ丸め処理を行うから、表示部13に表示される画像は、半音単位で丸められたピッチが表示される。これにより、検出したピッチの波形そのものをそのまま表示する場合(図5参照)と比較して、歌唱者のピッチを、より歌唱者に分かり易く示すことができる。
また、この実施形態によれば、子音区間を母音のピッチで補間するから、各音素の発音タイミングがずれて表示が不自然になるという不具合を防ぐことができる。
また、この実施形態によれば、同一のピッチが予め定められた時間以上継続している場合にはそのピッチを選択する一方、予め定められた時間内に複数のピッチが混在している場合には、直前に選択されたピッチを継続して選択するから、ノイズを除去することができ、より見易い表示を行うことができる。
また、この実施形態によれば、歌唱者は、自身の歌唱音声のピッチとリファレンスのピッチとがずれている箇所を、表示部13を視認することで直感的に把握することができる。特に、歌唱者が歌唱している最中であっても、表示部13に表示された図形の色を見るだけで、歌唱者は、自身の歌唱音声のピッチとガイドメロディのピッチとの差異を直感的に把握することができる。
<C:変形例>
以上、本発明の実施形態について説明したが、本発明は上述した実施形態に限定されることなく、他の様々な形態で実施可能である。以下にその一例を示す。なお、以下の各態様を適宜に組み合わせてもよい。
(1)上述の実施形態では、図9に示すような、基本色C1と一致色C2との2色の色を用いて表示したが、これに限らず、例えば、図10に示すように、基本色C1,一致色C2,不一致色C3の3色の色を用いて表示してもよい。図10に例示する画面では、歌唱者が未歌唱の区間については、リファレンスデータのピッチを示す帯状図形Z1,Z2,Z3,…は基本色C1で描画される。一方、歌唱ピッチデータSPとリファレンスピッチデータRPとが一致する区間については一致色C2で描画される。また、歌唱ピッチデータSPとリファレンスピッチデータRPとが一致しない区間においては不一致色C3で描画される。
また、他の例として、例えば、リファレンスピッチデータRPを表す帯状図形を表示しておき、歌唱が行われると、歌唱ピッチデータSPを表す帯状図形を、その上に上書するようにしてもよい。
このように、描画に用いられる色の数や種類は任意であり、要するに、歌唱ピッチデータSPの示すピッチとリファレンスピッチデータRPの示すピッチとが、一致する場合と一致しない場合とで異なる態様で表示されるようにすればよい。
(2)上述の実施形態では、歌唱ピッチデータSPの表すピッチとリファレンスピッチデータRPの表すピッチとを、両者が一致する場合とそれ以外の場合で異なる態様で表示するようにした。表示態様はこれに限らず、例えば、歌唱ピッチデータの表すピッチとリファレンスピッチデータRPの表すピッチとを、比較可能な態様で表示してもよい。具体的には、例えば、図11に示すように、リファレンスピッチデータRPのピッチを表す帯状図形Z1,Z2,Z3,…と、歌唱ピッチデータSPのピッチを表す帯状図形Z11,Z12,Z13,…とを、並べて表示するようにしてもよい。図11に示す例において、帯状図形Z11,Z12,Z13,…は、帯状図形Z1,Z2,Z3,…と同様に、ピッチの高低がその表示位置で示されるとともに、ピッチの継続時間長がその横幅で示されている。すなわち、制御部11は、リファレンスピッチデータRPと歌唱ピッチデータSPのそれぞれについて、ピッチの高低とその継続時間が、帯状図形の表示位置と形状で示されるような画像データを生成し、表示部13に出力する。
また、上述した実施形態では歌唱ピッチデータSPの示すピッチとリファレンスピッチデータRPの示すピッチとを両方表示するようにしたが、歌唱ピッチデータSPの示すピッチのみを表示するようにしてもよい。具体的には、例えば、図12に示すように、歌唱ピッチデータSPのピッチを表す帯状図形Z11,Z12,Z13,…を表示するようにしてもよい。なお、図12に示す帯状図形Z11,Z12,Z13,…は、図11に示したそれと同様であり、ここではその詳細な説明を省略する。
(3)上述の態様において、歌唱音声の比較対象となるリファレンスデータは、例えば楽曲のガイドメロディを表すデータであってもよく、また、例えば、楽曲の模範となる歌唱音声を表すデータであってもよく、楽曲の模範となるデータであればどのようなものであってもよい。
(4)上述した実施形態では、歌唱者の歌唱音声をリアルタイムで解析するようにしたが、必ずしもリアルタイムで解析する必要はなく、例えば、記憶部に予め記憶されたオーディオ信号を解析するようにしてもよい。また、例えば、カラオケ装置1にインターネット等の通信ネットワークを介してデータ伝送を行うための通信部を設ける構成とし、通信ネットワークを介してオーディオ信号を受信し、受信したオーディオ信号を解析するようにしてもよい。
(5)上述した実施形態では、制御部11は、図4に示すフローチャートの順に各処理を行ったが、処理順序はこれに限定されるものではなく、例えば、ノイズ除去処理を行う前に子音区間ピッチ補間処理を行ってもよく、また、例えば、ピッチ丸め処理を行う前に子音区間ピッチ補間処理を行ってもよく、それらの処理順序は設計等に応じて変更可能である。また、制御部11が、図4のステップS2〜ステップS9に示される処理を逐次実行するようにしてもよく、また、マルチタスクOSを用いて複数の処理を並行して実行するようにしてもよい。
また、上述の実施形態では、制御部11は、図4に示すフローチャートの各処理をすべて実行したが、図4に示す処理の一部を実行するようにしてもよい。具体的には、例えば、ステップS5に示すノイズ除去処理を実行しないようにしてもよく、また、例えば、ステップS6に示す子音区間ピッチ補間処理を実行しないようにしてもよい。
(6)上述の実施形態では、カラオケ装置1が本実施形態に係るピッチ検出処理、ピッチ丸め処理、ノイズ除去処理等を行うようになっていた。これに対し、通信ネットワークで接続された2以上の装置が上記実施形態に係る機能を分担するようにし、それら複数の装置を備えるシステムが同実施形態のカラオケ装置1を実現するようにしてもよい。例えば、マイクロホンやスピーカ、表示装置及び操作部等を備えるコンピュータ装置と、ピッチ検出処理、ノイズ除去処理等を実行するサーバ装置とが通信ネットワークで接続されたシステムとして構成されていてもよい。この場合は、例えば、コンピュータ装置が、マイクロホンから入力された音声をオーディオ信号に変換してサーバ装置に送信し、サーバ装置が、受信したオーディオ信号を解析して解析結果を示す画像データを生成し、生成した画像データをコンピュータ装置に送信してもよい。
(7)上述した実施形態におけるカラオケ装置1の制御部11によって実行されるプログラムは、磁気テープ、磁気ディスク、フレキシブルディスク、光記録媒体、光磁気記録媒体、RAM、ROMなどの記録媒体に記録した状態で提供し得る。また、インターネットのようなネットワーク経由でカラオケ装置1にダウンロードさせることも可能である。
カラオケ装置のハードウェア構成の一例を示すブロック図である。 楽曲データの構造を示す図である。 楽曲データに含まれるリファレンスデータトラックの内容を示す図である。 カラオケ装置の制御部が行う処理の流れを示すフローチャートである。 ピッチ検出処理を説明するための図である。 ピッチ丸め処理を説明するための図である。 ノイズ除去処理を説明するための図である。 子音区間ピッチ補間処理を説明するための図である。 表示部13に表示される画面の一例を示す図である。 表示部13に表示される画面の一例を示す図である。 表示部13に表示される画面の一例を示す図である。 表示部13に表示される画面の一例を示す図である。
符号の説明
1…カラオケ装置、11…制御部、12…記憶部、13…表示部、14…操作部、15…マイクロホン、16…音声処理部、17…スピーカ、121…楽曲データ記憶領域、122…背景画データ記憶領域。

Claims (6)

  1. 音声のピッチを複数の区間に区分し、各区間の代表値を特定する代表値特定手段と、
    収音された音声を表すオーディオ信号から、該オーディオ信号のピッチを検出するピッチ検出手段と、
    前記ピッチ検出手段によって前記ピッチが検出されなかった時間区間がある場合に、該時間区間の直後に検出されたピッチで、該ピッチの検出が開始されたときから予め定められた時間前までの間のピッチを補間するピッチ補間手段と、
    前記ピッチ補間手段により補間がなされたピッチに対して、該ピッチが含まれる区間の代表値を前記代表値特定手段を用いて特定し、ピッチを、前記代表値特定手段を用いて特定された代表値に変換するピッチ丸め手段と、
    前記ピッチ丸め手段により変換された代表値の時間的変化を表す画像データを生成する画像データ生成手段と、
    前記画像データ生成手段により生成された画像データを表示手段に出力する画像データ出力手段と
    を具備することを特徴とするピッチ表示制御装置。
  2. 音声のピッチを複数の区間に区分し、各区間の代表値を特定する代表値特定手段と、
    収音された音声を表すオーディオ信号から、該オーディオ信号のピッチを検出するピッチ検出手段と、
    前記ピッチ検出手段により検出されたピッチが含まれる区間の代表値を前記代表値特定手段を用いて特定し、前記ピッチ検出手段により検出されたピッチを、前記代表値特定手段を用いて特定された代表値に変換するピッチ丸め手段と、
    前記ピッチ丸め手段によって変換された代表値の時間的な変化を解析し、同一の代表値が予め定められた時間以上継続している場合には、該代表値を選択する一方、それ以外の場合には、直前に選択された代表値を継続して選択する代表値選択手段と、
    前記代表値選択手段により選択された代表値の時間的変化を表す画像データを生成する画像データ生成手段と、
    前記画像データ生成手段により生成された画像データを表示手段に出力する画像データ出力手段と
    を具備することを特徴とするピッチ表示制御装置。
  3. 前記画像データ生成手段は、前記代表値の高低をその表示位置で示すとともに該代表値の継続時間長をその形状で示す帯状図形を含む画像を表す画像データを生成する
    ことを特徴とする請求項1又は2に記載のピッチ表示制御装置。
  4. 模範となるピッチの時間的変化を表すリファレンスデータを記憶するリファレンスデータ記憶手段を備え、
    前記画像データ生成手段は、前記ピッチ丸め手段により変換された代表値の時間的変化と、前記リファレンスデータ記憶手段に記憶されたリファレンスデータの示すピッチの時間的変化とが、比較可能な態様で表示されるような画像データを生成する
    ことを特徴とする請求項1に記載のピッチ表示制御装置。
  5. 前記画像データ生成手段は、前記ピッチ丸め手段により変換された代表値の時間的変化と前記リファレンスデータ記憶手段に記憶されたリファレンスデータの示すピッチの時間的変化とが、一致する場合と一致しない場合とで異なる態様で表示されるような画像データを生成する
    ことを特徴とする請求項に記載のピッチ表示制御装置。
  6. 模範となるピッチの時間的変化を示すリファレンスデータを記憶するリファレンスデータ記憶手段を備え、
    前記画像データ生成手段は、前記代表値選択手段により選択された代表値の時間的変化と、前記リファレンスデータ記憶手段に記憶されたリファレンスデータの示すピッチの時間的変化とが、比較可能な態様で表示されるような画像データを生成する
    ことを特徴とする請求項に記載のピッチ表示制御装置。
JP2007064110A 2007-03-13 2007-03-13 ピッチ表示制御装置 Active JP4949899B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2007064110A JP4949899B2 (ja) 2007-03-13 2007-03-13 ピッチ表示制御装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2007064110A JP4949899B2 (ja) 2007-03-13 2007-03-13 ピッチ表示制御装置

Publications (2)

Publication Number Publication Date
JP2008225117A JP2008225117A (ja) 2008-09-25
JP4949899B2 true JP4949899B2 (ja) 2012-06-13

Family

ID=39843810

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2007064110A Active JP4949899B2 (ja) 2007-03-13 2007-03-13 ピッチ表示制御装置

Country Status (1)

Country Link
JP (1) JP4949899B2 (ja)

Families Citing this family (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH1025920A (ja) * 1996-07-11 1998-01-27 Fujita Corp 建築構造物の制震装置
JPH1144046A (ja) * 1997-07-28 1999-02-16 Kajima Corp 鉄筋の組立方法およびコンクリート構造物
JP5244739B2 (ja) * 2009-08-24 2013-07-24 株式会社エクシング 歌唱音声再生装置、歌唱音声再生方法及びコンピュータプログラム
JP5293703B2 (ja) * 2010-08-27 2013-09-18 ブラザー工業株式会社 カラオケ装置
JP5811837B2 (ja) 2011-12-27 2015-11-11 ヤマハ株式会社 表示制御装置及びプログラム
JP6144592B2 (ja) * 2013-09-27 2017-06-07 株式会社第一興商 歌唱採点システム
JP6144593B2 (ja) * 2013-09-27 2017-06-07 株式会社第一興商 歌唱採点システム
JP6177091B2 (ja) * 2013-10-31 2017-08-09 株式会社第一興商 歌唱採点システム

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS5885773A (ja) * 1981-11-16 1983-05-23 ブリヂストンサイクル株式会社 折りたたみ自転車フレ−ム
JPH08123454A (ja) * 1994-10-28 1996-05-17 Sofuitsuku:Kk カラオケ練習装置および同装置における音程比較表示方法
JP3673405B2 (ja) * 1998-07-08 2005-07-20 株式会社リコー 演奏曲再生装置
JP4169555B2 (ja) * 2002-09-13 2008-10-22 ヤマハ株式会社 カラオケ装置
JP4182750B2 (ja) * 2002-12-25 2008-11-19 ヤマハ株式会社 カラオケ装置
JP2006189471A (ja) * 2004-12-28 2006-07-20 Konami Co Ltd プログラム、歌唱力判定方法、ならびに、判定装置

Also Published As

Publication number Publication date
JP2008225117A (ja) 2008-09-25

Similar Documents

Publication Publication Date Title
JP4124247B2 (ja) 楽曲練習支援装置、制御方法及びプログラム
JP4949899B2 (ja) ピッチ表示制御装置
JP4353018B2 (ja) 楽器演奏教習装置及びそのプログラム
JP5811837B2 (ja) 表示制御装置及びプログラム
JPH0944171A (ja) カラオケ装置
JP2003302984A (ja) 歌詞表示方法、歌詞表示プログラムおよび歌詞表示装置
JP5799966B2 (ja) 採点装置及びプログラム
JP2012037722A (ja) 音合成用データ生成装置およびピッチ軌跡生成装置
JP4182750B2 (ja) カラオケ装置
JP4913638B2 (ja) 評価装置及びカラオケ装置
JP5014073B2 (ja) メロディ表示制御装置及びカラオケ装置
JP5297662B2 (ja) 楽曲データ加工装置、カラオケ装置、及びプログラム
JP2009031549A (ja) メロディ表示制御装置及びカラオケ装置
JP2009169103A (ja) 練習支援装置
JP4839967B2 (ja) 指導装置及びプログラム
JP2005107330A (ja) カラオケ装置
JP3116937B2 (ja) カラオケ装置
JP4932614B2 (ja) コード名検出装置及びコード名検出用プログラム
JP4891135B2 (ja) 評価装置
JP4170279B2 (ja) 歌詞表示方法および装置
JP2007334202A (ja) カラオケ装置
JP4506748B2 (ja) コンテンツ再生装置
JP4631726B2 (ja) 歌唱合成装置及び記録媒体
JP2005107332A (ja) カラオケ装置
JP2904045B2 (ja) カラオケ装置

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20100120

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20111121

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20111129

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20120130

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20120306

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20120308

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20150316

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Ref document number: 4949899

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250