JP7232653B2

JP7232653B2 - カラオケ装置

Info

Publication number: JP7232653B2
Application number: JP2019016366A
Authority: JP
Inventors: 聡橘
Original assignee: Daiichikosho Co Ltd
Current assignee: Daiichikosho Co Ltd
Priority date: 2019-01-31
Filing date: 2019-01-31
Publication date: 2023-03-03
Anticipated expiration: 2039-01-31
Also published as: JP2020122948A

Description

本発明は、カラオケ装置に関する。

カラオケ装置は、マイクにより入力された歌唱音声から抽出した歌唱音声データと、カラオケ演奏された楽曲の主旋律を示すリファレンスデータとを比較することにより、カラオケ歌唱の巧拙を採点する採点機能が搭載されている。

たとえば、特許文献１には、カラオケ演奏に合わせてマイクから入力される歌唱音声信号から音高データ及び音長データを抽出し、カラオケ演奏に並行して読み出されるガイドメロディと比較することによって歌唱の巧拙を採点評価する技術が開示されている。

また、歌唱者の中にはプロ歌手の歌唱を真似て、しゃくり、フォール、こぶし、シャウトなどの特殊な歌唱技法を用いて歌唱を行う者もいる。特許文献２～５には、このような特殊な歌唱技法を検出し、歌唱を評価する技術が開示されている。

特開平１０－６９２１６号公報特開２００５－１０７３３６号公報特開２００８－２２５１１５号公報特開２００８－２６８３７０号公報特開２０１２－０７８７０１号公報

ところで、特殊な歌唱技法の一つとして、カラオケ歌唱の表現力を深めるために、あるノート（音符）について強調して歌唱する（カラオケ歌唱の音量を大きくして歌唱する）歌唱方法（以下、「アクセント歌唱」）が知られている。このようなアクセント歌唱を検出するためには、歌唱音声の音量レベルを取得し、音量レベルが所定値よりも大きくなったかどうかを判断することが考えられる。

しかし、実際のカラオケ歌唱においては、カラオケ伴奏音のマイクへの回り込み（特にバスドラムやスネアの音）や、歌唱者とマイクとの距離が一定ではないこと等が原因となり、音量レベルが正確に得られない。従って、従来のカラオケ装置では、アクセント歌唱を判定することができなかった。

また、聴感上の印象が異なる様々なアクセント歌唱が存在する。

本発明の目的は、カラオケ歌唱にＬ字アクセント歌唱（後述）が含まれるかどうかを判定することが可能なカラオケ装置を提供することにある。

本発明者は、聴感上、アクセント歌唱でありつつ、「緊張した感じ」や「切羽詰まった印象」を与えるカラオケ歌唱と判断される歌唱音声信号に含まれる歌唱ピッチを解析したところ、あるノートの基準ピッチよりも高い歌唱ピッチから、歌唱ピッチが短時間で下降し、その後歌唱ピッチの変動が小さくなるという変化を示すことを見出した。また、「緊張した感じ」や「切羽詰まった印象」をより強く受けた場合に得られた歌唱音声信号に含まれる歌唱ピッチを解析したところ、あるノートの基準ピッチよりも高い歌唱ピッチから、歌唱ピッチが短時間で下降した後、上昇し、その後歌唱ピッチの変動が小さくなるという変化を示すことを見出した。本発明は、この発見に基づき、完成されたものであって、この歌唱独特のピッチの変化を検出することにより、この歌唱を特定することができる技術である。

なお、このようなカラオケ歌唱による歌唱ピッチの推移は「Ｌ字」状になる。よって、このようなピッチ変化を示すアクセント歌唱を、以下「Ｌ字アクセント歌唱」という。

具体的に、上記目的を達成するための発明は、カラオケ楽曲の歌唱により得られた歌唱音声信号から、所定区間毎に歌唱ピッチを検出する歌唱ピッチ検出部と、検出した複数の前記歌唱ピッチを含む区間の中に、あるノートの基準ピッチよりも高い歌唱ピッチから所定の条件で歌唱ピッチが下降する下降区間と、当該下降区間の終了時の歌唱ピッチから連続する２つの歌唱ピッチのピッチ差が所定範囲内である区間が所定数以上連続する水平区間と、が存在する場合、前記あるノートに対するＬ字アクセント歌唱が行われていると判定するＬ字アクセント歌唱判定部と、を有するカラオケ装置である。
本発明の他の特徴については、後述する明細書及び図面の記載により明らかにする。

本発明によれば、カラオケ歌唱にＬ字アクセント歌唱が含まれるかどうかを判定することができる。

実施形態に係るカラオケ装置のハードウェア構成例を示す図である。実施形態に係るカラオケ本体のソフトウェア構成例を示す図である。実施形態に係るＬ字アクセント歌唱の判定処理を示すフローチャートである。実施形態に係る歌唱ピッチ、及び歌唱ピッチと基準ピッチとのピッチ差を示した図である。実施形態に係る歌唱ピッチ及びピッチ差を示した図である。実施形態に係る一のノートと歌唱ピッチとの関係を示した図である。実施形態に係るＬ字アクセント歌唱の判定処理を示すフローチャートである。実施形態に係る歌唱ピッチ、及び歌唱ピッチと基準ピッチとのピッチ差を示した図である。実施形態に係る歌唱ピッチ及びピッチ差を示した図である。実施形態に係る一のノートと歌唱ピッチとの関係を示した図である。

＜実施形態＞
図１～図１０を参照して、実施形態に係るカラオケ装置１について説明する。

＝＝カラオケ装置＝＝
カラオケ装置１は、カラオケ演奏及び歌唱者がカラオケ歌唱を行うための装置である。カラオケ装置１は、歌唱者が選曲したカラオケ楽曲を予約待ち行列に登録し、順番にカラオケ演奏を行う。図１に示すように、カラオケ装置１は、カラオケ本体１０、スピーカ２０、表示装置３０、マイク４０、及びリモコン装置５０を備える。

スピーカ２０はカラオケ本体１０からの放音信号に基づいて放音するための構成である。表示装置３０はカラオケ本体１０からの信号に基づいて映像や画像を画面に表示するための構成である。マイク４０は歌唱者の歌唱音声（マイク４０への入力音声）をアナログの歌唱音声信号に変換してカラオケ本体１０に入力するための構成である。リモコン装置５０は、カラオケ本体１０に対する各種操作をおこなうための装置である。歌唱者はリモコン装置５０を用いて歌唱を希望するカラオケ楽曲の選曲（予約）等を行うことができる。リモコン装置５０の表示画面には各種操作の指示入力を行うためのアイコン等が表示される。

カラオケ本体１０は、選曲されたカラオケ楽曲の演奏制御、歌詞や背景映像等の表示制御、マイク４０を通じて入力された歌唱音声信号の処理といった、カラオケ歌唱に関する各種の制御を行う。図１に示すように、カラオケ本体１０は、制御部１１、通信部１２、記憶部１３、音響処理部１４、表示処理部１５及び操作部１６を備える。各構成はインターフェース（図示なし）を介してバスＢに接続されている。

制御部１１は、ＣＰＵ１１ａおよびメモリ１１ｂを備える。ＣＰＵ１１ａは、メモリ１１ｂに記憶された動作プログラムを実行することにより各種の制御機能を実現する。メモリ１１ｂは、ＣＰＵ１１ａに実行されるプログラムを記憶したり、プログラムの実行時に各種情報を一時的に記憶したりする記憶装置である。

通信部１２は、ルーター（図示なし）を介してカラオケ本体１０を通信回線に接続するためのインターフェースを提供する。

記憶部１３は、各種のデータを記憶する大容量の記憶装置であり、たとえばハードディスクドライブなどである。記憶部１３は、カラオケ装置１によりカラオケ演奏を行うための複数の楽曲データを記憶する。

楽曲データは、個々のカラオケ楽曲を特定するための楽曲ＩＤが付与されている。楽曲データは、伴奏データ、リファレンスデータ等を含む。伴奏データは、カラオケ演奏音の元となるデータである。伴奏データはカラオケ演奏をする際のテンポを示す情報を含む。テンポは、楽曲毎に所定の値が設定されている。リファレンスデータは、歌唱者によるカラオケ歌唱を採点する際の基準として用いられるデータである。リファレンスデータは、複数のノート（音符）から構成され、ノート毎に所定のピッチ（基準ピッチ）が設定されている。

また、記憶部１３は、各カラオケ楽曲に対応する歌詞を表示装置３０等に表示させるための歌詞テロップデータ、カラオケ演奏時に表示装置３０等に表示される背景画像等の背景画像データ、楽曲毎のカラオケ演奏時間を示す演奏時間データ及び楽曲の属性情報（歌手名、作詞・作曲者名、ジャンル等の当該楽曲に関する情報）を記憶する。

音響処理部１４は、制御部１１の制御に基づき、カラオケ楽曲に対する演奏の制御およびマイク４０を通じて入力された歌唱音声信号の処理を行う。表示処理部１５は、制御部１１の制御に基づき、表示装置３０やリモコン装置５０における各種表示に関する処理を行う。たとえば、表示処理部１５は、カラオケ楽曲の演奏時における背景映像に歌詞テロップや各種アイコンが重ねられた映像を表示装置３０に表示させる制御を行う。或いは、表示処理部１５は、リモコン装置５０の表示画面に操作入力用の各種アイコンを表示させる。操作部１６は、パネルスイッチおよびリモコン受信回路などからなり、歌唱者によるカラオケ装置１のパネルスイッチあるいはリモコン装置５０の操作に応じて選曲信号、演奏中止信号などの操作信号を制御部１１に対して出力する。制御部１１は、操作部１６からの操作信号を検出し、対応する処理を実行する。

（ソフトウェア構成）
図２はカラオケ本体１０のソフトウェア構成例を示す図である。カラオケ本体１０は、歌唱ピッチ検出部１００、Ｌ字アクセント歌唱判定部２００、提示部３００、及び採点処理部４００を備える。歌唱ピッチ検出部１００、Ｌ字アクセント歌唱判定部２００、提示部３００、及び採点処理部４００は、ＣＰＵ１１ａがメモリ１１ｂに記憶されるプログラムを実行することにより実現される。

［歌唱ピッチ検出部］
歌唱ピッチ検出部１００は、カラオケ楽曲の歌唱により得られた歌唱音声信号から、所定区間毎に歌唱ピッチを検出する。

具体的に、歌唱ピッチ検出部１００は、歌唱音声信号を解析し、歌唱ピッチを検出する。歌唱ピッチは、所定時間長（たとえば１０～２０ｍｓｅｃ）のフレーム単位で１サンプルずつ時系列に検出する。たとえば、所定時間長が２０ｍｓｅｃの場合、２０ｍｓｅｃのフレームが、歌唱ピッチ検出における所定区間に相当する。歌唱ピッチ検出部１００は、検出した歌唱ピッチを、Ｌ字アクセント歌唱判定部２００に順次出力する。なお、歌唱ピッチの検出は、カラオケ楽曲の歌唱に伴って順次行ってもよいし、一のカラオケ楽曲の歌唱が全て終了した後にまとめて行ってもよい。

［Ｌ字アクセント歌唱判定部］
Ｌ字アクセント歌唱判定部２００は、検出した複数の歌唱ピッチを含む区間の中に、下降区間及び水平区間が存在する場合、あるノートに対するＬ字アクセント歌唱が行われていると判定する。

下降区間は、あるノートの基準ピッチよりも高い歌唱ピッチから所定の条件で歌唱ピッチが下降する区間である。所定の条件は、下降区間を特定するための条件である。所定の条件は、特定するＬ字アクセント歌唱の程度に応じて、予め任意の条件が設定されている（詳細は後述）。

水平区間は、下降区間の終了時の歌唱ピッチから連続する２つの歌唱ピッチのピッチ差が所定範囲内であり、且つ所定数以上連続する区間である。所定範囲は、水平区間を特定するにあたり、許容可能な連続する２つの歌唱ピッチのずれの幅である。所定数は、水平区間を特定するにあたり、最低限必要な、所定範囲内に含まれるピッチ差の歌唱ピッチが連続する数である。所定範囲及び所定数は、特定するＬ字アクセント歌唱の程度に応じて、予め任意の値が設定されている。たとえば、所定範囲は±１ｃｅｎｔ～±１２ｃｅｎｔであり、所定数は３～５である。

ここで、図３～図１０を参照して、Ｌ字アクセント歌唱の判定処理について詳細に説明を行う。以下の例では、歌唱ピッチの推移が「Ｌ字」状になる２つの例（例１、例２）について説明する。図３及び図７は、Ｌ字アクセント歌唱の判定処理を示すフローチャートである。図４及び図８は、カラオケ楽曲Ｘのリファレンスデータに設定されているノートＮの基準ピッチＢＰと、カラオケ楽曲Ｘの歌唱により得られた歌唱音声信号を解析して検出された所定区間毎の歌唱ピッチとのピッチ差を示した図である。この図において、歌唱ピッチＰ（１）は、ノートＮの発音開始タイミング以降で最初に検出された歌唱ピッチであるとする。ノートの発音開始タイミングは、カラオケ楽曲の演奏開始時点を０とした場合の、当該ノートまでの経過時間に相当する。図５及び図９は、カラオケ楽曲Ｘの歌唱により得られた歌唱音声信号を解析して検出された所定区間毎の歌唱ピッチと、連続する２つの歌唱ピッチのピッチ差を示した図である。図６及び図１０は、Ｌ字アクセント歌唱の歌唱ピッチの推移を示した図である。

図４、図５、図８、及び図９の例において、ピッチ差はｃｅｎｔ値で示す。なお、ｃｅｎｔ値は相対値であるが、以下の説明においては歌唱ピッチを絶対値として表現するために、音階Ｃ４（周波数２６１．６２６Ｈｚ）を６０００ｃｅｎｔと定義する。また基準ピッチが０の部分は、非歌唱区間（カラオケ歌唱用の歌詞が付与されていない区間）であり、歌唱ピッチが０の部分は歌唱ピッチが検出できなかったものとする。

また、図６及び図１０において、ノートＮのピッチ（基準ピッチ）をピッチＢＰで示す。また、開始時刻ＴｓはノートＮの発音開始タイミングであり、終了時刻ＴｅはノートＮの発音終了タイミングである。図６及び図１０における縦軸は歌唱ピッチを示し、横軸は時刻を示すが、横軸は連続する時間長（たとえば２０ｍｓｅｃ）の所定区間と解してもよく所定区間毎に歌唱ピッチが検出される。

［例１］
図３～図６を用いて１つ目の例について説明する。

まず、Ｌ字アクセント歌唱判定部２００は、あるノートの発音開始タイミング近傍において検出した歌唱ピッチのうち、当該あるノートの基準ピッチとのピッチ差が第１の所定値以上である歌唱ピッチを第１の歌唱ピッチとする（第１の歌唱ピッチを特定。ステップ１０）。

具体的に、Ｌ字アクセント歌唱判定部２００は、ノートＮの発音開始タイミング近傍において検出された歌唱ピッチと、ノートＮの基準ピッチＢＰとのピッチ差を求め、当該ピッチ差が第１の所定値以上であるかどうかを判断する。歌唱ピッチＰ（ｎ）とノートＮの基準ピッチＢＰとのピッチ差ＢＰｄ（ｎ）は、「Ｐ（ｎ）－ＢＰ」で算出される。第１の所定値は、判定するＬ字アクセント歌唱の程度に応じて、予め任意の値が設定されている。たとえば、第１の所定値は、１３０ｃｅｎｔ～１６０ｃｅｎｔである。本実施形態における第１の所定値は「１５０ｃｅｎｔ」とする。第１の所定値は「所定の条件」の一部である。

図４の例によると、歌唱ピッチＰ（１）とノートＮの基準ピッチＢＰとのピッチ差ＢＰｄ（１）は、「＋１８４ｃｅｎｔ」である。この場合、Ｌ字アクセント歌唱判定部２００は、ピッチ差ＢＰｄ（１）が第１の所定値（１５０ｃｅｎｔ）以上であると判断する。一方、歌唱ピッチＰ（５）とノートＮの基準ピッチＢＰとのピッチ差ＢＰｄ（５）は、「＋１３５ｃｅｎｔ」である。この場合、Ｌ字アクセント歌唱判定部２００は、ピッチ差ＢＰｄ（５）は第１の所定値（１５０ｃｅｎｔ）未満であると判断する。図４の例によると、Ｌ字アクセント歌唱判定部２００は、歌唱ピッチＰ（１）～歌唱ピッチＰ（４）を第１の歌唱ピッチとして特定する。

次に、Ｌ字アクセント歌唱判定部２００は、第１の歌唱ピッチよりも第１の所定数だけ後に検出した第２の歌唱ピッチまで歌唱ピッチが連続して減少しているかどうかを判定する（第１の歌唱ピッチから第２の歌唱ピッチまで、歌唱ピッチが連続して減少しているかを判定。ステップ１１）。

第１の所定数は、判定するＬ字アクセント歌唱の程度に応じて、予め任意の値が設定されている。たとえば、第１の所定数は、３サンプル～５サンプルである。本実施形態における第１の所定数は「３サンプル」とする。第１の所定数は「所定の条件」の一部である。

Ｌ字アクセント歌唱判定部２００は、特定された第１の歌唱ピッチについて、３サンプルだけ後に検出した第２の歌唱ピッチまで、歌唱ピッチが連続して減少しているかどうかを判断する。図４の例によると、歌唱ピッチＰ（１）は、次に検出した歌唱ピッチＰ（２）の方が高い値（＋３ｃｅｎｔ）となっているため、歌唱ピッチが連続して減少していると判定せず、第１の歌唱ピッチの特定を解除する。一方、歌唱ピッチＰ（２）については、３サンプルだけ後に検出した歌唱ピッチＰ（５）まで歌唱ピッチが連続して減少している。よって、Ｌ字アクセント歌唱判定部２００は、歌唱ピッチＰ（２）から歌唱ピッチＰ（５）まで、歌唱ピッチが連続して減少していると判定する。この場合、歌唱ピッチＰ（５）は第２の歌唱ピッチに相当する。

同様に、第１の歌唱ピッチとして特定された歌唱ピッチＰ（３）についても、３サンプルだけ後に検出した歌唱ピッチＰ（６）まで歌唱ピッチが連続して減少している。よって、Ｌ字アクセント歌唱判定部２００は、歌唱ピッチＰ（３）から歌唱ピッチＰ（６）まで歌唱ピッチが連続して減少していると判定する。この場合、歌唱ピッチＰ（６）が第２の歌唱ピッチに相当する。また、第１の歌唱ピッチとして特定された歌唱ピッチＰ（４）についても、３サンプルだけ後に検出した歌唱ピッチＰ（７）まで歌唱ピッチが連続して減少している。よって、Ｌ字アクセント歌唱判定部２００は、歌唱ピッチＰ（４）から歌唱ピッチＰ（７）まで歌唱ピッチが連続して減少していると判定する。この場合、歌唱ピッチＰ（７）が第２の歌唱ピッチに相当する。

次に、Ｌ字アクセント歌唱判定部２００は、第１の歌唱ピッチから、第１の歌唱ピッチよりも第２の所定数だけ後に検出した第３の歌唱ピッチまでの間に第２の所定値以上、歌唱ピッチが減少しているかどうかを判定する（第１の歌唱ピッチから第３の歌唱ピッチまでの間に歌唱ピッチが所定値以上、減少しているかを判定。ステップ１２）。

第２の所定数及び第２の所定値は、判定するＬ字アクセント歌唱の程度に応じて、予め任意の値が設定されている。第２の所定数は、第１の所定数よりも大きい値である。第２の所定数は、たとえば１０～２５サンプルである。第２の所定値はたとえば１３０～１６０ｃｅｎｔである。本実施形態における第２の所定数は「１０サンプル」であり、第２の所定値は、少なくともノートＮの基準ピッチまで歌唱ピッチを減少させるために、歌唱ピッチとノートＮの基準ピッチＢＰとのピッチ差である第１の所定値と同数とすることが望ましいため、第１の所定値と同じ「１５０ｃｅｎｔ」とする。第２の所定数及び第２の所定値は「所定の条件」の一部である。

図４の例によると、歌唱ピッチＰ（２）から１０サンプルだけ後に検出した歌唱ピッチＰ（１２）までの間に歌唱ピッチは１５０ｃｅｎｔ減少している。Ｌ字アクセント歌唱判定部２００は、歌唱ピッチＰ（２）から歌唱ピッチＰ（１２）までの間に歌唱ピッチが１５０ｃｅｎｔ以上減少していると判定する。この場合、歌唱ピッチＰ（１２）は第３の歌唱ピッチに相当する。

同様に、図４の例によると歌唱ピッチＰ（３）から１０サンプルだけ後に検出した歌唱ピッチＰ（１３）までの間に歌唱ピッチが１５５ｃｅｎｔ減少している。Ｌ字アクセント歌唱判定部２００は、歌唱ピッチＰ（３）から歌唱ピッチＰ（１３）までの間に歌唱ピッチが１５０ｃｅｎｔ以上減少していると判定する。この場合、歌唱ピッチＰ（１３）は第３の歌唱ピッチに相当する。また、歌唱ピッチＰ（４）から１０サンプルだけ後に検出した歌唱ピッチＰ（１４）までの間に歌唱ピッチが１５０ｃｅｎｔ減少している。Ｌ字アクセント歌唱判定部２００は、歌唱ピッチＰ（４）から歌唱ピッチＰ（１４）までの間に歌唱ピッチが１５０ｃｅｎｔ以上減少していると判定する。この場合、歌唱ピッチＰ（１４）は第３の歌唱ピッチに相当する。

次に、Ｌ字アクセント歌唱判定部２００は、第１の歌唱ピッチを開始時の歌唱ピッチとし、第３の歌唱ピッチを終了時の歌唱ピッチとする下降区間候補を特定する（下降区間候補の特定。ステップ１３）。

上記例によれば、Ｌ字アクセント歌唱判定部２００は、歌唱ピッチＰ（２）を開始時の歌唱ピッチとし、歌唱ピッチＰ（１２）を終了時の歌唱ピッチとする第１の下降区間候補ＤＣ１を特定し、歌唱ピッチＰ（３）を開始時の歌唱ピッチとし、歌唱ピッチＰ（１３）を終了時の歌唱ピッチとする第２の下降区間候補ＤＣ２を特定し、歌唱ピッチＰ（４）を開始時の歌唱ピッチとし、歌唱ピッチＰ（１４）を終了時の歌唱ピッチとする第３の下降区間候補ＤＣ３を特定する。

次に、Ｌ字アクセント歌唱判定部２００は、第３の歌唱ピッチから連続する２つの歌唱ピッチのピッチ差が、所定範囲内であり、且つ所定数以上連続する区間を水平区間として特定する（水平区間の特定。ステップ１４）。

具体的に、Ｌ字アクセント歌唱判定部２００は、第３の歌唱ピッチから連続する２つの歌唱ピッチのピッチ差を求め、当該ピッチ差が所定範囲内にあるかどうかを判断する。連続する２つの歌唱ピッチＰ（ｎ－１）、Ｐ（ｎ）のピッチ差Ｐｄ（ｎ）は、「Ｐ（ｎ）－Ｐ（ｎ－１）」で算出される。本実施形態における所定範囲は「±１１ｃｅｎｔ」とする。

図５の例によると、第１の下降区間候補ＤＣ１における終了時の歌唱ピッチＰ（１２）と次の歌唱ピッチＰ（１３）とのピッチ差Ｐｄ（１２）は、「－１７ｃｅｎｔ」である。この場合、Ｌ字アクセント歌唱判定部２００は、ピッチ差Ｐｄ（１２）は所定範囲内にないと判断する。一方、第２の下降区間候補ＤＣ２における終了時の歌唱ピッチＰ（１３）と次の歌唱ピッチＰ（１４）とのピッチ差Ｐｄ（１３）は、「－１０ｃｅｎｔ」である。この場合、Ｌ字アクセント歌唱判定部２００は、ピッチ差Ｐｄ（１３）は所定範囲内にあると判断する。

更に、Ｌ字アクセント歌唱判定部２００は、検出された連続する２つの歌唱ピッチについて、順次、ピッチ差を求め、所定範囲内にあるかどうかを判断する。この際、Ｌ字アクセント歌唱判定部２００は、所定範囲内にあるピッチ差が所定数以上連続するかどうかを判断する。所定数以上連続する場合、Ｌ字アクセント歌唱判定部２００は、ピッチ差を求める際に用いた最初の歌唱ピッチを水平区間の開始時の歌唱ピッチとする。本実施形態における所定数は「３」とする。

図５の例によると、所定範囲（±１１ｃｅｎｔ）内にあるピッチ差は、最初に所定範囲内にあると判断されたピッチ差Ｐｄ（１３）から、少なくともピッチ差Ｐｄ（１５）まで３つ連続している。この場合、Ｌ字アクセント歌唱判定部２００は、ピッチ差Ｐｄ（１３）を求める際に用いた歌唱ピッチＰ（１３）を水平区間の開始時の歌唱ピッチとし、ピッチ差Ｐｄ（１５）を求める際に用いた歌唱ピッチＰ（１５）を水平区間の終了時の歌唱ピッチとする水平区間ＨＺ１を特定する。同様に、Ｌ字アクセント歌唱判定部２００は、ピッチ差Ｐｄ（１４）を求める際に用いた歌唱ピッチＰ（１４）を水平区間の開始時の歌唱ピッチとし、ピッチ差Ｐｄ（１６）を求める際に用いた歌唱ピッチＰ（１６）を水平区間の終了時の歌唱ピッチとする水平区間ＨＺ２を特定する。

最後に、Ｌ字アクセント歌唱判定部２００は、第３の歌唱ピッチが水平区間の開始時の歌唱ピッチとなっている下降区間候補を下降区間として特定する（下降区間の特定。ステップ１５）。

図５の例によると、第１の下降区間候補ＤＣ１における第３の歌唱ピッチＰ（１２）、第２の下降区間候補ＤＣ２における第３の歌唱ピッチＰ（１３）、及び第３の下降区間候補ＤＣ３における第３の歌唱ピッチＰ（１４）のうち、特定された第１の水平区間ＨＺ１及び第２の水平区間ＨＺ２の開始時の歌唱ピッチとなっているものは、歌唱ピッチＰ（１３）及び歌唱ピッチＰ（１４）である。この場合、Ｌ字アクセント歌唱判定部２００は、第２の下降区間候補ＤＣ２を下降区間ＤＺ２として特定し、第３の下降区間候補ＤＣ３を下降区間ＤＺ３として特定する。

水平区間及び下降区間が存在する場合、Ｌ字アクセント歌唱判定部２００は、Ｌ字アクセント歌唱が行われていると判定する（Ｌ字アクセント歌唱の判定。ステップ１６）。図４及び図５の例によると、特定された水平区間ＨＺ１及び下降区間ＤＺ２、または水平区間ＨＺ２及び下降区間ＤＺ３が、Ｌ字アクセント歌唱による歌唱区間となる。なお、このように複数のＬ字アクセント歌唱の歌唱区間があると判定された場合、Ｌ字アクセント歌唱判定部２００は、いずれか一方をＬ字アクセント歌唱の歌唱区間として選択する。一の歌唱区間の選択は、任意の条件により行うことができる。本実施形態では、先に特定された水平区間ＨＺ１及び下降区間ＤＺ２をＬ字アクセント歌唱による歌唱区間として選択する。図６は、水平区間ＨＺ１及び下降区間ＤＺ２からなるアクセント歌唱を示している。

なお、下降区間や水平区間を特定できない場合、Ｌ字アクセント歌唱判定部２００は、ノートＮについてはＬ字アクセント歌唱が行われていないと判定する。

［例２］
次に図７～図１０を用いて２つ目の例について説明する。この例では、聴感上、「緊張した感じ」や「切羽詰まった印象」をより強く受けるＬ字アクセント歌唱の判定について説明する。例１と同様の処理については詳細な説明を省略する場合がある。

まず、Ｌ字アクセント歌唱判定部２００は、あるノートの発音開始タイミング近傍において検出した歌唱ピッチのうち、当該あるノートの基準ピッチとのピッチ差が第１の所定値以上である歌唱ピッチを第１の歌唱ピッチとする（第１の歌唱ピッチを特定。ステップ２０）。本実施形態における第１の所定値は「１３０ｃｅｎｔ」とする。

図８の例によると、歌唱ピッチＰ（１）とノートＮの基準ピッチＢＰとのピッチ差ＢＰｄ（１）は、「＋１６４ｃｅｎｔ」である。この場合、Ｌ字アクセント歌唱判定部２００は、ピッチ差ＢＰｄ（１）が第１の所定値（１３０ｃｅｎｔ）以上であると判断する。一方、歌唱ピッチＰ（５）とノートＮの基準ピッチＢＰとのピッチ差ＢＰｄ（５）は、「＋１２７ｃｅｎｔ」である。この場合、Ｌ字アクセント歌唱判定部２００は、ピッチ差ＢＰｄ（５）は第１の所定値（１３０ｃｅｎｔ）未満であると判断する。図８の例によると、Ｌ字アクセント歌唱判定部２００は、歌唱ピッチＰ（１）～歌唱ピッチＰ（４）を第１の歌唱ピッチとして特定する。

次に、Ｌ字アクセント歌唱判定部２００は、第１の歌唱ピッチよりも第１の所定数だけ後に検出した第２の歌唱ピッチまで歌唱ピッチが連続して減少しているかどうかを判定する（第１の歌唱ピッチから第２の歌唱ピッチまで、歌唱ピッチが連続して減少しているかを判定。ステップ２１）。本実施形態における第１の所定数は「３サンプル」とする。

Ｌ字アクセント歌唱判定部２００は、特定された第１の歌唱ピッチについて、３サンプルだけ後に検出した第２の歌唱ピッチまで、歌唱ピッチが連続して減少しているかどうかを判断する。図８の例によると、歌唱ピッチＰ（１）は、次に検出した歌唱ピッチＰ（２）の方が高い値（＋３ｃｅｎｔ）となっているため、歌唱ピッチが連続して減少していると判定せず、第１の歌唱ピッチの特定を解除する。一方、歌唱ピッチＰ（２）については、３サンプルだけ後に検出した歌唱ピッチＰ（５）まで歌唱ピッチが連続して減少している。よって、Ｌ字アクセント歌唱判定部２００は、歌唱ピッチＰ（２）から歌唱ピッチＰ（５）まで、歌唱ピッチが連続して減少していると判定する。この場合、歌唱ピッチＰ（５）は第２の歌唱ピッチに相当する。

次に、Ｌ字アクセント歌唱判定部２００は、第１の歌唱ピッチから、第１の歌唱ピッチよりも第２の所定数だけ後に検出した第３の歌唱ピッチまでの間に第２の所定値以上、歌唱ピッチが減少した後、第３の所定値以上、歌唱ピッチが上昇しているかどうかを判定する（第１の歌唱ピッチから第３の歌唱ピッチまでの間に歌唱ピッチが所定値以上、減少した後、所定値以上、上昇しているかを判定。ステップ２２）。

第２の所定数、第２の所定値、及び第３の所定値は、判定するＬ字アクセント歌唱の程度に応じて、予め任意の値が設定されている。第３の所定値は、たとえば１５～３０ｃｅｎｔである。本実施形態における第２の所定数は「２４サンプル」であり、第２の所定値は「１５０ｃｅｎｔ」であり、第３の所定値は「２０ｃｅｎｔ」であるとする。第２の所定数、第２の所定値、及び第３の所定値は「所定の条件」の一部である。

図８の例によると、歌唱ピッチＰ（２）から２４サンプルだけ後に検出した歌唱ピッチＰ（２６）までの間に歌唱ピッチは最大２００ｃｅｎｔ減少（歌唱ピッチＰ（２）から歌唱ピッチＰ（１７）まで）している。また、歌唱ピッチＰ（１７）から歌唱ピッチＰ（２６）までの間に歌唱ピッチは２１ｃｅｎｔ上昇している。よって、Ｌ字アクセント歌唱判定部２００は、歌唱ピッチＰ（２）から歌唱ピッチＰ（２６）までの間に歌唱ピッチが１５０ｃｅｎｔ以上減少した後、２０ｃｅｎｔ以上、歌唱ピッチが上昇していると判定する。この場合、歌唱ピッチＰ（２６）は第３の歌唱ピッチに相当する。

同様に、図８の例によると、歌唱ピッチＰ（３）から２４サンプルだけ後に検出した歌唱ピッチＰ（２７）までの間に歌唱ピッチが最大１８８ｃｅｎｔ減少（歌唱ピッチＰ（３）から歌唱ピッチＰ（１７）まで）しており、歌唱ピッチＰ（１７）から歌唱ピッチＰ（２６）までの間に歌唱ピッチは２５ｃｅｎｔ上昇している。よって、Ｌ字アクセント歌唱判定部２００は、歌唱ピッチＰ（３）から歌唱ピッチＰ（２７）までの間に歌唱ピッチが１５０ｃｅｎｔ以上減少した後、２０ｃｅｎｔ以上、歌唱ピッチが上昇していると判定する。この場合、歌唱ピッチＰ（２７）は第３の歌唱ピッチに相当する。また、歌唱ピッチＰ（４）から２４サンプルだけ後に検出した歌唱ピッチＰ（２８）までの間に歌唱ピッチが最大１７２ｃｅｎｔ減少（歌唱ピッチＰ（４）から歌唱ピッチＰ（１７）まで）しており、歌唱ピッチＰ（１７）から歌唱ピッチＰ（２８）までの間に歌唱ピッチは２４ｃｅｎｔ上昇している。よって、Ｌ字アクセント歌唱判定部２００は、歌唱ピッチＰ（４）から歌唱ピッチＰ（２８）までの間に歌唱ピッチが１５０ｃｅｎｔ以上減少した後、２０ｃｅｎｔ以上、歌唱ピッチが上昇していると判定する。この場合、歌唱ピッチＰ（２８）は第３の歌唱ピッチに相当する。

次に、Ｌ字アクセント歌唱判定部２００は、第１の歌唱ピッチを開始時の歌唱ピッチとし、第３の歌唱ピッチを終了時の歌唱ピッチとする下降区間候補を特定する（下降区間候補の特定。ステップ２３）。

上記例によれば、Ｌ字アクセント歌唱判定部２００は、歌唱ピッチＰ（２）を開始時の歌唱ピッチとし、歌唱ピッチＰ（２６）を終了時の歌唱ピッチとする第１の下降区間候補ＤＣ１を特定し、歌唱ピッチＰ（３）を開始時の歌唱ピッチとし、歌唱ピッチＰ（２７）を終了時の歌唱ピッチとする第２の下降区間候補ＤＣ２を特定し、歌唱ピッチＰ（４）を開始時の歌唱ピッチとし、歌唱ピッチＰ（２８）を終了時の歌唱ピッチとする第３の下降区間候補ＤＣ３を特定する。

次に、Ｌ字アクセント歌唱判定部２００は、第３の歌唱ピッチから連続する２つの歌唱ピッチのピッチ差が、所定範囲内であり、且つ所定数以上連続する区間を水平区間として特定する（水平区間の特定。ステップ２４）。本実施形態における所定範囲は「±１２ｃｅｎｔ」とする。

図９の例によると、たとえば、第１の下降区間候補ＤＣ１における終了時の歌唱ピッチＰ（２６）と次の歌唱ピッチＰ（２７）とのピッチ差Ｐｄ（２６）は、「＋４ｃｅｎｔ」である。この場合、Ｌ字アクセント歌唱判定部２００は、ピッチ差Ｐｄ（１２）は所定範囲内にあると判断する。

図９の例によると、所定範囲（±１２ｃｅｎｔ）内にあるピッチ差は、最初に所定範囲内にあると判断されたピッチ差Ｐｄ（２６）から、少なくともピッチ差Ｐｄ（２８）まで３つ連続している。この場合、Ｌ字アクセント歌唱判定部２００は、ピッチ差Ｐｄ（２６）を求める際に用いた歌唱ピッチＰ（２６）を水平区間の開始時の歌唱ピッチとし、ピッチ差Ｐｄ（２８）を求める際に用いた歌唱ピッチＰ（２８）を水平区間の終了時の歌唱ピッチとする水平区間ＨＺ１を特定する。同様に、Ｌ字アクセント歌唱判定部２００は、ピッチ差Ｐｄ（２７）を求める際に用いた歌唱ピッチＰ（２７）を水平区間の開始時の歌唱ピッチとし、ピッチ差Ｐｄ（２９）を求める際に用いた歌唱ピッチＰ（２９）を水平区間の終了時の歌唱ピッチとする水平区間ＨＺ２を特定し、ピッチ差Ｐｄ（２８）を求める際に用いた歌唱ピッチＰ（２８）を水平区間の開始時の歌唱ピッチとし、ピッチ差Ｐｄ（３０）を求める際に用いた歌唱ピッチＰ（３０）を水平区間の終了時の歌唱ピッチとする水平区間ＨＺ３を特定する。

最後に、Ｌ字アクセント歌唱判定部２００は、第３の歌唱ピッチが水平区間の開始時の歌唱ピッチとなっている下降区間候補を下降区間として特定する（下降区間の特定。ステップ２５）。

図９の例によると、第１の下降区間候補ＤＣ１における第３の歌唱ピッチＰ（２６）、第２の下降区間候補ＤＣ２における第３の歌唱ピッチＰ（２７）、及び第３の下降区間候補ＤＣ３における第３の歌唱ピッチＰ（２８）のうち、特定された第１の水平区間ＨＺ１～第３の水平区間ＨＺ３の開始時の歌唱ピッチとなっているものは、歌唱ピッチＰ（２６）～歌唱ピッチＰ（２８）である。この場合、Ｌ字アクセント歌唱判定部２００は、第１の下降区間候補ＤＣ１～第３の下降区間候補ＤＣ３を下降区間ＤＺ１～加工区間ＤＺ３として特定する。

水平区間及び下降区間が存在する場合、Ｌ字アクセント歌唱判定部２００は、Ｌ字アクセント歌唱が行われていると判定する（Ｌ字アクセント歌唱の判定。ステップ２６）。図８及び図９の例によると、特定された水平区間ＨＺ１及び下降区間ＤＺ１、水平区間ＨＺ２及び下降区間ＤＺ２、または水平区間ＨＺ３及び下降区間ＤＺ３が、Ｌ字アクセント歌唱による歌唱区間となる。なお、このように複数のＬ字アクセント歌唱の歌唱区間があると判定された場合、Ｌ字アクセント歌唱判定部２００は、いずれかをＬ字アクセント歌唱の歌唱区間として選択する。一の歌唱区間の選択は、任意の条件により行うことができる。本実施形態では、先に特定された水平区間ＨＺ１及び下降区間ＤＺ１をＬ字アクセント歌唱による歌唱区間として選択する。図１０は、水平区間ＨＺ１及び下降区間ＤＺ１からなるアクセント歌唱を示している。

［提示部］
提示部３００は、Ｌ字アクセント歌唱判定部２００による判定結果を歌唱者に提示する。たとえば、ノートＮに対するＬ字アクセント歌唱が行われたとの判定結果が入力された場合、提示部３００は、表示装置３０に表示されるノートＮに対応するガイドメロディ画像近傍にＬ字アクセント歌唱が行われた旨のアイコンを表示させることができる。ガイドメロディ画像は、歌唱者のカラオケ歌唱を支援するために、カラオケ楽曲のメロディを画像として表示させたものである。ガイドメロディ画像の表示については公知の手法を用いることが可能である（たとえば特開２００４－２０５８１７号公報参照）。

なお、提示部３００は、ガイドメロディ画像と関係なく、Ｌ字アクセント歌唱が行われた旨のアイコンのみを表示させることもできる。或いは、提示部３００は、Ｌ字アクセント歌唱が行われた旨のアイコンを表示させる代わりにスピーカ２０を介して音声（拍手、歓声等）でＬ字アクセント歌唱が行われた旨を報知することでもよい。

［採点処理部］
採点処理部４００は、カラオケ楽曲の歌唱により得られる歌唱音声信号を当該カラオケ楽曲のリファレンスデータと比較し、採点値を算出する。採点値を算出する処理は公知の手法を用いることができる。たとえば、採点処理部４００は、マイク４０から入力された歌唱音声信号に基づく歌唱ピッチと、リファレンスデータに基づく基準ピッチにより、歌唱音程の正確さについての採点処理を行う。

ここで、本実施形態に係る採点処理部４００は、あるノートの採点結果が不合格と判定された場合、且つ当該あるノートに対するＬ字アクセント歌唱が行われていた場合、当該あるノートの採点結果を合格と判定する。図６や図１０に示すように、Ｌ字アクセント歌唱は、ノートの基準ピッチとのずれが大きくなるため、一般的な採点処理によれば、不合格となる可能性が高い。そこで、採点処理部４００は、あるノートの採点結果が不合格となった場合であっても、Ｌ字アクセント歌唱判定部２００により、当該あるノートに対してＬ字アクセント歌唱が行われたと判定された場合には、当該あるノートを合格として判定する。

以上から明らかなように、本実施形態に係るカラオケ装置１は、カラオケ楽曲の歌唱により得られた歌唱音声信号から、所定区間毎に歌唱ピッチを検出する歌唱ピッチ検出部１００と、検出した複数の歌唱ピッチを含む区間の中に、あるノートの基準ピッチよりも高い歌唱ピッチから所定の条件で歌唱ピッチが下降する下降区間と、当該下降区間の終了時の歌唱ピッチから連続する２つの歌唱ピッチのピッチ差が所定範囲内である区間が所定数以上連続する水平区間と、が存在する場合、あるノートに対するＬ字アクセント歌唱が行われていると判定するＬ字アクセント歌唱判定部２００と、を有する。このようなカラオケ装置１によれば、カラオケ歌唱にＬ字アクセント歌唱が含まれるかどうかを判定することができる。

より、具体的に、Ｌ字アクセント歌唱判定部２００は、あるノートの発音開始タイミング近傍において検出した歌唱ピッチのうち、当該あるノートの基準ピッチとのピッチ差が第１の所定値以上である歌唱ピッチを第１の歌唱ピッチとし、当該第１の歌唱ピッチよりも第１の所定数だけ後に検出した第２の歌唱ピッチまで歌唱ピッチが連続して減少しており、且つ当該第１の歌唱ピッチから、当該第１の歌唱ピッチよりも第２の所定数だけ後に検出した第３の歌唱ピッチまでの間に第２の所定値以上、歌唱ピッチが減少している場合、当該第１の歌唱ピッチを開始時の歌唱ピッチとし、当該第３の歌唱ピッチを終了時の歌唱ピッチとする下降区間候補を特定し、第３の歌唱ピッチから連続する２つの歌唱ピッチのピッチ差が、所定範囲内であり、且つ所定数以上連続する区間を前記水平区間として特定し、第３の歌唱ピッチが水平区間の開始時の歌唱ピッチとなっている下降区間候補を下降区間として特定する。Ｌ字アクセント歌唱判定部２００がこのような処理を実行することにより、カラオケ歌唱にＬ字アクセント歌唱が含まれるかどうかを判定することができる。

或いは、Ｌ字アクセント歌唱判定部２００は、あるノートの発音開始タイミング近傍において検出した歌唱ピッチのうち、当該あるノートの基準ピッチとのピッチ差が第１の所定値以上である歌唱ピッチを第１の歌唱ピッチとし、当該第１の歌唱ピッチよりも第１の所定数だけ後に検出した第２の歌唱ピッチまで歌唱ピッチが連続して減少しており、且つ当該第１の歌唱ピッチから、当該第１の歌唱ピッチよりも第２の所定数だけ後に検出した第３の歌唱ピッチまでの間に第２の所定値以上、歌唱ピッチが減少した後、第３の所定値以上、歌唱ピッチが上昇している場合、当該第１の歌唱ピッチを開始時の歌唱ピッチとし、当該第３の歌唱ピッチを終了時の歌唱ピッチとする下降区間候補を特定し、第３の歌唱ピッチから連続する２つの歌唱ピッチのピッチ差が、所定範囲内であり、且つ所定数以上連続する区間を前記水平区間として特定し、第３の歌唱ピッチが水平区間の開始時の歌唱ピッチとなっている下降区間候補を下降区間として特定する。Ｌ字アクセント歌唱判定部２００がこのような処理を実行することにより、聴感上「緊張した感じ」や「切羽詰まった印象」をより強く受けるＬ字アクセント歌唱が含まれるかどうかを判定することができる。

更に、本実施形態に係るカラオケ装置１は、あるノートの採点結果が不合格と判定された場合、且つ当該あるノートに対するＬ字アクセント歌唱が行われていた場合、当該あるノートの採点結果を合格と判定する採点処理部４００を有する。このようなカラオケ装置によれば、Ｌ字アクセント歌唱という歌唱技法が用いられたにも関わらず、それが反映されない採点結果となることを回避できる。

＜その他＞
なお、上記実施形態では、ノートＮの発音開始タイミング以降に検出された歌唱ピッチに基づいてＬ字アクセント歌唱の判定を行っているが、これに限られない。たとえば、ノートＮに対してＬ字アクセント歌唱を行う際、ノートＮの発音開始タイミングよりも少し前のタイミングからＬ字アクセント歌唱が開始される場合がある。この場合、Ｌ字アクセント歌唱判定部２００は、ノートＮの発音開始タイミングよりも前（例えば１０サンプル前）に検出された歌唱ピッチを利用して、ノートＮに対するＬアクセント歌唱の有無を判定してもよい。この際、ノートＮの発音開始タイミングよりも前に検出された歌唱ピッチについて、基準ピッチとのピッチ差を求める場合には、ノートＮの基準ピッチを用いる。

また、上記実施形態で説明したＬ字アクセント歌唱の判定処理等をプログラムとして提供することも可能である。たとえば、当該プログラムは、コンピューター（たとえば、カラオケ装置）に、カラオケ楽曲の歌唱により得られた歌唱音声信号から、所定区間毎に歌唱ピッチを検出させ、検出した複数の歌唱ピッチを含む区間の中に、あるノートの基準ピッチよりも高い歌唱ピッチから所定の条件で歌唱ピッチが下降する下降区間と、当該下降区間の終了時の歌唱ピッチから連続する２つの歌唱ピッチのピッチ差が所定範囲内である区間が所定数以上連続する水平区間と、が存在する場合、あるノートに対するＬ字アクセント歌唱が行われていると判定させる。

また、上記プログラムが記憶された非一時的なコンピューター可読媒体（non-transitory computer readable medium with an executable program thereon）を用いて、コンピューターにプログラムを供給することも可能である。なお、非一時的なコンピューターの可読媒体の例は、磁気記録媒体（例えばフレキシブルディスク、磁気テープ、ハードディスクドライブ）、ＣＤ－ＲＯＭ（Read Only Memory）等がある。

上記実施形態は、例として提示したものであり、発明の範囲を限定するものではない。上記の構成は、適宜組み合わせて実施することが可能であり、発明の要旨を逸脱しない範囲で、種々の省略、置き換え、変更を行うことができる。上記実施形態やその変形は、発明の範囲や要旨に含まれると同様に、特許請求の範囲に記載された発明とその均等の範囲に含まれる。

１カラオケ装置
１０カラオケ本体
１１制御部
１００歌唱ピッチ検出部
２００Ｌ字アクセント歌唱判定部
３００提示部
４００採点処理部

Claims

カラオケ楽曲の歌唱により得られた歌唱音声信号から、所定区間毎に歌唱ピッチを検出する歌唱ピッチ検出部と、
検出した複数の前記歌唱ピッチを含む区間の中に、あるノートの基準ピッチよりも高い歌唱ピッチから所定の条件で歌唱ピッチが下降する下降区間と、当該下降区間の終了時の歌唱ピッチから連続する２つの歌唱ピッチのピッチ差が所定範囲内である区間が所定数以上連続する水平区間と、が存在する場合、前記あるノートに対するＬ字アクセント歌唱が行われていると判定するＬ字アクセント歌唱判定部と、
を有し、
前記Ｌ字アクセント歌唱判定部は、
前記あるノートの発音開始タイミング近傍において検出した歌唱ピッチのうち、当該あるノートの基準ピッチとのピッチ差が第１の所定値以上である歌唱ピッチを第１の歌唱ピッチとし、当該第１の歌唱ピッチよりも第１の所定数だけ後に検出した第２の歌唱ピッチまで歌唱ピッチが連続して減少しており、且つ当該第１の歌唱ピッチから、当該第１の歌唱ピッチよりも第２の所定数だけ後に検出した第３の歌唱ピッチまでの間に第２の所定値以上、歌唱ピッチが減少している場合、当該第１の歌唱ピッチを開始時の歌唱ピッチとし、当該第３の歌唱ピッチを終了時の歌唱ピッチとする下降区間候補を特定し、
前記第３の歌唱ピッチから連続する２つの歌唱ピッチのピッチ差が、所定範囲内であり、且つ所定数以上連続する区間を前記水平区間として特定し、
前記第３の歌唱ピッチが前記水平区間の開始時の歌唱ピッチとなっている前記下降区間候補を前記下降区間として特定するカラオケ装置。
カラオケ楽曲の歌唱により得られた歌唱音声信号から、所定区間毎に歌唱ピッチを検出する歌唱ピッチ検出部と、
検出した複数の前記歌唱ピッチを含む区間の中に、あるノートの基準ピッチよりも高い歌唱ピッチから所定の条件で歌唱ピッチが下降する下降区間と、当該下降区間の終了時の歌唱ピッチから連続する２つの歌唱ピッチのピッチ差が所定範囲内である区間が所定数以上連続する水平区間と、が存在する場合、前記あるノートに対するＬ字アクセント歌唱が行われていると判定するＬ字アクセント歌唱判定部と、
を有し、
前記Ｌ字アクセント歌唱判定部は、
前記あるノートの発音開始タイミング近傍において検出した歌唱ピッチのうち、当該あるノートの基準ピッチとのピッチ差が第１の所定値以上である歌唱ピッチを第１の歌唱ピッチとし、当該第１の歌唱ピッチよりも第１の所定数だけ後に検出した第２の歌唱ピッチまで歌唱ピッチが連続して減少しており、且つ当該第１の歌唱ピッチから、当該第１の歌唱ピッチよりも第２の所定数だけ後に検出した第３の歌唱ピッチまでの間に第２の所定値以上、歌唱ピッチが減少した後、第３の所定値以上、歌唱ピッチが上昇している場合、当該第１の歌唱ピッチを開始時の歌唱ピッチとし、当該第３の歌唱ピッチを終了時の歌唱ピッチとする下降区間候補を特定し、
前記第３の歌唱ピッチから連続する２つの歌唱ピッチのピッチ差が、所定範囲内であり、且つ所定数以上連続する区間を前記水平区間として特定し、
前記第３の歌唱ピッチが前記水平区間の開始時の歌唱ピッチとなっている前記下降区間候補を前記下降区間として特定するカラオケ装置。
前記あるノートの採点結果が不合格と判定された場合、且つ当該あるノートに対する前記Ｌ字アクセント歌唱が行われていると判定された場合、当該あるノートの採点結果を合格と判定する採点処理部を有することを特徴とする請求項１または２記載のカラオケ装置。