JP2015169867A

JP2015169867A - 歌唱解析装置

Info

Publication number: JP2015169867A
Application number: JP2014045957A
Authority: JP
Inventors: 松本　秀一; Shuichi Matsumoto; 秀一松本
Original assignee: Yamaha Corp
Current assignee: Yamaha Corp
Priority date: 2014-03-10
Filing date: 2014-03-10
Publication date: 2015-09-28
Also published as: WO2015137360A1

Abstract

【課題】歌唱者の歌唱の傾向に応じた適切なコメントを歌唱者に提示する。【解決手段】歌唱解析装置１００は、事前に収録された複数の参照音声のうち対象歌唱者の歌唱音声Ｖに対応したグループの各参照音声の傾向に応じたコメント（例えば歌唱アドバイスＡ）を特定する解析処理部２２と、解析処理部２２が特定したコメントを対象歌唱者に提示する提示処理部２４とを具備する。【選択図】図１

Description

本発明は、歌唱音声を解析する技術に関する。

歌唱者による過去の歌唱の傾向を利用した技術が従来から提案されている。例えば特許文献１には、過去の選曲の傾向（すなわち嗜好）に応じて各歌唱者を分類した複数のグループの各々について楽曲を事前に登録することで、個々の歌唱者の嗜好に合致した楽曲を歌唱者に提案する技術が開示されている。

特開２０１２−０７８３８７号公報

特許文献１の技術は、各歌唱者による歌唱の傾向を楽曲の提案に利用する技術であるが、多数の歌唱者が楽曲を歌唱した場合の傾向（例えば楽曲のうち多数の歌唱者が失敗し易い箇所）や個々の歌唱者による歌唱の傾向（例えば高音域で音高の誤差が発生し易い等の傾向）を加味した歌唱のアドバイス（指摘や助言）、または、以上の傾向を加味して歌唱を評価した評価結果等のコメントを歌唱者に提示できれば、歌唱の効果的な改善が期待できる。以上の事情を考慮して、本発明は、歌唱者の歌唱の傾向に応じた適切なコメントを歌唱者に提示することを目的とする。

以上の課題を解決するために、本発明の歌唱解析装置は、事前に収録された複数の参照音声のうち対象歌唱者の歌唱音声に対応したグループの各参照音声の傾向に応じたコメントを特定する解析処理部と、解析処理部が特定したコメントを対象歌唱者に提示する提示処理部とを具備する。以上の構成では、対象歌唱者の歌唱音声に対応したグループの各参照音声の傾向が特定されるから、対象歌唱者の歌唱音声にとって適切なコメントを対象歌唱者に提示することが可能である。したがって、対象歌唱者の歌唱を効果的に改善できるという利点がある。

本発明の第１態様において、前記解析処理部は、前記対象歌唱者の歌唱音声に対応したグループの各参照音声の傾向に応じた歌唱アドバイスを前記コメントとして特定する。以上の態様では、対象歌唱者の歌唱音声に対応したグループの各参照音声の傾向に応じた歌唱アドバイスが特定されるから、対象歌唱者の歌唱音声にとって適切な歌唱アドバイスを対象歌唱者に提示することが可能である。

本発明の第１態様の好適例において、解析処理部は、対象歌唱者の歌唱音声と楽曲が共通する複数の参照音声を分類した複数のグループの各々について歌唱アドバイスを指定する参照情報を参照して、複数のグループのうち対象歌唱者の歌唱音声が属するグループの歌唱アドバイスを特定する。以上の態様では、対象歌唱者の歌唱音声と楽曲が共通する複数の参照音声を分類した複数のグループの各々について歌唱アドバイスを指定する参照情報を参照することで、対象歌唱者の歌唱音声が属するグループの歌唱アドバイスが特定されるから、楽曲毎に好適な歌唱アドバイスを提示できるという利点がある。また、対象歌唱者による楽曲の歌唱中に解析処理部が当該歌唱音声のグループを順次に更新する構成によれば、対象楽曲の区間毎に好適な歌唱アドバイスを提示できるという利点がある。なお、以上の各態様の具体例は、例えば第１実施形態として後述される。

本発明の第１態様において、解析処理部は、複数の参照音声のうち対象歌唱者の音声を収集したグループの各参照音声の傾向に応じて音楽属性毎に歌唱アドバイスを指定する参照情報を参照して、対象歌唱者が歌唱する楽曲のうち音楽属性に該当する箇所の歌唱アドバイスを特定する。以上の態様では、対象歌唱者の複数の参照音声の傾向に応じて音楽属性毎に歌唱アドバイスを指定する参照情報を参照することで、楽曲のうち音楽属性に該当する箇所の歌唱アドバイスが特定されるから、対象歌唱者毎に好適な歌唱アドバイス（例えば歌唱者毎の苦手な歌唱に対するアドバイス）を提示できるという利点がある。例えば、参照情報が、相前後する各音高の特定の音程を音楽属性として歌唱アドバイスを指定し、解析処理部が、対象歌唱者が歌唱する楽曲のうち特定の音程が存在する箇所について、参照情報にて当該音程に指定された歌唱アドバイスを特定する構成によれば、特定の音程で音高を変化させる歌唱が苦手な歌唱者に対し、苦手の克服のための効果的な歌唱アドバイスを提示することが可能である。なお、以上の態様の具体例は、例えば第２実施形態として後述される。
「音楽属性」は、楽曲の音楽的な属性（態様）を意味する。具体的には、音域（高／低）、演奏マーク（Ａメロ、サビ等）、フレーズ等の特定の区間内での位置（出だし等）、音型（上昇、下降、同音連続、コブシ、修飾音）、音価（ロングトーン、短いパッセージ）、リズムの種類、レガート／スタッカート、テンポ、拍位置（２拍目のウラ等）、和音上の機能（ルート、非和声音）等が、「音楽属性」の概念に包含される。

本発明の第２態様において、前記解析処理部は、前記解析処理部が特定した傾向に応じて前記対象歌唱者の歌唱音声を評価した評価結果を前記コメントとして特定する。以上の態様では、対象歌唱者の歌唱音声に対応したグループの各参照音声の傾向に応じて対象歌唱者の歌唱音声を評価した評価結果が提示されるから、対象歌唱者の歌唱音声にとって適切な評価結果を対象歌唱者に提示することが可能である。

ところで、多数の歌唱者が楽曲を歌唱した場合の傾向や個々の歌唱者による歌唱の傾向を加味して歌唱者の歌唱を評価すれば、歌唱の効果的な改善が期待できる。以上の事情を考慮して、本発明の他の態様に係る歌唱解析装置は、事前に収録された複数の参照音声のうち対象歌唱者の歌唱音声に対応したグループの各参照音声の傾向に応じて当該歌唱音声を評価する解析処理部を具備する。以上の構成によれば、歌唱者の歌唱の傾向に応じて歌唱音声が評価（典型的には採点）されるから、歌唱の改善に効果的に寄与し得る評価を実現できるという利点がある。

以上の各態様に係る歌唱解析装置は、歌唱アドバイスの提示に専用されるＤＳＰ（Digital Signal Processor）等のハードウェア（電子回路）によって実現されるほか、ＣＰＵ（Central Processing Unit）等の汎用の演算処理装置とプログラムとの協働によっても実現される。本発明の好適な態様に係るプログラムは、事前に収録された複数の参照音声のうち対象歌唱者の歌唱音声に対応したグループの各参照音声の傾向に応じたコメントを特定する解析処理部、および解析処理部が特定したコメントを対象歌唱者に提示する提示処理部としてコンピュータを機能させる。また、他の態様に係るプログラムは、事前に収録された複数の参照音声のうち対象歌唱者の歌唱音声に対応したグループの各参照音声の傾向に応じて当該歌唱音声を評価する解析処理部としてコンピュータを機能させる。本発明のプログラムは、コンピュータが読取可能な記録媒体に格納された形態で提供されてコンピュータにインストールされ得る。記録媒体は、例えば非一過性（non-transitory）の記録媒体であり、ＣＤ-ＲＯＭ等の光学式記録媒体（光ディスク）が好例であるが、半導体記録媒体や磁気記録媒体等の公知の任意の形式の記録媒体を包含し得る。また、例えば、本発明のプログラムは、通信網を介した配信の形態で提供されてコンピュータにインストールされ得る。

また、以上の各態様に係る歌唱解析装置の動作方法（歌唱解析方法）としても本発明は特定される。本発明の好適な態様に係る歌唱解析方法は、事前に収録された複数の参照音声のうち対象歌唱者の歌唱音声に対応したグループの各参照音声の傾向に応じたコメントを特定する解析処理過程と、解析処理過程で特定したコメントを対象歌唱者に提示する提示処理過程とを包含する。また、他の態様に係る歌唱解析方法は、事前に収録された複数の参照音声のうち対象歌唱者の歌唱音声に対応したグループの各参照音声の傾向に応じて当該歌唱音声を評価する解析処理過程を包含する。

本発明の第１実施形態に係る歌唱解析装置の構成図である。参照情報の説明図である。指摘時点の説明図である。歌唱アドバイス特定処理のフローチャートである。第２実施形態における参照情報の説明図である。第２実施形態における歌唱アドバイス特定処理のフローチャートである。

＜第１実施形態＞
図１は、本発明の第１実施形態に係る歌唱解析装置１００の構成図である。歌唱解析装置１００は、楽曲の歌唱に関する指摘や助言等のアドバイス（以下「歌唱アドバイス」という）を当該楽曲の歌唱者（以下「対象歌唱者」という）に提示するための情報処理装置であり、演算処理装置１２と記憶装置１４と収音装置１６と表示装置１８とを具備するコンピュータシステムで実現される。歌唱解析装置１００は、例えば楽曲の伴奏音を再生するカラオケ装置として好適に利用される。

収音装置１６は、周囲の音響を収音する装置（マイクロホン）である。第１実施形態の収音装置１６は、対象歌唱者が特定の楽曲（以下「対象楽曲」という）を歌唱した歌唱音声Ｖを収音する。なお、音声合成技術で合成された合成音声を歌唱音声Ｖとすることも可能である。表示装置１８（例えば液晶表示パネル）は、演算処理装置１２から指示された画像を表示する。第１実施形態では、対象楽曲の歌唱アドバイスＡが表示装置１８に表示される。具体的には、対象歌唱者による楽曲の歌唱中の各時点において、当該時点に好適な歌唱アドバイスＡが順次に表示装置１８に表示される。なお、歌唱アドバイスＡを放音装置（例えばスピーカ）から音声で出力することも可能である。

記憶装置１４は、演算処理装置１２が実行するプログラムや演算処理装置１２が使用する各種のデータを記憶する。半導体記録媒体や磁気記録媒体等の公知の記録媒体または複数種の記録媒体の組合せが記憶装置１４として任意に採用される。第１実施形態の記憶装置１４は、複数の楽曲の各々について参照情報ＤAを記憶する。各参照情報ＤAは、当該楽曲の歌唱アドバイスＡの特定に利用される。

図２は、任意の１個の楽曲の参照情報ＤAの説明図である。図２に例示される通り、参照情報ＤAの生成には参照音声群Ｑが利用される。参照音声群Ｑは、事前に収録された複数の歌唱音声（以下「参照音声」という）Ｒの集合である。参照音声群Ｑに包含される複数の参照音声Ｒは、不特定多数の歌唱者が任意の楽曲を歌唱した音声である。図２に例示される通り、任意の１個の楽曲の複数の参照音声（歌唱楽曲が共通する複数の参照音声）Ｒは、Ｎ個（Ｎは２以上の自然数）のグループＧ[1]〜Ｇ[N]に分類される。任意の楽曲に対応する１個のグループＧ[n]（ｎ＝１〜Ｎ）には、相異なる歌唱者が当該楽曲を歌唱した複数の参照音声Ｒが包含される。

各参照音声Ｒの分類（クラスタリング）の仕方は任意であるが、音楽的な観点から複数の参照音声ＲをＮ個のグループＧ[1]〜Ｇ[N]に分類する方法が好適である。具体的には、楽曲の歌唱パートの旋律と参照音声Ｒとの異同の指標である評価指標（歌唱採点結果）Ｅの範囲毎（例えば１００点満点の５点刻み）に各参照音声ＲをＮ個のグループＧ[1]〜Ｇ[N]に分類する方法や、楽曲内で時系列に算定される評価指標Ｅの傾向（例えば楽曲の後半で評価指標Ｅが増加する等の傾向）に応じて各参照音声ＲをＮ個のグループＧ[1]〜Ｇ[N]に分類する方法が採用され得る。

図２に例示される通り、第１実施形態の参照情報ＤAは、参照音声Ｒの相異なるグループＧ[n]に対応するＮ個の単位情報Ｕ[1]〜Ｕ[N]を包含する。単位情報Ｕ[N]について図２に代表的に例示される通り、任意の１個の単位情報Ｕ[n]は、楽曲の複数の時点（以下「指摘時点」という）Ｔ（Ｔ1，Ｔ2，……）の各々について歌唱アドバイスＡ（Ａ1，Ａ2，……）を指定する。歌唱アドバイスＡの内容は指摘時点Ｔ毎に個別に設定される。

任意の１個の楽曲の単位情報Ｕ[n]は、当該楽曲の複数の参照音声ＲのうちグループＧ[n]に分類された各参照音声Ｒの音楽的な傾向を加味して生成される。具体的には、楽曲のうちグループＧ[n]の多数の参照音声Ｒにて歌唱を改善すべき各時点が指摘時点Ｔとして指定され、歌唱の改善の内容や改善のための助言または指摘（提案）を表現する文字列が歌唱アドバイスＡとして指定される。

図３には、グループＧ[n]の複数の参照音声Ｒにわたる平均的な音高Ｐ[n]の時系列と、楽曲の模範的な音高Ｐ0の時系列とが併記されている。模範的な音高Ｐ0は、楽曲の楽譜で規定された各音符の音高の時系列や、評価指標Ｅが最大となるグループＧの各参照音声Ｒの音高の平均値の時系列である。図３から理解される通り、グループＧ[n]の平均的な音高Ｐ[n]と模範的な音高Ｐ0との差異（音高の誤差）が極大となる時点が指摘時点Ｔとして指定され、当該時点での音高の誤差を改善するための文字列（例えば「音高に注意！」等のメッセージ）が歌唱アドバイスＡとして指摘時点Ｔ毎に指定される。

図１の演算処理装置１２は、記憶装置１４に記憶されたプログラムを実行することで歌唱解析装置１００の各要素を統括的に制御する。第１実施形態の演算処理装置１２は、図１に例示される通り、対象楽曲を歌唱する対象歌唱者に歌唱アドバイスＡを提示するための複数の機能（解析処理部２２，提示処理部２４）を実現する。なお、演算処理装置１２の各機能を複数の装置に分散した構成や、演算処理装置１２の機能の一部を専用の電子回路が実現する構成も採用され得る。

図１の解析処理部２２は、対象歌唱者に提示すべき歌唱アドバイスＡを特定する。第１実施形態の解析処理部２２は、対象歌唱者の歌唱音声Ｖにとって好適な歌唱アドバイスＡを対象楽曲の歌唱中に順次に特定する。図４は、解析処理部２２が歌唱アドバイスＡを特定するための処理（以下「歌唱アドバイス特定処理」という）のフローチャートである。対象楽曲の歌唱の開始（対象楽曲の伴奏音の再生開始）を契機として図４の歌唱アドバイス特定処理が開始される。

歌唱アドバイス特定処理を開始すると、解析処理部２２は、対象楽曲が終了したか否かを判定する（ＳA1）。対象楽曲が終了していない場合（ＳA1：NO）、解析処理部２２は、楽曲を時間軸上で所定長（固定長または可変長）毎に区分した複数の区間のうち１個の区間（以下「選択区間」という）の歌唱音声Ｖを収音装置１６から取得する（ＳA2）。解析処理部２２は、楽曲の各区間を先頭から末尾にかけてステップＳA2の実行毎に順番に選択して選択区間の歌唱音声Ｖを取得する。

解析処理部２２は、対象楽曲の複数の参照音声Ｒを分類したＮ個のグループＧ[1]〜Ｇ[N]のうち選択区間の歌唱音声Ｖが属するグループ（以下「所属グループ」という）Ｇを特定する（ＳA3）。具体的には、解析処理部２２は、選択区間の歌唱音声Ｖについて評価指標Ｅを算定し、評価指標Ｅの相異なる範囲に対応するＮ個のグループＧ[1]〜Ｇ[N]のうち選択区間内の歌唱音声Ｖの評価指標Ｅが包含される範囲の１個のグループＧ[n]を所属グループＧとして特定する。

解析処理部２２は、記憶装置１４に記憶された参照情報ＤAのＮ個の単位情報Ｕ[1]〜Ｕ[N]のうちステップＳA3で特定した所属グループＧに対応する単位情報Ｕを選択する（ＳA4）。すなわち、解析処理部２２は、Ｎ個のグループＧ[1]〜Ｇ[N]のうち対象歌唱者の歌唱音声Ｖが属する所属グループＧの各歌唱アドバイスＡを特定する。以上の手順で選択区間の単位情報Ｕが特定されると、解析処理部２２は処理をステップＳA1に移行する。したがって、対象楽曲が終了するまで（ＳA1：YES）、対象楽曲の区間毎に所属グループＧが順次に更新され、更新後の所属グループＧに対応する単位情報Ｕ（歌唱アドバイスＡの時系列）が順次に特定される。なお、対象楽曲の最初の区間が歌唱される段階（歌唱音声Ｖの未取得の段階）では、歌唱音声Ｖに対応する所属グループＧが特定されないから、参照情報ＤAの各単位情報Ｕ[n]とは無関係に事前に用意された歌唱アドバイスＡ（例えば「感情を込めて歌いましょう」等の一般的なメッセージ）が対象歌唱者に提示される。

図１の提示処理部２４は、以上に例示した歌唱アドバイス特定処理で解析処理部２２が特定した歌唱アドバイスＡを対象歌唱者に提示する。具体的には、提示処理部２４は、解析処理部２２が特定した単位情報Ｕが指定する各指摘時点Ｔから所定の時間だけ先行する時点において、単位情報Ｕが当該指摘時点Ｔについて指定する歌唱アドバイスＡを表示装置１８に表示させる。すなわち、歌唱音声Ｖが属する所属グループＧの各参照音声Ｒのもとで改善すべき点（すなわち対象歌唱者の歌唱音声Ｖでも同様に改善すべきと推測される箇所）が対象歌唱者に順次に提示され、対象歌唱者は、対象楽曲のうち自身が失敗し易い箇所を特に注意して歌唱することが可能である。

以上に説明した通り、第１実施形態では、対象歌唱者の歌唱音声Ｖが属する所属グループＧの複数の参照音声Ｒの傾向に応じた歌唱アドバイスＡが対象歌唱者に提示される。すなわち、個々の対象歌唱者の歌唱音声Ｖにとって適切な歌唱アドバイスＡが対象歌唱者に提示される。したがって、対象歌唱者の歌唱を効果的に改善できるという利点がある。

第１実施形態では特に、歌唱音声Ｖと楽曲が共通する複数の参照音声Ｒを分類した各グループＧ[n]について歌唱アドバイスＡを指定する参照情報ＤAを参照することで歌唱アドバイスＡが特定されるから、個々の楽曲に好適な歌唱アドバイスＡが特定される。したがって、対象楽曲の歌唱音声Ｖにとって適切な歌唱アドバイスＡを提示できるという前述の効果は格別に顕著である。また、第１実施形態では、対象歌唱者による対象楽曲の歌唱中に歌唱音声Ｖの所属グループＧが対象楽曲の区間毎に順次に更新される。したがって、対象楽曲の区間毎に好適な歌唱アドバイスＡを提示できるという利点がある。

＜第２実施形態＞
本発明の第２実施形態を以下に説明する。なお、以下に例示する各形態において作用や機能が第１実施形態と同様である要素については、第１実施形態の説明で参照した符号を流用して各々の詳細な説明を適宜に省略する。

第２実施形態の記憶装置１４は、第１実施形態の参照情報ＤAに代えて図５の参照情報ＤBを記憶する。参照情報ＤBの生成には、第１実施形態と同様の参照音声群Ｑのうち対象歌唱者の複数の参照音声Ｒの集合（グループ）が利用される。具体的には、参照音声群Ｑのうち対象歌唱者の複数の参照音声Ｒを解析することで、対象歌唱者に歌唱アドバイスＡを提示すべき音楽属性Ｘ（典型的には対象歌唱者が失敗する傾向がある音楽属性Ｘ）が特定され、複数の音楽属性Ｘの各々（Ｘ1，Ｘ2，……）について歌唱アドバイスＡ（Ａ1，Ａ2，……）を指定する参照情報ＤBが任意の１人の対象歌唱者について記憶装置１４に格納される。なお、参照情報ＤBは、複数の歌唱者の各々について参照情報ＤBが事前に生成され得るが、対象歌唱者による歌唱の直前に（すなわち歌唱毎に）当該対象歌唱者の参照情報ＤBを生成することも可能である。

音楽属性Ｘは、楽曲の歌唱パートの音楽的な属性（態様）を意味する。例えば、高音域の歌唱が苦手であるという傾向が複数の参照音声Ｒから解析された対象歌唱者の参照情報ＤBでは、「高音域」という音楽属性Ｘ1について「高音に注意！」等の歌唱アドバイスＡ1が指定される。特定の音程（例えば５度）で相前後する各音高の歌唱が苦手であるという傾向が複数の参照音声Ｒから解析された対象歌唱者の参照情報ＤBでは、「５度」という音楽属性Ｘ2（特定の音程）について「音高変化に注意！」等の歌唱アドバイスＡ2が指定される。また、特定のリズムの歌唱が苦手であるという傾向が解析された対象歌唱者の参照情報ＤBでは、「特定のリズム」という音楽属性Ｘ3について「リズムに注意！」等の歌唱アドバイスＡ3が指定され、楽曲のうち開始直後（歌い始め）等の特定の区間の歌唱が苦手であるという傾向が解析された対象歌唱者の参照情報ＤBでは、「開始直後」という音楽属性Ｘ4について「歌い始めに注意！」等の歌唱アドバイスＡ4が指定される。

図６は、第２実施形態の解析処理部２２が歌唱アドバイスＡを特定するための歌唱アドバイス特定処理のフローチャートである。第１実施形態と同様に、対象楽曲の歌唱の開始を契機として図６の歌唱アドバイス特定処理が開始される。

歌唱アドバイス特定処理を開始すると、解析処理部２２は、対象歌唱者の参照情報ＤBを参照することで、対象楽曲のうち参照情報ＤBで指定される音楽属性Ｘに該当する箇所（以下「指摘区間」という）を探索する（ＳB1）。例えば、特定の音域（例えば高音域）が音楽属性Ｘとして参照情報ＤBで指定されている場合には、対象楽曲のうち当該音域の区間が指摘区間として探索され、特定の音程（例えば５度）が音楽属性Ｘとして参照情報ＤBで指定されている場合には、対象楽曲のうち当該音程で音高が前後する区間が指摘区間として探索される。また、特定のリズムが音楽属性Ｘとして参照情報ＤBで指定されている場合には対象楽曲のうち当該リズムの区間が指摘区間として探索され、特定の区間（例えば開始直後）が音楽属性Ｘとして参照情報ＤBで指定されている場合には対象楽曲のうち当該区間が指摘区間として探索される。なお、指摘区間の探索に複数種の音楽属性Ｘを加味することも可能である。例えば、「特定のリズム」かつ「特定の音程」の区間が指摘区間として探索される。

解析処理部２２は、以上の手順で対象楽曲から探索した各指摘区間について歌唱アドバイスＡを特定する（ＳB2）。具体的には、解析処理部２２は、対象楽曲から探索された複数の指摘区間の各々について、当該指摘区間の音楽属性Ｘに対応する歌唱アドバイスＡを参照情報ＤBから特定する。以上が第２実施形態における歌唱アドバイス特定処理の具体例である。

第２実施形態の提示処理部２４は、以上に説明した歌唱アドバイス特定処理で解析処理部２２が特定した歌唱アドバイスＡを対象楽曲の指摘区間毎に対象歌唱者に提示する。具体的には、提示処理部２４は、対象楽曲のうち各指摘区間の始点から所定の時間だけ先行する時点において、当該指摘区間について解析処理部２２が特定した歌唱アドバイスＡを表示装置１８に表示させる。以上の説明から理解される通り、対象歌唱者にとって苦手であると推測される指摘区間の歌唱に先立ち、当該区間の歌唱を改善するための歌唱アドバイスＡが対象歌唱者に順次に提示される。

以上に説明した通り、第２実施形態では、参照音声群Ｑのうち対象歌唱者の歌唱音声に対応したグループの傾向に応じた歌唱アドバイスＡが対象歌唱者に提示されるから、第１実施形態と同様に、個々の対象歌唱者にとって適切な歌唱アドバイスＡを対象歌唱者に提示することが可能である。第２実施形態では特に、参照音声群Ｑのうち対象歌唱者が過去に発声した複数の参照音声Ｒのグループの傾向に応じて音楽属性Ｘ毎に歌唱アドバイスＡを指定する参照情報ＤBが参照されるから、個々の対象歌唱者にとって適切な歌唱アドバイスＡを提示できるという効果は格別に顕著である。例えば、特定の音程を音楽属性Ｘとして歌唱アドバイスＡを指定する参照情報ＤBが参照されるから、特定の音程で相前後する各音高の歌唱が苦手な歌唱者に対し、その克服のための効果的な歌唱アドバイスＡを提示することが可能である。

＜第３実施形態＞
第１実施形態や第２実施形態では、対象歌唱者の歌唱音声Ｖが属する所属グループＧの複数の参照音声Ｒの傾向に応じた歌唱アドバイスＡを解析処理部２２が特定した。第３実施形態の解析処理部２２は、対象歌唱者の歌唱音声Ｖが属する所属グループＧの複数の参照音声Ｒの傾向に応じて歌唱音声Ｖを評価（採点）した評価結果のコメントを特定する。具体的には、歌唱音声Ｖの所属グループＧの各参照音声Ｒの傾向に応じた評価項目を重視して歌唱音声Ｖを評価した評価結果が特定される。

例えば、初心者は楽曲のサビの区間を主に記憶している（それ以外は余り記憶していない）という事情を考慮して、音量の変動量が大きく音高の誤差が大きい傾向がある参照音声ＲのグループＧ（すなわち初心者のグループ）に歌唱音声Ｖが属する場合、解析処理部２２は、楽曲のうちサビの区間の評価の加重値を他区間と比較して大きい数値に設定して評価結果を算定する。また、抑揚の評価結果と比較して音高の評価結果が高い傾向がある参照音声ＲのグループＧについて、解析処理部２２は、音高の評価の加重値を抑揚等の他要素と比較して大きい数値に設定して評価結果を算定する。音高の評価結果と比較して抑揚の評価結果が高く各種の歌唱技法（コブシやシャクリ）の頻度が高い傾向がある参照音声ＲのグループＧについて、解析処理部２２は、抑揚や歌唱技法の評価の加重値を音高等の他要素と比較して大きい数値に設定して評価結果を算定する。また、音圧が大きく音高の変動量が大きい傾向（すなわち熱唱する傾向）がある参照音声ＲのグループＧについて、解析処理部２２は、抑揚の評価の加重値を他要素と比較して大きい数値に設定して評価結果を算定する。提示処理部２４は、解析処理部２２が特定した評価結果のコメントを表示装置１８に表示させる。

第３実施形態では、対象歌唱者の歌唱音声Ｖが属する所属グループＧの複数の参照音声Ｒの傾向に応じた評価結果のコメントが対象歌唱者に提示される。すなわち、個々の対象歌唱者の歌唱音声Ｖにとって適切なコメントが対象歌唱者に提示される。したがって、対象歌唱者の歌唱を効果的に改善できるという利点がある。なお、第３実施形態において、評価結果のコメントの提示を省略することも可能である。すなわち、対象歌唱者の歌唱音声Ｖが属する所属グループＧの複数の参照音声Ｒの傾向に応じて歌唱音声Ｖを評価する装置（提示処理部２４を省略した構成）としても本発明は実現され得る。

＜変形例＞
以上の各形態は多様に変形され得る。具体的な変形の態様を以下に例示する。以下の例示から任意に選択された２個以上の態様は適宜に併合され得る。

（１）第１実施形態では、楽曲毎の参照情報ＤAを事前に作成しておく構成を例示したが、各楽曲の歌唱毎に参照情報ＤAを実時間的に生成することも可能である。例えば、対象歌唱者の歌唱音声Ｖに音楽的な傾向が類似する各参照音声ＲのグループＧを参照音声群Ｑから抽出し、当該グループＧの各参照音声Ｒを利用して解析処理部２２が参照情報ＤAを生成することも可能である。例えば、評価指標Ｅが歌唱音声Ｖに近い複数の参照音声Ｒ（例えば歌唱音声Ｖの評価指標Ｅや音高Ｐに対して±５％の範囲にある複数の参照音声Ｒ）のグループＧに応じて参照情報ＤAを生成する構成が好適である。

（２）第１実施形態では、参照音声群Ｑのうち特定の楽曲に対応する複数の参照音声ＲをＮ個のグループＧ[1]〜Ｇ[N]に分類したが、参照音声Ｒの分類の仕方は、第１実施形態で既述した通り任意である。例えば、特定の楽曲に対応する複数の参照音声Ｒのうち評価指標Ｅの降順で上位に位置する所定個（例えば上位５％）の参照音声ＲをグループＧ[n]に分類することも可能である。

（３）前述の各形態では、グループＧ[n]の平均的な音高Ｐ[n]と模範的な音高Ｐ0との差異が極大となる時点を指摘時点Ｔとして選定したが、指摘時点Ｔの選定の仕方は以上の例示に限定されない。例えば、グループＧ[n]に包含される複数の参照音声Ｒの評価指標Ｅまたは音高の散布度（例えば分散や分布幅）が増加する時点や、複数の参照音声Ｒの評価指標Ｅの平均値が極小となる時点を指摘時点Ｔとして選定することも可能である。また、平均的な音高Ｐ[n]と模範的な音高Ｐ0との差異が所定の閾値を上回る時点を指摘時点Ｔとして選定することも可能である。

（４）第１実施形態では、対象楽曲の区間毎に所属グループＧを更新したが、例えば選択区間を包含する複数の区間にわたる歌唱音声Ｖの評価指標Ｅに応じて選択区間の所属グループＧを特定することも可能である。具体的には、評価指標Ｅの相異なる範囲に対応するＮ個のグループＧ[1]〜Ｇ[N]のうち、選択区間を最後尾とした複数の区間にわたる評価指標Ｅの加重和が包含される範囲のグループＧ[n]が所属グループＧとして特定される。各区間の評価指標Ｅに適用される加重値は、例えば選択区間に近いほど大きい数値に設定される。

（５）複数の参照情報Ｄ（ＤA，ＤB）を利用者からの指示に応じて歌唱アドバイスＡの特定に選択的に適用することも可能である。例えば第１実施形態では、指摘時点Ｔが多い参照情報ＤA1と指摘時点Ｔが少ない参照情報ＤA2との組を楽曲毎に用意し、解析処理部２２が、利用者からの指示に応じて参照情報ＤA1と参照情報ＤA2とを選択的に利用する構成が採用される。参照情報ＤA1を適用した場合には対象楽曲内の多数の指摘時点Ｔで歌唱アドバイスＡが提示され（すなわち辛目のアドバイス）、参照情報ＤA2を適用した場合には、歌唱アドバイスＡが提示される指摘時点Ｔが減少する（すなわち甘目のアドバイス）。

（６）第２実施形態において、対象楽曲の区間毎に評価指標Ｅを算定し、指摘区間の評価指標Ｅが所定の基準値を上回る場合（すなわち、対象歌唱者が苦手を克服した場合）に対象歌唱者に通知することも可能である。以上の構成によれば、苦手の克服を対象歌唱者が認識できるから、対象歌唱者による歌唱の意欲を維持できるという利点がある。

（７）第１実施形態および第２実施形態においては歌唱アドバイスＡの提示を例示し、第３実施形態においては評価結果の提示を例示したが、対象歌唱者に対する提示内容は以上の例示に限定されない。前述の各形態の例示から理解される通り、解析処理部２２は、対象歌唱者の歌唱音声Ｖの所属グループＧの各参照音声Ｒの傾向に応じたコメント（歌唱アドバイスＡや評価結果）を特定する要素として包括的に表現される。

（８）通信カラオケ装置等の通信端末と通信するサーバ装置（例えばウェブサーバ）により歌唱解析装置１００を実現することも可能である。例えば、第１実施形態の歌唱解析装置１００をサーバ装置にて実現した構成では、通信端末から通信網を介して受信した歌唱音声Ｖの所属グループＧに対応する歌唱アドバイスＡを解析処理部２２が特定し（歌唱アドバイス特定処理）、歌唱アドバイスＡを対象歌唱者に提示させるための指令を提示処理部２４が通信端末に送信する。

１００……歌唱解析装置、１２……演算処理装置、１４……記憶装置、１６……収音装置、１８……表示装置、２２……解析処理部、２４……提示処理部。

Claims

事前に収録された複数の参照音声のうち対象歌唱者の歌唱音声に対応したグループの各参照音声の傾向に応じたコメントを特定する解析処理部と、
前記解析処理部が特定したコメントを前記対象歌唱者に提示する提示処理部と
を具備する歌唱解析装置。
前記解析処理部は、前記対象歌唱者の歌唱音声に対応したグループの各参照音声の傾向に応じた歌唱アドバイスを前記コメントとして特定する
請求項１の歌唱解析装置。
前記解析処理部は、前記対象歌唱者の歌唱音声と楽曲が共通する複数の参照音声を分類した複数のグループの各々について歌唱アドバイスを指定する参照情報を参照して、前記複数のグループのうち前記対象歌唱者の歌唱音声が属するグループの歌唱アドバイスを特定する
請求項２の歌唱解析装置。
前記解析処理部は、前記対象歌唱者による楽曲の歌唱中に当該歌唱音声のグループを順次に更新する
請求項３の歌唱解析装置。
前記解析処理部は、複数の参照音声のうち前記対象歌唱者の音声を収集したグループの各参照音声の傾向に応じて音楽属性毎に歌唱アドバイスを指定する参照情報を参照して、前記対象歌唱者が歌唱する楽曲のうち前記音楽属性に該当する箇所の歌唱アドバイスを特定する
請求項２の歌唱解析装置。
前記参照情報は、相前後する各音高の特定の音程を前記音楽属性として歌唱アドバイスを指定し、
前記解析処理部は、前記対象歌唱者が歌唱する楽曲のうち前記特定の音程が存在する箇所について、前記参照情報にて当該音程に指定された歌唱アドバイスを特定する
請求項５の歌唱解析装置。
前記解析処理部は、前記解析処理部が特定した傾向に応じて前記対象歌唱者の歌唱音声を評価した評価結果を前記コメントとして特定する
請求項１の歌唱解析装置。