JP6638305B2 - 評価装置 - Google Patents

評価装置 Download PDF

Info

Publication number
JP6638305B2
JP6638305B2 JP2015202099A JP2015202099A JP6638305B2 JP 6638305 B2 JP6638305 B2 JP 6638305B2 JP 2015202099 A JP2015202099 A JP 2015202099A JP 2015202099 A JP2015202099 A JP 2015202099A JP 6638305 B2 JP6638305 B2 JP 6638305B2
Authority
JP
Japan
Prior art keywords
value
evaluation
pitch
range
slope
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2015202099A
Other languages
English (en)
Other versions
JP2017075991A (ja
Inventor
辰弥 寺島
辰弥 寺島
隆一 成山
隆一 成山
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Yamaha Corp
Original Assignee
Yamaha Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Yamaha Corp filed Critical Yamaha Corp
Priority to JP2015202099A priority Critical patent/JP6638305B2/ja
Publication of JP2017075991A publication Critical patent/JP2017075991A/ja
Application granted granted Critical
Publication of JP6638305B2 publication Critical patent/JP6638305B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Auxiliary Devices For Music (AREA)
  • Reverberation, Karaoke And Other Acoustics (AREA)
  • Electrophonic Musical Instruments (AREA)

Description

本発明は、歌唱を評価する技術に関する。
カラオケ装置又は楽器演奏評価装置には、歌唱音声又は演奏音などの入力音を解析して評価する機能が備えられていることが多い。入力音は、例えば、歌唱音声又は演奏音のピッチと歌唱又は演奏すべきガイドメロディ(リファレンスデータ)のピッチとを比較し、これらの一致の程度に基づいて評価される(例えば、特許文献1)。
特開2005−107328
しかしながら、特許文献1の技術では、リファレンスデータを判定の基準に用いるため、評価対象の入力音に対して判定の基準となる情報を用意する必要がある。また、特許文献1の技術では、水平な音高の入力音を評価することはできるが、リファレンスデータの音高の変化点付近におけるピッチ変化の傾きによる評価をすることはできない。
本発明の目的の一つは、評価対象の入力音のピッチ変化の傾きに基づく評価を行うことにある。
本発明の一実施形態に係る評価装置によると、入力音を取得する入力音取得部と、入力音取得部が取得した入力音のピッチを算出するピッチ算出部と、ピッチ算出部が算出したピッチの変化の割合を示す傾き値を算出する傾き算出部と、傾き値に基づいて、入力音の評価値を計算する傾き評価部と、を備える。
また、評価部は、傾き値が第1範囲及び第1範囲よりも傾き値が大きい第2範囲である場合に第1の計算を行い、第1範囲よりも傾き値が大きく、第2範囲よりも傾き値が小さい第3範囲である場合に第2の計算を行ってもよい。
また、評価部は、傾き算出部が算出した傾き値が所定期間において第1範囲又は第2範囲に含まれる回数、又は第3範囲に含まれる回数に応じて、評価値に加点又は減点をしてもよい。
また、傾き算出部は、ピッチ算出部が算出した複数のピッチから得られる統計値に基づいて傾き値を算出してもよい。
また、評価部は、入力音に対応するリファレンスデータにおける音高の変化の割合に応じて、リファレンスデータの位置に対応する入力音の評価値に重み付けをしてもよい。
また、評価部は、入力音に対応するリファレンスデータにおける音高の変化の割合に応じて、リファレンスデータの位置に対応する傾き値の第1範囲、第2範囲、及び第3範囲をそれぞれ調整してもよい。
また、評価部は、傾き算出部が算出した傾き値が所定期間において第1範囲又は第2範囲に含まれる回数、又は第3範囲に含まれる回数に応じて、以降の第1範囲、第2範囲、及び第3範囲をそれぞれ調整してもよい。
また、評価部は、ピッチに基づいて非評価期間を設定し、非評価期間を除く期間の傾き値に基づいて、評価値を計算してもよい。
本発明の一実施形態によれば、評価対象の入力音のピッチ変化の傾きに基づく評価を行うことができる。
本発明の一実施形態における評価装置のハードウェア構成を示すブロック図である。 本発明の一実施形態における評価機能部の機能構成を示すブロック図である。 本発明の一実施形態における評価方法において、取得したピッチの一例を示す図である。 本発明の一実施形態における評価方法において、ピッチの傾き値を算出する方法を示す図である。 本発明の一実施形態における評価方法において、ピッチの傾き値を算出する方法を示す図である。 本発明の一実施形態における評価方法において、ピッチの傾き値の判定基準を示す図である。 本発明の一実施形態における評価方法において、ピッチの傾き値の判定基準を説明する概念図である。 本発明の一実施形態における評価機能部の機能構成を示すブロック図である。 本発明の一実施形態の変形例における評価方法において、リファレンスデータの音高に応じた判定を行う例を示す図である。 本発明の一実施形態における評価機能部の機能構成を示すブロック図である。 本発明の一実施形態における評価方法において、連続NG時間の度数分布から評価値を算出する例を示す図である。 本発明の一実施形態における評価方法において、複数の歌唱ピッチを含むピッチ群に基づいて傾き値を算出する例を示す図である。 本発明の一実施形態における評価機能部の機能構成を示すブロック図である。
以下、本発明の一実施形態における評価装置について、図面を参照しながら詳細に説明する。以下に示す実施形態は本発明の実施形態の一例であって、本発明はこれらの実施形態に限定されるものではない。
〈第1実施形態〉
本発明の第1実施形態における評価装置について、図面を参照しながら詳細に説明する。第1実施形態に係る評価装置は、歌唱するユーザ(以下、歌唱者という場合がある)の歌唱音声を評価する装置である。この評価装置は、所定期間ごとに決められた複数のピッチ(以下、基準ピッチという場合がある)と、歌唱者の歌唱音声のピッチ(以下、歌唱ピッチという場合がある)とを比較して、歌唱の評価を行う。この評価装置によると、ガイドメロディに対応するリファレンスデータに依存しない評価をすることができ、この例では、さらに、歌唱すべき音高の変化点付近におけるピッチ変化の傾きによる歌唱の巧拙を判断することができる。以下、このような評価装置について説明する。
[ハードウエア]
図1は、本発明の一実施形態における評価装置のハードウェア構成を示すブロック図である。評価装置10としては、例えば、カラオケ装置や楽器演奏評価装置が挙げられる。なお、評価装置10はスマートフォン等の携帯装置であってもよい。評価装置10は、制御部100、記憶部110、操作部120、表示部130、通信部140、および信号処理部150を含む。これらの各構成は、バスを介して接続されている。また、信号処理部150には、マイクロフォン560およびスピーカ570が接続されている。
制御部100は、CPUなどの演算処理回路を含む。制御部100は、記憶部110に記憶された制御プログラム512をCPUにより実行して、各種機能を評価装置10において実現させる。実現される機能には、歌唱音声の評価機能が含まれる。記憶部110は、不揮発性メモリ、ハードディスク等の記憶装置である。記憶部110は、評価機能を実現するための制御プログラム512を記憶する。制御プログラム512は、磁気記録媒体、光記録媒体、光磁気記録媒体、半導体メモリなどのコンピュータ読み取り可能な記録媒体に記憶した状態で提供されてもよい。この場合には、評価装置10は、記録媒体を読み取る装置を備えていればよい。また、制御プログラム512は、ネットワーク経由でダウンロードされてもよい。
また、記憶部110は、歌唱に関するデータとして、入力音データ514、評価基準情報516、および楽曲データ518を記憶する。楽曲データ518は、カラオケの歌唱曲に関連するデータ、例えば、ガイドメロディデータ、伴奏データ、歌詞データなどが含まれている。ガイドメロディデータは、歌唱曲のメロディを示すデータである。伴奏データは、歌唱曲の伴奏を示すデータである。ガイドメロディデータおよび伴奏データは、MIDI形式で表現されたデータであってもよい。歌詞データは、歌唱曲の歌詞を表示させるためのデータ、および表示させた歌詞テロップを色替えするタイミングを示すデータである。入力音データは、歌唱者がマイクロフォン560から入力した歌唱音声を示すデータである。この例では、入力音データは、評価機能によって歌唱音声が評価されるまで、記憶部110にバッファされる。
評価基準情報516は、評価機能が歌唱音声の評価の基準として用いる情報である。例えば、評価基準情報516には、ピッチ変化の傾きに基づいて歌唱評価をするための基準情報が含まれる。ここで、歌唱上級者は、一定の音高で歌唱すべきパートでは一定の音高を維持して歌唱し、歌唱すべき音高の変化点においては音高を急激に変化させて歌唱する。一方で、歌唱低級者は、一定の音高で歌唱すべきパートで一定の音高を維持できず、歌唱すべき音高の変化点においては変化後のピッチを探し迷いながら歌唱するため音高の変化が緩やかである。つまり、歌唱上級者のピッチ変化の傾きは、水平に近い場合と傾きが急激な場合とで二極化する。したがって、ピッチ変化の傾きがゼロに近い場合及びピッチ変化の傾きが急峻な場合に対しては高い評価点を付与し、ピッチ変化の傾きがこれらの間の傾きの場合に対しては低い評価点を付与する。
操作部120は、操作パネルおよびリモコンなどに設けられた操作ボタン、キーボード、マウスなどの装置であり、入力された操作に応じた信号を制御部100に出力する。表示部130は、液晶ディスプレイ、有機ELディスプレイ等の表示装置であり、制御部100による制御に基づいた画面が表示される。なお、操作部120と表示部130とは一体としてタッチパネルを構成してもよい。通信部140は、制御部100の制御に基づいて、インターネットなどの通信回線と接続して、サーバ等の外部装置と情報の送受信を行う。なお、記憶部110の機能は、通信部140において通信可能な外部装置で実現されてもよい。
信号処理部150は、MIDI形式の信号からオーディオ信号を生成する音源、A/Dコンバータ、D/Aコンバータ等を含む。歌唱音声は、マイクロフォン560において電気信号に変換されて信号処理部150に入力され、信号処理部150においてA/D変換されて制御部100に出力される。上述したように、歌唱音声は、歌唱音声データとして記憶部110にバッファされる。また、伴奏データは、制御部100によって読み出され、信号処理部150においてD/A変換され、スピーカ570から歌唱曲の伴奏として出力される。このとき、ガイドメロディもスピーカ570から出力されるようにしてもよい。
[評価機能]
評価装置10の制御部100が制御プログラムを実行することによって実現される評価機能について説明する。なお、以下に説明する評価機能を実現する構成の一部または全部は、ハードウエアによって実現されてもよい。
図2は、本発明の一実施形態における評価機能部の機能構成を示すブロック図である。評価機能部200は、入力音取得部210、ピッチ算出部220、傾き算出部230、及び傾き評価部240を含む。入力音取得部210は伴奏出力部290に接続されている。伴奏出力部290は、歌唱者に指定された歌唱曲に対応する伴奏データを読み出し、信号処理部150を介して、伴奏音をスピーカ570から出力させる。
入力音取得部210は、マイクロフォン560から入力された歌唱音声を示す入力音データを取得する。この例では、伴奏音が出力されている期間におけるマイクロフォン560への入力音を、評価対象の歌唱音声として認識する。なお、入力音取得部210は、記憶部110にバッファされた入力音データを取得するが、記憶部110に1曲全体の入力音データが記憶された後に取得してもよいし、信号処理部150から直接取得してもよい。また、入力音取得部210は、マイクロフォン560へ入力音を示す入力音データを取得する場合に限らず、外部装置への入力音を示す入力音データを、通信部140によりネットワーク経由で取得してもよい。
ピッチ算出部220は、入力音取得部210によって取得された入力音データを解析し、歌唱ピッチ(周波数)の時間的な変化、すなわち歌唱ピッチ波形を算出する。具体的には、歌唱音声の波形のゼロクロスを用いた方法、FFT(Fast Fourier Transform)を用いた方法等、公知の方法で歌唱ピッチ波形が算出される。
傾き算出部230は、ピッチ算出部220が算出した歌唱ピッチの傾き値を算出する。ここで、歌唱ピッチの傾きとは、歌唱ピッチの変化の割合を示す。傾き算出部230が歌唱ピッチから傾き値を算出する方法は、後で詳しく説明する。傾き評価部240は、傾き算出部230が算出した傾き値に基づいて、入力音の評価値を計算する。傾き評価部240が傾き値から評価値を算出する方法については、後で詳しく説明する。
[歌唱評価の例]
上述した評価機能部200による歌唱音声の評価方法について、図3に示す具体的な歌唱ピッチの例を用いて説明する。
図3は、本発明の一実施形態における評価方法において、取得したピッチの一例を示す図である。図3に示す波形は、歌唱の一部における歌唱ピッチ波形の例である。縦軸はピッチを示す。ピッチ方向に100centごとに配置された破線は複数の基準ピッチを示している。横軸は時間の経過を示している。図3に示す波形は、所定時間間隔で取得されたピッチを曲線でつなぐことで得られる。ここで、図3中のS、F、K、Vの記号については後で詳しく説明する。
図4は、本発明の一実施形態における評価方法において、ピッチの傾き値を算出する方法を示す図である。図4に示す波形は図3に示す波形の領域340を拡大した波形である。図3と同様に、図4の縦軸はピッチを示し、横軸は時間の経過を示す。図4に示すように一定の範囲350に含まれるピッチに対して傾きを算出する。範囲350に含まれるピッチに対する傾きが算出されると、時間軸方向に範囲350をずらし、そこでさらに傾きを算出する。範囲350をずらす量は、1サンプルずつであってもよく、複数サンプル単位であってもよい。ここで、範囲350はピッチ変化の傾き評価に適さない区間を除く領域に対して設定されるように制御してもよい。
また、傾き値による評価をより明確にするために、水平部を評価区間から除外してもよい。つまり、傾き評価部240は、歌唱ピッチに基づいて非評価期間を設定し、その非評価期間を除く期間の傾き値に基づいて評価値を計算してもよい。また、図3に示す歌唱ピッチ波形に対してノイズ除去処理を行ってもよい。ノイズ除去処理としては、例えば、移動平均やローパスフィルタなどを用いることができる。また、ピッチの連続性(連続してピッチが得られているかどうか)、累積ピッチ範囲(累積したピッチの上限から下限までの高さが一定以下に収まっているか)、歌唱ピッチの分散値が一定以下であるかどうか、などによって歌唱ピッチ波形の評価対象の妥当性を判断してもよい。
図5は、本発明の一実施形態における評価方法において、ピッチの傾き値を算出する方法を示す図である。図3と同様に、図5の縦軸はピッチを示し、横軸は時間の経過を示す。図5において、プロット361〜366は図4に示す範囲350に含まれるピッチを示す。ここでは、6点の測定ポイントに対して傾きを求める例について説明する。図5に示すように、ピッチの傾き値は範囲350に含まれるピッチに対して、y=ax+bで表される近似直線360に基づいて算出する。近似直線360はプロット361〜366に対して最小二乗法を用いた近似によって求めることができる。近似直線360は最小二乗法に限定されず、その他の統計手法を用いて求めてもよい。例えば、隣接するプロット間の差に基づいてピッチの傾きを算出してもよい。また、複数の隣接するプロット間の差の平均や中央値などからピッチの傾きを算出してもよい。図5では、6点のプロットに対する近似直線360から傾き値(上記式のaの値)を求める方法を例示したが、この方法に限定されない。例えば、7点以上のプロットに対する近似直線から傾き値を求めてもよく、5点以下のプロットに対する近似直線から傾き値を求めてもよい。例えば、隣接する2点のプロットを結ぶ直線から傾き値を求めてもよい。また、隣接する傾き値の移動平均を使用してもよい。
図6は、本発明の一実施形態における評価方法において、ピッチの傾き値の判定基準を示す図である。図6に示す判定基準テーブルは、図1に示す評価基準情報516の一つとして記憶部110に格納されている。図7は、本発明の一実施形態における評価方法において、ピッチの傾き値の判定基準を説明する概念図である。図6及び図7に示すように、近似直線360の傾き値によって6個の異なる判定基準が設けられている。詳細に説明すると、傾き値が0度〜90度の範囲についてみると、判定基準は3つの領域に分かれており、最も傾き値が小さい第1範囲410及び最も傾き値が大きい第2範囲420は「OK」判定エリア、第1範囲410よりも傾き値が大きく第2範囲420よりも傾き値が小さい第3範囲430は「NG」判定エリアである。傾き値が「OK」判定エリアに含まれる場合は、傾き評価部240は第1の計算を行って相対的に高い評価値を算出し、傾き値が「NG」判定エリアに含まれる場合は、傾き評価部240は第2の計算を行って相対的に低い評価値を算出する。また、傾き値が0度〜−90度の範囲では、第1範囲410、第2範囲420、及び第3範囲430に対してx軸に対称に第1範囲412、第2範囲422、及び第3範囲432が設定されている。
上記のように傾き評価部240は各々の傾き値に対して得られた評価値に基づいて、傾き評価による点数を算出する。例えば、算出された評価対象の全ての評価値に対して、OK判定と判断された傾き値の割合を傾き評価による点数としてもよい。また、OK判定が連続する時間(又は回数)やNG判定が連続する時間(又は回数)に応じて評価値を付与、又はボーナスポイントを付与してもよい。例えば、連続OK判定が長いほど高いボーナスポイントを付与してもよい。また、連続NG判定が短いほど高いボーナスポイントを付与してもよい。また、連続OK判定又は連続NG判定が長いほどボーナスポイントの得点を大きくしてもよい。上記とは逆に、OK判定又はNG判定が連続する時間に応じて、減点してもよい。
図6及び図7では、第1範囲410及び412、第2範囲420及び422、第3範囲430及び432のそれぞれがx軸に対称であるが、この例に限定されない。例えば、音高の変化が目立ちやすい低音から高音への変化に対してNG判定エリアが広くなるようにしてもよい。つまり、傾き値がマイナスの値をとる第3範囲432に比べて傾き値がプラスの値をとる第3範囲430の方が範囲が広くなるようにしてもよい。また、NG判定エリアが第3範囲430だけに設けられていてもよい。
図6及び図7では、第1範囲410、412、第2範囲420、422、第3範囲430、432がそれぞれ静的に設定されている、つまり、上記の範囲は固定されている。しかし、上記の範囲を動的に変化させてもよい。例えば、連続OK判定又は連続NG判定の長さに応じて上記の範囲を変化させてもよい。具体的には、連続OK判定の時間が長いほど第1範囲410、412及び第2範囲420、422の範囲が狭くなるようにしてもよい。つまり、上手な歌唱者には難易度を高くするように上記の範囲を調整してもよい。逆に、連続OK判定が一定の時間に達すると、第1範囲410、412及び第2範囲420、422の範囲が広くなるようにしてもよい。つまり、一定期間上手に歌唱した場合にボーナスタイムを設けてもよい。
また、図6及び図7では評価の基準をOK又はNGの2値で評価する例を示したが、この例に限定されない。例えば、第1範囲410と第2範囲420とで異なる評価値を付与してもよく、傾き値による評価をより明確にするために、傾きが小さい第1範囲410を評価対象から除外してもよい。また、第1範囲410を傾き値に応じてさらに細分化し、第1範囲410内で傾き値に応じて異なる評価値を付与してもよい。第2範囲420及び第3範囲430についても、第1範囲410と同様に傾き値に応じて異なる評価値を付与してもよい。もちろん、第1範囲412、第2範囲422、及び第3範囲432についても同様である。
また、傾き値の絶対値が同じ場合であっても、傾き値がプラスの場合とマイナスの場合とで異なる評価値を付与してもよい。例えば、低音から高音への変化は目立ちやすいので、傾き値がプラスの場合のOK判定の評価値を、傾き値がマイナスの場合のOK判定の評価値よりも高くしてもよい。つまり、第1範囲412よりも第1範囲410の評価値を高くし、第2範囲422よりも第2範囲420の評価値を高くしてもよい。また、第3範囲432よりも第3範囲430の評価値を低くしてもよい。
以上のように、本発明の第1実施形態に係る評価装置10によると、ピッチ変化の傾きに基づく歌唱評価を行うことができる。つまり、歌唱すべき音高の変化点付近におけるピッチ変化の傾きによる歌唱の巧拙を判断することができる。また、OK判定エリアである第1範囲410及び第2範囲420の間にNG判定エリアである第3範囲430が設けられていることで、安定した音高の歌唱及び音高を急激に変化させる歌唱技法に対しては高い評価点を付与し、一定の音高を維持できない又は歌唱すべき音高を探し迷いながらの歌唱に対しては低い評価点を付与することができる。したがって、実際の聴取者が感じる歌唱の巧拙を数値化することができる。
〈第2実施形態〉
本発明の第2実施形態における評価装置について、図7及び図8を参照しながら詳細に説明する。第2実施形態に係る評価装置は、歌唱ピッチの音高又は歌唱ピッチの変化の割合に応じて傾き値の評価方法を変化させる。特に、第2実施形態では、歌唱すべきリファレンスデータ(ガイドメロディに対応)が存在し、そのリファレンスデータに基づいて傾き値の評価方法を変化させる。ここで、第2実施形態において、評価装置のハードウェア構成は第1実施形態と同様であるので、ここでは説明を省略する。図8は、本発明の一実施形態における評価機能部の機能構成を示すブロック図である。図8の評価機能部200Aは図2に示す評価機能部200と類似しているが、評価機能部200Aでは伴奏出力部290Aからリファレンスデータが傾き評価部240Aに送信される点において、評価機能部200と相違する。
第2実施形態における評価機能部200Aでは、OK判定によって得られる評価値がリファレンスデータの音高によって異なる。換言すると、第2実施形態において、傾き評価部240Aは、歌唱ピッチに対応するリファレンスデータにおける音高に応じて、リファレンスデータの時間位置に対応する歌唱ピッチの評価値に重み付けをする、ということもできる。つまり、傾き値が同じであってもリファレンスデータの音高によって評価値が異なる。例えば、傾き値が同じ場合であってもリファレンスデータの音高が高い場合は、OK判定によって得られる評価値は相対的に高く設定され、リファレンスデータの音高が高い場合は、OK判定によって得られる評価値は相対的に低く設定される。このようにすることで、歌唱ピッチの維持が難しい低音域及び高音域の重みを高く設定することができ、歌唱ピッチ維持の難易度を評価値に反映することができる。
上記では、リファレンスデータの音高に応じて歌唱ピッチの評価値に重み付けをする例を示したが、この例に限定されない。例えば、リファレンスデータの変化の割合に応じて重み付けをしてもよい。例えば、傾き値が同じ場合であってもリファレンスデータの音高の変化量が大きい場合、OK判定によって得られる評価値は相対的に高く設定されてもよい。一方、傾き値が同じ場合であってもリファレンスデータの音高の変化量が小さい場合、OK判定によって得られる評価値は相対的に低く設定されてもよい。
〈第2実施形態の変形例〉
図9は、本発明の一実施形態の変形例における評価方法において、リファレンスデータの音高に応じた判定を行う例を示す図である。図9に示す2つの判定基準は、(a)甘めの判定基準、及び(b)厳しめの判定基準である。第2実施形態の変形例1における評価機能部200Aでは、リファレンスデータの音高によって、得られた傾き値に適用する判定基準が異なる。換言すると、第2実施形態の変形例において、傾き評価部240Aは、歌唱ピッチに対応するリファレンスデータにおける音高に応じて、リファレンスデータの位置に対応する傾き値の第1範囲、第2範囲、及び第3範囲をそれぞれ調整するということもできる。例えば、リファレンスデータの音高が低い場合及び高い場合は、(b)厳しめの判定基準を適用することで、OK判定エリアである第1範囲410、412及び第2範囲420、422は相対的に狭く設定される。一方、リファレンスデータの音高が上記の低音・高音の中間音の場合は、(a)甘めの判定基準を適用することで、OK判定エリアである第1範囲410、412及び第2範囲420、422は相対的に広く設定される。このようにすることで、歌唱ピッチの維持及び調整が難しい低音域及び高音域と、歌唱ピッチの維持及び調整が比較的容易な中間音域とを、難易度に応じて適正に評価することができる。
上記では、リファレンスデータの音高に応じて歌唱ピッチの傾き値を異なる判定基準で評価する例を示したが、この例に限定されない。例えば、リファレンスデータの変化の割合に応じて傾き値を異なる判定基準で評価してもよい。例えば、歌唱ピッチに対応するリファレンスデータにおいて、リファレンスデータの音高の変化量が大きい場合、(b)厳しめの判定基準を適用してもよい。一方、リファレンスデータにおいて、リファレンスデータの音高の変化量が小さい場合、(a)甘めの判定基準を適用してもよい。
以上のように、本発明の第2実施形態に係る評価装置によると、ピッチ変化の傾きに基づく歌唱評価を行うことができる。また、歌唱ピッチに対応するリファレンスデータの音高又は音高の変化の割合に応じて、評価値への重み付けを変化させる、又はOK判定領域を変化させることで、歌唱の難易度を評価値に反映することができる。
〈第3実施形態〉
本発明の第3実施形態における評価装置について、図10及び図11を参照しながら詳細に説明する。第3実施形態に係る評価装置は、上記の傾き値の評価によってNGと判定された時間の長さ(連続NG時間)の分布に基づいて評価値を算出する。ここで、第3実施形態において、評価装置のハードウェア構成は第1実施形態と同様であるので、ここでは説明を省略する。図10は、本発明の一実施形態における評価機能部の機能構成を示すブロック図である。図10の評価機能部200Bは図2に示す評価機能部200と類似しているが、評価機能部200Bは傾き評価部240の代わりに判定結果積算部250Bを有している点において、評価機能部200と相違する。
判定結果積算部250Bは、傾き値評価部240Bが算出した評価値を積算して度数分布を作製する。具体的には、傾き値評価部240BがNG判定を出した連続時間を積算して度数分布を作製する。図11は、本発明の一実施形態における評価方法において、連続NG時間の度数分布から評価値を算出する例を示す図である。図11の横軸は連続NG時間を示し、縦軸は各連続NG時間における度数を示している。また、図11のグラフ中に示された実線520は評価値が高い歌唱上級者の分布を示し、二点鎖線530は評価値が低い歌唱低級者の分布を示している。歌唱上級者の分布では、度数分布のピークが相対的に連続NG時間が短い位置にある傾向がある。一方、歌唱低級者の分布では、度数分布のピークが相対的に連続NG時間が長い位置にある大きい傾向がある。このように、連続NG時間の分布に基づいて評価値を算出してもよい。
以上のように、本発明の第3実施形態に係る評価装置によると、ピッチ変化の傾きに基づく歌唱評価を行うことができる。また、この例では、連続NG時間が積算された連続NG時間分布に基づいて評価値を算出するため、ノイズなどの局所的なデータの影響を受けにくい評価を行うことができる。
〈第4実施形態〉
本発明の第4実施形態における評価装置について、図12を参照しながら詳細に説明する。第4実施形態に係る評価装置は、歌唱ピッチの傾き値を算出する際に、複数の歌唱ピッチを1つの群としたピッチ群を用いて傾き値を算出する。ここで、第4実施形態において、評価装置のハードウェア構成及び評価機能部の機能構成は第1実施形態と同様であるので、ここでは説明を省略する。
図12は、本発明の一実施形態における評価方法において、複数の歌唱ピッチを含むピッチ群に基づいて傾き値を算出する例を示す図である。上記の実施形態では、単体の歌唱ピッチに基づいて傾き値を算出したが、図12では、複数の歌唱ピッチを含むピッチ群に基づいて傾き値を算出する。図12の縦軸はピッチを示し、横軸は時間の経過を示しており、ピッチ方向に100cent間隔で破線が表示されている。
ここで、ピッチ群440は一定の範囲に含まれる歌唱ピッチ450を含む。図12では、例えば100centのピッチ範囲に含まれる連続性のある歌唱ピッチ450をピッチ群440としている。各々のピッチ群440に対してピッチ群統計値460が求められ、ピッチ群統計値460に対して近似直線470が求められる。ここでは、各々のピッチ群440に含まれる全ての歌唱ピッチの時間及びピッチに対する平均値をピッチ群統計値460とした。求められた近似直線470の傾きに基づいて、ピッチ群440の傾き値を算出する。そして、算出されたピッチ群440の傾き値に基づいて、図6及び図7に示す方法と同様の方法で評価値を算出する。
図12では、固定された100centのピッチ範囲に含まれる歌唱ピッチ450を1つのピッチ群としたが、ピッチ群と判断するためのピッチ範囲は複数の歌唱ピッチ450に合わせて上下に調整されてもよい。ただし、上下方向に隣接する上記のピッチ範囲は互いに重畳しないように設定される。また、上記のピッチ範囲は100centに限定されず、100cent未満であってもよく、100centを上回ってもよい。また、図12では、一定の範囲に含まれる連続した歌唱ピッチを1つのピッチ群としたが、ピッチ群に含まれる歌唱ピッチは必ずしも連続している必要はなく、例えば、ノイズの影響を排除するために、一定数の歌唱ピッチが上記の一定範囲から外れても1つのピッチ群と認識するようにしてもよい。ここでは、一定の範囲に含まれる歌唱ピッチを1つのピッチ群としたが、一定時間毎に歌唱ピッチを区切るようにしてもよい。また、ピッチ群統計値460は平均値に限定されず、中央値などの他の統計値であってもよい。
以上のように、本発明の第4実施形態に係る評価装置によると、ピッチ変化の傾きに基づく歌唱評価を行うことができる。また、この例では、複数の歌唱ピッチを含むピッチ群の統計値に基づいて評価値を算出するため、ノイズなどの局所的なデータの影響を受けにくい評価を行うことができる。
〈第5実施形態〉
本発明の第5実施形態における評価装置について、図13を参照しながら詳細に説明する。第5実施形態に係る評価装置は、歌唱ピッチの傾き値に基づく評価に加え、基準ピッチと歌唱ピッチとの比較、歌唱ピッチの水平な箇所における評価、及び歌唱技法による評価の機能を有する評価装置である。ここで、第5実施形態において、評価装置のハードウェア構成は第1実施形態と同様であるので、ここでは説明を省略する。
図13は、本発明の一実施形態における評価機能部の機能構成を示すブロック図である。図13の評価機能部200Cは図2に示す評価機能部200と類似しているが、評価機能部200Cは特定区間検出部610C、水平評価部620C、ピッチ比較部630C、及び得点計算部640Cを有している点において、評価機能部200と相違する。ピッチ算出部220Cは、算出した歌唱ピッチを特定区間検出部610C、水平評価部620C、及びピッチ比較部630Cに送信する。また、傾き評価部240C、特定区間検出部610C、水平評価部620C、及びピッチ比較部630Cによって算出された各々の評価値は得点計算部640Cに送信される。
ここで、記憶部110に格納された評価基準情報516には、ピッチ変化の傾きに基づいて歌唱評価をするための基準情報の他に、歌唱技法を検出するための歌唱ピッチの変化(歌唱ピッチ波形)を特定するための情報が含まれる。ここで、ビブラート、コブシ、シャクリ、フォールといった歌唱技法であれば、例えば、以下のような歌唱ピッチ波形を示す。
(1)ビブラート:ピッチが細かく(所定周期以下で)高低に変化する。ビブラート検出の具体的な例は、特開2005−107087号公報に開示されている。
(2)コブシ:ピッチが一時的に(所定時間以内で)高くなり、その後、元のピッチに戻る。コブシ検出の具体的な例は、特開2008−268370号公報に開示されている。
(3)シャクリ:ピッチが所定時間かけて高くなり、その後安定する。シャクリ検出の具体的な例は、特開2005−107334号公報に開示されている。
(4)フォール:ピッチが所定時間かけて低くなり、その後、歌唱が途切れる。フォール検出の具体的な例は、特開2008−225115号公報に開示されている。
なお、図3に示す区間Sは「シャクリ」、区間Fは「フォール」、区間Kは「コブシ」、区間Vは「ビブラート」にそれぞれ対応する特定区間である。ここで、評価区間を、区間S、F、K、Vに対応する特定区間以外としてもよい。
また、評価基準情報516には、歌唱ピッチと比較されるべき基準ピッチが規定されている。基準ピッチは、複数のピッチとして規定されている。この例では、基準ピッチは、440Hzを含み、440Hzを基準として100cent間隔で規定されている。なお、楽曲によって基準となるピッチが440Hzからずれている場合、例えば、442Hzである場合には、基準ピッチは、442Hzを基準として100cent間隔で規定されればよい。このずれ量については、例えば、楽曲データにチューン情報として格納されていればよい。
特定区間検出部610Cは、歌唱ピッチ波形を解析し、歌唱音声の入力期間のうち、得点基準情報によって規定された歌唱技法を含む区間(特定区間)を検出する。このとき検出される特定区間は、歌唱技法の種類ごとに対応付けられていてもよい。特定区間検出部610Cによって検出された特定区間における歌唱ピッチは、歌唱技法の評価だけに用いられ、傾き値に基づく評価や下記に説明する評価には用いられないようにする。
水平評価部620Cは、歌唱ピッチ波形を解析し、歌唱音声の入力期間のうち、歌唱ピッチが水平、つまり歌唱ピッチの変動率が一定以下のピッチ群に対して評価を行う。水平評価部620Cは、歌唱ピッチが水平であると判定した領域のピッチ群に対して、その水平の良し悪しを評価する。具体的には、ピッチ群の変動の幅を評価し、水平部におけるピッチの安定性を評価する。例えば、上記のピッチ群における最大値と最小値との差に基づいて評価値を算出してもよい。又は、上記のピッチ群のピッチ分布における標準偏差に基づいて評価値を算出してもよい。
ピッチ比較部630Cは、歌唱音声の入力期間のうち、特定区間検出部610Cにおいて検出された特定区間を除いた区間を、評価区間として設定する。ピッチ比較部630Cは、評価区間における歌唱ピッチ波形、及び基準ピッチに基づいて、歌唱ピッチと基準ピッチとを比較する。比較結果として、例えば、歌唱ピッチ波形と基準ピッチとの不一致度を算出する。ここで、複数の基準ピッチが100cent間隔で存在する。そのため、複数の基準ピッチのうち、歌唱ピッチに最も近い基準ピッチが歌唱ピッチの比較対象として選択される。歌唱ピッチ波形と基準ピッチとの差が大きいほど、不一致度が高くなるように算出される。例えば、歌唱ピッチ波形の各サンプルにおける歌唱ピッチと基準ピッチとの差分を評価区間において加算し、加算値を評価区間のサンプル数で除算することによって、不一致度が算出される。
得点計算部640Cは、上記のように、傾き評価部240C、特定区間検出部610C、水平評価部620C、及びピッチ比較部630Cによって算出された各々の評価値に基づいて総合得点を計算する。得点計算部640Cによって計算された総合得点は、表示部130(図1参照)によって表示される。ここで、表示部130は得点計算部640Cによって計算された総合得点だけでなく、傾き評価部240C、特定区間検出部610C、水平評価部620C、及びピッチ比較部630Cによって算出された各々の評価値を個別に表示してもよい。
以上のように、本発明の第5実施形態に係る評価装置によると、リファレンスデータに依存しない歌唱評価を行うことができる。また、この例では、歌唱ピッチの傾き値基づく評価だけではなく、基準ピッチに対する歌唱ピッチの正確さ及び水平部における安定性に基づく評価を行うことができ、歌唱技法による特殊なピッチの変動が他の評価に影響を及ぼさないようにすることができる。
入力音取得部210によって取得される入力音データが示す音は、歌唱者による音声に限られず、歌唱合成による音声であってもよいし、楽器音であってもよい。楽器音である場合には、単音演奏であることが望ましい。楽器音の場合は、スラー記号がついた音符を演奏したときの巧拙が評価できる。弾くべき音程の変化部のピッチ傾きにより、スラーで弾いたか否かを判定することができる。リファレンスにスラー情報がある場合は、その情報と比較し、楽譜通りに演奏したかを評価する事ができる。例えば、バイオリンなどの擦弦楽器の演奏において、スラー記号がついた音符を演奏する際に弓を返さずに演奏する方法がある。また、トランペットなどの管弦楽器の演奏において、スラー記号がついた音符を演奏する際にタンギングせずに別の音高に推移する演奏方法がある。これらの演奏方法においては、異なる音高間を推移する間のピッチが観測される。第5実施形態に係る評価装置によれば、これらの演奏方法における異なる音高間の推移を評価することができる。
なお、本発明は上記の実施形態に限られたものではなく、趣旨を逸脱しない範囲で適宜変更することが可能である。
10:評価装置、 100:制御部、 110:記憶部、 120:操作部、 130:表示部、 140:通信部、 150:信号処理部、 200:評価機能部、 210:入力音取得部、 220:ピッチ算出部、 230:傾き算出部、 240:傾き評価部、 250:判定結果積算部、 290:伴奏出力部、 360:近似直線、 361、362、363、364、365、366:プロット、 410、412:第1範囲、 420、422:第2範囲、 430、432:第3範囲、 440:ピッチ群、 450:歌唱ピッチ、 460:ピッチ群統計値、 470:近似直線、 502:第1ノート、 504:第2ノート、 506:第3ノート、 520:実線、 530:二点鎖線、 560:マイクロフォン、 570:スピーカ、 610:特定区間検出部、 620:水平評価部、 630:ピッチ比較部、 640:得点計算部

Claims (9)

  1. 入力音を取得する入力音取得部と、
    前記入力音取得部が取得した前記入力音のピッチを算出するピッチ算出部と、
    前記ピッチ算出部が算出した前記ピッチの変化の割合を示す傾き値を算出する傾き算出部と、
    前記傾き値に基づいて、前記入力音の評価値を計算する傾き評価部と、
    を備え、
    前記評価部は、前記傾き値の絶対値が第1範囲及び前記第1範囲よりも前記傾き値の絶対値が大きい第2範囲である場合に第1の計算を行い、前記第1範囲よりも前記傾き値の絶対値が大きく、前記第2範囲よりも前記傾き値の絶対値が小さい第3範囲である場合に第2の計算を行うことを特徴とする評価装置。
  2. 入力音を取得し、
    前記入力音のピッチを算出し、
    前記ピッチの変化の割合を示す傾き値を算出し、
    前記傾き値に基づいて、前記入力音の評価値を計算し、
    前記傾き値の絶対値が第1範囲及び前記第1範囲よりも前記傾き値の絶対値が大きい第2範囲である場合に第1の計算を行い、前記第1範囲よりも前記傾き値の絶対値が大きく、前記第2範囲よりも前記傾き値の絶対値が小さい第3範囲である場合に第2の計算を行うことを特徴とする評価方法。
  3. 前記評価値の計算において、前記傾き値が所定期間において前記第1範囲又は前記第2範囲に含まれる回数、又は前記第3範囲に含まれる回数に応じて、前記評価値に加点又は減点をすることを特徴とする請求項に記載の評価方法。
  4. 前記傾き値の算出において、複数の前記ピッチから得られる統計値に基づいて前記傾き値を算出することを特徴とする請求項2又は3に記載の評価方法。
  5. 前記評価値の計算において、前記入力音に対応するリファレンスデータにおける音高の変化の割合に応じて、前記リファレンスデータの位置に対応する前記入力音の前記評価値に重み付けをすることを特徴とする請求項乃至のいずれか一に記載の評価方法。
  6. 前記評価値の計算において、前記入力音に対応するリファレンスデータにおける音高の変化の割合に応じて、前記リファレンスデータの位置に対応する前記傾き値の前記第1範囲、前記第2範囲、及び前記第3範囲をそれぞれ調整することを特徴とする請求項又はに記載の評価方法。
  7. 前記評価値の計算において、前記傾き算出部が算出した前記傾き値が所定期間において前記第1範囲又は前記第2範囲に含まれる回数、又は前記第3範囲に含まれる回数に応じて、以降の前記第1範囲、前記第2範囲、及び前記第3範囲をそれぞれ調整することを特徴とする請求項又はに記載の評価方法。
  8. 前記評価値の計算において、前記ピッチに基づいて非評価期間を設定し、前記非評価期間を除く期間の前記傾き値に基づいて、前記評価値を計算することを特徴とする請求項乃至のいずれか一に記載の評価方法。
  9. 入力音を取得し、
    前記入力音のピッチを算出し、
    前記ピッチの変化の割合を示す傾き値を算出し、
    前記傾き値に基づいて、前記入力音の評価値を計算し、
    前記傾き値の絶対値が第1範囲及び前記第1範囲よりも前記傾き値の絶対値が大きい第2範囲である場合に第1の計算を行い、前記第1範囲よりも前記傾き値の絶対値が大きく、前記第2範囲よりも前記傾き値の絶対値が小さい第3範囲である場合に第2の計算を行うことをコンピュータに実行させるためのプログラム。

JP2015202099A 2015-10-13 2015-10-13 評価装置 Active JP6638305B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2015202099A JP6638305B2 (ja) 2015-10-13 2015-10-13 評価装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2015202099A JP6638305B2 (ja) 2015-10-13 2015-10-13 評価装置

Publications (2)

Publication Number Publication Date
JP2017075991A JP2017075991A (ja) 2017-04-20
JP6638305B2 true JP6638305B2 (ja) 2020-01-29

Family

ID=58551208

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2015202099A Active JP6638305B2 (ja) 2015-10-13 2015-10-13 評価装置

Country Status (1)

Country Link
JP (1) JP6638305B2 (ja)

Also Published As

Publication number Publication date
JP2017075991A (ja) 2017-04-20

Similar Documents

Publication Publication Date Title
WO2017082061A1 (ja) 調律推定装置、評価装置、およびデータ処理装置
JP4767691B2 (ja) テンポ検出装置、コード名検出装置及びプログラム
JP6627482B2 (ja) 技法判定装置
US8859872B2 (en) Method for giving feedback on a musical performance
CN101123085A (zh) 和弦名检测装置以及和弦名检测用程序
US10643638B2 (en) Technique determination device and recording medium
JP6759545B2 (ja) 評価装置およびプログラム
JP6690181B2 (ja) 楽音評価装置及び評価基準生成装置
JP4910854B2 (ja) こぶし検出装置、こぶし検出方法及びプログラム
JP5005445B2 (ja) コード名検出装置及びコード名検出用プログラム
JP6638305B2 (ja) 評価装置
JP2008268369A (ja) ビブラート検出装置、ビブラート評価装置、ビブラート検出方法、ビブラート評価方法およびプログラム
JP5585320B2 (ja) 歌唱音声評価装置
JP4855980B2 (ja) カラオケ装置、歌唱評価方法およびプログラム
JP4910855B2 (ja) リファレンスデータ編集装置、こぶし評価装置、リファレンスデータ編集方法、こぶし評価方法及びプログラム
JP5618743B2 (ja) 歌唱音声評価装置
JP5200144B2 (ja) カラオケ装置
JP2016180965A (ja) 評価装置およびプログラム
JP6690446B2 (ja) 音響解析装置および音響解析方法
JP4367156B2 (ja) 調律装置及びそのプログラム
JP6175034B2 (ja) 歌唱評価装置
JP2017173640A (ja) 演奏分析装置及びプログラム
WO2016148256A1 (ja) 評価装置およびプログラム
JP2016173562A (ja) 評価装置およびプログラム
JP2018146929A (ja) 評価装置、評価方法及びプログラム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20180921

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20190708

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20190716

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20190904

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20191001

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20191029

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20191126

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20191209

R151 Written notification of patent or utility model registration

Ref document number: 6638305

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R151