JP2018146933A - Evaluation device, evaluation method, and program - Google Patents
Evaluation device, evaluation method, and program Download PDFInfo
- Publication number
- JP2018146933A JP2018146933A JP2017044931A JP2017044931A JP2018146933A JP 2018146933 A JP2018146933 A JP 2018146933A JP 2017044931 A JP2017044931 A JP 2017044931A JP 2017044931 A JP2017044931 A JP 2017044931A JP 2018146933 A JP2018146933 A JP 2018146933A
- Authority
- JP
- Japan
- Prior art keywords
- predetermined
- pitch
- section
- pitch data
- predetermined section
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Abstract
Description
本発明は、音を評価する技術に関する。 The present invention relates to a technique for evaluating sound.
演奏音や歌唱音声を評価する評価装置には、入力音を解析して評価する機能が備えられている。音の評価には様々な方法が用いられる。例えば、特許文献1には、リファレンスデータを実際の歌唱に近くなるように加工し、歌唱音声を加工されたリファレンスデータと比較し、歌唱音声を採点するカラオケ装置が開示されている。また、特許文献2には、所定の評価区間において入力音のピッチと基準ピッチを比較して、比較結果に基づいて入力音の評価を行う評価装置が開示されている。 An evaluation device that evaluates performance sounds and singing voices has a function of analyzing and evaluating input sounds. Various methods are used for sound evaluation. For example, Patent Literature 1 discloses a karaoke device that processes reference data so that it is close to an actual song, compares the singing voice with the processed reference data, and scores the singing voice. Patent Document 2 discloses an evaluation device that compares the pitch of an input sound with a reference pitch in a predetermined evaluation section and evaluates the input sound based on the comparison result.
しかしながら、特許文献1及び特許文献2の技術では、所定の期間に入力される入力音に対するまとまった評価はできるものの、決められた所定の音高に対する評価はできない。 However, with the techniques of Patent Document 1 and Patent Document 2, although it is possible to collectively evaluate the input sound input during a predetermined period, it is not possible to evaluate a predetermined predetermined pitch.
本発明の課題の一つは、演奏音や歌唱音声などの種々の入力音における、決められた連続する複数の音高に対する精度の高い評価を行うことにある。 One of the objects of the present invention is to perform highly accurate evaluation on a plurality of predetermined continuous pitches in various input sounds such as performance sounds and singing voices.
本発明の一実施形態によると、コンピュータに、入力音を取得し、前記入力音に基づいてピッチデータを時系列に取得し、取得した前記ピッチデータのうち、所定区間のピッチデータを所定の時間ごとに蓄積し順次更新し、前記所定区間のピッチデータと所定のリファレンス音情報とを比較し、比較結果に基づいて前記所定区間のピッチデータの評価値を算出し、前記所定区間のピッチデータに対応する期間の入力音に基づいて、前記リファレンス音情報を切り替えるかどうかを判定し、前記リファレンス音情報を切り替える場合、前記所定区間のピッチデータと前記所定のリファレンス音情報とは異なる所定のリファレンス音情報とを比較し、比較結果に基づいて前記所定区間のピッチデータの評価値を算出すること、を実行させるためのプログラムが提供される。 According to an embodiment of the present invention, a computer acquires an input sound, acquires pitch data in time series based on the input sound, and among the acquired pitch data, pitch data of a predetermined section is determined for a predetermined time. Each time it is accumulated and updated sequentially, the pitch data of the predetermined section is compared with predetermined reference sound information, an evaluation value of the pitch data of the predetermined section is calculated based on the comparison result, and the pitch data of the predetermined section is calculated. When determining whether to switch the reference sound information based on an input sound in a corresponding period and switching the reference sound information, a predetermined reference sound different from the pitch data of the predetermined section and the predetermined reference sound information Comparing the information and calculating the evaluation value of the pitch data of the predetermined section based on the comparison result Program is provided.
前記リファレンス音情報を切り替えるかどうかを判定することは、前記所定区間のピッチデータに基づいて、前記リファレンス音情報を切り替えるかどうか判定すること、であってもよい。 Determining whether to switch the reference sound information may be determining whether to switch the reference sound information based on pitch data of the predetermined section.
前記リファレンス音情報を切り替えるかどうかを判定することは、前記所定区間の音量データに基づいて、前記リファレンス音情報を切り替えるかどうか判定すること、であってもよい。 Determining whether to switch the reference sound information may be determining whether to switch the reference sound information based on volume data of the predetermined section.
前記所定区間の入力音に基づいて、前記所定区間における、前記所定のリファレンス音情報との比較対象となる区間を特定すること、を前記コンピュータに実行させるようにしてもよい。 The computer may be configured to identify a section to be compared with the predetermined reference sound information in the predetermined section based on the input sound of the predetermined section.
前記所定区間のピッチデータの評価値を算出することは、前記所定区間における代表ピッチを特定し、前記代表ピッチと前記所定のリファレンス音情報のピッチと比較して、前記所定区間のピッチデータの評価値を算出すること、であってもよい。 The calculation of the evaluation value of the pitch data of the predetermined section specifies the representative pitch in the predetermined section, and compares the representative pitch with the pitch of the predetermined reference sound information to evaluate the pitch data of the predetermined section. It may be to calculate a value.
前記所定区間のピッチデータの評価値を算出することは、前記所定区間におけるピッチデータが前記所定のリファレンス音情報に対応するピッチを基準とした所定のピッチ範囲内であるか否かに基づいて、前記所定区間のピッチデータの評価値を算出すること、であってもよい。 The evaluation value of the pitch data in the predetermined section is calculated based on whether the pitch data in the predetermined section is within a predetermined pitch range based on a pitch corresponding to the predetermined reference sound information. The evaluation value of the pitch data of the predetermined section may be calculated.
前記所定区間のピッチデータの評価値を算出することは、前記所定区間におけるピッチデータの度数分布に基づいて、前記所定区間のピッチデータの評価値を算出すること、であってもよい。 The evaluation value of the pitch data in the predetermined section may be calculated based on the frequency distribution of the pitch data in the predetermined section.
本発明の一実施形態によると、入力音を取得する入力音取得部と、前記入力音に基づいてピッチデータを時系列に取得し、取得した前記ピッチデータのうち、所定区間のピッチデータを所定の時間ごとに蓄積し順次更新する特徴量取得部と、前記所定区間のピッチデータと所定のリファレンス音情報とを比較し、比較結果に基づいて前記所定区間のピッチデータの評価値を算出する評価部と、前記所定区間のピッチデータに対応する期間の入力音に基づいて、前記リファレンス音情報を切り替えるかどうかを判定する切り替え判定部と、を備え、前記切り替え判定部が前記リファレンス音情報を切り替えると判定する場合、前記評価部は、前記所定区間のピッチデータと前記所定のリファレンス音情報とは異なる所定のリファレンス音情報とを比較し、比較結果に基づいて前記所定区間のピッチデータの評価値を算出する、評価装置が提供される。 According to an embodiment of the present invention, an input sound acquisition unit that acquires an input sound, and pitch data is acquired in time series based on the input sound, and pitch data in a predetermined section is acquired from the acquired pitch data. A feature amount acquisition unit that accumulates and sequentially updates each time, and an evaluation that compares the pitch data of the predetermined section with predetermined reference sound information and calculates an evaluation value of the pitch data of the predetermined section based on the comparison result And a switching determination unit that determines whether to switch the reference sound information based on an input sound in a period corresponding to the pitch data of the predetermined section, and the switching determination unit switches the reference sound information When the determination unit determines that the predetermined reference sound information different from the pitch data of the predetermined section and the predetermined reference sound information, Comparison based on the comparison result calculates the evaluation value of the pitch data of the predetermined section, the evaluation device is provided.
本発明の一実施形態によると、入力音を取得し、前記入力音に基づいてピッチデータを時系列に取得し、取得した前記ピッチデータのうち、所定区間のピッチデータを所定の時間ごとに蓄積し順次更新し、前記所定区間のピッチデータと所定のリファレンス音情報とを比較し、比較結果に基づいて前記所定区間のピッチデータの評価値を算出し、前記所定区間のピッチデータに対応する期間の入力音に基づいて、前記リファレンス音情報を切り替えるかどうかを判定し、前記リファレンス音情報を切り替える場合、前記所定区間のピッチデータと前記所定のリファレンス音情報とは異なる所定のリファレンス音情報とを比較し、比較結果に基づいて前記所定区間のピッチデータの評価値を算出すること、を含む、評価方法が提供される。 According to an embodiment of the present invention, an input sound is acquired, pitch data is acquired in time series based on the input sound, and pitch data of a predetermined section is accumulated at predetermined intervals among the acquired pitch data. And sequentially updating, comparing the pitch data of the predetermined section with predetermined reference sound information, calculating an evaluation value of the pitch data of the predetermined section based on the comparison result, and a period corresponding to the pitch data of the predetermined section It is determined whether to switch the reference sound information based on the input sound, and when the reference sound information is switched, the pitch data of the predetermined section and predetermined reference sound information different from the predetermined reference sound information are obtained. Comparing and calculating an evaluation value of the pitch data of the predetermined section based on the comparison result is provided.
本発明の一実施形態によれば、演奏音や歌唱音声などの種々の入力音について決められた連続する複数の音高に対する精度の高い評価を行うことが可能になる。 According to an embodiment of the present invention, it is possible to perform a highly accurate evaluation on a plurality of continuous pitches determined for various input sounds such as performance sounds and singing sounds.
以下、本発明の一実施形態における評価装置について、図面を参照しながら詳細に説明する。以下に示す実施形態は本発明の実施形態の一例であって、本発明はこれらの実施形態に限定されるものではない。 Hereinafter, an evaluation apparatus according to an embodiment of the present invention will be described in detail with reference to the drawings. The following embodiments are examples of the embodiments of the present invention, and the present invention is not limited to these embodiments.
本発明の一実施形態における評価装置について、図面を参照しながら詳細に説明する。本発明の一実施形態に係る評価装置は、演奏者によって演奏された楽器の入力音や歌唱者の歌唱音声などの種々の入力音を評価する機能を備えた装置である。この評価装置は、入力音のピッチデータを時系列に取得し、取得したピッチデータにおける所定区間のピッチデータを蓄積し、所定時間ごとに該所定区間のピッチデータを順次更新する。そして、当該評価装置は、ピッチデータと所定のリファレンス音情報とを比較し、比較結果に基づいて該所定区間のピッチデータの評価値を算出するが、このとき、該所定区間のピッチデータに対応する期間の入力音に基づいて、比較対象とするべきリファレンス音情報を切り替えるかどうかを判定し、リファレンス音情報を切り替える場合、該所定のリファレンス音情報とは異なる別の所定のリファレンス音情報と該所定区間のピッチデータとを比較し、比較結果に基づいて該所定区間のピッチデータの評価行う。 An evaluation apparatus according to an embodiment of the present invention will be described in detail with reference to the drawings. An evaluation apparatus according to an embodiment of the present invention is an apparatus having a function of evaluating various input sounds such as an input sound of a musical instrument played by a performer and a singing voice of a singer. This evaluation device acquires pitch data of input sound in time series, accumulates pitch data of a predetermined section in the acquired pitch data, and sequentially updates the pitch data of the predetermined section every predetermined time. Then, the evaluation device compares the pitch data with predetermined reference sound information, and calculates an evaluation value of the pitch data of the predetermined section based on the comparison result. At this time, it corresponds to the pitch data of the predetermined section. When determining whether to switch the reference sound information to be compared based on the input sound of the period to be compared, and switching the reference sound information, the predetermined reference sound information different from the predetermined reference sound information and the The pitch data of a predetermined section is compared, and the pitch data of the predetermined section is evaluated based on the comparison result.
[ハードウエア]
図1は、本発明の一実施形態における評価装置10の構成を示すブロック図である。評価装置10は、評価装置10は、制御部11、記憶部13、表示部15、および信号処理部17を備える。信号処理部17には、音入力部(例えば、マイクロフォン)19が接続されている。また、評価装置10は、任意で操作部21及び通信部23を備えてもよい。これらの各構成は、バス25を介して相互に接続されている。尚、以下では、本発明の一実施形態に係る評価装置10が、演奏者によって演奏された楽器の入力音を評価する例を説明する。
[Hardware]
FIG. 1 is a block diagram showing a configuration of an
制御部11は、CPUなどの演算処理回路を含む。制御部11は、記憶部13に記憶された制御プログラム13aをCPUにより実行して、各種機能を評価装置10において実現させる。実現される機能には、演奏者に演奏による楽器の入力音の評価機能が含まれる。また、制御部11は、入力音をFIFO(First In, First Out)に保存する入力音記憶部11aを含む。入力音記憶部11aはFIFOメモリである。
The
記憶部13は、不揮発性メモリ、ハードディスク等の記憶装置である。記憶部13は、評価機能を実現するための制御プログラム13aを記憶する。制御プログラム13aは、磁気記録媒体、光記録媒体、光磁気記録媒体、半導体メモリなどのコンピュータ読み取り可能な記録媒体に記憶した状態で提供されてもよい。この場合には、評価装置10は、記録媒体を読み取る装置を備えていればよい。また、制御プログラム13aは、インターネット等のネットワーク経由でダウンロードされてもよい。また、記憶部13は、リファレンス音情報13bを記憶する。リファレンス音情報13bは、入力音の評価の基準として用いられる基準音情報であり、リファレンス音のピッチ情報を含む。
The
表示部15は、液晶ディスプレイ、有機ELディスプレイ等の表示装置であり、制御部11による制御に基づいて演奏者による入力音に対する評価を表す画面が表示される。
The
信号処理部17は、A/Dコンバータ等を含む。演奏者によって演奏された楽器の入力音は、音入力部19において電気信号に変換されて信号処理部17に入力され、信号処理部21においてA/D変換されて制御部11に出力される。
The signal processing unit 17 includes an A / D converter and the like. The input sound of the musical instrument played by the performer is converted into an electrical signal by the
操作部21は、操作パネルおよびリモコンなどに設けられた操作ボタン、キーボード、マウスなどの装置であり、入力された操作に応じた信号を制御部11に出力する。評価装置10の使用者は、評価対象になる入力音に対応するリファレンス音を操作部21によって指定してもよい。通信部23は、制御部11の制御に基づいて、インターネットやLANなどの通信回線と接続して、サーバ等の外部装置と情報の送受信を行う。なお、記憶部13の機能は、通信部23において通信可能な外部装置で実現されてもよい。
The
[評価機能]
評価装置10の制御部11が記憶部13に記憶された制御プログラム13aを実行することによって実現される評価機能について説明する。なお、以下に説明する評価機能を実現する構成の一部または全部は、ハードウエアによって実現されてもよい。
[Evaluation function]
An evaluation function realized when the
図2は、本発明の一実施形態における評価機能100の構成を示すブロック図である。図2を参照すると、評価機能100は、入力音取得部103、特徴量取得部105、有効区間特定部107、切り替え判定部109及び評価部111を含む。尚、評価機能100において、有効区間特定部107は省略されてもよい。
FIG. 2 is a block diagram showing the configuration of the
図3は、図2に示した、本発明の一実施形態における評価機能100の構成によって実行される、入力音の評価方法の流れを示したフローチャートである。図2及び図3を参照して、本発明の一実施形態における評価機能100の構成によって実行される、入力音の評価方法の一例を簡単に説明する。
FIG. 3 is a flowchart showing the flow of the input sound evaluation method executed by the configuration of the
まず、入力音取得部103によって入力音が取得される(S1)。次に、特徴量取得部105によって、取得された入力音に基づいて特徴量が取得され(S2)、FIFOに保存される。FIFOに保存された所定区間の特徴量に基づいて、有効区間特定部107によって、該所定区間における有効区間が特定される(S3)。即ち、該所定区間に有効区間が存在しているか否か判定される。有効区間が特定されない場合、後述するS8に進む。但し、評価機能100において有効区間特定部107が省略される場合、S3は省略され、S2において特徴量が取得された後は、後述するS4に進む。有効区間が特定(S3)された場合、又は特徴量が取得(S2)された後、切り替え判定部109によって、リファレンス音情報を切り替えるかどうか判定する(S4)。リファレンス音情報を切り替える場合は、評価部111は、リファレンス音情報を別のリファレンス音情報と切り替えて(S5)、所定区間のピッチデータと切り替えられたリファレンス音情報とを比較して所定区間のピッチデータに対する評価値を算出する(S6)。リファレンス音情報を切り替えない場合は、評価部111は、リファレンス音情報を切り替えることなく、所定区間のピッチデータと現在のリファレンス音情報とを比較して所定区間のピッチデータに対する評価値を算出する(S6)。評価値が算出されると、全ての入力音に対する評価が終了したか否かが判定される(S7)。全ての入力音に対する評価が終了していない場合、次の所定区間における有効区間の特定(S3)に進む。有効区間特定部107が省略される場合、次の所定区間におけるピッチデータの評価の比較対象となるリファレンス音情報を切り替えるかどうかの判定(S4)に進む。最初の入力音の取得から一定時間経過後、全ての入力音に対する評価が終了してもよく、評価装置10の使用者による操作で終了してもよい。
First, an input sound is acquired by the input sound acquisition unit 103 (S1). Next, the feature
以下、本発明の一実施形態に係る評価機能100における、入力音取得部103、特徴量取得部105、有効区間特定部107、切り替え判定部109及び評価部111について説明する。
Hereinafter, the input
入力音取得部103は、音入力部19から入力された入力音を取得する。ここで、入力音取得部103によって取得された入力音は、信号処理部17によってデジタル化されている。なお、入力音取得部103は、入力音を信号処理部17から直接取得するが、いったん記憶部13に記憶された入力音を取得するようにしてもよい。また、入力音取得部103は、音入力部19への入力音を取得する場合に限らず、外部装置へのデジタル化された入力音を、通信部23によりネットワーク経由で取得してもよい。本実施形態においては、入力音取得部103は、順次入力される入力音を、特徴量取得部105に順次出力する。
The input
特徴量取得部105は、入力音取得部103によって取得された入力音から、入力音の特徴量を時系列に検出する。入力音の特徴量は、入力音のピッチを含む。特徴量取得部105は、フレーム(所定期間で区切られたデータサンプル)ごとに入力音が示す音声信号の波形が負から正に変化する際のゼロクロスを検出し、そのゼロクロスの時間間隔を測定することによって入力音のピッチ(周波数)を特定する。このとき、この音声信号から、ローパスフィルタによりノイズ成分となる高域成分をカットしたり、ハイパスフィルタにより直流成分をカットしたりしておいてもよい。また、特徴量取得部105は、入力音にFFT(Fast Fourier Transform)を施して得られるスペクトルから入力音のピッチを特定してもよい。このようにして検出したピッチを示すピッチデータの所定区間のデータがFIFOに順次保存される。FIFOにおけるバッファサイズ、つまり該所定区間の長さは、特に限定されず任意であるが、例えば、直近〜数百msecであってもよい。
The feature
また、特徴量取得部105は、入力音の特徴量として、入力音の音量を検出してもよい。特徴量取得部105は、入力音取得部103によって取得された入力音から、入力音の音量を時系列に検出する。特徴量取得部105は、入力音に基づいて、入力音の音量の時間的な変化(音量波形)を検出する。特徴量取得部105は、入力音が示す音声信号の振幅に基づいて音量を検出する。特徴量取得部105は、検出した入力音の音量を示す音量データをピッチデータに関連付けて所定区間ごとにFIFOに保存する。
The feature
有効区間特定部107は、特徴量取得部105によって取得され、FIFOに保存された、入力音の所定区間の特徴量に基づいて、該所定区間における有効区間を特定する。有効区間特定部107は、特徴量取得部105によって取得された特徴量のうち、ピッチデータに基づいて、所定区間における有効区間を特定する。しかしながら、有効区間特定部107は、特徴量取得部105によって取得された特徴量のうち、音量データに基づいて、所定区間における有効区間を特定してもよい。また、有効区間特定部107は、ピッチデータ及び音量データに基づいて、所定区間における有効区間を特定してもよい。ここで、有効区間とは、所定区間における、所定のリファレンス音情報との比較対象となるピッチデータに対応する区間を意味する。本実施形態では、有孔区間特定部107が、特徴量取得部105によって取得され、FIFOに保存された、所定区間のピッチデータに基づいて、該所定区間における有効区間を特定する一例を説明する。
The effective
有効区間特定部107は、特徴量取得部105からFIFOに保存された所定区間のピッチデータを順次取得し、取得した所定区間にピッチデータに基づいて、該所定区間における有効区間を特定する。例えば、有効区間特定部107は、所定区間のピッチの線形近似曲線の傾きの絶対値に基づいて、該所定区間における有効区間を特定することができる。
The effective
図4Aは、有効区間特定部107による、所定区間における有効区間特定の概念の一例を説明するための図である。図4Aは、所定区間におけるピッチデータの時系列の変動を示している。図4Aにおいて、所定区間はt0〜tiとする。有効区間特定部107は、所定区間t0〜tiのピッチデータを取得すると、取得したピッチデータにおける各ピッチの線形近似を行い、線形近似曲線の傾きを求める。有効区間特定部107は、所定区間t0〜tiにおいて、ピッチの線形近似曲線の傾きの絶対値が所定の閾値未満である区間を有効区間と特定する。所定の閾値は、任意であり、評価装置10の使用者によって設定されてもよい。図4Aでは、tb〜tdを有効区間として示しており、有効区間tb〜tdにおけるピッチの線形近似曲線の傾きの絶対値は、所定の閾値未満である。例えば、所定区間t0〜tiにおける有効区間tb〜tdにおいて、tbにおけるピッチの線形近似曲線Bの傾きの絶対値、tcにおけるピッチの線形近似曲線Cの傾きの絶対値、及びtdにおけるピッチの線形近似曲線Dの傾きの絶対値は、所定の閾値未満である。一方、所定区間t0〜tiにおける有効区間tb〜tdを除いた区間であるt0〜tb区間及びtd〜ti区間におけるピッチの線形近似曲線の傾きの絶対値、例えば、taにおける線形近似曲線Aの傾きの絶対値、及びteにおける線形近似曲線の傾きの絶対値は、該所定の閾値以上である。
FIG. 4A is a diagram for explaining an example of a concept of specifying an effective section in a predetermined section by the effective
以上では、有効区間特定部107が、所定区間におけるピッチの線形近似曲線の傾きの絶対値に基づいて該所定区間における有効区間を特定する方法を説明したが、所定区間における有効区間の特定は、所定区間におけるピッチの線形近似曲線の傾きの絶対値に基づく特定方法に限定されるわけではない。例えば、有効区間特定部107は、所定区間におけるピッチの分散に基づいて、該所定区間における有効区間を特定することができる。
In the above, the method in which the effective
有効区間特定部107は、所定区間t0〜tiのピッチデータを取得すると、取得したピッチデータの分散値を算出する。算出した分散値が所定値以上である場合、有効区間特定部107は、所定区間t0〜tiに有効区間は存在しないと判定する。一方、算出した分散値が所定値未満である場合、有効区間特定部107は、所定区間t0〜tiに有効区間が存在すると判定する。尚、ここで所定値は、任意であり、評価装置10の使用者が設定することもできる。
When obtaining the pitch data of the predetermined sections t0 to ti, the valid
所定区間t0〜tiに有効区間が存在する場合、有効区間特定部107は、所定区間t0〜tiのピッチデータに基づき、所定区間t0〜tiにおける有効区間を特定する。有効区間特定部107は、所定区間t0〜tiにおいて、所定の閾値以上の頻度を有するピッチ範囲が存在する場合、所定の閾値以上の頻度を有するピッチ範囲に存在しているピッチに対応する区間であり、且つ該ピッチ範囲に存在しているピッチが所定期間連続している区間を有効区間と特定する。
When there is an effective section in the predetermined section t0 to ti, the effective
図4Bは、有効区間特定部107による、所定区間における有効区間特定の概念の別の一例を説明するための図である。図4B(a)は、所定区間におけるピッチの頻度を示し、図4B(b)は該所定区間におけるピッチデータの時系列の変動を示している。図4B(a)に示すように、所定区間t0〜tiのピッチデータにおける各ピッチは、ピッチPa〜ピッチPb、ピッチPb〜ピッチPc、ピッチPc〜ピッチPd、ピッチPd〜ピッチPe、ピッチPe〜ピッチPf、ピッチPf〜ピッチPg、ピッチPf〜ピッチPh、ピッチPh〜ピッチPiのピッチ範囲に存在する。尚、各ピッチ範囲は、任意に設定することができ、各ピッチ範囲におけるピッチは、重複していてもよく、重複していなくてもよい。有効区間特定部107は、所定区間t0〜tiにおいて、所定の閾値Va以上の頻度を有するピッチ範囲を特定する。図4B(b)に示すように、ピッチPf〜ピッチPgのピッチ範囲の頻度が所定の閾値Va以上である。有効区間特定部107は、ピッチPf〜ピッチPgのピッチ範囲に存在しているピッチに対応し、且つ、ピッチPf〜ピッチPgのピッチ範囲に対応するピッチが所定期間連続する区間を有効区間と特定する。例えば、図4B(b)に示すように、ピッチPf〜ピッチPgのピッチ範囲に対応するピッチが、tx1〜tx2の区間で連続している場合、有効区間特定部107は、所定区間t0〜tiにおいてtx1〜tx2の区間を有効区間と特定する。
FIG. 4B is a diagram for explaining another example of the concept of specifying the effective section in the predetermined section by the effective
以上に説明したように、有効区間特定部107は、特徴量取得部105から、FIFOに保存された所定区間のピッチデータを順次取得し、取得した所定区間のピッチデータに基づいて、以上に述べたように該所定区間における有効区間を順次特定する。有効区間特定部107は、該所定区間において有効区間を特定すると、該所定区間における有効区間を示す情報を評価部111に伝達する。また、該所定区間において、有効区間が存在しない場合は、該所定区間が有効区間を含まないことを示す情報を評価部111に伝達する。尚、所定区間における有効区間の特定方法は、以上に述べた方法に限定されるわけではない。また、上述したように、本発明の一実施形態に係る評価機能100において、有効区間判定部107は省略されてもよい。
As described above, the valid
切り替え判定部109は、後述する評価部111において、所定区間のピッチデータの評価値を算出する際、該所定区間のピッチデータの比較対象となるリファレンス音情報を切り替えるか否か判定する。複数の入力音が連続するフレーズの評価を行う際、入力音が切り替わると、評価部111は、切り替わった入力音の比較対象となるリファレンス音情報を切り替える。切り替え判定部109は、所定区間における入力音の切り替えの有無を判定する。
When the
切り替え判定部109は、所定区間の入力音に基づいて、該所定区間における入力音の切り替えの有無を判定することができる。例えば、切り替え判定部109は、所定区間におけるピッチデータに基づいて、該所定区間における入力音の切り替えの有無を判定してもよい。
The switching
図5は、切り替え判定部109による、所定区間における入力音の切り替えの有無の判定の概念の一例を説明するための図である。切り替え判定部109は、特徴量取得部105から、所定区間のピッチデータを順次取得する。図5は、所定区間におけるピッチデータの時系列の変動を示している。図5において、所定区間はt0〜tiとする。切り替え判定部109は、所定区間t0〜tiのピッチデータを取得すると、取得したピッチデータにおける各ピッチの線形近似を行い、線形近似曲線の傾きを求める。切り替え判定部109は、所定区間t0〜tiにおいて、ピッチの線形近似曲線の傾きの絶対値が所定の閾値以上である区間がある場合、該所定区間t0〜tiにおいて入力音の切り替えがあると判定する。ここで、所定の閾値は、任意であり、評価装置10の使用者によって設定されてもよい。図5において、tb、tcにおけるピッチの線形近似曲線の傾きの絶対値が閾値以上である場合、切り替え判定部109は、tb、tcを含む区間において入力音の切り替えがあると判定する。切り替え判定部109は、所定区間において入力音の切り替えがあると判定した場合、該所定区間において入力音の切り替えがあることを示す情報を評価部111に伝達する。また、所定区間において入力音の切り替えがないと判定した場合、該所定区間において入力音の切り替えがないことを示す情報を評価部111に伝達する。
FIG. 5 is a diagram for explaining an example of the concept of determining whether or not input sound is switched in a predetermined section by the switching
以上では、切り替え判定部109が、所定区間におけるピッチの線形近似曲線の傾きの絶対値に基づいて該所定区間における入力音の切り替えを判定する方法を説明したが、所定区間における入力音の切り替えの有無は、所定区間におけるピッチの線形近似曲線の傾きの絶対値に基づく判定方法に限定されるわけではない。例えば、切り替え判定部109は、所定区間においてピッチが未検出の区間がある場合、該所定区間において入力音の切り替えがあると判定してもよい。
The method for determining the input sound in the predetermined section based on the absolute value of the slope of the linear approximation curve of the pitch in the predetermined section has been described above. The presence / absence is not limited to the determination method based on the absolute value of the slope of the linear approximate curve of the pitch in the predetermined section. For example, when there is a section in which the pitch is not detected in the predetermined section, the switching
また、切り替え判定部109は、所定区間における音量データに基づいて、該所定区間における入力音の切り替えの有無を判定してもよい。図6は、切り替え判定部109による、所定区間における入力音の切り替えの有無の判定の概念の別の一例を説明するための図である。図6は、所定区間における音量データの時系列の変動を示している。切り替え判定部109は、特徴量取得部105から、所定区間の音量データを順次取得する。図6において、所定区間はt0〜tiとする。切り替え判定部109は、所定区間t0〜tiの音量データを取得すると、所定の閾値Vth未満となる音量を検出すると、所定区間t0〜tiに入力音の切り替えがあると判定する。図6では、所定区間t0〜tiのうち、ta〜tbの間の区間で音量が所定の閾値Vth未満であることを示している。切り替え判定部109は、所定区間t0〜tiにおいて、ta〜tbの間の区間に入力音の切り替えがあると判定する。
Further, the switching
また、図示はしないが、切り替え判定部109は、特徴量取得部105から取得した所定区間の音量データの線形近似を行い、該所定区間において、入力音の切り替えの有無を判定してもよい。この場合、切り替え判定部109は、所定区間における音量データの線形近似曲線の傾きを求め、該所定区間において、音量データの線形近似曲線の傾きの絶対値が所定の閾値以上である区間がある場合、該所定区間において入力音の切り替えがあると判定する。
Although not shown, the switching
以上では、切り替え判定部109が、所定区間のピッチデータ又は音量データに基づいて該所定区間に入力音の切り替えの有無を判定する方法を説明したが、切り替え判定部109による所定区間に入力音の切り替えの有無を判定する方法は、これらに限定されるわけではない。
In the above, the method has been described in which the
評価部111は、特徴量取得部105からFIFOに保存された所定区間のピッチデータを順次取得する。また、評価部111は、取得した所定区間に有効区間が存在しない場合、有効区間特定部107から該所定区間が有効区間を含まないことを示す情報を受信し、取得した所定区間に有効区間が存在する場合は、有効区間特定部107から該所定区間における有効区間を示す情報を受信する。取得した所定区間に有効区間が存在しない場合、評価部111は、評価不能を示す情報を出力する。一方、有効区間特定部107によって、所定区間における有効区間が特定されると、評価部111は、該所定区間内の有効区間におけるピッチデータと、所定のリファレンス音情報とを比較し、比較結果に基づいて該所定区間におけるピッチデータの評価値を算出する。この際、切り替え判定部109から該所定区間において入力音の切り替えがあることを示す情報が伝達されると、評価部111は、切り替えられた入力音に対応する、別のリファレンス音情報を記憶部13から取得し、該所定区間内の有効区間におけるピッチデータの比較対象となるリファレンス音情報を切り替える。以下、評価部111における、所定区間におけるピッチデータの評価方法を説明する。
The
評価部111は、特定された有効区間のピッチデータにおいて、代表ピッチを特定し、特定した代表ピッチと所定のリファレンス音情報のピッチとを比較して、該所定区間のピッチデータの評価値を算出することができる。ここで、代表ピッチは、有効区間における所定のピッチであってもよく、有効区間におけるピッチデータの平均ピッチであってもよい。また、代表ピッチは、有効区間における中央値ピッチであってもよい。
The
評価部111は、特定した代表ピッチが、所定のリファレンス音情報のピッチを基準とした所定のピッチ範囲であるか否かに基づいて、所定区間におけるピッチデータの評価値を算出する。図7Aは、評価部111による、所定区間における有効区間の代表ピッチに基づいて、該所定区間におけるピッチデータの評価値を算出する概念の一例を説明するための図である。図7Aに示すように、所定のリファレンス音情報のピッチPrefを基準とした、ピッチPref−aセント〜ピッチPref+aセントのピッチ範囲に有効区間の代表ピッチが存在する場合、評価部111は、該有効区間が含まれる所定区間のピッチデータの評価値を100点(合格)とする。図7Aにおいて、100点(合格)となるピッチ範囲は、斜線で示している。有効区間の代表ピッチがピッチPref−aセント〜ピッチPref+aセントのピッチ範囲外である場合、評価部111は、該有効区間が含まれる所定区間のピッチデータの評価値を0点(不合格)とする。
The
尚、所定のリファレンス音情報のピッチPrefを基準とした所定のピッチ範囲は、複数の区間に分割されもよい。評価部111は、特定した代表ピッチに対応する区間に基づいて、所定区間におけるピッチデータの評価値を算出することができる。図7Bは、評価部111による、所定区間における有効区間の代表ピッチに基づいて、該所定区間におけるピッチデータの評価値を算出する概念の別の一例を説明するための図である。図7Bでは、一例として、所定のリファレンス音情報のピッチPrefを基準とした、所定のピッチ範囲は3つの区間(区間401、区間403及び区間405)に分割されている。
The predetermined pitch range based on the pitch Pref of the predetermined reference sound information may be divided into a plurality of sections. The
図7Bにおいて、区間401は、所定のリファレンス音情報のピッチPrefを基準とした、ピッチPref−bセント〜ピッチPref+bセントのピッチ範囲を示し、区間403は、ピッチPref+bセント〜ピッチPref+aセントのピッチ範囲を示し、区間405は、ピッチPref−bセント〜ピッチPref−aセントのピッチ範囲を示している。ここでは、a>bである。図7Bに示すように、所定のリファレンス音情報のピッチPrefを基準とした、ピッチPref−bセント〜ピッチPref+bセントのピッチ範囲に有効区間の代表ピッチが存在する場合、即ち、代表ピッチに対応する区間が区間401に存在する場合、評価部111は、該有効区間が含まれる所定区間のピッチデータの評価値を100点(合格)とする。また、代表ピッチに対応する区間が区間403又は区間405に存在する場合、評価部111は、有効区間が存在する所定区間のピッチデータの評価値を100>x>0点(合格)とする。ここで、xは、評価部111によって所定区間のピッチデータに対してつけられる任意の点数であり、図7Bに示すように、代表ピッチがピッチPref−bセント〜ピッチPref+bセントのピッチ範囲に近ければ近いほど、高得点がつけられてもよく、代表ピッチがピッチPref−bセント〜ピッチPref+bセントのピッチ範囲から離れるほど、低い点数がつけられてもよい。有効区間の代表ピッチがピッチPref−aセント〜ピッチPref+aセントのピッチ範囲外である場合、即ち、区間401、区間403、及び区間405外である場合、評価部111は、該有効区間が含まれる所定区間のピッチデータの評価値を0点(不合格)とする。
In FIG. 7B, a
図7Bに示すように、リファレンス音情報のピッチPrefを基準とした所定のピッチ範囲を複数の区間に分割して、所定区間のピッチデータに対する評価値を算出する場合、各区間に対応する評価値は、演奏された楽器によって変更可能であってもよい。また、所定のリファレンス音情報がシャープ(#)又はフラット(♭)である場合、各区間に対応する評価値は不均衡に設定されてもよい。さらに、演奏された楽器とリファレンス音情報のピッチに基づいて、判定基準は変更されてもよい。例えば、高音域が出しにくい楽器を用いて高音の評価を行う場合、リファレンス音情報のピッチPrefを基準とした所定のピッチ範囲を大きくしたり、該ピッチ範囲を細かく分割してもよい。また、評価部111は、評価部111は、特徴量取得部105からFIFOに保存された所定区間のピッチデータを取得する際、所定区間のピッチデータに関連付けられた音量データを取得し、有効区間又は所定区間における音量の変動が少ない場合、該所定区間のピッチデータに対する評価値に加重値を付与してもよい。
As shown in FIG. 7B, when dividing a predetermined pitch range based on the pitch Pref of the reference sound information into a plurality of sections and calculating an evaluation value for pitch data of the predetermined section, evaluation values corresponding to the sections May be changeable depending on the instrument played. When the predetermined reference sound information is sharp (#) or flat (♭), the evaluation value corresponding to each section may be set to be unbalanced. Furthermore, the determination criterion may be changed based on the musical instrument played and the pitch of the reference sound information. For example, when a high tone is evaluated using an instrument that does not easily produce a high pitch range, a predetermined pitch range based on the pitch Pref of the reference sound information may be increased, or the pitch range may be finely divided. Further, when the
以上では、評価部111が、特定された有効区間のピッチデータにおいて、代表ピッチを特定し、特定した代表ピッチと所定のリファレンス音情報のピッチとを比較することによって、該所定区間のピッチデータの評価値を算出する例を説明したが、評価部111による所定区間のピッチデータの評価値の算出は、これに限定されるわけではない。例えば、評価部111は、特定された有効区間のピッチデータと所定のリファレンス音情報のピッチとを比較して、該所定区間のピッチデータの評価値を算出してもよい。つまり、図7A及び図7Bを参照して説明した評価部111による所定区間のピッチデータに対する評価は、該所定区間における有効区間の代表ピッチを特定して、特定された代表ピッチとリファレンス音情報のピッチとを比較したが、必ずしも代表ピッチを特定する必要はない。評価部111は、有効区間の全体又は一部のピッチデータと所定のリファレンス音情報のピッチとを比較して、該所定区間のピッチデータの評価値を算出してもよい。
As described above, the
また、有効区間のピッチデータと所定のリファレンス音情報のピッチとを比較する際、評価部111は、所定のリファレンス音情報のピッチPrefを含むピッチ範囲に有効区間のピッチデータ全体又は一部が存在するかどうかを判定することにより、該有効区間が含まれる所定区間のピッチデータに対する評価値を算出してもよい。例えば、図7Aに示したように、所定のリファレンス音情報のピッチPrefを基準とした、ピッチPref−aセント〜ピッチPref+aセントのピッチ範囲に有効区間のピッチデータの全体又は一部が存在する場合、評価部111は、該有効区間が含まれる所定区間のピッチデータの評価値を100点(合格)としてもよい。また、図7Bに示したように、リファレンス音情報のピッチPrefを基準とした所定のピッチ範囲が複数の区間に分割されてもよく、その場合、評価部111は、有効区間のピッチデータに対応する区間に基づいて、所定区間におけるピッチデータの評価値を算出してもよい。
In addition, when comparing the pitch data of the valid section and the pitch of the predetermined reference sound information, the
リファレンス音情報のピッチPrefを基準とした所定のピッチ範囲を複数の区間に分割して、所定区間のピッチデータに対する評価値を算出する場合、各区間に対応する評価値は、演奏された楽器によって変更可能であってもよい。また、所定のリファレンス音情報がシャープ(#)又はフラット(♭)である場合、各区間に対応する評価値は不均衡に設定されてもよい。さらに、演奏された楽器とリファレンス音情報のピッチに基づいて、判定基準は変更されてもよい。例えば、高音域が出しにくい楽器を用いて高音の評価を行う場合、リファレンス音情報のピッチPrefを基準とした所定のピッチ範囲を大きくしたり、該ピッチ範囲を細かく分割してもよい。また、評価部111は、特徴量取得部105からFIFOに保存された所定区間のピッチデータを取得する際、所定区間のピッチデータに関連付けられた音量データを取得し、有効区間又は所定区間における音量の変動が少ない場合、該所定区間のピッチデータに対する評価値に加重値を付与してもよい。
When a predetermined pitch range based on the pitch Pref of the reference sound information is divided into a plurality of sections and an evaluation value for the pitch data of the predetermined section is calculated, the evaluation value corresponding to each section depends on the musical instrument played. It may be changeable. When the predetermined reference sound information is sharp (#) or flat (♭), the evaluation value corresponding to each section may be set to be unbalanced. Furthermore, the determination criterion may be changed based on the musical instrument played and the pitch of the reference sound information. For example, when a high tone is evaluated using an instrument that does not easily produce a high pitch range, a predetermined pitch range based on the pitch Pref of the reference sound information may be increased, or the pitch range may be finely divided. Further, when the
また、評価部111は、有効区間のピッチデータの統計をとり、該有効区間のピッチの度数分布に基づいて、該有効区間が含まれる所定区間のピッチデータに対する評価値を算出してもよい。図8Aは、評価部111による、該有効区間のピッチの度数分布に基づいて、該所定区間におけるピッチデータの評価値を算出する概念の一例を説明するための図である。図8Aに示すように、評価部111は、所定のリファレンス音情報のピッチPrefに基づいて、該所定のリファレンス音情報のピッチPrefを基準とした、ピッチPref−aセント〜ピッチPref+aセントのピッチ範囲801を設定する。さらに、評価部111は、ピッチ範囲801における加重値Aを設定する。例えば、加重値Aは100点としてもよい。評価部111は、有効区間の全ピッチに対するピッチ範囲801におけるピッチの度数の割合に加重値A(100点)を掛け、得られた点数を該有効区間が含まれる所定区間のピッチデータの評価値とする。ピッチ範囲801におけるピッチの度数が高いほど、該有効区間が含まれる所定区間のピッチデータの評価値が高くなる。評価部111は、所定区間のピッチデータの評価値が所定の点数以上である場合、該所定区間のピッチデータの評価値を一律に100点(合格)としてもよい。ピッチ範囲801における有効区間のピッチの度数が低いほど、該有効区間が含まれる所定区間のピッチデータの評価値は低くなる。例えば、ピッチ範囲801に有効区間のピッチが存在しない場合、評価部111は、該有効区間が含まれる所定区間のピッチデータの評価値を0点(不合格)とする。また、評価部111は、所定区間のピッチデータの評価値が所定の点数未満である場合、該所定区間のピッチデータの評価値を一律に0点(不合格)としてもよい。
Further, the
尚、所定のリファレンス音情報のピッチPrefを基準とした所定のピッチ範囲は、複数の区間に分割されもよい。評価部111は、各区間における有効区間のピッチの度数分布に基づいて、所定区間におけるピッチデータの評価値を算出することができる。図8Bは、評価部111による、該有効区間のピッチの度数分布に基づいて、該所定区間におけるピッチデータの評価値を算出する概念の別の一例を説明するための図である。図8Bに示すように、評価部111は、所定のリファレンス音情報のピッチPrefに基づいて、該所定のリファレンス音情報のピッチPrefを基準とした、ピッチPref−aセント〜ピッチPref+aセントのピッチ範囲801を設定する。さらに、評価部111は、ピッチ範囲801を3つの区間(区間803、区間805及び区間807)に分割する。尚、分割された区間の数は、3つに限定されるわけではない。
The predetermined pitch range based on the pitch Pref of the predetermined reference sound information may be divided into a plurality of sections. The
図8Bにおいて、区間803は、所定のリファレンス音情報のピッチPrefを基準とした、ピッチPref−bセント〜ピッチPref+bセントのピッチ範囲を示し、区間805は、ピッチPref+bセント〜ピッチPref+aセントのピッチ範囲を示し、区間807は、ピッチPref−bセント〜ピッチPref−aセントのピッチ範囲を示している。ここでは、a>bである。評価部111は、ピッチ範囲801における区間803、区間805及び区間807に対して、それぞれ加重値A、加重値B及び加重値Cを設定する。例えば、区間803に対する加重値Aは100点であってもよい。区間805及び区間807に対する加重値B及び加重値Cは、加重値Aより小さければ特に限定されず、加重値B及び加重値Cは同一であってもよく、異なっていてもよい。例えば、加重値B及び加重値Cは60点であってもよい。尚、分割された区間に対応する加重値は、所定のリファレンス音情報のピッチPrefに近いほど相対的に高く設定し、所定のリファレンス音情報のピッチPrefから離れるほど相対的に低く設定する。
In FIG. 8B, a
評価部111は、区間803のピッチの度数の割合に加重値A(100点)を掛けて、区間803の評価値を算出する。同様に、評価部111は、区間805のピッチの度数の割合に加重値B(60点)を掛けて、区間805の評価値を算出する。また、評価部111は、区間807のピッチの度数の割合に加重値C(60点)を掛けて、区間807の評価値を算出する。評価部111は、区間803の評価値、区間805の評価値及び区間807の評価値を合算して得られた点数を有効区間が含まれる所定区間のピッチデータの評価値とする。ピッチ範囲801におけるピッチの度数が高いほど、該有効区間が含まれる所定区間のピッチデータの評価値が高くなる。特に、ピッチ範囲801における、区間803のピッチの度数が高いほど、つまり、有効区間のピッチがリファレンス音情報のピッチPrefに近いほど、該有効区間が含まれる所定区間のピッチデータの評価値が高くなる。評価部111は、所定区間のピッチデータの評価値が所定の点数以上である場合、該所定区間のピッチデータの評価値を一律に100点(合格)としてもよい。一方、ピッチ範囲801における有効区間のピッチの度数が低いほど、つまり、有効区間のピッチがリファレンス音情報のピッチPrefから離れるほど、該有効区間が含まれる所定区間のピッチデータの評価値は低くなる。例えば、ピッチ範囲801に有効区間のピッチデータが存在しない場合、評価部111は、該有効区間が含まれる所定区間のピッチデータの評価値を0点(不合格)とする。また、評価部111は、所定区間のピッチデータの評価値が所定の点数未満である場合、該所定区間のピッチデータの評価値を一律に0点(不合格)としてもよい。
The
図8Bに示すように、リファレンス音情報のピッチPrefを基準とした所定のピッチ範囲を複数の区間に分割して、所定区間のピッチデータに対する評価値を算出する場合、各区間に対応する加重値は、演奏された楽器によって変更可能であってもよい。また、所定のリファレンス音情報がシャープ(#)又はフラット(♭)である場合、各区間に対応する加重値は不均衡に設定されてもよい。さらに、演奏された楽器とリファレンス音情報のピッチに基づいて、判定基準は変更されてもよい。例えば、高音域が出しにくい楽器を用いて高音の評価を行う場合、リファレンス音情報のピッチPrefを基準とした所定のピッチ範囲を大きくしたり、該ピッチ範囲を細かく分割してもよい。また、評価部111は、特徴量取得部105からFIFOに保存された所定区間のピッチデータを取得する際、所定区間のピッチデータに関連付けられた音量データを取得し、有効区間又は所定区間における音量の変動が少ない場合、該所定区間のピッチデータに対する評価値に加重値を付与してもよい。
As shown in FIG. 8B, when the predetermined pitch range based on the pitch Pref of the reference sound information is divided into a plurality of sections and the evaluation value for the pitch data of the predetermined section is calculated, the weight value corresponding to each section May be changeable depending on the instrument played. Further, when the predetermined reference sound information is sharp (#) or flat (♭), the weight value corresponding to each section may be set to be unbalanced. Furthermore, the determination criterion may be changed based on the musical instrument played and the pitch of the reference sound information. For example, when a high tone is evaluated using an instrument that does not easily produce a high pitch range, a predetermined pitch range based on the pitch Pref of the reference sound information may be increased, or the pitch range may be finely divided. Further, when the
また、評価部111は、所定区間のピッチデータに対する評価値が、所定回数以上連続して閾値以上である場合、或は、所定回数以上連続して合格である場合、入力音に対して最終的な合格とする評価を行う。この場合、評価部111は、所定区間のピッチデータに対する評価値の中から最も高い点数を入力音に対する最終的な評価値としてもよく、所定区間のピッチデータに対する評価値の平均点を演奏者の入力音に対する最終的な評価値としてもよい。また、評価部111は、所定区間のピッチデータに対する評価値が閾値以上である期間の長さ、即ち、合格と判定された期間の長さに基づいて、最終的な評価値に加重値を付与してもよく、入力音のピッチがリファレンス音情報のピッチPrefを基準とした所定のピッチ範囲内にある期間が長いほど、さらに加重値を付与してもよい。また、評価部111は、所定の数以上の連続する所定区間のピッチデータに対する評価値に対しローパスフィルタをかけ、ノイズ成分を除去した評価値が一定以上連続する場合、演奏者の入力音に対して最終的な合格とする評価を行ってもよい。また、評価部111は、入力音のピッチ取得開始時点から、入力音のピッチがリファレンス音情報のピッチPrefを基準とした所定のピッチ範囲内に入る時間が所定の時間よりも短い場合は、最終的な評価値に加重値を付与してもよい。この場合、所定の時間は、任意に設定することができる。
The
評価部111は、以上に述べたような方法により、所定区間のピッチデータに対する評価値を算出し、算出した評価値を表示部15に伝達する。表示部15は、伝達された評価値に基づいて、所定区間のピッチデータに対する評価を楽器の演奏者が認識できるように結果を表示する。尚、評価部111による所定区間のピッチデータに対する評価値の算出方法を以上に説明したが、評価値の算出方法は、以上に述べた方法に限定されるわけではない。
The
尚、以上では、評価部111が、所定区間の有効区間のピッチデータと対応するリファレンス音情報とを比較し、比較結果に基づいて該所定区間のピッチデータに対する評価値を算出する方法を説明した。しかしながら、評価機能100において有効区間特定部107が省略される場合、評価部111は、所定区間のピッチデータの全体又は任意の一部のピッチデータと、対応するリファレンス音情報とを比較し、比較結果に基づいて該所定区間のピッチデータに対する評価値を算出してもよい。この際、評価部111は、所定区間のピッチデータ全体又は任意の一部のピッチデータの代表ピッチを特定して、図7A及び図7Bを参照して説明したように、所定区間のピッチデータに対する評価値を算出してもよい。また、評価部111は、所定区間のピッチデータ全体又は任意の一部のピッチの度数分布に基づいて、図8A及び図8Bを参照して説明したように、所定区間のピッチデータに対する評価値を算出してもよい。
In the above description, the
評価部111は、所定区間のピッチデータに対する評価値を順次算出して、複数の入力音が連続するフレーズの評価を行う。評価部111は、フレーズにおける各音に対する評価値の平均を、該フレーズに対する最終的な評価値として出力してもよい。また、評価部111は、フレーズにおける入力音の切り替えが円滑である場合、最終的な評価値に加重値を付与してもよく、フレーズにおける入力音の切り替えが円滑でない場合、最終的な評価値を減点してもよい。例えば、評価部111は、入力音の切り替え区間が所定期間未満であれば、入力音の切り替えが円滑であると判定してもよく、入力音の切り替え区間が所定期間以上であれば、入力音の切り替えが円滑でないと判定してもよい。また、評価部111は、入力音の切り替え区間における線形近似曲線の傾きの絶対値が所定の値以上であれば、入力音の切り替えが円滑であると判定してもよい。また、評価部111は、入力音の切り替え区間における線形近似曲線の傾きの絶対値に基づいて、最終的な評価値に対する加重値又は減点値を決定してもよい。
The
また、評価部111は、フレーズにおける各音の代表音量を特定し、各音の代表音量が均一であれば、最終的な評価値に加重値を付与してもよい。
Further, the
また、評価部111は、フレーズにおける各音の平均ピッチを求め、各音の平均ピッチと、対応するリファレンス音情報とを比較し、比較結果に基づいて、最終的な評価値に対する加重値又は減点値を決定してもよい。例えば、各音の平均ピッチと対応するリファレンス音情報との差が所定値未満であれば、最終的な評価値に加重値を付与してもよく、各音の平均ピッチと対応するリファレンス音情報との差が所定値以上であれば、最終的な評価値を減点してもよい。
Further, the
以上に述べた評価機能100によると、所定区間のピッチデータから有効区間を特定し、有効区間のピッチデータに基づいて所定区間のピッチデータを評価することにより、演奏音や歌唱音声などの種々の入力音について、決められた連続する複数の音高に対する精度の高い評価を行うことができる。
According to the
(変形例)
以上に述べた評価機能100では、有効区間特定部107において、所定区間における有効区間は、該所定区間のピッチデータに基づいて、特定されている。しかしながら、有効区間特定部107は、特徴量取得部105によって取得された特徴量のうち、音量データに基づいて、所定区間における有効区間を特定することもできる。
(Modification)
In the
有効区間特定部107は、特徴量取得部105からFIFOに保存された所定区間の音量データを順次取得し、取得した所定区間の音量データの変化量に基づいて、該所定区間における有効区間を特定する。例えば、有効区間特定部107は、所定区間の音量の変動が所定の閾値以下の区間を、該所定区間における有効区間を特定することができる。
The effective
図9は、有効区間特定部107による、所定区間における有効区間特定の概念の一例を説明するための図である。図9は、所定区間における音量データの時系列の変動を示している。図9において、所定区間はt0〜tiとする。有効区間特定部107は、所定区間t0〜tiの音量データを取得すると、取得した音量データにおける音量の線形近似を行い、線形近似曲線の傾きを求める。有効区間特定部107は、所定区間t0〜tiにおいて、音量の線形近似曲線の傾きの絶対値が所定の閾値未満である区間を有効区間と特定する。所定の閾値は、任意であり、評価装置10の使用者によって設定されてもよい。図9では、tb〜tdを有効区間として示しており、有効区間tb〜tdにおける音量の線形近似曲線の傾きの絶対値は、所定の閾値未満である。例えば、所定区間t0〜tiにおける有効区間tb〜tdにおいて、tbにおける音量の線形近似曲線Bの傾きの絶対値、tcにおける音量の線形近似曲線Cの傾きの絶対値、及びtdにおける音量の線形近似曲線Dの傾きの絶対値は、所定の閾値未満である。一方、所定区間t0〜tiにおける有効区間tb〜tdを除いた区間であるt0〜tb区間及びtd〜ti区間における音量の線形近似曲線の傾きの絶対値、例えば、taにおける線形近似曲線Aの傾きの絶対値、teにおける線形近似曲線の傾きの絶対値、及びtfにおける線形近似曲線の傾きの絶対値は、該所定の閾値以上である。
FIG. 9 is a diagram for explaining an example of a concept of specifying an effective section in a predetermined section by the effective
このように、有効区間特定部107は、所定区間の音量データに基づいて、該所定区間における有効区間を特定することができる。尚、有効区間特定部107における、所定区間の音量データを用いた有効区間の特定方法は、図9を参照して述べた方法に限定されるわけではない。
As described above, the valid
有効区間特定部107によって、音量データに基づいて所定区間における有効区間を特定した後は、前述したように、評価部111によって有効区間のピッチデータに基づいて該有効区間が含まれる所定区間のピッチデータに対する評価値の算出が行われる。
After the effective
本発明の実施形態として説明した構成を基にして、当業者が適宜構成要素の追加、削除もしくは設計変更を行ったもの、又は、工程の追加、省略もしくは条件変更を行ったものも、本発明の要旨を備えている限り、本発明の範囲に含まれる。 Based on the configuration described as the embodiment of the present invention, those in which a person skilled in the art appropriately added, deleted, or changed the design of the component, or added, omitted, or changed conditions of the process are also included in the present invention. As long as the gist of the present invention is provided, the scope of the present invention is included.
また、上述した実施形態の態様によりもたらされる作用効果とは異なる他の作用効果であっても、本明細書の記載から明らかなもの、又は、当業者において容易に予測し得るものについては、当然に本発明によりもたらされると解される。 Of course, other operational effects that are different from the operational effects brought about by the above-described embodiment are obvious from the description of the present specification or can be easily predicted by those skilled in the art. It is understood that this is brought about by the present invention.
10:評価装置、11:制御部、13:記憶部、15:表示部、17:信号処理部、19:音入力部、21:操作部、23:通信部、100:評価機能、103:入力音取得部、105:特徴量取得部、107:有効区間特定部、109:切り替え判定部、111:評価部 10: evaluation device, 11: control unit, 13: storage unit, 15: display unit, 17: signal processing unit, 19: sound input unit, 21: operation unit, 23: communication unit, 100: evaluation function, 103: input Sound acquisition unit, 105: feature amount acquisition unit, 107: effective section identification unit, 109: switching determination unit, 111: evaluation unit
Claims (9)
入力音を取得し、
前記入力音に基づいてピッチデータを時系列に取得し、取得した前記ピッチデータのうち、所定区間のピッチデータを所定の時間ごとに蓄積し順次更新し、
前記所定区間のピッチデータと所定のリファレンス音情報とを比較し、比較結果に基づいて前記所定区間のピッチデータの評価値を算出し、
前記所定区間のピッチデータに対応する期間の入力音に基づいて、前記リファレンス音情報を切り替えるかどうかを判定し、
前記リファレンス音情報を切り替える場合、前記所定区間のピッチデータと前記所定のリファレンス音情報とは異なる所定のリファレンス音情報とを比較し、比較結果に基づいて前記所定区間のピッチデータの評価値を算出すること、
を実行させるためのプログラム。 On the computer,
Get the input sound,
Pitch data is acquired in time series based on the input sound, among the acquired pitch data, the pitch data of a predetermined section is accumulated and updated every predetermined time,
The pitch data of the predetermined section is compared with predetermined reference sound information, and an evaluation value of the pitch data of the predetermined section is calculated based on the comparison result,
Determine whether to switch the reference sound information based on the input sound of the period corresponding to the pitch data of the predetermined section,
When switching the reference sound information, the pitch data of the predetermined section is compared with predetermined reference sound information different from the predetermined reference sound information, and the evaluation value of the pitch data of the predetermined section is calculated based on the comparison result To do,
A program for running
前記入力音に基づいてピッチデータを時系列に取得し、取得した前記ピッチデータのうち、所定区間のピッチデータを所定の時間ごとに蓄積し順次更新する特徴量取得部と、
前記所定区間のピッチデータと所定のリファレンス音情報とを比較し、比較結果に基づいて前記所定区間のピッチデータの評価値を算出する評価部と、
前記所定区間のピッチデータに対応する期間の入力音に基づいて、前記リファレンス音情報を切り替えるかどうかを判定する切り替え判定部と、
を備え、
前記切り替え判定部が前記リファレンス音情報を切り替えると判定する場合、前記評価部は、前記所定区間のピッチデータと前記所定のリファレンス音情報とは異なる所定のリファレンス音情報とを比較し、比較結果に基づいて前記所定区間のピッチデータの評価値を算出する、評価装置。 An input sound acquisition unit for acquiring the input sound;
A feature amount acquisition unit that acquires pitch data in a time series based on the input sound, and accumulates and sequentially updates pitch data of a predetermined section of the acquired pitch data for each predetermined time;
An evaluation unit that compares the pitch data of the predetermined section with predetermined reference sound information, and calculates an evaluation value of the pitch data of the predetermined section based on a comparison result;
A switching determination unit that determines whether to switch the reference sound information based on an input sound in a period corresponding to the pitch data of the predetermined section;
With
When the switching determination unit determines to switch the reference sound information, the evaluation unit compares the pitch data of the predetermined section with predetermined reference sound information different from the predetermined reference sound information, and determines the comparison result. An evaluation device that calculates an evaluation value of pitch data in the predetermined section based on the evaluation value.
前記入力音に基づいてピッチデータを時系列に取得し、取得した前記ピッチデータのうち、所定区間のピッチデータを所定の時間ごとに蓄積し順次更新し、
前記所定区間のピッチデータと所定のリファレンス音情報とを比較し、比較結果に基づいて前記所定区間のピッチデータの評価値を算出し、
前記所定区間のピッチデータに対応する期間の入力音に基づいて、前記リファレンス音情報を切り替えるかどうかを判定し、
前記リファレンス音情報を切り替える場合、前記所定区間のピッチデータと前記所定のリファレンス音情報とは異なる所定のリファレンス音情報とを比較し、比較結果に基づいて前記所定区間のピッチデータの評価値を算出すること、
を含む、評価方法。 Get the input sound,
Pitch data is acquired in time series based on the input sound, among the acquired pitch data, the pitch data of a predetermined section is accumulated and updated every predetermined time,
The pitch data of the predetermined section is compared with predetermined reference sound information, and an evaluation value of the pitch data of the predetermined section is calculated based on the comparison result,
Determine whether to switch the reference sound information based on the input sound of the period corresponding to the pitch data of the predetermined section,
When switching the reference sound information, the pitch data of the predetermined section is compared with predetermined reference sound information different from the predetermined reference sound information, and the evaluation value of the pitch data of the predetermined section is calculated based on the comparison result To do,
Including evaluation method.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2017044931A JP2018146933A (en) | 2017-03-09 | 2017-03-09 | Evaluation device, evaluation method, and program |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2017044931A JP2018146933A (en) | 2017-03-09 | 2017-03-09 | Evaluation device, evaluation method, and program |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2018146933A true JP2018146933A (en) | 2018-09-20 |
Family
ID=63591090
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2017044931A Pending JP2018146933A (en) | 2017-03-09 | 2017-03-09 | Evaluation device, evaluation method, and program |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2018146933A (en) |
-
2017
- 2017-03-09 JP JP2017044931A patent/JP2018146933A/en active Pending
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US10643638B2 (en) | Technique determination device and recording medium | |
US10497348B2 (en) | Evaluation device and evaluation method | |
JP6690181B2 (en) | Musical sound evaluation device and evaluation reference generation device | |
JP2017111268A (en) | Technique judgement device | |
JP6585289B2 (en) | Lighting control device, lighting control method, and lighting control program | |
JP2018146933A (en) | Evaluation device, evaluation method, and program | |
JP6812273B2 (en) | Musical instrument sound recognition device and musical instrument sound recognition program | |
US20220215051A1 (en) | Audio analysis method, audio analysis device and non-transitory computer-readable medium | |
JP2018146929A (en) | Evaluation device, evaluation method, and program | |
JP5585320B2 (en) | Singing voice evaluation device | |
JP5618743B2 (en) | Singing voice evaluation device | |
JP6690446B2 (en) | Acoustic analysis device and acoustic analysis method | |
JP2015194767A (en) | Voice evaluation device | |
JP6144592B2 (en) | Singing scoring system | |
JP6677041B2 (en) | Performance analyzer and program | |
JP2017111274A (en) | Data processor | |
JP6638305B2 (en) | Evaluation device | |
JP6175034B2 (en) | Singing evaluation device | |
JP2009150920A (en) | Echo canceller, karaoke machine, echo canceling method and program | |
JP2017129787A (en) | Scoring device | |
JP2016156917A (en) | Singing evaluation device and program | |
JP5697395B2 (en) | Singing voice evaluation apparatus and program | |
JP2019012118A (en) | Karaoke device | |
JP2015169720A (en) | Output sound controller and program | |
JP2014134687A (en) | Acoustic analyzer |