JP2018146933A - Evaluation device, evaluation method, and program - Google Patents

Evaluation device, evaluation method, and program Download PDF

Info

Publication number
JP2018146933A
JP2018146933A JP2017044931A JP2017044931A JP2018146933A JP 2018146933 A JP2018146933 A JP 2018146933A JP 2017044931 A JP2017044931 A JP 2017044931A JP 2017044931 A JP2017044931 A JP 2017044931A JP 2018146933 A JP2018146933 A JP 2018146933A
Authority
JP
Japan
Prior art keywords
predetermined
pitch
section
pitch data
predetermined section
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2017044931A
Other languages
Japanese (ja)
Inventor
辰弥 寺島
Tatsuya Terajima
辰弥 寺島
松本 秀一
Shuichi Matsumoto
秀一 松本
博貴 井上
Hirotaka Inoue
博貴 井上
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Yamaha Corp
Original Assignee
Yamaha Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Yamaha Corp filed Critical Yamaha Corp
Priority to JP2017044931A priority Critical patent/JP2018146933A/en
Publication of JP2018146933A publication Critical patent/JP2018146933A/en
Pending legal-status Critical Current

Links

Images

Abstract

PROBLEM TO BE SOLVED: To perform accurate evaluation on a plurality of continuous determined pitches.SOLUTION: A program according to one embodiment of the present invention causes a computer to acquire an input sound, acquire pitch data in time series on the basis of the input sound, accumulate pitch data in a predetermined section from among the acquired pitch data for every predetermined time and sequentially update the pitch data, compare the pitch data in the predetermined section with predetermined reference sound information, calculate an evaluation value of the pitch data in the predetermined section on the basis of a result of comparison, determine whether to switch the reference sound information on the basis of the input sound in a period corresponding to the pitch data in the predetermined section, when switching the reference sound information, compare the pitch data in the predetermined section with predetermined reference sound information different from the predetermined reference sound information, and calculate the evaluation value of the pitch data in the predetermined section on the basis of a result of comparison.SELECTED DRAWING: Figure 2

Description

本発明は、音を評価する技術に関する。   The present invention relates to a technique for evaluating sound.

演奏音や歌唱音声を評価する評価装置には、入力音を解析して評価する機能が備えられている。音の評価には様々な方法が用いられる。例えば、特許文献1には、リファレンスデータを実際の歌唱に近くなるように加工し、歌唱音声を加工されたリファレンスデータと比較し、歌唱音声を採点するカラオケ装置が開示されている。また、特許文献2には、所定の評価区間において入力音のピッチと基準ピッチを比較して、比較結果に基づいて入力音の評価を行う評価装置が開示されている。   An evaluation device that evaluates performance sounds and singing voices has a function of analyzing and evaluating input sounds. Various methods are used for sound evaluation. For example, Patent Literature 1 discloses a karaoke device that processes reference data so that it is close to an actual song, compares the singing voice with the processed reference data, and scores the singing voice. Patent Document 2 discloses an evaluation device that compares the pitch of an input sound with a reference pitch in a predetermined evaluation section and evaluates the input sound based on the comparison result.

特開2005−107328号公報JP-A-2005-107328 特開2016−173562号公報Japanese Patent Laid-Open No. 2006-173562

しかしながら、特許文献1及び特許文献2の技術では、所定の期間に入力される入力音に対するまとまった評価はできるものの、決められた所定の音高に対する評価はできない。   However, with the techniques of Patent Document 1 and Patent Document 2, although it is possible to collectively evaluate the input sound input during a predetermined period, it is not possible to evaluate a predetermined predetermined pitch.

本発明の課題の一つは、演奏音や歌唱音声などの種々の入力音における、決められた連続する複数の音高に対する精度の高い評価を行うことにある。   One of the objects of the present invention is to perform highly accurate evaluation on a plurality of predetermined continuous pitches in various input sounds such as performance sounds and singing voices.

本発明の一実施形態によると、コンピュータに、入力音を取得し、前記入力音に基づいてピッチデータを時系列に取得し、取得した前記ピッチデータのうち、所定区間のピッチデータを所定の時間ごとに蓄積し順次更新し、前記所定区間のピッチデータと所定のリファレンス音情報とを比較し、比較結果に基づいて前記所定区間のピッチデータの評価値を算出し、前記所定区間のピッチデータに対応する期間の入力音に基づいて、前記リファレンス音情報を切り替えるかどうかを判定し、前記リファレンス音情報を切り替える場合、前記所定区間のピッチデータと前記所定のリファレンス音情報とは異なる所定のリファレンス音情報とを比較し、比較結果に基づいて前記所定区間のピッチデータの評価値を算出すること、を実行させるためのプログラムが提供される。   According to an embodiment of the present invention, a computer acquires an input sound, acquires pitch data in time series based on the input sound, and among the acquired pitch data, pitch data of a predetermined section is determined for a predetermined time. Each time it is accumulated and updated sequentially, the pitch data of the predetermined section is compared with predetermined reference sound information, an evaluation value of the pitch data of the predetermined section is calculated based on the comparison result, and the pitch data of the predetermined section is calculated. When determining whether to switch the reference sound information based on an input sound in a corresponding period and switching the reference sound information, a predetermined reference sound different from the pitch data of the predetermined section and the predetermined reference sound information Comparing the information and calculating the evaluation value of the pitch data of the predetermined section based on the comparison result Program is provided.

前記リファレンス音情報を切り替えるかどうかを判定することは、前記所定区間のピッチデータに基づいて、前記リファレンス音情報を切り替えるかどうか判定すること、であってもよい。   Determining whether to switch the reference sound information may be determining whether to switch the reference sound information based on pitch data of the predetermined section.

前記リファレンス音情報を切り替えるかどうかを判定することは、前記所定区間の音量データに基づいて、前記リファレンス音情報を切り替えるかどうか判定すること、であってもよい。   Determining whether to switch the reference sound information may be determining whether to switch the reference sound information based on volume data of the predetermined section.

前記所定区間の入力音に基づいて、前記所定区間における、前記所定のリファレンス音情報との比較対象となる区間を特定すること、を前記コンピュータに実行させるようにしてもよい。   The computer may be configured to identify a section to be compared with the predetermined reference sound information in the predetermined section based on the input sound of the predetermined section.

前記所定区間のピッチデータの評価値を算出することは、前記所定区間における代表ピッチを特定し、前記代表ピッチと前記所定のリファレンス音情報のピッチと比較して、前記所定区間のピッチデータの評価値を算出すること、であってもよい。   The calculation of the evaluation value of the pitch data of the predetermined section specifies the representative pitch in the predetermined section, and compares the representative pitch with the pitch of the predetermined reference sound information to evaluate the pitch data of the predetermined section. It may be to calculate a value.

前記所定区間のピッチデータの評価値を算出することは、前記所定区間におけるピッチデータが前記所定のリファレンス音情報に対応するピッチを基準とした所定のピッチ範囲内であるか否かに基づいて、前記所定区間のピッチデータの評価値を算出すること、であってもよい。   The evaluation value of the pitch data in the predetermined section is calculated based on whether the pitch data in the predetermined section is within a predetermined pitch range based on a pitch corresponding to the predetermined reference sound information. The evaluation value of the pitch data of the predetermined section may be calculated.

前記所定区間のピッチデータの評価値を算出することは、前記所定区間におけるピッチデータの度数分布に基づいて、前記所定区間のピッチデータの評価値を算出すること、であってもよい。   The evaluation value of the pitch data in the predetermined section may be calculated based on the frequency distribution of the pitch data in the predetermined section.

本発明の一実施形態によると、入力音を取得する入力音取得部と、前記入力音に基づいてピッチデータを時系列に取得し、取得した前記ピッチデータのうち、所定区間のピッチデータを所定の時間ごとに蓄積し順次更新する特徴量取得部と、前記所定区間のピッチデータと所定のリファレンス音情報とを比較し、比較結果に基づいて前記所定区間のピッチデータの評価値を算出する評価部と、前記所定区間のピッチデータに対応する期間の入力音に基づいて、前記リファレンス音情報を切り替えるかどうかを判定する切り替え判定部と、を備え、前記切り替え判定部が前記リファレンス音情報を切り替えると判定する場合、前記評価部は、前記所定区間のピッチデータと前記所定のリファレンス音情報とは異なる所定のリファレンス音情報とを比較し、比較結果に基づいて前記所定区間のピッチデータの評価値を算出する、評価装置が提供される。   According to an embodiment of the present invention, an input sound acquisition unit that acquires an input sound, and pitch data is acquired in time series based on the input sound, and pitch data in a predetermined section is acquired from the acquired pitch data. A feature amount acquisition unit that accumulates and sequentially updates each time, and an evaluation that compares the pitch data of the predetermined section with predetermined reference sound information and calculates an evaluation value of the pitch data of the predetermined section based on the comparison result And a switching determination unit that determines whether to switch the reference sound information based on an input sound in a period corresponding to the pitch data of the predetermined section, and the switching determination unit switches the reference sound information When the determination unit determines that the predetermined reference sound information different from the pitch data of the predetermined section and the predetermined reference sound information, Comparison based on the comparison result calculates the evaluation value of the pitch data of the predetermined section, the evaluation device is provided.

本発明の一実施形態によると、入力音を取得し、前記入力音に基づいてピッチデータを時系列に取得し、取得した前記ピッチデータのうち、所定区間のピッチデータを所定の時間ごとに蓄積し順次更新し、前記所定区間のピッチデータと所定のリファレンス音情報とを比較し、比較結果に基づいて前記所定区間のピッチデータの評価値を算出し、前記所定区間のピッチデータに対応する期間の入力音に基づいて、前記リファレンス音情報を切り替えるかどうかを判定し、前記リファレンス音情報を切り替える場合、前記所定区間のピッチデータと前記所定のリファレンス音情報とは異なる所定のリファレンス音情報とを比較し、比較結果に基づいて前記所定区間のピッチデータの評価値を算出すること、を含む、評価方法が提供される。   According to an embodiment of the present invention, an input sound is acquired, pitch data is acquired in time series based on the input sound, and pitch data of a predetermined section is accumulated at predetermined intervals among the acquired pitch data. And sequentially updating, comparing the pitch data of the predetermined section with predetermined reference sound information, calculating an evaluation value of the pitch data of the predetermined section based on the comparison result, and a period corresponding to the pitch data of the predetermined section It is determined whether to switch the reference sound information based on the input sound, and when the reference sound information is switched, the pitch data of the predetermined section and predetermined reference sound information different from the predetermined reference sound information are obtained. Comparing and calculating an evaluation value of the pitch data of the predetermined section based on the comparison result is provided.

本発明の一実施形態によれば、演奏音や歌唱音声などの種々の入力音について決められた連続する複数の音高に対する精度の高い評価を行うことが可能になる。   According to an embodiment of the present invention, it is possible to perform a highly accurate evaluation on a plurality of continuous pitches determined for various input sounds such as performance sounds and singing sounds.

本発明の一実施形態における評価装置の構成を示すブロック図である。It is a block diagram which shows the structure of the evaluation apparatus in one Embodiment of this invention. 本発明の一実施形態における評価機能の構成を示すブロック図である。It is a block diagram which shows the structure of the evaluation function in one Embodiment of this invention. 本発明の一実施形態における評価機能の構成によって実行される、入力音の評価方法の流れを示したフローチャートである。It is the flowchart which showed the flow of the evaluation method of the input sound performed by the structure of the evaluation function in one Embodiment of this invention. 所定区間における有効区間特定の概念の一例を説明するための図である。It is a figure for demonstrating an example of the concept of the effective area identification in a predetermined area. (a)所定区間におけるピッチの頻度を示す図である。(b)所定区間におけるピッチデータの時系列の変動を示す図である。(A) It is a figure which shows the frequency of the pitch in a predetermined area. (B) It is a figure which shows the fluctuation | variation of the time series of the pitch data in a predetermined area. 所定区間における入力音の切り替えの有無の判定の概念の一例を説明するための図である。It is a figure for demonstrating an example of the concept of the determination of the presence or absence of switching of the input sound in a predetermined area. 所定区間における入力音の切り替えの有無の判定の概念の別の一例を説明するための図である。It is a figure for demonstrating another example of the concept of the determination of the presence or absence of switching of the input sound in a predetermined area. 該所定区間におけるピッチデータの評価値を算出する概念の一例を説明するための図である。It is a figure for demonstrating an example of the concept which calculates the evaluation value of the pitch data in this predetermined area. 該所定区間におけるピッチデータの評価値を算出する概念の別の一例を説明するための図である。It is a figure for demonstrating another example of the concept which calculates the evaluation value of the pitch data in this predetermined area. 該所定区間におけるピッチデータの評価値を算出する概念の一例を説明するための図である。It is a figure for demonstrating an example of the concept which calculates the evaluation value of the pitch data in this predetermined area. 該所定区間におけるピッチデータの評価値を算出する概念の別の一例を説明するための図である。It is a figure for demonstrating another example of the concept which calculates the evaluation value of the pitch data in this predetermined area. 所定区間における有効区間特定の概念の一例を説明するための図である。It is a figure for demonstrating an example of the concept of the effective area identification in a predetermined area.

以下、本発明の一実施形態における評価装置について、図面を参照しながら詳細に説明する。以下に示す実施形態は本発明の実施形態の一例であって、本発明はこれらの実施形態に限定されるものではない。   Hereinafter, an evaluation apparatus according to an embodiment of the present invention will be described in detail with reference to the drawings. The following embodiments are examples of the embodiments of the present invention, and the present invention is not limited to these embodiments.

本発明の一実施形態における評価装置について、図面を参照しながら詳細に説明する。本発明の一実施形態に係る評価装置は、演奏者によって演奏された楽器の入力音や歌唱者の歌唱音声などの種々の入力音を評価する機能を備えた装置である。この評価装置は、入力音のピッチデータを時系列に取得し、取得したピッチデータにおける所定区間のピッチデータを蓄積し、所定時間ごとに該所定区間のピッチデータを順次更新する。そして、当該評価装置は、ピッチデータと所定のリファレンス音情報とを比較し、比較結果に基づいて該所定区間のピッチデータの評価値を算出するが、このとき、該所定区間のピッチデータに対応する期間の入力音に基づいて、比較対象とするべきリファレンス音情報を切り替えるかどうかを判定し、リファレンス音情報を切り替える場合、該所定のリファレンス音情報とは異なる別の所定のリファレンス音情報と該所定区間のピッチデータとを比較し、比較結果に基づいて該所定区間のピッチデータの評価行う。   An evaluation apparatus according to an embodiment of the present invention will be described in detail with reference to the drawings. An evaluation apparatus according to an embodiment of the present invention is an apparatus having a function of evaluating various input sounds such as an input sound of a musical instrument played by a performer and a singing voice of a singer. This evaluation device acquires pitch data of input sound in time series, accumulates pitch data of a predetermined section in the acquired pitch data, and sequentially updates the pitch data of the predetermined section every predetermined time. Then, the evaluation device compares the pitch data with predetermined reference sound information, and calculates an evaluation value of the pitch data of the predetermined section based on the comparison result. At this time, it corresponds to the pitch data of the predetermined section. When determining whether to switch the reference sound information to be compared based on the input sound of the period to be compared, and switching the reference sound information, the predetermined reference sound information different from the predetermined reference sound information and the The pitch data of a predetermined section is compared, and the pitch data of the predetermined section is evaluated based on the comparison result.

[ハードウエア]
図1は、本発明の一実施形態における評価装置10の構成を示すブロック図である。評価装置10は、評価装置10は、制御部11、記憶部13、表示部15、および信号処理部17を備える。信号処理部17には、音入力部(例えば、マイクロフォン)19が接続されている。また、評価装置10は、任意で操作部21及び通信部23を備えてもよい。これらの各構成は、バス25を介して相互に接続されている。尚、以下では、本発明の一実施形態に係る評価装置10が、演奏者によって演奏された楽器の入力音を評価する例を説明する。
[Hardware]
FIG. 1 is a block diagram showing a configuration of an evaluation apparatus 10 according to an embodiment of the present invention. The evaluation device 10 includes a control unit 11, a storage unit 13, a display unit 15, and a signal processing unit 17. A sound input unit (for example, a microphone) 19 is connected to the signal processing unit 17. Further, the evaluation device 10 may optionally include an operation unit 21 and a communication unit 23. These components are connected to each other via a bus 25. In the following, an example in which the evaluation device 10 according to an embodiment of the present invention evaluates an input sound of a musical instrument played by a performer will be described.

制御部11は、CPUなどの演算処理回路を含む。制御部11は、記憶部13に記憶された制御プログラム13aをCPUにより実行して、各種機能を評価装置10において実現させる。実現される機能には、演奏者に演奏による楽器の入力音の評価機能が含まれる。また、制御部11は、入力音をFIFO(First In, First Out)に保存する入力音記憶部11aを含む。入力音記憶部11aはFIFOメモリである。   The control unit 11 includes an arithmetic processing circuit such as a CPU. The control unit 11 causes the CPU to execute the control program 13a stored in the storage unit 13 and implements various functions in the evaluation apparatus 10. The realized functions include a function for evaluating the input sound of a musical instrument performed by the performer. The control unit 11 also includes an input sound storage unit 11a that stores input sound in a FIFO (First In, First Out). The input sound storage unit 11a is a FIFO memory.

記憶部13は、不揮発性メモリ、ハードディスク等の記憶装置である。記憶部13は、評価機能を実現するための制御プログラム13aを記憶する。制御プログラム13aは、磁気記録媒体、光記録媒体、光磁気記録媒体、半導体メモリなどのコンピュータ読み取り可能な記録媒体に記憶した状態で提供されてもよい。この場合には、評価装置10は、記録媒体を読み取る装置を備えていればよい。また、制御プログラム13aは、インターネット等のネットワーク経由でダウンロードされてもよい。また、記憶部13は、リファレンス音情報13bを記憶する。リファレンス音情報13bは、入力音の評価の基準として用いられる基準音情報であり、リファレンス音のピッチ情報を含む。   The storage unit 13 is a storage device such as a nonvolatile memory or a hard disk. The storage unit 13 stores a control program 13a for realizing the evaluation function. The control program 13a may be provided in a state stored in a computer-readable recording medium such as a magnetic recording medium, an optical recording medium, a magneto-optical recording medium, or a semiconductor memory. In this case, the evaluation device 10 only needs to include a device that reads the recording medium. The control program 13a may be downloaded via a network such as the Internet. The storage unit 13 stores reference sound information 13b. The reference sound information 13b is reference sound information used as a reference for evaluation of the input sound, and includes pitch information of the reference sound.

表示部15は、液晶ディスプレイ、有機ELディスプレイ等の表示装置であり、制御部11による制御に基づいて演奏者による入力音に対する評価を表す画面が表示される。   The display unit 15 is a display device such as a liquid crystal display or an organic EL display, and displays a screen representing an evaluation of the input sound by the performer based on control by the control unit 11.

信号処理部17は、A/Dコンバータ等を含む。演奏者によって演奏された楽器の入力音は、音入力部19において電気信号に変換されて信号処理部17に入力され、信号処理部21においてA/D変換されて制御部11に出力される。   The signal processing unit 17 includes an A / D converter and the like. The input sound of the musical instrument played by the performer is converted into an electrical signal by the sound input unit 19 and input to the signal processing unit 17, and A / D converted by the signal processing unit 21 and output to the control unit 11.

操作部21は、操作パネルおよびリモコンなどに設けられた操作ボタン、キーボード、マウスなどの装置であり、入力された操作に応じた信号を制御部11に出力する。評価装置10の使用者は、評価対象になる入力音に対応するリファレンス音を操作部21によって指定してもよい。通信部23は、制御部11の制御に基づいて、インターネットやLANなどの通信回線と接続して、サーバ等の外部装置と情報の送受信を行う。なお、記憶部13の機能は、通信部23において通信可能な外部装置で実現されてもよい。   The operation unit 21 is a device such as operation buttons, a keyboard, and a mouse provided on the operation panel and the remote controller, and outputs a signal corresponding to the input operation to the control unit 11. The user of the evaluation device 10 may specify a reference sound corresponding to the input sound to be evaluated by the operation unit 21. Based on the control of the control unit 11, the communication unit 23 is connected to a communication line such as the Internet or a LAN, and transmits / receives information to / from an external device such as a server. Note that the function of the storage unit 13 may be realized by an external device capable of communicating in the communication unit 23.

[評価機能]
評価装置10の制御部11が記憶部13に記憶された制御プログラム13aを実行することによって実現される評価機能について説明する。なお、以下に説明する評価機能を実現する構成の一部または全部は、ハードウエアによって実現されてもよい。
[Evaluation function]
An evaluation function realized when the control unit 11 of the evaluation apparatus 10 executes the control program 13a stored in the storage unit 13 will be described. A part or all of the configuration for realizing the evaluation function described below may be realized by hardware.

図2は、本発明の一実施形態における評価機能100の構成を示すブロック図である。図2を参照すると、評価機能100は、入力音取得部103、特徴量取得部105、有効区間特定部107、切り替え判定部109及び評価部111を含む。尚、評価機能100において、有効区間特定部107は省略されてもよい。   FIG. 2 is a block diagram showing the configuration of the evaluation function 100 in one embodiment of the present invention. Referring to FIG. 2, the evaluation function 100 includes an input sound acquisition unit 103, a feature amount acquisition unit 105, an effective section identification unit 107, a switching determination unit 109, and an evaluation unit 111. In the evaluation function 100, the valid section specifying unit 107 may be omitted.

図3は、図2に示した、本発明の一実施形態における評価機能100の構成によって実行される、入力音の評価方法の流れを示したフローチャートである。図2及び図3を参照して、本発明の一実施形態における評価機能100の構成によって実行される、入力音の評価方法の一例を簡単に説明する。   FIG. 3 is a flowchart showing the flow of the input sound evaluation method executed by the configuration of the evaluation function 100 according to the embodiment of the present invention shown in FIG. With reference to FIG. 2 and FIG. 3, an example of the input sound evaluation method executed by the configuration of the evaluation function 100 in one embodiment of the present invention will be briefly described.

まず、入力音取得部103によって入力音が取得される(S1)。次に、特徴量取得部105によって、取得された入力音に基づいて特徴量が取得され(S2)、FIFOに保存される。FIFOに保存された所定区間の特徴量に基づいて、有効区間特定部107によって、該所定区間における有効区間が特定される(S3)。即ち、該所定区間に有効区間が存在しているか否か判定される。有効区間が特定されない場合、後述するS8に進む。但し、評価機能100において有効区間特定部107が省略される場合、S3は省略され、S2において特徴量が取得された後は、後述するS4に進む。有効区間が特定(S3)された場合、又は特徴量が取得(S2)された後、切り替え判定部109によって、リファレンス音情報を切り替えるかどうか判定する(S4)。リファレンス音情報を切り替える場合は、評価部111は、リファレンス音情報を別のリファレンス音情報と切り替えて(S5)、所定区間のピッチデータと切り替えられたリファレンス音情報とを比較して所定区間のピッチデータに対する評価値を算出する(S6)。リファレンス音情報を切り替えない場合は、評価部111は、リファレンス音情報を切り替えることなく、所定区間のピッチデータと現在のリファレンス音情報とを比較して所定区間のピッチデータに対する評価値を算出する(S6)。評価値が算出されると、全ての入力音に対する評価が終了したか否かが判定される(S7)。全ての入力音に対する評価が終了していない場合、次の所定区間における有効区間の特定(S3)に進む。有効区間特定部107が省略される場合、次の所定区間におけるピッチデータの評価の比較対象となるリファレンス音情報を切り替えるかどうかの判定(S4)に進む。最初の入力音の取得から一定時間経過後、全ての入力音に対する評価が終了してもよく、評価装置10の使用者による操作で終了してもよい。   First, an input sound is acquired by the input sound acquisition unit 103 (S1). Next, the feature amount acquisition unit 105 acquires a feature amount based on the acquired input sound (S2) and stores it in the FIFO. Based on the feature value of the predetermined section stored in the FIFO, the effective section in the predetermined section is specified by the effective section specifying unit 107 (S3). That is, it is determined whether or not an effective section exists in the predetermined section. When the valid section is not specified, the process proceeds to S8 described later. However, when the valid section specifying unit 107 is omitted in the evaluation function 100, S3 is omitted, and after the feature amount is acquired in S2, the process proceeds to S4 described later. When the valid section is specified (S3) or after the feature value is acquired (S2), the switching determination unit 109 determines whether to switch the reference sound information (S4). When switching the reference sound information, the evaluation unit 111 switches the reference sound information to another reference sound information (S5), compares the pitch data of the predetermined section with the switched reference sound information, and determines the pitch of the predetermined section. An evaluation value for the data is calculated (S6). When the reference sound information is not switched, the evaluation unit 111 calculates the evaluation value for the pitch data of the predetermined section by comparing the pitch data of the predetermined section with the current reference sound information without switching the reference sound information ( S6). When the evaluation values are calculated, it is determined whether or not the evaluation for all input sounds has been completed (S7). If evaluation for all input sounds has not been completed, the process proceeds to identification of an effective section in the next predetermined section (S3). When the valid section specifying unit 107 is omitted, the process proceeds to determination (S4) as to whether or not to switch reference sound information to be compared for evaluation of pitch data in the next predetermined section. After a certain period of time has elapsed since the acquisition of the first input sound, the evaluation for all input sounds may be completed, or may be ended by an operation by the user of the evaluation device 10.

以下、本発明の一実施形態に係る評価機能100における、入力音取得部103、特徴量取得部105、有効区間特定部107、切り替え判定部109及び評価部111について説明する。   Hereinafter, the input sound acquisition unit 103, the feature amount acquisition unit 105, the valid section identification unit 107, the switching determination unit 109, and the evaluation unit 111 in the evaluation function 100 according to an embodiment of the present invention will be described.

入力音取得部103は、音入力部19から入力された入力音を取得する。ここで、入力音取得部103によって取得された入力音は、信号処理部17によってデジタル化されている。なお、入力音取得部103は、入力音を信号処理部17から直接取得するが、いったん記憶部13に記憶された入力音を取得するようにしてもよい。また、入力音取得部103は、音入力部19への入力音を取得する場合に限らず、外部装置へのデジタル化された入力音を、通信部23によりネットワーク経由で取得してもよい。本実施形態においては、入力音取得部103は、順次入力される入力音を、特徴量取得部105に順次出力する。   The input sound acquisition unit 103 acquires the input sound input from the sound input unit 19. Here, the input sound acquired by the input sound acquisition unit 103 is digitized by the signal processing unit 17. The input sound acquisition unit 103 acquires the input sound directly from the signal processing unit 17, but may acquire the input sound once stored in the storage unit 13. The input sound acquisition unit 103 is not limited to acquiring the input sound to the sound input unit 19, and may acquire the digitized input sound to the external device via the network. In the present embodiment, the input sound acquisition unit 103 sequentially outputs input sounds that are sequentially input to the feature amount acquisition unit 105.

特徴量取得部105は、入力音取得部103によって取得された入力音から、入力音の特徴量を時系列に検出する。入力音の特徴量は、入力音のピッチを含む。特徴量取得部105は、フレーム(所定期間で区切られたデータサンプル)ごとに入力音が示す音声信号の波形が負から正に変化する際のゼロクロスを検出し、そのゼロクロスの時間間隔を測定することによって入力音のピッチ(周波数)を特定する。このとき、この音声信号から、ローパスフィルタによりノイズ成分となる高域成分をカットしたり、ハイパスフィルタにより直流成分をカットしたりしておいてもよい。また、特徴量取得部105は、入力音にFFT(Fast Fourier Transform)を施して得られるスペクトルから入力音のピッチを特定してもよい。このようにして検出したピッチを示すピッチデータの所定区間のデータがFIFOに順次保存される。FIFOにおけるバッファサイズ、つまり該所定区間の長さは、特に限定されず任意であるが、例えば、直近〜数百msecであってもよい。   The feature amount acquisition unit 105 detects the feature amount of the input sound from the input sound acquired by the input sound acquisition unit 103 in time series. The feature amount of the input sound includes the pitch of the input sound. The feature amount acquisition unit 105 detects a zero cross when the waveform of the audio signal indicated by the input sound changes from negative to positive for each frame (data sample divided by a predetermined period), and measures the time interval of the zero cross. Thus, the pitch (frequency) of the input sound is specified. At this time, a high-frequency component that becomes a noise component may be cut from the audio signal by a low-pass filter, or a DC component may be cut by a high-pass filter. The feature quantity acquisition unit 105 may specify the pitch of the input sound from a spectrum obtained by performing FFT (Fast Fourier Transform) on the input sound. Data of a predetermined section of the pitch data indicating the pitch detected in this way is sequentially stored in the FIFO. The buffer size in the FIFO, that is, the length of the predetermined section is not particularly limited and is arbitrary, but may be, for example, the latest to several hundred msec.

また、特徴量取得部105は、入力音の特徴量として、入力音の音量を検出してもよい。特徴量取得部105は、入力音取得部103によって取得された入力音から、入力音の音量を時系列に検出する。特徴量取得部105は、入力音に基づいて、入力音の音量の時間的な変化(音量波形)を検出する。特徴量取得部105は、入力音が示す音声信号の振幅に基づいて音量を検出する。特徴量取得部105は、検出した入力音の音量を示す音量データをピッチデータに関連付けて所定区間ごとにFIFOに保存する。   The feature amount acquisition unit 105 may detect the volume of the input sound as the feature amount of the input sound. The feature amount acquisition unit 105 detects the volume of the input sound in time series from the input sound acquired by the input sound acquisition unit 103. The feature amount acquisition unit 105 detects a temporal change (volume waveform) of the volume of the input sound based on the input sound. The feature amount acquisition unit 105 detects the volume based on the amplitude of the audio signal indicated by the input sound. The feature amount acquisition unit 105 associates the detected volume data indicating the volume of the input sound with the pitch data and stores the volume data in the FIFO for each predetermined section.

有効区間特定部107は、特徴量取得部105によって取得され、FIFOに保存された、入力音の所定区間の特徴量に基づいて、該所定区間における有効区間を特定する。有効区間特定部107は、特徴量取得部105によって取得された特徴量のうち、ピッチデータに基づいて、所定区間における有効区間を特定する。しかしながら、有効区間特定部107は、特徴量取得部105によって取得された特徴量のうち、音量データに基づいて、所定区間における有効区間を特定してもよい。また、有効区間特定部107は、ピッチデータ及び音量データに基づいて、所定区間における有効区間を特定してもよい。ここで、有効区間とは、所定区間における、所定のリファレンス音情報との比較対象となるピッチデータに対応する区間を意味する。本実施形態では、有孔区間特定部107が、特徴量取得部105によって取得され、FIFOに保存された、所定区間のピッチデータに基づいて、該所定区間における有効区間を特定する一例を説明する。   The effective section specifying unit 107 specifies the effective section in the predetermined section based on the feature amount of the predetermined section of the input sound acquired by the feature amount acquisition unit 105 and stored in the FIFO. The effective section specifying unit 107 specifies the effective section in the predetermined section based on the pitch data among the feature amounts acquired by the feature amount acquiring unit 105. However, the effective section specifying unit 107 may specify the effective section in the predetermined section based on the volume data among the feature amounts acquired by the feature amount acquiring unit 105. Further, the valid section specifying unit 107 may specify a valid section in the predetermined section based on the pitch data and the volume data. Here, the effective section means a section corresponding to pitch data to be compared with predetermined reference sound information in a predetermined section. In the present embodiment, an example in which the perforated section specifying unit 107 specifies an effective section in the predetermined section based on the pitch data of the predetermined section acquired by the feature amount acquiring unit 105 and stored in the FIFO will be described. .

有効区間特定部107は、特徴量取得部105からFIFOに保存された所定区間のピッチデータを順次取得し、取得した所定区間にピッチデータに基づいて、該所定区間における有効区間を特定する。例えば、有効区間特定部107は、所定区間のピッチの線形近似曲線の傾きの絶対値に基づいて、該所定区間における有効区間を特定することができる。   The effective section specifying unit 107 sequentially acquires the pitch data of the predetermined section stored in the FIFO from the feature amount acquisition unit 105, and specifies the effective section in the predetermined section based on the acquired predetermined section based on the pitch data. For example, the effective section specifying unit 107 can specify the effective section in the predetermined section based on the absolute value of the slope of the linear approximation curve of the pitch of the predetermined section.

図4Aは、有効区間特定部107による、所定区間における有効区間特定の概念の一例を説明するための図である。図4Aは、所定区間におけるピッチデータの時系列の変動を示している。図4Aにおいて、所定区間はt0〜tiとする。有効区間特定部107は、所定区間t0〜tiのピッチデータを取得すると、取得したピッチデータにおける各ピッチの線形近似を行い、線形近似曲線の傾きを求める。有効区間特定部107は、所定区間t0〜tiにおいて、ピッチの線形近似曲線の傾きの絶対値が所定の閾値未満である区間を有効区間と特定する。所定の閾値は、任意であり、評価装置10の使用者によって設定されてもよい。図4Aでは、tb〜tdを有効区間として示しており、有効区間tb〜tdにおけるピッチの線形近似曲線の傾きの絶対値は、所定の閾値未満である。例えば、所定区間t0〜tiにおける有効区間tb〜tdにおいて、tbにおけるピッチの線形近似曲線Bの傾きの絶対値、tcにおけるピッチの線形近似曲線Cの傾きの絶対値、及びtdにおけるピッチの線形近似曲線Dの傾きの絶対値は、所定の閾値未満である。一方、所定区間t0〜tiにおける有効区間tb〜tdを除いた区間であるt0〜tb区間及びtd〜ti区間におけるピッチの線形近似曲線の傾きの絶対値、例えば、taにおける線形近似曲線Aの傾きの絶対値、及びteにおける線形近似曲線の傾きの絶対値は、該所定の閾値以上である。   FIG. 4A is a diagram for explaining an example of a concept of specifying an effective section in a predetermined section by the effective section specifying unit 107. FIG. 4A shows a time-series variation of pitch data in a predetermined section. In FIG. 4A, the predetermined section is t0 to ti. When acquiring the pitch data of the predetermined sections t0 to ti, the valid section specifying unit 107 performs linear approximation of each pitch in the acquired pitch data and obtains the slope of the linear approximation curve. The effective section specifying unit 107 specifies a section in which the absolute value of the slope of the linear approximation curve of the pitch is less than a predetermined threshold in the predetermined sections t0 to ti as the effective section. The predetermined threshold value is arbitrary and may be set by the user of the evaluation device 10. In FIG. 4A, tb to td are shown as effective intervals, and the absolute value of the slope of the linear approximate curve of the pitch in the effective intervals tb to td is less than a predetermined threshold. For example, in the effective sections tb to td in the predetermined section t0 to ti, the absolute value of the slope of the linear approximate curve B of the pitch at tb, the absolute value of the slope of the linear approximate curve C of the pitch at tc, and the linear approximation of the pitch at td The absolute value of the slope of the curve D is less than a predetermined threshold value. On the other hand, the absolute value of the slope of the linear approximate curve of the pitch in the interval t0 to tb and the interval td to ti excluding the valid intervals tb to td in the predetermined interval t0 to ti, for example, the slope of the linear approximate curve A in ta And the absolute value of the slope of the linear approximation curve at te are equal to or greater than the predetermined threshold.

以上では、有効区間特定部107が、所定区間におけるピッチの線形近似曲線の傾きの絶対値に基づいて該所定区間における有効区間を特定する方法を説明したが、所定区間における有効区間の特定は、所定区間におけるピッチの線形近似曲線の傾きの絶対値に基づく特定方法に限定されるわけではない。例えば、有効区間特定部107は、所定区間におけるピッチの分散に基づいて、該所定区間における有効区間を特定することができる。   In the above, the method in which the effective section specifying unit 107 specifies the effective section in the predetermined section based on the absolute value of the slope of the linear approximation curve of the pitch in the predetermined section has been described. The method is not limited to the identification method based on the absolute value of the slope of the linear approximate curve of the pitch in the predetermined section. For example, the effective section specifying unit 107 can specify the effective section in the predetermined section based on the pitch dispersion in the predetermined section.

有効区間特定部107は、所定区間t0〜tiのピッチデータを取得すると、取得したピッチデータの分散値を算出する。算出した分散値が所定値以上である場合、有効区間特定部107は、所定区間t0〜tiに有効区間は存在しないと判定する。一方、算出した分散値が所定値未満である場合、有効区間特定部107は、所定区間t0〜tiに有効区間が存在すると判定する。尚、ここで所定値は、任意であり、評価装置10の使用者が設定することもできる。   When obtaining the pitch data of the predetermined sections t0 to ti, the valid section specifying unit 107 calculates a variance value of the acquired pitch data. When the calculated variance value is equal to or greater than the predetermined value, the effective interval specifying unit 107 determines that there is no effective interval in the predetermined intervals t0 to ti. On the other hand, when the calculated variance value is less than the predetermined value, the effective interval specifying unit 107 determines that an effective interval exists in the predetermined intervals t0 to ti. Here, the predetermined value is arbitrary and can be set by the user of the evaluation apparatus 10.

所定区間t0〜tiに有効区間が存在する場合、有効区間特定部107は、所定区間t0〜tiのピッチデータに基づき、所定区間t0〜tiにおける有効区間を特定する。有効区間特定部107は、所定区間t0〜tiにおいて、所定の閾値以上の頻度を有するピッチ範囲が存在する場合、所定の閾値以上の頻度を有するピッチ範囲に存在しているピッチに対応する区間であり、且つ該ピッチ範囲に存在しているピッチが所定期間連続している区間を有効区間と特定する。   When there is an effective section in the predetermined section t0 to ti, the effective section specifying unit 107 specifies the effective section in the predetermined section t0 to ti based on the pitch data of the predetermined section t0 to ti. In a predetermined section t0 to ti, the valid section specifying unit 107 is a section corresponding to a pitch existing in a pitch range having a frequency equal to or higher than a predetermined threshold when a pitch range having a frequency equal to or higher than a predetermined threshold exists. A section in which the pitch existing in the pitch range is continuous for a predetermined period is identified as an effective section.

図4Bは、有効区間特定部107による、所定区間における有効区間特定の概念の別の一例を説明するための図である。図4B(a)は、所定区間におけるピッチの頻度を示し、図4B(b)は該所定区間におけるピッチデータの時系列の変動を示している。図4B(a)に示すように、所定区間t0〜tiのピッチデータにおける各ピッチは、ピッチPa〜ピッチPb、ピッチPb〜ピッチPc、ピッチPc〜ピッチPd、ピッチPd〜ピッチPe、ピッチPe〜ピッチPf、ピッチPf〜ピッチPg、ピッチPf〜ピッチPh、ピッチPh〜ピッチPiのピッチ範囲に存在する。尚、各ピッチ範囲は、任意に設定することができ、各ピッチ範囲におけるピッチは、重複していてもよく、重複していなくてもよい。有効区間特定部107は、所定区間t0〜tiにおいて、所定の閾値Va以上の頻度を有するピッチ範囲を特定する。図4B(b)に示すように、ピッチPf〜ピッチPgのピッチ範囲の頻度が所定の閾値Va以上である。有効区間特定部107は、ピッチPf〜ピッチPgのピッチ範囲に存在しているピッチに対応し、且つ、ピッチPf〜ピッチPgのピッチ範囲に対応するピッチが所定期間連続する区間を有効区間と特定する。例えば、図4B(b)に示すように、ピッチPf〜ピッチPgのピッチ範囲に対応するピッチが、tx1〜tx2の区間で連続している場合、有効区間特定部107は、所定区間t0〜tiにおいてtx1〜tx2の区間を有効区間と特定する。   FIG. 4B is a diagram for explaining another example of the concept of specifying the effective section in the predetermined section by the effective section specifying unit 107. FIG. 4B (a) shows the frequency of the pitch in the predetermined section, and FIG. 4B (b) shows the time-series fluctuation of the pitch data in the predetermined section. As shown in FIG. 4B (a), the pitches in the pitch data of the predetermined sections t0 to ti are: pitch Pa to pitch Pb, pitch Pb to pitch Pc, pitch Pc to pitch Pd, pitch Pd to pitch Pe, pitch Pe to The pitch Pf, the pitch Pf to the pitch Pg, the pitch Pf to the pitch Ph, and the pitch Ph to the pitch Pi exist. In addition, each pitch range can be set arbitrarily and the pitch in each pitch range may overlap and does not need to overlap. The valid section specifying unit 107 specifies a pitch range having a frequency equal to or higher than a predetermined threshold Va in the predetermined sections t0 to ti. As shown in FIG. 4B (b), the frequency in the pitch range of the pitch Pf to the pitch Pg is equal to or greater than a predetermined threshold value Va. The valid section specifying unit 107 identifies a section corresponding to a pitch existing in the pitch range of the pitch Pf to the pitch Pg and having a pitch corresponding to the pitch range of the pitch Pf to the pitch Pg as a valid section. To do. For example, as shown in FIG. 4B (b), when the pitch corresponding to the pitch range of the pitch Pf to the pitch Pg is continuous in the section of tx1 to tx2, the valid section specifying unit 107 sets the predetermined section t0 to ti. In t, the interval from tx1 to tx2 is specified as the effective interval.

以上に説明したように、有効区間特定部107は、特徴量取得部105から、FIFOに保存された所定区間のピッチデータを順次取得し、取得した所定区間のピッチデータに基づいて、以上に述べたように該所定区間における有効区間を順次特定する。有効区間特定部107は、該所定区間において有効区間を特定すると、該所定区間における有効区間を示す情報を評価部111に伝達する。また、該所定区間において、有効区間が存在しない場合は、該所定区間が有効区間を含まないことを示す情報を評価部111に伝達する。尚、所定区間における有効区間の特定方法は、以上に述べた方法に限定されるわけではない。また、上述したように、本発明の一実施形態に係る評価機能100において、有効区間判定部107は省略されてもよい。   As described above, the valid section specifying unit 107 sequentially acquires the pitch data of the predetermined section stored in the FIFO from the feature amount acquisition unit 105, and described above based on the acquired pitch data of the predetermined section. As described above, the effective sections in the predetermined section are sequentially specified. When the valid section specifying unit 107 identifies a valid section in the predetermined section, the valid section specifying unit 107 transmits information indicating the valid section in the predetermined section to the evaluation unit 111. If there is no valid section in the predetermined section, information indicating that the predetermined section does not include the valid section is transmitted to the evaluation unit 111. Note that the method for specifying the effective section in the predetermined section is not limited to the method described above. Further, as described above, in the evaluation function 100 according to the embodiment of the present invention, the valid section determination unit 107 may be omitted.

切り替え判定部109は、後述する評価部111において、所定区間のピッチデータの評価値を算出する際、該所定区間のピッチデータの比較対象となるリファレンス音情報を切り替えるか否か判定する。複数の入力音が連続するフレーズの評価を行う際、入力音が切り替わると、評価部111は、切り替わった入力音の比較対象となるリファレンス音情報を切り替える。切り替え判定部109は、所定区間における入力音の切り替えの有無を判定する。   When the evaluation unit 111 described later calculates an evaluation value of pitch data in a predetermined section, the switching determination unit 109 determines whether to switch reference sound information to be compared with pitch data in the predetermined section. When evaluating a phrase in which a plurality of input sounds are continued, when the input sound is switched, the evaluation unit 111 switches reference sound information to be compared with the switched input sound. The switching determination unit 109 determines whether or not input sound is switched in a predetermined section.

切り替え判定部109は、所定区間の入力音に基づいて、該所定区間における入力音の切り替えの有無を判定することができる。例えば、切り替え判定部109は、所定区間におけるピッチデータに基づいて、該所定区間における入力音の切り替えの有無を判定してもよい。   The switching determination unit 109 can determine whether or not the input sound is switched in the predetermined section based on the input sound in the predetermined section. For example, the switching determination unit 109 may determine whether or not the input sound is switched in the predetermined section based on the pitch data in the predetermined section.

図5は、切り替え判定部109による、所定区間における入力音の切り替えの有無の判定の概念の一例を説明するための図である。切り替え判定部109は、特徴量取得部105から、所定区間のピッチデータを順次取得する。図5は、所定区間におけるピッチデータの時系列の変動を示している。図5において、所定区間はt0〜tiとする。切り替え判定部109は、所定区間t0〜tiのピッチデータを取得すると、取得したピッチデータにおける各ピッチの線形近似を行い、線形近似曲線の傾きを求める。切り替え判定部109は、所定区間t0〜tiにおいて、ピッチの線形近似曲線の傾きの絶対値が所定の閾値以上である区間がある場合、該所定区間t0〜tiにおいて入力音の切り替えがあると判定する。ここで、所定の閾値は、任意であり、評価装置10の使用者によって設定されてもよい。図5において、tb、tcにおけるピッチの線形近似曲線の傾きの絶対値が閾値以上である場合、切り替え判定部109は、tb、tcを含む区間において入力音の切り替えがあると判定する。切り替え判定部109は、所定区間において入力音の切り替えがあると判定した場合、該所定区間において入力音の切り替えがあることを示す情報を評価部111に伝達する。また、所定区間において入力音の切り替えがないと判定した場合、該所定区間において入力音の切り替えがないことを示す情報を評価部111に伝達する。   FIG. 5 is a diagram for explaining an example of the concept of determining whether or not input sound is switched in a predetermined section by the switching determination unit 109. The switching determination unit 109 sequentially acquires pitch data of a predetermined section from the feature amount acquisition unit 105. FIG. 5 shows time-series fluctuations in pitch data in a predetermined section. In FIG. 5, the predetermined section is t0 to ti. When the switching determination unit 109 acquires the pitch data of the predetermined sections t0 to ti, the switching determination unit 109 performs linear approximation of each pitch in the acquired pitch data and obtains the slope of the linear approximation curve. The switching determination unit 109 determines that the input sound is switched in the predetermined section t0 to ti when there is a section in which the absolute value of the slope of the linear approximation curve of the pitch is equal to or greater than a predetermined threshold in the predetermined section t0 to ti. To do. Here, the predetermined threshold value is arbitrary and may be set by the user of the evaluation device 10. In FIG. 5, when the absolute value of the slope of the linear approximate curve of the pitch at tb and tc is equal to or greater than the threshold, the switching determination unit 109 determines that the input sound is switched in the section including tb and tc. When it is determined that the input sound is switched in the predetermined section, the switching determination unit 109 transmits information indicating that the input sound is switched in the predetermined section to the evaluation unit 111. If it is determined that there is no input sound switching in the predetermined section, information indicating that there is no input sound switching in the predetermined section is transmitted to the evaluation unit 111.

以上では、切り替え判定部109が、所定区間におけるピッチの線形近似曲線の傾きの絶対値に基づいて該所定区間における入力音の切り替えを判定する方法を説明したが、所定区間における入力音の切り替えの有無は、所定区間におけるピッチの線形近似曲線の傾きの絶対値に基づく判定方法に限定されるわけではない。例えば、切り替え判定部109は、所定区間においてピッチが未検出の区間がある場合、該所定区間において入力音の切り替えがあると判定してもよい。   The method for determining the input sound in the predetermined section based on the absolute value of the slope of the linear approximation curve of the pitch in the predetermined section has been described above. The presence / absence is not limited to the determination method based on the absolute value of the slope of the linear approximate curve of the pitch in the predetermined section. For example, when there is a section in which the pitch is not detected in the predetermined section, the switching determination unit 109 may determine that the input sound is switched in the predetermined section.

また、切り替え判定部109は、所定区間における音量データに基づいて、該所定区間における入力音の切り替えの有無を判定してもよい。図6は、切り替え判定部109による、所定区間における入力音の切り替えの有無の判定の概念の別の一例を説明するための図である。図6は、所定区間における音量データの時系列の変動を示している。切り替え判定部109は、特徴量取得部105から、所定区間の音量データを順次取得する。図6において、所定区間はt0〜tiとする。切り替え判定部109は、所定区間t0〜tiの音量データを取得すると、所定の閾値Vth未満となる音量を検出すると、所定区間t0〜tiに入力音の切り替えがあると判定する。図6では、所定区間t0〜tiのうち、ta〜tbの間の区間で音量が所定の閾値Vth未満であることを示している。切り替え判定部109は、所定区間t0〜tiにおいて、ta〜tbの間の区間に入力音の切り替えがあると判定する。   Further, the switching determination unit 109 may determine whether or not the input sound is switched in the predetermined section based on the volume data in the predetermined section. FIG. 6 is a diagram for explaining another example of the concept of determining whether or not input sound is switched in a predetermined section by the switching determination unit 109. FIG. 6 shows time-series fluctuations in volume data in a predetermined section. The switching determination unit 109 sequentially acquires volume data of a predetermined section from the feature amount acquisition unit 105. In FIG. 6, the predetermined section is t0 to ti. When the sound volume data of the predetermined sections t0 to ti is acquired, the switching determination unit 109 determines that the input sound is switched in the predetermined sections t0 to ti when detecting the sound volume that is less than the predetermined threshold Vth. FIG. 6 shows that the volume is less than the predetermined threshold Vth in the section between ta and tb among the predetermined sections t0 to ti. The switching determination unit 109 determines that the input sound is switched in the section between ta and tb in the predetermined sections t0 to ti.

また、図示はしないが、切り替え判定部109は、特徴量取得部105から取得した所定区間の音量データの線形近似を行い、該所定区間において、入力音の切り替えの有無を判定してもよい。この場合、切り替え判定部109は、所定区間における音量データの線形近似曲線の傾きを求め、該所定区間において、音量データの線形近似曲線の傾きの絶対値が所定の閾値以上である区間がある場合、該所定区間において入力音の切り替えがあると判定する。   Although not shown, the switching determination unit 109 may perform linear approximation of the volume data of a predetermined section acquired from the feature amount acquisition unit 105 and determine whether or not the input sound is switched in the predetermined section. In this case, the switching determination unit 109 obtains the slope of the linear approximation curve of the volume data in a predetermined section, and there is a section in the predetermined section where the absolute value of the slope of the linear approximation curve of the volume data is greater than or equal to a predetermined threshold. It is determined that the input sound is switched in the predetermined section.

以上では、切り替え判定部109が、所定区間のピッチデータ又は音量データに基づいて該所定区間に入力音の切り替えの有無を判定する方法を説明したが、切り替え判定部109による所定区間に入力音の切り替えの有無を判定する方法は、これらに限定されるわけではない。   In the above, the method has been described in which the switching determination unit 109 determines whether or not the input sound is switched in the predetermined section based on the pitch data or the volume data in the predetermined section. The method for determining the presence or absence of switching is not limited to these.

評価部111は、特徴量取得部105からFIFOに保存された所定区間のピッチデータを順次取得する。また、評価部111は、取得した所定区間に有効区間が存在しない場合、有効区間特定部107から該所定区間が有効区間を含まないことを示す情報を受信し、取得した所定区間に有効区間が存在する場合は、有効区間特定部107から該所定区間における有効区間を示す情報を受信する。取得した所定区間に有効区間が存在しない場合、評価部111は、評価不能を示す情報を出力する。一方、有効区間特定部107によって、所定区間における有効区間が特定されると、評価部111は、該所定区間内の有効区間におけるピッチデータと、所定のリファレンス音情報とを比較し、比較結果に基づいて該所定区間におけるピッチデータの評価値を算出する。この際、切り替え判定部109から該所定区間において入力音の切り替えがあることを示す情報が伝達されると、評価部111は、切り替えられた入力音に対応する、別のリファレンス音情報を記憶部13から取得し、該所定区間内の有効区間におけるピッチデータの比較対象となるリファレンス音情報を切り替える。以下、評価部111における、所定区間におけるピッチデータの評価方法を説明する。   The evaluation unit 111 sequentially acquires pitch data of a predetermined section stored in the FIFO from the feature amount acquisition unit 105. In addition, when there is no effective section in the acquired predetermined section, the evaluation unit 111 receives information indicating that the predetermined section does not include the effective section from the effective section specifying unit 107, and there is an effective section in the acquired predetermined section. If it exists, information indicating the valid section in the predetermined section is received from the valid section identifying unit 107. When there is no valid section in the acquired predetermined section, the evaluation unit 111 outputs information indicating that evaluation is not possible. On the other hand, when the effective section in the predetermined section is specified by the effective section specifying unit 107, the evaluation unit 111 compares the pitch data in the effective section in the predetermined section with predetermined reference sound information, and the comparison result is obtained. Based on this, an evaluation value of pitch data in the predetermined section is calculated. At this time, when information indicating that the input sound is switched in the predetermined section is transmitted from the switching determination unit 109, the evaluation unit 111 stores another reference sound information corresponding to the switched input sound. 13 and the reference sound information to be compared with the pitch data in the valid section within the predetermined section is switched. Hereinafter, a method for evaluating pitch data in a predetermined section in the evaluation unit 111 will be described.

評価部111は、特定された有効区間のピッチデータにおいて、代表ピッチを特定し、特定した代表ピッチと所定のリファレンス音情報のピッチとを比較して、該所定区間のピッチデータの評価値を算出することができる。ここで、代表ピッチは、有効区間における所定のピッチであってもよく、有効区間におけるピッチデータの平均ピッチであってもよい。また、代表ピッチは、有効区間における中央値ピッチであってもよい。   The evaluation unit 111 specifies the representative pitch in the pitch data of the specified effective section, compares the specified representative pitch with the pitch of the predetermined reference sound information, and calculates the evaluation value of the pitch data of the predetermined section can do. Here, the representative pitch may be a predetermined pitch in the effective section, or may be an average pitch of pitch data in the effective section. The representative pitch may be a median pitch in the effective section.

評価部111は、特定した代表ピッチが、所定のリファレンス音情報のピッチを基準とした所定のピッチ範囲であるか否かに基づいて、所定区間におけるピッチデータの評価値を算出する。図7Aは、評価部111による、所定区間における有効区間の代表ピッチに基づいて、該所定区間におけるピッチデータの評価値を算出する概念の一例を説明するための図である。図7Aに示すように、所定のリファレンス音情報のピッチPrefを基準とした、ピッチPref−aセント〜ピッチPref+aセントのピッチ範囲に有効区間の代表ピッチが存在する場合、評価部111は、該有効区間が含まれる所定区間のピッチデータの評価値を100点(合格)とする。図7Aにおいて、100点(合格)となるピッチ範囲は、斜線で示している。有効区間の代表ピッチがピッチPref−aセント〜ピッチPref+aセントのピッチ範囲外である場合、評価部111は、該有効区間が含まれる所定区間のピッチデータの評価値を0点(不合格)とする。   The evaluation unit 111 calculates an evaluation value of pitch data in a predetermined section based on whether or not the identified representative pitch is in a predetermined pitch range based on the pitch of predetermined reference sound information. FIG. 7A is a diagram for explaining an example of a concept by which the evaluation unit 111 calculates an evaluation value of pitch data in a predetermined section based on a representative pitch of an effective section in the predetermined section. As shown in FIG. 7A, when the representative pitch of the valid section exists in the pitch range of pitch Pref-a cent to pitch Pref + a cent with reference to the pitch Pref of the predetermined reference sound information, the evaluation unit 111 Assume that the evaluation value of pitch data in a predetermined section including the section is 100 points (passed). In FIG. 7A, the pitch range of 100 points (accepted) is indicated by hatching. When the representative pitch of the valid section is outside the pitch range of pitch Pref-a cent to pitch Pref + a cent, the evaluation unit 111 sets the evaluation value of the pitch data of the predetermined section including the valid section as 0 (fail). To do.

尚、所定のリファレンス音情報のピッチPrefを基準とした所定のピッチ範囲は、複数の区間に分割されもよい。評価部111は、特定した代表ピッチに対応する区間に基づいて、所定区間におけるピッチデータの評価値を算出することができる。図7Bは、評価部111による、所定区間における有効区間の代表ピッチに基づいて、該所定区間におけるピッチデータの評価値を算出する概念の別の一例を説明するための図である。図7Bでは、一例として、所定のリファレンス音情報のピッチPrefを基準とした、所定のピッチ範囲は3つの区間(区間401、区間403及び区間405)に分割されている。   The predetermined pitch range based on the pitch Pref of the predetermined reference sound information may be divided into a plurality of sections. The evaluation unit 111 can calculate the evaluation value of the pitch data in the predetermined section based on the section corresponding to the identified representative pitch. FIG. 7B is a diagram for explaining another example of the concept of calculating the evaluation value of the pitch data in the predetermined section based on the representative pitch of the effective section in the predetermined section by the evaluation unit 111. In FIG. 7B, as an example, the predetermined pitch range based on the pitch Pref of the predetermined reference sound information is divided into three sections (section 401, section 403, and section 405).

図7Bにおいて、区間401は、所定のリファレンス音情報のピッチPrefを基準とした、ピッチPref−bセント〜ピッチPref+bセントのピッチ範囲を示し、区間403は、ピッチPref+bセント〜ピッチPref+aセントのピッチ範囲を示し、区間405は、ピッチPref−bセント〜ピッチPref−aセントのピッチ範囲を示している。ここでは、a>bである。図7Bに示すように、所定のリファレンス音情報のピッチPrefを基準とした、ピッチPref−bセント〜ピッチPref+bセントのピッチ範囲に有効区間の代表ピッチが存在する場合、即ち、代表ピッチに対応する区間が区間401に存在する場合、評価部111は、該有効区間が含まれる所定区間のピッチデータの評価値を100点(合格)とする。また、代表ピッチに対応する区間が区間403又は区間405に存在する場合、評価部111は、有効区間が存在する所定区間のピッチデータの評価値を100>x>0点(合格)とする。ここで、xは、評価部111によって所定区間のピッチデータに対してつけられる任意の点数であり、図7Bに示すように、代表ピッチがピッチPref−bセント〜ピッチPref+bセントのピッチ範囲に近ければ近いほど、高得点がつけられてもよく、代表ピッチがピッチPref−bセント〜ピッチPref+bセントのピッチ範囲から離れるほど、低い点数がつけられてもよい。有効区間の代表ピッチがピッチPref−aセント〜ピッチPref+aセントのピッチ範囲外である場合、即ち、区間401、区間403、及び区間405外である場合、評価部111は、該有効区間が含まれる所定区間のピッチデータの評価値を0点(不合格)とする。   In FIG. 7B, a section 401 indicates a pitch range of pitch Pref-b cent to pitch Pref + b cent with reference to a pitch Pref of predetermined reference sound information, and a section 403 indicates a pitch range of pitch Pref + b cent to pitch Pref + a cent. A section 405 indicates a pitch range from pitch Pref-b cent to pitch Pref-a cent. Here, a> b. As shown in FIG. 7B, when the representative pitch of the valid section exists in the pitch range from pitch Pref-b cent to pitch Pref + b cent with reference to the pitch Pref of the predetermined reference sound information, that is, it corresponds to the representative pitch. When the section exists in the section 401, the evaluation unit 111 sets the evaluation value of the pitch data of the predetermined section including the valid section as 100 points (passed). When the section corresponding to the representative pitch exists in the section 403 or the section 405, the evaluation unit 111 sets the evaluation value of the pitch data of the predetermined section in which the valid section exists as 100> x> 0 points (pass). Here, x is an arbitrary number given to the pitch data of the predetermined section by the evaluation unit 111, and as shown in FIG. 7B, the representative pitch approaches the pitch range of pitch Pref-b cent to pitch Pref + b cent. The closer it is, the higher the score may be given, and the lower the score may be, the farther the representative pitch is from the pitch range of pitch Pref-b cent to pitch Pref + b cent. When the representative pitch of the valid section is outside the pitch range of pitch Pref-a cent to pitch Pref + a cent, that is, outside the section 401, section 403, and section 405, the evaluation unit 111 includes the valid section. Assume that the evaluation value of the pitch data in the predetermined section is 0 (failed).

図7Bに示すように、リファレンス音情報のピッチPrefを基準とした所定のピッチ範囲を複数の区間に分割して、所定区間のピッチデータに対する評価値を算出する場合、各区間に対応する評価値は、演奏された楽器によって変更可能であってもよい。また、所定のリファレンス音情報がシャープ(#)又はフラット(♭)である場合、各区間に対応する評価値は不均衡に設定されてもよい。さらに、演奏された楽器とリファレンス音情報のピッチに基づいて、判定基準は変更されてもよい。例えば、高音域が出しにくい楽器を用いて高音の評価を行う場合、リファレンス音情報のピッチPrefを基準とした所定のピッチ範囲を大きくしたり、該ピッチ範囲を細かく分割してもよい。また、評価部111は、評価部111は、特徴量取得部105からFIFOに保存された所定区間のピッチデータを取得する際、所定区間のピッチデータに関連付けられた音量データを取得し、有効区間又は所定区間における音量の変動が少ない場合、該所定区間のピッチデータに対する評価値に加重値を付与してもよい。   As shown in FIG. 7B, when dividing a predetermined pitch range based on the pitch Pref of the reference sound information into a plurality of sections and calculating an evaluation value for pitch data of the predetermined section, evaluation values corresponding to the sections May be changeable depending on the instrument played. When the predetermined reference sound information is sharp (#) or flat (♭), the evaluation value corresponding to each section may be set to be unbalanced. Furthermore, the determination criterion may be changed based on the musical instrument played and the pitch of the reference sound information. For example, when a high tone is evaluated using an instrument that does not easily produce a high pitch range, a predetermined pitch range based on the pitch Pref of the reference sound information may be increased, or the pitch range may be finely divided. Further, when the evaluation unit 111 acquires the pitch data of the predetermined section stored in the FIFO from the feature amount acquisition unit 105, the evaluation unit 111 acquires volume data associated with the pitch data of the predetermined section, and the effective section Or when there is little fluctuation | variation of the sound volume in a predetermined area, you may give a weight value to the evaluation value with respect to the pitch data of this predetermined area.

以上では、評価部111が、特定された有効区間のピッチデータにおいて、代表ピッチを特定し、特定した代表ピッチと所定のリファレンス音情報のピッチとを比較することによって、該所定区間のピッチデータの評価値を算出する例を説明したが、評価部111による所定区間のピッチデータの評価値の算出は、これに限定されるわけではない。例えば、評価部111は、特定された有効区間のピッチデータと所定のリファレンス音情報のピッチとを比較して、該所定区間のピッチデータの評価値を算出してもよい。つまり、図7A及び図7Bを参照して説明した評価部111による所定区間のピッチデータに対する評価は、該所定区間における有効区間の代表ピッチを特定して、特定された代表ピッチとリファレンス音情報のピッチとを比較したが、必ずしも代表ピッチを特定する必要はない。評価部111は、有効区間の全体又は一部のピッチデータと所定のリファレンス音情報のピッチとを比較して、該所定区間のピッチデータの評価値を算出してもよい。   As described above, the evaluation unit 111 specifies the representative pitch in the pitch data of the specified effective section, and compares the specified representative pitch with the pitch of the predetermined reference sound information, thereby determining the pitch data of the predetermined section. Although the example which calculates an evaluation value was demonstrated, calculation of the evaluation value of the pitch data of the predetermined area by the evaluation part 111 is not necessarily limited to this. For example, the evaluation unit 111 may calculate the evaluation value of the pitch data of the predetermined section by comparing the pitch data of the specified effective section and the pitch of the predetermined reference sound information. That is, the evaluation on the pitch data of the predetermined section by the evaluation unit 111 described with reference to FIGS. 7A and 7B is performed by specifying the representative pitch of the effective section in the predetermined section, and the specified representative pitch and reference sound information. Although the pitch is compared, it is not always necessary to specify the representative pitch. The evaluation unit 111 may calculate the evaluation value of the pitch data of the predetermined section by comparing the pitch data of the whole or a part of the effective section with the pitch of the predetermined reference sound information.

また、有効区間のピッチデータと所定のリファレンス音情報のピッチとを比較する際、評価部111は、所定のリファレンス音情報のピッチPrefを含むピッチ範囲に有効区間のピッチデータ全体又は一部が存在するかどうかを判定することにより、該有効区間が含まれる所定区間のピッチデータに対する評価値を算出してもよい。例えば、図7Aに示したように、所定のリファレンス音情報のピッチPrefを基準とした、ピッチPref−aセント〜ピッチPref+aセントのピッチ範囲に有効区間のピッチデータの全体又は一部が存在する場合、評価部111は、該有効区間が含まれる所定区間のピッチデータの評価値を100点(合格)としてもよい。また、図7Bに示したように、リファレンス音情報のピッチPrefを基準とした所定のピッチ範囲が複数の区間に分割されてもよく、その場合、評価部111は、有効区間のピッチデータに対応する区間に基づいて、所定区間におけるピッチデータの評価値を算出してもよい。   In addition, when comparing the pitch data of the valid section and the pitch of the predetermined reference sound information, the evaluation unit 111 has all or part of the pitch data of the valid section in the pitch range including the pitch Pref of the predetermined reference sound information. By determining whether or not to perform, an evaluation value for pitch data of a predetermined section including the effective section may be calculated. For example, as shown in FIG. 7A, when all or part of the pitch data of the valid section exists in the pitch range of pitch Pref-a cent to pitch Pref + a cent with reference to the pitch Pref of the predetermined reference sound information. The evaluation unit 111 may set the evaluation value of pitch data in a predetermined section including the effective section as 100 points (pass). Further, as shown in FIG. 7B, a predetermined pitch range based on the pitch Pref of the reference sound information may be divided into a plurality of sections. In this case, the evaluation unit 111 corresponds to the pitch data of the effective section. The evaluation value of the pitch data in the predetermined section may be calculated based on the section to be performed.

リファレンス音情報のピッチPrefを基準とした所定のピッチ範囲を複数の区間に分割して、所定区間のピッチデータに対する評価値を算出する場合、各区間に対応する評価値は、演奏された楽器によって変更可能であってもよい。また、所定のリファレンス音情報がシャープ(#)又はフラット(♭)である場合、各区間に対応する評価値は不均衡に設定されてもよい。さらに、演奏された楽器とリファレンス音情報のピッチに基づいて、判定基準は変更されてもよい。例えば、高音域が出しにくい楽器を用いて高音の評価を行う場合、リファレンス音情報のピッチPrefを基準とした所定のピッチ範囲を大きくしたり、該ピッチ範囲を細かく分割してもよい。また、評価部111は、特徴量取得部105からFIFOに保存された所定区間のピッチデータを取得する際、所定区間のピッチデータに関連付けられた音量データを取得し、有効区間又は所定区間における音量の変動が少ない場合、該所定区間のピッチデータに対する評価値に加重値を付与してもよい。   When a predetermined pitch range based on the pitch Pref of the reference sound information is divided into a plurality of sections and an evaluation value for the pitch data of the predetermined section is calculated, the evaluation value corresponding to each section depends on the musical instrument played. It may be changeable. When the predetermined reference sound information is sharp (#) or flat (♭), the evaluation value corresponding to each section may be set to be unbalanced. Furthermore, the determination criterion may be changed based on the musical instrument played and the pitch of the reference sound information. For example, when a high tone is evaluated using an instrument that does not easily produce a high pitch range, a predetermined pitch range based on the pitch Pref of the reference sound information may be increased, or the pitch range may be finely divided. Further, when the evaluation unit 111 acquires the pitch data of the predetermined section stored in the FIFO from the feature amount acquisition unit 105, the evaluation unit 111 acquires volume data associated with the pitch data of the predetermined section, and the volume in the effective section or the predetermined section When there is little fluctuation in the weight, a weight value may be given to the evaluation value for the pitch data in the predetermined section.

また、評価部111は、有効区間のピッチデータの統計をとり、該有効区間のピッチの度数分布に基づいて、該有効区間が含まれる所定区間のピッチデータに対する評価値を算出してもよい。図8Aは、評価部111による、該有効区間のピッチの度数分布に基づいて、該所定区間におけるピッチデータの評価値を算出する概念の一例を説明するための図である。図8Aに示すように、評価部111は、所定のリファレンス音情報のピッチPrefに基づいて、該所定のリファレンス音情報のピッチPrefを基準とした、ピッチPref−aセント〜ピッチPref+aセントのピッチ範囲801を設定する。さらに、評価部111は、ピッチ範囲801における加重値Aを設定する。例えば、加重値Aは100点としてもよい。評価部111は、有効区間の全ピッチに対するピッチ範囲801におけるピッチの度数の割合に加重値A(100点)を掛け、得られた点数を該有効区間が含まれる所定区間のピッチデータの評価値とする。ピッチ範囲801におけるピッチの度数が高いほど、該有効区間が含まれる所定区間のピッチデータの評価値が高くなる。評価部111は、所定区間のピッチデータの評価値が所定の点数以上である場合、該所定区間のピッチデータの評価値を一律に100点(合格)としてもよい。ピッチ範囲801における有効区間のピッチの度数が低いほど、該有効区間が含まれる所定区間のピッチデータの評価値は低くなる。例えば、ピッチ範囲801に有効区間のピッチが存在しない場合、評価部111は、該有効区間が含まれる所定区間のピッチデータの評価値を0点(不合格)とする。また、評価部111は、所定区間のピッチデータの評価値が所定の点数未満である場合、該所定区間のピッチデータの評価値を一律に0点(不合格)としてもよい。   Further, the evaluation unit 111 may take statistics of the pitch data of the effective section and calculate an evaluation value for the pitch data of the predetermined section including the effective section based on the frequency distribution of the pitch of the effective section. FIG. 8A is a diagram for explaining an example of a concept of calculating an evaluation value of pitch data in the predetermined section based on the frequency distribution of the pitch in the effective section by the evaluation unit 111. As shown in FIG. 8A, the evaluation unit 111, based on the pitch Pref of the predetermined reference sound information, uses the pitch Pref of the predetermined reference sound information as a reference, and a pitch range of pitch Pref-a cent to pitch Pref + a cent. 801 is set. Further, the evaluation unit 111 sets a weight value A in the pitch range 801. For example, the weight value A may be 100 points. The evaluation unit 111 multiplies the ratio of the frequency of pitches in the pitch range 801 with respect to all pitches in the effective section by a weight value A (100 points), and uses the obtained score as an evaluation value of pitch data in a predetermined section including the effective section And The higher the frequency of the pitch in the pitch range 801, the higher the evaluation value of the pitch data in the predetermined section including the effective section. When the evaluation value of the pitch data in the predetermined section is equal to or greater than a predetermined score, the evaluation unit 111 may uniformly set the evaluation value of the pitch data in the predetermined section as 100 points (pass). As the frequency of the pitch of the effective section in the pitch range 801 is lower, the evaluation value of the pitch data of the predetermined section including the effective section is lower. For example, when the pitch of the effective section does not exist in the pitch range 801, the evaluation unit 111 sets the evaluation value of the pitch data of the predetermined section including the effective section as 0 points (failed). Further, when the evaluation value of the pitch data in the predetermined section is less than the predetermined score, the evaluation unit 111 may uniformly set the evaluation value of the pitch data in the predetermined section to 0 point (fail).

尚、所定のリファレンス音情報のピッチPrefを基準とした所定のピッチ範囲は、複数の区間に分割されもよい。評価部111は、各区間における有効区間のピッチの度数分布に基づいて、所定区間におけるピッチデータの評価値を算出することができる。図8Bは、評価部111による、該有効区間のピッチの度数分布に基づいて、該所定区間におけるピッチデータの評価値を算出する概念の別の一例を説明するための図である。図8Bに示すように、評価部111は、所定のリファレンス音情報のピッチPrefに基づいて、該所定のリファレンス音情報のピッチPrefを基準とした、ピッチPref−aセント〜ピッチPref+aセントのピッチ範囲801を設定する。さらに、評価部111は、ピッチ範囲801を3つの区間(区間803、区間805及び区間807)に分割する。尚、分割された区間の数は、3つに限定されるわけではない。   The predetermined pitch range based on the pitch Pref of the predetermined reference sound information may be divided into a plurality of sections. The evaluation unit 111 can calculate the evaluation value of the pitch data in the predetermined section based on the frequency distribution of the pitch of the effective section in each section. FIG. 8B is a diagram for explaining another example of the concept of calculating the evaluation value of the pitch data in the predetermined section based on the frequency distribution of the pitch in the effective section by the evaluation unit 111. As shown in FIG. 8B, the evaluation unit 111 determines a pitch range from pitch Pref-a cent to pitch Pref + a cent based on the pitch Pref of the predetermined reference sound information based on the pitch Pref of the predetermined reference sound information. 801 is set. Further, the evaluation unit 111 divides the pitch range 801 into three sections (section 803, section 805, and section 807). Note that the number of divided sections is not limited to three.

図8Bにおいて、区間803は、所定のリファレンス音情報のピッチPrefを基準とした、ピッチPref−bセント〜ピッチPref+bセントのピッチ範囲を示し、区間805は、ピッチPref+bセント〜ピッチPref+aセントのピッチ範囲を示し、区間807は、ピッチPref−bセント〜ピッチPref−aセントのピッチ範囲を示している。ここでは、a>bである。評価部111は、ピッチ範囲801における区間803、区間805及び区間807に対して、それぞれ加重値A、加重値B及び加重値Cを設定する。例えば、区間803に対する加重値Aは100点であってもよい。区間805及び区間807に対する加重値B及び加重値Cは、加重値Aより小さければ特に限定されず、加重値B及び加重値Cは同一であってもよく、異なっていてもよい。例えば、加重値B及び加重値Cは60点であってもよい。尚、分割された区間に対応する加重値は、所定のリファレンス音情報のピッチPrefに近いほど相対的に高く設定し、所定のリファレンス音情報のピッチPrefから離れるほど相対的に低く設定する。   In FIG. 8B, a section 803 indicates a pitch range of pitch Pref-b cent to pitch Pref + b cent based on a pitch Pref of predetermined reference sound information, and a section 805 indicates a pitch range of pitch Pref + b cent to pitch Pref + a cent. A section 807 indicates a pitch range from pitch Pref-b cent to pitch Pref-a cent. Here, a> b. The evaluation unit 111 sets a weight value A, a weight value B, and a weight value C for the sections 803, 805, and 807 in the pitch range 801, respectively. For example, the weight value A for the section 803 may be 100 points. The weight values B and C for the sections 805 and 807 are not particularly limited as long as they are smaller than the weight value A, and the weight values B and C may be the same or different. For example, the weight value B and the weight value C may be 60 points. The weight value corresponding to the divided section is set to be relatively higher as it is closer to the pitch Pref of the predetermined reference sound information, and is set to be relatively lower as it is farther from the pitch Pref of the predetermined reference sound information.

評価部111は、区間803のピッチの度数の割合に加重値A(100点)を掛けて、区間803の評価値を算出する。同様に、評価部111は、区間805のピッチの度数の割合に加重値B(60点)を掛けて、区間805の評価値を算出する。また、評価部111は、区間807のピッチの度数の割合に加重値C(60点)を掛けて、区間807の評価値を算出する。評価部111は、区間803の評価値、区間805の評価値及び区間807の評価値を合算して得られた点数を有効区間が含まれる所定区間のピッチデータの評価値とする。ピッチ範囲801におけるピッチの度数が高いほど、該有効区間が含まれる所定区間のピッチデータの評価値が高くなる。特に、ピッチ範囲801における、区間803のピッチの度数が高いほど、つまり、有効区間のピッチがリファレンス音情報のピッチPrefに近いほど、該有効区間が含まれる所定区間のピッチデータの評価値が高くなる。評価部111は、所定区間のピッチデータの評価値が所定の点数以上である場合、該所定区間のピッチデータの評価値を一律に100点(合格)としてもよい。一方、ピッチ範囲801における有効区間のピッチの度数が低いほど、つまり、有効区間のピッチがリファレンス音情報のピッチPrefから離れるほど、該有効区間が含まれる所定区間のピッチデータの評価値は低くなる。例えば、ピッチ範囲801に有効区間のピッチデータが存在しない場合、評価部111は、該有効区間が含まれる所定区間のピッチデータの評価値を0点(不合格)とする。また、評価部111は、所定区間のピッチデータの評価値が所定の点数未満である場合、該所定区間のピッチデータの評価値を一律に0点(不合格)としてもよい。   The evaluation unit 111 calculates the evaluation value of the section 803 by multiplying the ratio of the frequency of the pitch of the section 803 by the weight value A (100 points). Similarly, the evaluation unit 111 calculates the evaluation value of the section 805 by multiplying the ratio of the frequency of the pitch of the section 805 by the weight value B (60 points). In addition, the evaluation unit 111 calculates the evaluation value of the section 807 by multiplying the ratio of the frequency of the pitch of the section 807 by the weight value C (60 points). The evaluation unit 111 sets the score obtained by adding the evaluation value of the section 803, the evaluation value of the section 805, and the evaluation value of the section 807 as the evaluation value of the pitch data of the predetermined section including the effective section. The higher the frequency of the pitch in the pitch range 801, the higher the evaluation value of the pitch data in the predetermined section including the effective section. In particular, the higher the pitch frequency of the section 803 in the pitch range 801, that is, the closer the pitch of the effective section is to the pitch Pref of the reference sound information, the higher the evaluation value of the pitch data of the predetermined section including the effective section is. Become. When the evaluation value of the pitch data in the predetermined section is equal to or greater than a predetermined score, the evaluation unit 111 may uniformly set the evaluation value of the pitch data in the predetermined section as 100 points (pass). On the other hand, as the frequency of the effective section in the pitch range 801 is lower, that is, as the pitch of the effective section is farther from the pitch Pref of the reference sound information, the evaluation value of the pitch data of the predetermined section including the effective section becomes lower. . For example, when there is no pitch data in the valid section in the pitch range 801, the evaluation unit 111 sets the evaluation value of the pitch data in the predetermined section including the valid section as 0 (failed). Further, when the evaluation value of the pitch data in the predetermined section is less than the predetermined score, the evaluation unit 111 may uniformly set the evaluation value of the pitch data in the predetermined section to 0 point (fail).

図8Bに示すように、リファレンス音情報のピッチPrefを基準とした所定のピッチ範囲を複数の区間に分割して、所定区間のピッチデータに対する評価値を算出する場合、各区間に対応する加重値は、演奏された楽器によって変更可能であってもよい。また、所定のリファレンス音情報がシャープ(#)又はフラット(♭)である場合、各区間に対応する加重値は不均衡に設定されてもよい。さらに、演奏された楽器とリファレンス音情報のピッチに基づいて、判定基準は変更されてもよい。例えば、高音域が出しにくい楽器を用いて高音の評価を行う場合、リファレンス音情報のピッチPrefを基準とした所定のピッチ範囲を大きくしたり、該ピッチ範囲を細かく分割してもよい。また、評価部111は、特徴量取得部105からFIFOに保存された所定区間のピッチデータを取得する際、所定区間のピッチデータに関連付けられた音量データを取得し、有効区間又は所定区間における音量の変動が少ない場合、該所定区間のピッチデータに対する評価値に加重値を付与してもよい。   As shown in FIG. 8B, when the predetermined pitch range based on the pitch Pref of the reference sound information is divided into a plurality of sections and the evaluation value for the pitch data of the predetermined section is calculated, the weight value corresponding to each section May be changeable depending on the instrument played. Further, when the predetermined reference sound information is sharp (#) or flat (♭), the weight value corresponding to each section may be set to be unbalanced. Furthermore, the determination criterion may be changed based on the musical instrument played and the pitch of the reference sound information. For example, when a high tone is evaluated using an instrument that does not easily produce a high pitch range, a predetermined pitch range based on the pitch Pref of the reference sound information may be increased, or the pitch range may be finely divided. Further, when the evaluation unit 111 acquires the pitch data of the predetermined section stored in the FIFO from the feature amount acquisition unit 105, the evaluation unit 111 acquires volume data associated with the pitch data of the predetermined section, and the volume in the effective section or the predetermined section When there is little fluctuation in the weight, a weight value may be given to the evaluation value for the pitch data in the predetermined section.

また、評価部111は、所定区間のピッチデータに対する評価値が、所定回数以上連続して閾値以上である場合、或は、所定回数以上連続して合格である場合、入力音に対して最終的な合格とする評価を行う。この場合、評価部111は、所定区間のピッチデータに対する評価値の中から最も高い点数を入力音に対する最終的な評価値としてもよく、所定区間のピッチデータに対する評価値の平均点を演奏者の入力音に対する最終的な評価値としてもよい。また、評価部111は、所定区間のピッチデータに対する評価値が閾値以上である期間の長さ、即ち、合格と判定された期間の長さに基づいて、最終的な評価値に加重値を付与してもよく、入力音のピッチがリファレンス音情報のピッチPrefを基準とした所定のピッチ範囲内にある期間が長いほど、さらに加重値を付与してもよい。また、評価部111は、所定の数以上の連続する所定区間のピッチデータに対する評価値に対しローパスフィルタをかけ、ノイズ成分を除去した評価値が一定以上連続する場合、演奏者の入力音に対して最終的な合格とする評価を行ってもよい。また、評価部111は、入力音のピッチ取得開始時点から、入力音のピッチがリファレンス音情報のピッチPrefを基準とした所定のピッチ範囲内に入る時間が所定の時間よりも短い場合は、最終的な評価値に加重値を付与してもよい。この場合、所定の時間は、任意に設定することができる。   The evaluation unit 111 determines the final value for the input sound when the evaluation value for the pitch data of the predetermined section is equal to or greater than the threshold value for a predetermined number of times or when the evaluation value is continuously for the predetermined number of times. To make a pass. In this case, the evaluation unit 111 may use the highest score among the evaluation values for the pitch data in the predetermined section as the final evaluation value for the input sound, and determine the average score of the evaluation values for the pitch data in the predetermined section. The final evaluation value for the input sound may be used. In addition, the evaluation unit 111 assigns a weight value to the final evaluation value based on the length of the period in which the evaluation value for the pitch data of the predetermined section is equal to or greater than the threshold, that is, the length of the period determined to be acceptable. Alternatively, a weight may be further added as the period during which the pitch of the input sound is within a predetermined pitch range based on the pitch Pref of the reference sound information is longer. Further, the evaluation unit 111 applies a low pass filter to the evaluation value for the pitch data of a predetermined predetermined number or more of continuous intervals, and when the evaluation value from which the noise component is removed continues for a certain level or more, And final evaluation may be performed. In addition, the evaluation unit 111 determines that the final time when the input sound pitch falls within a predetermined pitch range with reference to the pitch Pref of the reference sound information is shorter than the predetermined time from the start point of the input sound pitch acquisition. A weight value may be given to a typical evaluation value. In this case, the predetermined time can be arbitrarily set.

評価部111は、以上に述べたような方法により、所定区間のピッチデータに対する評価値を算出し、算出した評価値を表示部15に伝達する。表示部15は、伝達された評価値に基づいて、所定区間のピッチデータに対する評価を楽器の演奏者が認識できるように結果を表示する。尚、評価部111による所定区間のピッチデータに対する評価値の算出方法を以上に説明したが、評価値の算出方法は、以上に述べた方法に限定されるわけではない。   The evaluation unit 111 calculates an evaluation value for the pitch data of a predetermined section by the method described above, and transmits the calculated evaluation value to the display unit 15. The display unit 15 displays the result based on the transmitted evaluation value so that the musical instrument player can recognize the evaluation of the pitch data in the predetermined section. Although the evaluation value calculation method for the pitch data of the predetermined section by the evaluation unit 111 has been described above, the evaluation value calculation method is not limited to the method described above.

尚、以上では、評価部111が、所定区間の有効区間のピッチデータと対応するリファレンス音情報とを比較し、比較結果に基づいて該所定区間のピッチデータに対する評価値を算出する方法を説明した。しかしながら、評価機能100において有効区間特定部107が省略される場合、評価部111は、所定区間のピッチデータの全体又は任意の一部のピッチデータと、対応するリファレンス音情報とを比較し、比較結果に基づいて該所定区間のピッチデータに対する評価値を算出してもよい。この際、評価部111は、所定区間のピッチデータ全体又は任意の一部のピッチデータの代表ピッチを特定して、図7A及び図7Bを参照して説明したように、所定区間のピッチデータに対する評価値を算出してもよい。また、評価部111は、所定区間のピッチデータ全体又は任意の一部のピッチの度数分布に基づいて、図8A及び図8Bを参照して説明したように、所定区間のピッチデータに対する評価値を算出してもよい。   In the above description, the evaluation unit 111 compares the pitch data of the valid section of the predetermined section with the corresponding reference sound information, and calculates the evaluation value for the pitch data of the predetermined section based on the comparison result. . However, when the valid section specifying unit 107 is omitted in the evaluation function 100, the evaluation unit 111 compares the entire pitch data of the predetermined section or any part of the pitch data with the corresponding reference sound information, and compares them. An evaluation value for the pitch data of the predetermined section may be calculated based on the result. At this time, the evaluation unit 111 specifies the representative pitch of the entire pitch data of the predetermined section or an arbitrary part of the pitch data, and as described with reference to FIGS. 7A and 7B, An evaluation value may be calculated. In addition, the evaluation unit 111 calculates the evaluation value for the pitch data of the predetermined section, as described with reference to FIGS. 8A and 8B, based on the entire pitch data of the predetermined section or an arbitrary part of the frequency distribution of the pitch. It may be calculated.

評価部111は、所定区間のピッチデータに対する評価値を順次算出して、複数の入力音が連続するフレーズの評価を行う。評価部111は、フレーズにおける各音に対する評価値の平均を、該フレーズに対する最終的な評価値として出力してもよい。また、評価部111は、フレーズにおける入力音の切り替えが円滑である場合、最終的な評価値に加重値を付与してもよく、フレーズにおける入力音の切り替えが円滑でない場合、最終的な評価値を減点してもよい。例えば、評価部111は、入力音の切り替え区間が所定期間未満であれば、入力音の切り替えが円滑であると判定してもよく、入力音の切り替え区間が所定期間以上であれば、入力音の切り替えが円滑でないと判定してもよい。また、評価部111は、入力音の切り替え区間における線形近似曲線の傾きの絶対値が所定の値以上であれば、入力音の切り替えが円滑であると判定してもよい。また、評価部111は、入力音の切り替え区間における線形近似曲線の傾きの絶対値に基づいて、最終的な評価値に対する加重値又は減点値を決定してもよい。   The evaluation unit 111 sequentially calculates evaluation values for pitch data in a predetermined section, and evaluates a phrase in which a plurality of input sounds are continuous. The evaluation unit 111 may output the average evaluation value for each sound in the phrase as the final evaluation value for the phrase. Further, the evaluation unit 111 may give a weight value to the final evaluation value when the input sound switching in the phrase is smooth, and the final evaluation value when the input sound switching in the phrase is not smooth. May be deducted. For example, the evaluation unit 111 may determine that the input sound switching is smooth if the input sound switching interval is less than a predetermined period, and if the input sound switching interval is equal to or longer than the predetermined period, the input sound It may be determined that the switching is not smooth. Further, the evaluation unit 111 may determine that the switching of the input sound is smooth if the absolute value of the slope of the linear approximation curve in the input sound switching section is equal to or greater than a predetermined value. Further, the evaluation unit 111 may determine a weighted value or a deduction value for the final evaluation value based on the absolute value of the slope of the linear approximation curve in the input sound switching section.

また、評価部111は、フレーズにおける各音の代表音量を特定し、各音の代表音量が均一であれば、最終的な評価値に加重値を付与してもよい。   Further, the evaluation unit 111 may specify a representative volume of each sound in the phrase, and may assign a weight value to the final evaluation value if the representative volume of each sound is uniform.

また、評価部111は、フレーズにおける各音の平均ピッチを求め、各音の平均ピッチと、対応するリファレンス音情報とを比較し、比較結果に基づいて、最終的な評価値に対する加重値又は減点値を決定してもよい。例えば、各音の平均ピッチと対応するリファレンス音情報との差が所定値未満であれば、最終的な評価値に加重値を付与してもよく、各音の平均ピッチと対応するリファレンス音情報との差が所定値以上であれば、最終的な評価値を減点してもよい。   Further, the evaluation unit 111 obtains an average pitch of each sound in the phrase, compares the average pitch of each sound with the corresponding reference sound information, and based on the comparison result, a weighted value or a deduction point for the final evaluation value The value may be determined. For example, if the difference between the average pitch of each sound and the corresponding reference sound information is less than a predetermined value, a weight value may be given to the final evaluation value, and the reference sound information corresponding to the average pitch of each sound If the difference between and is equal to or greater than a predetermined value, the final evaluation value may be deducted.

以上に述べた評価機能100によると、所定区間のピッチデータから有効区間を特定し、有効区間のピッチデータに基づいて所定区間のピッチデータを評価することにより、演奏音や歌唱音声などの種々の入力音について、決められた連続する複数の音高に対する精度の高い評価を行うことができる。   According to the evaluation function 100 described above, an effective section is specified from the pitch data of a predetermined section, and the pitch data of the predetermined section is evaluated based on the pitch data of the effective section. The input sound can be evaluated with high accuracy with respect to a plurality of predetermined continuous pitches.

(変形例)
以上に述べた評価機能100では、有効区間特定部107において、所定区間における有効区間は、該所定区間のピッチデータに基づいて、特定されている。しかしながら、有効区間特定部107は、特徴量取得部105によって取得された特徴量のうち、音量データに基づいて、所定区間における有効区間を特定することもできる。
(Modification)
In the evaluation function 100 described above, the effective section specifying unit 107 specifies the effective section in the predetermined section based on the pitch data of the predetermined section. However, the effective section specifying unit 107 can also specify the effective section in the predetermined section based on the volume data among the feature amounts acquired by the feature amount acquiring unit 105.

有効区間特定部107は、特徴量取得部105からFIFOに保存された所定区間の音量データを順次取得し、取得した所定区間の音量データの変化量に基づいて、該所定区間における有効区間を特定する。例えば、有効区間特定部107は、所定区間の音量の変動が所定の閾値以下の区間を、該所定区間における有効区間を特定することができる。   The effective section specifying unit 107 sequentially acquires volume data of a predetermined section stored in the FIFO from the feature amount acquisition unit 105, and specifies an effective section in the predetermined section based on the obtained change amount of the volume data of the predetermined section. To do. For example, the effective interval specifying unit 107 can specify an effective interval in the predetermined interval for the interval in which the volume fluctuation in the predetermined interval is not more than a predetermined threshold.

図9は、有効区間特定部107による、所定区間における有効区間特定の概念の一例を説明するための図である。図9は、所定区間における音量データの時系列の変動を示している。図9において、所定区間はt0〜tiとする。有効区間特定部107は、所定区間t0〜tiの音量データを取得すると、取得した音量データにおける音量の線形近似を行い、線形近似曲線の傾きを求める。有効区間特定部107は、所定区間t0〜tiにおいて、音量の線形近似曲線の傾きの絶対値が所定の閾値未満である区間を有効区間と特定する。所定の閾値は、任意であり、評価装置10の使用者によって設定されてもよい。図9では、tb〜tdを有効区間として示しており、有効区間tb〜tdにおける音量の線形近似曲線の傾きの絶対値は、所定の閾値未満である。例えば、所定区間t0〜tiにおける有効区間tb〜tdにおいて、tbにおける音量の線形近似曲線Bの傾きの絶対値、tcにおける音量の線形近似曲線Cの傾きの絶対値、及びtdにおける音量の線形近似曲線Dの傾きの絶対値は、所定の閾値未満である。一方、所定区間t0〜tiにおける有効区間tb〜tdを除いた区間であるt0〜tb区間及びtd〜ti区間における音量の線形近似曲線の傾きの絶対値、例えば、taにおける線形近似曲線Aの傾きの絶対値、teにおける線形近似曲線の傾きの絶対値、及びtfにおける線形近似曲線の傾きの絶対値は、該所定の閾値以上である。   FIG. 9 is a diagram for explaining an example of a concept of specifying an effective section in a predetermined section by the effective section specifying unit 107. FIG. 9 shows time-series fluctuations in volume data in a predetermined section. In FIG. 9, the predetermined section is t0 to ti. When acquiring the volume data of the predetermined sections t0 to ti, the valid section specifying unit 107 performs linear approximation of the volume in the acquired volume data and obtains the slope of the linear approximation curve. The effective section specifying unit 107 specifies a section where the absolute value of the slope of the linear approximation curve of the volume is less than a predetermined threshold in the predetermined sections t0 to ti as the effective section. The predetermined threshold value is arbitrary and may be set by the user of the evaluation device 10. In FIG. 9, tb to td are shown as effective intervals, and the absolute value of the slope of the linear approximate curve of the sound volume in the effective intervals tb to td is less than a predetermined threshold. For example, in the effective sections tb to td in the predetermined section t0 to ti, the absolute value of the slope of the linear approximate curve B of the volume at tb, the absolute value of the slope of the linear approximate curve C of the volume at tc, and the linear approximation of the volume at td The absolute value of the slope of the curve D is less than a predetermined threshold value. On the other hand, the absolute value of the slope of the linear approximation curve of the volume in the t0 to tb section and the td to ti section, excluding the effective sections tb to td in the predetermined section t0 to ti, for example, the slope of the linear approximation curve A at ta , The absolute value of the slope of the linear approximation curve at te, and the absolute value of the slope of the linear approximation curve at tf are equal to or greater than the predetermined threshold.

このように、有効区間特定部107は、所定区間の音量データに基づいて、該所定区間における有効区間を特定することができる。尚、有効区間特定部107における、所定区間の音量データを用いた有効区間の特定方法は、図9を参照して述べた方法に限定されるわけではない。   As described above, the valid section specifying unit 107 can specify the valid section in the predetermined section based on the volume data of the predetermined section. Note that the method of specifying the effective section using the volume data of the predetermined section in the effective section specifying unit 107 is not limited to the method described with reference to FIG.

有効区間特定部107によって、音量データに基づいて所定区間における有効区間を特定した後は、前述したように、評価部111によって有効区間のピッチデータに基づいて該有効区間が含まれる所定区間のピッチデータに対する評価値の算出が行われる。   After the effective section specifying unit 107 specifies the effective section in the predetermined section based on the volume data, the pitch of the predetermined section including the effective section based on the pitch data of the effective section is evaluated by the evaluation unit 111 as described above. An evaluation value is calculated for the data.

本発明の実施形態として説明した構成を基にして、当業者が適宜構成要素の追加、削除もしくは設計変更を行ったもの、又は、工程の追加、省略もしくは条件変更を行ったものも、本発明の要旨を備えている限り、本発明の範囲に含まれる。   Based on the configuration described as the embodiment of the present invention, those in which a person skilled in the art appropriately added, deleted, or changed the design of the component, or added, omitted, or changed conditions of the process are also included in the present invention. As long as the gist of the present invention is provided, the scope of the present invention is included.

また、上述した実施形態の態様によりもたらされる作用効果とは異なる他の作用効果であっても、本明細書の記載から明らかなもの、又は、当業者において容易に予測し得るものについては、当然に本発明によりもたらされると解される。   Of course, other operational effects that are different from the operational effects brought about by the above-described embodiment are obvious from the description of the present specification or can be easily predicted by those skilled in the art. It is understood that this is brought about by the present invention.

10:評価装置、11:制御部、13:記憶部、15:表示部、17:信号処理部、19:音入力部、21:操作部、23:通信部、100:評価機能、103:入力音取得部、105:特徴量取得部、107:有効区間特定部、109:切り替え判定部、111:評価部 10: evaluation device, 11: control unit, 13: storage unit, 15: display unit, 17: signal processing unit, 19: sound input unit, 21: operation unit, 23: communication unit, 100: evaluation function, 103: input Sound acquisition unit, 105: feature amount acquisition unit, 107: effective section identification unit, 109: switching determination unit, 111: evaluation unit

Claims (9)

コンピュータに、
入力音を取得し、
前記入力音に基づいてピッチデータを時系列に取得し、取得した前記ピッチデータのうち、所定区間のピッチデータを所定の時間ごとに蓄積し順次更新し、
前記所定区間のピッチデータと所定のリファレンス音情報とを比較し、比較結果に基づいて前記所定区間のピッチデータの評価値を算出し、
前記所定区間のピッチデータに対応する期間の入力音に基づいて、前記リファレンス音情報を切り替えるかどうかを判定し、
前記リファレンス音情報を切り替える場合、前記所定区間のピッチデータと前記所定のリファレンス音情報とは異なる所定のリファレンス音情報とを比較し、比較結果に基づいて前記所定区間のピッチデータの評価値を算出すること、
を実行させるためのプログラム。
On the computer,
Get the input sound,
Pitch data is acquired in time series based on the input sound, among the acquired pitch data, the pitch data of a predetermined section is accumulated and updated every predetermined time,
The pitch data of the predetermined section is compared with predetermined reference sound information, and an evaluation value of the pitch data of the predetermined section is calculated based on the comparison result,
Determine whether to switch the reference sound information based on the input sound of the period corresponding to the pitch data of the predetermined section,
When switching the reference sound information, the pitch data of the predetermined section is compared with predetermined reference sound information different from the predetermined reference sound information, and the evaluation value of the pitch data of the predetermined section is calculated based on the comparison result To do,
A program for running
前記リファレンス音情報を切り替えるかどうかを判定することとして、前記所定区間のピッチデータに基づいて、前記リファレンス音情報を切り替えるかどうか判定すること、を前記コンピュータに実行させる請求項1に記載のプログラム。   The program according to claim 1, wherein the computer is configured to determine whether to switch the reference sound information based on pitch data of the predetermined section as the determination of whether to switch the reference sound information. 前記リファレンス音情報を切り替えるかどうかを判定することとして、前記所定区間の音量データに基づいて、前記リファレンス音情報を切り替えるかどうか判定すること、を前記コンピュータに実行させる請求項1に記載のプログラム。   2. The program according to claim 1, wherein the computer is configured to determine whether to switch the reference sound information based on volume data of the predetermined section as the determination of whether to switch the reference sound information. 前記所定区間の入力音に基づいて、前記所定区間における、前記所定のリファレンス音情報との比較対象となる区間を特定すること、を前記コンピュータにさらに実行させる、請求項1乃至請求項3の何れか一項に記載のプログラム。   4. The computer according to claim 1, further comprising: identifying, based on the input sound of the predetermined section, a section to be compared with the predetermined reference sound information in the predetermined section. 5. A program according to any one of the above. 前記所定区間のピッチデータの評価値を算出することとして、前記所定区間における代表ピッチを特定し、前記代表ピッチと前記所定のリファレンス音情報のピッチと比較して、前記所定区間のピッチデータの評価値を算出すること、を前記コンピュータに実行させる、請求項1乃至請求項4の何れか一項に記載のプログラム。   By calculating the evaluation value of the pitch data in the predetermined section, the representative pitch in the predetermined section is specified, and the pitch data in the predetermined section is evaluated by comparing the representative pitch with the pitch of the predetermined reference sound information. The program according to any one of claims 1 to 4, which causes the computer to calculate a value. 前記所定区間のピッチデータの評価値を算出することとして、前記所定区間におけるピッチデータが前記所定のリファレンス音情報に対応するピッチを基準とした所定のピッチ範囲内であるか否かに基づいて、前記所定区間のピッチデータの評価値を算出すること、を前記コンピュータに実行させる、請求項1乃至請求項4の何れか一項に記載のプログラム。   Based on whether or not the pitch data in the predetermined section is within a predetermined pitch range based on the pitch corresponding to the predetermined reference sound information, as the evaluation value of the pitch data in the predetermined section is calculated. The program according to any one of claims 1 to 4, which causes the computer to execute an evaluation value of pitch data of the predetermined section. 前記所定区間のピッチデータの評価値を算出することとして、前記所定区間におけるピッチデータの度数分布に基づいて、前記所定区間のピッチデータの評価値を算出すること、を前記コンピュータに実行させる、請求項1乃至請求項4の何れか一項に記載のプログラム。   Calculating the evaluation value of the pitch data in the predetermined section based on the frequency distribution of the pitch data in the predetermined section, and calculating the evaluation value of the pitch data in the predetermined section. The program as described in any one of Claim 1 thru | or 4. 入力音を取得する入力音取得部と、
前記入力音に基づいてピッチデータを時系列に取得し、取得した前記ピッチデータのうち、所定区間のピッチデータを所定の時間ごとに蓄積し順次更新する特徴量取得部と、
前記所定区間のピッチデータと所定のリファレンス音情報とを比較し、比較結果に基づいて前記所定区間のピッチデータの評価値を算出する評価部と、
前記所定区間のピッチデータに対応する期間の入力音に基づいて、前記リファレンス音情報を切り替えるかどうかを判定する切り替え判定部と、
を備え、
前記切り替え判定部が前記リファレンス音情報を切り替えると判定する場合、前記評価部は、前記所定区間のピッチデータと前記所定のリファレンス音情報とは異なる所定のリファレンス音情報とを比較し、比較結果に基づいて前記所定区間のピッチデータの評価値を算出する、評価装置。
An input sound acquisition unit for acquiring the input sound;
A feature amount acquisition unit that acquires pitch data in a time series based on the input sound, and accumulates and sequentially updates pitch data of a predetermined section of the acquired pitch data for each predetermined time;
An evaluation unit that compares the pitch data of the predetermined section with predetermined reference sound information, and calculates an evaluation value of the pitch data of the predetermined section based on a comparison result;
A switching determination unit that determines whether to switch the reference sound information based on an input sound in a period corresponding to the pitch data of the predetermined section;
With
When the switching determination unit determines to switch the reference sound information, the evaluation unit compares the pitch data of the predetermined section with predetermined reference sound information different from the predetermined reference sound information, and determines the comparison result. An evaluation device that calculates an evaluation value of pitch data in the predetermined section based on the evaluation value.
入力音を取得し、
前記入力音に基づいてピッチデータを時系列に取得し、取得した前記ピッチデータのうち、所定区間のピッチデータを所定の時間ごとに蓄積し順次更新し、
前記所定区間のピッチデータと所定のリファレンス音情報とを比較し、比較結果に基づいて前記所定区間のピッチデータの評価値を算出し、
前記所定区間のピッチデータに対応する期間の入力音に基づいて、前記リファレンス音情報を切り替えるかどうかを判定し、
前記リファレンス音情報を切り替える場合、前記所定区間のピッチデータと前記所定のリファレンス音情報とは異なる所定のリファレンス音情報とを比較し、比較結果に基づいて前記所定区間のピッチデータの評価値を算出すること、
を含む、評価方法。
Get the input sound,
Pitch data is acquired in time series based on the input sound, among the acquired pitch data, the pitch data of a predetermined section is accumulated and updated every predetermined time,
The pitch data of the predetermined section is compared with predetermined reference sound information, and an evaluation value of the pitch data of the predetermined section is calculated based on the comparison result,
Determine whether to switch the reference sound information based on the input sound of the period corresponding to the pitch data of the predetermined section,
When switching the reference sound information, the pitch data of the predetermined section is compared with predetermined reference sound information different from the predetermined reference sound information, and the evaluation value of the pitch data of the predetermined section is calculated based on the comparison result To do,
Including evaluation method.
JP2017044931A 2017-03-09 2017-03-09 Evaluation device, evaluation method, and program Pending JP2018146933A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2017044931A JP2018146933A (en) 2017-03-09 2017-03-09 Evaluation device, evaluation method, and program

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2017044931A JP2018146933A (en) 2017-03-09 2017-03-09 Evaluation device, evaluation method, and program

Publications (1)

Publication Number Publication Date
JP2018146933A true JP2018146933A (en) 2018-09-20

Family

ID=63591090

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2017044931A Pending JP2018146933A (en) 2017-03-09 2017-03-09 Evaluation device, evaluation method, and program

Country Status (1)

Country Link
JP (1) JP2018146933A (en)

Similar Documents

Publication Publication Date Title
US10643638B2 (en) Technique determination device and recording medium
US10497348B2 (en) Evaluation device and evaluation method
JP6690181B2 (en) Musical sound evaluation device and evaluation reference generation device
JP2017111268A (en) Technique judgement device
JP6585289B2 (en) Lighting control device, lighting control method, and lighting control program
JP2018146933A (en) Evaluation device, evaluation method, and program
JP6812273B2 (en) Musical instrument sound recognition device and musical instrument sound recognition program
US20220215051A1 (en) Audio analysis method, audio analysis device and non-transitory computer-readable medium
JP2018146929A (en) Evaluation device, evaluation method, and program
JP5585320B2 (en) Singing voice evaluation device
JP5618743B2 (en) Singing voice evaluation device
JP6690446B2 (en) Acoustic analysis device and acoustic analysis method
JP2015194767A (en) Voice evaluation device
JP6144592B2 (en) Singing scoring system
JP6677041B2 (en) Performance analyzer and program
JP2017111274A (en) Data processor
JP6638305B2 (en) Evaluation device
JP6175034B2 (en) Singing evaluation device
JP2009150920A (en) Echo canceller, karaoke machine, echo canceling method and program
JP2017129787A (en) Scoring device
JP2016156917A (en) Singing evaluation device and program
JP5697395B2 (en) Singing voice evaluation apparatus and program
JP2019012118A (en) Karaoke device
JP2015169720A (en) Output sound controller and program
JP2014134687A (en) Acoustic analyzer