JP6705142B2 - 音質判定装置及びプログラム - Google Patents
音質判定装置及びプログラム Download PDFInfo
- Publication number
- JP6705142B2 JP6705142B2 JP2015183718A JP2015183718A JP6705142B2 JP 6705142 B2 JP6705142 B2 JP 6705142B2 JP 2015183718 A JP2015183718 A JP 2015183718A JP 2015183718 A JP2015183718 A JP 2015183718A JP 6705142 B2 JP6705142 B2 JP 6705142B2
- Authority
- JP
- Japan
- Prior art keywords
- unit
- tilt
- overtone
- sound
- sound quality
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
- 238000004364 calculation method Methods 0.000 claims description 42
- 230000014509 gene expression Effects 0.000 claims description 40
- 230000008859 change Effects 0.000 claims description 21
- 238000012886 linear function Methods 0.000 claims description 8
- 230000006870 function Effects 0.000 description 80
- 238000010586 diagram Methods 0.000 description 21
- 238000000034 method Methods 0.000 description 18
- 238000012986 modification Methods 0.000 description 16
- 230000004048 modification Effects 0.000 description 16
- 238000012545 processing Methods 0.000 description 15
- 238000009795 derivation Methods 0.000 description 10
- 238000004891 communication Methods 0.000 description 6
- 230000008569 process Effects 0.000 description 4
- 230000007423 decrease Effects 0.000 description 3
- 230000000694 effects Effects 0.000 description 3
- 238000010801 machine learning Methods 0.000 description 3
- 230000009471 action Effects 0.000 description 2
- 238000013459 approach Methods 0.000 description 2
- 238000009825 accumulation Methods 0.000 description 1
- 230000001419 dependent effect Effects 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 230000005236 sound signal Effects 0.000 description 1
- 230000002194 synthesizing effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/48—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use
- G10L25/51—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for comparison or discrimination
- G10L25/60—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for comparison or discrimination for measuring the quality of voice signals
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10H—ELECTROPHONIC MUSICAL INSTRUMENTS; INSTRUMENTS IN WHICH THE TONES ARE GENERATED BY ELECTROMECHANICAL MEANS OR ELECTRONIC GENERATORS, OR IN WHICH THE TONES ARE SYNTHESISED FROM A DATA STORE
- G10H1/00—Details of electrophonic musical instruments
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10H—ELECTROPHONIC MUSICAL INSTRUMENTS; INSTRUMENTS IN WHICH THE TONES ARE GENERATED BY ELECTROMECHANICAL MEANS OR ELECTRONIC GENERATORS, OR IN WHICH THE TONES ARE SYNTHESISED FROM A DATA STORE
- G10H1/00—Details of electrophonic musical instruments
- G10H1/02—Means for controlling the tone frequencies, e.g. attack or decay; Means for producing special musical effects, e.g. vibratos or glissandos
- G10H1/06—Circuits for establishing the harmonic content of tones, or other arrangements for changing the tone colour
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10H—ELECTROPHONIC MUSICAL INSTRUMENTS; INSTRUMENTS IN WHICH THE TONES ARE GENERATED BY ELECTROMECHANICAL MEANS OR ELECTRONIC GENERATORS, OR IN WHICH THE TONES ARE SYNTHESISED FROM A DATA STORE
- G10H2210/00—Aspects or methods of musical processing having intrinsic musical character, i.e. involving musical theory or musical parameters or relying on musical knowledge, as applied in electrophonic musical tools or instruments
- G10H2210/031—Musical analysis, i.e. isolation, extraction or identification of musical elements or musical parameters from a raw acoustic signal or from an encoded audio signal
- G10H2210/066—Musical analysis, i.e. isolation, extraction or identification of musical elements or musical parameters from a raw acoustic signal or from an encoded audio signal for pitch analysis as part of wider processing for musical purposes, e.g. transcription, musical performance evaluation; Pitch recognition, e.g. in polyphonic sounds; Estimation or use of missing fundamental
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10H—ELECTROPHONIC MUSICAL INSTRUMENTS; INSTRUMENTS IN WHICH THE TONES ARE GENERATED BY ELECTROMECHANICAL MEANS OR ELECTRONIC GENERATORS, OR IN WHICH THE TONES ARE SYNTHESISED FROM A DATA STORE
- G10H2210/00—Aspects or methods of musical processing having intrinsic musical character, i.e. involving musical theory or musical parameters or relying on musical knowledge, as applied in electrophonic musical tools or instruments
- G10H2210/031—Musical analysis, i.e. isolation, extraction or identification of musical elements or musical parameters from a raw acoustic signal or from an encoded audio signal
- G10H2210/091—Musical analysis, i.e. isolation, extraction or identification of musical elements or musical parameters from a raw acoustic signal or from an encoded audio signal for performance evaluation, i.e. judging, grading or scoring the musical qualities or faithfulness of a performance, e.g. with respect to pitch, tempo or other timings of a reference performance
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/03—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
- G10L25/18—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters the extracted parameters being spectral information of each sub-band
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/48—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use
- G10L25/51—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for comparison or discrimination
Description
取得された前記入力音の周波数分布を算出し、算出された前記周波数分布に基づいて、周波数に対する倍音の強度の変化を示すチルトを算出し、算出されたチルトと、当該チルトに関連した閾値とを比較し、比較された結果に基づいて、前記入力音が所定の音質であるか否かを判定することを実行させる。
本発明の第1実施形態における音質判定装置10について説明する。第1実施形態における音質判定装置10は、歌唱する利用者(以下、歌唱者という場合がある)の歌唱音声の音質を判定する機能を備えた装置である。音質判定装置10は、ピッチ(基本周波数)の変化に依存した閾値を用いて音質パラメータを評価し、所定の条件を満たした場合に特定の音質であると判定する機能を備えている。
図1は、本発明の第1実施形態における音質判定装置10の構成を示すブロック図である。音質判定装置10は、例えば、歌唱採点機能を備えたカラオケ装置である。音質判定装置10は、制御部11、記憶部13、操作部15、表示部17、通信部19、および信号処理部21を含む。また、信号処理部21には、音入力部(例えばマイクロフォン)23及び音出力部(例えばスピーカー)25が接続されている。これらの各構成は、バス27を介して相互に接続されている。
音質判定装置10の制御部11が記憶部13に記憶された制御プログラム13aを実行することによって実現される音質判定機能について説明する。なお、以下に説明する音質判定機能を実現する構成の一部または全部は、ハードウエアによって実現されてもよい。
本発明の第2実施形態における音質判定機能100aは、音質パラメータとして、第1実施形態で説明したチルトに加えて倍音比率を用い、チルト及び倍音比率に基づいて裏声判定を行う点で第1実施形態における音質判定機能100とは異なる。ここで、倍音比率とは、基音の周波数に対する倍音の周波数の比率を示すパラメータである。なお、本実施形態では、第1実施形態における音質判定機能100との構成上の差異に注目して説明を行い、同じ部分については同じ符号を付して説明を省略する。
第2実施形態における音質判定機能100aでは、音質パラメータとしてチルト及び倍音比率の両方を用いた例を示したが、図8を用いて説明したように、倍音比率とピッチの関係から簡易的に裏声であるか否かを判定することも可能である。
以上の各実施形態は、必要に応じて適宜変形が可能である。変形例の一例を以下に示す。これらの変形例は、組み合わせて実施されてもよい。
(変形例1)
第1実施形態における音質判定機能100では、周波数分布算出部105から取得したデータに基づいて、閾値Tth導出部109がチルトに関連した閾値(Tth)を導出し、該閾値とチルトとを比較する例を示した。しかし、裏声になるとチルトが急峻なものとなるという傾向は、あまり大きく人に依存しない場合がある。そのため、簡易的には、閾値を一定値とみなして裏声判定を行うことも可能である。
上述した各実施形態では、チルトに関連した閾値(Tth)または倍音比率に関連した閾値(Hth)を予め求めておく例を示したが、これらの閾値を導出するための演算式(関数を含む)のパラメータを適宜変更可能としてもよい。例えば、歌唱者が男性であるか女性であるか等の性別、または、大人であるか子どもであるか等の年齢に応じてパラメータを変更し、閾値を導出するための演算式(例えば係数)を変更することができる。このような演算式の設定パラメータの変更は、自動的に行われてもよいし、手動で行われてもよい。手動で行う場合、例えば、図1に示した音質判定装置10において、操作部15を操作することにより、演算式のパラメータを変更すればよい。
変形例2で説明したパラメータ変更部は、さらに伴奏音に関連づけられた情報に基づいてパラメータを変更するように構成することも可能である。例えば、パラメータ変更部は、伴奏音に関連づけられた、男性パートを示す情報、女性パートを示す情報、子ども用の伴奏音である旨を示す情報等に基づいてパラメータを変更することが可能である。
上述した各実施形態では、音質判定装置として、歌唱者による歌唱音声から裏声を判定する例を示したが、裏声に限るものではなく、チルトや倍音比率を用いて他の音質を判定することも可能である。例えば、チルトが小さく倍音比率が高めに現れるような歌唱音声である場合に、明るい音質であると判定するなど、チルトまたは倍音比率の音質に依存した傾向を把握することにより、様々な音質を判定することも可能である。
上述した各実施形態では、人の歌唱音声の音質(声質)を判定する例を示したが、楽器から発せられた音または合成歌唱音(歌詞を構成する文字に応じた音声素片を組み合わせつつ、指定された音高になるように波形を合成することによって生成された歌唱音)の音質を判定することも可能である。楽器からの発音であっても、人の発声と同様に、周波数分布図において、高調波になるにしたがって、急峻に強度が低くなり、周波数に対する倍音の強度の変化を示すチルト(傾き)が急峻なものとなる場合がある。このような場合に、その楽器からの発音が裏声に相当する音質であると判定することができる。このような音質の発音は、基本的にサイン波に近い音となる。
Claims (11)
- 入力音を取得する取得部と、
前記取得部によって取得された前記入力音の周波数分布を算出する周波数分布算出部と、
前記周波数分布算出部によって算出された前記周波数分布に基づいて、周波数に対する倍音の強度の変化を示すチルトを算出するチルト算出部と、
前記チルト算出部によって算出されたチルトと、当該チルトに関連した閾値とを比較するチルト比較部と、
前記チルト比較部によって比較された結果に基づいて、前記入力音が所定の音質であるか否かを判定する判定部と、
を備えることを特徴とする音質判定装置。 - さらに、前記周波数分布算出部によって算出された前記周波数分布に基づいて、基音の周波数に対する倍音の周波数の比率を示す倍音比率を算出する倍音比率算出部と、
前記倍音比率算出部によって算出された倍音比率と、当該倍音比率に関連した閾値とを比較する倍音比率比較部と、
を備え、
前記判定部は、チルト比較部によって比較された結果及び前記倍音比率比較部によって比較された結果に基づいて、前記入力音が所定の音質であるか否かを判定することを特徴とする請求項1に記載の音質判定装置。 - 前記チルト算出部は、前記周波数分布から複数の倍音にそれぞれ対応する複数の強度を求め、前記複数の強度を用いた直線近似により得た一次関数の傾きを前記チルトとして算出することを特徴とする請求項1に記載の音質判定装置。
- 前記チルトに関連した閾値として、前記周波数分布における基音の周波数を用いて導出された値を用いることを特徴とする請求項1乃至3のいずれか1項に記載の音質判定装置。
- 前記倍音比率に関連した閾値として、前記周波数分布における基音の周波数を用いて導出された値を用いることを特徴とする請求項2に記載の音質判定装置。
- 入力音を取得する取得部と、
前記入力音取得部によって取得された前記入力音の周波数分布を算出する周波数分布算出部と、
前記周波数分布算出部によって算出された前記周波数分布に基づいて、基音に対する倍音の比率を示す倍音比率を算出する倍音比率算出部と、
前記倍音比率算出部によって算出された倍音比率と、当該倍音比率に関連した閾値とを比較する倍音比率比較部と、
前記倍音比率比較部によって比較された結果に基づいて、前記入力音が所定の音質であるか否かを判定する判定部と、
を備え、
前記閾値は、所定の演算式により導出され、
前記演算式のパラメータを変更可能なパラメータ変更部をさらに備えることを特徴とする音質判定装置。 - 前記倍音比率に関連した閾値として、前記周波数分布における基音の周波数を用いて導出された値を用いることを特徴とする請求項6に記載の音質判定装置。
- 前記閾値は、所定の演算式により導出され、
前記演算式のパラメータを変更可能なパラメータ変更部をさらに備えることを特徴とする請求項1乃至5のいずれか1項に記載の音質判定装置。 - 前記入力音の入力期間において出力される伴奏音を選択する選択部をさらに備え、
前記パラメータ変更部は、選択された前記伴奏音に関連付けられた情報に基づいて前記パラメータを変更することを特徴とする請求項8に記載の音質判定装置。 - コンピュータに、
入力音を取得し、
取得された前記入力音の周波数分布を算出し、
算出された前記周波数分布に基づいて、周波数に対する倍音の強度の変化を示すチルトを算出し、
算出されたチルトと、当該チルトに関連した閾値とを比較し、
比較された結果に基づいて、前記入力音が所定の音質であるか否かを判定することを実行させるためのプログラム。 - コンピュータに、
入力音を取得し、
取得された前記入力音の周波数分布を算出し、
算出された前記周波数分布に基づいて、基音に対する倍音の比率を示す倍音比率を算出し、
算出された倍音比率と、当該倍音比率に関連した所定の演算式により導出される閾値とを比較し、
比較された結果に基づいて、前記入力音が所定の音質であるか否かを判定し、
前記演算式のパラメータを変更することを実行させるためのプログラム。
Priority Applications (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2015183718A JP6705142B2 (ja) | 2015-09-17 | 2015-09-17 | 音質判定装置及びプログラム |
PCT/JP2016/076180 WO2017047453A1 (ja) | 2015-09-17 | 2016-09-06 | 音質判定装置及び記録媒体 |
US15/920,532 US10453478B2 (en) | 2015-09-17 | 2018-03-14 | Sound quality determination device, method for the sound quality determination and recording medium |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2015183718A JP6705142B2 (ja) | 2015-09-17 | 2015-09-17 | 音質判定装置及びプログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2017058536A JP2017058536A (ja) | 2017-03-23 |
JP6705142B2 true JP6705142B2 (ja) | 2020-06-03 |
Family
ID=58289169
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2015183718A Expired - Fee Related JP6705142B2 (ja) | 2015-09-17 | 2015-09-17 | 音質判定装置及びプログラム |
Country Status (3)
Country | Link |
---|---|
US (1) | US10453478B2 (ja) |
JP (1) | JP6705142B2 (ja) |
WO (1) | WO2017047453A1 (ja) |
Families Citing this family (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP6728754B2 (ja) * | 2015-03-20 | 2020-07-22 | ヤマハ株式会社 | 発音装置、発音方法および発音プログラム |
JP6759545B2 (ja) * | 2015-09-15 | 2020-09-23 | ヤマハ株式会社 | 評価装置およびプログラム |
CN114242044B (zh) * | 2022-02-25 | 2022-10-11 | 腾讯科技(深圳)有限公司 | 语音质量评估方法、语音质量评估模型训练方法及装置 |
CN114400022B (zh) * | 2022-03-25 | 2022-08-23 | 北京荣耀终端有限公司 | 音质比对的方法、设备和存储介质 |
Family Cites Families (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
TW430778B (en) * | 1998-06-15 | 2001-04-21 | Yamaha Corp | Voice converter with extraction and modification of attribute data |
US20060089836A1 (en) * | 2004-10-21 | 2006-04-27 | Motorola, Inc. | System and method of signal pre-conditioning with adaptive spectral tilt compensation for audio equalization |
EP2256724A1 (en) * | 2008-03-19 | 2010-12-01 | Pioneer Corporation | Overtone production device, acoustic device, and overtone production method |
EP2410522B1 (en) * | 2008-07-11 | 2017-10-04 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio signal encoder, method for encoding an audio signal and computer program |
US8788276B2 (en) * | 2008-07-11 | 2014-07-22 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Apparatus and method for calculating bandwidth extension data using a spectral tilt controlled framing |
JP4709928B1 (ja) * | 2010-01-21 | 2011-06-29 | 株式会社東芝 | 音質補正装置及び音質補正方法 |
EP2362376A3 (en) * | 2010-02-26 | 2011-11-02 | Fraunhofer-Gesellschaft zur Förderung der Angewandten Forschung e.V. | Apparatus and method for modifying an audio signal using envelope shaping |
JP5957798B2 (ja) * | 2011-03-16 | 2016-07-27 | ヤマハ株式会社 | 裏声検出装置および歌唱評価装置 |
US8548803B2 (en) * | 2011-08-08 | 2013-10-01 | The Intellisis Corporation | System and method of processing a sound signal including transforming the sound signal into a frequency-chirp domain |
JP6150276B2 (ja) * | 2012-12-28 | 2017-06-21 | 国立大学法人三重大学 | 発声評価装置、発声評価方法、及びプログラム |
US9672843B2 (en) * | 2014-05-29 | 2017-06-06 | Apple Inc. | Apparatus and method for improving an audio signal in the spectral domain |
-
2015
- 2015-09-17 JP JP2015183718A patent/JP6705142B2/ja not_active Expired - Fee Related
-
2016
- 2016-09-06 WO PCT/JP2016/076180 patent/WO2017047453A1/ja active Application Filing
-
2018
- 2018-03-14 US US15/920,532 patent/US10453478B2/en active Active
Also Published As
Publication number | Publication date |
---|---|
US20180204588A1 (en) | 2018-07-19 |
WO2017047453A1 (ja) | 2017-03-23 |
US10453478B2 (en) | 2019-10-22 |
JP2017058536A (ja) | 2017-03-23 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US10789921B2 (en) | Audio extraction apparatus, machine learning apparatus and audio reproduction apparatus | |
US10453478B2 (en) | Sound quality determination device, method for the sound quality determination and recording medium | |
WO2018084305A1 (ja) | 音声合成方法 | |
JP6690181B2 (ja) | 楽音評価装置及び評価基準生成装置 | |
WO2019107378A1 (ja) | 音声合成方法、音声合成装置およびプログラム | |
JP5223433B2 (ja) | 音声データ処理装置およびプログラム | |
US11842720B2 (en) | Audio processing method and audio processing system | |
Xue et al. | Acoustic and articulatory analysis and synthesis of shouted vowels | |
JP2018077283A (ja) | 音声合成方法 | |
JP5509536B2 (ja) | 音声データ処理装置およびプログラム | |
JP6488767B2 (ja) | 歌唱評価装置およびプログラム | |
JP7124870B2 (ja) | 情報処理方法、情報処理装置およびプログラム | |
JP5618743B2 (ja) | 歌唱音声評価装置 | |
JP7419768B2 (ja) | 楽曲生成方法および楽曲生成システム | |
Miyazaki et al. | Building a measurement model for simulating naturalness of vibrato based on subjective evaluation | |
JP6144592B2 (ja) | 歌唱採点システム | |
JP7127682B2 (ja) | 情報処理方法、情報処理装置およびプログラム | |
WO2016039463A1 (ja) | 音響解析装置 | |
WO2016039465A1 (ja) | 音響解析装置 | |
US20210350783A1 (en) | Sound signal synthesis method, neural network training method, and sound synthesizer | |
JP5262875B2 (ja) | 追従性評価システム,カラオケシステムおよびプログラム | |
JP5697395B2 (ja) | 歌唱音声評価装置およびプログラム | |
JP2018077280A (ja) | 音声合成方法 | |
RU2591640C1 (ru) | Способ модификации голоса и устройство для его осуществления (варианты) | |
JP2015079065A (ja) | 合成情報管理装置および音声合成装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20180725 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20190910 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20191106 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20200414 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20200427 |
|
R151 | Written notification of patent or utility model registration |
Ref document number: 6705142 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R151 |
|
LAPS | Cancellation because of no payment of annual fees |