JP6807461B2 - Music analysis device and music analysis program - Google Patents
Music analysis device and music analysis program Download PDFInfo
- Publication number
- JP6807461B2 JP6807461B2 JP2019533869A JP2019533869A JP6807461B2 JP 6807461 B2 JP6807461 B2 JP 6807461B2 JP 2019533869 A JP2019533869 A JP 2019533869A JP 2019533869 A JP2019533869 A JP 2019533869A JP 6807461 B2 JP6807461 B2 JP 6807461B2
- Authority
- JP
- Japan
- Prior art keywords
- peak
- music data
- music
- smoothing processing
- singing
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000004458 analytical method Methods 0.000 title claims description 17
- 238000009499 grossing Methods 0.000 claims description 28
- 238000006243 chemical reaction Methods 0.000 claims description 21
- 238000001514 detection method Methods 0.000 claims description 14
- 230000004044 response Effects 0.000 claims description 2
- 230000001131 transforming effect Effects 0.000 claims 1
- 238000000034 method Methods 0.000 description 15
- 238000001228 spectrum Methods 0.000 description 6
- 230000006870 function Effects 0.000 description 4
- 230000008569 process Effects 0.000 description 4
- 238000010586 diagram Methods 0.000 description 3
- 230000000694 effects Effects 0.000 description 3
- 238000004364 calculation method Methods 0.000 description 2
- 238000002360 preparation method Methods 0.000 description 2
- 230000007704 transition Effects 0.000 description 2
- 230000005540 biological transmission Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 230000010365 information processing Effects 0.000 description 1
- 238000005070 sampling Methods 0.000 description 1
- 230000001502 supplementing effect Effects 0.000 description 1
- 230000001360 synchronised effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/03—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
- G10L25/18—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters the extracted parameters being spectral information of each sub-band
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/78—Detection of presence or absence of voice signals
- G10L25/81—Detection of presence or absence of voice signals for discriminating voice from music
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Computational Linguistics (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Auxiliary Devices For Music (AREA)
Description
本発明は、楽曲解析装置および楽曲解析プログラムに関する。 The present invention relates to a music analysis device and a music analysis program.
従来、歌唱を含む楽曲データから歌唱部分を消去して、楽曲データをカラオケ等に使用するボイスキャンセル機能を有する楽曲再生装置が知られている(たとえば、特許文献1、特許文献2参照)。
このような楽曲再生装置では、歌唱部分が、LチャンネルとRチャンネルの中間の位置に定位し、LチャンネルとRチャンネルにほぼ同位相、同レベルで含まれていることを利用して、LチャンネルおよびRチャンネルの差を取った信号に低域成分と高域成分を補充することにより、入力される楽曲データから歌唱部分を除去している。Conventionally, there is known a music reproduction device having a voice canceling function of erasing a singing portion from music data including singing and using the music data for karaoke or the like (see, for example,
In such a music playback device, the singing portion is localized at a position between the L channel and the R channel, and is included in the L channel and the R channel at substantially the same phase and at the same level. The singing part is removed from the input music data by supplementing the low-frequency component and the high-frequency component to the signal obtained by taking the difference between the R channel and the R channel.
ところで、DJパフォーマンスにおいては、再生中の楽曲データから他の楽曲データにテンポを同期させて遷移することが頻繁に行われている。
この場合、再生中の楽曲データの歌唱部分から他の楽曲データの歌唱部分に遷移してしまうと、聴取者に違和感を与える。
このため、コンピュータ読取可能なプログラム等を実行して楽曲データの解析を行い、歌唱部分を検出する必要があるが、前記特許文献1および特許文献2に記載の技術では、歌唱部分を検出することはできない。By the way, in DJ performance, it is frequently performed that the tempo is synchronized from the music data being played to another music data to make a transition.
In this case, if the singing part of the music data being played is changed to the singing part of other music data, the listener feels uncomfortable.
Therefore, it is necessary to execute a computer-readable program or the like to analyze the music data and detect the singing portion. However, in the techniques described in
本発明の目的は、再生中の楽曲データから他の楽曲データに遷移する際、聴取者に違和感を与えることなく、楽曲データの遷移を行うことのできる楽曲解析装置および楽曲解析プログラムを提供することにある。 An object of the present invention is to provide a music analysis device and a music analysis program capable of performing a transition of music data without giving a sense of discomfort to the listener when transitioning from music data being played to other music data. It is in.
本発明の楽曲解析装置は、
楽曲データに対して周波数領域への変換を行う周波数変換部と、
前記周波数変換部により変換された楽曲データの平滑化処理を行う平滑化処理部と、
前記平滑化処理部により平滑化処理された楽曲データの音圧レベルのピーク値、当該ピーク値の前後の極小値の差分として与えられるプロミネンス、および当該ピーク値の山の幅となるピーク幅を検出するピーク検出部と、
前記ピーク検出部により検出されたピーク値、プロミネンス、およびピーク幅が、所定の閾値を超えるか否かを判定し、所定の閾値超える区間を、前記楽曲データの歌唱データを含む区間であると判定する歌唱区間判定部と、
を備えていることを特徴とする。The music analysis device of the present invention
A frequency conversion unit that converts music data into the frequency domain,
A smoothing processing unit that performs smoothing processing of music data converted by the frequency conversion unit, and
The peak value of the sound pressure level of the music data smoothed by the smoothing processing unit, the prominence given as the difference between the minimum values before and after the peak value, and the peak width which is the width of the peak of the peak value are detected. Peak detector and
It is determined whether or not the peak value, prominence, and peak width detected by the peak detection unit exceed a predetermined threshold value, and the section exceeding the predetermined threshold value is determined to be a section including the singing data of the music data. Singing section judgment part to do,
It is characterized by having.
本発明の楽曲解析プログラムは、
コンピュータを、
楽曲データに対して周波数領域への変換を行う周波数変換部と、
前記周波数変換部により変換された楽曲データの平滑化処理を行う平滑化処理部と、
前記平滑化処理部により平滑化処理された楽曲データの音圧レベルのピーク値、当該ピーク値の前後の極小値の差分として与えられるプロミネンス、および当該ピーク値の山の幅となるピーク幅を検出するピーク検出部と、
前記ピーク検出部により検出されたピーク値、プロミネンス、およびピーク幅が、所定の閾値を超えるか否かを判定し、所定の閾値を超える区間を、前記楽曲データの歌唱データを含む区間であると判定する歌唱区間判定部と、
して機能させることを特徴とする。The music analysis program of the present invention
Computer,
A frequency conversion unit that converts music data into the frequency domain,
A smoothing processing unit that performs smoothing processing of music data converted by the frequency conversion unit, and
The peak value of the sound pressure level of the music data smoothed by the smoothing processing unit, the prominence given as the difference between the minimum values before and after the peak value, and the peak width which is the width of the peak of the peak value are detected. Peak detector and
It is determined whether or not the peak value, prominence, and peak width detected by the peak detection unit exceed a predetermined threshold value, and the section exceeding the predetermined threshold value is regarded as a section including the singing data of the music data. Singing section judgment unit to judge and
It is characterized in that it functions.
[1]本発明の実現方法
本発明の楽曲解析は、「歌声情報処理の最近の研究」(後藤真孝、齋藤毅、中野倫靖、藤原弘将(産業技術総合研究所)日本音響学会誌64巻10号(2008)pp.616−623)に記載された内容に基づくものである。[1] Realization Method of the Present Invention The music analysis of the present invention is "Recent research on singing voice information processing" (Masataka Goto, Takeshi Saito, Tomoyasu Nakano, Hiromasa Fujiwara (National Institute of Advanced Industrial Science and Technology) Journal of the Acoustical Society of Japan 64 It is based on the contents described in Vol. 10 (2008) pp. 616-623).
具体には、以下に記載された内容に基づくものである。
「歌声は、話し声と比較して発声の高さや強さの変動幅が広く、より複雑で動的な特性を持つことが知られている。特に楽曲の旋律に沿って変化する基本周波数(F0、声の高さ)の軌跡には、歌声固有の動的な変動成分が現れる。中でも図1に示すように、プレパレーション、オーバーシュート、微細変動、ヴィブラートという4種の成分は、歌唱法や歌唱者に依存せず、様々な歌声において共通して存在し、かつ歌声を知覚する上で重要な役割を担っていることが明らかになってきている。」
このことから、歌声のスペクトルと楽器音のスペクトルを比較した場合、歌声のピークの幅は、楽器音のピークに比べてブロードになるという傾向を生じる。
そこで、本発明の楽曲解析では、ピークの幅の広い狭いの違いから、楽曲データ中の音が歌唱音であるか、楽器音であるかを判定することとした。Specifically, it is based on the contents described below.
"Singing voices are known to have a wider range of fluctuations in vocalization pitch and strength than speaking voices, and to have more complex and dynamic characteristics. In particular, the fundamental frequency (F0) that changes along the melody of a musical piece. , The pitch of the voice), the dynamic fluctuation component peculiar to the singing voice appears. Among them, as shown in Fig. 1, the four kinds of components, preparation, overshoot, fine fluctuation, and vibrato, are singing method and It is becoming clear that it is independent of the singer, exists in common in various singing voices, and plays an important role in perceiving the singing voice. "
From this, when comparing the spectrum of the singing voice and the spectrum of the musical instrument sound, the width of the peak of the singing voice tends to be broader than the peak of the musical instrument sound.
Therefore, in the musical composition analysis of the present invention, it is determined whether the sound in the musical composition data is a singing sound or a musical instrument sound from the difference between the wide and narrow peaks.
[2]全体構成
図2には、本発明の実施形態に係る音響制御システム1が示されている。この音響制御システム1は、音響機器としての4台のデジタルプレーヤー2と、音響機器としてのデジタルミキサー3と、コンピュータ4とを接続して構成される。
4台のデジタルプレーヤー2は、操作することにより音響制御情報を出力する機能を備え、LANケーブル5によってデジタルミキサー3に接続されている。このように4台のデジタルプレーヤー2とデジタルミキサー3とをLANケーブル5で接続することにより、5つの音響機器2、3を連動させることが可能となる。
本実施形態では、LANケーブル5は、IEEE1394規格のインターフェースが用いられている。なお、デジタルプレーヤー2とデジタルミキサー3との接続は、これに限らず、MIDI(Musical Instruments Digital Interface:登録商標/社団法人音楽電子事業協会)規格のインターフェースを利用してもよい。[2] Overall Configuration FIG. 2 shows an
The four digital players 2 have a function of outputting acoustic control information by operating them, and are connected to the
In this embodiment, the LAN cable 5 uses an IEEE 1394 standard interface. The connection between the digital player 2 and the
デジタルミキサー3は、USBケーブル6を介して、コンピュータ4と通信可能に接続される。デジタルミキサー3は、デジタルプレーヤー2を操作するごとに入力される音響制御情報と、自身が操作されることにより生成される音響制御情報とを、一括してコンピュータ4に出力するマスター音響機器(いずれか1つの音響機器)として機能する。本実施形態では、USBケーブル6は、USB2.0規格のインターフェースが用いられている。なお、デジタルミキサー3とコンピュータ4との接続は、これに限らず、IEEE1394規格のLANケーブルで接続してもよい。
The
コンピュータ4は、CPUおよびハードディスク、ROM等のメモリーを備えて構成される。CPU上では、楽曲情報を管理するプログラムが実行可能とされ、デジタルミキサー3からUSBケーブル6を介して入力された音響制御情報に基づいて、再生する楽曲等にエフェクトや、ミキシング等の音響処理を施す。
The
[3]楽曲解析装置4Aの構成
図3には、本実施形態に係る楽曲解析装置4Aの機能ブロック図が示されている。楽曲解析装置4Aは、コンピュータ4のCPU上で実行される楽曲解析プログラムとして構成され、周波数変換部41、平滑化処理部42、ピーク検出部43、歌唱区間判定部44、および楽曲データ切替制御部45を備える。[3] Configuration of
周波数変換部41は、楽曲データSDの1小節目から1拍毎にFFT(Fast Fourier Transform)を実行し、振幅スペクトルを算出する。本実施形態では、楽曲データSDを1/8ダウンサンプリングしたデータを用い、計算量の削減を図っている。具体的には、周波数変換部41は、図4に示すように、楽曲データSDを、周波数毎の音圧レベル(dB)に変換する。
The
本実施形態では、FFTの間隔は、(1拍分の時間長)=(1/8のサンプリング周波数)×(1拍の時間長)=44100/8×60/BPM(サンプル)で与えられる。
なお、本実施形態では、FFTによる周波数領域への変換を行っているが、これに限らず、たとえば、DCT(Discrete Cosine Transform)により周波数領域への変換を行ってもよい。In the present embodiment, the FFT interval is given by (time length for one beat) = (sampling frequency of 1/8) × (time length for one beat) = 44100/8 × 60 / BPM (sample).
In the present embodiment, the conversion to the frequency domain is performed by FFT, but the present invention is not limited to this, and for example, the conversion to the frequency domain may be performed by DCT (Discrete Cosine Transform).
平滑化処理部42は、周波数変換部41により変換された振幅スペクトルに対して、2次IIR(Infinite Impulse Response) LPF(Low-Pass Filter)により平滑化処理を行う。具体的には、平滑化処理部42は、振幅スペクトルを時間波形とみなしてLPFを行っている。平滑化処理部42は、図4に示す周波数領域への変換結果に基づいて、図5に示すように、細かなノイズ成分を除去し、なだらかなカーブとなるように平滑化処理を行う。
The smoothing
ピーク検出部43は、平滑化処理部42により平滑化処理された楽曲データのピーク(極大)の音圧レベルであるピーク値、ピーク値とピークの前後の極小値の差分として与えられるプロミネンス、およびピークの山の幅となるピーク幅を検出する。
ここで、プロミネンスとは、言語学的には、伝達の意図で文中の部分を他の部分を際立たせて発音することをいうが、本発明にいうプロミネンスは、他の周波数よりも音圧レベルが際だった周波数、すなわちピーク(極大)となる周波数の音圧レベルと、そのピークの前後において極小となる周波数の音圧レベルとの差分として定義される。The
Here, prominence linguistically means that a part in a sentence is pronounced with other parts emphasized for the purpose of transmission, but the prominence referred to in the present invention has a sound pressure level higher than that of other frequencies. Is defined as the difference between the sound pressure level of the frequency that stands out, that is, the frequency that becomes the peak (maximum), and the sound pressure level of the frequency that becomes the minimum before and after the peak.
具体的には、図5に示すように、ピーク検出部43は、平滑化処理された楽曲データのそれぞれの周波数における音圧レベルの高い山のピーク値を検出する。次に、ピーク検出部43は、ピーク値を取る周波数と、前後の極小値を取る周波数との音圧レベルの差分をとって、プロミネンスを検出する。そして、ピーク検出部43は、ピーク値を与える山の幅をピーク幅として検出する。なお、本実施形態では、ピーク幅は、プロミネンスの1/2音圧レベルにおける周波数の幅として検出しているが、山の裾野をピーク幅として検出してもよい。
Specifically, as shown in FIG. 5, the
歌唱区間判定部44は、ピーク検出部43により検出されたピーク値、プロミネンス、およびピーク幅が、所定の閾値を超えるか否かを判定し、所定の閾値を超える区間を、前記楽曲データの歌唱データを含む区間であると判定する。
The singing
歌唱区間判定部44は、ピーク値およびプロミネンスが一定の音圧レベルを超え、かつ、前述したように歌声のピークの幅が楽器音のピークの幅に比べてブロードになる点に着目して、歌唱区間であると判定している。具体的には、図4および図5に示すように、ピーク値が高く、プロミネンスも大きく、ピーク幅も大きい場合には、当該区間を歌唱区間であると判定している。
一方、図6および図7に示すように、ピーク値が高く、プロミネンスも大きいが、ピーク幅が狭い区間は、プレパレーション、オーバーシュート、微細変動、ヴィブラート等の歌唱特有の効果が現れておらず、ピーク幅が狭くなっているため、歌唱区間とは判定しない。The singing
On the other hand, as shown in FIGS. 6 and 7, the peak value is high and the prominence is large, but the singing-specific effects such as preparation, overshoot, fine variation, and vibrato do not appear in the section where the peak width is narrow. , Since the peak width is narrow, it is not judged as a singing section.
楽曲データ切替制御部45は、図3に示すように、歌唱区間判定部44の判定結果に基づいて、再生中の楽曲データから他の楽曲データへの切り替えを許容するか否かの制御指令をデジタルミキサー3に出力する。具体的には、楽曲データ切替制御部45は、歌唱区間判定部44によって、再生中の楽曲データSDが、歌唱区間であると判定された場合には、楽曲データSDの切り替えを規制し、歌唱区間でないと判定された場合には、楽曲データSDの切り替えを許容する制御指令をデジタルミキサー3に出力する。
As shown in FIG. 3, the music data switching
[4]実施形態の作用および効果
次に、本発明の実施形態の作用について、図8に示すフローチャートに基づいて説明する。
まず、楽曲解析装置4Aは、入力される楽曲データSDを、1/8でダウンサンプリングしてデータを軽減する(手順S1)。
周波数変換部41は、1拍毎にFFTを実行し、振幅スペクトルを算出する(手順S2)。[4] Actions and Effects of Embodiments Next, the actions of embodiments of the present invention will be described with reference to the flowchart shown in FIG.
First, the
The
平滑化処理部42は、2次IIR LPFにより、周波数領域へ変換された楽曲データの平滑化処理を行う(手順S3)。
ピーク検出部43は、平滑化処理された楽曲データに基づいて、ピーク値、プロミネンス、およびピーク幅の検出を行う(手順S4)。The smoothing
The
歌唱区間判定部44は、ピーク検出部43により検出されたピーク値、プロミネンス、およびピーク幅が、所定の閾値を超えるか否かを判定する(手順S5)。
現在再生中の楽曲データSDが、歌唱区間ではないと判定されたら(S5:No)、楽曲データ切替制御部45は、他の楽曲データへの切り替えを許容する制御指令をデジタルミキサー3に出力する(手順S6)。The singing
If it is determined that the music data SD currently being played is not in the singing section (S5: No), the music data switching
現在再生中の楽曲データSDが、歌唱区間であると判定されたら(S5:Yes)、楽曲データ切替制御部45は、他の楽曲データへの切り替えを規制する制御指令をデジタルミキサー3に出力する(手順S7)。
デジタルミキサー3では、楽曲データ切替制御部45からの制御指令に基づいて、デジタルミキサー3による楽曲データの切り替えを行う。When the music data SD currently being played is determined to be in the singing section (S5: Yes), the music data switching
In the
このような本実施形態によれば、歌唱区間判定部44が、ピーク検出部43で検出されたピーク値、プロミネンス、およびピーク幅に基づいて、歌唱区間であるか否かの判定を行っているため、歌唱区間でない場合には、他の楽曲データへの切り替えを許容し、歌唱区間である場合には、他の楽曲データへの切り替えを規制している。したがって、楽曲データSDの再生中の歌唱区間で他の楽曲データへの切り替えを防止することができるため、DJパフォーマンスにおいて、楽曲データの切り替えに際して、聴取者に違和感を与えることがない。
According to this embodiment, the singing
また、周波数領域への変換をFFT、平滑化処理を2次IIR LPFにより行うことにより、通常の楽曲解析で用いられる周波数領域への変換、平滑化処理を利用しているため、変換および処理の汎用化、簡略化を図り易い。
さらに、楽曲データSDを1/8ダウンサンプリングすることにより、データ数の軽減を図ることができるため、歌唱区間の判定のための演算負荷を軽減することができ、変換、処理の高速化を実現できる。Further, since the conversion to the frequency domain is performed by FFT and the smoothing process is performed by the secondary IIR LPF, the conversion to the frequency domain and the smoothing process used in normal music analysis are used. Easy to generalize and simplify.
Furthermore, by downsampling the music data SD by 1/8, the number of data can be reduced, so that the calculation load for determining the singing section can be reduced, and conversion and processing can be speeded up. it can.
1…音響制御システム、2…デジタルプレーヤー、3…デジタルミキサー、4…コンピュータ、4A…楽曲解析装置、5…LANケーブル、6…USBケーブル、41…周波数変換部、42…平滑化処理部、43…ピーク検出部、44…歌唱区間判定部、45…楽曲データ切替制御部、SD…楽曲データ。
1 ... Acoustic control system, 2 ... Digital player, 3 ... Digital mixer, 4 ... Computer, 4A ... Music analyzer, 5 ... LAN cable, 6 ... USB cable, 41 ... Frequency conversion unit, 42 ... Smoothing processing unit, 43 ... Peak detection unit, 44 ... Singing section determination unit, 45 ... Music data switching control unit, SD ... Music data.
Claims (4)
前記周波数変換部により変換された楽曲データの平滑化処理を行う平滑化処理部と、
前記平滑化処理部により平滑化処理された楽曲データの音圧レベルのピーク値、当該ピーク値の前後の極小値の差分として与えられるプロミネンス、および当該ピーク値の山の幅となるピーク幅を検出するピーク検出部と、
前記ピーク検出部により検出されたピーク値、プロミネンス、およびピーク幅が、所定の閾値を超えるか否かを判定し、所定の閾値を超える区間を、前記楽曲データの歌唱データを含む区間であると判定する歌唱区間判定部と、
を備えていることを特徴とする楽曲解析装置。A frequency conversion unit that converts music data into the frequency domain,
A smoothing processing unit that performs smoothing processing of music data converted by the frequency conversion unit, and
The peak value of the sound pressure level of the music data smoothed by the smoothing processing unit, the prominence given as the difference between the minimum values before and after the peak value, and the peak width which is the width of the peak of the peak value are detected. Peak detector and
It is determined whether or not the peak value, prominence, and peak width detected by the peak detection unit exceed a predetermined threshold value, and the section exceeding the predetermined threshold value is regarded as a section including the singing data of the music data. Singing section judgment unit to judge and
A music analysis device characterized by being equipped with.
前記周波数変換部は、FFT(Fast Fourier Transform)により周波数領域への変換を行うことを特徴とする楽曲解析装置。In the music analysis device according to claim 1,
The frequency transforming unit is a music analysis device characterized in that it transforms into a frequency domain by FFT (Fast Fourier Transform).
前記平滑化処理部は、2次IIR(Infinite Impulse Response)LPF(Low-Pass Filter)により平滑化処理を行うことを特徴とする楽曲解析装置。In the music analysis device according to claim 1 or 2.
The smoothing processing unit is a music analysis apparatus characterized in that smoothing processing is performed by a secondary IIR (Infinite Impulse Response) LPF (Low-Pass Filter).
楽曲データに対して周波数領域への変換を行う周波数変換部と、
前記周波数変換部により変換された楽曲データの平滑化処理を行う平滑化処理部と、
前記平滑化処理部により平滑化処理された楽曲データの音圧レベルのピーク値、当該ピーク値の前後の極小値の差分として与えられるプロミネンス、および当該ピーク値の山の幅となるピーク幅を検出するピーク検出部と、
前記ピーク検出部により検出されたピーク値、プロミネンス、およびピーク幅が、所定の閾値を超えるか否かを判定し、所定の閾値を超える区間を、前記楽曲データの歌唱データを含む区間であると判定する歌唱区間判定部と、
して機能させることを特徴とする楽曲解析プログラム。
Computer,
A frequency conversion unit that converts music data into the frequency domain,
A smoothing processing unit that performs smoothing processing of music data converted by the frequency conversion unit, and
The peak value of the sound pressure level of the music data smoothed by the smoothing processing unit, the prominence given as the difference between the minimum values before and after the peak value, and the peak width which is the width of the peak of the peak value are detected. Peak detector and
It is determined whether or not the peak value, prominence, and peak width detected by the peak detection unit exceed a predetermined threshold value, and the section exceeding the predetermined threshold value is regarded as a section including the singing data of the music data. Singing section judgment unit to judge and
A music analysis program characterized by making it function.
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
PCT/JP2017/028460 WO2019026286A1 (en) | 2017-08-04 | 2017-08-04 | Music analysis device and music analysis program |
Publications (2)
Publication Number | Publication Date |
---|---|
JPWO2019026286A1 JPWO2019026286A1 (en) | 2020-07-16 |
JP6807461B2 true JP6807461B2 (en) | 2021-01-06 |
Family
ID=65232618
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2019533869A Active JP6807461B2 (en) | 2017-08-04 | 2017-08-04 | Music analysis device and music analysis program |
Country Status (2)
Country | Link |
---|---|
JP (1) | JP6807461B2 (en) |
WO (1) | WO2019026286A1 (en) |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102422349A (en) * | 2009-05-14 | 2012-04-18 | 夏普株式会社 | Gain control apparatus and gain control method, and voice output apparatus |
-
2017
- 2017-08-04 JP JP2019533869A patent/JP6807461B2/en active Active
- 2017-08-04 WO PCT/JP2017/028460 patent/WO2019026286A1/en active Application Filing
Also Published As
Publication number | Publication date |
---|---|
JPWO2019026286A1 (en) | 2020-07-16 |
WO2019026286A1 (en) | 2019-02-07 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP4645241B2 (en) | Voice processing apparatus and program | |
KR20060051592A (en) | Audio signal processing apparatus and method for the same | |
JPH07302092A (en) | Grading apparatus of song grade of user of sing-along system | |
WO2006090589A1 (en) | Sound separating device, sound separating method, sound separating program, and computer-readable recording medium | |
JPH04195196A (en) | Midi chord forming device | |
WO2012111043A1 (en) | Signal processing method, signal processing device, reproduction device, and program | |
US6673995B2 (en) | Musical signal processing apparatus | |
US8750530B2 (en) | Method and arrangement for processing audio data, and a corresponding corresponding computer-readable storage medium | |
JP2019200259A (en) | Detection method of degree of voice and non-voice | |
JP6807461B2 (en) | Music analysis device and music analysis program | |
EP3772224B1 (en) | Vibration signal generation apparatus and vibration signal generation program | |
JP5494083B2 (en) | Karaoke equipment | |
WO2017135350A1 (en) | Recording medium, acoustic processing device, and acoustic processing method | |
JP5447624B2 (en) | Karaoke equipment | |
Dobrian | Strategies for continuous pitch and amplitude tracking in realtime interactive improvisation software | |
JP2016038543A (en) | Effect addition device, method, and program, and electric musical instrument | |
WO2017195292A1 (en) | Music structure analysis device, method for analyzing music structure, and music structure analysis program | |
JPH01219634A (en) | Automatic score taking method and apparatus | |
WO2017013762A1 (en) | Sound processing device and sound processing method | |
JP2015087436A (en) | Voice sound processing device, control method and program for voice sound processing device | |
JP5034642B2 (en) | Karaoke equipment | |
JP5177657B2 (en) | Acoustic characteristic control device | |
JP5696828B2 (en) | Signal processing device | |
JPH1026994A (en) | Karaoke grading device | |
JP5082760B2 (en) | Sound control apparatus and program |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20200129 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20201117 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20201207 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6807461 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |