KR101350308B1 - 다성 음악 신호에서 추출된 주요 멜로디 교정 장치 및 그 방법 - Google Patents

다성 음악 신호에서 추출된 주요 멜로디 교정 장치 및 그 방법 Download PDF

Info

Publication number
KR101350308B1
KR101350308B1 KR1020110142527A KR20110142527A KR101350308B1 KR 101350308 B1 KR101350308 B1 KR 101350308B1 KR 1020110142527 A KR1020110142527 A KR 1020110142527A KR 20110142527 A KR20110142527 A KR 20110142527A KR 101350308 B1 KR101350308 B1 KR 101350308B1
Authority
KR
South Korea
Prior art keywords
group
frequency
melody
pitch
neighboring
Prior art date
Application number
KR1020110142527A
Other languages
English (en)
Other versions
KR20130074458A (ko
Inventor
송재종
이석필
양창모
신사임
박호종
윤제열
이세원
Original Assignee
전자부품연구원
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 전자부품연구원 filed Critical 전자부품연구원
Priority to KR1020110142527A priority Critical patent/KR101350308B1/ko
Publication of KR20130074458A publication Critical patent/KR20130074458A/ko
Application granted granted Critical
Publication of KR101350308B1 publication Critical patent/KR101350308B1/ko

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10KSOUND-PRODUCING DEVICES; METHODS OR DEVICES FOR PROTECTING AGAINST, OR FOR DAMPING, NOISE OR OTHER ACOUSTIC WAVES IN GENERAL; ACOUSTICS NOT OTHERWISE PROVIDED FOR
    • G10K11/00Methods or devices for transmitting, conducting or directing sound in general; Methods or devices for protecting against, or for damping, noise or other acoustic waves in general
    • G10K11/18Methods or devices for transmitting, conducting or directing sound
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10HELECTROPHONIC MUSICAL INSTRUMENTS; INSTRUMENTS IN WHICH THE TONES ARE GENERATED BY ELECTROMECHANICAL MEANS OR ELECTRONIC GENERATORS, OR IN WHICH THE TONES ARE SYNTHESISED FROM A DATA STORE
    • G10H1/00Details of electrophonic musical instruments
    • G10H1/0008Associated control or indicating means
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10HELECTROPHONIC MUSICAL INSTRUMENTS; INSTRUMENTS IN WHICH THE TONES ARE GENERATED BY ELECTROMECHANICAL MEANS OR ELECTRONIC GENERATORS, OR IN WHICH THE TONES ARE SYNTHESISED FROM A DATA STORE
    • G10H2210/00Aspects or methods of musical processing having intrinsic musical character, i.e. involving musical theory or musical parameters or relying on musical knowledge, as applied in electrophonic musical tools or instruments
    • G10H2210/031Musical analysis, i.e. isolation, extraction or identification of musical elements or musical parameters from a raw acoustic signal or from an encoded audio signal
    • G10H2210/066Musical analysis, i.e. isolation, extraction or identification of musical elements or musical parameters from a raw acoustic signal or from an encoded audio signal for pitch analysis as part of wider processing for musical purposes, e.g. transcription, musical performance evaluation; Pitch recognition, e.g. in polyphonic sounds; Estimation or use of missing fundamental

Landscapes

  • Physics & Mathematics (AREA)
  • Engineering & Computer Science (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Electrophonic Musical Instruments (AREA)
  • Auxiliary Devices For Music (AREA)

Abstract

다성 음악 신호에서 추출된 주요 멜로디 교정 장치가 개시된다. 이 장치는 교정된 주요 멜로디가 저장되는 메모리, 및 다성 음악 신호에서 추출된 주요 멜로디의 이웃 프레임 간 주파수 차이가 제1경계 값 미만이면 동일 집단으로 판단하여 집단화하고, 상기 집단화된 집단의 크기에 따라 멜로디 음정 집단과 파생 음정 집단으로 판별하며, 상기 파생 음정 집단이 이웃한 멜로디 음정 집단과 배음 관계이면 상기 파생 음정 집단과 상기 이웃한 멜로디 음정 집단의 평균 주파수의 비율에 따라 상기 파생 음정 집단의 주파수를 교정하는 제1교정부를 포함하는 프로세서를 포함한다. 이에 의해 다성 음악 신호에서 추출된 주요 멜로디가 정확히 교정될 수 있다.

Description

다성 음악 신호에서 추출된 주요 멜로디 교정 장치 및 그 방법{Apparatus for improving accuracy of predominant melody extraction in polyphonic music signal and method thereof}
본 발명은 다성 음악의 주요 멜로디 검출 기술에 관한 것으로, 특히 다성 음악에서 추출된 주요 멜로디를 교정하여 정확도를 향상시키는 기술에 관한 것이다.
다수의 음원이 혼재된 음악 신호에서 주요 멜로디를 검출하는 종래 방법에 의하면, 피치 값의 더블링(doubling)과 하빙(halving)의 발생으로 인해 주요 멜로디 추출 정확도가 저하된다. 종래 다성 음악 신호에서 추출된 주요 멜로디의 검출 정확도 향상 방법은 음악 신호에서 음악적 특성인 코드(chord), 음계, 음의 길이 등의 통계적 성질을 분석하여 HMM(hidden Markov model) 기반으로 잘못된 주요 멜로디를 교정하는 것이다. 그러나 이 방법은 입력된 음악 신호의 고유 성질을 직접적으로 이용하는 것이 아니라 통계적 특성에 따른 확률 모델을 이용하는 것이므로, 훈련과정이 필요하고 동작 연산량이 많다. 또한 만일 특정 입력 신호의 멜로디 흐름이 주어진 확률 모델과 다를 경우, 정확한 주요 멜로디를 교정하지 못한다. 또 다른 종래 기술에 따른 주요 멜로디의 검출 정확도 향상 방법은 멜로디 주파수의 에너지를 이용하여 주요 멜로디에서 파생된 짧은 구간의 음정을 병합한다. 그러나 이 방법은 짧은 구간의 음정이 정확히 주요 멜로디에서 파생된 음정인지에 대한 확인 과정 없이 진행되므로, 정확한 주요 멜로디 검출 정확도 향상을 기대할 수 없다. 또한 멜로디 주파수의 에너지, 즉 음정의 활주(glissando)를 이용한 방법은 단음원 음악 신호에서는 뚜렷한 성질을 보이지만, 다음원 음악 신호에서는 다른 악기의 영향으로 음정의 활주 특성이 불분명해지기 때문에 정확한 주요 멜로디 검출 정확도 향상을 크게 기대할 수 없다.
본 발명은 다성 음악 신호에서 추출된 주요 멜로디의 정확도를 향상시킬 수 있는 기술적 방안을 제공함을 목적으로 한다.
전술한 기술적 과제를 달성하기 위한 본 발명의 일 양상에 따른 다성 음악 신호에서 추출된 주요 멜로디 교정 장치는 교정된 주요 멜로디가 저장되는 메모리, 및 다성 음악 신호에서 추출된 주요 멜로디의 이웃 프레임 간 주파수 차이가 제1경계 값 미만이면 동일 집단으로 판단하여 집단화하고, 상기 집단화된 집단의 크기에 따라 멜로디 음정 집단과 파생 음정 집단으로 판별하며, 상기 파생 음정 집단이 이웃한 멜로디 음정 집단과 배음 관계이면 상기 파생 음정 집단의 평균 주파수와 상기 이웃한 멜로디 음정 집단의 평균 주파수의 비율에 따라 상기 파생 음정 집단의 주파수를 교정하는 제1교정부를 포함하는 프로세서를 포함한다.
나아가 상기 프로세서는 상기 제1교정부에 의해 교정된 주요 멜로디의 이웃 프레임 간 주파수 차이가 제2경계 값 미만이면 동일 집단으로 판단하여 집단화하고, 상기 집단화된 집단의 평균 주파수와 상기 제1교정부에 의해 교정된 주요 멜로디의 주파수의 중간값(median value)의 차이에 따라 멜로디 음정 집단과 오류 음정 집단으로 판별하며, 상기 오류 음정 집단의 평균 주파수와 이웃한 멜로디 음정 집단의 평균 주파수의 비율을 계산하여 그 계산된 비율만큼 상기 오류 음정 집단의 주파수를 교정하는 제2교정부를 더 포함한다.
나아가 상기 프로세서는 상기 제2교정부의 교정 후 상기 제2교정부에서 집단화된 동일 집단 내 주파수들의 평균 편차를 구하고, 상기 주파수와 이웃 프레임의 주파수 차이가 상기 평균 편차보다 크면 상기 주파수를 둘 이상의 이웃 프레임의 주파수들의 평균값으로 교정하는 제3교정부를 더 포함한다.
한편, 전술한 기술적 과제를 달성하기 위한 본 발명의 일 양상에 따른 다성 음악 신호에서 추출된 주요 멜로디 교정 방법은 다성 음악 신호에서 추출된 주요 멜로디의 이웃 프레임 간 주파수 차이가 제1경계 값 미만이면 동일 집단으로 판단하여 집단화하는 단계, 상기 집단화된 집단의 크기에 따라 멜로디 음정 집단과 파생 음정 집단으로 판별하는 단계, 상기 파생 음정 집단이 이웃한 멜로디 음정 집단과 배음 관계이면 상기 파생 음정 집단의 평균 주파수와 상기 이웃한 멜로디 음정 집단의 평균 주파수의 비율에 따라 상기 파생 음정 집단의 주파수를 교정하는 단계를 포함한다.
나아가 상기 방법은 상기 교정된 주요 멜로디의 이웃 프레임 간 주파수 차이가 제2경계 값 미만이면 동일 집단으로 판단하여 집단화하는 단계, 상기 집단화된 집단의 평균 주파수와 상기 교정된 주요 멜로디의 주파수의 중간값(median value)의 비율에 따라 멜로디 음정 집단과 오류 음정 집단으로 판별하는 단계, 및 상기 오류 음정 집단의 평균 주파수와 이웃한 멜로디 음정 집단의 정수배 비율을 계산하여 그 계산된 비율만큼 상기 오류 음정 집단의 주파수를 교정하는 단계를 더 포함한다.
나아가 상기 방법은 상기 오류 음정 집단의 주파수 교정 후에 상기 집단 내 주파수들의 평균 편차를 구하고, 상기 주파수와 이웃 프레임의 주파수의 차이가 상기 평균 편차보다 크면 상기 주파수를 둘 이상의 이웃 프레임의 주파수들의 평균값으로 교정하는 단계를 더 포함한다.
종래 기술은 확률 모델을 사용하기 때문에, 훈련되지 않은 음악 신호를 입력받게 되면 주요 멜로디 검출 정확도 향상에 큰 효과가 없다. 그러나 본 발명은 입력 신호의 특성만을 활용하므로, 다양한 종류의 음악에 대하여 보다 강인하게 주요 멜로디 검출 정확도를 향상시킬 수 있다.
또한 종래 기술은 주요 멜로디에서 파생된 짧은 구간의 음정을 병합하여 주요 멜로디를 보정하지만, 본 발명은 짧은 구간의 음정과 주변의 긴 구간의 음정이 정확한 정수배를 이루면 짧은 구간의 음정을 교정하고, 특히 교정 방법은 단순 병합이 아닌 음성 사이의 비율을 적용하여 멜로디의 흐름을 유지한다.
즉, 본 발명은 종래 기술에 비해 주요 멜로디 검출 정확도를 향상할 수 있기 때문에, 다성 음악 신호에서 보컬 멜로디의 내용 분석 및 음원 분해를 보다 정확하게 구현하여 준다. 또한 본 발명은 종래 기술에서 사용되는 확률 모델을 사용하지 않아 모델링을 위한 훈련이 필요 없고, 매우 효과적으로 주요 멜로디 검출 정확도를 향상시킬 수 있다. 또한 본 발명은 다양한 종류의 음악에 대하여 효율적으로 주요 멜로디 검출 정확도를 향상시키므로, 음악 검색 등을 정확하게 구현할 수 있다. 또한 본 발명은 주요 멜로디 추출 정확도를 향상시키므로, 음악 코드 추출, 음악 유사도 측정, 음악 표절 판별과 같이 적용 범위가 상당히 넓다.
도 1은 본 발명의 일 실시예에 따른 다성 음악 신호에서 추출된 주요 멜로디 교정 장치 블록도.
도 2는 본 발명의 일 실시예에 따른 제1교정부 블록도.
도 3은 본 발명의 일 실시예에 따른 제2교정부 블록도.
도 4는 본 발명의 일 실시예에 따른 제3교정부 블록도.
도 5는 본 발명의 일 실시예에 따른 다성 음악 신호에서 추출된 주요 멜로디 교정 방법 흐름도.
전술한, 그리고 추가적인 본 발명의 양상들은 첨부된 도면을 참조하여 설명되는 바람직한 실시예들을 통하여 더욱 명백해질 것이다. 이하에서는 본 발명을 이러한 실시예를 통해 당업자가 용이하게 이해하고 재현할 수 있도록 상세히 설명하기로 한다.
도 1은 본 발명의 일 실시예에 따른 다성 음악 신호에서 추출된 주요 멜로디 교정 장치 블록도이다.
도시된 바와 같이, 주요 멜로디 교정 장치는 프로세서(100)와 메모리(200)를 포함한다. 프로세서(100)는 신호 처리용 프로세서로서, 다성 음악 신호에서 추출된 주요 멜로디를 교정한다. 여기서 주요 멜로디는 다중 피치 추출 방법에 의해 다성 음악 신호로부터 추출될 수 있다. 메모리(200)는 비휘발성 메모리일 수 있다. 이 메모리(200)에는 프로세서(100)에 의해 교정된 주요 멜로디가 저장되며, 저장된 멜로디는 이후에 음악 검색 등에 이용될 수 있다. 프로세서(100)는 제1교정부(110)와 제2교정부(120) 및 제3교정부(130)를 포함한다. 제1교정부(110)는 다성 음악 신호에서 추출된 주요 멜로디를 집단화한 후, 집단 중 파생 음정 집단을 판별하고 교정한다. 제2교정부(120)는 제1교정부에서 교정된 음정을 집단화하고, 집단 중 오류 음정 집단을 판별하고 교정한다. 그리고 제3교정부(130)는 제2교정부(120)에서 교정된 집단 주파수들의 평균 편차(mean deviation)를 구하여 최종 주요 멜로디를 교정한다. 이하에서는 이들 각각에 대해 상세히 설명한다.
도 2는 도 1에 도시된 제1교정부 블록도이다.
제1교정부(110)는 제1집단화부(111)와 제1집단 판별부(112) 및 파생 음정 교정부(113)를 포함한다. 제1집단화부(111)는 주요 멜로디의 이웃 프레임 간 주파수 차이가 제1경계 값 미만이면 동일 집단으로 판단하여 집단화한다. 즉, 제1집단화부(111)는 시간의 흐름에 따라 입력된 주요 주파수에 대해, 수학식 1을 이용하여 이웃한 프레임의 주파수 변화량이 제1경계 값보다 작으면 동일 집단으로 판단하여 집단화한다.
Figure 112011103470270-pat00001
여기서 Gl은 유사도가 높은 주파수의 집단이고, l은 집단의 인덱스를 의미하며, fn은 n번째 프레임의 주파수를 나타낸다. 일 실시예에 있어서, 제1교정부(110)에서의 제1경계 값인 집단 경계 값 α는 주파수의 변화가 심함을 고려하여 1.5톤(tone)으로 설정한다.
제1집단 판별부(112)는 제1집단화부(111)에 의해 집단화된 각각의 집단의 크기를 이용하여 멜로디 음정 집단과 파생 음정 집단으로 판별한다. 일 실시예에 있어서, 제1집단 판별부(112)는 집단의 크기가 100ms 이하이면 파생 음정 집단으로 판별하고, 집단의 크기가 500ms 이상이면 멜로디 음정 집단으로 판별한다. 따라서 한 프레임의 길이가 10ms일 때, 집단 내 프레임의 수가 열 개 이하이면 파생 음정 집단으로 분류되고, 집단 내 프레임의 수가 오십 개 이상이면 멜로디 음정 집단으로 분류된다.
파생 음정 교정부(113)는 파생 음정 집단의 주파수를 교정한다. 구체적으로, 파생 음정 교정부(113)는 파생 음정 집단이 이웃한 멜로디 음정 집단과 배음 관계인지를 비교하며, 배음 관계가 성립하면 멜로디 음정 집단의 평균 주파수와 파생 음정 집단의 평균 주파수의 비율을 계산하여 그 비율만큼 파생 음정 집단의 주파수를 교정한다. 예를 들어, 파생 음정 집단의 평균 주파수가 멜로디 음정 집단의 평균 주파수의 2배일 경우, 파생 음정 교정부(113)는 파생 음정 집단의 평균 주파수를 그 배수 비율만큼 낮추는 것이다. 반대로 멜로디 음정 집단의 평균 주파수가 파생 음정 집단의 평균 주파수의 2배일 경우, 파생 음정 교정부(113)는 파생 음정 집단의 평균 주파수를 그 배수 비율만큼 높이는 것이다.
도 3은 본 발명의 일 실시예에 따른 제2교정부 블록도이다.
멜로디 주파수 범위 결정부(121)는 제1교정부(110)에 의해 교정된 주파수의 중간값(median value)을 구하고, 이로부터 주요 주파수 범위를 결정한다. 일 실시예에 있어서, 멜로디 주파수 범위 결정부(121)는 중간값의 ±1.5 옥타브(octave)를 주요 주파수 범위로 결정한다. 제2집단화부(122)는 제1교정부(110)에 의해 제1교정된 주요 멜로디의 이웃 프레임 간 주파수 차이가 제2경계 값 미만이면 동일 집단으로 판단하여 집단화한다. 즉, 제2집단화부(122)는 수학식 1에 따라 이웃한 프레임의 주파수 변화량이 제2경계 값보다 작으면 동일 집단으로 판단하여 집단화한다. 이때 제1교정된 주파수는 제1교정 전 주파수보다 변화가 적기 때문에, 제2교정부(120)에서의 제2경계 값인 집단 경계 값 α를 1톤으로 설정할 수 있다.
제2집단 판별부(123)는 제2집단화부(122)에 의해 집단화된 집단의 평균 주파수가 주파수의 중간값과 ±1.5 옥타브 이상 차이가 나면 오류 음정 집단으로 판별하고, 그렇지 않으면 멜로디 음정 집단으로 판별한다. 오류 음정 교정부(124)는 오류 음정 집단의 평균 주파수와 멜로디 음정 집단의 평균 주파수의 비율을 정수배 단위로 계산하며, 그 계산된 비율만큼 오류 음정 집단의 주파수를 교정하여 멜로디 음정 집단에 가까워지도록 한다. 일 실시예에 있어서, 오류 음정 교정부(124)는 이웃한 멜로디 음정 집단 중 상대적으로 크기가 더 큰 멜로디 음정 집단에 가까워지도록 오류 음정 집단의 주파수를 교정한다.
도 4는 본 발명의 일 실시예에 따른 제3교정부 블록도이다.
제3교정부(130)의 멜로디 평활화부(131)는 제2교정부(120)에 의해 제2교정된 주파수를 평활화한다. 구체적으로, 멜로디 평활화부(131)는 제2집단화부(122)에 의해 집단화된 집단의 기본 주파수의 평균 편차를 [수학식 3]을 이용하여 구하고, 이웃한 기본 주파수의 변화량이 평균 편차보다 크면 수학식 2에서와 같이 기본 주파수를 둘 이상의 이웃 기본 주파수들의 평균값으로 교정한다.
Figure 112013063576757-pat00002

i: 프레임 인덱스
pi: i번째 프레임의 기본 주파수
Figure 112013063576757-pat00003

i: 프레임 인덱스
pi: i번째 프레임의 기본 주파수
MD(kl)은 집단 kl의 주파수 평균 편차 값을 나타내며, 수학식 3과 같이 정의한다. 여기서,
Figure 112011103470270-pat00004
은 집단 kl의 평균 주파수 값을 나타내고, N은 집단 kl의 원소 개수를 의미한다.
도 5는 본 발명의 일 실시예에 따른 다성 음악 신호에서 추출된 주요 멜로디 교정 방법 흐름도이다.
제1교정부(110)는 다성 음원 신호에서 추출된 주요 멜로디에 대해 제1교정을 수행한다(S100). 구체적으로, 제1교정부(110)는 추출된 주요 멜로디에 대해 수학식 1을 이용하여 집단화한다. 이때 수학식 1의 변수 α는 1.5톤일 수 있다. 제1교정부(110)는 집단의 크기가 100ms 이하이면 파생 음정 집단으로 판별하고, 집단의 크기가 500ms 이상이면 멜로디 음정 집단으로 판별한다. 제1교정부(110)는 파생 음정 집단의 주파수를 교정하는데, 상술한 바와 같이 멜로디 음정 집단과 배음 관계인지를 비교하며, 배음 관계가 성립하면 멜로디 음정 집단의 평균 주파수와 파생 음정 집단의 평균 주파수의 비율을 계산하여 그 비율만큼 파생 음정 집단의 주파수를 교정한다.
제2교정부(120)는 제1교정된 주요 멜로디에 대해 제2교정을 수행한다(S200). 구체적으로, 제2교정부(120)는 수학식 1을 이용하여 이웃한 프레임의 주파수 변화량이 제2경계 값보다 작으면 동일 집단으로 판단하여 집단화한다. 이때 수학식 1의 변수 α는 1톤일 수 있다. 제2교정부(120)는 집단의 평균 주파수가 제1교정부(110)에 의해 교정된 주파수의 중간값(median value)과 ±1.5 옥타브 이상 차이가 나면 오류 음정 집단으로 판별하고, 그렇지 않으면 멜로디 음정 집단으로 판별한다. 제2교정부(120)는 오류 음정 집단의 평균 주파수와 이웃한 멜로디 음정 집단의 평균 주파수의 비율을 정수배 단위로 계산한 후, 그 계산된 비율만큼 오류 음정 집단의 주파수를 교정하여 멜로디 음정 집단의 주파수에 가까워지도록 한다.
제3교정부(130)는 제2교정된 주요 멜로디에 대해 제3교정을 수행한다(S300). 구체적으로, 제3교정부(130)는 제2교정부(120)에어서 집단화된 집단 내 기본 주파수의 평균 편차를 구하고, 이웃한 기분 주파수의 변화량이 평균 편차보다 크면 수학식 2를 이용하여 기본 주파수의 값을 교정함으로써, 제2교정부(120)에 의해 제2교정된 주파수를 평활화하여 최종적으로 교정된 주요 멜로디를 출력한다.
이제까지 본 발명에 대하여 그 바람직한 실시예들을 중심으로 살펴보았다. 본 발명이 속하는 기술 분야에서 통상의 지식을 가진 자는 본 발명이 본 발명의 본질적인 특성에서 벗어나지 않는 범위에서 변형된 형태로 구현될 수 있음을 이해할 수 있을 것이다. 그러므로 개시된 실시예들은 한정적인 관점이 아니라 설명적인 관점에서 고려되어야 한다. 본 발명의 범위는 전술한 설명이 아니라 특허청구범위에 나타나 있으며, 그와 동등한 범위 내에 있는 모든 차이점은 본 발명에 포함된 것으로 해석되어야 할 것이다.
100 : 프로세서 110 : 제1교정부
111 : 제1집단화부 112 : 제1집단 판별부
113 : 파생 음정 교정부 120 : 제2교정부
121 : 멜로디 주파수 범위 결정부 122 : 제2집단화부
123 : 제2집단 판별부 124 : 오류 음정 교정부
130 : 제3교정부 131 : 멜로디 평활화부
200 : 메모리

Claims (7)

  1. 교정된 주요 멜로디가 저장되는 메모리; 및
    다성 음악 신호에서 추출된 주요 멜로디의 프레임 중, 이웃 프레임 간 주파수 차이가 제1경계 값 미만인 프레임을 동일 집단으로 판단하여 제1 동일 집단으로 제1집단화하고, 상기 제1집단화된 제1 동일 집단을 프레임 수에 따라 제1 멜로디 음정 집단과 파생 음정 집단으로 판별하며, 상기 파생 음정 집단이 이웃한 제1 멜로디 음정 집단과 배음 관계이면 상기 파생 음정 집단의 평균 주파수와 상기 이웃한 제1 멜로디 음정 집단의 평균 주파수의 비율에 따라 상기 파생 음정 집단의 주파수를 교정하는 제1교정부를 포함하는 프로세서;
    를 포함하는 것을 특징으로 하는 다성 음악 신호에서 추출된 주요 멜로디 교정 장치.
  2. 제1항에 있어서, 상기 프로세서는
    상기 제1교정부에 의해 교정된 주요 멜로디의 프레임 중, 이웃 프레임 간 주파수 차이가 제2경계 값 미만인 프레임을 제2 동일 집단으로 판단하여 제2집단화하고, 상기 제2집단화된 제2 동일 집단의 평균 주파수와 상기 제1교정부에 의해 교정된 주요 멜로디의 주파수의 중간값(median value)의 비율에 따라 상기 제2 동일 집단을 제2 멜로디 음정 집단과 오류 음정 집단으로 판별하며, 상기 오류 음정 집단의 평균 주파수와 이웃한 제2 멜로디 음정 집단의 평균 주파수의 비율을 계산하여 그 계산된 비율만큼 상기 오류 음정 집단의 주파수를 교정하는 제2교정부;
    를 더 포함하는 것을 특징으로 하는 다성 음악 신호에서 추출된 주요 멜로디 교정 장치.
  3. 제2항에 있어서,
    상기 제2경계 값은 상기 제1경계 값보다 작은 값인 것을 특징으로 하는 다성 음악 신호에서 추출된 주요 멜로디 교정 장치.
  4. 제2항 또는 제3항에 있어서, 상기 프로세서는
    상기 제2교정부의 교정 후 상기 제2교정부에서 집단화된 동일 집단 내 주파수들의 평균 편차를 구하고, 상기 주파수와 이웃 프레임의 주파수 차이가 상기 평균 편차보다 크면 상기 주파수를 둘 이상의 이웃 프레임의 주파수들의 평균값으로 교정하는 제3교정부;
    를 더 포함하는 것을 특징으로 하는 다성 음악 신호에서 추출된 주요 멜로디 교정 장치.
  5. 다성 음악 신호에서 추출된 주요 멜로디의 프레임 중, 이웃 프레임 간 주파수 차이가 제1경계 값 미만인 프레임을 동일 집단으로 판단하여 제1 동일 집단으로 제1집단화하는 단계;
    상기 제1집단화된 제1 동일 집단을 프레임 수에 따라 제1 멜로디 음정 집단과 파생 음정 집단으로 판별하는 단계; 및
    상기 파생 음정 집단이 이웃한 제1 멜로디 음정 집단과 배음 관계이면 상기 파생 음정 집단의 평균 주파수와 상기 이웃한 제1 멜로디 음정 집단의 평균 주파수의 비율에 따라 상기 파생 음정 집단의 주파수를 교정하는 단계;
    를 포함하는 것을 다성 음악 신호에서 추출된 주요 멜로디 교정 방법.
  6. 제5항에 있어서,
    상기 교정된 주요 멜로디의 프레임 중, 이웃 프레임 간 주파수 차이가 제2경계 값 미만인 프레임을 제2 동일 집단으로 판단하여 제2집단화하는 단계;
    상기 제2집단화된 제2 동일 집단의 평균 주파수와 상기 교정된 주요 멜로디의 주파수의 중간값(median value)의 비율에 따라 상기 제2 동일 집단을 제2 멜로디 음정 집단과 오류 음정 집단으로 판별하는 단계; 및
    상기 오류 음정 집단의 평균주파수와 이웃한 제2 멜로디 음정 집단의 평균주파수의 비율을 계산하여 그 계산된 비율만큼 상기 오류 음정 집단의 주파수를 교정하는 단계;
    를 더 포함하는 것을 특징으로 하는 다성 음악 신호에서 추출된 주요 멜로디 교정 방법.
  7. 제6항에 있어서,
    상기 오류 음정 집단의 주파수 교정 후에 상기 집단 내 주파수들의 평균 편차를 구하고, 상기 주파수와 이웃 프레임의 주파수의 차이가 상기 평균 편차보다 크면 상기 주파수를 둘 이상의 이웃 프레임의 주파수들의 평균값으로 교정하는 단계;
    를 더 포함하는 것을 특징으로 하는 다성 음악 신호에서 추출된 주요 멜로디 교정 방법.
KR1020110142527A 2011-12-26 2011-12-26 다성 음악 신호에서 추출된 주요 멜로디 교정 장치 및 그 방법 KR101350308B1 (ko)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020110142527A KR101350308B1 (ko) 2011-12-26 2011-12-26 다성 음악 신호에서 추출된 주요 멜로디 교정 장치 및 그 방법

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020110142527A KR101350308B1 (ko) 2011-12-26 2011-12-26 다성 음악 신호에서 추출된 주요 멜로디 교정 장치 및 그 방법

Publications (2)

Publication Number Publication Date
KR20130074458A KR20130074458A (ko) 2013-07-04
KR101350308B1 true KR101350308B1 (ko) 2014-01-13

Family

ID=48988549

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020110142527A KR101350308B1 (ko) 2011-12-26 2011-12-26 다성 음악 신호에서 추출된 주요 멜로디 교정 장치 및 그 방법

Country Status (1)

Country Link
KR (1) KR101350308B1 (ko)

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20070020131A (ko) * 2004-06-10 2007-02-16 하산 세히토글루 신호 처리를 위한 행렬-값 방법 및 장치
JP2011158906A (ja) 2010-01-29 2011-08-18 Polycom Inc 変換補間によるオーディオパケット損失補償

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20070020131A (ko) * 2004-06-10 2007-02-16 하산 세히토글루 신호 처리를 위한 행렬-값 방법 및 장치
JP2011158906A (ja) 2010-01-29 2011-08-18 Polycom Inc 変換補間によるオーディオパケット損失補償

Also Published As

Publication number Publication date
KR20130074458A (ko) 2013-07-04

Similar Documents

Publication Publication Date Title
Rao et al. Vocal melody extraction in the presence of pitched accompaniment in polyphonic music
Marolt A connectionist approach to automatic transcription of polyphonic piano music
Wu et al. Polyphonic music transcription with semantic segmentation
US7908135B2 (en) Music-piece classification based on sustain regions
US7649137B2 (en) Signal processing apparatus and method, program, and recording medium
US7601907B2 (en) Signal processing apparatus and method, program, and recording medium
US10733900B2 (en) Tuning estimating apparatus, evaluating apparatus, and data processing apparatus
Carabias-Orti et al. Musical instrument sound multi-excitation model for non-negative spectrogram factorization
CN109979483B (zh) 音频信号的旋律检测方法、装置以及电子设备
KR20010082279A (ko) 기본 주파수 고속 검색 방법
Pedersoli et al. Improving music transcription by pre-stacking a U-Net
JP5790496B2 (ja) 音響処理装置
JP5747562B2 (ja) 音響処理装置
KR101350308B1 (ko) 다성 음악 신호에서 추출된 주요 멜로디 교정 장치 및 그 방법
Chuan et al. Audio key finding: Considerations in system design and case studies on Chopin's 24 Preludes
US11837205B2 (en) Musical analysis method and music analysis device
Wei et al. JEPOO: highly accurate joint estimation of pitch, onset and offset for music information retrieval
JP5153517B2 (ja) コード名検出装置及びコード名検出用コンピュータ・プログラム
Degani et al. A pitch salience function derived from harmonic frequency deviations for polyphonic music analysis
Stanek et al. Comparison of fundamental frequency detection methods and introducing simple self-repairing algorithm for musical applications
Jin et al. An automatic grading method for singing evaluation
Chuan et al. The KUSC classical music dataset for audio key finding
Gawlik et al. Modern pitch detection methods in singing voices analyzes
Biswas et al. Objective assessment of pitch accuracy in equal-tempered vocal music using signal processing approaches
Rao et al. Improving polyphonic melody extraction by dynamic programming based dual f0 tracking

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
AMND Amendment
E601 Decision to refuse application
AMND Amendment
X701 Decision to grant (after re-examination)
GRNT Written decision to grant
FPAY Annual fee payment

Payment date: 20161229

Year of fee payment: 4

FPAY Annual fee payment

Payment date: 20171207

Year of fee payment: 5

LAPS Lapse due to unpaid annual fee