KR100189796B1 - 현악기/타악기용 피치인식방법 - Google Patents

현악기/타악기용 피치인식방법 Download PDF

Info

Publication number
KR100189796B1
KR100189796B1 KR1019960000377A KR19960000377A KR100189796B1 KR 100189796 B1 KR100189796 B1 KR 100189796B1 KR 1019960000377 A KR1019960000377 A KR 1019960000377A KR 19960000377 A KR19960000377 A KR 19960000377A KR 100189796 B1 KR100189796 B1 KR 100189796B1
Authority
KR
South Korea
Prior art keywords
pitch
zero crossing
slope
zero
zero crossings
Prior art date
Application number
KR1019960000377A
Other languages
English (en)
Other versions
KR960030072A (ko
Inventor
스잘라이 안드레아스
Original Assignee
라인하드 프란쯔
블루 칩 뮤직 게엠베하
우에시마 세이스케
야마하 가부시키가이샤
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 라인하드 프란쯔, 블루 칩 뮤직 게엠베하, 우에시마 세이스케, 야마하 가부시키가이샤 filed Critical 라인하드 프란쯔
Publication of KR960030072A publication Critical patent/KR960030072A/ko
Application granted granted Critical
Publication of KR100189796B1 publication Critical patent/KR100189796B1/ko

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10HELECTROPHONIC MUSICAL INSTRUMENTS; INSTRUMENTS IN WHICH THE TONES ARE GENERATED BY ELECTROMECHANICAL MEANS OR ELECTRONIC GENERATORS, OR IN WHICH THE TONES ARE SYNTHESISED FROM A DATA STORE
    • G10H5/00Instruments in which the tones are generated by means of electronic generators
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10HELECTROPHONIC MUSICAL INSTRUMENTS; INSTRUMENTS IN WHICH THE TONES ARE GENERATED BY ELECTROMECHANICAL MEANS OR ELECTRONIC GENERATORS, OR IN WHICH THE TONES ARE SYNTHESISED FROM A DATA STORE
    • G10H3/00Instruments in which the tones are generated by electromechanical means
    • G10H3/12Instruments in which the tones are generated by electromechanical means using mechanical resonant generators, e.g. strings or percussive instruments, the tones of which are picked up by electromechanical transducers, the electrical signals being further manipulated or amplified and subsequently converted to sound by a loudspeaker or equivalent instrument
    • G10H3/125Extracting or recognising the pitch or fundamental frequency of the picked up signal
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10HELECTROPHONIC MUSICAL INSTRUMENTS; INSTRUMENTS IN WHICH THE TONES ARE GENERATED BY ELECTROMECHANICAL MEANS OR ELECTRONIC GENERATORS, OR IN WHICH THE TONES ARE SYNTHESISED FROM A DATA STORE
    • G10H2210/00Aspects or methods of musical processing having intrinsic musical character, i.e. involving musical theory or musical parameters or relying on musical knowledge, as applied in electrophonic musical tools or instruments
    • G10H2210/031Musical analysis, i.e. isolation, extraction or identification of musical elements or musical parameters from a raw acoustic signal or from an encoded audio signal
    • G10H2210/066Musical analysis, i.e. isolation, extraction or identification of musical elements or musical parameters from a raw acoustic signal or from an encoded audio signal for pitch analysis as part of wider processing for musical purposes, e.g. transcription, musical performance evaluation; Pitch recognition, e.g. in polyphonic sounds; Estimation or use of missing fundamental
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10TECHNICAL SUBJECTS COVERED BY FORMER USPC
    • Y10STECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10S84/00Music
    • Y10S84/18Tuning

Landscapes

  • Physics & Mathematics (AREA)
  • Engineering & Computer Science (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Measurement Of Mechanical Vibrations Or Ultrasonic Waves (AREA)
  • Auxiliary Devices For Music (AREA)
  • Electrophonic Musical Instruments (AREA)
  • Measuring Frequencies, Analyzing Spectra (AREA)

Abstract

본 발명은 오디오 신호의 신호 파형의 제로 크로싱들간의 간격을 상기 오디오 신호의 하나의 주기로 이용하는 피치인식방법에 관한 것으로서, 특히 현악기/타악기용 피치인식방법에 관한 것이다.
본 발명의 목적은 상기 방법을 이용하여 간단한 방식으로도 신뢰성있는피치 인식을 가능하게 하는 데에 있다.
상기 목적을 위하여, 제로 크로싱의 영역에서 신호파형의 기울기의 크기를 각각 결정하며, 평가되어야 할 제로 크로싱의 선택을 위한 판단기준으로서 상기 기울기의 크기를 이용한다.

Description

현악기/타악기용 피치인식방법
제1도는 제로 크로싱을 가진 통상적인 오디오 신호 파형을 도시한 도면.
제2도는 피치 인식을 위한 단계적 방법을 도시한 개략적인 도면.
제3도는 제로 포인트 부근에서의 신호 파형을 도시한 상세도.
제4도는 본 발명에 따른 음조 피치 인식장치의 블럭도.
* 도면의 주요부분에 대한 부호의 설명
1 : A/D컨버터 2 : 저역필터
3a : 제로 크로싱 검출기 4 : 판별기
5 : 발생기 6 : 판별기
7 : 발생기 8 : 계산기
본 발명은 오디오 신호의 신호 파형의 제로크로싱들간의 간격을 오디오 신호의 하나의 주기로서 이용하는 피치 인식 방법에 관한 것으로서 특히 현악기/타악기용 피치인식 방법에 관한 것이다.
합성 오디오 또는 음조생성이 시작되는 시기에는 각각의 키이에 명확한 한정음정이 할당되어 있는 건반악기를 참고로 하였으나, 합성음조 또는 사운드 생성을 위해 여러 다른 악기들을 사용하는 쪽으로 상당기간에 걸쳐 연구가 행해지고 있다. 그 일례로는 직접 손가락을 이용하거나 픽을 이용하여 인장현을 뜯거나 타현함으로써 진동시키는 기타를 들 수 있다. 공지되어 있는 바와 같이, 기타의 경우에는 현의 유효진동길이를 변화시김으로써 여러 피치를 생성할 수 있다. 클래식 기타, 어코스틱 기타의 경우에는 기타 몸체의 공명에 의해서 현의 진동을 직점 들을 수 있으나, 합성 음조 생성의 경우에는 자극을 받은 현의 진동주파수를 결정하는 것이 필요하다· 일단 피치가 결정되기만 하면, 해당신호를 생성 및 처리할 수 있다. 기타의 경우뿐만 아니라, 예를들면, 하아프, 베이스, 치터등의 현을 뜯거나 타현하는 여러 악기에서도 상기 문제가 발생한다. 피치 인식은 드럼의 경우에도 중요하게 여겨지고 있다. 그런데, 원칙적으로 싱기 방법은 모든 다른 오디오신호. 예를들면 음성 팔로우어(fol1ower)에서 처리될 수 있는 목소리에도 이용될 수 있지만, 이해를 돕고자 기타의 경우에서의 피치 인식에 기초하여 다음과 같이 설명한다.
US 5,014,589에는 오디오 신호의 제로 크로싱을 결정하는 피치인식방법이 설명되어 있으며, 같은 방향에서의 두 제로 크로싱간의 간격이 주기에 대한 기준으로 고려된다. 상기 주기의 역수는 주파수에 해당한다. 이러한 피치인식에서외 문제는 주기를 결정하는 제로크로싱에 부가하여 예를들면 고조파에 의해 야기되는 오디오신호의 제로크로싱이 한 주기내에 또 발생할 수 있는 데에 있다. 그러므로 공지의 방법의 경우에서는 제로 크로싱의 시점뿐만 아니라 신호파형의 진폭 죄대값들을 결정하는 것도 필요하다. 이 경우 일종의 엔벌로프커브가 생성되며, 이는 엔벌로프 팔로우어로도 일컬어진다.
결과적으로, 한 제토 크로싱이 주기의 경계를 표현하는 지에 대한 여부를 판단하기 위해서는 부가적인 기준들이 얻어진다. 2개의 연속 주기들이 특정양보다 더 많이 차이가 나지 않을 때에, 피치신호는 발생된다.
상기한 방법으로의 신호처리는 점점 디지탈적으로 행해지고 있다. 공지의 방법의 경우에는 상당한 상당한 계산력이 필요하다. 이러한 계산력이 하나의 현에 대해서뿐만 아니라 다수의 현에 대해 이용가능하게 유지되어져야 하는 사실을 주시하면, 작금의 프로세서로는 실제로 경제적인 해결책을 얻을 수 없음이 더욱 명백해진다.
따라서, 본 발명은 간단한 방법으로도 신뢰할 수 있는 피기 인식을 얻는 데에 그 목적을 두고 있다.
초기에 언급했던 타입의 방법의 경우, 상기 목적은 제로 크로싱의 영역에서 졀정되는 각 신호파형의 기울기의 크기와, 값이 구해져야 할 제로 크로싱의 선택에 대한 판단기준으로 사용되는 기울기의 크기에 의해서 달성된다.
US 5,014,589에 공지되어 있는 방법과 비교할 때에, 필요한 계산력은 크게 감소될 수 있으며 정확하게는 일반적으로 1/1O 미만으로 감소될 수 있다. 특히, 샘플로부터 디지탈화된 형태로 존재하는 오디오 신호는 그 제로 크로싱의 영역에서만 값을 구하면 된다.제로 크로싱은 2개의 연속 샘플의 극성을 비교함으로써 용이하게 결정할 수 있다. 모든다른 샘플들은 값을 구하는 과정에서 제외될 수 있다. 필요한 경우, 정확도를 개선시키기 위해서는 제로 크로싱 부분에서의 몇개의 값들을 부가적으로 고려할 수 있다. 또한, 제로 크로싱 기울기도 비교적 용이하게 결정될 수 있다、 일정한 샘플링 주파수를 미리 가정하면, 원칙적으로 제로 크로싱 전후에서 두 샘플들간의 간격을 결정하는 것으로도 충분하다. 이제, 오디오 신호의 신호파형이 하나의 주기를 경계짓는 제로 크로싱들에서 가장 급경사에 있다고 가정할 수 있으므로 같은 극성의 제로 크로싱중에서 가장 급경사인 제로 크로싱만을 고려한다. 이들 제로 크로싱간의 간격이 주기에 해당한다. 따라서.주기에 대해서 제로 크로싱이 의미가 있는지의 여부에 대한 판단을 하기 위해서 필요한정보는 제로 크로싱에시의 신호파형으로부터 직접 얻어진다. 따라서, 제로 크로싱 또는 그 근방에 위치하는 샘플들만이 계산에 포함되기 때문에, 필요한 계산력을 상당히 줄이는 것이 가능하다. 또한, 신호파형이 가장 급경사에 있는 위치 즉, 가장 큰 기울기 값을갖는 위치인 제로 크로싱을 이용하는 것은 교란의 영향이 가장 미치는 잇점을 가진다. 만약, 가장 간단한 경우에, 상기 교란을 오프셋(신호파형의 양의 방향 또는 음의 방향으로의 일정량의 변동)으로 간주하면. 평평한 신호 파형을 가긴 제로 크로싱의 경우 신호파형이 제로축을 교차하게되는 점의 변동은 급경사의 신호파형을 가진 제로 크로싱을고려하는 경우보다 더 크게 일어난다. 따라서, 상기 제로 크로싱에 대한 제한으로 인해 피치인식의 정확도가 향상된다.
제로 크로싱 주변의 비교적 좁은 대역의 경우를 제외하고, 오디오 신호파형에 대한 정보를 더이상 필요로 하지 않기 때문에, 비교적 낮은 분석도, 즉 낮은 샘플링 속도를 처리할 수가 있다. 인체의 귀는 그 주파수 대역에서는 비교적 정교만 분석도를 가지고 있기 때문에. 약 1퍼센트, 즉 절반-음조의 1/100의 정확도로 피치 정보를 얻을 수 있다.주파수 범위가 약 80㎐ 내지 1㎑ 에 연장되어 있는 기타의 경우, 상기 목적을 위해서는 1.7㎒의 샘플링 속도가 필요할 것이다. 이에 대한 계산은 상당히 복잡하게 된다. 본 발명에 따른 방법을 사용하면, 훨씬 적은 숫자의 샘플을 다를 수가 있다. 이 경우, 약 10㎑의 새플링 속도면 충분하다.
값을 구하는 데에 사용하게 될 기울기 값을 판단하기 위해서는 기울기의 최대값이 결정되는 것이 바람직하며, 이 최대값을 기초로 하여 감쇠 함수가 발생되고. 그 기울기 크기가 이 시점에서의 감쇠함수값을 초과하는 제로 크로싱만이 계속 처리된다. 한편 상기함수는 기울기값이 너무 작은 모든 제로 크로싱들을 필터링한다. 또한, 이들 제로 크로싱에 대해서는 추후처리동안에 계산력이 필요하지 않다. 따라서, 무효한 제로 크로싱들을 비교적 일찍 제거한 것이다. 부가적으로, 고정된 임계값에 비하여, 감쇠값은 실제 악기의 동적 범위를 참작한 데에 그 잇점을 가진다. 또한. 기울기는 특히 악기가 연주되는 음량에 의해 좌우된다. 또한, 타현되는 순간에 기울기에서 스파D이크가 발생될 수 있으며, 여기에서, 원칙상 상기 스파이크는 의미가 없다. 악기의 동적 범위와의 매칭에도 불구하고, 상기 감쇠함수로 인해서, 극히 낮은 기울기를 갖는 제로 크로싱을 확실히 배제할 수 있지만, 한편으로는 상기 스파이크가 오랜 기간동안 상기 방법에 장애가 되지 않게도 한다.
이 경우, 특히 제로 크로싱이 발생한 때에만 감쇠함수의 값들이 감소하는 것이 바람직하다. 이는 계산력을 절약하지만, 한편으로 이로인해 감쇠함수가 단계적으로 감소되는 것이 확실히게 된다.
또한. 매번의 감소마다 감쇠함수의 값들에 일정계수가 곱해지는 것이 바람직하다. 이는 지수함수적 감쇠 양태가 얻어지게 하며, 초기에는 비교적 급격히 감소하게 하며, 후반에는 원만하게 감소하게 한다.
남게 되는 기울기값들은 적어도 2번 같은 방식으로 감쇠함수와 비교되는 것이 바람직하다. 이와 같은 식으로, 향상된 계산력이 얻어진다. 본래의 오디오 신호의 고르지 못한 특성으로 인해서. 특히 타현에 의해 발생된 때에 그 시작영역에서 상기 기울기값들에 산란이 비교적 크게 발생할 수 있다· 만약, 임계값이 너무 높으면, 유호한 제로크로싱들이 인식되어야 함에도 불구하고 인식되지 않는다. 신호가 많은 수의 제로 크로싱들을 가지고 있으면, 감쇠함수는 극히 작은 값으로 급히 감소하므로, 상기 감쇠함수와 기울기와의 비교의 결과로서 제로 크로싱은 유효한 것으로 잘못 분류된다. 제2(또는 추가) 필터링는 여전히 부정확하거나 불필요한 값들을 제거하기는 하나, 또한편으로는 모든 유효만 값들을 신뢰성있게 보유한다. 일반적으로, 주기를 결정하는 데에 이용되는 가장 급경사의 제로 크로싱을 실제로 결정하는 데에는 1초 비교로도 충분하다.
바람직하게, 제로 크로싱에서의 기울기는 제로 크로싱 주변에서의 오디오 신호의 다수의 기울기 값들로부터 보간된다. 제로 크로싱 영역에서 본래의 선형 신호 파형에 기초를 둔 때에는 2개의 값들로부터 하나의 기울기를 결정하는 것은 충분한 한편, 이 영역에서의 신호파형이 비교적 높은 곡률을 가지면. 이와 같이 단순하게 기울기를 결정할 경우 오차가 발생된다. 이경우, 제로 크로싱 주변으로부터 더 많은 샘플을 이용함으로써써 향상된 정확도를 얻을 수 있다.
제로 크로싱은 그 기울기가 후속 제로 크로싱의 기울기의 크기의 소정 비율을 얻지 못하면 불충분한 것으로 무시하는 것이 바람직하다. 이와 같이 하여, 스파이크, 즉 정규 신호파형에 맞지 않는 값들도 용이하고도 신속하게 제거될 수 있다.
유효 제로 크로싱의 시점은 보간에 의해 결정되는 것이 바람직하다. 그런데, 상기 보간은 유효 제로 크로싱이 실제로 발견된 때에만 필요하므로, 유용한 결과가 실제로 예상될 수 있는 때에만 계산력이 필요하다.
제로 크로싱들간의 연속 시간 간격은 서로 비교되는 것이 바람직하며. 피치는 소정 한계아래의 불일치의 경우에만 결정된다. 피치 및 이에 관련된 주기는 표에 기록해두는 것이 더욱 바람직하다. 주기가 변화하지 않는 한. 피치도 변화하지 않는다. 따라서. 정보가 미리 존재하여 있으므로, 정보를 결정하기 위해서 계산을 새로 시작하거나 검색 작업을 시작하지 않아도 된다. 이는 상당한 계산 시간을 절약한다.
특히 바람직하게 정밀하게는, 오디오 신호에 대해서 고정 샘플링 주파수가 이용되며, 피치에 대한 초기값은 싱기 시간간격에서의 소정 피치 값들을 평균함으로써 소정 길이의 상기 시간 간격의 끝에서만 생성된다. 예를들면, 시간간격은 8 내지 15㎳의 길이를 가길 수 있다. 고정 샘플링 주파수는 낮은 음조의 경우에는 주기당 더 많은 샘플로 인도하며, 높은 음조의 경우에는 주기당 더 적은 수의 샘플로 인도한다. 따라서, 본질적으로 높은 음조에서의 피치 결정에 대한 상대적 정확도는 감소될 것이다. 이러한 불리함은 고정시간격에서의 펑균화에 의해서 보상된다. 일반적으로. 하나의 개별 주기의 경우에서 상대직인 정확도는 어느 정도 감소되지만, 높은 음조의 경우, 고정 시간 간격내에 다수의 주기들이 수용되어 있으므로. 실제의 피치값에 훨씬 가까운 값인 평균값을 얻는다.
이 경우, 통과되는 죄종 초기값에서부터 소정량보다 더 많이 차이날 때에만 초기값은 인터페이스를 매개로 하여 통과되는 것이 특히 바람직하다. 예를들면. 상기 인터페이스는 악기 디지탈 인터페이스(MIDI)일 수 있다. 또한, 상기 인터페이스는 다른 형태의신호 전송에도 널리 이용되고 있다. 전송 데이타의 변화를 제한함으로써 인터페이스는 개방되어 있다.
오디오 신호는 피치인식이전에 저역 필터링되는 것이 바람직하다. 너무 많은 정보를 필터링하는 것을 방지하기 위해서, 상기 저역 필터링은 예를들면 2-극성 IIR 필터를 이용하여 매우 주의하여 행해져야한다. 지침 숫자로서, 필터링후에 주기당 10개 이하의 제로 크로싱이 존재해야 하는 것으로 추정할 수 있다.
제로 크로싱들은 양의 방향 및 음의 방향으로 양쪽으로 구해지는 것이 유리하다. 일반적으로, 한 극성으로 제한되는 경우에서보다 이 이경우가 더 많은 계산력이 필요하다. 한편, 추가의 정보를 얻을 수 있으며, 이는 정확도의 향상에 기여한다.
특히, 이 경우에, 제로 크로싱의 기울기가 반대극성의 선행제로 크로의 기울기의 절반보다 작으면 상기 제로 크로싱은 구해지지 않는 것이 바람직하다. 이 경우에. 상기 제로 크로싱은 주기를 결정하는 데에 이용할 필요가 없다. 그런데, 한편으로는 반대극성의 제로 크로싱간의 간격에 의해서 주기를 얻을 수 있으므로 이러한 정보 손실은 극복될 수 있다.
이하, 도면을 참고하여 바람직한 실시예들과 관련하여 본 발명을 설명한다.
제1도는 각각의 주기(T)내에 다수의 제로 크로싱이 존재하는 통상적인 오디오신호의 파형도를 도시한 도면이다. 예로 도시한 신호는 이미 저역 필더링을 통과한 신호이며, 필터로는 간단한 2-극성 IIR 필터가 이용되었다. 이 필터는 교란-고조파를 제거한다. 상기 신호는 추후 처리를 위해 디지탈화된다. 즉, 여러 시점 (P0,P1,P2,P3)(제3도)에서 진폭 (A0,A1,A2,A3...)들이 결정되고, 디지탈값으로 전환된다. 2개 보다 많은 들을 저장시키기 위해서 시프트 레지스터 또는 F1FO 버퍼에 상기 값드을 저장할 수 있다.
제1도에 예시한 신호파형의 제로 크로싱들은 2개의 연속·샘플들을 서로 비교함으로써 쉽게 결정될 수 있다. 만일 양자가 동일 극성을 가지고 있으면 예를들면 A0와 A1,A2,와 A3의 쌍인 경우에는 그 사이에 제로 크로싱이 없다. 그러한 제로 크로싱의 바로 근방에서의 예외를 무시하면. 상기 값들은 무시할 수 있다. 주기(P)는 상기 2개의 제로 크로싱사이의 간격으로부터 기인한다. 즉X21P - X11P 또는 X22P -X12P 또는 X21N -X1lN 또는 X22N - X12N이다. 주기 결정에 대해 모든 선택 사항이 가능하지만값의 쌍 X21P, X11P 또는 X21N, X11N이 이용되면 가강 정확한 값이 얻어진다. 이는 신호파형이 이들 점들에서의 제로 크로싱에서 가캉 큰 기울기를 가지기 때문이다. 여기에서, 교란은, 최소의 여향을 가진다. 즉, 제로 크로싱의 오프셋이 더 작게 될수록 신호 파형은 상기 제로 크로싱에서 더 급경사가 된다.
가장 급경사의 제로 크로싱을 결정하는 데에 비교적 간단한 방법이 사용되며. 이후 제2도를 참고하여 그 방법을 설명한다.
제2a도는 주기당 다수외 제로 크로싱을 가긴 통상적인 신호파형을 도시한 도면이다. 또한, 각각의 제로 크로싱에서의 신호파형의 기울기의 크기도 도시되어 있다. 제2b도는 양의 기울기값들을 도시한 도면이다. 이 경우, 각각의 제로 크로싱에 인접한 각각의 경우에서 2개 샘플들간의 감산에 의해 간단히 기울기값들을 결정한다. 현재의 경우,샘플링 속도는 1O㎑로 일정하기 때문에 상기 차이로도 기울기를 언급하기에 충분하다.
제2a도 및 제2b도간의 비교에 의해서, 그 이후의 과정에서 더이상 많은 양의 정보가 필요하지 않음을 알 수 있다. 따라서, 상기 양만큼 정보에 대해서는 계산력도 더 이상 필요하지 않음은 물론이다.
제2c도는 제2b도로부터의 기울기값들을 도시한 도면이다. 또한, 감쇠함수의 값들은 점선으로 표시되어 있으며 이 감쇠함수는 다음과 같이 형성된다.
D를 기울기값으로 하고, ENV1은 감쇠함수값으로 하며, F1은 일정감쇠계수 예를들면 11/16으로 한다.
제1제로 크로싱에서, ENV1은 값 D로 설정되이 있다.
다음 제로 크로싱에서 감솨함수는 변경된다.
ENV1 = F1 × ENV1
이제, D > ENV1 이면,
EMV1 = D 로 설정된다.
이 경우는 제2제로 크로싱에 대해 도시한 것이다. D ENV1 이면, 이는 작은 기울기를 가진 제로 크로싱에 해당하며, 이는 유효하지 않는것으로 간주될 수 있다. 상기 점은 추후 과정에서 제거된다.
제2d도로부터 알 수 있듯이, 제1, 제2, 제5, 제6, 제9, 제10등의 제로 크로싱들만은 이러한 제1필터링이후에도 여전히 남아있다. 모든 다른 제로 크로싱들은 이미 제거되었다.
같은 식으로, 남아있는 제로 크로싱들은 추후외 필터링을 거칠 수 있으며(제2e도), ENV2는 제2감쇠함수값들이고, F2는감쇠계수이다.
ENV 2 = F2 ×ENV2
상기 제로 크로싱은 D ENV2 인 경우에만 계속 계산되며, 상경우가 아니면, 이에 해당하는 제로 크로싱은 무효한 것으로 간주된다.
상기 필터링이후에는 가장 급경사의 제로 크로싱만이 남게됨을 제2f도로부터 알 수 있다. 이들 제로 크로싱간의 간격이 주기 T에 해당하며, 또한 피치 측정이다.
정확도를 향상하기 위해서, 제로 크로싱 주변에서 더 많은 점들이 이용될 수 있다. 예를들면, 2개의 인접 포인트 P1및 P2뿐만 아니라, 그전후의 P0및 P3점들도 이용될 수 있다.
다음과 같은 표시법이 이용되면 :
즉, DlO = Al - AO
D21 = A2 - A1
D32 = A3 - A2
dX = A2 / (A2-Al)(제로크로싱과 점 P2간의 거리)
기울기 D = (D21 + dx ×D10 + (1-dx) x D32) / 2 가 된다.
유동점 동작을 방지하고자 하면, 16번의 오버 샘플링이 모의된 경우 정수 조작을 이용하여 보간도 행해질 수 있다. 또한. 절대 기울기값이 아닌 개별 기울기값들의 비율에만 관심이 있으면, 2로 나누지 않아도 된다. 이 경우, 다음과 같이 설정될 수 있다
dx = (A2 4) / (A2-Al)
D = dx × (A2-A0) + (16-dx) x (A3-Al)
이 경우, 상기 기호 는 2진 영역에서 '좌편 시프트 동작을 의미한다. 따라서, 좌편으로의 4비트 만큼의 시프트를 예를들면, 이는 16으로 곱한 결과를 낳는다. 이 경우, 제로 크로싱의 시점은
T = (Ix4) -dx 가 된다.
여기에서, Ix는 점 P2의 샘플링 인덱스이다· 이와 같은 식으로 결정된 2개의 연속 제로 크로싱점들간의 시간 차이는 주기를 산출한다.
2개의 연속주기간의 차이가 소정값, 예를들면 40 내지 60 퍼센트보다 작으면, 결정된 주기는 실제로 진동의 주기에 해당하는 젓으로 가정할 수 있다. 이 경우, 작은 오차도 없애기 위해서, 2개의 연속 주기의 산술평균에 의해 주기를 구한다.·
또한, 연속값들을 서로 역으로 비교함으로써 그 이상으로 오차수정을 할 수 있다. 예를들면, 기울기값 50, 35, 27의 순서는 이치에 맞다. 이는 급격히 쇠퇴하는 신호에 해당한다. 대조적으로, 50, 35, 48의 순서는 상대적으로 존재 가능성이 적다. 이 경우, 제2값(35)은 신호로 적합하지 않다. 따라서, 관련된 제로 크로싱은 제거되어야 한다. 이는 선행값을 현재값의 소정 비율과 비교함으로써 비교적 용이하게 행해질 수 있다. F3가 1보다 작은 일정값, 즉 3/4인 경우, F3 x D(n) D(n-1) 이면, 기울기 D(n-1)와 관련된 제로 크로싱은 제거된다.
상기 방법의 절대 정확도는 ± 1/32 T 이다. 여기에서, T는 샘플링 주기이다. 상대적인 정확도는 주파수에 의해 좌우된다. 이는 낮은 주파수에 대해 더 크기 때문에, 초기에 언급한 부정확도 1퍼센트(1/100 절반 음조)로 신호를 생성하기에 충분하다. 그런데 , 상대 오차는 높은 주파수에서 증가되기 때문에 부정확한 피치 정보가 생성될 위험이 있다. 각각의 주기의 끝에서가 아니라, 예를들면 8내지 15㎳의 일정 길이를 가진 소정 타임 슬롯의 끝에서 피치신호를 생성함으로써 상기 오차는 극복된다. 후속 처리를 하는 데에는 대응 시간이 걸리기 때문에 피치 정보를 더 빠르게 공급할 필요는 없다. 상기 타임 슬롯에서 낮은 주파수에서는 더 작은 갯수의 주기들이 얻어지지만, 상기 주기들은 상대적으로 높은 정확도를 갖는 것으로 판정되었다. 또는, 높은 피치의 경우에는 많은 갯수의 주기들이 얻어지며, 이는 더 낮은 상대 정확도를 갖는 것으로 판정되었다. 이제, 각각의 타임 슬롯에서의 주기를 평균하면, 인체의 귀어ㅔ 거슬리지 않을 정도로 부정확도를 극복할 수 있다.
따라서, 주기 및 피치 정보는 양의 기울기를 가긴 제로 크로싱 및 음의 기울기를 가진 제로 크로싱으로부터 얻어진다. 이들 기울기의 크기들이 서로 현저하게 다른 상황이 자주 발생한다. 하나의 양이 나머지에 비해서 그 2배보다 더 크면, 더 작은 기울기를 갖는 제로 크로싱은 무시한다.
또한, 피치를 경정하는 동안에 제로 크로싱을 구하기 위해서는 존재해야만 하는 최소 기울기를 정의할 수 있다. 또한, 선행 타임 슬롯의 최대 기울기의 절반을 다음 타임 슬롯에 대한 최소 기울기로서 이용함으로써 상기 최소 기울기는 동적으로 변화될 수 있다.
제4도는 본 발명에 따른 음조 피치 인식장치의 개략적인 도면이다. 기타등의 현악기의 픽업으로부터 수신된 파형신호는 오디오 입력신호로서 A/D 컨버터(1)에 공급되며, 일정 샘플링 속도를 샘플링되고 디지탈 신호로 전환된다. 디지탈 출력 신호는 교란 고조파를 제거하기 위해서 저역필터(2)에서 필터링된다. 다음에, 제2A도에 도시한 바와 같은 파형으로 표현될 수 있는 저역 필터(2)의 출력은 제로 크로싱 검출기(3a) 및 경사도 계산기(3b)로 이루어진 연산 유닛(3)에 입력되고, 제로 크로싱 검추기(3a)에서 제로 크로싱에서의 파형의 경사도를 표시하는 경사도를 계산한다. 경사도를 계산하는 몇몇 방법들은 앞서 설명하였다. 경사도를 계산하는 가장 간단한 방법은 각각의 제로 크로싱제로 크로싱 검출기(3a) 및 경 사도 계산기(3b)는 저역필터(2)로부터 수신된 데이타량을 상당히 감소시킨다. 연산 유닛(3)의 출력은 일련의 데이타 쌍으로 이루어져 있으며, 각 쌍의 제1데이타는 제로 크로싱의 타이밍 위치를 표시하고, 각 쌍의 제2데이타는 각각의 제로 크로싱의 점에서의 파형의 경사도를 표시한다.
비교적 낮은 경사도를 가진 제로 크로싱들을 제거하기 위해서, 연산 유닛(3)의 출력은 판별기(4)를 거친다. 이 판별기(4)는 경사도가 소정 임계값이하인 모든 제로 크로싱을 제거한다. 임계 ENV1은 상기 방법에 따라서 발생기(5)에 의해 발생된다. 간단히 말하면, 임계ENV1은 각각의 제로 크로싱에서 일정 계수 F1에 의해 감소되며, 경사도가 이전 임계값보다 높은 경우에는 제로 크로싱의 경사도를 갖도록 상승한다.
따라서, 판별기(4)는 비교적 낮은 경사도를 가진 모든 제로 크로싱들을 제거하므로 데이타량은제2D도에 예시한 바와 같은 데이타로 감소한다. 판별기(6) 및 발생기(7)에 의한 상기한 종류와 같은 제2필터링은 제2F도에 예시한 바와 같이 최종적으로 한 세트의 에이타를 유도한다. 제2F도에 예시한 바와 같은 판별기(6)의 출력에서 남아있는제로 크로싱들은 악음의 주기를 정의하는 기본 제로 크로싱에 해당한다. 계산기(8)는 남아있는 제로 크로싱들의 적어도 2개에서 시간 간격을 결정하고그 역수를 계산한다. 이 역수는 그 파형울 분석하고 있는 악음의 기본 주파수에 직접 대응한다. 주파수 신호는 음조피치신호로 쉽게 전환될 수 있으며. 이는 계산기(8)에 의해 출력된다.
이제까지. 몇몇 실시예를 예로 들어 본 발명의 원리를 설명하였으며, 특수 용어를·이용하긴 하였으나 이는 포괄적이면서도 서술적인 의미로 사용만 것이다. 본 발명 범위는 다음 청구범위에 열거되어 있으며, 이에만 제한되지 않음은 물론이다.

Claims (17)

  1. 오디오신호의 신호 파형의 제로 크로싱들간의 거리를 상기 오디오 신호의 하나의 주기로서 이용하는 현악기/타악기용 피치 인식방법에 있어서. 상기 제로 크로싱의 영역에서 상기 신호파형의 기울기와 크기를 각각 결정하고, 평가되이아 하는 제로 크로싱을 선택하기 위한 판단기준으로서 상기 기울기의 크기를 이용하는 것을 특징으로 하는 현악기./타악기용피치인식방법.
  2. 상기 신호파형의 기울기의 최대값을 결정하고, 상기 최대값을 기초로 하여 감쇠함수를 발생하며, 그 기울기의 크기가 해당 시점에서의 상기 감쇠함수값을 초과하는 제로 크로싱만을 계속 처리하는 것을 특징으로 하는 현악기/타악기용 피치인식방법.
  3. 제2항에 있어서, 상기 감쇠함수값들은 제로 크로싱이 발생하는 때에만 감소하는 것을 특징으로 하는 현악기/타악기용 피치인식방법
  4. 제3항에 있어서, 상기 감쇠함수값을은 감소할 때마다 일정계수가 곱해지는 것을 특징으로 하는 현악기/타악기용 피치인식방법,
  5. 제2항에 있어서, 상기 계속 처리되는 기울기값들은 같은 방식으로 적어도 2번에 결쳐서 감쇠함수와 비교되는 것을 특징으로 하는 현악기/ 타악기용 피치인식방법.
  6. 제1항에 있어서, 상기 제로 크로싱에서의 기울기는 상기 제로 크로싱의 부근에서의 상기 오디오 신호의 다수의 기울기값들로부터 보간되는 것을 특징으로 하는 현악기/타악기용 피치인식방법.
  7. 제1항에 있어서, 로 크로싱의 기울기가 후속 제로크로싱의 기울기 크기의 소정비율에 도달하지 못하면, 상기 제로 크로싱은 불충분한 것으로 버리는 것을 특징으로 하는 현악기/타악기용 피치인식방법.
  8. 제1항에 있어서, 유효 제로 크로싱의 시점은 보간에 의해 결정되는 것을 특징으로 하는 현악기/타악기용 피치인식방법.
  9. 제1항에 있어서, 제로 크로싱들간의 연속 시간 간격들을 서로 비교하여, 소정한계값이하외 불일치의 경우에만 피치를 결정하는 것을 특징으로 하는 현악기/타악기용 피치인식방법.
  10. 제l항에 있어서, 상기 오디오 신호에 대해서 고정 샘플링 주파수를 이용하고. 일정한 소정 길이를 가진 시간 간격에서 상기 결정된 피치값들을 평균함으로써 피치의 본래의 값을 상기 시간 간격의 끝에서만 발생하는 것을 특징으로 하는 현악기/타악기용 피치인싯방법.
  11. 제10항에 있어서, 초기값은 통과된 최종 초기값에 비해서 소정량보다 더 많이 차이가 나는 때에만 인더페이스를 거쳐 통과되는 것을 특징으로 하는 현악기 /타악기 용 피치인식방법.
  12. 제1항에 있어서, 상기 오디오 신호는 피치 인식전에 지역 필터링되는 것을 특징으로 하는 현악기/타악기용 피치인식방법.
  13. 1항에 있어서, 상기 제로 크로싱들을 양의 방향 및 음의 방향, 양쪽으로 구하는 것을 특징으로 하는 현악기/타악기용 피치인식방법.
  14. 제13항에 있어서, 제로 크로싱의 기울기가 반대 극성의 선행 제로 크로싱의
    기울기의 절반보다 작으면, 상기 제로 크로싱은 평가하지 않는 것을 특징으로 하는 현악기/타악기용 피치인식방법.
  15. 음조 피치를 정의하는 대체로 같은 길이의 수개외 주기로 이루어져 있으면서. 그 각각의 주기에는 A(t) = O 인 수개의 제로 크로싱을 포함하며, 시간의 함수로서의 진폭값 A(t) = 0 인 수기의 제로 크로싱을 포함하며, 시간의 함수로서 진폭값 A(t)들로 이루어진 파형으로 표헌되는 악음의 상기 음조 피치를 결정하는 음조피치인식장치에 있어서,
    a) 상기 파형의 적어도 하나의 주기에서 상기 파형의 상기 제로 크로싱을 검출하는 제로 크로싱 검출 수단과,
    b) 상기 각각의 제로 크로싱에 대해 상기 파형의 경사도를 결정하는 경사도 계산 수단과,
    c) 임계값을 발생하는 임계값 발생수단과.
    d) 상기 검출된 제로 크로싱들중에서 경사도가 상기 임계값 아래인 제로 크로싱들을 판별하고 상기 적어도 하나의 주기에 대해 잔존 제로 크로싱들을 결정하기 위하여, 상기 임계값과 상기 경사도롤 비교하는 판별수단과,
    (e) 상기 적어도 하나의 주기의 길이틀 한정하는 상기 잔존 제로 크로싱들에 의거하여 상기 음조 피치를 계산하는 계산수단 이루어진 것을 특징으로 하는 음조피치인식장치.
  16. 제15항에 있어서. 상기 발생수단은 제로 크로싱이 발생할 때마다 조설되는 동적 임계값을 발생하는 것을 특징으로 하는 음조피치인식장치.
  17. 제16항에 있어서. 상기 동적 임계값은 상기 임계값을 초과하는 경사도를 가긴 제로 크로싱이 발생한 후마다 증가되고 후속 제로 크로싱의 경사도아 비교하기 전에 매번 감소되도록 조절되는 것을 특징으로 하는 음조피치인식장치
KR1019960000377A 1995-01-12 1996-01-10 현악기/타악기용 피치인식방법 KR100189796B1 (ko)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
DE19500750.6-51 1995-01-12
DE19500750A DE19500750C2 (de) 1995-01-12 1995-01-12 Verfahren zur Tonhöhenerkennung, insbesondere bei zupf- oder schlagerregten Musikinstrumenten

Publications (2)

Publication Number Publication Date
KR960030072A KR960030072A (ko) 1996-08-17
KR100189796B1 true KR100189796B1 (ko) 1999-06-01

Family

ID=7751357

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1019960000377A KR100189796B1 (ko) 1995-01-12 1996-01-10 현악기/타악기용 피치인식방법

Country Status (5)

Country Link
US (1) US5780759A (ko)
EP (1) EP0722161B1 (ko)
JP (1) JP2799364B2 (ko)
KR (1) KR100189796B1 (ko)
DE (2) DE19500750C2 (ko)

Families Citing this family (30)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE19649296C2 (de) * 1996-11-28 2002-01-17 Blue Chip Music Gmbh Verfahren zur Tonhöhenerkennung bei zupf- oder schlagerregten Saiteninstrumenten
US20050120870A1 (en) * 1998-05-15 2005-06-09 Ludwig Lester F. Envelope-controlled dynamic layering of audio signal processing and synthesis for music applications
JP3912903B2 (ja) 1998-07-02 2007-05-09 キヤノン株式会社 データ変換方法およびその装置
US6766288B1 (en) 1998-10-29 2004-07-20 Paul Reed Smith Guitars Fast find fundamental method
US6836056B2 (en) 2000-02-04 2004-12-28 Viking Technologies, L.C. Linear motor having piezo actuators
US6465723B2 (en) 2000-03-07 2002-10-15 Lynn M. Milano Automatic string instrument tuner kit
AU2001243481A1 (en) 2000-03-07 2001-09-17 Viking Technologies, Inc. Method and system for automatically tuning a stringed instrument
US6627806B1 (en) 2000-04-12 2003-09-30 David J. Carpenter Note detection system and methods of using same
US6529843B1 (en) 2000-04-12 2003-03-04 David J. Carpenter Beat rate tuning system and methods of using same
US6613971B1 (en) 2000-04-12 2003-09-02 David J. Carpenter Electronic tuning system and methods of using same
US6548938B2 (en) 2000-04-18 2003-04-15 Viking Technologies, L.C. Apparatus having a pair of opposing surfaces driven by a piezoelectric actuator
US6717332B2 (en) 2000-04-18 2004-04-06 Viking Technologies, L.C. Apparatus having a support structure and actuator
JP4645867B2 (ja) * 2000-08-02 2011-03-09 ソニー株式会社 ディジタル信号処理方法、学習方法及びそれらの装置並びにプログラム格納媒体
US6759790B1 (en) 2001-01-29 2004-07-06 Viking Technologies, L.C. Apparatus for moving folded-back arms having a pair of opposing surfaces in response to an electrical activation
US6479738B1 (en) 2001-06-27 2002-11-12 Donald A. Gilmore Piano tuner
US7139565B2 (en) * 2002-01-08 2006-11-21 Seven Networks, Inc. Connection architecture for a mobile network
US6559369B1 (en) 2002-01-14 2003-05-06 Donald A. Gilmore Apparatus and method for self-tuning a piano
JP4202111B2 (ja) * 2002-12-20 2008-12-24 株式会社コルグ チューナ
JP4190426B2 (ja) * 2004-01-08 2008-12-03 ローランド株式会社 電子打楽器
JP4504052B2 (ja) * 2004-03-15 2010-07-14 セイコーインスツル株式会社 調律装置及び調律方法
JP2006113416A (ja) * 2004-10-18 2006-04-27 New Japan Radio Co Ltd 周波数検出方法および装置
JP4630646B2 (ja) * 2004-11-19 2011-02-09 任天堂株式会社 息吹きかけ判別プログラム、息吹きかけ判別装置、ゲームプログラムおよびゲーム装置
WO2008051766A2 (en) * 2006-10-19 2008-05-02 U.S. Music Corporation Adaptive triggers method for signal period measuring
RS20060577A (en) * 2006-10-19 2009-05-06 U.S. Music Corporation, Method for signal period measuring with adaptive triggers
US7732703B2 (en) 2007-02-05 2010-06-08 Ediface Digital, Llc. Music processing system including device for converting guitar sounds to MIDI commands
US8620976B2 (en) 2009-11-12 2013-12-31 Paul Reed Smith Guitars Limited Partnership Precision measurement of waveforms
EP2499579B1 (en) 2009-11-12 2021-07-21 Digital Harmonic LLC Domain identification and separation for precision measurement of waveforms
US9390066B2 (en) 2009-11-12 2016-07-12 Digital Harmonic Llc Precision measurement of waveforms using deconvolution and windowing
US8873821B2 (en) 2012-03-20 2014-10-28 Paul Reed Smith Guitars Limited Partnership Scoring and adjusting pixels based on neighborhood relationships for revealing data in images
CN111261191A (zh) * 2019-11-22 2020-06-09 惠州市德赛西威智能交通技术研究院有限公司 车载多媒体系统声音拼接和无声的自动化检测方法及系统

Family Cites Families (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4688464A (en) * 1986-01-16 1987-08-25 Ivl Technologies Ltd. Pitch detection apparatus
US4817484A (en) * 1987-04-27 1989-04-04 Casio Computer Co., Ltd. Electronic stringed instrument
US4882965A (en) * 1987-09-02 1989-11-28 Mcclish Richard E D Direction of bowing detection method and apparatus
JPH0196700A (ja) * 1987-10-08 1989-04-14 Casio Comput Co Ltd 電子楽器の入力制御装置
JPH01177082A (ja) * 1987-12-28 1989-07-13 Casio Comput Co Ltd 音高決定装置
JP2734521B2 (ja) * 1988-03-31 1998-03-30 カシオ計算機株式会社 楽音制御装置
US5001960A (en) * 1988-06-10 1991-03-26 Casio Computer Co., Ltd. Apparatus for controlling reproduction on pitch variation of an input waveform signal
US5349130A (en) * 1991-05-02 1994-09-20 Casio Computer Co., Ltd. Pitch extracting apparatus having means for measuring interval between zero-crossing points of a waveform

Also Published As

Publication number Publication date
EP0722161B1 (en) 2000-03-22
US5780759A (en) 1998-07-14
JPH0922298A (ja) 1997-01-21
JP2799364B2 (ja) 1998-09-17
DE69607223T2 (de) 2000-12-21
DE19500750A1 (de) 1996-07-18
DE19500750C2 (de) 1999-07-15
EP0722161A2 (en) 1996-07-17
EP0722161A3 (en) 1996-11-27
KR960030072A (ko) 1996-08-17
DE69607223D1 (de) 2000-04-27

Similar Documents

Publication Publication Date Title
KR100189796B1 (ko) 현악기/타악기용 피치인식방법
US6798886B1 (en) Method of signal shredding
US6930236B2 (en) Apparatus for analyzing music using sounds of instruments
US4429609A (en) Pitch analyzer
Duxbury et al. Separation of transient information in musical audio using multiresolution analysis techniques
US8618402B2 (en) Musical harmony generation from polyphonic audio signals
US6140568A (en) System and method for automatically detecting a set of fundamental frequencies simultaneously present in an audio signal
Klapuri et al. Robust multipitch estimation for the analysis and manipulation of polyphonic musical signals
WO2007010637A1 (ja) テンポ検出装置、コード名検出装置及びプログラム
JP3789326B2 (ja) テンポ抽出装置、テンポ抽出方法、テンポ抽出プログラム及び記録媒体
JP3914878B2 (ja) リズム情報に関するオーディオ信号を解析するための装置及び方法
Traube et al. Estimating the plucking point on a guitar string
JP3552837B2 (ja) 周波数分析方法及び装置並びにこれを用いた複数ピッチ周波数検出方法及び装置
Penttinen et al. A time-domain approach to estimating the plucking point of guitar tones obtained with an under-saddle pickup
KR100189797B1 (ko) 타악기/현악기의 악음 개시 및 악음 종료 인지방법 및 그장치
Traube et al. Extracting the fingering and the plucking points on a guitar string from a recording
Özaslan et al. Attack based articulation analysis of nylon string guitar
Özaslan et al. Identifying attack articulations in classical guitar
KR20060081500A (ko) 음악에서의 비브라토 자동 검출방법
KR20050003814A (ko) 음정 인식 장치
Penttinen et al. Acoustic guitar plucking point estimation in real time
US7196257B2 (en) Computer aided piano voicing
JP3633090B2 (ja) 音源装置および楽音のスペクトル成分分析方法
JP3919359B2 (ja) 楽音信号のアタック位置検出装置
JPH05313696A (ja) ピッチ周期抽出方法

Legal Events

Date Code Title Description
A201 Request for examination
E701 Decision to grant or registration of patent right
GRNT Written decision to grant
FPAY Annual fee payment

Payment date: 20040108

Year of fee payment: 6

LAPS Lapse due to unpaid annual fee