KR20190086872A - Method the create midi file with harmonics removed and method to converse audio file - Google Patents

Method the create midi file with harmonics removed and method to converse audio file Download PDF

Info

Publication number
KR20190086872A
KR20190086872A KR1020180004947A KR20180004947A KR20190086872A KR 20190086872 A KR20190086872 A KR 20190086872A KR 1020180004947 A KR1020180004947 A KR 1020180004947A KR 20180004947 A KR20180004947 A KR 20180004947A KR 20190086872 A KR20190086872 A KR 20190086872A
Authority
KR
South Korea
Prior art keywords
frequency
file
midi
window
harmonics
Prior art date
Application number
KR1020180004947A
Other languages
Korean (ko)
Inventor
강제원
김동영
최윤정
Original Assignee
이화여자대학교 산학협력단
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 이화여자대학교 산학협력단 filed Critical 이화여자대학교 산학협력단
Priority to KR1020180004947A priority Critical patent/KR20190086872A/en
Publication of KR20190086872A publication Critical patent/KR20190086872A/en

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10HELECTROPHONIC MUSICAL INSTRUMENTS; INSTRUMENTS IN WHICH THE TONES ARE GENERATED BY ELECTROMECHANICAL MEANS OR ELECTRONIC GENERATORS, OR IN WHICH THE TONES ARE SYNTHESISED FROM A DATA STORE
    • G10H1/00Details of electrophonic musical instruments
    • G10H1/0033Recording/reproducing or transmission of music for electrophonic musical instruments
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10HELECTROPHONIC MUSICAL INSTRUMENTS; INSTRUMENTS IN WHICH THE TONES ARE GENERATED BY ELECTROMECHANICAL MEANS OR ELECTRONIC GENERATORS, OR IN WHICH THE TONES ARE SYNTHESISED FROM A DATA STORE
    • G10H3/00Instruments in which the tones are generated by electromechanical means
    • G10H3/12Instruments in which the tones are generated by electromechanical means using mechanical resonant generators, e.g. strings or percussive instruments, the tones of which are picked up by electromechanical transducers, the electrical signals being further manipulated or amplified and subsequently converted to sound by a loudspeaker or equivalent instrument
    • G10H3/125Extracting or recognising the pitch or fundamental frequency of the picked up signal
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10HELECTROPHONIC MUSICAL INSTRUMENTS; INSTRUMENTS IN WHICH THE TONES ARE GENERATED BY ELECTROMECHANICAL MEANS OR ELECTRONIC GENERATORS, OR IN WHICH THE TONES ARE SYNTHESISED FROM A DATA STORE
    • G10H2210/00Aspects or methods of musical processing having intrinsic musical character, i.e. involving musical theory or musical parameters or relying on musical knowledge, as applied in electrophonic musical tools or instruments
    • G10H2210/031Musical analysis, i.e. isolation, extraction or identification of musical elements or musical parameters from a raw acoustic signal or from an encoded audio signal
    • G10H2210/066Musical analysis, i.e. isolation, extraction or identification of musical elements or musical parameters from a raw acoustic signal or from an encoded audio signal for pitch analysis as part of wider processing for musical purposes, e.g. transcription, musical performance evaluation; Pitch recognition, e.g. in polyphonic sounds; Estimation or use of missing fundamental
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10HELECTROPHONIC MUSICAL INSTRUMENTS; INSTRUMENTS IN WHICH THE TONES ARE GENERATED BY ELECTROMECHANICAL MEANS OR ELECTRONIC GENERATORS, OR IN WHICH THE TONES ARE SYNTHESISED FROM A DATA STORE
    • G10H2210/00Aspects or methods of musical processing having intrinsic musical character, i.e. involving musical theory or musical parameters or relying on musical knowledge, as applied in electrophonic musical tools or instruments
    • G10H2210/031Musical analysis, i.e. isolation, extraction or identification of musical elements or musical parameters from a raw acoustic signal or from an encoded audio signal
    • G10H2210/086Musical analysis, i.e. isolation, extraction or identification of musical elements or musical parameters from a raw acoustic signal or from an encoded audio signal for transcription of raw audio or music data to a displayed or printed staff representation or to displayable MIDI-like note-oriented data, e.g. in pianoroll format

Landscapes

  • Physics & Mathematics (AREA)
  • Engineering & Computer Science (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Auxiliary Devices For Music (AREA)
  • Electrophonic Musical Instruments (AREA)

Abstract

The disclosed technology relates to a method of creating a MIDI file having harmonics removed and a method of converting an audio file. The method of creating a MIDI file having harmonics removed comprises: a step in which a system receives an audio file and analyzes a frequency of the audio file; a step in which the system removes harmonics by setting an upper threshold value according to a level of the frequency; a step in which the system sets a window having a different size for each frequency region corresponding to each sound included in the frequency from which the harmonics are removed; a step which obtains a representative value for each window by applying the weight to each of the windows having different sizes, and calculates starting and ending time points for the representative value; and a step which converts the audio file into a MIDI file by selecting a MIDI sound matching the representative value on the basis of the starting and ending time points. Accordingly, the MIDI file having accurate pitch and beats as compared with the original audio file can be created, and the audio file can be accurately converted into a sound file in a different format.

Description

고조파를 제거한 미디 파일 생성 방법 및 오디오 파일 변환 방법{METHOD THE CREATE MIDI FILE WITH HARMONICS REMOVED AND METHOD TO CONVERSE AUDIO FILE} METHOD AND METHOD TO CONVERSE AUDIO FILE BACKGROUND OF THE INVENTION 1. Field of the Invention [0001] The present invention relates to a method of generating a MIDI file,

개시된 기술은 오디오 파일을 미디 파일로 변환할 시 고조파를 제거하여 보다 정확한 미디 파일을 생성하는 방법과 오디오 파일을 다른 포맷의 파일로 변환하는 방법에 관한 것이다.The disclosed technique relates to a method of generating a more accurate MIDI file by removing harmonics when converting an audio file into a MIDI file, and a method of converting an audio file into a file of a different format.

미디 파일 변환 방법은 미디음에 대응되는 주파수 값을 추출하여 일련의 매칭을 통해 파일을 변환하는 방법이다. 일반적으로 오디오 파일을 시스템에 입력하고 시스템을 통해 오디오 파일에 대한 주파수값을 추출하면 이를 토대로 미디파일을 생성하게 된다.The MIDI file conversion method extracts frequency values corresponding to MIDI sounds and converts the files through a series of matching operations. Generally, when an audio file is input to the system and the system extracts frequency values for the audio file, a MIDI file is generated based on the frequency value.

그러나, 오디오 파일에 대한 주파수값을 추출하는 과정에서 배음으로 인한 고조파 주파수가 섞이게 된다. 즉, 미디 파일로 변환하는 과정에서 고조파 주파수까지 음으로 인식하고 이를 미디음으로 변환하기 때문에 원래의 오디오 파일과 다소 다른 결과물이 생성되거나 부정확한 미디 파일이 생성되게 된다.However, in extracting the frequency value for the audio file, harmonic frequencies due to harmonics are mixed. That is, in the process of converting to a MIDI file, a harmonic frequency is recognized as a sound and converted to a MIDI sound, so that a slightly different result than an original audio file is generated or an incorrect MIDI file is generated.

미국 공개특허 2006-0075884호(발명의 명칭 : Method and device for extracting a melody underlying an audio signal)을 참조하면 주파수 영역에서 인지 가능한 영역의 신호를 스케일링하여 멜로디를 추출하는 기술이 개시되어 있다. 그러나 미디변환에 앞서 고조파를 제거하지 않기 때문에 종래와 같이 부정확하거나 다소 다른 미디 파일이 생성된다는 단점이 있었다.US Patent Application Publication No. 2006-0075884 discloses a technique for extracting a melody by scaling a signal of a recognizable region in a frequency domain with reference to a method and device for extracting a melody underlying an audio signal. However, since harmonics are not removed prior to MIDI conversion, there is a disadvantage in that an incorrect or somewhat different MIDI file is generated as in the prior art.

개시된 기술은 오디오 파일의 주파수에서 고조파를 제거하고 각 영역마다 서로 다른 크기의 윈도우를 적용하여 보다 정확한 미디 파일을 생성하는 방법 및 오디오 파일을 서로 다른 포맷의 음원 파일로 변환하는 방법을 제공하는데 있다.The disclosed technique is to provide a method of generating a more accurate MIDI file by removing harmonics at a frequency of an audio file and applying windows of different sizes to each area, and a method of converting an audio file into a sound source file of a different format.

상기의 기술적 과제를 이루기 위하여 개시된 기술의 제 1 측면은 시스템이 오디오 파일을 입력받고 상기 오디오 파일에 대한 주파수를 분석하는 단계, 상기 시스템이 상기 주파수의 레벨에 따라 상한임계값을 설정하여 고조파를 제거하는 단계, 상기 시스템이 상기 고조파를 제거한 주파수에 포함된 각각의 음에 대응되는 주파수 영역마다 서로 다른 크기의 윈도우를 설정하는 단계, 상기 서로 다른 크기의 윈도우 각각에 대한 가중치를 적용하여 각 윈도우마다 대푯값을 구하고 상기 대푯값에 대한 시작시점 및 종료시점을 계산하는 단계 및 상기 시작시점 및 상기 종료시점을 토대로 상기 대푯값에 매칭되는 미디 음을 선택하여 상기 오디오 파일을 미디 파일로 변환하는 단계를 포함하는 미디 파일 생성 방법을 제공하는데 있다.According to a first aspect of the present invention, there is provided a method of receiving a sound file and analyzing a frequency of the audio file, the method comprising: setting an upper threshold value according to a level of the frequency to remove harmonics; Setting a window of a different size for each frequency region corresponding to each sound included in a frequency at which the system eliminates the harmonics, applying a weight to each of the windows of different sizes, Calculating a start point and an end point of the representative value, and selecting a MIDI note matching the representative value based on the start point and the end point to convert the audio file into a MIDI file, Generating method.

상기의 기술적 과제를 이루기 위하여 개시된 기술의 제 2 측면은 시스템이 오디오 파일을 입력받고 상기 오디오 파일에 대한 주파수를 분석하는 단계, 상기 시스템이 상기 주파수의 레벨에 따라 상한임계값을 설정하여 고조파를 제거하는 단계, 상기 시스템이 상기 고조파를 제거한 주파수에 포함된 각각의 음에 대응되는 주파수 영역마다 서로 다른 크기의 윈도우를 설정하는 단계, 상기 서로 다른 크기의 윈도우 각각에 대한 가중치를 적용하여 각 윈도우마다 대푯값을 구하고 상기 대푯값에 대한 시작시점 및 종료시점을 계산하는 단계 및 상기 시작시점 및 상기 종료시점을 토대로 상기 대푯값에 매칭되는 음정 및 박자를 계산하여 상기 고조파를 제거한 오디오 파일을 서로 다른 포맷의 음원 파일로 변환하는 단계를 포함하는 오디오 파일 변환 방법을 제공하는데 있다.According to a second aspect of the present invention, there is provided a method for receiving an audio file and analyzing a frequency of the audio file, the system comprising the steps of setting an upper threshold value according to a level of the frequency, Setting a window of a different size for each frequency region corresponding to each sound included in a frequency at which the system eliminates the harmonics, applying a weight to each of the windows of different sizes, Calculating a starting point and an ending point of the representative value and calculating a pitch and a beat matched to the representative value based on the starting point and the end point to calculate an audio file from which the harmonic is removed into a sound source file of a different format An audio file conversion method comprising a step of converting To provide.

개시된 기술의 실시 예들은 다음의 장점들을 포함하는 효과를 가질 수 있다. 다만, 개시된 기술의 실시 예들이 이를 전부 포함하여야 한다는 의미는 아니므로, 개시된 기술의 권리범위는 이에 의하여 제한되는 것으로 이해되어서는 아니 될 것이다. Embodiments of the disclosed technique may have effects that include the following advantages. It should be understood, however, that the scope of the disclosed technology is not to be construed as limited thereby, since the embodiments of the disclosed technology are not meant to include all such embodiments.

개시된 기술의 일 실시예에 따르면 고조파를 제거한 미디 파일 생성 방법은 미디 파일 변환 시 고조파를 제거하여 정확도가 높은 미디 파일을 생성하는 효과가 있다.According to an embodiment of the disclosed technology, a harmonic-free MIDI file generation method has the effect of generating a MIDI file with high accuracy by removing harmonics when converting a MIDI file.

또한, 각 주파수 영역마다 서로 다른 크기의 윈도우를 적용하여 특정 음에 대한 음정 및 박자를 보다 정확하게 계산하는 장점이 있다.Further, there is an advantage that the pitch and beat of a specific sound can be calculated more accurately by applying windows of different sizes to each frequency region.

도 1은 개시된 기술의 일 실시예에 따른 고조파를 제거한 미디 파일 생성 방법에 대한 순서도이다.
도 2는 종래의 미디 파일 생성 방법에 대한 순서도이다.
도 3은 개시된 기술의 일 실시예에 따라 고조파를 제거하는 것을 나타낸 도면이다.
도 4는 개시된 기술의 일 실시예에 따라 서로 다른 크기의 윈도우를 생성하는 것을 나타낸 도면이다.
도 5는 개시된 기술의 일 실시예에 따라 대푯값을 계산하는 것을 나타낸 도면이다.
도 6은 개시된 기술의 일 실시예에 따른 오디오 파일 변환 방법에 대한 순서도이다.
1 is a flowchart illustrating a method of generating a harmonized MIDI file according to an embodiment of the disclosed technique.
2 is a flowchart of a conventional method of generating a MIDI file.
3 is a diagram illustrating removing harmonics according to one embodiment of the disclosed technique.
Figure 4 illustrates creating windows of different sizes according to one embodiment of the disclosed technique.
5 is a diagram illustrating calculation of a representative value according to one embodiment of the disclosed technique.
6 is a flowchart of an audio file conversion method according to an embodiment of the disclosed technique.

본 발명은 다양한 변경을 가할 수 있고 여러 가지 실시예를 가질 수 있는 바, 특정 실시예들을 도면에 예시하고 상세한 설명에 상세하게 설명하고자 한다. 그러나, 이는 본 발명을 특정한 실시 형태에 대해 한정하려는 것이 아니며, 본 발명의 사상 및 기술 범위에 포함되는 모든 변경, 균등물 내지 대체물을 포함하는 것으로 이해되어야 한다.While the invention is susceptible to various modifications and alternative forms, specific embodiments thereof are shown by way of example in the drawings and will herein be described in detail. It should be understood, however, that the invention is not intended to be limited to the particular embodiments, but includes all modifications, equivalents, and alternatives falling within the spirit and scope of the invention.

제 1, 제 2, A, B 등의 용어는 다양한 구성요소들을 설명하는데 사용될 수 있지만, 해당 구성요소들은 상기 용어들에 의해 한정되지는 않으며, 단지 하나의 구성요소를 다른 구성요소로부터 구별하는 목적으로만 사용된다. 예를 들어, 본 발명의 권리 범위를 벗어나지 않으면서 제 1 구성요소는 제 2 구성요소로 명명될 수 있고, 유사하게 제 2 구성요소도 제 1 구성요소로 명명될 수 있다. 및/또는 이라는 용어는 복수의 관련된 기재된 항목들의 조합 또는 복수의 관련된 기재된 항목들 중의 어느 항목을 포함한다.The terms first, second, A, B, etc., may be used to describe various components, but the components are not limited by the terms, but may be used to distinguish one component from another . For example, without departing from the scope of the present invention, the first component may be referred to as a second component, and similarly, the second component may also be referred to as a first component. And / or < / RTI > includes any combination of a plurality of related listed items or any of a plurality of related listed items.

본 명세서에서 사용되는 용어에서 단수의 표현은 문맥상 명백하게 다르게 해석되지 않는 한 복수의 표현을 포함하는 것으로 이해되어야 한다. 그리고 "포함한다" 등의 용어는 설시된 특징, 개수, 단계, 동작, 구성요소, 부분품 또는 이들을 조합한 것이 존재함을 의미하는 것이지, 하나 또는 그 이상의 다른 특징들이나 개수, 단계 동작 구성요소, 부분품 또는 이들을 조합한 것들의 존재 또는 부가 가능성을 배제하지 않는 것으로 이해되어야 한다.It is to be understood that the singular < RTI ID = 0.0 > terms < / RTI > used herein should be interpreted to include a plurality of representations unless the context clearly dictates otherwise. And "comprises ", when used in this specification, specify the presence of stated features, numbers, steps, operations, elements, parts, or combinations thereof, Or combinations thereof, as a matter of course.

도면에 대한 상세한 설명을 하기에 앞서, 본 명세서에서의 구성부들에 대한 구분은 각 구성부가 담당하는 주기능 별로 구분한 것에 불과함을 명확히 하고자 한다. 즉, 이하에서 설명할 2개 이상의 구성부가 하나의 구성부로 합쳐지거나 또는 하나의 구성부가 보다 세분화된 기능별로 2개 이상으로 분화되어 구비될 수도 있다. Before describing the drawings in detail, it is to be clarified that the division of constituent parts in this specification is merely a division by main functions of each constituent part. That is, two or more constituent parts to be described below may be combined into one constituent part, or one constituent part may be divided into two or more functions according to functions that are more subdivided.

그리고 이하에서 설명할 구성부 각각은 자신이 담당하는 주기능 이외에도 다른 구성부가 담당하는 기능 중 일부 또는 전부의 기능을 추가적으로 수행할 수도 있으며, 구성부 각각이 담당하는 주기능 중 일부 기능이 다른 구성부에 의해 전담되어 수행될 수도 있음은 물론이다. 따라서, 본 명세서를 통해 설명되는 각 구성부들의 존재 여부는 기능적으로 해석되어야 할 것이다.In addition, each of the constituent units described below may additionally perform some or all of the functions of other constituent units in addition to the main functions of the constituent units themselves, and that some of the main functions, And may be carried out in a dedicated manner. Accordingly, the presence or absence of each component described in this specification should be interpreted as a function.

도 1은 개시된 기술의 일 실시예에 따른 고조파를 제거한 미디 파일 생성 방법에 대한 순서도이다. 도 1을 참조하면 고조파를 제거한 미디 파일 생성 방법은 이하의 단계들을 포함한다.1 is a flowchart illustrating a method of generating a harmonized MIDI file according to an embodiment of the disclosed technique. Referring to FIG. 1, a method of generating a MIDI file with harmonics removed includes the following steps.

110 단계에서 시스템은 오디오 파일을 입력받아 주파수를 분석한다. 시스템은 오디오 파일 및 미디 파일을 저장할 수 있는 메모리를 구비하고 오디오 파일의 주파수를 분석하여 미디 파일로 변환할 수 있는 연산을 수행하는 프로세서가 구비된다. 예컨대, 시스템은 컴퓨터나 노트북과 같은 단말기일 수 있다.In step 110, the system analyzes the frequency by receiving the audio file. The system includes a processor having a memory capable of storing audio files and MIDI files, and performing an operation of analyzing frequencies of the audio files and converting the analyzed frequencies into MIDI files. For example, the system may be a terminal such as a computer or a notebook.

한편, 이러한 시스템은 메모리에 오디오 파일을 입력받으면 프로세서를 이용하여 오디오 파일에 대한 주파수를 분석한다. 일 실시예로, 오디오 파일에 포함된 각각의 음들에 대한 기본주파수와 고조파를 분석할 수 있다. 여기에서 기본주파수는 원래의 음에 대한 주파수로 각 음마다 서로 다른 높낮이, 박자 및 음정과 같은 성분들을 포함하는 주파수를 의미한다. 그리고 고조파는 음들의 중첩으로 발생되는 배음에 대한 주파수로 주파수의 특성상 기본주파수의 n배의 양상을 갖는다.On the other hand, when the system receives an audio file in the memory, it analyzes the frequency of the audio file using the processor. In one embodiment, the fundamental frequency and harmonics for each note included in the audio file can be analyzed. Here, the fundamental frequency is a frequency with respect to the original sound, which means a frequency including components such as different pitches, beats, and pitches for each note. Harmonics are frequencies for harmonics generated by superposition of sounds, which are n times the fundamental frequency.

잠시 도 2를 참조하면 종래의 미디 파일 생성 방법에서는 210 단계에 따라 시스템에 웨이브 파일이나 MP3 파일이 입력되면 220 단계에서 해당 파일에 대한 주파수를 분석하여 미리 가지고 있던 미디음에 대한 주파수에 매칭시킨다. 그리고 230 단계를 통해 미디 파일로 변환하는 과정을 거치게 된다. Referring to FIG. 2, if a wave file or an MP3 file is input to the system according to step 210 in the conventional method of generating a MIDI file, the frequency of the corresponding file is analyzed to match the frequency of the MIDI sound. In step 230, a MIDI file is converted.

즉, 단순히 입력되는 오디오 파일에 대한 주파수를 뽑아내서 이를 그대로 미디 파일로 변환하는 단순한 과정을 거치기 때문에 각각의 음에 대한 음정이나 박자의 정확도가 떨어지고, 고조파를 제거하지 않은채로 미디 파일 변환 과정을 거치기 때문에 불필요한 음까지 미디음으로 변환되어 원래의 오디오와 비교하여 다소 부정확한 미디 파일이 생성되는 문제점이 있었다.That is, since a simple process of extracting a frequency of an input audio file and converting it to a MIDI file is performed, the accuracy of the pitch and beat of each sound is degraded, and the MIDI file conversion process is performed without removing harmonics Therefore, there is a problem that a MIDI file is converted into a MIDI sound until an unnecessary sound is generated, thereby generating a somewhat inaccurate MIDI file as compared with the original audio.

따라서, 개시된 기술에서는 이러한 문제점을 해결하고자 오디오 파일에 포함된 기본주파수와 고조파를 구분하여 고조파를 제거시킨 다음에 남아있는 기본주파수들만을 이용하여 미디 파일을 생성한다.Accordingly, in order to solve such a problem, the disclosed technology divides the fundamental frequency and the harmonic included in the audio file to remove the harmonics, and then generates the MIDI file using only the remaining fundamental frequencies.

120 단계에서 시스템은 고조파를 제거하기 위하여 주파수의 레벨에 따라 상한임계값을 설정한다. 일 실시예로, 특정 레벨을 만족하는 주파수와 동일한 시점에 더 큰 주파수가 존재하면 고조파로 판단할 수 있다. 일반적으로 고조파는 동일한 시점에서 기본주파수보다 n배 큰 주파수로 나타나기 때문에 주파수를 시점별로 구분하여 큰 값들을 제거함으로써 고조파를 제거하는 것이 가능하다.In step 120, the system sets an upper threshold according to the level of the frequency to remove the harmonics. In one embodiment, if there is a larger frequency at the same time as a frequency that satisfies a certain level, it can be determined as a harmonic. Generally, since the harmonics appear at frequencies n times larger than the fundamental frequency at the same time, it is possible to remove the harmonics by removing the large values by dividing the frequency by the viewpoint.

다른 일 실시예로, 주파수를 하나의 음에 해당하는 복수개의 영역으로 분류하고, 각 영역마다 2개의 주파수가 감지되면 그 중 큰 주파수를 고조파로 판단하여 제거할 수 있다. 이하의 도 3을 참조하면 오디오 파일로부터 추출한 주파수를 시점에 따라 복수개의 영역으로 분류하고 각 영역마다 2개의 주파수가 감지되면 큰 주파수(301)를 고조파로 판단하고 있는 것을 확인할 수 있다. In another embodiment, a frequency is classified into a plurality of regions corresponding to one sound, and when two frequencies are detected for each region, a large frequency may be determined as a harmonic and removed. Referring to FIG. 3, it can be seen that frequencies extracted from an audio file are classified into a plurality of regions according to a viewpoint, and when two frequencies are detected for each region, a large frequency 301 is determined as a harmonic.

여기에서 오디오 파일에 포함된 음들은 상대적으로 큰 음이 있고 작은 음이 있는데 당연히 크고 작음의 차이에 따라 둘을 구분하는 것이 가능하다. 예컨대, 도 3에 도시된 바와 같이 2번째 영역에서 기본주파수(302)보다 고조파(301)의 레벨이 더 높으므로 시스템은 고조파(301)을 제거할 수 있다.Here, the sound included in the audio file has a relatively large sound and a small sound, but it is possible to distinguish the two according to the difference between the large and small sound. For example, as shown in FIG. 3, the system can remove the harmonics 301 because the level of the harmonics 301 is higher than the fundamental frequency 302 in the second region.

130 단계에서 시스템은 고조파를 제거한 나머지 주파수에 포함된 각각의 음에 대응되는 주파수 영역마다 서로 다른 크기의 윈도우를 설정한다. 여기에서 윈도우는 단순히 시간에 따라 음을 나누는 기준이 아닌 각각의 음에 대응되는 주파수 영역마다 서로 다른 임계값을 적용하여 각 음들마다 서로 다른 크기로 설정되는 구간 내지는 영역을 의미한다.In step 130, the system sets a window having a different size for each frequency region corresponding to each sound included in the remaining frequency from which the harmonics are removed. Here, the window is not a reference for dividing a sound according to time, but refers to a section or an area which is set to a different size for each sound by applying different threshold values to the respective frequency regions corresponding to the respective sounds.

일 실시예로, 도 4를 참조하면 3개의 음에 대한 주파수가 표시되어 있고, 여기에 임계값을 적용하여 각 음들에 대한 서로 다른 크기의 5개의 윈도우(401, 402, 403, 404, 405)를 설정하는 것을 확인할 수 있다. 여기에서 윈도우의 크기는 하나의 음에 대응되는 주파수 영역에 적용된 임계값을 기준으로 주파수의 기울기가 0에서 양수로 변하는 순간 및 음수에서 0으로 변하는 순간을 해당 주파수 영역에 대한 윈도우의 시작점 및 종료점으로 설정한다. 4, frequencies for three notes are displayed, and five windows 401, 402, 403, 404, and 405 of different sizes for each note are applied to the threshold, As shown in FIG. Here, the size of the window is defined as a time when the slope of the frequency changes from 0 to a positive value based on a threshold value applied to a frequency region corresponding to one note, and a moment when the value changes from a negative value to 0 as a starting point and an ending point of the window for the corresponding frequency region Setting.

즉 윈도우는 고조파에 대한 간섭은 물론이고 다른 음들과 확실하게 구별하고 각각의 음들을 보다 정확하게 판단하기 위해서 설정하는 것이다. 만약 비슷한 소리의 음들이 동시에 여러개가 발현된다면 윈도우를 통해 비슷한 소리의 음들을 디텍팅하는 것이 가능하다. 그리고 큰 음과 작은 음이 동시에 발현된다면 전자와는 달리 이를 디텍팅하기는 매우 어려우므로 3번 윈도우(403)의 음을 버리게 된다. That is, the window is set not only to interfere with harmonics but also to distinguish clearly from other sounds and to judge each sound more accurately. It is possible to detect similar sounds through windows if several sounds of similar sounds are present at the same time. If a large sound and a small sound are generated at the same time, unlike the former, it is very difficult to detect it, so that the sound of the third window 403 is discarded.

원래의 오디오 파일을 그대로 듣게 되더라도 큰 음과 작은 음이 동시에 나타날 때에는 작은 음이 묻히기 때문에 쉽게 인지하지 못하고, 이를 미디로 변환하는 경우에는 작은 음을 삭제하여도 원래의 오디오 파일과 크게 차이가 나지 않는 결과가 도출된다. 따라서, 서로 다른 크기의 윈도우를 적용하여 미디 파일을 생성하기 위한 최적의 주파수만을 추려내는 것이 가능하다.Even if you hear the original audio file as it is, you can not recognize it easily because a small sound is buried when a big sound and a small sound appear at the same time. If you convert it to MIDI, even if you delete a small sound, Results are derived. Therefore, it is possible to select only the optimum frequency for generating a MIDI file by applying windows of different sizes.

140 단계에서 시스템은 서로 다른 크기의 윈도우 각각에 대한 가중치를 적용하여 각 윈도우마다 대푯값을 구한다. 그리고 대푯값에 대한 시작시점 및 종료시점을 계산한다. 일 실시예로, 시스템은 하나의 윈도우에 포함된 음에 대한 음정 및 박자를 계산하기 위하여 해당 윈도우의 가장 높은 레벨에 해당하는 주파수 값을 대푯값으로 계산할 수 있다.In step 140, the system obtains a representative value for each window by applying a weight to each window having a different size. Then, the start and end points of the representative value are calculated. In one embodiment, the system may calculate a frequency value corresponding to a highest level of a corresponding window to calculate a pitch and a beat for a note included in one window, using a representative value.

그리고 각 대푯값들의 시작시점과 종료시점을 계산하여 해당 음에 대한 음정과 박자를 계산하게 된다. 예컨대, 도 5를 참조하면 하나의 음에 대응되는 주파수의 가장 높은 레벨에 해당하는 지점을 그 음의 대푯값(501)으로 설정하고, 대푯값에서 연속되고 있는 주파수의 시작시점(502)과 종료시점(503)으로 계산할 수 있다. 그리고 시작시점(502)에서 종료시점(503)까지를 대푯값(501)에 대응되는 미디 음을 발현하는 시간 및 미디 음을 지속하는 시간으로 계산할 수 있다. 이 과정을 통하여 시스템은 오디오 파일에 포함된 전체 음을 미디 음으로 변환할 시 각각의 음들을 어느 시점에 어떤 음으로 얼마만큼의 지속시간을 갖도록 하는지 계산하는 것이 가능하다. 따라서, 종래의 미디 변환 방법보다 정확한 음정과 박자를 갖는 미디 파일을 생성할 수 있다.Then, the start and end points of each representative value are calculated and the pitch and beat of the corresponding note are calculated. For example, referring to FIG. 5, a point corresponding to the highest level of a frequency corresponding to one note is set as the negative representative value 501, and the starting point 502 and the ending point 503). The time from the start point 502 to the end point 503 can be calculated as a time for expressing the MIDI sound corresponding to the representative value 501 and a duration for continuing the MIDI sound. Through this process, it is possible to calculate how long each sound is to be sounded and how much time it takes to convert each sound included in the audio file into MIDI sound. Therefore, it is possible to generate a MIDI file having a more accurate pitch and beat than the conventional MIDI conversion method.

150 단계에서 시스템은 140 단계를 통해 구해진 대푯값의 시작시점과 종료시점을 토대로 대푯값에 매칭되는 미디 음을 선택한다. 일 실시예로, 시스템은 미리 미디음들에 대한 테이블을 저장하고 있고, 주파수로 변환된 오디오 파일의 각 음들에 매칭되는 미디 음을 각각 매칭시키는 방식으로 미디 파일을 생성할 수 있다. 미디 파일을 생성하는 방식 자체는 종래의 기술과 비교하여 크게 다르지 않지만 개시된 기술에 따른 방식으로 미디 파일을 생성하면 고조파를 포함하지 않은 주파수를 이용하기 때문에 불필요한 음이 미디 파일에 추가되지 않는 장점이 있으며 윈도우를 적용하여 각 음들에 대한 음정과 박자를 보다 정확하게 판단하기 때문에 각각의 음을 단순음으로 표현하는 미디 파일을 보다 디테일하게 생성하는 장점을 갖는다.In step 150, the system selects a MIDI sound that matches the representative value based on the start point and the end point of the representative value obtained in step 140. In one embodiment, the system stores a table for MIDI notes in advance, and may generate MIDI files in a manner that matches each of the MIDI notes that match each note of the audio file converted to frequency. Although the method of generating a MIDI file itself is not significantly different from the conventional technique, when a MIDI file is generated according to the disclosed technology, unnecessary sounds are not added to the MIDI file because frequencies using no harmonics are used Since the pitch and the beat of each note are more accurately determined by applying the window, it is advantageous to generate a MIDI file that expresses each note as a simple note in a more detailed manner.

한편, 이하의 도 6을 참조하면 시스템은 오디오 파일을 미디 파일 뿐만 아니라 다른 포맷의 음원 파일로 변환하는 것이 가능하다. 예를 들어, 시스템은 앞서 110 내지 140 단계를 동일하게 610 내지 640 단계를 수행하여 원래의 오디오 파일에서 고조파를 제거한 주파수를 획득할 수 있다. 그리고 650 단계에서 각각의 음에 대응되는 주파수에 설정한 동적 윈도우를 이용하여 음정과 박자를 계산할 수 있다.Meanwhile, referring to FIG. 6, the system can convert an audio file into a sound file of a different format as well as a MIDI file. For example, the system can perform steps 610 to 640 in the same manner as steps 110 to 140, thereby obtaining the harmonics free from the original audio file. In step 650, the pitch and the pitch can be calculated using the dynamic window set to the frequency corresponding to each note.

즉, 오디오에 포함된 음들의 순수한 주파수를 획득할 수 있으므로 이 주파수를 토대로 WAVE, FLAC, OGG, AAC 등과 같은 다양한 디지털 음원의 포맷으로 변환할 수 있다. 물론 서로 다른 포맷의 음원 파일로 변환하기 위해서 시스템은 해당 포맷에 따른 데이터를 사전에 저장하고 있어야 한다. That is, since the pure frequencies of the tones included in the audio can be obtained, it can be converted into various digital sound source formats such as WAVE, FLAC, OGG, and AAC based on this frequency. Of course, in order to convert sound source files of different formats, the system must store the data according to the format in advance.

개시된 기술의 일 실시예에 따른 고조파를 제거한 미디 파일 생성 방법 및 오디오 파일 변환 방법은 이해를 돕기 위하여 도면에 도시된 실시 예를 참고로 설명되었으나, 이는 예시적인 것에 불과하며, 당해 분야에서 통상적 지식을 가진 자라면 이로부터 다양한 변형 및 균등한 타 실시 예가 가능하다는 점을 이해할 것이다. 따라서, 개시된 기술의 진정한 기술적 보호범위는 첨부된 특허청구범위에 의해 정해져야 할 것이다.Although the harmonic-free MIDI file generation method and the audio file conversion method according to an embodiment of the disclosed technology have been described with reference to the embodiments shown in the drawings to facilitate understanding, the present invention is not limited thereto. Those skilled in the art will appreciate that various modifications and equivalent embodiments are possible. Accordingly, the true scope of protection of the disclosed technology should be determined by the appended claims.

110 : 오디오 파일의 주파수 분석 120 : 고조파 제거
130 : 주파수 영역마다 윈도우 설정 140 : 대푯값 계산
150 : 미디 파일로 변환
110: Frequency analysis of audio files 120: Harmonic elimination
130: Window setting for each frequency domain 140:
150: Convert to MIDI file

Claims (10)

시스템이 오디오 파일을 입력받고 상기 오디오 파일에 대한 주파수를 분석하는 단계;
상기 시스템이 상기 주파수의 레벨에 따라 상한임계값을 설정하여 고조파를 제거하는 단계;
상기 시스템이 상기 고조파를 제거한 주파수에 포함된 각각의 음에 대응되는 주파수 영역마다 서로 다른 크기의 윈도우를 설정하는 단계;
상기 서로 다른 크기의 윈도우 각각에 대한 가중치를 적용하여 각 윈도우마다 대푯값을 구하고 상기 대푯값에 대한 시작시점 및 종료시점을 계산하는 단계; 및
상기 시작시점 및 상기 종료시점을 토대로 상기 대푯값에 매칭되는 미디 음을 선택하여 상기 오디오 파일을 미디 파일로 변환하는 단계;를 포함하는 미디 파일 생성 방법.
The system receiving an audio file and analyzing the frequency for the audio file;
The system setting an upper threshold according to the level of the frequency to remove the harmonics;
Setting a window of a different size for each frequency region corresponding to each sound included in a frequency at which the system eliminates the harmonics;
Calculating a representative value for each window by applying a weight to each window of the different size, and calculating a starting point and an end point of the representative value; And
And converting the audio file into a MIDI file by selecting a MIDI sound matching the representative value based on the start point and the end point.
제 1 항에 있어서, 상기 주파수를 분석하는 단계는,
상기 오디오 파일에 포함된 각각의 음들에 대한 기본주파수 및 상기 음들의 중첩으로 발생되는 배음에 대한 고조파를 분석하는 미디 파일 생성 방법.
The method of claim 1, wherein analyzing the frequency comprises:
And analyzing harmonics of harmonics generated by overlapping the fundamental frequencies and the sounds of the respective notes included in the audio file.
제 1 항에 있어서, 상기 고조파를 제거하는 단계는,
상기 레벨을 만족하는 주파수와 동일한 시점에 더 큰 주파수가 존재하면 고조파로 판단하여 제거하는 미디 파일 생성 방법.
2. The method of claim 1, wherein removing the harmonic comprises:
And if a larger frequency exists at the same time as the frequency satisfying the level, it is determined to be a harmonic and removed.
제 1 항에 있어서, 상기 고조파를 제거하는 단계는,
상기 주파수를 하나의 음에 해당하는 복수개의 영역으로 분류하고, 각 영역마다 2개의 주파수가 감지되면 그 중 큰 주파수를 고조파로 판단하여 제거하는 미디 파일 생성 방법.
2. The method of claim 1, wherein removing the harmonic comprises:
The method comprising the steps of: classifying the frequency into a plurality of regions corresponding to one sound, and when two frequencies are detected for each region, determining a higher frequency as a harmonic and removing the higher frequency;
제 1 항에 있어서, 상기 윈도우를 설정하는 단계는,
상기 각각의 음에 대응되는 주파수 영역마다 서로 다른 임계값을 적용하여 상기 서로 다른 크기의 윈도우를 설정하는 미디 파일 생성 방법.
2. The method of claim 1, wherein the setting of the window comprises:
And setting different windows of different sizes by applying different threshold values to respective frequency regions corresponding to the respective tones.
제 1 항에 있어서, 상기 윈도우를 설정하는 단계는,
하나의 음에 대응되는 주파수 영역에 임계값을 적용하고, 상기 임계값을 기준으로 주파수의 기울기가 0에서 양수로 변하는 순간 및 음수에서 0으로 변하는 순간을 상기 주파수 영역에 대한 윈도우의 시작점 및 종료점으로 설정하는 미디 파일 생성 방법.
2. The method of claim 1, wherein the setting of the window comprises:
A threshold value is applied to a frequency region corresponding to one note, and a moment when the slope of the frequency changes from 0 to a positive value on the basis of the threshold value and a moment that changes from a negative value to 0 is defined as a start point and an end point of the window for the frequency region How to create a MIDI file to set.
제 1 항에 있어서,
상기 대푯값은 하나의 윈도우에 포함된 음에 대한 음정 및 박자를 계산하기 위하여 상기 윈도우의 가장 높은 레벨에 해당하는 주파수를 상기 대푯값으로 계산하는 미디 파일 생성 방법.
The method according to claim 1,
Wherein the representative value is calculated as the representative value of the frequency corresponding to the highest level of the window in order to calculate a pitch and a beat for a note included in one window.
제 1 항에 있어서, 상기 시작시점 및 종료시점을 계산하는 단계는,
상기 시작시점에서 상기 종료시점까지를 상기 대푯값에 대응되는 미디음을 발현하는 시간 및 상기 미디음을 지속하는 시간으로 계산하는 미디 파일 생성 방법.
2. The method of claim 1, wherein the calculating the start time and end time comprises:
And calculating the time from the start point to the end point as a time for expressing the MIDI sound corresponding to the representative value and a duration for continuing the MIDI sound.
제 1 항에 있어서, 상기 미디 파일로 변환하는 단계는,
미리 저장된 미디테이블을 이용하여 상기 대푯값에 매칭되는 미디음을 매핑하여 파일로 변환하는 미디 파일 생성 방법.
2. The method of claim 1,
A method for generating a MIDI file by mapping a MIDI note matched to the representative value using a pre-stored MIDI table and converting the MIDI note to a file.
시스템이 오디오 파일을 입력받고 상기 오디오 파일에 대한 주파수를 분석하는 단계;
상기 시스템이 상기 주파수의 레벨에 따라 상한임계값을 설정하여 고조파를 제거하는 단계;
상기 시스템이 상기 고조파를 제거한 주파수에 포함된 각각의 음에 대응되는 주파수 영역마다 서로 다른 크기의 윈도우를 설정하는 단계;
상기 서로 다른 크기의 윈도우 각각에 대한 가중치를 적용하여 각 윈도우마다 대푯값을 구하고 상기 대푯값에 대한 시작시점 및 종료시점을 계산하는 단계; 및
상기 시작시점 및 상기 종료시점을 토대로 상기 대푯값에 매칭되는 음정 및 박자를 계산하여 상기 고조파를 제거한 오디오 파일을 서로 다른 포맷의 음원 파일로 변환하는 단계;를 포함하는 오디오 파일 변환 방법.
The system receiving an audio file and analyzing the frequency for the audio file;
The system setting an upper threshold according to the level of the frequency to remove the harmonics;
Setting a window of a different size for each frequency region corresponding to each sound included in a frequency at which the system eliminates the harmonics;
Calculating a representative value for each window by applying a weight to each window of the different size, and calculating a starting point and an end point of the representative value; And
Calculating a pitch and a beat matched to the representative value based on the start point and the end point, and converting the harmonics-free audio file into sound source files in different formats.
KR1020180004947A 2018-01-15 2018-01-15 Method the create midi file with harmonics removed and method to converse audio file KR20190086872A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020180004947A KR20190086872A (en) 2018-01-15 2018-01-15 Method the create midi file with harmonics removed and method to converse audio file

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020180004947A KR20190086872A (en) 2018-01-15 2018-01-15 Method the create midi file with harmonics removed and method to converse audio file

Publications (1)

Publication Number Publication Date
KR20190086872A true KR20190086872A (en) 2019-07-24

Family

ID=67481023

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020180004947A KR20190086872A (en) 2018-01-15 2018-01-15 Method the create midi file with harmonics removed and method to converse audio file

Country Status (1)

Country Link
KR (1) KR20190086872A (en)

Similar Documents

Publication Publication Date Title
CN108320730B (en) Music classification method, beat point detection method, storage device and computer device
US8344234B2 (en) Tempo detecting device and tempo detecting program
JP2007199306A (en) Beat extracting device and method
JP7105880B2 (en) Beat sound generation timing generator
JP2015079151A (en) Music discrimination device, discrimination method of music discrimination device, and program
Marolt On finding melodic lines in audio recordings
KR20190086872A (en) Method the create midi file with harmonics removed and method to converse audio file
Faghih et al. An investigation into several pitch detection algorithms for singing phrases analysis
JP6263382B2 (en) Audio signal processing apparatus, audio signal processing apparatus control method, and program
JP6263383B2 (en) Audio signal processing apparatus, audio signal processing apparatus control method, and program
JP2015200685A (en) Attack position detection program and attack position detection device
JP6018141B2 (en) Audio signal processing apparatus, audio signal processing method, and audio signal processing program
Coyle et al. Onset detection using comb filters
Tang et al. Melody Extraction from Polyphonic Audio of Western Opera: A Method based on Detection of the Singer's Formant.
Alcabasa et al. Automatic guitar music transcription
US20230186876A1 (en) Beat sound generation timing generating device, beat sound generation timing generating method, and non-transitory computer readable medium storing program
JP2015040970A (en) Measure interval estimation, and device, method and program for performing feature value extraction for the estimation
Deif et al. A local discontinuity based approach for monaural singing voice separation from accompanying music with multi-stage non-negative matrix factorization
Presti et al. TRAP: TRAnsient Presence detection exploiting continuous brightness estimation (CoBE)
JP2012118417A (en) Feature waveform extraction system and feature waveform extraction method
JP4360527B2 (en) Pitch detection method
Glover et al. Real-time segmentation of the temporal evolution of musical sounds
JP2011164497A (en) Tempo value detecting device and tempo value detection method
JP5272141B2 (en) Voice processing apparatus and program
JP5495858B2 (en) Apparatus and method for estimating pitch of music audio signal

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E601 Decision to refuse application