KR102128315B1 - An apparatus for arranging MIDI music based on virtual instrument visualization, method thereof and computer recordable medium storing program to perform the method - Google Patents

An apparatus for arranging MIDI music based on virtual instrument visualization, method thereof and computer recordable medium storing program to perform the method Download PDF

Info

Publication number
KR102128315B1
KR102128315B1 KR1020180073014A KR20180073014A KR102128315B1 KR 102128315 B1 KR102128315 B1 KR 102128315B1 KR 1020180073014 A KR1020180073014 A KR 1020180073014A KR 20180073014 A KR20180073014 A KR 20180073014A KR 102128315 B1 KR102128315 B1 KR 102128315B1
Authority
KR
South Korea
Prior art keywords
gesture
image
midi music
virtual
track
Prior art date
Application number
KR1020180073014A
Other languages
Korean (ko)
Other versions
KR20200000763A (en
Inventor
양일호
유하진
허희수
윤성현
Original Assignee
서울시립대학교 산학협력단
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 서울시립대학교 산학협력단 filed Critical 서울시립대학교 산학협력단
Priority to KR1020180073014A priority Critical patent/KR102128315B1/en
Publication of KR20200000763A publication Critical patent/KR20200000763A/en
Application granted granted Critical
Publication of KR102128315B1 publication Critical patent/KR102128315B1/en

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10HELECTROPHONIC MUSICAL INSTRUMENTS; INSTRUMENTS IN WHICH THE TONES ARE GENERATED BY ELECTROMECHANICAL MEANS OR ELECTRONIC GENERATORS, OR IN WHICH THE TONES ARE SYNTHESISED FROM A DATA STORE
    • G10H1/00Details of electrophonic musical instruments
    • G10H1/02Means for controlling the tone frequencies, e.g. attack or decay; Means for producing special musical effects, e.g. vibratos or glissandos
    • G06K9/00335
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V40/00Recognition of biometric, human-related or animal-related patterns in image or video data
    • G06V40/20Movements or behaviour, e.g. gesture recognition
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10HELECTROPHONIC MUSICAL INSTRUMENTS; INSTRUMENTS IN WHICH THE TONES ARE GENERATED BY ELECTROMECHANICAL MEANS OR ELECTRONIC GENERATORS, OR IN WHICH THE TONES ARE SYNTHESISED FROM A DATA STORE
    • G10H2220/00Input/output interfacing specifically adapted for electrophonic musical tools or instruments
    • G10H2220/155User input interfaces for electrophonic musical instruments
    • G10H2220/201User input interfaces for electrophonic musical instruments for movement interpretation, i.e. capturing and recognizing a gesture or a specific kind of movement, e.g. to control a musical instrument
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10HELECTROPHONIC MUSICAL INSTRUMENTS; INSTRUMENTS IN WHICH THE TONES ARE GENERATED BY ELECTROMECHANICAL MEANS OR ELECTRONIC GENERATORS, OR IN WHICH THE TONES ARE SYNTHESISED FROM A DATA STORE
    • G10H2220/00Input/output interfacing specifically adapted for electrophonic musical tools or instruments
    • G10H2220/155User input interfaces for electrophonic musical instruments
    • G10H2220/321Garment sensors, i.e. musical control means with trigger surfaces or joint angle sensors, worn as a garment by the player, e.g. bracelet, intelligent clothing

Abstract

본 발명은 가상 악기 시각화 기반 미디 음악 편곡 장치, 이를 위한 방법 및 이 방법을 수행하는 프로그램이 기록된 컴퓨터 판독 가능한 기록매체에 관한 것이다. 이러한 본 발명은 카메라장치를 통해 사용자의 제스처를 촬영한 제스처 영상을 수신하는 통신부와, 미디 음악의 복수의 트랙에 대응하는 악기 이미지를 시각화한 가상 영상을 영사하는 영사부와, 상기 제스처 영상의 3차원 좌표를 상기 가상 영상의 3차원 좌표로 변환한 후, 변환된 3차원 좌표에 따라 사용자의 제스처를 인식하는 제스처인식부와, 상기 미디 음악을 재생하는 중 상기 인식된 사용자의 제스처에 따라 상기 미디 음악의 복수의 트랙을 편곡하는 가상편곡부를 포함하는 것을 특징으로 하는 미디 음악을 편곡하기 위한 장치와, 이를 위한 방법 및 이 방법을 수행하는 프로그램이 기록된 컴퓨터 판독 가능한 기록매체를 제공한다. The present invention relates to a virtual music visualization-based MIDI music arrangement device, a method therefor, and a computer-readable recording medium in which a program for performing the method is recorded. The present invention is a communication unit for receiving a gesture image of a user's gesture through a camera device, a projection unit for projecting a virtual image visualizing a musical instrument image corresponding to a plurality of tracks of MIDI music, and a three-dimensional image of the gesture image. After converting the coordinates into 3D coordinates of the virtual image, a gesture recognition unit that recognizes a user's gesture according to the converted 3D coordinates, and the MIDI music according to the recognized user's gesture while playing the MIDI music An apparatus for arranging MIDI music, comprising a virtual arranging section for arranging a plurality of tracks, and a computer-readable recording medium in which a method therefor and a program for performing the method are recorded.

Description

가상 악기 시각화 기반 미디 음악 편곡 장치, 이를 위한 방법 및 이 방법을 수행하는 프로그램이 기록된 컴퓨터 판독 가능한 기록매체{An apparatus for arranging MIDI music based on virtual instrument visualization, method thereof and computer recordable medium storing program to perform the method} An apparatus for arranging MIDI music based on virtual instrument visualization, method thereof and computer recordable medium storing program to perform the method}

본 발명은 미디 음악 편곡 기술에 관한 것으로, 보다 상세하게는, 가상 악기를 시각화하여 시각화된 가상 악기에 대한 제스처 인식을 통해 미디 음악을 편곡하는 장치, 이를 위한 방법 및 이 방법을 수행하는 프로그램이 기록된 컴퓨터 판독 가능한 기록매체에 관한 것이다. The present invention relates to a MIDI music arrangement technology, and more specifically, a device for arranging MIDI music through gesture recognition for a visualized virtual instrument by visualizing a virtual instrument, a method therefor, and a program for performing the method are recorded Computer readable recording media.

기존의 미디 음악 편집기는 기본적으로 키보드와 마우스를 활용하는 GUI(Graphic User Interface)를 제공한다. 하지만 미디 음악 작곡가 혹은 편곡가와 같은 사용자가 개별 노트(note, 음표로 나타내는 하나의 음)의 볼륨을 세세히 변경하는 과정은 직관적이지 않다. 사용자는 편집기 GUI 상에서 각각의 음에 대한 볼륨을 조절하고, 편집된 곡을 재차 재생하여 청취하는 과정을 반복한다. 이러한 과정에는 많은 작업 시간이 소요된다. The existing MIDI music editor basically provides a GUI (Graphic User Interface) using a keyboard and mouse. However, it is not intuitive for a user such as a MIDI music composer or arranger to change the volume of individual notes (note, one note). The user adjusts the volume for each note on the editor GUI and repeats the process of listening to the edited song again. This process is time consuming.

(특허 1) 한국공개특허 제2008-0074977호 2008년 08월 13일 공개 (명칭: 음악 편집 장치 및 음악 편집 방법)(Patent 1) Korean Patent Publication No. 2008-0074977 published on August 13, 2008 (name: music editing device and music editing method)

본 발명의 목적은 사용자가 미디 음악을 편곡하고자 할 때, 작업 시간을 줄이고 직관적으로 편곡할 수 있도록 곡이 재생되는 동안 오케스트라 지휘와 같은 사용자의 제스처를 인식하여, 실시간으로 음악을 편곡할 수 있는 인터페이스를 제공함에 있다. An object of the present invention is to recognize a user's gesture such as conducting an orchestra while a song is being played so that when the user wants to arrange MIDI music, the work time is reduced and intuitively arranged, an interface that can arrange music in real time In providing.

또한, 본 발명의 다른 목적은 가상 악기 시각화를 통해 복수의 트랙의 일부 또는 전부를 동시에 편곡할 수 있는 인터페이스를 제공함에 있다. In addition, another object of the present invention is to provide an interface capable of simultaneously arranging some or all of a plurality of tracks through visualization of a virtual instrument.

상술한 바와 같은 목적을 달성하기 위한 본 발명의 바람직한 실시예에 따른 미디 음악을 편곡하기 위한 장치는 카메라장치를 통해 사용자의 제스처를 촬영한 제스처 영상을 수신하는 통신부와, 미디 음악의 복수의 트랙에 대응하는 악기 이미지를 시각화한 가상 영상을 영사하는 영사부와, 상기 제스처 영상의 3차원 좌표를 상기 가상 영상의 3차원 좌표로 변환한 후, 변환된 3차원 좌표에 따라 사용자의 제스처를 인식하는 제스처인식부와, 상기 미디 음악을 재생하는 중 상기 인식된 사용자의 제스처에 따라 상기 미디 음악의 복수의 트랙을 편곡하는 가상편곡부를 포함한다. Apparatus for arranging MIDI music according to a preferred embodiment of the present invention for achieving the above object is a communication unit for receiving a gesture image of a user's gesture through the camera device, and a plurality of tracks of the MIDI music Gesture recognition for projecting a virtual image visualizing a corresponding instrument image, and converting the three-dimensional coordinates of the gesture image into three-dimensional coordinates of the virtual image, and then recognizing the user's gesture according to the converted three-dimensional coordinates And a virtual arranging unit for arranging a plurality of tracks of the MIDI music according to the recognized user's gesture while playing the MIDI music.

상기 가상 영상은 가상의 무대와, 상기 가상의 무대에 배치되며, 상기 미디 음악의 복수의 트랙 각각에 대응하는 복수의 트랙 이미지와, 상기 미디 음악의 복수의 트랙 전체에 대응하는 전체 트랙 이미지와, 상기 가상의 무대의 테두리에 배치되는 버튼 이미지를 포함하며, 상기 트랙 이미지는 상기 트랙을 연주하는 악기를 나타내는 악기 이미지, 상기 트랙을 재생하는 볼륨의 크기를 나타내는 볼륨 이미지 및 상기 트랙이 선택되었는지 여부를 나타내는 선택 이미지를 포함한다. The virtual image is a virtual stage, a plurality of track images corresponding to each of the plurality of tracks of the MIDI music, and an entire track image corresponding to all of the plurality of tracks of the MIDI music, It includes a button image disposed on the border of the virtual stage, the track image is an instrument image representing the instrument playing the track, a volume image representing the size of the volume playing the track and whether the track is selected Contains optional images to represent.

상기 제스처인식부가 상기 복수의 트랙 이미지 및 상기 전체 트랙 이미지 중 적어도 하나의 트랙을 선택하거나, 선택 해제하는 상기 사용자의 제스처를 인식하면, 상기 가상편곡부는 상기 인식된 사용자의 제스처에 따라 적어도 하나의 트랙을 선택하거나, 선택 해제하는 것을 특징으로 한다. When the gesture recognition unit recognizes the user's gesture of selecting or deselecting at least one track of the plurality of track images and the entire track image, the virtual arrangement unit tracks at least one track according to the recognized user's gesture. It is characterized by selecting or deselecting.

상기 제스처인식부가 지휘 제스처의 궤적의 방향이 변경되는 변곡점인 비트포인트의 수를 인식하면, 상기 가상편곡장치는 상기 비트포인트의 수에 따라 상기 재생 중인 미디 음악의 박자를 변경하는 것을 특징으로 한다. When the gesture recognition unit recognizes the number of bit points that are inflection points in which the direction of the trajectory of the command gesture is changed, the virtual arrangement device changes the time signature of the playing MIDI music according to the number of bit points.

상기 제스처인식부가 한 번의 지휘 제스처가 완성되는 데에 소요되는 시간을 통해 지휘 제스처의 속도를 산출하면, 상기 가상편곡장치는 상기 산출된 속도에 따라 상기 재생 중인 미디 음악의 템포를 변경하여 재생하는 것을 특징으로 한다. When the gesture recognition unit calculates the speed of the commanding gesture through the time required to complete one commanding gesture, the virtual arrangement device changes the tempo of the playing MIDI music according to the calculated speed and plays it. It is characterized by.

상기 제스처인식부가 한 번의 지휘 제스처를 이루는 궤적의 총 길이를 N, 상기 궤적 상의 지점을 x, 지점 x에서의 제스처 속도를 s(x)라 할 때, 지휘 제스처의 궤적 중 비트포인트에서의 속도와 비트포인트 이외의 구간의 속도의 차이 D를 수학식

Figure 112018062316348-pat00001
을 통해 산출하면, 상기 가상편곡부는 산출된 속도의 차이에 따라 상기 재생 중인 미디 음악의 연주법을 변경하여 재생하는 것을 특징으로 한다. When the total length of the trajectory that the gesture recognition unit forms one command gesture is N, the point on the trajectory is x, and the gesture speed at point x is s(x), the speed at the bit point of the trajectory of the command gesture is The difference in speed D of the section other than the bit point
Figure 112018062316348-pat00001
When calculated through, the virtual arrangement unit is characterized in that it plays by changing the playing method of the MIDI music being played according to the difference in the calculated speed.

상기 제스처인식부가 한 번의 지휘 제스처에서 인식되는 복수의 비트포인트 중 2 이상의 비트포인트 간의 거리를 통해 지휘 제스처의 크기를 산출하면, 상기 가상편곡부는 산출된 크기에 따라 상기 재생 중인 미디 음악의 볼륨을 변경하여 재생하는 것을 특징으로 한다. When the gesture recognition unit calculates the size of the commanding gesture through the distance between two or more bitpoints among the plurality of bitpoints recognized in one commanding gesture, the virtual arrangement unit changes the volume of the MIDI music being played according to the calculated size. It is characterized by playing.

본 발명의 실시예에 따른 미디 음악을 편곡하기 위한 장치는 복수의 악기 이미지를 저장하는 저장부를 더 포함하며, 상기 가상편곡부는 상기 미디 음악에서 복수의 트랙 각각에 대한 악기 정보를 추출하고, 상기 저장부에 복수의 악기 이미지 중 상기 미디 음악의 각 트랙의 악기 정보에 대응하는 악기 이미지가 존재하는지 여부를 판단하고, 상기 트랙의 악기 정보에 대응하는 악기 이미지가 존재하면, 상기 대응하는 악기 이미지를 선택하고, 상기 트랙의 악기 정보에 대응하는 악기 이미지가 존재하지 않으면, 해당 트랙을 재생하여 재생된 오디오 신호와 상기 저장부에 저장된 복수의 악기 이미지에 대응하는 가상 악기의 오디오 신호를 비교하여 오디오 신호의 유사도가 가장 높은 가상 악기의 악기 이미지를 선택하고, 선택된 악기 이미지를 이용하여 복수의 트랙을 시각화하여 상기 가상 영상을 생성하는 것을 특징으로 한다. The apparatus for arranging MIDI music according to an embodiment of the present invention further includes a storage unit for storing a plurality of musical instrument images, and the virtual arrangement unit extracts musical instrument information for each of a plurality of tracks from the MIDI music, and stores the storage information. It is determined whether there is a musical instrument image corresponding to musical instrument information of each track of the MIDI music among a plurality of musical instrument images, and if an musical instrument image corresponding to musical instrument information of the track exists, selects the corresponding musical instrument image If the instrument image corresponding to the instrument information of the track does not exist, the audio signal reproduced by playing the corresponding track and the audio signal of the virtual instrument corresponding to the plurality of instrument images stored in the storage unit are compared to obtain an audio signal. It is characterized in that the instrument image of the virtual instrument having the highest similarity is selected, and the plurality of tracks are visualized using the selected instrument image to generate the virtual image.

상술한 바와 같은 목적을 달성하기 위한 본 발명의 바람직한 실시예에 따른 미디 음악을 편곡하기 위한 방법은 미디 음악의 복수의 트랙에 대응하는 악기 이미지를 시각화한 가상 영상을 생성하고, 생성된 가상 영상을 영사하는 단계와, 상기 미디 음악을 재생하는 단계와, 카메라장치를 통해 사용자의 제스처를 촬영한 제스처 영상을 수신하는 단계와, 상기 제스처 영상의 3차원 좌표를 상기 가상 영상의 3차원 좌표로 변환한 후, 변환된 3차원 좌표에 따라 사용자의 제스처를 인식하고, 상기 인식된 사용자의 제스처에 따라 상기 미디 음악을 편곡하는 단계를 포함한다. The method for arranging MIDI music according to a preferred embodiment of the present invention for achieving the above object generates a virtual image visualizing an instrument image corresponding to a plurality of tracks of MIDI music, and generates the generated virtual image. Projecting, playing the MIDI music, receiving a gesture image of a user's gesture through a camera device, and converting the three-dimensional coordinates of the gesture image into three-dimensional coordinates of the virtual image Thereafter, the user's gesture is recognized according to the converted 3D coordinates, and the MIDI music is arranged according to the recognized user's gesture.

상기 미디 음악을 편곡하는 단계는 지휘 제스처의 궤적의 방향이 변경되는 변곡점인 비트포인트의 수를 인식하면, 상기 비트포인트의 수에 따라 상기 재생 중인 미디 음악의 박자를 변경하는 것을 특징으로 한다. The step of arranging the MIDI music is characterized by changing the beat of the playing MIDI music according to the number of the bitpoints when the number of bitpoints, which are inflection points in which the direction of the trajectory of the command gesture is changed, is changed.

상기 미디 음악을 편곡하는 단계는 한 번의 지휘 제스처가 완성되는 데에 소요되는 시간을 통해 지휘 제스처의 속도를 산출하면, 상기 산출된 속도에 따라 상기 재생 중인 미디 음악의 템포를 변경하여 재생하는 것을 특징으로 한다. The step of arranging the MIDI music is characterized in that when the speed of the command gesture is calculated through the time required for one command gesture to be completed, the tempo of the playing MIDI music is changed and played according to the calculated speed. Should be

상기 미디 음악을 편곡하는 단계는 한 번의 지휘 제스처를 이루는 궤적의 총 길이를 N, 상기 궤적 상의 지점을 x, 지점 x에서의 제스처 속도를 s(x)라 할 때, 지휘 제스처의 궤적 중 비트포인트에서의 속도와 비트포인트 이외의 구간의 속도의 차이 D를 수학식

Figure 112018062316348-pat00002
을 통해 산출하면, 산출된 속도의 차이에 따라 상기 재생 중인 미디 음악의 연주법을 변경하여 재생하는 것을 특징으로 한다. In the arranging the MIDI music, when the total length of the trajectory forming one command gesture is N, the point on the trajectory is x, and the speed of the gesture at point x is s(x), the bit point in the trajectory of the command gesture D is the difference between the velocity at and the velocity of the section other than the bit point.
Figure 112018062316348-pat00002
When calculated through, it is characterized in that the playing method of the MIDI music being played is changed and played according to the difference in the calculated speed.

상기 미디 음악을 편곡하는 단계는 한 번의 지휘 제스처에서 인식되는 복수의 비트포인트 중 2 이상의 비트포인트 간의 거리를 통해 지휘 제스처의 크기를 산출하면, 산출된 크기에 따라 상기 재생 중인 미디 음악의 볼륨을 변경하여 재생하는 것을 특징으로 한다. In the arranging of the MIDI music, if the size of the command gesture is calculated through a distance between two or more bit points among a plurality of bit points recognized in one command gesture, the volume of the MIDI music being played is changed according to the calculated size. It is characterized by playing.

상기 가상 영상을 영사하는 단계는 상기 미디 음악에서 복수의 트랙 각각에 대한 악기 정보를 추출하는 단계와, 기 저장된 복수의 악기 이미지 중 상기 미디 음악의 각 트랙의 악기 정보에 대응하는 악기 이미지가 존재하는지 여부를 판단하는 단계와, 상기 판단 결과, 상기 트랙의 악기 정보에 대응하는 악기 이미지가 존재하면, 상기 대응하는 악기 이미지를 선택하고, 상기 판단 결과, 상기 트랙의 악기 정보에 대응하는 악기 이미지가 존재하지 않으면, 해당 트랙을 재생하여 재생된 오디오 신호와 상기 저장부에 저장된 복수의 악기 이미지에 대응하는 가상 악기의 오디오 신호를 비교하여 오디오 신호의 유사도가 가장 높은 가상 악기의 악기 이미지를 선택하는 단계와, 상기 선택된 악기 이미지를 이용하여 복수의 트랙을 시각화하여 상기 가상 영상을 생성하는 단계를 포함한다. The step of projecting the virtual image includes extracting instrument information for each of a plurality of tracks from the MIDI music, and whether there is an instrument image corresponding to the instrument information of each track of the MIDI music among a plurality of previously stored instrument images. Determining whether there is an instrument image corresponding to the instrument information of the track, and selecting the corresponding instrument image, and as a result of the determination, an instrument image corresponding to the instrument information of the track exists If not, comparing the audio signal reproduced by playing the corresponding track and the audio signal of the virtual instrument corresponding to the plurality of instrument images stored in the storage unit, and selecting the instrument image of the virtual instrument having the highest similarity of the audio signal; And generating the virtual image by visualizing a plurality of tracks using the selected instrument image.

상술한 바와 같은 목적을 달성하기 위한 본 발명의 바람직한 실시예에 따른 미디 음악을 편곡하기 위한 방법을 수행하는 프로그램이 기록된 컴퓨터 판독 가능한 기록매체는 미디 음악의 복수의 트랙에 대응하는 악기 이미지를 시각화한 가상 영상을 생성하고, 생성된 가상 영상을 영사하는 단계와, 상기 미디 음악을 재생하는 단계와, 카메라장치를 통해 사용자의 제스처를 촬영한 제스처 영상을 수신하는 단계와, 상기 제스처 영상의 3차원 좌표를 상기 가상 영상의 3차원 좌표로 변환한 후, 변환된 3차원 좌표에 따라 사용자의 제스처를 인식하고, 상기 인식된 사용자의 제스처에 따라 상기 미디 음악을 편곡하는 단계를 포함하는 미디 음악을 편곡하기 위한 방법을 수행하는 프로그램이 기록된다. A computer-readable recording medium in which a program for performing a method for arranging MIDI music according to a preferred embodiment of the present invention for achieving the above-described object visualizes an instrument image corresponding to a plurality of tracks of MIDI music Generating a virtual image, projecting the generated virtual image, playing the MIDI music, receiving a gesture image of a user's gesture through a camera device, and three-dimensional of the gesture image After converting the coordinates to the three-dimensional coordinates of the virtual image, and recognizing the user's gesture according to the converted three-dimensional coordinates, and arranging the MIDI music comprising the arrangement of the MIDI music according to the recognized gesture of the user A program that performs a method for doing so is recorded.

본 발명에 따르면, 미디 음악이 재생되는 동안 오케스트라 지휘자와 같은 사용자의 제스처를 인식하여, 곡을 편집할 수 있어 사용자는 실시간으로 그리고 직관적으로 미디 음악을 편곡할 수 있다. 더욱이, 본 발명은 복수의 가상 악기를 가상으로 제공하여 사용자가 동시에 멀티 트랙을 편곡할 수 있도록 한다. According to the present invention, while the MIDI music is being played, a gesture of the user, such as an orchestra conductor, can be recognized, and the song can be edited, so that the user can arrange the MIDI music in real time and intuitively. Moreover, the present invention provides a plurality of virtual instruments virtually so that a user can arrange multi-tracks simultaneously.

도 1은 본 발명의 실시예에 따른 가상 악기 시각화 기반 미디 음악 편곡 시스템을 설명하기 위한 도면이다.
도 2는 본 발명의 실시예에 따른 가상 악기 시각화 기반 미디 음악 편곡 시스템의 구성을 설명하기 위한 블록도이다.
도 3은 본 발명의 실시예에 따른 미디 음악을 구성하는 복수의 트랙의 가상 악기 시각화 방법을 설명하기 위한 흐름도이다.
도 4는 본 발명의 실시예에 따른 미디 음악을 구성하는 복수의 트랙의 가상 악기 시각화 방법을 설명하기 위한 화면 예이다.
도 5는 본 발명의 실시예에 따른 가상 악기 시각화 기반 미디 음악 편곡 방법을 설명하기 위한 흐름도이다.
도 6 내지 도 9는 트랙 선택 혹은 선택 해제 제스처에 따라 트랙을 선택 혹은 선택 해제하는 방법을 설명하기 위한 화면 예이다.
도 10 내지 도 18은 본 지휘 제스처에 따라 선택된 트랙을 편곡하는 방법을 설명하기 위한 화면 예이다.
도 19 및 도 20은 버튼 선택 제스처에 따라 버튼에 할당된 기능을 수행하는 방법을 설명하기 위한 화면 예이다.
1 is a view for explaining a virtual music visualization based MIDI music arrangement system according to an embodiment of the present invention.
2 is a block diagram illustrating a configuration of a MIDI music arrangement system based on virtual instrument visualization according to an embodiment of the present invention.
3 is a flowchart illustrating a method of visualizing a virtual instrument of a plurality of tracks constituting MIDI music according to an embodiment of the present invention.
4 is a screen example for explaining a virtual instrument visualization method of a plurality of tracks constituting MIDI music according to an embodiment of the present invention.
5 is a flowchart illustrating a method for arranging MIDI music based on virtual instrument visualization according to an embodiment of the present invention.
6 to 9 are screen examples for explaining a method of selecting or deselecting a track according to a track selection or deselection gesture.
10 to 18 are screen examples for explaining a method of arranging a selected track according to the present command gesture.
19 and 20 are screen examples for explaining a method of performing a function assigned to a button according to a button selection gesture.

본 발명의 상세한 설명에 앞서, 이하에서 설명되는 본 명세서 및 청구범위에 사용된 용어나 단어는 통상적이거나 사전적인 의미로 한정해서 해석되어서는 아니 되며, 발명자는 그 자신의 발명을 가장 최선의 방법으로 설명하기 위해 용어의 개념으로 적절하게 정의할 수 있다는 원칙에 입각하여 본 발명의 기술적 사상에 부합하는 의미와 개념으로 해석되어야만 한다. 따라서 본 명세서에 기재된 실시예와 도면에 도시된 구성은 본 발명의 가장 바람직한 실시예에 불과할 뿐, 본 발명의 기술적 사상을 모두 대변하는 것은 아니므로, 본 출원시점에 있어서 이들을 대체할 수 있는 다양한 균등물과 변형 예들이 있을 수 있음을 이해하여야 한다. Prior to the detailed description of the present invention, terms or words used in the present specification and claims described below should not be interpreted as being limited to a conventional or lexical meaning, and the inventor may use his own invention in the best way. In order to explain, it should be interpreted as meanings and concepts consistent with the technical spirit of the present invention based on the principle that it can be properly defined as a concept of terms. Therefore, the embodiments shown in the embodiments and the drawings described in this specification are only the most preferred embodiments of the present invention, and do not represent all of the technical spirit of the present invention, and various equivalents can be substituted at the time of application. It should be understood that there may be water and variations.

이하, 첨부된 도면을 참조하여 본 발명의 바람직한 실시예들을 상세히 설명한다. 이때, 첨부된 도면에서 동일한 구성 요소는 가능한 동일한 부호로 나타내고 있음을 유의해야 한다. 또한, 본 발명의 요지를 흐리게 할 수 있는 공지 기능 및 구성에 대한 상세한 설명은 생략할 것이다. 마찬가지의 이유로 첨부 도면에 있어서 일부 구성요소는 과장되거나 생략되거나 또는 개략적으로 도시되었으며, 각 구성요소의 크기는 실제 크기를 전적으로 반영하는 것이 아니다. Hereinafter, preferred embodiments of the present invention will be described in detail with reference to the accompanying drawings. At this time, it should be noted that the same components are denoted by the same reference numerals in the accompanying drawings. In addition, detailed descriptions of well-known functions and configurations that may obscure the subject matter of the present invention will be omitted. For the same reason, in the accompanying drawings, some components are exaggerated, omitted, or schematically illustrated, and the size of each component does not entirely reflect the actual size.

먼저, 본 발명의 실시예에 따른 가상 악기 시각화 기반 미디 음악 편곡 시스템에 대해서 설며하기로 한다. 도 1은 본 발명의 실시예에 따른 가상 악기 시각화 기반 미디 음악 편곡 시스템을 설명하기 위한 도면이다. 도 2는 본 발명의 실시예에 따른 가상 악기 시각화 기반 미디 음악 편곡 시스템의 구성을 설명하기 위한 블록도이다. First, a description will be given of a MIDI music arrangement system based on virtual instrument visualization according to an embodiment of the present invention. 1 is a view for explaining a virtual music visualization based MIDI music arrangement system according to an embodiment of the present invention. 2 is a block diagram illustrating a configuration of a MIDI music arrangement system based on virtual instrument visualization according to an embodiment of the present invention.

도 1을 참조하면, 미디음악편곡시스템(10)은 가상편곡장치(100) 및 카메라장치(200)를 포함한다. 가상편곡장치(100)는 HMD(Head Mounted Display)를 기반으로 형성되며, 카메라장치(200)는 카메라를 기반으로 통신 기능을 부가하여 형성된다. 카메라장치(200)는 사용자의 제스처를 촬영하고, 촬영된 사용자의 제스처 영상을 가상편곡장치(100)에 제공한다. 가상편곡장치(100)는 미디 음악을 재생하는 중 카메라장치(200)로부터 제공 받은 사용자의 제스처 영상을 통해 사용자의 제스처를 인식하고, 인식된 제스처에 따라 미디 음악을 편곡할 수 있다. Referring to FIG. 1, the MIDI music arrangement system 10 includes a virtual arrangement device 100 and a camera device 200. The virtual arrangement device 100 is formed based on a head mounted display (HMD), and the camera device 200 is formed by adding a communication function based on a camera. The camera device 200 photographs the user's gesture and provides the captured user's gesture image to the virtual arrangement device 100. The virtual arrangement device 100 may recognize the user's gesture through the user's gesture image provided from the camera device 200 while playing the MIDI music, and arrange the MIDI music according to the recognized gesture.

그러면, 가상편곡장치(100)에 대해서 보다 상세하게 설명하기로 한다. 가상편곡장치(100)는 도 2에 도시된 바와 같이, 영사부(110), 오디오부(120), 센서부(130), 통신부(140), 저장부(150) 및 제어부(160)를 포함한다. Then, the virtual arrangement device 100 will be described in more detail. 2, the virtual arrangement device 100 includes a projection unit 110, an audio unit 120, a sensor unit 130, a communication unit 140, a storage unit 150, and a control unit 160, as shown in FIG. .

영사부(110)는 사용자에게 미디 음악을 편곡하기 위한 가상공간을 구성하는 가상 영상을 영사하기 위한 것이다. 이러한 가상 영상은 다양한 악기가 연주되는 가상의 음악 연주 공간을 제공할 수 있다. 영사부(110)는 도시되지는 않았지만, 프로젝터와 광학계를 포함한다. 프로젝터는 제어부(160)로부터 출력되는 화상을 마이크로 디스플레이 패널을 통해 발산한다. 그러면, 광학계는 반사경, 프리즘 및 렌즈를 포함하며, 프로젝터로부터 발산된 영상을 반사경을 통해 반사시키거나, 프리즘을 통해 굴절시켜 렌즈를 통해 사용자의 눈(동공)에 영사한다. 이로써, 사용자의 눈앞에서 확대된 가상 영상이 보이도록 한다. 특히, 영사부(110)가 영사하는 가상 영상은 기 설정된 기준점을 기준으로 소정의 3차원 좌표를 가진다. 이러한 3차원 좌표에 따라 사용자의 제스처가 인식된다. 이러한 가상 영상의 3차원 좌표는 아래에서 더 상세하게 설명하기로 한다. The projection unit 110 is for projecting a virtual image constituting a virtual space for arranging MIDI music to a user. Such a virtual image may provide a virtual music playing space in which various musical instruments are played. The projection unit 110 is not shown, but includes a projector and an optical system. The projector radiates an image output from the control unit 160 through a micro display panel. Then, the optical system includes a reflector, a prism, and a lens, and reflects the image emitted from the projector through the reflector or refracts through the prism to project it to the user's eye (pupil) through the lens. Thus, the enlarged virtual image is visible in front of the user's eyes. In particular, the virtual image projected by the projection unit 110 has a predetermined 3D coordinate based on a preset reference point. The user's gesture is recognized according to the three-dimensional coordinates. The 3D coordinates of the virtual image will be described in more detail below.

오디오부(120)는 마이크(MIC) 및 스피커(SPK)를 포함한다. 오디오부(120)는 마이크(MIC)를 통해 사용자의 오디오 신호를 입력받고, 입력된 오디오 신호를 제어부(160)에 제공한다. 또한, 오디오부(120)는 제어부(160)로부터 제공되는 오디오 신호를 스피커(SPK)를 통해 출력한다. 이러한 오디오 신호는 미디 음악이 될 수 있다. The audio unit 120 includes a microphone (MIC) and a speaker (SPK). The audio unit 120 receives a user's audio signal through a microphone (MIC), and provides the input audio signal to the control unit 160. In addition, the audio unit 120 outputs an audio signal provided from the control unit 160 through a speaker SPK. This audio signal can be MIDI music.

센서부(130)는 가상편곡장치(100)의 움직임을 감지하기 위한 것이다. 가상편곡장치(100)는 사용자의 두부에 착용되기 때문에 센서부(130)를 통해 가상편곡장치(100)의 움직임을 감지하면, 사용자가 응시하는 방향을 알 수 있다. 센서부(130)는 가상편곡장치(100)의 움직임을 감지하여 감지된 움직임을 좌표를 통해 제어부(160)에 제공한다. 센서부(130)가 제어부(160)에 제공하는 좌표는 기 설정된 기준점으로부터 가상편곡장치(100)의 움직임에 따라 도출되는 3차원 직교좌표계의 x, y, z와, 요(yaw), 피치(pitch), 롤(roll)을 포함한다. 이러한 센서부(130)는 하나 이상의 센서를 통해 구현될 수 있으며, 이러한 센서는 가속도 센서(accelerometer), 자이로 센서(gyroscope), 지자기 센서(magnetometer) 등이 될 수 있다. The sensor unit 130 is for detecting the movement of the virtual arrangement device 100. Since the virtual arrangement device 100 is worn on the user's head, when the movement of the virtual arrangement device 100 is sensed through the sensor unit 130, the user's gaze direction can be known. The sensor unit 130 detects the motion of the virtual arrangement device 100 and provides the detected motion to the control unit 160 through coordinates. The coordinates provided by the sensor unit 130 to the control unit 160 include x, y, z, yaw, and pitch (of a 3D Cartesian coordinate system derived according to the movement of the virtual arrangement device 100 from a preset reference point) pitch), and rolls. The sensor unit 130 may be implemented through one or more sensors, which may be an accelerometer, a gyroscope, a magnetometer, or the like.

통신부(140)는 ISM 대역(Industrial Scientific Medical band)을 통해 카메라장치(200)와 직접 통신할 수 있다. 예컨대, 통신부(140)는 블루투스 모듈, 적외선 통신 모듈 등이 될 수 있다. 통신부(140)는 카메라장치(200)로부터 카메라장치(200)가 촬영한 사용자의 제스처 영상을 수신하면, 수신된 사용자의 제스처 영상을 제어부(160)에 제공한다. 통신부(140)는 송신되는 신호의 주파수를 상승 변환 및 증폭하는 RF(Radio Frequency) 송신기(Tx) 및 수신되는 신호를 저 잡음 증폭하고 주파수를 하강 변환하는 RF 수신기(Rx)를 포함할 수 있다. 그리고 통신부(140)는 송신되는 신호를 변조하고, 수신되는 신호를 복조하는 모뎀(Modem)을 포함할 수 있다. The communication unit 140 may directly communicate with the camera device 200 through an ISM band (Industrial Scientific Medical band). For example, the communication unit 140 may be a Bluetooth module, an infrared communication module, or the like. When the communication unit 140 receives a gesture image of a user photographed by the camera apparatus 200 from the camera apparatus 200, the communication unit 140 provides the received gesture image of the user to the controller 160. The communication unit 140 may include an RF (Radio Frequency) transmitter (Tx) for up-converting and amplifying the frequency of the transmitted signal, and an RF receiver (Rx) for amplifying the received signal with low noise and down-converting the frequency. In addition, the communication unit 140 may include a modem for modulating the transmitted signal and demodulating the received signal.

저장부(150)는 가상편곡장치(100)의 동작에 필요한 프로그램 및 데이터를 저장하는 역할을 수행하며, 프로그램 영역과 데이터 영역으로 구분될 수 있다. 프로그램 영역은 가상편곡장치(100)의 전반적인 동작을 제어하는 프로그램 및 가상편곡장치(100)를 부팅시키는 운영체제(OS, Operating System), 미디 음악을 편곡하기 위한 응용 프로그램 등을 저장할 수 있다. 데이터 영역은 가상편곡장치(100)의 사용에 따라 발생하는 사용자 데이터가 저장되는 영역이다. 즉, 데이터 영역은 미디 음악, 편곡된 미디 음악, 악기 이미지 등을 저장한다. 저장부(150)에 저장되는 각 종 데이터는 사용자의 조작에 따라, 삭제, 변경, 추가될 수 있다. 또한, 저장부(150)는 HDD(Hard Disk Drive), SDD(Solidestat Disk Drive), RAM(Read Access Memory), ROM(Read Only Memory), FLASH, EEPROM 등을 통해 구현될 수 있다. The storage unit 150 serves to store programs and data necessary for the operation of the virtual arrangement device 100, and may be divided into a program area and a data area. The program area may store a program for controlling the overall operation of the virtual arrangement device 100, an operating system (OS) for booting the virtual arrangement device 100, an application program for arranging MIDI music, and the like. The data area is an area in which user data generated according to the use of the virtual arrangement device 100 is stored. That is, the data area stores MIDI music, arranged MIDI music, musical instrument images, and the like. Various types of data stored in the storage unit 150 may be deleted, changed, or added according to user manipulation. In addition, the storage unit 150 may be implemented through a hard disk drive (HDD), a solidestat disk drive (SDD), read access memory (RAM), read only memory (ROM), FLASH, EEPROM, or the like.

제어부(160)는 가상편곡장치(100)의 전반적인 동작 및 가상편곡장치(100)의 내부 블록들 간 신호 흐름을 제어하고, 데이터를 처리하는 데이터 처리 기능을 수행할 수 있다. 이러한 제어부(160)는 저장부(150)에 저장된 어플리케이션을 로드(load)시켜 실행시키고, 필요한 경우, 임시 저장 공간으로 버퍼를 할당할 수 있다. 특히, 제어부(160)는 예컨대, 중앙 처리 장치(CPU: Central Processing Unit), 애플리케이션 프로세서(AP: Application Processor), 마이크로컨트롤러(micro-controller), 그래픽 처리 장치(GPU: Graphics Processing Unit), 디지털 신호 처리기(DSP: Digital Signal Processor) 등을 통해 구현될 수 있다. The controller 160 may control the overall operation of the virtual arrangement device 100 and the signal flow between the internal blocks of the virtual arrangement device 100, and may perform a data processing function for processing data. The control unit 160 loads and executes an application stored in the storage unit 150, and if necessary, allocates a buffer as a temporary storage space. In particular, the control unit 160 includes, for example, a central processing unit (CPU), an application processor (AP), a micro-controller, a graphics processing unit (GPU), and a digital signal. It may be implemented through a processor (DSP: Digital Signal Processor).

제어부(160)는 제스처인식부(161) 및 가상편곡부(163)를 포함한다. 제스처인식부(161)는 카메라장치(200)로부터 수신된 사용자의 제스처 영상으로부터 사용자의 제스처를 인식하기 위한 것이다. 제스처인식부(161)는 제스처를 인식한 후, 그 인식 결과를 가상편곡부(163)로 출력한다. 가상편곡부(163)는 사용자가 미디 음악을 편곡할 수 있는 가상공간을 구성하는 가상 영상을 생성할 수 있다. 가상편곡부(163)는 생성된 가상 영상을 영사부(110)에 제공한다. 또한, 가상편곡부(163)는 저장부(150)에 저장된 미디 음악을 제공받아, 이를 재생할 수 있다. 가상편곡부(163)는 재생되는 음악을 오디오부(120)에 제공하여 오디오부(120)의 스피커(SPK)를 통해 출력하도록 한다. 또한, 가상편곡부(163)는 제스처인식부(161)가 인식한 제스처에 따라 미디 음악을 편곡할 수 있다. 가상편곡부(163)는 편곡된 음악을 저장부(150)에 저장하거나, 오디오부(120)에 제공하여 오디오부(120)의 스피커(SPK)를 통해 출력하도록 할 수 있다. 이러한 제스처인식부(161) 및 가상편곡부(163)를 포함하는 제어부(160)의 구체적인 동작은 아래에서 더 상세하게 설명하기로 한다. The control unit 160 includes a gesture recognition unit 161 and a virtual arrangement unit 163. The gesture recognition unit 161 is for recognizing the user's gesture from the user's gesture image received from the camera device 200. After recognizing the gesture, the gesture recognition unit 161 outputs the recognition result to the virtual arrangement unit 163. The virtual arrangement unit 163 may generate a virtual image constituting a virtual space where a user can arrange MIDI music. The virtual arrangement unit 163 provides the generated virtual image to the projection unit 110. In addition, the virtual arrangement unit 163 may receive MIDI music stored in the storage unit 150 and reproduce it. The virtual arrangement unit 163 provides the reproduced music to the audio unit 120 and outputs it through the speaker SPK of the audio unit 120. Also, the virtual arrangement unit 163 may arrange MIDI music according to the gesture recognized by the gesture recognition unit 161. The virtual arrangement unit 163 may store the arranged music in the storage unit 150 or provide it to the audio unit 120 to output it through the speaker SPK of the audio unit 120. The detailed operation of the control unit 160 including the gesture recognition unit 161 and the virtual arrangement unit 163 will be described in more detail below.

다음으로, 카메라장치(200)에 대해서 보다 상세하게 설명하기로 한다. 카메라장치(200)는 도 2에 도시된 바와 같이, 통신모듈(210) 및 카메라모듈(220)을 포함한다. Next, the camera device 200 will be described in more detail. 2, the camera device 200 includes a communication module 210 and a camera module 220.

통신모듈(210)은 ISM 대역을 통해 가상편곡장치(100)와 통신하기 위한 것이다. 예컨대, 통신모듈(210)은 블루투스 모듈, 적외선 통신 모듈 등이 될 수 있다. 통신모듈(210)은 카메라모듈(220)이 촬영한 영상을 가상편곡장치(100)로 전송한다. 통신모듈(210)은 송신되는 신호의 주파수를 상승 변환 및 증폭하는 RF(Radio Frequency) 송신기(Tx) 및 수신되는 신호를 저 잡음 증폭하고 주파수를 하강 변환하는 RF 수신기(Rx)를 포함할 수 있다. 그리고 통신모듈(210)은 송신되는 신호를 변조하고, 수신되는 신호를 복조하는 모뎀(Modem)을 포함할 수 있다. The communication module 210 is for communicating with the virtual arrangement device 100 through the ISM band. For example, the communication module 210 may be a Bluetooth module, an infrared communication module, or the like. The communication module 210 transmits the image captured by the camera module 220 to the virtual arrangement device 100. The communication module 210 may include an RF (Radio Frequency) transmitter (Tx) for up-converting and amplifying the frequency of the transmitted signal and an RF receiver (Rx) for amplifying the received signal with low noise and down-converting the frequency. . In addition, the communication module 210 may include a modem that modulates the transmitted signal and demodulates the received signal.

카메라모듈(220)은 사용자의 제스처를 촬영하기 위한 것이다. 특히, 카메라모듈(220)은 사용자가 가상편곡장치(100)를 착용하였을 때, 사용자의 전면을 촬영할 수 있도록 배치된다. 카메라모듈(220)은 도시되지는 않았지만, 적외선 발광 모듈(IR light), 깊이 이미지 센서 및 컬러 이미지 센서를 포함한다. 컬러 이미지 센서는 피사체에서 반사되는 빛을 입력받아 전기신호로 변환하며, CCD(Charged Coupled Device), CMOS(Complementary Metal-Oxide Semiconductor) 등을 기반으로 구현될 수 있다. 적외선 발광 모듈은 픽셀 단위로 적외선을 발산한다. 깊이 이미지 센서는 적외선 발광 모듈이 픽셀 단위로 발산한 적외선을 입력받아, 적외선이 피사체에 반사되어 돌아오는 거리(혹은 깊이로 표현되기도 함)를 측정한다. 이에 따라, 제어부(160)는 본 발명의 실시예에 따른 카메라장치(200)을 통해 촬영된 영상의 피사체의 각 픽셀에 대해 3차원 좌표를 도출할 수 있다. 이러한 카메라장치(200)의 적외선 발광 모듈(IR light), 깊이 이미지 센서 및 컬러 이미지 센서의 대표적인 예로, 키넥트 센서(Kinect sensor)를 예시할 수 있다. 카메라장치(200)는 아날로그-디지털 변환기(Analog to Digital Converter)를 더 포함할 수 있으며, 이미지 센서에서 출력되는 전기신호를 디지털 수열로 변환하여 제어부(160)로 출력할 수 있다. The camera module 220 is for photographing a user's gesture. In particular, the camera module 220 is arranged so that when the user wears the virtual arrangement device 100, the front of the user can be photographed. Although not shown, the camera module 220 includes an infrared light emitting module (IR light), a depth image sensor, and a color image sensor. The color image sensor receives light reflected from a subject and converts it into an electrical signal, and may be implemented based on a CCD (Charged Coupled Device), a CMOS (Complementary Metal-Oxide Semiconductor), or the like. The infrared light emitting module emits infrared light in units of pixels. The depth image sensor receives the infrared light emitted by the infrared light emitting module in units of pixels, and measures the distance (or sometimes expressed in depth) that infrared light is reflected back to the subject. Accordingly, the control unit 160 may derive three-dimensional coordinates for each pixel of the subject of the image photographed through the camera device 200 according to the embodiment of the present invention. A representative example of the infrared light emitting module (IR light), the depth image sensor, and the color image sensor of the camera device 200 may be a Kinect sensor. The camera device 200 may further include an analog-to-digital converter, and convert the electrical signal output from the image sensor into a digital sequence and output it to the controller 160.

카메라모듈(220)은 사용자의 제스처를 촬영하기 위한 것이다. 특히, 카메라모듈(220)은 사용자가 가상편곡장치(100)를 착용하였을 때, 사용자의 손의 움직임과 사용자의 손에 쥔 스틱의 움직임을 포함하는 사용자의 제스처를 촬영할 수 있도록 배치된다. 카메라모듈(220)은 이미지 센서를 포함하며, 이미지 센서는 피사체에서 반사되는 빛을 입력받아 전기신호로 변환하며, CCD(Charged Coupled Device), CMOS(Complementary Metal-Oxide Semiconductor) 등을 기반으로 구현될 수 있다. 카메라모듈(220)은 아날로그-디지털 변환기(Analog to Digital Converter)를 더 포함할 수 있으며, 이미지 센서에서 출력되는 전기신호를 디지털 수열로 변환하여 각 픽셀의 픽셀값(예컨대, RGB값)을 출력할 수 있다. 특히, 카메라모듈(220)은 3D 센서를 포함한다. 3D 센서는 비접촉 방식으로 영상의 각 픽셀에 대한 3차원 좌표를 획득하기 위한 센서이다. 카메라모듈(220)은 객체를 촬영함과 동시에 3D 센서를 통해 촬영된 영상의 각 픽셀에 대한 3차원 좌표의 좌표값(예컨대, x, y, z값)을 검출할 수 있다. 이때, 3차원 좌표의 좌표값은 카메라부(110)의 초점을 0점(0, 0, 0)으로 하였을 때의 좌표값이다. 3D 센서는 레이저, 적외선, 가시광 등을 이용하는 다양한 방식의 센서를 이용할 수 있다. 이러한 3D 센서는 TOP(Time of Flight), 위상변위(Phase-shift) 및 Online Waveform Analysis 중 어느 하나를 이용하는 레이저 방식 3차원 스캐너, 광 삼각법을 이용하는 레이저 방식 3차원 스캐너, 백색광 혹은 변조광을 이용하는 광학방식 3차원 스캐너, Handheld Real Time 방식의 PHOTO, 광학방식 3차원 스캐너, Pattern Projection 혹은 Line Scanning을 이용하는 광학방식, 레이저 방식 전신 스캐너, 사진 측량(Photogrammetry)을 이용하는 사진방식 스캐너, 키네틱(Kinect Fusion)을 이용하는 실시간(Real Time) 스캐너 등을 예시할 수 있다. 이와 같이, 본 발명의 실시예에 따른 카메라모듈(220)은 사용자의 제스처를 촬영하여 제스처 영상을 생성한다. 이러한 제스처 영상은 각 픽셀에 대한 컬러값(예컨대, RGB값)과 3차원 좌표값(예컨대, x, y, z값)을 포함한다. The camera module 220 is for photographing a user's gesture. In particular, the camera module 220 is arranged so that when the user wears the virtual arrangement device 100, the user's gesture including the movement of the user's hand and the movement of the stick held by the user's hand is captured. The camera module 220 includes an image sensor, and the image sensor receives light reflected from a subject and converts it into an electric signal, and may be implemented based on a CCD (Charged Coupled Device), CMOS (Complementary Metal-Oxide Semiconductor), or the like. Can. The camera module 220 may further include an analog-to-digital converter, and convert the electrical signal output from the image sensor into a digital sequence to output pixel values (eg, RGB values) of each pixel. Can. In particular, the camera module 220 includes a 3D sensor. The 3D sensor is a sensor for obtaining 3D coordinates of each pixel of an image in a non-contact manner. The camera module 220 may detect the coordinate values (eg, x, y, and z values) of three-dimensional coordinates for each pixel of the image captured through the 3D sensor while simultaneously photographing the object. At this time, the coordinate values of the 3D coordinates are coordinate values when the focus of the camera unit 110 is 0 (0, 0, 0). The 3D sensor can use various types of sensors using laser, infrared light, and visible light. These 3D sensors include laser (3D) scanners using any of TOP (Time of Flight), phase shift (Phase-shift) and Online Waveform Analysis, laser 3D scanners using optical triangulation, optics using white light or modulated light. Method 3D scanner, Handheld Real Time PHOTO, Optical 3D scanner, Pattern Projection or Line Scanning optical method, Laser method full body scanner, Photogrammetry photo method scanner, Kinect Fusion And a real-time scanner used. As described above, the camera module 220 according to an embodiment of the present invention generates a gesture image by photographing a user's gesture. The gesture image includes color values (eg, RGB values) and three-dimensional coordinate values (eg, x, y, and z values) for each pixel.

그러면, 전술한 미디음악편곡시스템(10)의 가상 악기 시각화 방법에 대해서 설명하기로 한다. 도 3은 본 발명의 실시예에 따른 미디 음악을 구성하는 복수의 트랙의 가상 악기 시각화 방법을 설명하기 위한 흐름도이다. 도 4는 본 발명의 실시예에 따른 미디 음악을 구성하는 복수의 트랙의 가상 악기 시각화 방법을 설명하기 위한 화면 예이다. Then, the virtual instrument visualization method of the MIDI music arrangement system 10 described above will be described. 3 is a flowchart illustrating a method of visualizing a virtual instrument of a plurality of tracks constituting MIDI music according to an embodiment of the present invention. 4 is a screen example for explaining a virtual instrument visualization method of a plurality of tracks constituting MIDI music according to an embodiment of the present invention.

도 3을 참조하면, 가상편곡부(163)는 S110 단계에서 저장부(150)로부터 복수의 트랙을 가지는 미디 음악을 로드한다. 이러한 미디 음악은 디지털 파일이며, 가상편곡부(163)는 S120 단계에서 미디 음악에서 복수의 트랙 각각에 대한 악기 정보를 추출한다. 악기 정보는 해당 트랙을 연주하는 악기를 나타낸다. 예컨대, 제1 내지 제4 트랙(Track 1, 2, 3, 4)의 악기 정보는 바이올린, 작은 북, 큰 북, 전자 기타 등이 될 수 있다. Referring to FIG. 3, the virtual arrangement unit 163 loads MIDI music having a plurality of tracks from the storage unit 150 in step S110. The MIDI music is a digital file, and the virtual arrangement unit 163 extracts musical instrument information for each of a plurality of tracks from the MIDI music in step S120. The instrument information indicates the instrument playing the track. For example, the instrument information of the first to fourth tracks (Track 1, 2, 3, 4) may be a violin, a small drum, a large drum, an electric guitar, and the like.

가상편곡부(163)는 S130 단계에서 저장부(150)를 검색하여 저장부(150)에 저장된 복수의 악기 이미지 중 각 트랙(Track 1, 2, 3, 4)의 악기 정보(바이올린, 작은 북, 큰 북, 전자 기타)에 대응하는 악기 이미지가 존재하는지 여부를 판단한다. The virtual arrangement unit 163 searches for the storage unit 150 in step S130, and the instrument information (violin, small book) of each track (Track 1, 2, 3, 4) among the plurality of musical instrument images stored in the storage unit 150. , Large drum, electric guitar) determines whether or not an instrument image exists.

S130 단계의 판단 결과, 트랙의 악기 정보에 대응하는 악기 이미지가 존재하면, 가상편곡부(163)는 S140 단계에서 해당 트랙에 대응하여 해당 악기 이미지를 선택한다. As a result of the determination in step S130, if there is an instrument image corresponding to the instrument information of the track, the virtual arrangement unit 163 selects the instrument image corresponding to the track in step S140.

반면, S130 단계의 판단 결과, 트랙의 악기 정보에 대응하는 악기 이미지가 존재하지 않으면, 가상편곡부(163)는 S150 단계에서 해당 트랙을 재생하고, 재생된 오디오 신호와 저장부(150)에 저장된 복수의 악기 이미지에 대응하는 가상 악기의 오디오 신호와 비교하여 오디오 신호와의 유사도가 가장 높은 악기의 악기 이미지를 선택한다. On the other hand, as a result of the determination in step S130, if there is no musical instrument image corresponding to the instrument information of the track, the virtual arrangement unit 163 plays the corresponding track in step S150, and the stored audio signal and the stored in the storage unit 150 The instrument image of the instrument having the highest similarity to the audio signal is selected by comparing with the audio signal of the virtual instrument corresponding to the plurality of instrument images.

예를 들어, "Y모 사의 전자 기타" 소리를 내도록 지정된 트랙의 경우, 저장부(150) 검색 결과, 지원 가능한 가상 악기의 이미지가 {"현악기", "통기타", "피아노", "드럼"} 4 가지 밖에 없는 상황이라면, 가장 유사한 "통기타"의 이미지를 선택한다. 이때, 음향 식별의 정확도를 높이기 위해, 해당 트랙을 재생한 오디오 신호("Y모 사의 전자 기타" 소리로 연주한 결과)를 지원 가능한 가상 악기들로 각각 연주한 오디오 신호들({"현악기" 소리로 연주한 결과, "통기타" 소리로 연주한 결과, "피아노" 소리로 연주한 결과, "드럼" 소리로 연주한 결과})과 비교하여 가장 유사한 오디오 신호를 지닌 가상 악기를 최종 선택한다. For example, in the case of a track designated to make a sound of "Y guitar's electric guitar," the search result of the storage unit 150 shows that the image of the supported virtual instrument is {"stringed instrument", "guitar guitar", "piano", "drum" } If there are only four, select the image with the most similar "guitar". At this time, in order to increase the accuracy of the acoustic identification, the audio signals ({"stringed instrument" sounds) played by each of the virtual instruments capable of supporting the audio signals reproduced by the track (the result of playing with the "Y guitar electric guitar" sound) As a result, the virtual instrument with the most similar audio signal is finally selected by comparing with the result of playing with "guitar guitar", the result of playing with "piano", and the result of playing with "drum"}.

이때, 이와 가장 유사한 오디오 신호의 비교는 패턴 인식(음향 식별) 기술을 이용하여 이루어진다. 또한, '재생'의 의미는 해당 트랙을 '재생'한 오디오 신호는 오디오부(120)의 스피커(SPK)를 통해 출력할 필요는 없으며, 비교를 위해서만 사용된다. At this time, the comparison of the most similar audio signal is performed using pattern recognition (sound identification) technology. In addition, the meaning of'play' does not need to output the audio signal'play' of the track through the speaker SPK of the audio unit 120, and is used only for comparison.

전술한 바와 같이, 각 트랙에 대한 악기 이미지가 선택되면, 가상편곡부(163)는 S160 단계에서 선택된 악기 이미지를 이용하여 복수의 트랙을 시각화하여 가상 영상을 생성하며, 생성된 가상 영상을 영사부(110)를 통해 출력한다. As described above, when the instrument image for each track is selected, the virtual arrangement unit 163 generates a virtual image by visualizing a plurality of tracks using the instrument image selected in step S160, and the generated virtual image is projected ( 110).

이러한 화면 예가 도 4에 도시되었다. 도시된 바와 같이, 가상 영상은 가상의 무대(ST)를 포함한다. 또한, 가상 영상은 복수의 트랙 각각에 대응하는 복수의 트랙 이미지(Track 1, 2, 3, 4) 및 복수의 트랙 전체에 대응하는 전체 트랙 이미지(ALL TRACK)를 더 포함한다. 이러한 복수의 트랙 이미지(Track 1, 2, 3, 4) 및 전체 트랙 이미지(ALL TRACK)는 가상의 무대(ST) 내에 배치된다. An example of such a screen is shown in FIG. 4. As shown, the virtual image includes a virtual stage ST. In addition, the virtual image further includes a plurality of track images (Track 1, 2, 3, 4) corresponding to each of the plurality of tracks and an entire track image (ALL TRACK) corresponding to the entire plurality of tracks. The plurality of track images (Track 1, 2, 3, 4) and the entire track image (ALL TRACK) are disposed in the virtual stage ST.

도 4에 제1 내지 제4 트랙(Track 1, 2, 3, 4)의 트랙 이미지가 도시되었다. 예컨대, 어느 하나의 트랙 이미지(예컨대, Track 4)는 해당 트랙을 연주하는 악기를 나타내는 악기 이미지(21), 해당 트랙을 재생하는 볼륨의 크기를 나타내는 볼륨 이미지(23) 및 해당 트랙이 선택되었는지 여부를 나타내는 선택 이미지(25)를 포함한다. 전체 트랙 이미지(ALL TRACK)는 전체 트랙 이미지임을 나타내는 텍스트(27), 예컨대, "ALL TRACK"와 전체 트랙이 선택되었는지 여부를 나타내는 선택 이미지(29)를 포함한다. 또한, 가상 영상은 하나 이상의 버튼(BT)을 더 포함한다. 이러한 버튼(BT)은 가상의 무대(ST)를 가리지 않도록 가상의 무대(ST)의 테두리에 배치되는 것이 바람직하다. 4, track images of the first to fourth tracks (Track 1, 2, 3, 4) are shown. For example, any one track image (eg, Track 4) includes an instrument image 21 representing an instrument playing the track, a volume image 23 representing the volume of the volume playing the track, and whether the track is selected. It includes a selection image 25 representing. The ALL track image (ALL TRACK) includes text 27 indicating that it is an entire track image, for example, “ALL TRACK” and a selection image 29 indicating whether all tracks are selected. Also, the virtual image further includes one or more buttons BT. The button BT is preferably disposed on the border of the virtual stage ST so as not to cover the virtual stage ST.

그러면, 전술한 미디음악편곡시스템(10)의 가상 악기 시각화 기반 미디 음악 편곡 방법에 대해서 설명하기로 한다. 도 5는 본 발명의 실시예에 따른 가상 악기 시각화 기반 미디 음악 편곡 방법을 설명하기 위한 흐름도이다. 도 6 내지 도 9는 트랙 선택 혹은 선택 해제 제스처에 따라 트랙을 선택 혹은 선택 해제하는 방법을 설명하기 위한 화면 예이다. 도 10 내지 도 18은 본 지휘 제스처에 따라 선택된 트랙을 편곡하는 방법을 설명하기 위한 화면 예이다. 그리고 도 19 및 도 20은 버튼 선택 제스처에 따라 버튼에 할당된 기능을 수행하는 방법을 설명하기 위한 화면 예이다. Then, the MIDI music arrangement method based on the virtual instrument visualization of the aforementioned MIDI music arrangement system 10 will be described. 5 is a flowchart illustrating a method for arranging MIDI music based on virtual instrument visualization according to an embodiment of the present invention. 6 to 9 are screen examples for explaining a method of selecting or deselecting a track according to a track selection or deselection gesture. 10 to 18 are screen examples for explaining a method of arranging a selected track according to the present command gesture. 19 and 20 are screen examples for explaining a method of performing a function assigned to a button according to a button selection gesture.

도 5를 참조하면, 복수의 트랙이 시각화되어 가상 영상이 영사된 상태에서, 제어부(160)의 가상편곡부(163)는 S210 단계에서 앞서 로드된 복수의 트랙을 포함하는 미디 음악을 재생한다. 미디 음악의 재생 중 카메라장치(200)의 카메라모듈(220)은 지속적으로 사용자의 제스처를 촬영하고, 통신모듈(210)은 촬용된 사용자의 제스처 영상을 가상편곡장치(100)로 전송한다. Referring to FIG. 5, in a state in which a plurality of tracks are visualized and a virtual image is projected, the virtual arrangement unit 163 of the control unit 160 plays MIDI music including the plurality of tracks previously loaded in step S210. During playback of MIDI music, the camera module 220 of the camera device 200 continuously photographs the user's gesture, and the communication module 210 transmits the captured user's gesture image to the virtual arrangement device 100.

그러면, 가상편곡장치(100) 제어부(160)의 제스처인식부(161)는 통신부(140)를 통해 제스처 영상을 지속적으로 수신한다. 이에 따라, 제스처인식부(161)는 S220 단계에서 수신된 제스처 영상으로부터 가상 영상에 대응하는 사용자의 제스처를 인식할 수 있다. 즉, 카메라모듈(220)이 촬영한 제스처 영상은 카메라모듈(220)의 초점을 기준으로 하는 3차원 좌표를 가지며, 제스처인식부(161)는 이러한 3차원 좌표는 가상 영상의 소정의 기준점을 기준으로 하는 3차원 좌표로 변환하고, 변환된 3차원 좌표에 따라 가상 영상에 대응하는 사용자의 제스처를 인식할 수 있다. 예컨대, 제스처인식부(161)는 가상 영상 내의 특정 트랙, 특정 버튼을 가리키거나, 가상 영상의 가상 무대(ST) 밖을 가리키는 제스처를 인식할 수 있다. Then, the gesture recognition unit 161 of the control unit 160 of the virtual arrangement device 100 continuously receives the gesture image through the communication unit 140. Accordingly, the gesture recognition unit 161 may recognize the user's gesture corresponding to the virtual image from the gesture image received in step S220. That is, the gesture image taken by the camera module 220 has three-dimensional coordinates based on the focus of the camera module 220, and the gesture recognition unit 161 refers to these three-dimensional coordinates based on a predetermined reference point of the virtual image. It can be converted into 3D coordinates, and the gesture of the user corresponding to the virtual image can be recognized according to the converted 3D coordinates. For example, the gesture recognition unit 161 may recognize a gesture pointing to a specific track or a specific button in the virtual image, or pointing out the virtual stage ST of the virtual image.

이어서, 가상편곡부(163)는 S230 단계에서 제스처인식부(161)가 인식한 제스처가 트랙을 선택하거나, 선택 해제하기 위한 트랙 선택 제스처인지 여부를 판별한다. 이러한 S230 단계의 판별 결과, 제스처인식부(161)가 인식한 제스처가 트랙 선택 제스처이면, 가상편곡부(163)는 S240 단계에서 해당 제스처에 따라 트랙을 선택하거나, 선택 해제한다. 트랙 선택 제스처에 따라 트랙을 선택하거나, 선택 해제하는 방법이 도 6 내지 도 9에 도시되었다. Subsequently, the virtual arrangement unit 163 determines whether the gesture recognized by the gesture recognition unit 161 is a track selection gesture for selecting or deselecting the track in step S230. As a result of the determination in step S230, if the gesture recognized by the gesture recognition unit 161 is a track selection gesture, the virtual arrangement unit 163 selects or deselects the track according to the corresponding gesture in step S240. A method of selecting or deselecting a track according to a track selection gesture is illustrated in FIGS. 6 to 9.

도 6을 참조하면, 제스처 S1과 같이, 제스처인식부(161)가 스틱을 통해 어느 하나의 트랙 이미지(예컨대, Track 2)를 소정 시간 이상 가리키는 사용자의 트랙 선택 제스처를 감지하면, 가상편곡부(163)는 해당 트랙(예컨대, Track 2)을 선택한다. 다른 예로, 제스처 S2와 같이, 제스처인식부(161)가 손가락을 통해 어느 하나의 트랙 이미지(예컨대, Track 4)를 소정 시간 이상 가리키는 사용자의 트랙 선택 제스처를 감지하면, 가상편곡부(163)는 해당 트랙(예컨대, Track 4)을 선택한다. 한편, 제스처 S1 및 S2가 동시에 일어나는 경우, 2개의 트랙(예컨대, Track 2, 4)이 동시에 선택될 수도 있다. 이때, 가상편곡부(163)는 선택된 트랙임을 시각적으로 나타내기 위하여 트랙 이미지 중 선택 이미지(25)의 색상, 명도, 채도 혹은 밝기를 변경할 수 있다. Referring to FIG. 6, as in gesture S1, when the gesture recognition unit 161 detects a track selection gesture of a user pointing a certain track image (eg, Track 2) over a predetermined time through a stick, the virtual arrangement unit ( 163) selects a corresponding track (eg, Track 2). As another example, as in gesture S2, when the gesture recognition unit 161 detects a track selection gesture of a user pointing a certain track image (eg, Track 4) over a predetermined time through a finger, the virtual arrangement unit 163 may Select the appropriate track (eg Track 4). On the other hand, when the gestures S1 and S2 occur simultaneously, two tracks (eg, Track 2, 4) may be selected at the same time. At this time, the virtual arrangement unit 163 may change the color, brightness, saturation, or brightness of the selected image 25 among the track images in order to visually indicate that it is the selected track.

도 7을 참조하면, 제스처 S3과 같이, 제스처인식부(161)가 주먹을 쥔 상태를 유지하는 사용자의 트랙 선택 제스처를 감지하면, 가상편곡부(163)는 기 선택된 트랙(예컨대, Track 2, 4)의 선택 상태를 유지하고, 제스처 S4와 같이, 제스처인식부(161)가 선택되지 않은 트랙 이미지(예컨대, Track 1)를 소정 시간 이상 가리키는 사용자의 트랙 선택 제스처를 감지하면, 가상편곡부(163)는 기 선택된 트랙(예컨대, Track 2, 4)에 추가로 해당 트랙(예컨대, Track 1)을 선택한다. Referring to FIG. 7, as in gesture S3, when the gesture recognition unit 161 detects a user's track selection gesture maintaining a fisted state, the virtual arrangement unit 163 may select a previously selected track (eg, Track 2, If the selected state of 4) is maintained, and the gesture recognition unit 161 detects the track selection gesture of the user pointing the track image (eg, Track 1) for which the gesture recognition unit 161 is not selected for a predetermined time or longer, the virtual arrangement unit ( 163) selects a corresponding track (eg, Track 1) in addition to the previously selected track (eg, Track 2, 4).

도 8을 참조하면, 제스처 S5와 같이, 제스처인식부(161)가 주먹을 쥔 상태를 유지하는 사용자의 트랙 선택 제스처를 감지하면, 가상편곡부(163)는 기 선택된 트랙(예컨대, Track 1, 2, 4)의 선택 상태를 유지하고, 제스처 S6과 같이, 제스처인식부(161)가 기 선택된 트랙(예컨대, Track 1, 2, 4) 중 어느 하나의 트랙 이미지(예컨대, Track 1)를 소정 시간 이상 가리키는 사용자의 트랙 선택 제스처를 감지하면, 가상편곡부(163)는 기 선택된 트랙(예컨대, Track 1, 2, 4) 중 해당 트랙(예컨대, Track 1)을 선택 해제한다. Referring to FIG. 8, as in gesture S5, when the gesture recognition unit 161 detects a user's track selection gesture maintaining a fisted state, the virtual arrangement unit 163 may select a previously selected track (eg, Track 1, 2, 4), and the gesture recognition unit 161 determines a track image (eg, Track 1) of any one of the previously selected tracks (eg, Track 1, 2, 4), such as gesture S6. When the user's track selection gesture pointing for a time or more is sensed, the virtual arrangement unit 163 deselects the corresponding track (eg, Track 1) among the previously selected tracks (eg, Track 1, 2, 4).

도 9를 참조하면, 제스처 S7과 같이, 제스처인식부(161)가 전체 트랙 이미지(ALL TRACK)를 소정 시간 이상 가리킨 후, 2 이상의 트랙 이미지(예컨대, Track 1, 2, 4)를 연속해서 가리키는 드래그 동작인 트랙 선택 제스처를 감지하면, 가상편곡부(163)는 연속해서 가리킨 2 이상의 트랙 이미지에 대응하는 트랙(예컨대, Track 1, 2, 4)을 선택할 수 있다. Referring to FIG. 9, as in gesture S7, the gesture recognition unit 161 points to the entire track image (ALL TRACK) for a predetermined time or more, and then continuously points to two or more track images (eg, Track 1, 2, 4). When the track selection gesture, which is a drag operation, is sensed, the virtual arrangement unit 163 may select tracks (eg, Tracks 1, 2, 4) corresponding to two or more track images that are consecutively pointed.

전술한 바와 같이, 본 발명에 따르면, 사용자의 트랙 선택 제스처에 따라 다양한 방식으로 복수의 트랙 중 일부 혹은 전부를 선택하거나, 선택 해제 할 수 있다. As described above, according to the present invention, some or all of a plurality of tracks may be selected or deselected in various ways according to a user's track selection gesture.

한편, S230 단계의 판단 결과, 제스처인식부(161)가 인식한 제스처가 트랙 선택 제스처가 아니면, 가상편곡부(163)는 S250 단계에서 제스처인식부(161)가 인식한 제스처가 지휘 제스처인지 여부를 판별한다. 이러한 S250 단계의 판별 결과, 제스처인식부(161)가 인식한 제스처가 지휘 제스처이면, 가상편곡부(163)는 S260 단계에서 해당 제스처에 따라 재생 중인 미디 음악의 선택된 트랙의 박자, 템포, 연주법 및 볼륨 중 적어도 하나를 편곡하여 재생한다. 이러한 지휘 제스처에 따라 재생 중인 미디 음악의 선택된 트랙을 편곡하는 방법이 도 10 내지 도 18에 도시되었다. On the other hand, as a result of the determination in step S230, if the gesture recognized by the gesture recognition unit 161 is not a track selection gesture, the virtual arrangement unit 163 determines whether the gesture recognized by the gesture recognition unit 161 in step S250 is a command gesture. To discriminate. As a result of the determination in step S250, if the gesture recognized by the gesture recognition unit 161 is a command gesture, the virtual arrangement unit 163 measures the beat, tempo, and method of playing the selected track of the MIDI music being played according to the corresponding gesture in step S260. Arrange and play at least one of the volumes. A method of arranging selected tracks of MIDI music being played according to the command gesture is illustrated in FIGS. 10 to 18.

먼저, 도 10을 참조하면, 제스처인식부(161)가 지휘 제스처에 따른 스틱의 움직임에 따른 궤적이 소정의 모양을 형성하는 것을 인식하면, 가상편곡부(163)는 형성된 모양에 따라 재생 중인 미디 음악의 선택된 트랙의 박자를 편곡하여 재생한다. 즉, 가상편곡부(163)는 지휘 제스처의 모양에 따라 재생 중인 미디 음악의 선택된 트랙의 박자를 변경하여 재생한다. 도 10에서, 지휘 제스처의 궤적 중 ①, ②, ③ 및 ④는 비트포인트를 나타내며, 이러한 비트포인트는 지휘 제스처의 궤적의 방향이 변경되는 변곡점이다. 제스처인식부(161)는 이러한 변곡점의 수, 즉, 비트포인트의 수를 통해 지휘 제스처의 모양을 인식할 수 있다. First, referring to FIG. 10, when the gesture recognition unit 161 recognizes that the trajectory according to the movement of the stick according to the command gesture forms a predetermined shape, the virtual arrangement unit 163 is a MIDI being played according to the formed shape. Arrange and play the beat of the selected track of music. That is, the virtual arrangement unit 163 reproduces the beat of the selected track of the MIDI music being played according to the shape of the command gesture. In FIG. 10, ①, ②, ③, and ④ among the trajectories of the command gesture represent bit points, and these bit points are inflection points in which the direction of the trajectory of the command gesture is changed. The gesture recognition unit 161 may recognize the shape of the command gesture through the number of inflection points, that is, the number of bit points.

일례로, 제스처 E1과 같이, 제스처인식부(161)는 스틱을 이용한 지휘 제스처에 궤적에 따라 형성되는 변곡점이 ① 및 ②와 같이 2개이면, 비트포인트의 수가 2개임을 인식한다. 이에 따라, 가상편곡부(163)는 재생 중인 미디 음악의 선택된 트랙의 한마디의 박자를 2박자로 변경하어 재생한다. 다른 예로, 제스처 E2와 같이, 제스처인식부(161)가 스틱을 이용한 지휘 제스처에 궤적에 따라 형성되는 변곡점이 ①, ② 및 ③과 같이 3개이면, 비트포인트의 수가 3개임을 인식한다. 이에 따라, 가상편곡부(163)는 재생 중인 미디 음악의 선택된 트랙의 한마디의 박자를 3박자로 변경하여 재생한다. 또 다른 예로, 제스처 E3과 같이, 제스처인식부(161)가 스틱을 이용한 지휘 제스처에 궤적에 따라 형성되는 변곡점이 ①, ②, ③ 및 ④와 같이 4개이면, 비트포인트의 수가 3개임을 인식한다. 이에 따라, 가상편곡부(163)는 선택된 트랙의 한마디의 박자를 4박자로 변경하여 재생한다. For example, as in the gesture E1, the gesture recognition unit 161 recognizes that the number of bit points is two if the inflection points formed according to the trajectory of the command gesture using the stick are two such as ① and ②. Accordingly, the virtual arrangement unit 163 reproduces the beat of one word of the selected track of the MIDI music being played by changing the time signature to 2 beats. As another example, as in gesture E2, if the gesture recognition unit 161 has three inflection points formed according to a trajectory in a command gesture using a stick, it is recognized that the number of bit points is three. Accordingly, the virtual arrangement unit 163 reproduces the beat of one word of the selected track of the MIDI music being played by changing the time signature to 3 beats. As another example, as in gesture E3, if the gesture recognition unit 161 has four inflection points formed according to the trajectory of a command gesture using a stick, such as ①, ②, ③ and ④, it recognizes that the number of bit points is three. do. Accordingly, the virtual arrangement unit 163 reproduces the beat of one word of the selected track by changing it to 4 beats.

다음으로, 도 11을 참조하면, 제스처인식부(161)가 한 번의 지휘 제스처가 완성되는 데에 소요되는 시간을 통해 지휘 제스처의 속도를 산출하고, 가상편곡부(163)는 그 산출된 속도에 따라 재생 중인 미디 음악의 선택된 트랙의 템포를 변경하여 재생한다. 즉, 제스처인식부(161)가 지휘 제스처의 속도를 인식하면, 가상편곡부(163)는 그 속도에 따라 재생 중인 미디 음악의 선택된 트랙의 템포를 변경하여 재생한다. Next, referring to FIG. 11, the gesture recognition unit 161 calculates the speed of the command gesture through the time it takes for one command gesture to be completed, and the virtual arrangement unit 163 calculates the calculated speed. Then, the tempo of the selected track of the MIDI music being played is changed and played. That is, when the gesture recognition unit 161 recognizes the speed of the command gesture, the virtual arrangement unit 163 changes and plays the tempo of the selected track of the MIDI music being played according to the speed.

예를 들면, 제스처 E4는 한 번의 지휘 제스처(4박자 지휘)가 완성되는데 소요되는 시간이 1초인 경우를 나타내며, 제스처 E5는 E4와 동일한 지휘 제스처(4박자 지휘)에 소요되는 시간이 0.5초인 경우를 나타낸다. 이와 같이, 제스처인식부(161)는 한 번의 지휘 제스처에 소요되는 시간, 즉, 지휘 제스처의 속도를 산출하고, 가상편곡부(163)는 그 산출된 속도에 따라 재생 중인 미디 음악의 선택된 트랙의 템포를 변경하여 재생한다. 이에 따라, 가상편곡부(163)는 제스처 E4에 비해 제스처 E5의 경우에 해당 트랙의 템포를 빠르게 변경하여 재생할 수 있다. For example, the gesture E4 represents a case in which the time required to complete one command gesture (4 beat command) is 1 second, and the gesture E5 is the time required for the same command gesture (4 beat command) equal to E4 is 0.5 seconds. Indicates. In this way, the gesture recognition unit 161 calculates the time required for one command gesture, that is, the speed of the command gesture, and the virtual arrangement unit 163 selects the selected track of the MIDI music being played according to the calculated speed. Play by changing the tempo. Accordingly, the virtual arrangement unit 163 can quickly change and play the tempo of the corresponding track in the case of the gesture E5 compared to the gesture E4.

다음으로, 도 12를 참조하면, 제스처인식부(161)가 지휘 제스처의 비트 포인트와 비트포인트 이외의 구간에서의 속도 차이를 산출하고, 가상편곡부(163)는 그 산출된 속도의 차이에 따라 재생 중인 미디 음악의 선택된 트랙의 연주법을 변경하여 재생한다. 도 12에서, 지휘 제스처의 궤적 중 ①, ②, ③ 및 ④는 비트포인트를 나타내며, 이러한 비트포인트는 지휘 제스처의 궤적의 방향이 변경되는 구간, 즉, 변곡점이다. 제스처인식부(161)가 지휘 제스처의 비트포인트 ①, ②, ③, ④에서의 속도와 비트포인트 이외의 구간, 즉, ①과 ② 사이, ②와 ③ 사이, 그리고, ③과 ④ 사이 구간의 속도의 차이를 인식하면, 가상편곡부(163)는 그 속도의 차이에 따라 재생 중인 미디 음악의 선택된 트랙의 연주법을 변경하여 재생한다. Next, referring to FIG. 12, the gesture recognition unit 161 calculates a speed difference in a section other than the bit point and the bit point of the command gesture, and the virtual arrangement unit 163 according to the calculated difference in speed. Plays by changing the playing method of the selected track of the MIDI music being played. In FIG. 12, ①, ②, ③, and ④ among the trajectories of the command gesture represent bit points, and these bit points are sections in which the direction of the trajectory of the command gesture is changed, that is, inflection points. The gesture recognition unit 161 has the speed at the bit points ①, ②, ③, and ④ of the command gesture and a section other than the bit point, that is, the speed between sections ① and ②, between ② and ③, and between sections ③ and ④. Upon recognizing the difference, the virtual arrangement unit 163 changes and plays the selected track of the MIDI music being played according to the difference in speed.

한 번의 지휘 제스처를 이루는 궤적의 총 길이를 N, 궤적 상의 어떤 지점을 x, 이 지점에서의 제스처 속도를 s(x)라 할 때, 제스처인식부(161)는 지휘 제스처의 비트 포인트와 비트포인트 이외의 구간에서의 속도 차이(D)를 다음의 수학식 1을 통해 같이 산출하여 가상편곡부(163)가 연주법을 결정할 수 있도록 제공한다. When the total length of a locus forming a single command gesture is N, a certain point on the trajectory is x, and the gesture speed at this point is s(x), the gesture recognition unit 161 bit points and bit points of the command gesture The speed difference (D) in the other sections is calculated through Equation 1 below to provide a virtual arrangement unit 163 to determine a performance method.

Figure 112018062316348-pat00003
Figure 112018062316348-pat00003

즉, 수학식 1에 따르면, 지휘 제스처의 비트 포인트와 비트포인트 이외의 구간에서의 속도 차이(D)는 지휘 제스처의 궤적의 각 지점 x에서의 가속도의 절대값 합계로 나타낼 수 있다. 가상편곡부(163)는 산출된 속도 차이(D)가 상대적으로 클수록 한 음을 짧게, 산출된 속도 차이(D)가 상대적으로 작을수록 한 음을 길게 재생하는 연주법으로 변경한다. That is, according to Equation 1, the speed difference (D) between the bit point of the command gesture and the section other than the bit point can be expressed as the sum of the absolute values of acceleration at each point x of the trajectory of the command gesture. The virtual arrangement unit 163 changes to a performance method in which one sound is shortened as the calculated speed difference D is relatively large, and one sound is long as the calculated speed difference D is relatively small.

예컨대, 도 12의 (E6), (E7) 및 (E8)은 모두 한 번의 지휘 제스처가 완성되는 동안의 각 구간의 속도의 변화를 나타내는 그래프이다. (E8)의 경우, 지휘 제스처의 비트 포인트와 비트포인트 이외의 구간에서의 속도 차이(D)가 상대적으로 가장 크고, (E6)은 상대적으로 가장 작으며, (E7)은 (E8) 보다 작고, (E6) 보다 크다. 이에 따라, (E8)와 같은 지휘 제스처가 있는 경우, 가상편곡부(163)는 상대적으로 (E7) 보다 한 음을 짧게 재생하는 연주법으로 변경한다. 또한, (E6)과 같은 지휘 제스처가 있는 경우, 가상편곡부(163)는 상대적으로 (E7) 보다 한 음을 길게 재생하는 연주법으로 변경한다. 그리고 (E7)과 같은 지휘 제스처가 있는 경우, 가상편곡부(163)는 상대적으로 (E8) 보다 한 음을 길게 재생하고, (E6) 보다 상대적으로 한 음을 짧게 재생하는 연주법으로 변경한다. For example, (E6), (E7), and (E8) in FIG. 12 are graphs showing changes in the speed of each section while one command gesture is completed. In the case of (E8), the speed difference (D) in the section other than the bit point of the command gesture and the bit point is relatively largest, (E6) is relatively small, (E7) is less than (E8), (E6). Accordingly, when there is a commanding gesture such as (E8), the virtual arrangement unit 163 changes to a playing method in which one note is played relatively shorter than (E7). In addition, when there is a commanding gesture such as (E6), the virtual arrangement unit 163 changes to a playing method in which one note is played longer than (E7). And if there is a command gesture such as (E7), the virtual arrangement unit 163 changes to a playing method that plays one note relatively longer than (E8) and plays one note relatively shorter than (E6).

이러한 연주법은 레가토(legato: 한 음을 길게 연주하여 음과 음 사이가 끊기지 않게), 논레가토(non legato, 본래 음표 길이보다 약간 짧게 소리 내기), 포르타토(portato: 본래 음표의 3/4 길이 정도만 짧게 소리 내기), 스타카토(staccato: 본래 음표의 1/2 길이 정도만 짧게 소리 내기) 등을 포함한다. These methods include legato (so that one note is played long, so that there is no break between notes), non legato (slightly shorter than the original note length), portato (3/4 length of the original note) Sound shorter), staccato (sound shorter than half the length of the original note).

다음으로, 도 12를 참조하면, 제스처인식부(161)는 지휘 제스처의 크기를 산출하고, 가상편곡부(163)는 그 산출된 크기에 따라 선택된 트랙의 볼륨을 변경하여 재생한다. 이때, 제스처인식부(161)는 한 번의 지휘 제스처에서 인식되는 복수의 비트포인트 중 2 이상의 비트포인트 간의 거리를 통해 지휘 제스처의 상대적인 크기를 산출할 수 있다. 또한, 가상편곡부(163)는 제스처인식부(161)가 산출한 지휘 제스처의 크기에 따라 지휘 제스처의 크기가 클수록 볼륨을 높여 재생하며, 지휘 제스처의 크기가 작을수록 볼륨을 낮게 재생한다. Next, referring to FIG. 12, the gesture recognition unit 161 calculates the size of the command gesture, and the virtual arrangement unit 163 changes the volume of the selected track according to the calculated size and plays it. At this time, the gesture recognition unit 161 may calculate the relative size of the command gesture through the distance between two or more bit points among the plurality of bit points recognized in one command gesture. In addition, according to the size of the command gesture calculated by the gesture recognition unit 161, the virtual arrangement unit 163 increases the volume and plays the volume up, and the smaller the command gesture size, the lower the volume.

예를 들면, 제스처 E9의 경우, 제스처인식부(161)는 1번의 지휘 제스처(4박자 지휘)에 따른 비트포인트 ② 및 ④와의 거리 d1을 산출할 수 있다. 또한, E9와 동일한 지휘 제스처(4박자 지휘)인 제스처 E10의 경우, 제스처인식부(161)는 한 번의 지휘 제스처(4박자 지휘)에 따른 비트포인트 ② 및 ④와의 거리 d2를 산출할 수 있다. d1<d2일 때, 가상편곡부(163)는 지휘 제스처의 크기(d1<d2)에 따라 제스처 E9의 경우 제스처 E10 보다 볼륨을 낮게 변경하여 재생하며, 제스처 E10의 경우 제스처 E9 보다 볼륨을 높게 변경하여 재생한다. For example, in the case of the gesture E9, the gesture recognition unit 161 may calculate the distance d1 between the bit points ② and ④ according to the first command gesture (4 beat command). Also, in the case of gesture E10, which is the same command gesture (4 beat command) as E9, the gesture recognition unit 161 may calculate the distance d2 from the bit points ② and ④ according to one command gesture (4 beat command). When d1<d2, the virtual arrangement unit 163 changes the volume to a lower level than gesture E10 in case of gesture E9 and plays the volume higher than gesture E9 in case of gesture E10 according to the size of the command gesture (d1<d2). To play.

한편, 지금까지, 스틱을 이용한 지휘 제스처에 대해서 설명하였지만, 도 14에 도시된 제스처 E11 및 E12와 같이, 스틱 없이 오른손 및 왼손 중 어느 하나의 손으로도 지휘 제스처를 수행할 수 있다. 즉, 본 발명의 실시예에 따르면, 손을 이용한 지휘 제스처의 모양, 즉, 비트포인트의 수에 따라 박자를 조절할 수 있다. 손을 이용한 지휘 제스처의 속도에 따라 템포를 조절할 수 있다. 손을 이용한 지휘 제스처의 비트포인트에서의 속도 차이에 따라 연주법을 조절할 수 있다. 그리고 손을 이용한 지휘 제스처의 크기에 따라 볼륨을 조절할 수 있다. On the other hand, until now, although the command gesture using the stick has been described, as shown in the gestures E11 and E12 shown in FIG. 14, the command gesture can be performed with either one of the right hand and the left hand without a stick. That is, according to an embodiment of the present invention, the time signature can be adjusted according to the shape of the command gesture using the hand, that is, the number of bit points. You can adjust the tempo according to the speed of your hand gesture. You can adjust the playing method according to the speed difference at the beat point of the hand gesture. And the volume can be adjusted according to the size of the hand gesture using the hand.

다음으로, 도 15를 참조하면, 제스처 E13과 같이, 제스처인식부(161)가 주먹을 쥔 상태를 유지하는 사용자의 제스처를 감지하면, 가상편곡부(163)는 주먹을 쥔 제스처를 하기 이전의 지휘 제스처에 따라 기 선택된 트랙을 재생한다. 또한, 제스처 E14와 같이, 제스처인식부(161)가 스틱 혹은 손가락 끝을 통해 가상 무대의 밖을 가리키는 것을 인식하면, 가상편곡부(163)는 지휘에 따른 편곡을 중단하고, 기존의 미디 음악의 각 트랙의 악보에 따라 해당 미디 음악을 재생한다. Next, referring to FIG. 15, when the gesture recognition unit 161 detects a user's gesture to maintain a fisted state, as in the gesture E13, the virtual arrangement unit 163 is used to make a fisted gesture before The selected track is played according to the command gesture. In addition, when the gesture recognition unit 161 recognizes that the gesture recognition unit 161 points out of the virtual stage through a stick or a finger tip, the virtual arrangement unit 163 stops the arrangement according to the command, and performs the existing MIDI music. Play the corresponding MIDI music according to the score of each track.

다음으로, 도 16을 참조하면, 제스처 E15와 같이, 제스처인식부(161)가 손바닥을 내리는 제스처를 감지하면, 가상편곡부(163)는 선택된 트랙의 볼륨을 낮추어 재생할 수 있다. 또한, 제스처 E16과 같이, 제스처인식부(161)가 손바닥을 내리는 제스처를 감지하면, 가상편곡부(163)는 선택된 트랙의 볼륨을 높여 재생할 수 있다. Next, referring to FIG. 16, when the gesture recognition unit 161 detects a gesture of lowering a palm, as in the gesture E15, the virtual arrangement unit 163 may lower the volume of the selected track and play it. In addition, like the gesture E16, when the gesture recognition unit 161 detects a gesture of lowering the palm of the hand, the virtual arrangement unit 163 may increase the volume of the selected track and play it.

한편, 본 발명의 다른 실시예에 따르면, 양 손을 이용하여 지휘 제스처를 수행할 수 있다. 일 실시예에 따르면, 제스처인식부(161)가 왼손 및 오른손의 지휘 제스처를 동시에 인식하면, 가상편곡부(163)는 인식된 왼손의 제스처에 따라 볼륨을 조절하고, 인식된 오른손의 제스처에 따라 박자, 템포 및 연주법을 조절할 수 있다. 일례로, 도 17에 도시된 바와 같이, 제스처인식부(161)가 제스처 B1과 같이, 주먹을 쥔 상태를 유지하는 왼손의 지휘 제스처를 감지하고, 이와 동시에, 제스처 B2와 같이, 오른손의 지휘 제스처를 인식하면, 가상편곡부(163)는 인식된 왼손의 제스처에 따라 볼륨을 유지하고, 인식된 오른손의 제스처에 따라 박자, 템포 및 연주법을 조절할 수 있다. Meanwhile, according to another embodiment of the present invention, a command gesture may be performed using both hands. According to an embodiment, when the gesture recognition unit 161 simultaneously recognizes the left and right hand command gestures, the virtual arrangement unit 163 adjusts the volume according to the recognized left hand gesture, and according to the recognized right hand gesture. You can adjust the time signature, tempo, and playing method. As an example, as shown in FIG. 17, the gesture recognition unit 161 detects a left-handed commanding gesture that maintains a fisted state, such as gesture B1, and at the same time, as a gesture B2, a right-handed commanding gesture When recognizing, the virtual arrangement unit 163 may maintain the volume according to the recognized gesture of the left hand, and adjust the beat, tempo, and playing method according to the recognized gesture of the right hand.

다른 실시예에 따르면, 제스처인식부(161)가 왼손의 지휘 제스처 및 오른손의 선택 제스처를 동시에 인식하면, 가상편곡부(163)는 인식된 오른손의 선택 제스처에 따라 특정 트랙을 선택하고, 인식된 왼손의 지휘 제스처에 따라 오른손에 의해 선택된 볼륨, 박자, 템포 및 연주법을 조절할 수 있다. 일례로, 도 18에 도시된 바와 같이, 제스처인식부(161)가 제스처 B4와 같이, 어느 하나의 트랙 이미지(Track 1)를 소정 시간 이상 가리키는 선택 제스처를 감지하고, 제스처 B5 혹은 B6과 같이, 왼손을 통해 손바닥을 내리거나, 올리는 선택 제스처를 인식하면, 가상편곡부(163)는 인식된 오른손의 선택 제스처에 따라 해당 트랙(Track 1)을 선택하고, 인식된 왼손의 제스처에 따라 오른손에 의해 선택된 트랙(Track 1)의 볼륨을 내리거나 올려 재생할 수 있다. According to another embodiment, when the gesture recognition unit 161 simultaneously recognizes the left hand command gesture and the right hand select gesture, the virtual arrangement unit 163 selects a specific track according to the recognized right hand select gesture, and recognizes the recognized track. You can adjust the volume, beat, tempo, and playing method selected by the right hand according to the left hand's commanding gesture. As an example, as illustrated in FIG. 18, the gesture recognition unit 161 detects a selection gesture indicating a certain track image (Track 1) for a predetermined time or longer, such as gesture B4, and as gestures B5 or B6, When recognizing the selection gesture of lowering or raising the palm through the left hand, the virtual arrangement unit 163 selects the corresponding track (Track 1) according to the recognized selection gesture of the right hand, and is selected by the right hand according to the recognized gesture of the left hand. The volume of the selected track (Track 1) can be turned up or down to play.

한편, S250 단계의 판단 결과, 제스처인식부(161)가 인식한 제스처가 지휘 제스처가 아니면, 가상편곡부(163)는 S270 단계에서 제스처인식부(161)가 인식한 제스처가 버튼 선택 제스처인지 여부를 판별한다. 이러한 S270 단계의 판별 결과, 제스처인식부(161)가 인식한 제스처가 버튼 선택 제스처이면, 가상편곡부(163)는 S280 단계에서 해당 제스처에 따라 선택된 버튼에 할당된 기능을 수행한다. 버튼 선택 제스처에 따라 버튼에 할당된 기능을 수행하는 방법이 도 19 및 도 20에 도시되었다. Meanwhile, as a result of the determination in step S250, if the gesture recognized by the gesture recognition unit 161 is not a command gesture, the virtual arrangement unit 163 determines whether the gesture recognized by the gesture recognition unit 161 in step S270 is a button selection gesture. To discriminate. As a result of the determination in step S270, if the gesture recognized by the gesture recognition unit 161 is a button selection gesture, the virtual arrangement unit 163 performs a function assigned to the button selected according to the corresponding gesture in step S280. 19 and 20 show a method of performing a function assigned to a button according to a button selection gesture.

도 19를 참조하면, 제스처 F1과 같이, 제스처인식부(161)가 스틱을 통해 어느 하나의 버튼(BT1)을 소정 시간 이상 가리키는 사용자의 버튼 선택 제스처를 감지하면, 가상편곡부(163)는 해당 버튼(BT1)에 할당된 기능, 즉, 빨리감기(Fast Forward) 기능을 수행할 수 있다. 이러한 재생 제어 기능은 일시멈충(Pause), 되감기(Rewind), 재생(Play) 등을 포함한다. Referring to FIG. 19, when the gesture recognition unit 161 detects a button selection gesture of a user pointing a certain button BT1 over a predetermined time through a stick, as in the gesture F1, the virtual arrangement unit 163 corresponds A function assigned to the button BT1, that is, a fast forward function may be performed. The playback control functions include pause, rewind, and play.

또한, 제스처 F2와 같이, 제스처인식부(161)가 스틱을 통해 어느 하나의 버튼(BT2)을 소정 시간 이상 가리키는 사용자의 버튼 선택 제스처를 감지하면, 가상편곡부(163)는 해당 버튼(BT2)에 할당된 기능, 즉, 연주법을 스타카토(STACCATO)로 변경하여 재생할 수 있다. In addition, as in the gesture F2, when the gesture recognition unit 161 detects a button selection gesture of a user pointing any one button BT2 through a stick for a predetermined time or longer, the virtual arrangement unit 163 applies the corresponding button BT2. You can play by changing the function assigned to, that is, the playing method to STACCATO.

도 20을 참조하면, 제스처 F3과 같이, 제스처인식부(161)가 소정의 버튼에 대응하여 미리 결정된 버튼 선택 제스처의 궤적을 감지하면, 가상편곡부(163)는 해당 버튼(BT2)에 할당된 기능, 즉, 연주법을 스타카토(STACCATO)로 변경하여 재생할 수 있다. Referring to FIG. 20, as in gesture F3, when the gesture recognition unit 161 detects a trajectory of a predetermined button selection gesture corresponding to a predetermined button, the virtual arrangement unit 163 is assigned to the corresponding button BT2. The function, that is, the playing method can be changed to STACCATO and played.

한편, S240 단계, S260 단계 및 S280 단계를 수행한 후, 가상편곡부(163)는 S290 단계로 진행한다. 또한, S270 단계의 판단 결과, 제스처인식부(161)가 인식한 제스처가 버튼 선택 제스처가 아니면, 가상편곡부(163)는 S290 단계로 진행한다. On the other hand, after performing steps S240, S260 and S280, the virtual arrangement unit 163 proceeds to step S290. In addition, as a result of the determination in step S270, if the gesture recognized by the gesture recognition unit 161 is not a button selection gesture, the virtual arrangement unit 163 proceeds to step S290.

S290 단계에서 가상편곡부(163)는 재생 중인 미디 음악의 재생이 종료되었는지 여부를 판단한다. S290 단계의 판단 결과, 미디 음악의 재생이 종료되지 않은 경우, 앞서 설명된 S220 단계 내지 S280 단계를 반복한다. 반면, S290 단계의 판단 결과, 미디 음악의 재생이 종료된 경우, 가상편곡부(163)는 S300 단계에서 앞서 제스처에 따라 변경된 미디 음악, 즉, 편곡된 미디 음악을 저장부(150)에 저장한다. In step S290, the virtual arrangement unit 163 determines whether playback of the MIDI music being played is finished. As a result of the determination in step S290, if the playback of the MIDI music has not ended, steps S220 to S280 described above are repeated. On the other hand, as a result of the determination in step S290, when the playback of the MIDI music is finished, the virtual arrangement unit 163 stores the MIDI music changed according to the gesture in step S300, that is, the arranged MIDI music in the storage unit 150. .

앞서 설명된 본 발명의 실시예에 따른 방법은 다양한 컴퓨터수단을 통하여 판독 가능한 프로그램 형태로 구현되어 컴퓨터로 판독 가능한 기록매체에 기록될 수 있다. 여기서, 기록매체는 프로그램 명령, 데이터 파일, 데이터구조 등을 단독으로 또는 조합하여 포함할 수 있다. 기록매체에 기록되는 프로그램 명령은 본 발명을 위하여 특별히 설계되고 구성된 것들이거나 컴퓨터 소프트웨어 당업자에게 공지되어 사용 가능한 것일 수도 있다. 예컨대 기록매체는 하드 디스크, 플로피 디스크 및 자기 테이프와 같은 자기 매체(magnetic media), CD-ROM, DVD와 같은 광 기록 매체(optical media), 플롭티컬 디스크(floptical disk)와 같은 자기-광 매체(magneto-optical media), 및 롬(ROM), 램(RAM), 플래시 메모리 등과 같은 프로그램 명령을 저장하고 수행하도록 특별히 구성된 하드웨어 장치를 포함한다. 프로그램 명령의 예에는 컴파일러에 의해 만들어지는 것과 같은 기계어 와이어뿐만 아니라 인터프리터 등을 사용해서 컴퓨터에 의해서 실행될 수 있는 고급 언어 와이어를 포함할 수 있다. 이러한 하드웨어 장치는 본 발명의 동작을 수행하기 위해 하나 이상의 소프트웨어 모듈로서 작동하도록 구성될 수 있으며, 그 역도 마찬가지이다. The method according to the embodiment of the present invention described above may be implemented in a form of a program readable through various computer means and recorded on a computer-readable recording medium. Here, the recording medium may include program instructions, data files, data structures, or the like alone or in combination. The program instructions recorded on the recording medium may be specially designed and configured for the present invention, or may be known and available to those skilled in computer software. For example, the recording medium includes magnetic media such as hard disks, floppy disks, and magnetic tapes, optical media such as CD-ROMs, DVDs, and magnetic-optical media such as floptical disks. magneto-optical media, and hardware devices specifically configured to store and execute program instructions such as ROM, RAM, flash memory, and the like. Examples of program instructions may include high-level language wires that can be executed by a computer using an interpreter, as well as machine language wires such as those produced by a compiler. Such a hardware device can be configured to operate as one or more software modules to perform the operation of the present invention, and vice versa.

이상 본 발명을 몇 가지 바람직한 실시예를 사용하여 설명하였으나, 이들 실시예는 예시적인 것이며 한정적인 것이 아니다. 이와 같이, 본 발명이 속하는 기술분야에서 통상의 지식을 지닌 자라면 본 발명의 사상과 첨부된 특허청구범위에 제시된 권리범위에서 벗어나지 않으면서 균등론에 따라 다양한 변화와 수정을 가할 수 있음을 이해할 것이다. Although the present invention has been described above using some preferred examples, these examples are illustrative and not restrictive. As described above, those skilled in the art to which the present invention pertains will understand that various changes and modifications can be made according to the theory of equality without departing from the spirit of the present invention and the scope of the rights set forth in the appended claims.

10: 미디음악편곡시스템 100: 가상편곡장치
110: 영사부 120: 오디오부
130: 센서부 140: 통신부
150: 저장부 160: 제어부
161: 제스처인식부 163: 가상편곡부
200: 카메라장치 210: 통신모듈
220: 카메라모듈
10: MIDI music arrangement system 100: virtual arrangement device
110: projection unit 120: audio unit
130: sensor unit 140: communication unit
150: storage unit 160: control unit
161: gesture recognition unit 163: virtual arrangement unit
200: camera device 210: communication module
220: camera module

Claims (15)

미디 음악을 편곡하기 위한 장치에 있어서,
카메라장치를 통해 사용자의 제스처를 촬영한 제스처 영상을 수신하는 통신부;
미디 음악의 복수의 트랙에 대응하는 악기 이미지를 시각화한 가상 영상을 영사하는 영사부;
상기 제스처 영상의 3차원 좌표를 상기 가상 영상의 3차원 좌표로 변환한 후, 변환된 3차원 좌표에 따라 사용자의 제스처를 인식하는 제스처인식부; 및
상기 미디 음악을 재생하는 중 상기 인식된 사용자의 제스처에 따라 상기 미디 음악의 복수의 트랙을 편곡하는 가상편곡부;를 포함하는 것을 특징으로 하는 미디 음악을 편곡하기 위한 장치.
A device for arranging MIDI music,
A communication unit that receives a gesture image of a user's gesture through a camera device;
A projection unit for projecting a virtual image visualizing a musical instrument image corresponding to a plurality of tracks of MIDI music;
A gesture recognition unit that converts the 3D coordinates of the gesture image into 3D coordinates of the virtual image, and then recognizes the user's gesture according to the converted 3D coordinates; And
And a virtual arranging unit for arranging a plurality of tracks of the MIDI music according to the recognized user's gesture while playing the MIDI music.
제1항에 있어서,
상기 가상 영상은
가상의 무대와, 상기 가상의 무대에 배치되며, 상기 미디 음악의 복수의 트랙 각각에 대응하는 복수의 트랙 이미지와, 상기 미디 음악의 복수의 트랙 전체에 대응하는 전체 트랙 이미지와, 상기 가상의 무대의 테두리에 배치되는 버튼 이미지를 포함하며,
상기 트랙 이미지는
상기 트랙을 연주하는 악기를 나타내는 악기 이미지, 상기 트랙을 재생하는 볼륨의 크기를 나타내는 볼륨 이미지 및 상기 트랙이 선택되었는지 여부를 나타내는 선택 이미지를 포함하는 것을 특징으로 하는 미디 음악을 편곡하기 위한 장치.
According to claim 1,
The virtual image
A virtual stage, a plurality of track images disposed on the virtual stage, and corresponding to each of a plurality of tracks of the MIDI music, a whole track image corresponding to the entire plurality of tracks of the MIDI music, and the virtual stage Contains a button image that is placed on the border of,
The track image
And an instrument image representing an instrument playing the track, a volume image representing the size of the volume playing the track, and a selection image representing whether the track is selected.
제2항에 있어서,
상기 제스처인식부가
상기 복수의 트랙 이미지 및 상기 전체 트랙 이미지 중 적어도 하나의 트랙을 선택하거나, 선택 해제하는 상기 사용자의 제스처를 인식하면,
상기 가상편곡부는
상기 인식된 사용자의 제스처에 따라 적어도 하나의 트랙을 선택하거나, 선택 해제하는 것을 특징으로 하는 미디 음악을 편곡하기 위한 장치.
According to claim 2,
The gesture recognition unit
Recognizing the gesture of the user to select or deselect at least one track of the plurality of track images and the entire track image,
The virtual arrangement section
And selecting or deselecting at least one track according to the recognized user's gesture.
제2항에 있어서,
상기 제스처인식부가
지휘 제스처의 궤적의 방향이 변경되는 변곡점인 비트포인트의 수를 인식하면,
상기 가상편곡부는
상기 비트포인트의 수에 따라 상기 재생 중인 미디 음악의 박자를 변경하는 것을 특징으로 하는 미디 음악을 편곡하기 위한 장치.
According to claim 2,
The gesture recognition unit
Recognizing the number of bit points, which are inflection points that change the direction of the trajectory of the command gesture,
The virtual arrangement section
A device for arranging MIDI music, characterized in that the beat of the MIDI music being played is changed according to the number of bitpoints.
제2항에 있어서,
상기 제스처인식부가
한 번의 지휘 제스처가 완성되는 데에 소요되는 시간을 통해 지휘 제스처의 속도를 산출하면,
상기 가상편곡부는
상기 산출된 속도에 따라 상기 재생 중인 미디 음악의 템포를 변경하여 재생하는 것을 특징으로 하는 미디 음악을 편곡하기 위한 장치.
According to claim 2,
The gesture recognition unit
Calculating the speed of a command gesture from the time it takes to complete one command gesture,
The virtual arrangement section
A device for arranging MIDI music, characterized in that the tempo of the MIDI music being played is changed and played according to the calculated speed.
제2항에 있어서,
상기 제스처인식부가
한 번의 지휘 제스처를 이루는 궤적의 총 길이를 N, 상기 궤적 상의 지점을 x, 지점 x에서의 제스처 속도를 s(x)라 할 때,
지휘 제스처의 궤적 중 비트포인트에서의 속도와 비트포인트 이외의 구간의 속도의 차이 D를
수학식
Figure 112018062316348-pat00004
을 통해 산출하면,
상기 가상편곡부는
산출된 속도의 차이에 따라 상기 재생 중인 미디 음악의 연주법을 변경하여 재생하는 것을 특징으로 하는 미디 음악을 편곡하기 위한 장치.
According to claim 2,
The gesture recognition unit
When the total length of the trajectory forming one command gesture is N, the point on the trajectory is x, and the gesture speed at point x is s(x),
The difference D between the speed at the bit point and the speed of the section other than the bit point among the trajectory of the command gesture
Equation
Figure 112018062316348-pat00004
Calculating through,
The virtual arrangement section
A device for arranging MIDI music, characterized in that the playing method of the MIDI music being played is changed and played according to a difference in the calculated speed.
제2항에 있어서,
상기 제스처인식부가
한 번의 지휘 제스처에서 인식되는 복수의 비트포인트 중 2 이상의 비트포인트 간의 거리를 통해 지휘 제스처의 크기를 산출하면,
상기 가상편곡부는
산출된 크기에 따라 상기 재생 중인 미디 음악의 볼륨을 변경하여 재생하는 것을 특징으로 하는 미디 음악을 편곡하기 위한 장치.
According to claim 2,
The gesture recognition unit
If the size of the command gesture is calculated through the distance between two or more bit points among the plurality of bit points recognized in one command gesture,
The virtual arrangement section
The apparatus for arranging MIDI music, characterized in that the volume of the MIDI music being played is changed and played according to the calculated size.
제1항에 있어서,
복수의 악기 이미지를 저장하는 저장부를 더 포함하며,
상기 가상편곡부는
상기 미디 음악에서 복수의 트랙 각각에 대한 악기 정보를 추출하고,
상기 저장부에 복수의 악기 이미지 중 상기 미디 음악의 각 트랙의 악기 정보에 대응하는 악기 이미지가 존재하는지 여부를 판단하고,
상기 트랙의 악기 정보에 대응하는 악기 이미지가 존재하면, 상기 대응하는 악기 이미지를 선택하고,
상기 트랙의 악기 정보에 대응하는 악기 이미지가 존재하지 않으면, 해당 트랙을 재생하여 재생된 오디오 신호와
상기 저장부에 저장된 복수의 악기 이미지에 대응하는 가상 악기의 오디오 신호를 비교하여 오디오 신호의 유사도가 가장 높은 가상 악기의 악기 이미지를 선택하고,
선택된 악기 이미지를 이용하여 복수의 트랙을 시각화하여 상기 가상 영상을 생성하는 것을 특징으로 하는 미디 음악을 편곡하기 위한 장치.
According to claim 1,
Further comprising a storage unit for storing a plurality of musical instrument images,
The virtual arrangement section
Extract musical instrument information for each of a plurality of tracks from the MIDI music,
It is determined whether or not there is a musical instrument image corresponding to musical instrument information of each track of the MIDI music among a plurality of musical instrument images in the storage unit,
If an instrument image corresponding to the instrument information of the track exists, the corresponding instrument image is selected,
If the instrument image corresponding to the instrument information of the track does not exist, the audio signal reproduced by playing the corresponding track and
Comparing the audio signal of the virtual instrument corresponding to the plurality of instrument images stored in the storage unit to select the instrument image of the virtual instrument having the highest similarity of the audio signal,
Apparatus for arranging MIDI music, characterized by generating a virtual image by visualizing a plurality of tracks using a selected instrument image.
미디 음악을 편곡하기 위한 방법에 있어서,
미디 음악의 복수의 트랙에 대응하는 악기 이미지를 시각화한 가상 영상을 생성하고, 생성된 가상 영상을 영사하는 단계;
상기 미디 음악을 재생하는 단계;
카메라장치를 통해 사용자의 제스처를 촬영한 제스처 영상을 수신하는 단계; 및
상기 제스처 영상의 3차원 좌표를 상기 가상 영상의 3차원 좌표로 변환한 후, 변환된 3차원 좌표에 따라 사용자의 제스처를 인식하고, 상기 인식된 사용자의 제스처에 따라 상기 미디 음악을 편곡하는 단계;를 포함하는 것을 특징으로 하는 미디 음악을 편곡하기 위한 방법.
In the method for arranging MIDI music,
Generating a virtual image visualizing a musical instrument image corresponding to a plurality of tracks of MIDI music, and projecting the generated virtual image;
Playing the MIDI music;
Receiving a gesture image of a user's gesture through a camera device; And
Converting the three-dimensional coordinates of the gesture image into three-dimensional coordinates of the virtual image, recognizing the user's gesture according to the converted three-dimensional coordinates, and arranging the MIDI music according to the recognized user's gesture; Method for arranging MIDI music, characterized in that it comprises a.
제9항에 있어서,
상기 미디 음악을 편곡하는 단계는
지휘 제스처의 궤적의 방향이 변경되는 변곡점인 비트포인트의 수를 인식하면, 상기 비트포인트의 수에 따라 상기 재생 중인 미디 음악의 박자를 변경하는 것을 특징으로 하는 미디 음악을 편곡하기 위한 방법.
The method of claim 9,
Arranging the MIDI music is
A method for arranging MIDI music characterized by changing the beat of the MIDI music being played according to the number of bitpoints when recognizing the number of bitpoints, which are inflection points in which the direction of the trajectory of the command gesture is changed.
제9항에 있어서,
상기 미디 음악을 편곡하는 단계는
한 번의 지휘 제스처가 완성되는 데에 소요되는 시간을 통해 지휘 제스처의 속도를 산출하면, 상기 산출된 속도에 따라 상기 재생 중인 미디 음악의 템포를 변경하여 재생하는 것을 특징으로 하는 미디 음악을 편곡하기 위한 방법.
The method of claim 9,
Arranging the MIDI music is
If the speed of the command gesture is calculated through the time required to complete one command gesture, the tempo of the playing MIDI music is changed and played according to the calculated speed. Way.
제9항에 있어서,
상기 미디 음악을 편곡하는 단계는
한 번의 지휘 제스처를 이루는 궤적의 총 길이를 N, 상기 궤적 상의 지점을 x, 지점 x에서의 제스처 속도를 s(x)라 할 때,
지휘 제스처의 궤적 중 비트포인트에서의 속도와 비트포인트 이외의 구간의 속도의 차이 D를
수학식
Figure 112018062316348-pat00005
을 통해 산출하면,
산출된 속도의 차이에 따라 상기 재생 중인 미디 음악의 연주법을 변경하여 재생하는 것을 특징으로 하는 미디 음악을 편곡하기 위한 방법.
The method of claim 9,
Arranging the MIDI music is
When the total length of the trajectory forming one command gesture is N, the point on the trajectory is x, and the gesture speed at point x is s(x),
The difference D between the speed at the bit point and the speed of the section other than the bit point among the trajectory of the command gesture
Equation
Figure 112018062316348-pat00005
Calculating through,
A method for arranging MIDI music, characterized in that the playing method of the MIDI music being played is changed and played according to the difference in the calculated speed.
제9항에 있어서,
상기 미디 음악을 편곡하는 단계는
한 번의 지휘 제스처에서 인식되는 복수의 비트포인트 중 2 이상의 비트포인트 간의 거리를 통해 지휘 제스처의 크기를 산출하면, 산출된 크기에 따라 상기 재생 중인 미디 음악의 볼륨을 변경하여 재생하는 것을 특징으로 하는 미디 음악을 편곡하기 위한 방법.
The method of claim 9,
Arranging the MIDI music is
If the size of the commanding gesture is calculated through the distance between two or more bitpoints among a plurality of bitpoints recognized in one commanding gesture, a MIDI characterized in that the volume of the playing MIDI music is changed and played according to the calculated size. Method for arranging music.
제9항에 있어서,
상기 가상 영상을 영사하는 단계는
상기 미디 음악에서 복수의 트랙 각각에 대한 악기 정보를 추출하는 단계;
기 저장된 복수의 악기 이미지 중 상기 미디 음악의 각 트랙의 악기 정보에 대응하는 악기 이미지가 존재하는지 여부를 판단하는 단계;
상기 판단 결과, 상기 트랙의 악기 정보에 대응하는 악기 이미지가 존재하면, 상기 대응하는 악기 이미지를 선택하고, 상기 판단 결과, 상기 트랙의 악기 정보에 대응하는 악기 이미지가 존재하지 않으면, 해당 트랙을 재생하여 재생된 오디오 신호와 기 저장된 복수의 악기 이미지에 대응하는 가상 악기의 오디오 신호를 비교하여 오디오 신호의 유사도가 가장 높은 가상 악기의 악기 이미지를 선택하는 단계;
상기 선택된 악기 이미지를 이용하여 복수의 트랙을 시각화하여 상기 가상 영상을 생성하는 단계;를 포함하는 것을 특징으로 하는 미디 음악을 편곡하기 위한 방법.
The method of claim 9,
The step of projecting the virtual image
Extracting musical instrument information for each of a plurality of tracks from the MIDI music;
Determining whether an instrument image corresponding to instrument information of each track of the MIDI music exists among a plurality of pre-stored instrument images;
As a result of the determination, if an instrument image corresponding to the instrument information of the track exists, the corresponding instrument image is selected. If the instrument image corresponding to the instrument information of the track does not exist as a result of the determination, the corresponding track is played. Comparing the audio signal reproduced by comparing the audio signal of the virtual instrument corresponding to a plurality of pre-stored instrument image to select the instrument image of the virtual instrument having the highest similarity of the audio signal;
And generating the virtual image by visualizing a plurality of tracks by using the selected instrument image.
미디 음악을 편곡하기 위한 방법을 수행하는 프로그램이 기록된 컴퓨터 판독 가능한 기록매체에 있어서,
미디 음악의 복수의 트랙에 대응하는 악기 이미지를 시각화한 가상 영상을 생성하고, 생성된 가상 영상을 영사하는 단계;
상기 미디 음악을 재생하는 단계;
카메라장치를 통해 사용자의 제스처를 촬영한 제스처 영상을 수신하는 단계; 및
상기 제스처 영상의 3차원 좌표를 상기 가상 영상의 3차원 좌표로 변환한 후, 변환된 3차원 좌표에 따라 사용자의 제스처를 인식하고, 상기 인식된 사용자의 제스처에 따라 상기 미디 음악을 편곡하는 단계;를 포함하는 것을 특징으로 하는 미디 음악을 편곡하기 위한 방법을 수행하는 프로그램이 기록된 컴퓨터 판독 가능한 기록매체.
A computer-readable recording medium in which a program for performing a method for arranging MIDI music is recorded,
Generating a virtual image visualizing a musical instrument image corresponding to a plurality of tracks of MIDI music, and projecting the generated virtual image;
Playing the MIDI music;
Receiving a gesture image of a user's gesture through a camera device; And
Converting the three-dimensional coordinates of the gesture image into three-dimensional coordinates of the virtual image, recognizing the user's gesture according to the converted three-dimensional coordinates, and arranging the MIDI music according to the recognized user's gesture; A computer readable recording medium in which a program for performing a method for arranging MIDI music is recorded.
KR1020180073014A 2018-06-25 2018-06-25 An apparatus for arranging MIDI music based on virtual instrument visualization, method thereof and computer recordable medium storing program to perform the method KR102128315B1 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020180073014A KR102128315B1 (en) 2018-06-25 2018-06-25 An apparatus for arranging MIDI music based on virtual instrument visualization, method thereof and computer recordable medium storing program to perform the method

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020180073014A KR102128315B1 (en) 2018-06-25 2018-06-25 An apparatus for arranging MIDI music based on virtual instrument visualization, method thereof and computer recordable medium storing program to perform the method

Publications (2)

Publication Number Publication Date
KR20200000763A KR20200000763A (en) 2020-01-03
KR102128315B1 true KR102128315B1 (en) 2020-06-30

Family

ID=69155731

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020180073014A KR102128315B1 (en) 2018-06-25 2018-06-25 An apparatus for arranging MIDI music based on virtual instrument visualization, method thereof and computer recordable medium storing program to perform the method

Country Status (1)

Country Link
KR (1) KR102128315B1 (en)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111428075A (en) * 2020-03-23 2020-07-17 王爽 Method for matching music composition through gesture track input

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2015210350A (en) 2014-04-25 2015-11-24 カシオ計算機株式会社 Musical performance device, musical performance method and program
KR101815973B1 (en) 2016-06-10 2018-01-08 재단법인 실감교류인체감응솔루션연구단 Menu sharing system in 3-dimensional shared space and method thereof

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP1959429A4 (en) 2005-12-09 2011-08-31 Sony Corp Music edit device and music edit method
KR20170019242A (en) * 2015-08-11 2017-02-21 삼성전자주식회사 Method and apparatus for providing user interface in an electronic device

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2015210350A (en) 2014-04-25 2015-11-24 カシオ計算機株式会社 Musical performance device, musical performance method and program
KR101815973B1 (en) 2016-06-10 2018-01-08 재단법인 실감교류인체감응솔루션연구단 Menu sharing system in 3-dimensional shared space and method thereof

Also Published As

Publication number Publication date
KR20200000763A (en) 2020-01-03

Similar Documents

Publication Publication Date Title
US9529566B2 (en) Interactive content creation
JP6887422B2 (en) Head posture mixing of audio files
KR101263686B1 (en) Karaoke system and apparatus using augmented reality, karaoke service method thereof
US8536437B2 (en) Musical score playing device and musical score playing program
JP4627052B2 (en) Audio output method and apparatus linked to image
US7893339B2 (en) Audio reproduction apparatus and method and storage medium
JP5319750B2 (en) GAME DEVICE, GAME DEVICE CONTROL METHOD, AND PROGRAM
JP2018063295A (en) Performance control method and performance control device
JP5742163B2 (en) Information processing terminal and setting control system
KR102128315B1 (en) An apparatus for arranging MIDI music based on virtual instrument visualization, method thereof and computer recordable medium storing program to perform the method
CN111933098A (en) Method and device for generating accompaniment music and computer readable storage medium
KR101267247B1 (en) Karaoke apparatus and karaoke service method using augmented reality marker-based
JP4409545B2 (en) Three-dimensional position specifying device and method, depth position specifying device
JP5803172B2 (en) Evaluation device
JP2000276138A (en) Music sound controller
JPWO2011030760A1 (en) Music game system capable of outputting text and computer-readable storage medium storing computer program thereof
Tanaka et al. MubuFunkScatShare: gestural energy and shared interactive music
US20130106689A1 (en) Methods of operating systems having optical input devices
JP4765705B2 (en) Music control device
KR101212019B1 (en) Karaoke system for producing music signal dynamically from wireless electronic percurssion
JP2006208959A (en) Karaoke playing apparatus
JP6149917B2 (en) Speech synthesis apparatus and speech synthesis method
JP2006091631A (en) System and program for managing musical performance practice
JP2014089475A (en) Voice synthesizer and program
KR102314025B1 (en) Media server and computer program product

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant