KR102156912B1

KR102156912B1 - 동영상 내 포함된 음원에 대한 검색 서비스 제공 방법 및 이를 이용하는 서버

Info

Publication number: KR102156912B1
Application number: KR1020180079007A
Authority: KR
Inventors: 유장한; 유성욱; 김대황
Original assignee: 네이버 주식회사
Priority date: 2018-07-06
Filing date: 2018-07-06
Publication date: 2020-10-23
Also published as: KR20200005359A

Abstract

본 출원은 동영상 내 포함된 음원에 대한 검색 서비스 제공 방법 및 이를 이용하는 서버에 관한 것으로서, 본 발명의 일 실시예에 의한 동영상 내 포함된 음원에 대한 검색 서비스 제공 방법은, 검색서버가 수행하는, 동영상 내 포함된 음원에 대한 검색 서비스 제공 방법으로, 사용자 단말로부터 특정 동영상에 삽입된 음원에 대한 검색요청을 수신하는 단계; 동영상과 상기 동영상에 삽입된 음원이 서로 매칭된 매칭 데이터베이스를 이용하여, 상기 특정 동영상에 대응하는 음원을 검색하는 단계; 및 상기 검색된 음원을 상기 사용자 단말에게 제공하는 단계를 포함할 수 있다.

Description

동영상 내 포함된 음원에 대한 검색 서비스 제공 방법 및 이를 이용하는 서버 {Method for providing search service for music included in a motion piture and server using the same}

본 출원은, 광고영상 등 동영상에 삽입된 음원을 정확하게 검색할 수 있는, 동영상 내 포함된 음원에 대한 검색 서비스 제공 방법 및 이를 이용하는 서버에 관한 것이다.

최근 인터넷을 통해 음악을 제공하는 것은 물론, 음악에 대한 다양한 정보를 제공하는 서비스가 활발하게 제공되고 있다. 사용자들은 음악 서비스사로부터 자신이 원하는 음악을 검색하여 스트림서비스를 제공받거나, 음원 파일을 다운로드받아 자신의 휴대재생장치에 저장하고 필요한 경우 이를 검색하여 사용한다.

따라서, 다양한 장르의 음악은 물론 이에 해당하는 음악정보를 제공하기 위해서 음악정보를 제공하는 서비스 시스템에서는, 음악검색 및 다양한 형태의 음악정보 등을 효과적으로 제공하기 위하여 음악 리듬 추출, 음악 데이터의 인덱싱 방법을 통한 음악 데이터 베이스 구축 및 검색 등에 대한 연구가 다양한 방법으로 이루어지고 있다.

종래의 음악정보 검색 시스템은, 검색어를 사용자가 입력하여 찾는 것이 일반적이었다. 따라서, 곡명을 잘 모르거나, 막연하게 선호하는 음악을 찾고자 하는 경우 사용자는 어려움을 겪게 된다. 또한, 광고영상 등 동영상에 포함된 음악을 찾고자 하는 경우에는, 사용자가 해당 음악에 대해 얻을 수 있는 정보가 제한되므로, 기존의 음악정보 검색 시스템만으로는 찾기 어려웠다.

본 출원은, 광고영상 등 동영상에 삽입된 음원을 정확하게 검색할 수 있는, 동영상 내 포함된 음원에 대한 검색 서비스 제공 방법 및 이를 이용하는 서버를 제공하고자 한다.

본 출원은, 동영상에서 추출한 음원을 복수의 단위구간으로 구별한 후, 각각의 단위구간에 대한 음악인식 결과를 이용하여 검색결과를 제공함으로써, 검색의 정확도 및 신뢰도를 높일 수 있는, 동영상 내 포함된 음원에 대한 검색 서비스 제공 방법 및 이를 이용하는 서버를 제공하고자 한다.

본 발명의 일 실시예에 의한 동영상 내 포함된 음원에 대한 검색 서비스 제공 방법은, 서버가 수행하는, 동영상 내 포함된 음원에 대한 검색 서비스 제공 방법에 관한 것으로서, 사용자 단말로부터 특정 동영상에 삽입된 음원에 대한 검색요청을 수신하는 단계; 동영상과 상기 동영상에 삽입된 음원이 서로 매칭된 매칭 데이터베이스를 이용하여, 상기 특정 동영상에 대응하는 음원을 검색하는 단계; 및 상기 검색된 음원을 상기 사용자 단말에게 제공하는 단계를 포함할 수 있다.

본 발명의 일 실시예에 의한 서버는, 사용자 단말로부터, 특정 동영상에 삽입된 음원에 대한 검색요청을 수신하는 검색요청수신부; 동영상과 상기 동영상에 삽입된 음원이 서로 매칭된 매칭 데이터베이스를 이용하여, 상기 특정 동영상에 대응하는 음원을 검색하는 검색부; 및 상기 검색된 음원을 상기 사용자 단말에게 제공하는 결과표시부를 포함할 수 있다.

본 발명의 다른 실시예에 의한 서버는, 프로세서; 및 상기 프로세서에 커플링된 메모리를 포함하는 것으로서, 상기 메모리는 상기 프로세서에 의하여 실행되도록 구성되는 하나 이상의 모듈을 포함하고, 상기 하나 이상의 모듈은, 사용자 단말로부터 특정 동영상에 삽입된 음원에 대한 검색요청을 수신하는, 동영상과 상기 동영상에 삽입된 음원이 서로 매칭된 매칭 데이터베이스를 이용하여, 상기 특정 동영상에 대응하는 음원을 검색하며, 상기 검색된 음원을 상기 사용자 단말에게 제공하는, 명령어를 포함할 수 있다.

덧붙여 상기한 과제의 해결수단은, 본 발명의 특징을 모두 열거한 것이 아니다. 본 발명의 다양한 특징과 그에 따른 장점과 효과는 아래의 구체적인 실시형태를 참조하여 보다 상세하게 이해될 수 있을 것이다.

본 발명의 일 실시예에 의한 동영상 내 포함된 음원에 대한 검색 서비스 제공 방법 및 이를 이용하는 서버에 의하면, 광고영상 등 동영상에 삽입된 음원을 정확하게 검색할 수 있다.

본 발명의 일 실시예에 의한 동영상 내 포함된 음원에 대한 검색 서비스 제공 방법 및 이를 이용하는 서버에 의하면, 동영상에서 추출한 음원을 복수의 단위구간으로 구별한 후, 각각의 단위구간에 대한 음악인식 결과를 이용하여 검색결과를 제공하므로, 검색의 정확도 및 신뢰도를 높일 수 있다.

다만, 본 발명의 실시예들에 따른 동영상 내 포함된 음원에 대한 검색 서비스 제공 방법 및 이를 이용하는 서버가 달성할 수 있는 효과는 이상에서 언급한 것들로 제한되지 않으며, 언급하지 않은 또 다른 효과들은 아래의 기재로부터 본 발명이 속하는 기술분야에서 통상의 지식을 가진 자에게 명확하게 이해될 수 있을 것이다.

도1은 본 발명의 일 실시예에 의한 동영상 내 포함된 음원에 대한 검색 서비스 제공 시스템을 나타내는 개략도이다.
도2 및 도3은 본 발명의 일 실시예에 의한 서버를 나타내는 블록도이다.
도4는 본 발명의 일 실시예에 의한 동영상 연계 음원 데이터베이스 생성을 나타내는 개략도이다.
도5는 본 발명의 일 실시예에 의한 결과 제공 인터페이스를 나타내는 개략도이다.
도6은 본 발명의 일 실시예에 의한 동영상 내 포함된 음원에 대한 검색 서비스 제공 방법을 나타내는 순서도이다.

이하, 첨부된 도면을 참조하여 본 명세서에 개시된 실시 예를 상세히 설명하되, 도면 부호에 관계없이 동일하거나 유사한 구성요소는 동일한 참조 번호를 부여하고 이에 대한 중복되는 설명은 생략하기로 한다. 이하의 설명에서 사용되는 구성요소에 대한 접미사 "모듈" 및 "부"는 명세서 작성의 용이함만이 고려되어 부여되거나 혼용되는 것으로서, 그 자체로 서로 구별되는 의미 또는 역할을 갖는 것은 아니다. 즉, 본 발명에서 사용되는 '부'라는 용어는 소프트웨어, FPGA 또는 ASIC과 같은 하드웨어 구성요소를 의미하며, '부'는 어떤 역할들을 수행한다. 그렇지만 '부'는 소프트웨어 또는 하드웨어에 한정되는 의미는 아니다. '부'는 어드레싱할 수 있는 저장 매체에 있도록 구성될 수도 있고 하나 또는 그 이상의 프로세서들을 재생시키도록 구성될 수도 있다. 따라서, 일 예로서 '부'는 소프트웨어 구성요소들, 객체지향 소프트웨어 구성요소들, 클래스 구성요소들 및 태스크 구성요소들과 같은 구성요소들과, 프로세스들, 함수들, 속성들, 프로시저들, 서브루틴들, 프로그램 코드의 세그먼트들, 드라이버들, 펌웨어, 마이크로 코드, 회로, 데이터, 데이터베이스, 데이터 구조들, 테이블들, 어레이들 및 변수들을 포함한다. 구성요소들과 '부'들 안에서 제공되는 기능은 더 작은 수의 구성요소들 및 '부'들로 결합되거나 추가적인 구성요소들과 '부'들로 더 분리될 수 있다.

또한, 본 명세서에 개시된 실시 예를 설명함에 있어서 관련된 공지 기술에 대한 구체적인 설명이 본 명세서에 개시된 실시 예의 요지를 흐릴 수 있다고 판단되는 경우 그 상세한 설명을 생략한다. 또한, 첨부된 도면은 본 명세서에 개시된 실시 예를 쉽게 이해할 수 있도록 하기 위한 것일 뿐, 첨부된 도면에 의해 본 명세서에 개시된 기술적 사상이 제한되지 않으며, 본 발명의 사상 및 기술 범위에 포함되는 모든 변경, 균등물 내지 대체물을 포함하는 것으로 이해되어야 한다.

도1은 본 발명의 일 실시예에 의한 동영상 내 포함된 음원에 대한 검색 서비스 제공 시스템을 나타내는 개략도이다.

도1을 참조하면 본 발명의 일 실시예에 의한 동영상 내 포함된 음원에 대한 검색 서비스 제공 시스템은, 사용자 단말(1) 및 서버(100)를 포함할 수 있다.

이하, 도1을 참조하여 본 발명의 일 실시예에 의한 동영상 내 포함된 음원에 대한 검색 서비스 제공 시스템을 설명한다.

사용자 단말(1)은 사용자가 사용하는 단말장치로, 사용자 단말(1)은 유선 또는 무선 통신망을 이용하여 서버(100) 등과 통신을 수행할 수 있다. 여기서, 사용자 단말(1)은 UE(User Equipment), MS(Mobile Station), MSS(Mobile Subscriber Station), SS(Subscriber Station), AMS(Advanced Mobile Station), WT(Wireless terminal), MTC(Machine-Type Communication) 장치, M2M(Machine-to-Machine) 장치, D2D 장치(Device-to-Device), 스테이션(STA: Station) 등의 용어에 의해 대체될 수 있다.

사용자 단말(1)은 유선 또는 무선 통신망을 통해 음성 또는 데이터 통신을 수행할 수 있으며, 사용자 단말(1)은 정보의 송수신을 위한 브라우저, 프로그램 및 프로토콜을 저장하는 메모리, 각종 프로그램을 실행하여 연산 및 제어하기 위한 마이크로프로세서 등을 구비할 수 있다.

본 발명의 일 실시예에 따른 사용자 단말(1)은 다양한 형태로 구현될 수 있다. 예를들어, 사용자 단말(1)은 스마트 폰(smart phone), 타블렛 PC(Tablet PC), 노트북, PDA(Personal Digital Assistants), PMP(Portable Multimedia Player), MP3 Player, 웨어러블 디바이스(wearable device, 예를 들어, 워치형 단말기 (smartwatch), 글래스형 단말기 (smart glass), HMD(head mounted display)) 등의 무선 통신 기술이 적용되는 이동 단말기 또는 PC, IPTV, 스마트 TV, 음성인식 스피커 등과 같이 휴대하기 어려운 디지털 기기일 수 있다.

사용자 단말(1)과 서버(100)는 통신 네트워크를 통해 서로 연결될 수 있다. 통신 네트워크는 유선 네트워크와 무선 네트워크를 포함할 수 있으며, 구체적으로, 근거리 네트워크(LAN: Local Area Network), 도시권 네트워크(MAN: Metropolitan Area Network), 광역 네트워크(WAN: Wide Area Network) 등 다양한 네트워크를 포함할 수 있다. 또한, 통신 네트워크는 공지의 월드 와이드 웹(WWW: World Wide Web)을 포함할 수도 있다. 그러나, 본 발명에 따른 통신 네트워크는 상기 열거된 네트워크에 국한되지 않고, 공지의 무선 데이터 네트워크, 공지의 전화 네트워크, 공지의 유/무선 텔레비전 네트워크 중 적어도 하나를 포함할 수도 있다.

사용자 단말(1)은 서버(100)로부터 제공받은 정보를 기반으로 사용자에게 서비스를 제공할 수 있다. 일 예로, 서버(100)가 웹 서버인 경우, 사용자 단말(1)은 서버(100)로부터 제공받은 컨텐츠를 기반으로 웹 서비스를 제공할 수 있다. 또한, 실시예에 따라서는, 사용자가 사용자 단말(1)을 이용하여, 서버(100)가 제공하는 검색 사이트에 접속하거나 검색 전용 어플리케이션을 실행할 수 있으며, 이를 통하여 사용자에게 뉴스, 음악 등 다양한 검색 서비스를 제공하는 것도 가능하다.

서버(100)는 서비스 제공 서버로서, 동영상 내에 포함되는 음원에 대한 검색 서비스를 비롯하여 다양한 검색 서비스를 사용자 단말(1)에 제공할 수 있다. 서버(100)는 사용자에게 검색서비스를 제공하기 위해 다양한 종류의 데이터베이스를 구비할 수 있으며, 데이터베이스와의 통신을 통하여 사용자의 검색요청에 대응하는 결과를 도출하여 제공할 수 있다. 여기서, 데이터베이스는 서버(100) 내에 구비될 수 있으며, 실시예에 따라서는 서버(100)와 유선 또는 무선 네트워크를 통하여 연결될 수 있다.

서버(100)는 Web Applicatoin Server(WAS), Internet Information Server(IIS) 또는 ApacheTomcat 또는 Nginx를 사용하는 인터넷 상의 공지의 웹 서버(Web Server) 또는 캐시 서버(Cashe Server)일 수 있다. 또한, 웹 서버(200)는 Linux 또는 Windows와 같은 OS(operating system)을 지원하며, 수신된 제어명령을 실행할 수 있다. 소프트웨어적으로는 C, C++, Java, Visual Basic, Visual C 등과 같은 언어를 통하여 구현되는 프로그램 모듈(Module)을 포함할 수 있다.

사용자는 광고영상에 포함된 음원을 궁금해하거나 이에 대한 정보를 얻고자 할 수 있다. 일반적으로, 음원에 대한 검색 서비스를 제공할 때, 가수나 노래 제목 등에 의한 검색을 제공하지만, 광고영상 등에 삽입된 음원에 대한 정보를 제공하는 것이 어려웠다. 즉, 종래에는 특정 광고영상에 포함된 음원에 대해 검색하면, 타인이 블로그나 웹 사이트에 업로드한 결과를 검색하여 제공하였으나, 그에 대한 신뢰도 등이 담보되지는 않았다.

반면에, 본 발명의 일 실시예에 의한 검색 서비스 제공 시스템에 의하면, 사용자가 요청하는 동영상 내에 삽입된 음원에 대한 검색을 서버(100)에서 제공할 수 있으므로, 정확하고 신뢰성있는 검색결과를 사용자에게 제공하는 것이 가능하다.

도2는 본 발명의 일 실시예에 의한 서버를 나타내는 블록도이다.

도2를 참조하면, 본 발명의 일 실시예에 의한 서버(100)는 DB 생성부(110), 검색요청수신부(120), 검색부(130) 및 결과표시부(140)를 포함할 수 있다.

이하 도2를 참조하여 본 발명의 일 실시예에 의한 서버를 설명한다.

DB(database) 생성부(110)는 음원과, 음원이 삽입된 동영상들을 매칭하여 매칭 데이터베이스를 생성할 수 있다. 구체적으로, DB 생성부(110)는 동영상 데이터베이스로부터 복수의 동영상들을 제공받을 수 있으며, 각각의 동영상에 삽입된 음향신호를 추출할 수 있다. 이후, 음향신호에 대응하는 음원을 음원 데이터베이스에서 검색할 수 있으며, 검색된 음원과 동영상을 매칭하여 매칭 데이터베이스를 생성할 수 있다.

실시예에 따라서는, 음원 데이터베이스에 포함된 음원의 메타 데이터에 동영상에 대한 연계정보를 포함하여 저장할 수 있다. 즉, 다양한 음원들이 저장된 음원 데이터베이스에, 각각의 음원이 사용된 동영상들을 연계하여 저장함으로써, 매칭 데이터베이스를 생성할 수 있다. 여기서, 매칭 데이터베이스에는 각각의 음원에 대한 정보와 함께, 해당 음원이 사용된 동영상들에 대한 정보가 메타 데이터로 저장되므로, 매칭 데이터베이스를 이용하면 각각의 동영상에 삽입된 음원을 추출하는 것이 가능하다.

또한, 실시예에 따라서는, 동영상 데이터베이스에 포함된 동영상의 메타 데이터에, 동영상에 매칭된 음원에 대한 연계정보를 더 포함하여 저장하는 것도 가능하다. 즉, 다양한 동영상들이 저장된 동영상 데이터베이스에, 각각의 동영상 내에 포함된 음원들을 연계하여 저장함으로써, 매칭 데이터베이스를 생성할 수 있다. 이 경우, 매칭 데이터베이스에는 각각의 동영상에 대한 정보와 함께, 해당 동영상 내에 삽입된 음원들에 대한 정보가 메타 데이터로 저장되므로, 매칭 데이터베이스를 이용하면 각각의 동영상에 삽입된 음원을 추출할 수 있다.

구체적으로, 도4(a)에 도시한 바와 같이, DB 생성부(110)는 동영상(v) 내 포함된 음원의 음향신호(m)를 추출할 수 있다. 여기서, 동영상(v)은 동영상 데이터베이스를 구비한 별도의 동영상 서버로부터 제공받을 수 있으며, DB 생성부(110)는 FFMPEG 등의 프로그램을 이용하여 동영상(v) 내에 삽입된 음원의 음향신호(m)를 WAV 파일 등의 음원파일로 추출할 수 있다. 동영상 데이터베이스에는 광고주들로부터 제공받은 광고 동영상 등이 저장되어 있을 수 있으며, 실시예에 따라서는 광고 동영상 이외에 영화, 드라마 등의 컨텐츠가 저장된 동영상이나, UCC(User Created Contents) 등 다양한 종류의 동영상들이 저장되어 있을 수 있다.

이후, 도4(b)에 도시한 바와 같이, DB 생성부(110)는 동영상(v)에서 추출한 음향신호(m)를 복수의 단위구간(s)으로 분리할 수 있다. DB 생성부(110)는 분리된 단위구간(s)을 이용하여 음악인식을 수행할 수 있으며, 음악인식을 통하여 각각의 단위구간(s)에 대응하는 후보음원(A, B, C, D)들을 음원 데이터베이스로부터 검색할 수 있다.

동영상(v) 내에 삽입된 음향신호(m)의 경우, 음원 이외에 인물들의 대사나 효과음 등 노이즈(noise)가 더 포함될 수 있다. 즉, 추출한 음향신호(m)를 직접 이용하여 음악인식 등을 수행하는 경우에는 노이즈에 의한 오류가 발생하여, 추출된 음원에 대한 검색 정확도가 낮아질 수 있다. 따라서, DB 생성부(110)에서는 추출한 음향신호(m)를 복수의 단위구간(s)으로 분리하고, 각각의 단위구간(s)에 대해 각각 음악인식을 수행할 수 있다. 이를 통하여 인물들의 대사나 효과음 등 노이즈에 의한 영향을 최소화하면서 동영상에 삽입된 음원에 대응하는 음원을 정확하게 검색할 수 있다.

여기서, 단위구간의 길이가 짧을수록 노이즈 제거에 유리하지만, 단위구간에 대응하는 음원에 대한 인식률이 낮아질 수 있다. 반면에, 단위구간의 길이가 길어질수록 인식률이 높아지므로 정확한 음원 인식이 가능하다. 따라서, DB 생성부(110)에서는, 노이즈와 인식률을 고려하여, 단위시간의 길이를 적절히 조절할 수 있다. 실시예에 따라서는, 단위구간(s)은 3초의 시간간격으로 설정될 수 있다.

한편, DB 생성부(110)는 단위구간(s)에 포함된 박자나 멜로디 등을 추출하여, 단위구간(s)에 대응하는 박자나 멜로디 등을 포함하는 후보 음원들을 추출하는 방식으로 음악인식을 수행할 수 있다. 다만, 짧은 시간간격의 단위구간(s)에 나타나는 박자나 멜로디만으로는 하나의 음원을 특정하기 어려울 수 있으며, 도4(b)에 도시한 바와 같이, 각각의 단위구간에 대하여 개별적으로 복수의 후보음원들을 추출할 수 있다.

이 경우, DB 생성부(110)는 단위구간(s) 별로 검색된 복수의 후보 음원(A, B, C, D)들 중에서, 이웃하는 단위구간과 연속하는 후보 음원들은 서로 그룹핑(g1, g2, g3)할 수 있다. 즉, 연속하는 단위구간에 포함된 후보 음원들 중에서 동일한 후보 음원이 있으면 하나의 그룹으로 그룹핑할 수 있다. 다만, 복수의 단위구간 중에서 노이즈가 심하게 포함된 단위구간이 존재할 수 있으며, 이 경우에는 해당 단위구간을 제외하고 그룹핑할 수 있다. 즉, 노이즈가 일정값 이상 포함된 단위구간에서의 음악인식결과는 정확한 결과가 반영된 것으로 볼 수 없으므로, 해당 단위구간은 제외하고 나머지 단위구간들에 대한 그룹핑을 수행할 수 있다.

이후, 그룹핑한 후보 음원(g1, g2, g3)들 중에서, 설정개수 이상의 단위구간동안 연속하는 후보 음원을 추출할 수 있으며, 추출된 후보 음원을 해당 동영상(v)에 삽입된 음원으로 설정할 수 있다. 즉, 설정개수가 3개인 경우, 도4(b)에서는, 3개의 연속된 단위구간에서 동일한 후보 음원이 검색된 그룹 g1의 후보음원 A를 동영상(v)의 음원으로 설정할 수 있다.

하나의 단위구간(s)에 대해 음악인식을 수행하는 경우, 단위구간(s) 내에 포함된 노이즈 등에 의하여 정확도가 떨어질 수 있다. 반면에, DB 생성부(110)에서는 서로 다른 복수의 단위구간(s)에 대해 수행한 음악인식결과를 취합하여 음원을 설정하므로, 음원 설정의 정확도를 높일 수 있다. 즉, 각각의 단위구간(s)에서 음악인식을 반복하여 수행하므로, 일부 단위구간(s)에서는 노이즈 등에 의하여 음악인식이 잘못 수행될 수도 있으나, 연속된 단위구간(s)에서 동일하게 하나의 후보 음원을 추출한 경우에는, 해당 후보 음원이 실제 동영상(v)에 삽입된 음원에 해당할 가능성이 매우 높은 것으로 판별할 수 있다. 따라서, DB 생성부(110)는 그룹핑한 후보 음원(g1, g2, g3)들 중에서, 설정개수 이상의 단위구간동안 연속하는 후보 음원을 동영상(v)에 삽입된 음원으로 설정할 수 있다.

실시예에 따라서는, 설정개수 이상의 단위구간동안 연속하는 후보 음원들이 복수개 존재하는 경우도 존재할 수 있다. 예를들어, 설정개수가 2개인 경우에는, 도4(b)의 후보 음원 A, B, D는 모두 설정개수 이상의 단위구간동안 연속하는 경우에 해당한다. 이 경우, DB 생성부(110)는 설정개수 이상의 단위구간에서 연속하는 후보음원들을 모두 동영상에 삽입된 음원으로 설정할 수 있다. 다만, 실시예에 따라서는 연속되는 단위구간이 가장 많은 후보 음원을 음원으로 설정하도록 하는 것도 가능하다. 즉, 도4(b)에서 후보 음원 A, B, D는 모두 설정개수 2개 이상의 단위구간에서 연속하고 있으나, 후보 음원 A는 3개의 단위구간에서 연속하고 있으므로, 연속되는 단위구간이 가장 많은 경우에 해당한다. 따라서, 후보 음원 A를 해당 샘플 동영상(v)의 음원으로 설정할 수 있다.

또한, 실시예에 따라서는, 연속되는 단위구간의 개수가 가장 많은 후보 음원들이 복수개인 경우도 존재할 수 있다. 예를들어, 도4(b)에서 후보 음원 A가 검색되지 않은 경우로 가정하면, 후보 음원 C와 후보 음원 D가 연속되는 단위구간(s) 개수가 가장 많은 후보 음원에 해당하는 동시에, 연속되는 단위구간의 개수도 2개로 동일하게 된다. 이 경우, DB 생성부(110)는 음향신호(m)에 포함된 전체 단위구간(s)에서 후보 음원이 검색된 단위구간의 개수가 더 많은 후보 음원을, 동영상(v)에 삽입된 음원으로 설정할 수 있다. 즉, 도4(b)를 참조하면, 후보음원 c는 전체 단위구간에서 2개가 포함되지만, 후보 음원 D는 3개 포함되어 있음을 확인할 수 있다. 따라서, DB 생성부(110)는 후보 음원 D를 동영상(v)에 포함된음원으로 설정할 수 있다.

동영상에 대한 음원이 설정되면, DB 생성부(110)는 매칭된 음원과 동영상을 저장하여 매칭 데이터베이스를 생성할 수 있다. 즉, 매칭 데이터베이스에는 각각의 음원에 대한 메타 데이터에 해당 음원이 삽입된 동영상에 대한 연계정보가 저장되거나, 각각의 동영상에 대한 메타 데이터에 해당 동영상에 삽입된 음원에 대한 연계정보가 저장될 수 있다. 여기서, 연계정보는 동영상 또는 음원에 대응하는 키워드 등일 수 있다. 예를들어, 음원에 대해 저장되는 연계정보는, 해당 음원이 삽입된 동영상의 제목이나 제작자, 출연진 등일 수 있으며, 동영상이 광고영상인 경우에는 연계정보로 광고대상인 상품 또는 서비스의 명칭, 상호 등이 포함될 수 있다. 또한, 동영상에 대해 저장되는 연계정보는, 해당 동영상에 삽입된 음원의 곡명이나 음반명, 가수, 음반사 등일 수 있다. 따라서, 연계정보를 이용하여, 각각의 음원 또는 동영상에 매칭된 음원이나 동영상들을 각각 검색하는 것이 가능하다.

실시예에 따라서는, 음원 데이터베이스에 포함된 음원의 메타 데이터에 동영상에 대한 연계정보를 더 포함하도록 업데이트하거나, 동영상 데이터베이스에 포함된 동영상의 메타 데이터에 음원에 대한 연계정보를 더 포함하도록 업데이트하여, 매칭 데이터베이스를 생성하는 것도 가능하다.

검색요청수신부(120)는 사용자 단말(1)로부터 특정 동영상에 삽입된 음원에 대한 검색요청을 수신할 수 있다. 사용자는 검색요청을 사용자 단말(1)에 문자열 또는 음성으로 입력할 수 있으며, 검색요청수신부(120)는 사용자 단말(1)을 통하여 전달받은 문자열 또는 음성으로부터, 사용자의 검색요청을 인식할 수 있다. 이후, 검색요청수신부(120)는 검색요청에 대응하여, 검색부(130)로 특정 동영상에 삽입된 음원을 검색하도록 요청할 수 있다.

검색요청에는 특정 동영상에 대응하는 키워드와, 삽입된 음원에 대한 키워드의 조합이 포함될 수 있다. 따라서, 검색요청수신부(120)는 사용자 단말(1)로부터 수신한 문자열이나 음성에 상기 키워드의 조합이 포함되면, 검색요청을 수신한 것으로 판별할 수 있다. 구체적으로, 특정 동영상에 대응하는 키워드는 "제품명", "서비스 명칭", "제조사 명칭" 등을 포함하고, 삽입된 음원에 대응하는 키워드는 "광고 음악", "삽입 음악", "음악" 등을 포함할 수 있다. 예를들어, "OO침대 광고음악", "AA 텔레콤 광고 음악" 등의 키워드를 포함하는 검색요청이 입력되는 경우에는, 각각 OO침대, AA 텔레콤의 광고영상이라는 특정 동영상에 삽입된 음원에 대한 검색을 요청한 것으로 판별할 수 있다.

한편, 문자열은 사용자가 사용자 단말(1)에 구비된 키보드 자판 또는 가상 키보드를 이용하여 입력한 것일 수 있으며, 음성은 사용자 단말(1)에 구비된 마이크를 이용하여 입력한 것일 수 있다.

여기서, 음성이 입력되는 경우에는, 검색요청수신부(120)가 음성인식을 이용하여 음성을 문자열로 변환할 수 있다. 검색요청수신부(120)에는 음성모델 데이터베이스 등이 구비되어 있을 수 있으며, 음성모델 데이터베이스에는 각각의 문자에 대응하는 표준음성패턴이 저장되어 있을 수 있다. 입력되는 음성은 전기신호 형태의 음성신호로 변환될 수 있으며, 음성신호를 음성모델 데이터베이스에 저장된 표준음성패턴과 비교할 수 있다. 이후, 각각의 음성신호에 대응하는 표준음성패턴을 추출하여 대응하는 문자로 변환할 수 있으며, 변환된 문자들을 결합하여 문자열을 생성할 수 있다. 다만, 음성을 문자로 변환하는 방식은 이에 한정되는 것은 아니며, 이외에도 다양한 방식으로 음성을 문자로 변환할 수 있다.

검색부(130)는 음원과 음원이 삽입된 동영상들이 매칭된 매칭 데이터베이스를 이용하여, 특정 동영상에 대응하는 음원을 검색할 수 있다. 검색부(130)는 검색요청수신부(120)에서 수신한 검색요청으로부터, 특정 동영상에 대한 키워드를 추출할 수 있으며, 키워드를 이용하여 매칭 데이터베이스에 저장된 연계 데이터와 비교할 수 있다. 이후, 매칭 데이터베이스로부터, 키워드에 대응하는 연계 데이터를 가지는 음원을 추출할 수 있다.

결과표시부(140)는 검색된 음원을 사용자 단말(1)에게 제공할 수 있다. 여기서, 음원을 제공하기 위한 사용자 인터페이스가 미리 설정되어 있을 수 있으며, 설정된 사용자 인터페이스를 통하여 검색된 음원을 사용자 단말(1)에게 제공할 수 있다.

실시예에 따라서는, 도5에 도시한 바와 같이, 사용자 인터페이스를 설정하여 사용자 단말(1)에게 제공할 수 있다. 구체적으로, 사용자 인터페이스에는 음원표시영역(r1), 동영상표시영역(r2) 및 추쳔영상 표시영역(r3)이 포함될 수 있다.

음원표시영역(r1)에는 음원에 대한 정보를 표시할 수 있다. 즉, 음원이 삽입된 특정 동영상의 명칭과, 삽입된 음원의 제목과 가수 등이 표시될 수 있다. 예를들어, "OO 침대 광고에 포함된 음악"을 검색한 경우에는, 특정 동영상의 명칭으로 "OO 침대 CF 음악"이 표시될 수 있으며, 삽입된 음원의 제목과 가수가 각각 "warm on a cold night"와 "honne"로 표시될 수 있다. 여기서, 음원표시영역(r1)에는 검색된 음원을 재생할 수 있는 음원재생 프로그램도 함께 제공하여, 사용자가 검색한 음원을 감상하도록 할 수 있다.

동영상표시영역(r2)에는 특정 동영상이 표시되도록 하여, 사용자가 검색하고자 한 특정동영상을 확인하도록 할 수 있다. 즉, "OO 침대 광고에 포함된 음악"을 검색한 경우에는, "OO 침대"의 광고영상을 제공할 수 있다. 여기서, 특정 동영상을 재생할 수 있는 동영상재생 프로그램도 함께 제공하여, 사용자가 특정 동영상을 감상할 수 있도록 할 수 있다. 여기서, 특정 동영상은 동영상 데이터베이스에서 제공받아 표시할 수 있다.

추천영상 표시영역(r3)에는 특정 동영상에 대응하는 추천 동영상들을 표시할 수 있다. 즉, 특정 동영상과 관련있는 다양한 동영상을 추출하여 함께 볼만한 동영상으로 제공할 수 있다. 실시예에 따라서는, 특정 동영상이 시리즈물의 하나인 경우가 있을 수 있으며, 이 경우, 추천영상 표시영역(r3)에는 동일한 시리즈물에 포함되는 다른 회차의 시리즈를 추천영상 표시영역에 표시할 수 있다. 예를들어, 특정 동영상이 광고영상이고 해당 광고영상이 시리즈물로 제작되어 방영된 경우에는, 도5에 도시한 바와 같이, 다른 버전의 시리즈들이 추천 동영상으로 표시될 수 있다. 또한, 특정 동영상이 전체 8회차의 드라마 중에서 1회차에 해당하는 경우에는, 추천영상 표시영역(r3)에는 나머지 2회 내지 8회차에 해당하는 동영상이 추천 동영상으로 표시될 수 있다.

여기서, 도5에 도시된 사용자 인터페이스는 일 실시예에 해당하며, 결과표시부(140)가 제공하는 사용자 인터페이스는 이에 한정되는 것은 아니다. 결과표시부(140)는 이외에도 다양한 방법으로 검색된 음원을 사용자 단말(1)에게 제공할 수 있다.

한편, 도3에 도시한 바와 같이, 본 발명의 일 실시예에 의한 서버(100)는, 프로세서(10), 메모리(40) 등의 물리적인 구성을 포함할 수 있으며, 메모리(40) 내에는 프로세서(10)에 의하여 실행되도록 구성되는 하나 이상의 모듈이 포함될 수 있다. 구체적으로, 하나 이상의 모듈에는, DB 생성모듈, 검색요청수신모듈, 검색모듈 및 결과표시모듈 등이 포함될 수 있다.

프로세서(10)는, 다양한 소프트웨어 프로그램과, 메모리(40)에 저장되어 있는 명령어 집합을 실행하여 여러 기능을 수행하고 데이터를 처리하는 기능을 수행할 수 있다. 주변인터페이스부(30)는, 컴퓨터 장치의 입출력 주변 장치를 프로세서(10), 메모리(40)에 연결할 수 있으며, 메모리 제어기(20)는 프로세서(10)나 컴퓨터 장치의 구성요소가 메모리(40)에 접근하는 경우에, 메모리 액세스를 제어하는 기능을 수행할 수 있다. 실시예에 따라서는, 프로세서(10), 메모리 제어기(20) 및 주변인터페이스부(30)를 단일 칩 상에 구현하거나, 별개의 칩으로 구현할 수 있다.

메모리(40)는 고속 랜덤 액세스 메모리, 하나 이상의 자기 디스크 저장 장치, 플래시 메모리 장치와 같은 불휘발성 메모리 등을 포함할 수 있다. 또한, 메모리(40)는 프로세서(10)로부터 떨어져 위치하는 저장장치나, 인터넷 등의 통신 네트워크를 통하여 엑세스되는 네트워크 부착형 저장장치 등을 더 포함할 수 있다.

도3에 도시한 바와 같이, 본 발명의 일 실시예에 의한 서버(100)는, 메모리(40)에 운영체제를 비롯하여, 응용프로그램에 해당하는 DB 생성모듈, 검색요청수신모듈, 검색모듈 및 결과표시모듈 등을 포함할 수 있다. 여기서, 각각의 모듈들은 상술한 기능을 수행하기 위한 명령어의 집합으로, 메모리(40)에 저장될 수 있다.

따라서, 본 발명의 일 실시예에 의한 서버(100)는, 프로세서(10)가 메모리(40)에 액세스하여 각각의 모듈에 대응하는 명령어를 실행할 수 있다. 다만, DB 생성모듈, 검색요청수신모듈, 검색모듈 및 결과표시모듈은 상술한 DB 생성부, 검색요청수신부, 검색부 및 결과표시부에 각각 대응하므로 여기서는 자세한 설명을 생략한다.

도6은 본 발명의 일 실시예에 의한 동영상 내 포함된 음원에 대한 검색 서비스 제공 방법을 나타내는 순서도이다.

도6을 참조하면 본 발명의 일 실시예에 의한 동영상 내 포함된 음원에 대한 검색 서비스 제공 방법은, DB 생성 단계(S10), 검색요청 수신단계(S20), 검색단계(S30) 및 결과표시단계(S40)를 포함할 수 있다. 여기서, 각각의 단계들은 서버에 의하여 수행될 수 있다.

이하, 도6을 참조하여 본 발명의 일 실시예에 의한 동영상 내 포함된 음원에 대한 검색 서비스 제공 방법을 설명한다.

DB 생성 단계(S10)에서는, 음원과, 음원이 삽입된 동영상들을 매칭하여 매칭 데이터베이스를 생성할 수 있다. 구체적으로, 동영상 데이터베이스로부터 복수의 동영상들을 제공받을 수 있으며, 각각의 동영상에 삽입된 음향신호를 추출할 수 있다. 이후, 음향신호에 대응하는 음원을 음원 데이터베이스에서 검색하고, 검색된 음원과 동영상을 매칭하여 매칭 데이터베이스를 생성할 수 있다.

실시예에 따라서는, DB 생성 단계(S10)를 복수의 단계로 구분할 수 있다. 구체적으로, 동영상 내 삽입된 적어도 하나의 음원에 대응하는 음향신호를 추출하는 단계를 수행할 수 있다. 여기서 동영상은 동영상 데이터베이스를 구비한 별도의 동영상 서버로부터 제공받을 수 있으며, FFMPEG 등의 프로그램을 이용하여 동영상 내에 삽입된 음향신호를 WAV 파일 등의 음원파일로 추출할 수 있다. 이때, 동영상은 광고 동영상, 영화, 드라마, UCC(User Created Contents) 등일 수 있다.

이후, 음향신호를 복수의 단위구간으로 분리하고, 각각의 단위구간에 음악인식을 적용하여, 음원 데이터베이스로부터 대응하는 후보음원을 검색하는 단계를 수행할 수 있다. 동영상 내에 삽입된 음향신호에는, 음원 이외에 인물들의 대사나 효과음 등의 노이즈(noise) 더 포함될 수 있다. 즉, 음향신호를 직접 이용하여 음악인식 등을 수행하는 경우에는 노이즈에 의한 오류가 발생하여, 추출된 음원에 대한 검색 정확도가 낮아질 수 있다. 따라서, 음향신호를 복수의 단위구간으로 분리하고, 단위구간에 대해 각각 음악인식을 수행할 수 있다. 이때, 단위구간의 길이는 노이즈와 인식률에 따라 적절히 선택될 수 있다.

후보음원을 검색한 이후에는, 단위구간 별로 검색된 복수의 후보 음원들 중에서, 이웃하는 단위구간에서 연속으로 검색된 후보 음원들을 각각 그룹핑하는 단계를 수행할 수 있다. 즉, 연속하는 단위구간에 포함된 후보 음원들 중에서 동일한 후보 음원이 있으면 하나의 그룹으로 그룹핑할 수 있다. 다만, 복수의 단위구간 중에서 노이즈가 심하게 포함된 단위구간이 존재할 수 있으며, 이 경우 해당 단위구간은 제외하고 그룹핑할 수 있다.

이후, 그룹핑한 후보 음원들 중에서, 설정개수 이상의 단위구간동안 연속하는 후보 음원을 추출할 수 있으며, 추출된 후보 음원을 음원으로 설정하는 단계를 수행할 수 있다. 즉, 동일한 후보 음원이 설정개수 이상 연속하여 단위구간에서 추출된 경우에는 해당 후보 음원이 정확하게 추출된 것으로 볼 수 있으므로, 해당 동영상에 대응하는 음원으로 설정할 수 있다.

한편, 설정개수 이상의 단위구간동안 연속하는 후보 음원들이 복수개 존재하는 경우도 존재할 수 있다. 이 경우, 설정개수 이상의 단위구간에서 연속하는 후보음원들을 모두 동영상에 삽입된 음원으로 설정할 수 있으며, 실시예에 따라서는, 연속되는 단위구간이 가장 많은 후보 음원을 동영상에 삽입된 음원으로 설정하도록 할 수 있다. 또한, 실시예에 따라서는, 연속되는 단위구간의 개수가 가장 많은 후보 음원들이 복수개인 경우도 존재할 수 있다. 이때에는, 음향신호에 포함된 전체 단위구간에서 후보 음원이 검색된 단위구간의 개수가 더 많은 후보 음원을, 동영상에 삽입된 음원으로 설정할 수 있다.

이후, 동영상에 삽입된 음원이 매칭되면, 서로 매칭된 동영상과 음원을 저장하여 매칭 데이터베이스를 생성할 수 있다.

즉, 매칭 데이터베이스에는 각각의 음원에 대한 메타 데이터에 해당 음원이 삽입된 동영상에 대한 연계정보가 저장되거나, 각각의 동영상에 대한 메타 데이터에 해당 동영상에 삽입된 음원에 대한 연계정보가 저장될 수 있다.

여기서, 연계정보는 동영상 또는 음원에 대응하는 키워드 등일 수 있다. 예를들어, 음원에 대해 저장되는 연계정보는, 해당 음원이 삽입된 동영상의 제목이나 제작자, 출연진 등일 수 있으며, 동영상이 광고영상인 경우에는 연계정보로 광고대상인 상품 또는 서비스의 명칭, 상호 등이 포함될 수 있다. 또한, 동영상에 대해 저장되는 연계정보는, 해당 동영상에 삽입된 음원의 곡명이나 음반명, 가수, 음반사 등일 수 있다. 따라서, 연계정보를 이용하여, 각각의 음원 또는 동영상에 매칭된 음원 또는 동영상들을 각각 검색하는 것이 가능하다.

검색요청 수신단계(S20)에서는, 사용자 단말로부터 특정 동영상에 삽입된 음원에 대한 검색요청을 수신할 수 있다. 검색요청 수신단계(S20)에서는 사용자 단말을 통하여 전달받은 문자열 또는 음성으로부터, 사용자의 검색요청을 인식할 수 있으며, 검색요청에 대응하여 특정 동영상에 삽입된 음원을 검색하도록 요청할 수 있다. 여기서, 검색요청에는 특정 동영상에 대응하는 키워드와, 삽입된 음원에 대한 키워드의 조합이 포함될 수 있다. 상기 키워드의 조합으로부터, 특정 동영상에 삽입된 음원에 대한 검색요청을 수신한 것으로 판별할 수 있다.

한편, 문자열은 사용자가 사용자 단말에 구비된 키보드 자판 또는 가상 키보드를 이용하여 입력한 것일 수 있으며, 음성은 사용자 단말에 구비된 마이크를 이용하여 입력한 것일 수 있다. 여기서, 음성이 입력되는 경우에는, 음성인식을 이용하여 음성을 문자열로 변환할 수 있다.

검색단계(S30)에서는, 동영상과 상기 동영상에 삽입된 음원이 서로 매칭된 매칭 데이터베이스를 이용하여, 특정 동영상에 대응하는 음원을 검색할 수 있다. 검색요청으로부터 특정 동영상에 대한 키워드를 추출할 수 있으며, 해당 키워드를 이용하여 매칭 데이터베이스에 저장된 연계 데이터와 비교할 수 있다. 이후, 매칭 데이터베이스로부터, 키워드에 대응하는 연계 데이터를 가지는 음원을 추출할 수 있다.

결과표시단계(S40)에서는, 검색된 음원을 사용자 단말에게 제공할 수 있다. 여기서, 음원을 제공하기 위한 사용자 인터페이스가 미리 설정되어 있을 수 있으며, 설정된 사용자 인터페이스를 통하여 검색된 음원을 사용자 단말에게 제공할 수 있다. 실시예에 따라서는, 음원을 표시하는 음원표시영역, 특정 동영상을 표시하는 동영상표시영역 및 특정 동영상에 대응하는 추천 동영상을 표시하는 추천영상 표시영역 등을 포함하는 사용자 인터페이스를 제공할 수 있다. 여기서, 특정 동영상이 시리즈물 중의 하나인 경우에는, 추천 영상 표시 영역에 시리즈물에 포함되는 다른 시리즈에 해당하는 동영상들이 표시될 수 있다.

전술한 본 발명은, 프로그램이 기록된 매체에 컴퓨터가 읽을 수 있는 코드로서 구현하는 것이 가능하다. 컴퓨터가 읽을 수 있는 매체는, 컴퓨터로 실행 가능한 프로그램을 계속 저장하거나, 실행 또는 다운로드를 위해 임시 저장하는 것일 수도 있다. 또한, 매체는 단일 또는 수개 하드웨어가 결합된 형태의 다양한 기록수단 또는 저장수단일 수 있는데, 어떤 컴퓨터 시스템에 직접 접속되는 매체에 한정되지 않고, 네트워크 상에 분산 존재하는 것일 수도 있다. 매체의 예시로는, 하드 디스크, 플로피 디스크 및 자기 테이프와 같은 자기 매체, CD-ROM 및 DVD와 같은 광기록 매체, 플롭티컬 디스크(floptical disk)와 같은 자기-광 매체(magneto-optical medium), 및 ROM, RAM, 플래시 메모리 등을 포함하여 프로그램 명령어가 저장되도록 구성된 것이 있을 수 있다. 또한, 다른 매체의 예시로, 애플리케이션을 유통하는 앱 스토어나 기타 다양한 소프트웨어를 공급 내지 유통하는 사이트, 서버 등에서 관리하는 기록매체 내지 저장매체도 들 수 있다. 따라서, 상기의 상세한 설명은 모든 면에서 제한적으로 해석되어서는 아니되고 예시적인 것으로 고려되어야 한다. 본 발명의 범위는 첨부된 청구항의 합리적 해석에 의해 결정되어야 하고, 본 발명의 등가적 범위 내에서의 모든 변경은 본 발명의 범위에 포함된다.

본 발명은 전술한 실시예 및 첨부된 도면에 의해 한정되는 것이 아니다. 본 발명이 속하는 기술분야에서 통상의 지식을 가진 자에게 있어, 본 발명의 기술적 사상을 벗어나지 않는 범위 내에서 본 발명에 따른 구성요소를 치환, 변형 및 변경할 수 있다는 것이 명백할 것이다.

1: 사용자 단말 100: 서버
110: DB 생성부 120: 검색요청수신부
130: 검색부 140: 결과표시부
S10: DB 생성단계 S20: 검색요청 수신단계
S30: 검색단계 S40: 결과표시단계

Claims

서버가 수행하는, 동영상 내 포함되는 음원에 대한 검색 서비스 제공 방법에 있어서,
동영상에 삽입된 음향신호를 추출하여, 음원 데이터베이스에서 상기음향신호에 대응하는 음원을 검색하고, 상기 검색된 음원과 상기 동영상을 매칭하여 매칭 데이터베이스를 생성하는 DB(Database)생성단계;
사용자 단말로부터 특정 동영상에 삽입된 음원에 대한 검색요청을 수신하는 단계;
동영상과 상기 동영상에 삽입된 음원이 서로 매칭된 매칭 데이터베이스를 이용하여, 상기 특정 동영상에 대응하는 음원을 검색하는 단계; 및
상기 검색된 음원을 상기 사용자 단말에게 제공하는 단계를 포함하는 것으로,
상기 DB 생성 단계는
동영상 데이터베이스로부터 제공받은 동영상으로부터, 상기 동영상 내 삽입된 적어도 하나의 음원에 대응하는 음향신호를 추출하는 단계;
상기 음향신호를 복수의 단위구간으로 분리하고, 각각의 단위구간에 음악인식을 적용하여, 상기 음원 데이터베이스로부터 대응하는 후보음원을 검색하는 단계;
상기 단위구간 별로 검색된 복수의 후보 음원들 중에서, 이웃하는 단위구간에서 연속으로 검색된 후보 음원들을 각각 그룹핑하는 단계; 및
상기 그룹핑한 후보 음원들 중에서, 설정개수 이상의 단위구간동안 연속하는 후보 음원을 추출하여, 상기 동영상의 음원으로 매칭하는 단계를 포함하는 것을 특징으로 하는, 동영상 내 포함되는 음원에 대한 검색 서비스 제공 방법.
제1항에 있어서, 상기 검색요청을 수신하는 단계는
상기 사용자 단말로부터, 상기 특정 동영상에 대응하는 키워드를 포함하는 문자열 또는 음성을 수신하는 것을 특징으로 하는 동영상 내 포함되는 음원에 대한 검색 서비스 제공 방법.
제1항에 있어서,
상기 동영상은 광고 영상이고, 상기 음원은 상기 광고 영상에서 사용된 광고음악인 것을 특징으로 하는 동영상 내 포함되는 음원에 대한 검색 서비스 제공 방법.
삭제
삭제
제1항에 있어서, 상기 그룹핑하는 단계는
상기 복수의 후보 음원 중에서, 노이즈가 심하여 후보음원이 검색되지 않거나 인식률이 낮은 단위구간은 제외하고, 그룹핑하는 것을 특징으로 하는 동영상 내 포함되는 음원에 대한 검색 서비스 제공 방법.
제1항에 있어서, 상기 동영상의 음원으로 매칭하는 단계는
상기 설정개수 이상의 단위구간동안 연속하는 후보 음원이 복수개 존재하는 경우에는, 연속되는 단위구간이 가장 많은 후보 음원을 상기 동영상의 음원으로 설정하는 것을 특징으로 하는 동영상 내 포함되는 음원에 대한 검색 서비스 제공 방법.
제7항에 있어서, 상기 동영상의 음원으로 매칭하는 단계는
상기 연속되는 단위구간이 가장 많은 후보 음원의 개수가 동일한 경우에는, 전체 단위구간에서 상기 후보 음원이 검색된 단위구간의 개수가 더 많은 후보 음원을 상기 동영상의 음원으로 설정하는 것을 특징으로 하는 동영상 내 포함되는 음원에 대한 검색 서비스 제공 방법.
제1항에 있어서, 상기 DB 생성 단계는
상기 동영상 데이터베이스에 포함된 동영상의 메타 데이터에, 상기 동영상에 매칭된 음원에 대한 연계정보를 더 포함하도록 업데이트하여, 상기 매칭 데이터베이스를 생성하는 것을 특징으로 하는 동영상 내 포함되는 음원에 대한 검색 서비스 제공 방법.
제1항에 있어서, 상기 DB 생성 단계는
상기 음원 데이터베이스에 포함된 음원의 메타 데이터에, 상기 동영상에 대한 연계정보를 더 포함하도록 업데이트하여, 상기 매칭 데이터베이스를 생성하는 것을 특징으로 하는 동영상 내 포함되는 음원에 대한 검색 서비스 제공 방법.
제1항에 있어서, 상기 사용자 단말에게 제공하는 단계는
상기 음원을 표시하는 음원표시영역, 상기 특정 동영상을 표시하는 동영상표시영역 및 상기 특정 동영상에 대응하는 추천 동영상을 표시하는 추천영상 표시영역를 포함하는 사용자 인터페이스를 제공하는 것을 특징으로 하는 동영상 내 포함되는 음원에 대한 검색 서비스 제공 방법.
제11항에 있어서, 상기 사용자 단말에게 제공하는 단계는
상기 특정 동영상이 시리즈물 중의 하나인 경우, 상기 추천 영상 표시 영역에 상기 시리즈물에 포함되는 다른 시리즈에 해당하는 동영상들을 표시하는 것을 특징으로 하는 동영상 내 포함되는 음원에 대한 검색 서비스 제공 방법.
하드웨어와 결합되어 제1항 내지 제3항, 제6항 내지 제12항 중 어느 한 항의 동영상 내 포함되는 음원에 대한 검색 서비스 제공 방법을 실행시키기 위하여 매체에 저장된 컴퓨터 프로그램.
동영상에 삽입된 음향신호를 추출하여, 음원 데이터베이스에서 상기 음향신호에 대응하는 음원을 검색하고, 상기 검색된 음원과 상기 동영상을 매칭하여 매칭 데이터베이스를 생성하는 DB(Database) 생성부;
사용자 단말로부터, 특정 동영상에 삽입된 음원에 대한 검색요청을 수신하는 검색요청수신부;
동영상과 상기 동영상에 삽입된 음원이 서로 매칭된 매칭 데이터베이스를 이용하여, 상기 특정 동영상에 대응하는 음원을 검색하는 검색부; 및
상기 검색된 음원을 상기 사용자 단말에게 제공하는 결과표시부를 포함하는 것으로,
상기 DB 생성부는
동영상 데이터베이스로부터 제공받은 동영상으로부터, 상기 동영상 내 삽입된 적어도 하나의 음원에 대응하는 음향신호를 추출하고,
상기 음향신호를 복수의 단위구간으로 분리하고, 각각의 단위구간에 음악인식을 적용하여, 상기 음원 데이터베이스로부터 대응하는 후보음원을 검색하며,
상기 단위구간 별로 검색된 복수의 후보 음원들 중에서, 이웃하는 단위구간에서 연속으로 검색된 후보 음원들을 각각 그룹핑한 후,
상기 그룹핑한 후보 음원들 중에서, 설정개수 이상의 단위구간동안 연속하는 후보 음원을 추출하여, 상기 동영상의 음원으로 매칭하는 것을 특징으로 하는 서버.
삭제