KR100838674B1 - 오디오 핑거프린팅 시스템 및 방법 - Google Patents

오디오 핑거프린팅 시스템 및 방법 Download PDF

Info

Publication number
KR100838674B1
KR100838674B1 KR1020067005805A KR20067005805A KR100838674B1 KR 100838674 B1 KR100838674 B1 KR 100838674B1 KR 1020067005805 A KR1020067005805 A KR 1020067005805A KR 20067005805 A KR20067005805 A KR 20067005805A KR 100838674 B1 KR100838674 B1 KR 100838674B1
Authority
KR
South Korea
Prior art keywords
audio
fingerprint
matrix
piece
class
Prior art date
Application number
KR1020067005805A
Other languages
English (en)
Other versions
KR20060095988A (ko
Inventor
프로드 홈
웬델 티. 히켄
Original Assignee
뮤직아이피 코포레이션
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 뮤직아이피 코포레이션 filed Critical 뮤직아이피 코포레이션
Publication of KR20060095988A publication Critical patent/KR20060095988A/ko
Application granted granted Critical
Publication of KR100838674B1 publication Critical patent/KR100838674B1/ko

Links

Images

Classifications

    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B27/00Editing; Indexing; Addressing; Timing or synchronising; Monitoring; Measuring tape travel
    • G11B27/10Indexing; Addressing; Timing or synchronising; Measuring tape travel
    • G11B27/19Indexing; Addressing; Timing or synchronising; Measuring tape travel by using information detectable on the record carrier
    • G11B27/28Indexing; Addressing; Timing or synchronising; Measuring tape travel by using information detectable on the record carrier by using information signals recorded by the same method as the main recording
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/60Information retrieval; Database structures therefor; File system structures therefor of audio data
    • G06F16/63Querying
    • G06F16/632Query formulation
    • G06F16/634Query by example, e.g. query by humming
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/60Information retrieval; Database structures therefor; File system structures therefor of audio data
    • G06F16/68Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • G06F16/683Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F17/00Digital computing or data processing equipment or methods, specially adapted for specific functions
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10TECHNICAL SUBJECTS COVERED BY FORMER USPC
    • Y10STECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10S707/00Data processing: database and file management or data structures
    • Y10S707/912Applications of a database
    • Y10S707/913Multimedia
    • Y10S707/916Audio
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10TECHNICAL SUBJECTS COVERED BY FORMER USPC
    • Y10STECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10S707/00Data processing: database and file management or data structures
    • Y10S707/99931Database or file accessing
    • Y10S707/99933Query processing, i.e. searching
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10TECHNICAL SUBJECTS COVERED BY FORMER USPC
    • Y10STECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10S707/00Data processing: database and file management or data structures
    • Y10S707/99931Database or file accessing
    • Y10S707/99939Privileged access
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10TECHNICAL SUBJECTS COVERED BY FORMER USPC
    • Y10STECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10S707/00Data processing: database and file management or data structures
    • Y10S707/99941Database schema or data structure
    • Y10S707/99943Generating database or data structure, e.g. via user interface
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10TECHNICAL SUBJECTS COVERED BY FORMER USPC
    • Y10STECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10S707/00Data processing: database and file management or data structures
    • Y10S707/99941Database schema or data structure
    • Y10S707/99944Object-oriented database structure
    • Y10S707/99945Object-oriented database structure processing
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10TECHNICAL SUBJECTS COVERED BY FORMER USPC
    • Y10STECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10S707/00Data processing: database and file management or data structures
    • Y10S707/99941Database schema or data structure
    • Y10S707/99948Application of database or data structure, e.g. distributed, multimedia, or image

Abstract

오디오 핑거프린팅 시스템 및 방법을 개시한다. 서버는 제1 오디오 피스(audio piece)의 오디오 핑거프린트(audio fingerprint)를 수신하고, 오디오 핑거프린트의 데이터베이스를 검색하며, 오디오 핑거프리트과 연관된 오디오 프로파일 벡터(audio profile vector)를 검색하고, 상기 오디오 프로파일 벡터에 기초하여 사용자 선호 정보를 갱신하며, 상기 사용자 선호 정보에 기초하여 제2 오디오 피스를 선택한다. 오디오 핑거프린트는 오디오 피스의 주파수 측정값에 기초하여 행렬을 만들고, 상기 행렬을 특이값 분해(singular value decomposition)함으로써 생성된다. 상기 데이터베이스의 검색을 촉진시키고 대조 정확성(matching accuracy)을 증가시키기 위해, 데이터베이스 내의 후보 서브세트는 오디오 피스의 가장 주요한 음악 주석(musical note)에 기초하여 식별되며, 상기 검색은 식별된 서브세트로 제한된다. 오디오 프로파일 벡터의 속성 중 하나는 특정 오디오 클래스이다. 상기 오디오 클래스의 식별자는 해당 오디오 클래스에 속하는 오디오 피스의 오디오 핑거프린트의 평균에 기초하여 생성된다.
오디오, 핑거프린트, 오디오 피스, 프로파일 벡터, 검색, 주석, 인덱스

Description

오디오 핑거프린팅 시스템 및 방법{AUDIO FINGERPRINTING SYSTEM AND METHOD}
본 발명은 일반적으로 미지(未知)의 오디오 피스(audio piece)를 자동으로 식별하는 것에 관한 것으로, 더욱 구체적으로는 미지의 오디오 피스를 그것의 오디오 핑거프린트에 의해 효과적으로 인식하는 시스템 및 방법에 관한 것이다.
오디오 피스의 오디오 신호의 컨텐츠를 분석함으로써 오디오 피스를 자동으로 식별하는 것은 종종 바람직하며, 특히 오디오 피스와 관련된 설명 데이터가 없는 경우에 그렇다.
종래 기술의 핑거프린팅 시스템은 일반적으로 오디오 피스의 임의의 부분에 기초하여 오디오 피스를 인식할 수 있도록 한다. 핑거프린트 데이터베이스의 핑거프린트는, 저장된 핑거프린트를 갖는 임의의 부분에 기초하여 생성된 핑거프린트의 적적한 정렬을 허용하기 위해 종종 시간 인덱싱(time-indexed) 된다. 따라서, 시간 인덱싱된 핑거프린팅 시스템은, 어떤 비교를 수행하기 전에 핑거프린트 데이터베이스에 정확한 세그먼트를 위치시키는 추가적인 복잡한 단계를 추가한다.
시간 인덱싱된 오디오 핑거프린트의 생성 및 저장은, 핑거프린팅을 사용할 수 있게 될 오디오 피스의 부분에 대해 가정이 이루어질 수 있다면, 중복된다 (redundant). 예를 들어, 식별할 오디오 피스가 기지(旣知)의 것이면, 악곡의 시작부분부터 항상 이용할 수 있게 될 것이고, 개개의 시간 슬라이스(time slice)에 대해 오디오 피스의 시간 인덱싱된 핑거프린트를 유지할 필요가 없고, 저장된 핑거프린트와 함께 질의(query) 핑거프린트를 시간 정렬(time-align)할 필요도 없다.
종래 기술의 핑거프린팅 시스템이 직면하는 다른 문제는 핑거프린트 데이터베이스에 등록된 핑거프린트의 수가 증가함에 따라, 일치하는 결과를 얻기 위해 소용되는 시간도 또한 증가한다는 것이다.
따라서, 핑거프린팅 시스템에서 필요로 하는 것은, 오디오 피스에 대한 신뢰성 있고, 신속하며 강건한(robust) 식별을 제공하는 것이다. 이러한 시스템은 보다 우수한 대조 정확성(matching accuracy)과 속도를 위해 식별을 수행할 때 검색 공간(search space)을 감소시키도록 구성되어야 한다.
일 실시예에 따르면, 본 발명은 복수의 오디오 피스스(audio piece)로부터 오디오 피스를 선택하는 방법에 관한 것이며, 이 방법은 제1 오디오 피스의 오디오 핑거프린트(audio fingerprint)를 수신하는 단계; 상기 오디오 핑거프린트의 데이터베이스를 검색하는 단계; 상기 오디오 핑거프린트과 연관된 오디오 프로파일 벡터(audio profile vector)를 검색하는 단계; 상기 오디오 프로파일 벡터에 기초하여 사용자 선호 정보(preference)를 갱신하는 단계; 및 상기 사용자 선호 정보에 기초하여 제2 오디오 피스를 선택하는 단계를 포함하며, 상기 오디오 프로파일 벡터는 상기 오디오 피스와 연관된 복수의 속성을 정량화(quantify)하기 위한 것이다.
다른 실시예에 따르면, 본 발명은 오디오 핑거프린팅 방법에 관한 것으로, 이 방법은 오디오 피스에 관련된 오디오 신호를 수신하는 단계; 상기 오디오 신호의 복수의 주파수 측정값을 취득하는 단계; 상기 주파수 측정값에 기초하여 행렬 A를 만드는 단계; 상기 행렬 A(A = USVT)에 대해 특이값 분해 (singular value decomposition)를 수행하는 단계; 행렬 VT의 하나 이상의 행(row)을 검색하는 단계; 상기 검색된 행렬 VT의 행을 상기 오디오 피스와 연관시키는 단계; 및 상기 검색된 행렬 VT의 행을 데이터 저장소(data store)에 저장하는 단계를 포함한다.
다른 실시예에 따르면, 본 발명은 오디오 인덱싱 방법에 관한 것으로, 이 방법은 오디오 피스의 오디오 신호를 수신하는 단계; 상기 오디오 신호로부터 상기 오디오 피스에 포함되어 있는 음악 주석의 리스트를 자동으로 취득하는 단계; 상기 오디오 신호로부터 상기 오디오 피스 내의 음악 주석의 주요도(prominence)를 결정하는 단계; 상기 오디오 피스 내에서 미리 결정된 수의 가장 주요한(prominent) 음악 주석을 선택하는 단계; 상기 선택된 음악 주석에 기초하여 인덱스를 생성하는 단계; 및 상기 생성된 인덱스에 기초하여 데이터베이스를 검색하는 단계를 포함한다.
다른 실시예에 따르면, 본 발명은 오디오 클래스용 식별자(identifier)를 생성하는 방법에 관한 것으로, 상기 오디오 클래스와 관련된 복수의 오디오 피스를 선택하는 단계; 선택된 오디오 피스 각각에 대해 오디오 핑거프린트를 계산하는 단계; 상기 계산된 오디오 핑거프린트의 평균을 계산하는 단계; 상기 계산에 기초하여 평균 핑거프린트를 생성하는 단계; 상기 평균 핑거프린트를 상기 오디오 클래스와 연관시키는 단계; 및 상기 평균 핑거프린트을 데이터 저장소에 저장하는 단계를 포함한다.
다른 실시예에 따르면, 본 발명은 오디오 선택 시스템에 관한 것으로, 복수의 오디오 피스에 대한 복수의 오디오 핑거프린트를 저장하는 제1 데이터 저장소; 복수의 오디오 핑거프린트에 대한 복수의 오디오 프로파일 벡터를 저장하는 제2 데이터 저장소; 제1 오디오 피스의 오디오 핑거프린트에 대한 제1 데이터 저장소를 검색하기 위한 수단; 상기 오디오 핑거프린트와 연관된 오디오 프로파일 벡터를 상기 제2 데이터 저장소로부터 검색하기 위한 수단; 상기 검색된 오디오 프로파일 벡터에 기초하여 사용자의 선호 정보를 갱신하기 위한 수단; 및 상기 사용자의 선호 정보에 기초하여 제2 오디오 피스를 선택하기 위한 수단을 포함하며,각 오디오 프로파일 벡터는 상기 오디오 핑거프린트에 대응하는 상기 오디오 피스에 관련된 복수의 속성을 정량화하는 것이다.
다른 실시예에 따르면, 본 발명은 오디오 핑거프린팅 시스템에 관한 것으로, 오디오 피스와 연관된 오디오 신호를 수신하고; 상기 오디오 신호의 복수의 주파수 측정값을 취득하며; 상기 주파수 측정값에 기초하여 행렬 A(A = USVT)를 만들고; 행렬 VT의 하나 이상의 행을 검색하며; 상기 검색된 행렬 VT의 행을 상기 오디오 피스와 연관시키도록 구성되어 있는 프로세서를 포함한다.
다른 실시예에 따르면, 본 발명은 오디오 인덱싱 시스템에 관한 것으로, 오디오 피스의 오디오 신호를 수신하기 위한 수단; 상기 오디오 신호로부터 상기 오디오 피스에 포함되어 있는 음악 주석의 리스트를 자동으로 취득하기 위한 수단; 상기 오디오 신호로부터 상기 오디오 피스 내의 음악 주석의 주요도를 결정하기 위한 수단; 상기 오디오 피스 내에서 미리 결정된 수의 가장 주요한 음악 주석을 선택하기 위한 수단; 상기 선택된 음악 주석에 기초하여 인덱스를 생성하기 위한 수단; 및 상기 생성된 인덱스에 기초하여 데이터베이스를 검색하기 위한 수단을 포함한다.
다른 실시예에 따르면, 본 발명은 오디오 클래스용 식별자를 생성하는 시스템에 관한 것으로, 복수의 선택된 오디오 피스 각각에 대해 오디오 핑거프린트를 계산하기 위한 수단; 상기 계산된 오디오 핑거프린트의 평균을 계산하기 위한 수단; 상기 계산된 평균을 상기 오디오 클래스와 연관시키기 위한 수단; 상기 계산된 평균을 데이터 저장소에 기억하기 위한 수단을 포함한다.
다른 실시예에 따르면, 본 발명은 컴퓨터에서 사용 가능한, 실행 가능한 명령어를 포함하는 프로그램을 구비하는 컴퓨터로 판독 가능한 매체를 포함하는 제품(article of manufacture)으로서, 상기 명령어는 실행될 때 상기 컴퓨터로 하여금, 오디오 피스에 연관된 오디오 신호에 대해 복수의 주파수 측정값을 취득하는 단계; 상기 주파수 측정값에 기초하여 행렬 A를 만드는 단계; 상기 행렬 A(A = USVT)에 대해 특이값 분해를 수행하는 단계; 행렬 VT의 하나 이상의 행(row)을 검색하는 단계; 상기 검색된 행렬 VT의 행을 상기 오디오 피스와 연관시키는 단계; 및 상기 검색된 행렬 VT의 행을 데이터 저장소에 저장하는 단계를 수행하도록 한다.
다른 실시예에 따르면, 본 발명은 컴퓨터에서 사용 가능한, 실행 가능한 명령어를 포함하는 프로그램을 구비하는 컴퓨터로 판독 가능한 매체를 포함하는 제품으로서, 상기 명령어는 실행될 때 상기 컴퓨터로 하여금, 오디오 피스의 오디오 신호로부터 상기 오디오 피스에 포함되어 있는 음악 주석의 리스트를 자동으로 취득하는 단계; 상기 오디오 신호로부터 상기 오디오 피스 내의 음악 주석의 주요도를 결정하는 단계; 상기 오디오 피스 내에서 미리 결정된 수의 가장 주요한 음악 주석을 선택하는 단계; 상기 선택된 음악 주석에 기초하여 인덱스를 생성하는 단계; 및 상기 생성된 인덱스에 기초하여 데이터베이스를 검색하는 단계를 포함한다.
본 발명의 상기한 그리고 다른 특징, 태양 및 이점은 다음의 상세한 설명, 첨부한 청구범위 및 첨부도면을 참작하면 더욱 완전하게 이해할 수 있을 겄이다. 물론, 본 발명의 실제 범위는 첨부한 청구범위에 의해 정해진다.
도 1은 본 발명의 일 실시예에 따른 오디오 핑거프린팅 시스템의 블록도이다.
도 2는 본 발명의 일 실시예에 따른 오디오 핑거프린트를 생성하는 프로세스를 나타낸 흐름도이다.
도 3은 본 발명의 일 실시예에 따른, 등록된 핑거프린트와의 대조를 위해 추출된 오디오 핑거프린트를 분석하는 프로세스를 나타낸 흐름도이다.
도 4는 본 발명의 다른 실시예에 따른, 등록된 핑거프린트와의 대조를 위해 추출된 오디오 핑거프린트를 분석하는 프로세스를 나타낸 흐름도이다.
도 5는 본 발명의 일 실시예에 따른, 오디오 피스에 데이터베이스 인덱스를 할당하는 프로세스를 나타낸 흐름도이다.
도 6은 본 발명의 일 실시예에 따른, 특정 음악 클래스에 대한 식별자를 생성하는 프로세스를 나타낸 흐름도이다.
도 7은 본 발명의 일 실시예에 따른 도 1의 오디오 핑거프린팅 시스템을 사용하는 하나 이상의 기기를 구비하는 컴퓨터 네트워크의 블록도이다.
도 1은 본 발명의 일 실시예에 따른 오디오 핑거프린팅 시스템(10)의 블록도이다. 이 시스템은 상이한 타입의 오디오 파일(11) 또는 오디오 입력을 판독하고, wave(.wav), MP3 파일 등을 출력하기 위한 오디오 파일 리더(12)를 포함한다. 오디오 파일 리더(12)는, 예를 들어 CD 플레이어, DVD 플레이어, 하드 드라이브 등일 수 있다. 오디오 파일 리더(12)는, 오디오 파일 리더(12)에 의해 출력된 MP3 파일을 디코딩하기 위한 MP3 디코더(14)에 연결될 수 있다. 다른 타입의 디코더도 또한 다른 타입의 부호화된 오디오 파일을 디코딩하기 위해 사용될 수 있다.
오디오 파일 리더(12)에 제공된 오디오 파일(11)은 인식할 또는 등록된, 완전한 오디오 피스 또는 오디오 피스의 부분일 수 있다. 본 발명의 일 실시예에 따 르면, 오디오 파일은 적어도 오디오 피스의 처음 30초를 포함한다. 하지만, 이 기술분야의 당업자는 그보다 더 짧거나 더 긴 세그먼트도 다른 실시예에서 사용될 수 있다는 것을 알 것이다
수신된 오디오 파일(11)은 음악 프리프로세서(preprocessor)(16)에 전송되며, 본 발명의 일 실시예에 따르면, 프리프로세서(16)는 오디오 파일을 분석하기 이전에 일정한 전처리 단계들을 취하도록 구성되어 있다. 전형적인 전처리 단계는 신호의 최대 레벨이 모든 오디오 샘플에 대해 동일하도록 오디오 신호를 정규화하는 단계, 오디오 데이터를 스트레오에서 모노로 변환하는 단계, 오디오 파일의 묵음 부분(silent poriton)을 제거하는 단계 등을 포함할 수 있다. 하지만 이 기술분야의 당업자는 전처리 단계를 없앨 수 있거나 또는 다른 타입의 종래 기술의 오디오 전처리 단계들을 포함할 수 있다는 것을 알아야 한다.
프리프로세서(16)는 핑거프린트 추출 엔진(18), 핑거프린트 분석 엔진(20), 인덱싱 엔진(22), 및 클래스 식별 엔진(24)에 연결되어 있다. 본 발명의 일 실시예에 따르면, 상기 엔진들은 메모리에 저장되어 있는 명령어를 실행하는 프로세서들이다. 이 기술분야의 당업자는, 상기 엔진들이 하드웨어, 펌웨어(예를 들어, ASIC), 또는 하드웨어, 펌웨어 및 소프트웨어의 조합으로 구현될 수 있다는 것을 알아야 한다.
본 발명의 일 실시예에 따르면, 핑거프린트 추출 엔진(18)은 축약형 표시(compact representation)를 자동으로 생성하는데, 이하에서는 오디오 피스의 고유한 식별자로서 사용하기 위해, 오디오 파일(11)의 서명 핑거프린트(fingerprint of signature)라고 한다. 본 발명의 일 실시예에 따르면, 오디오 핑거프린트는 행렬로 표현된다.
핑거프린트 분석 엔진(20)은 핑거프린트 데이터베이스(26)에 등록되어 있는 핑거프린트와의 대조를 위해, 핑거프린트 추출 엔진(18)에 의해 생성된 오디오 핑거프린트를 분석한다. 대조에 기초하여, 핑거프린트 분석 엔진이나 핑거프린트 분석 엔지에 연결된 개별 엔진(도시하지 않음) 중 어느 하나는, 오디오 피스와 연관된 부가적인 데이터를 검색한다. 부가적인 데이터는, 예를 들어 오디오 피스의 여러 가지 속성을 기술하며, 이에 대해 더욱 자세한 것은 미국특허출원 제10/278,636호(2003년 10월 23일 출원)에 기술되어 있으며, 그 내용 전부는 참조에 의해 본 명세서에 편입된다. 물론, 이 기술분야의 당업자는, 예를 들어, 타이틀 정보, 아티스트, 그룹 정보, 콘서트 정보, 새로 공개된 정보, 및/또는 더 많은 정보에 대한 URL 링크와 같은 링크 등의 다른 타입의 데이터도 또한 오디오 피스와 연관될 수 있다는 것을 알아야 한다.
인덱싱 엔진(22)은 추출된 오디오 핑거프린트를, 핑거프린트 데이터베이스(26) 내의 후보 서브세트를 식별하기 위해 핑거프린트 분석 엔진(20)에 의해 사용될 수 있는 인덱스와 연관시킨다. 본 발명의 일 실시예에 따르면, 인덱스는 악곡에 포함되어 있는 주요한 음악 주석(prominent musical note)에 기초하여 생성될 수 있으며, 오디오 피스가 속하는 핑거프린트 데이터베이스(26) 내의 오디오 핑거프린트의 서브세트가 식별될 수 있다.
클래스 식별 엔진(24)은 특정한 음악 클래스에 속하는 오디오 피스의 서로 다른 세트에 대한 식별자를 생성한다. 본 발명의 일 실시예에 따르면, 특정한 음악 클래스 내의 오디오 피스는 전체 기악 편성/관현악 편성(instrumentation/orchestration)에 있어 유사한다. 예를 들어, 전형적인 음악 클래스는 재즈 피아노 트리오, 아카펠라, 어쿠스틱 기타, 어쿠스틱 피아노, 보컬이 있는 솔로 어쿠스틱 기타 등을 포함하여 식별될 수 있다 다양한 음악 클래스는 그 후, 특정한 음악 클래스에 대한 값들의 세트가 해당 음악 클래스에 오디오 피스가 얼마나 가깝고 또는 얼마나 먼지를 나타내는, 오디오 프로파일 벡터의 속성으로서 포함될 수 있다. 여러 음악 클래스에 대한 식별자 및 정보는 그런 다음 음악 클래스 데이터베이스(28)에 저장될 수 있다.
핑거프린트 데이터베이스(26)는 기지의 오디오 피스에 대한 복수의 핑거프린트를 저장한다. 핑거프린트는 오디오 피스에 포함된 음악 주석에 기초하여 분리된 서브세트(discrete subset)로 그룹화될 수 있다. 각 오디오 핑거프린트는 실제 오디오 파일, 오디오 프로파일 벡터, 오디오 피스의 설명(예를 들어, 타이틀, 아티스트 및/또는 그룹), 콘서트 오디오 프로파일 벡터, 새로 공개된 정보, 추가적인 데이터에 대한 URL 링크 등과 연관될 수 있다.
도 2는 본 발명의 일 실시예에 따른 오디오 핑거프린트를 생성하는 프로세스를 나타낸 흐름도이다. 프로세스는 단계 100에서 시작하여, 핑거프린트 추출 엔진(18) 또는 개별 푸리에 변환 엔진(도시하지 않음)이, 시간 영역(time domain)의 신호 파형을 주파수 영역의 신호로 변환하기 위해, 전처리된 오디오 피스의 오디오 신호에 대해 고속 푸리에 변환(Fast Fourier Transform, FFT) 등을 계산한다. 본 발명의 일 실시예에 따르면, FFT 분석은 후속 처리의 데이터 크기를 줄이기 위해 재샘플링된다.
FFT 계산에 기초하여, 핑거프린트 추출 엔진(18)은 단계 102에서 TxF 행렬 A를 생성하며, 여기서 T ≥ F 이다. 본 발명의 일 실시예에 따르면, 행렬의 행은 시간을 나타내고, 행렬의 열은 주파수 측정값을 나타내며, FFT의 빈(bin)이라고도 한다.
단계 104에서, 핑거프린트 추출 엔진(18)이 행렬 A에 대해 특이값 분해(Singular Value Decomposition, SVD)라고 알려진 널리 알려진 행렬 연산을 수행한다. 일반적인 용어로, 특이값 분해는 원래의 행렬은 다음과 같이 3개의 매트릭스의 적(product)으로 감소시키는 기술이다.
SVD (A) = USVT
위 식에서, U는 TxF는 직교행렬(orthogonal matrix)이고, S는 양의 값 요소(positive valued element) 또는 영의 값 요소(zero valued element)를 갖는 FxF 대각선행렬(diagonal matrix)이며, VT는 FxF 직교행렬의 전치행렬이다.
본 발명의 일 실시예에 따르면, V 전치된 것의 행(row)은 최대 편차(most variance)를 포착하는 좌표, 즉 S 행렬의 대각선 엔트리에 의해 측정될 때 중요성의 내림차순으로 오디오 피스에 대한 최대의 정보를 보유한다.
단계 106에서, 핑거프린트 추출 엔진(18)은 행렬 VT에서 미리 정해진 개수의 행을 추출하고, 단계 108에서 추출된 행으로부터 핑거프린트 행렬을 생성한다. 단 계 110에서, 이 기술분야에서 종래 기술일 수 있는 임의의 방식으로, 핑거프린트 행렬을 오디오 피스와 연관시킴으로써 오디오 피스의 핑거프린트로서 설정된다.
단계 112에서, 핑거프린트 행렬은 데이터 저장소에 저장된다. 핑거프린트 추출인 등록을 목적으로 이루어졌다면, 데이터 저장소는 핑거프린트 데이터베이스(26)이다. 그렇지 않다면, 데이터 저장소는 등록된 핑거프린트와 비교하는 핑거프린트 분석 엔진(20)에 의한 나중의 검색을 위해 핑거프린트 행렬을 저장하는 임시 저장 장소이다.
종래 기술의 시스템에 의해 생성된 많은 오디오 핑거프린트와 달리, 특이값 분해(SVD) 연산(operation)에 의해 생성된 오디오 핑거프린트는, 그것과 연관된 시간 개념(notion of time)이 없다. 하지만, 이 기술분야의 당업자는, 시간이 특이값 분해(SVD) 연산에 의해 생성된 오디오 핑거프린트와 연관될 수 있음을 알아야 한다. 다시 말해, 도 2와 관련하여 설명한 오디오 핑거프린트를 생성하는 프로세스는, 특이값 분해(SVD) 연산에 의해 생성된 오디오 핑거프린트에 시간-인덱스를 할당하고, 윈도우(window)를 노래 전체 걸쳐 이동시키는 프로세스를 반복함으로써 시간 기반 오디오 핑거프린트 시스템으로 확장될 수 있다.
본 발명의 일 실시예에 따르면, 핑거프린트 추출 엔진(18)은 또한, 예를 들어 시간 인덱싱 핑거프린트 측정값을 얻는 스펙트럼 중심(spectral centroid) 또는 스펙트럼 편평도(spectral flatness)를 측정하는 것과 같은 종래의 핑거프린트 기술을 통합할 수도 있다. 만약 사용한다면, 이 측정 중 어느 하나 또는 양자의 결과는 특이값 분해(SVD) 연산에 의해 생성된 핑거프린트 행렬에 부가될 수 있다.
도 3은 본 발명의 일 실시예에 따른, 등록된 핑거프린트와의 대조를 위해 추출된 오디오 핑거프린트를 분석하는 핑거프린트 분석 엔진(20)에 의해 실행되는 프로세스를 나타낸 흐름도이다. 이 프로세스는 단계 200에서 시작하며, 핑거프린트 분석 엔진(20)은 핑거프린트 추출 엔진(18)으로부터 식별할 오디오 피스의 핑거프린트(핑거프린트 행렬 X)를 수신한다. 그런 다음, 핑거프린트 분석 엔진(20)은 핑거프린트 행렬 X를 갖는 핑거프린트 데이터베이스(26)에 대한 검색 루틴을 호출한다. 이와 관련하여, 핑거프린트 분석 엔진(20)은 단계 202에서, 핑거프린트 데이터베이스(DB)(26)에 비교할 핑거프린트 더 있는지 여부를 질의한다. 만약에 응답이 NO이면(비교할 핑거프린트가 없으면), 일치하는 것이 발견되지 않은 채로 데이터베이스 내의 모든 핑거프린트를 분석한 것이다. 이 시나리오는 단계 204에서, 핑거프린트 분석 엔진이 일치하는 것이 없다는 결과를 반환한다(불일치를 선언한다).
한편, 핑거프린트 데이터베이스에 분석되지 않은 핑거프린트가 더 있으면, 핑거프린트 분석 엔진(20)은 단계 206에서, 핑거프린트 행렬 X와 핑거프린트 데이터베이스(26) 내의 현재의 핑거프린트(핑거프린트 행렬 Y) 사이의 차를 계산한다. 본 발명의 일 실시예에 따르면, 상기 차는 핑거프린트 행렬 X 및 Y의 행 벡터 각각에 대해 잘 알려진 유클리드의 거리 측정값(Euclidian distance measure) D를 이용하여 다음과 같이 계산된다.
Figure 112006020511177-pct00001
위 식에서, XI, X2,... Xm은 핑거프린트 행렬 X의 행 벡터의 값이고, Y1,Y2,... Ym은 핑거프린트 행렬 Y의 행 벡터의 값이다. 행렬들의 모든 행에 대한 거리 측정값은 합산되고, 본 발명의 일 실시예에 따르면, 정규화된다. 단계 208에서, 거리의 합이 임계값을 초과하는지 여부에 대한 판정이 이루어진다. 판정 결과 NO(즉, 초과하지 않으면) 일치를 선언하고, 그렇지 않으면 핑거프린트 데이터베이스 내의 다음 핑거프린트가 대조를 위해 검사된다.
본 발명의 일 실시예에 따르면, 종래의 핑거프린팅 기술을 또한 도입하며, 이 기술에 의해 생성된 시간 인덱싱 벡터는 대응하는 저장된 핑거프린트 벡터에 대한 거리를 측정하고, 적절한 상수(constant)에 의해 조정된다(scaled). 최종 (결과) 거리 계산은 단계 206에서 계산된 거리에 가산된다. 가중 인자(weighing factor)가 또한 특정한 기술로 수행한 거리 계산에 대해 보다 큰 또는 보다 작은 가중치(weight)를 제공하기 위해 도입될 수 있다. 총 거리 계산은 그런 다음 일치가 이루어졌는지를 결정하기 위해 임계값에 대해 테스트된다.
도 4는 본 발명의 다른 실시예에 따른, 등록된 핑거프린트와의 대조를 위해 추출된 오디오 핑거프린트를 분석하는 핑거프린트 분석 엔진(20)에 의해 실행되는 프로세스를 나타낸 흐름도이다. 본 발명의 일 실시예에 따르면, 이 프로세스는 단계 300에서 시작하며, 핑거프린트 분석 엔진(20)은 핑거프린트 추출 엔진(18)으로부터 식별할 오디오 피스의 핑거프린트(핑거프린트 행렬 X)를 수신한다. 핑거프린트 분석 엔진(20)은 단계 302에서 인덱싱 엔진(22)을 호출하여, 만약 추출된 핑거프린트와 일치하는 핑거프린트가 존재하면 그 후보를 포함하는 핑거프린트 데이터 베이스(26) 내의 핑거프린트 서브세트의 인덱스를 식별한다. 이와 관련하여, 인덱싱 엔진(22)은 추출된 핑거프린트에 대한 질의 인덱스(query index)를 생성한다. 발명의 일 실시예에 따르면, 인덱스는 4개의 순서가 없는(unordered) 숫자로 이루어지며, 임의의 순서로 질의 인덱스의 숫자와 3개가 동일한 인덱스가 핑거프린트 데이터베이스 내에 존재하면 일치하는 것으로 간주한다.
도 4의 나머지 프로세스는, 검색 공간이 일치하는 인덱스에 의해 식별된 핑거프린트의 서브세트로 한정되는 것을 제외하고는 도 3에서와 동일한 방식으로 계속된다.
이와 관련하여, 핑거프린트 분석 엔진(20)은 단계 304에서, 핑거프린트 데이터베이스(26)의 식별된 서브세트 중에서 비교할 핑거프린트가 더 있는지 여부를 묻는다. 응답이 NO이면(비교할 핑거프린트가 없으면) 핑거프린트 분석 엔진은 단계 306에서 일치하는 것이 없다는 결과를 반환한다(불일치 선언).
서브세트에 분석되지 않은 핑거프린트가 더 있으면, 핑거프린트 분석 엔진(20)은 단계 308에서, 핑거프린트 행렬 X와 서브세트 내의 현재의 핑거프린트(핑거프린트 행렬 Y) 사이의 차를 계산한다. 단계 310에서, 계산된 차가 임계값을 초과하는지 여부에 대한 판정이 이루어진다. 판정 결과 NO(즉, 차가 임계값을 초과하지 않으면) 일치를 선언하고, 그렇지 않으면 식별된 서브세트 내의 다음 핑거프린트가 대조를 위해 검사된다.
도 5는 본 발명의 일 실시예에 따른, 오디오 피스에 데이터베이스 인덱스를 할당하는 인덱싱 엔진(22)에 의해 실행되는 프로세스를 나타낸 흐름도이다. 데이 터베이스 인덱스는 핑거프린트 추출 엔진(18)에 의해 추출된 핑거프린트를 등록하거나 또는 추출된 핑거프린트와의 대조를 위해 핑거프린트 데이터베이스(26) 내의 검사가 필요한 후보를 줄이기 위해, 핑거프린트 데이터베이스(26) 내의 핑거프린트의 서브세트를 식별하는 데 사용된다.
도 5에 도시된 프로세스는 단계 400에서 시작하며, 인덱싱 엔진(22)이나 개별 푸리에 변환 엔진(도시하지 않음)이 프리프로세서(16)에 의해 전처리된 오디오 피스의 FFT 등을 계산하여, 오디오 피스에 대한 FFT 스펙트럼을 얻는다. 단계 402에서, 인덱싱 엔진(22)은 오디오 피스의 주석 리스(list of notes)를 자동으로 취즉한다. 주석의 리스트는 종래 기술에 존재하는 임의의 널리 알려진 피크 추적 알고리즘(peak-tracking algorithm)에 의해 취득된다.
피크 추적 알고리즘은 그것의 주요부(prominency)에 대해 인덱싱 엔진에 의해 나중에 분석되는 FFT 내의 로컬 피트(local peak)의 트랙(track)을 생성한다. 이와 관련하여, 인덱싱 엔진(22)은 단계 404에서 검사할 트랙이 더 있는지 여부를 결정한다. 만약 응답이 YES이면(검사할 트랙이 더 있으면), 엔진은 단계406에서 트랙의 주파수를 트랙의 주파수를 양자화하는 정수 값으로 변환한다. 본 발명의 일 실시예에 따르면, 이것은 트랙의 주파수를, 이 기술분야에 잘 알려진 방식으로 가장 근접한 MIDI(Musical Instrument Digital Interface) 주석 번호(note number)로 양자화함으로써 수행된다.
단계 408에서, 인덱싱 엔진(22)는 예를 들어 트랙의 세기(strength)와 지속 기간(duration)과 같은 인자에 기초하여 트랙의 주요 값(prominence value)을 계산 한다. 단계 410에서, 엔진은 계산된 주요 값을 트랙의 MIDI 주석와 연관시킨다. 단계 412에서, MIDI 주석의 주요 값은 주요 배열(prominence array)에 축적된다. 그런 다음, 프로세스는 다음 트랙의 분석을 위해 단계 404로 돌아간다.
더 이상 검사할 트랙이 없으면, 인덱싱 엔진(22)은 단계 414에서 최고 주요 값을 갖는 주요 배열 내의 MIDI 주석 번호를 핑거프린트 데이터베이스(26) 내의 서브세트와 연관 인덱스로서 출력한다. 본 발명의 일 실시예에 따르면, 초고 주요 값을 갖는 4개의 MIDI 주석 번호가 인덱스를 위해 선택된다. 본 발명의 일 실시예에 따르면, 인덱스는 4개의 순서가 없는 숫자로 구성되며, 그 숫자는 선택된 MIDI 주석 번호가며, 인덱스를 위해 총 24개의 가능한 조합을 나타낸다.
도 6은 본 발명의 일 실시예에 따른, 특정한 음악 클래스에 대한 식별자를 생성하는 프로세스를 나타낸 흐름도이다. 도 6은 비록 음악 클래스에 관해 기재되어 있지만, 이 기술분야의 당업자는 이 프로세스는 이 분야의 종래 기술일 수 있는 모든 타입의 오디오 및 오디오 클래스로 확장된다는 것을 알아야 한다.
프로세스는 단계 500에서 시작하여, 음악 클래스에 속하는 오디오 피스(노래) 세트를 선택한다. 악곡의 선택은 수동 또는 자동일 수 있다.
단계 502에서, 클래스 식별 엔진(24)이 세트 내의 오디오 피스 각각에 대한 핑거프린트를 계산한다. 본 발명의 일 실시예에 따르면, 클래스 식별 엔진(24)은 핑거프린트 추출 엔진(18)의 호출하여 특이값 분해(SVD) 연산에 의해 핑거프린트를 계산한다. 다른 핑거프린트 메커니즘도 또한 특이값 분해(SVD) 연산 핑거프린트 메커니즘 대신 및/또는 추가로 사용될 수 있다.
단계 504에서, 클래스 식별 엔진(24)은 세트에 대해 생성된 핑거프린트의 평균을 계산한다. 이와 관련하여, 클래스 식별 엔진(24)은 세트 내의 모든 오디오 피스에 대한 거리 측정을 최소화하는 클래스 ID 행렬이라고 하는 행렬을 이 기술분야에 잘 알려진 방법으로 계산한다.
단계 506에서, 클래스 ID 행렬로 표현된 핑거프린트의 계산된 평균은 음악 클래스와 연관이 있으며, 단계 508에서 음악 클래스에 관한 다른 정보와 함께 그 식별자로서 음악 클래스 데이터베이스(28)에 저장된다. 이러한 부가 정보는, 예를 들어 해당 클래스에 속하는 오디오 피스의 리스트, 해당 클래스에 속하는 오디오 피스의 오디오 핑거프린트의 핑거프린트 데이터베이스(26)에 대한 링크, 해당 클래스에 속하는 오디오 피스를 위한 오디오 프로파일 벡터에 대한 링크 등을 포함할 수 있다.
일단 음악 클래스에 대한 식별자가 생성되었으면, 오디오 피스가 특정한 음악 클래스에 얼마나 가까운지 또는 먼지를 결정하기 위한 계산을 할 수 있다. 예를 들어, 이것은 오디오 피스의 추출된 핑거프린트와 특정 음악 클래스의 클래스 ID 행렬 사이의 거리를 계산함으로써 이루어질 수 있다.
본 발명의 일 실시예에 따르면, 여러 음악 클래스가 오디오 피스의 오디오 프로파일 벡터의 속성으로서 사용된다. 거리 계산은, 오디오 피스가 연관된 음악 클래스에 얼마나 가까운지에 대한 표시로서 속성 각각에 대해 오디오 프로파일 벡터로 저장된다.
도 7은 본 발명의 일 실시예에 따른 도 1의 오디오 핑거프린팅 시스템을(10) 사용하는 하나 이상의 기기를 구비하는 컴퓨터 네트워크의 블록도이다. 네트워크는 예를 들어 인터넷(610)과 같은 공중(public) 또는 사설(paivate) 네크워크를 통해 하나 이상의 최종 단말기(end terminal)(602-608)에 연결되어 있는 서버(600)를 포함한다. 최종 단말기는 개인용 컴퓨터(PC)(602), 개인용 휴대 단말기(personal digital assistant, PDA)(604), 랩톱(606), 무선 기기(608), 및/또는 이 기술분야에 알려져 있는 기타 다른 타입의 고정 또는 이동 단말기의 형태를 취할 수 있다.
본 발명의 일 실시예에 따르면, 오디오 핑거프린팅 시스템(10)은 서버(600)에 상주한다. 서버(600) 및/또는 최종 단말기(602-608)는 또한 오디오 피스를 자동으로 분석하여 오디오 프로파일 벡터를 생성하기 위해, 미국특허출원 제10/278,636호에 개시된 음악 프로파일러(music profiler)를 포함할 수도 있다. 서버(600) 및/또는 최종 단말기(602-608)에 포함된 하나 이상의 프로세서는 또 사용자의 선호도에 기초하여 사용자에게 오디오 피스를 추천하기 위한 추가적인 기능성(functionality)을 갖도록 구성될 수 있다. 이러한 기능성은 오디오 데이터베이스 내의 오디오 피스와 연관된 복수의 속성을 정량화하는 오디오 프로파일 벡터의 생성/검색, 그리고 사용자의 프로파일 벡터에 기초하여 오디오 데이터베이스로부터 오디오 피스의 선택을 포함한다.
오디오 핑거프린팅 시스템(10)의 전형적인 사용에 있어, 사용자는 연관된 설명 정보(descriptive information)가 없는 노래를 평가한다. 사용자가 평하고자 하는 노래 전곡을 전송하는 대신에, 노래의 핑거프린트를 평가 정보(rating information)와 함께 전송한다. 이에 대해, 사용자가 사용하는 최종 단말기는 서 버(600)에 접속하여 핑거프린트 추출 엔진(18)의 인스턴스(instance)를 메모리(도시하지 않음)로 다운로드한다. 핑거프린트 추출 엔진(18)은 평가되는 오디오 피스의 핑거프린트를 추출하기 위해 호출된다. 추출된 핑거프린트는 인터넷(610)을 통해 서버(600)로 전송된다.
추출된 오디오 핑거프린트를 받으면, 서버(600)는 핑거프린트 분석 엔진(20)을 호출하여 수신된 핑거프린트가 핑거프린트 데이터베이스(26)에 등록되어 있는지 여부를 결정한다. 등록되어 있으면, 서버는 해당 핑거프린트와 연관된 오디오 프로파일 벡터를 검색하고, 미국특허출원 제10/278,636호에 더욱 자세하게 기재되어 있는 것처럼, 그것을 사용하여 사용자에 대한 사용자 프로파일 벡터를 갱신 또는 생성한다. 사용자 프로파일 벡터는 그 후 사용자에게 다른 노래를 추천하기 위해 사용된다.
한편 등록되어 있지 않으면, 미국특허출원 제10/278,636호에 더욱 자세하게 기재되어 있는 것처럼, 오디오 프로파일 벡터를 생성하기 위해, 바람직하게는 최종 단말기에 의해 오디오 피스가 분석된다.
본 발명의 일 실시예에 따르면, 최종 단말기는 또한 평가되는 오디오 피스가 속하는 핑거프린트의 서브세트의 인덱스를 결정하기 위해 인덱싱 엔진(22)의 인스턴스를 다운로드할 수 있다. 또한 인덱싱 정보는 그 후 핑거프린트 데이터베이스(26)의 검색을 촉진시키기 위해 핑거프린트 정보와 함께 서버(600)로 전송된다.
본 발명은 특정한 실시예로 설명하였지만, 이 기술분야의 당업자라면 본 발명의 사상 및 범위를 벗어나지 않으면서 기술된 실시예에 대한 변형예를 어려움 없 이 고안할 수 있을 것이다. 또한, 여러 기술 분야의 당업자라면, 여기서의 본 발명 그 자체가 다른 과제 및 다른 애플리캐이션의 개조에 대한 해법을 제안할 것이다.
예를 들어, 오디오 핑거프린팅 시스템(10)은 위의 애플리케이션들과 오디오 프로파일 벡터를 생성하기 위한 오디오 피스의 인식을 넘는 애플리케이션을 가질 수 있다. 예를 들어, 오디오 핑거프린팅 시스템(10)은 미지의 음악 악곡의 연관된 설명 데이터(메타데이터, metadata)를 찾기 위해 사용될 수 있다. 오디오 핑거프린팅 시스템(10)은 또한 예정된 광고 차례(advertisement spot)의 조회, 방송 자료에 대한 작곡가의 로얄티(royalty) 보호, 또는 프로그램 자료의 통계적인 분석을 위해, 방송국에 대해 전송된 오디오 프로그램 자료(material)를 식별하고, 프로토콜에 따라 처리한다.
출원인은 본 발명의 모든 용도 및 본 발명의 사상과 범위를 벗어나지 않으면서 공개를 목적으로 여기에서 선택된 본 발명의 실시예로 구현할 수 있는 그 변경 및 변형도 또한 청구범위에 의해 본 발명에 포함시키고자 의도한다. 따라서, 본 발명의 실시예는 모든 점에서 한정적인 것이 아니라 예시적인 것으로 생각되어야 하며, 본 발명의 범위 전술한 설명에 의해서가 아니라 첨부된 청구범위와 그 등가물에 의해 나타난다.

Claims (49)

  1. 컴퓨터로 구현되는 오디오 핑거프린팅 방법으로서,
    오디오 피스(audio piece)과 연관된 오디오 신호를 수신하는 단계;
    상기 오디오 신호에 대한 복수의 주파수 측정값을 취득하는 단계;
    상기 주파수 측정값에 기초하여 N x M의 행렬 A를 만드는 단계;
    상기 행렬 A에 대해 특이값 분해 (singular value decomposition, SVD)를 수행하여 오디오 핑거프린트를 생성하는 단계[단, SVD(A) = USVT)이고, U는 N x M 직교행렬이며, S는 M x M 대각선행렬이고, VT는 M x M 직교행렬의 전치행렬임];
    행렬 VT의 하나 이상의 행(row)을 검색하는 단계; 및
    상기 검색된 행렬 VT의 행을 상기 오디오 피스와 연관시켜, 상기 오디오 피스의 상기 오디오 핑거프린트로서 데이터 저장소(data store)에 저장하는 단계
    를 포함하며,
    애플리케이션 프로그램에 의해 상기 검색된 행렬 VT의 행을 포함하는 요청이 수신되고, 상기 요청 내의 상기 행렬 VT의 행에 기초하여 데이터베이스에 저장된 오디오 피스에 대한 정보가 식별되고 검색되는 것을 특징으로 하는 오디오 핑거프린팅 방법.
  2. 제1항에 있어서,
    상기 행렬 A의 행은 시간을 나타내고, 상기 행렬 A의 열(column)은 상기 주 파수 측정값을 나타내는 것을 특징으로 하는 오디오 핑거프린팅 방법.
  3. 제1항에 있어서,
    상기 정보는 상기 오디오 피스의 음향 분석 데이터(acoustic analysis data)를 저장하는 오디오 프로파일 벡터(audio profile vector)인 것을 특징으로 하는 오디오 핑거프린팅 방법.
  4. 제3항에 있어서,
    상기 음향 분석 데이터에 기초하여 제2 오디오 피스를 추천하는 단계를 더 포함하는 오디오 핑거프린팅 방법.
  5. 제3항에 있어서,
    상기 오디오 프로파일 벡터는 특정 오디오 클래스(audio class)로 분류된 오디오 피스들에 대한 상기 오디오 피스의 유사도(degree of similarity)를 정량화하는 것을 특징으로 하는 오디오 핑거프린팅 방법.
  6. 제5항에 있어서,
    상기 특정 오디오 클래스에 대한 식별자(identifier)를 생성하는 단계를 더 포함하며,
    상기 생성하는 단계는,
    상기 특정 오디오 클래스와 연관된 오디오 피스를 선택하는 단계;
    선택된 오디오 피스 각각에 대해 제2 오디오 핑거프린트를 계산하는 단계;
    상기 계산된 제2 오디오 핑거프린트의 평균을 계산하는 단계;
    상기 계산된 평균을 상기 특정 오디오 클래스와 연관시키는 단계; 및
    상기 계산된 평균을 상기 특정 오디오 클래스의 식별자로서 데이터 저장소에 저장하는 단계
    를 포함하는
    오디오 핑거프린팅 방법.
  7. 제6항에 있어서,
    상기 제2 오디오 핑거프린트를 계산하는 단계는,
    상기 선택된 오디오 피스과 연관된 특정한 오디오 신호로부터 복수의 주파수 측정값을 취득하는 단계;
    상기 주파수 측정값에 기초하여 N x M의 행렬 A'를 만드는 단계;
    상기 행렬 A'에 대해 특이값 분해(SVD)를 수행하는 단계[단, SVD(A') = U'S'V'T')이고, U'는 N x M 직교행렬이며, S'는 M x M 대각선행렬이고 VT'는 M x M 직교행렬의 전치행렬임];
    행렬 VT'의 하나 이상의 행을 검색하는 단계; 및
    상기 검색된 행렬 VT'의 행을 상기 선택된 오디오 피스과 연관시키는 단계를 포함하는 오디오 핑거프린팅 방법.
  8. 제1항에 있어서,
    상기 오디오 피스의 인덱스(index)를 생성하는 단계를 더 포함하며,
    상기 생성하는 단계는,
    상기 오디오 피스와 연관된 오디오 신호로부터 상기 오디오 피스에 포함되어 있는 음악 주석의 리스트(list of musical notes)를 자동으로 취득하는 단계;
    상기 오디오 신호로부터 상기 오디오 피스 내의 음악 주석의 주요도(prominence)를 결정하는 단계; 및
    상기 오디오 피스 내에서 미리 결정된 수의 가장 주요한 음악 주석을 상기 인덱스로서 선택하는 단계를 포함하는 것을 특징으로 하는 오디오 핑거프린팅 방법.
  9. 제8항에 있어서,
    상기 데이터베이스에 저장된 데이터는 하나 이상의 그룹으로 구성되고, 각 그룹은 특정 인덱스에 의해 식별되는 것을 특징으로 하는 오디오 핑거프린팅 방법.
  10. 제9항에 있어서,
    상기 오디오 피스의 정보에 대한 상기 데이터베이스 검색은 상기 생성된 인덱스에 의해 식별된 그룹으로 제한되는 것을 특징으로 하는 오디오 핑거프린팅 방법.
  11. 컴퓨터로 구현되는 오디오 핑거프린팅 시스템으로서,
    오디오 피스를 저장하고 있는 오디오 파일을 판독하는 오디오 파일 리더( reader);
    상기 오디오 파일 리더에 연결되어 있고, 상기 오디오 피스과 연관된 오디오 신호의 복수의 주파수 측정값을 취득하며, 상기 행렬 A에 대해 특이값 분해(SVD)를 수행하여 오디오 핑거프린트를 생성하고[단, SVD(A) = USVT)이고, U는 N x M 직교행렬이며, S는 N x M 대각선행렬이고, VT는 N x M 직교행렬의 전치행렬임], 행렬 VT의 하나 이상의 행을 검색하도록 구성되어 있는 프로세서;
    상기 프로세서에 연결되어 있고, 상기 검색된 행렬 VT의 행을 상기 오디오 피스과 연관시켜, 상기 오디오 피스의 상기 오디오 핑거프린트로서 저장하는 데이터 저장소; 및
    복수의 오디오 피스에 대한 정보를 저장하는 데이터베이스
    를 포함하며,
    애플리케이션 프로그램에 의해 상기 검색된 행렬 VT의 행을 포함하는 요청이 수신되고, 상기 요청 내의 상기 행렬 VT의 행에 기초하여 데이터베이스에 저장된 오디오 피스에 대한 정보가 식별되고 검색되는 것을 특징으로 하는 오디오 핑거프린팅 시스템.
  12. 제11항에 있어서,
    상기 행렬 A의 행은 시간을 나타내고, 상기 행렬 A의 열은 상기 주파수 측정값을 나타내는 것을 특징으로 하는 오디오 핑거프린팅 시스템.
  13. 제11항에 있어서,
    상기 정보는 상기 오디오 피스의 음향 분석 데이터를 저장하는 오디오 프로파일 벡터인 것을 특징으로 하는 오디오 핑거프린팅 시스템.
  14. 제13항에 있어서,
    상기 오디오 프로파일 벡터는 특정 오디오 클래스로 분류된 오디오 피스들에 대한 상기 오디오 피스의 유사도를 정량화하는 것을 특징으로 하는 오디오 핑거프린팅 시스템.
  15. 제14항에 있어서,
    상기 프로세서는 특정 오디오 클래스에 대한 식별자를 생성하도록 더 구성되어 있으며,
    상기 식별자의 생성은,
    상기 특정 오디오 클래스와 연관된 오디오 피스를 선택하고,
    선택된 오디오 피스 각각에 대해 제2 오디오 핑거프린트를 계산하며,
    상기 계산된 제2 오디오 핑거프린트의 평균을 계산하고,
    상기 계산된 평균을 상기 특정 오디오 클래스와 연관시키며,
    상기 계산된 평균을 상기 특정 오디오 클래스의 식별자로서 데이터 저장소에 저장하는 것을 포함하는 오디오 핑거프린팅 시스템.
  16. 제15항에 있어서,
    상기 제2 오디오 핑거프린트의 계산은,
    상기 선택된 오디오 피스과 연관된 특정 오디오 신호로부터 복수의 주파수 측정값을 취득하고,
    상기 주파수 측정값에 기초하여 N x M의 행렬 A'를 만들며,
    상기 행렬 A'에 대해 특이값 분해(SVD)를 수행하고[단, SVD(A') = U'S'V'T')이고, U'는 N x M 직교행렬이며, S'는 M x M 대각선행렬이고 VT'는 M x M 직교행렬의 전치행렬임],
    행렬 VT'의 하나 이상의 행을 검색하며,
    상기 검색된 행렬 VT'의 행을 상기 선택된 오디오 피스과 연관시키는 것을 포함하는 오디오 핑거프린팅 시스템.
  17. 제11항에 있어서,
    상기 프로세서는 상기 오디오 피스의 인덱스를 생성하도록 더 구성되어 있으며,
    상기 인덱스의 생성은,
    상기 오디오 피스와 연관된 오디오 신호로부터 상기 오디오 피스에 포함되어 있는 음악 주석의 리스트를 자동으로 취득하고,
    상기 오디오 신호로부터 상기 오디오 피스 내의 음악 주석의 주요도를 결정하며,
    상기 오디오 피스 내에서 미리 결정된 수의 가장 주요한 음악 주석을 상기 인덱스로서 선택하는 것을 포함하는 오디오 핑거프린팅 시스템.
  18. 제17항에 있어서,
    상기 데이터베이스에 저장된 데이터는 하나 이상의 그룹으로 구성되고, 각 그룹은 특정 인덱스에 의해 식별되는 것을 특징으로 하는 오디오 핑거프린팅 시스템.
  19. 제18항에 있어서,
    상기 오디오 피스의 정보에 대한 상기 데이터베이스 검색은 상기 생성된 인덱스에 의해 식별된 그룹으로 제한되는 것을 특징으로 하는 오디오 핑거프린팅 시스템.
  20. 제11항에 있어서,
    상기 프로세서는 음향 분석 데이터에 기초하여 제2 오디오 피스를 추천하도록 더 구성되어 있는 것을 특징으로 하는 오디오 핑거프린팅 시스템.
  21. 클라이언트 기기(client device)로부터 오디오 피스(audio piece)의 오디오 핑거프린트를 수신하는 단계;
    대조(match)를 위해, 상기 수신된 오디오 핑거프린트를 복수의 저장된 오디오 핑거프린트와 비교하는 단계;
    상기 수신된 오디오 핑거프린트가 상기 저장된 오디오 핑거프린트 중 특정 하나의 오디오 핑거프린트에 대응하는지 여부를 결정하는 단계;
    만일 상기 수신된 오디오 핑거프린트가 상기 저장된 오디오 핑거프린트 중 특정 하나의 오디오 핑거프린트에 대응한다면, 상기 저장된 오디오 핑거프린트 중 상기 특정 하나의 오디오 핑거프린트에 연관되어 저장된 오디오 피스의 오디오 프로파일 벡터(audio profile vector)를 검색하는 단계; 및
    상기 검색된 오디오 프로파일 벡터와 연관되어 저장된 정보를 상기 클라이언트 기기에 전송하는 단계
    를 포함하고
    상기 오디오 프로파일 벡터는 상기 오디오 피스의 N개의 음향 속성(acoustic attribute)을 정량화하는(quantifying) N개의 수치 값(numerical value)을 포함하며,
    상기 N은 N>0인,
    오디오 인식 방법.
  22. 오디오 피스의 오디오 핑거프린트를 수신하는 단계;
    대조를 위해, 상기 수신된 오디오 핑거프린트를 복수의 저장된 오디오 핑거프린트와 비교하는 단계;
    상기 오디오 핑거프린트의 대조에 응답하는 오디오 피스를 식별하는 단계; 및
    상기 식별된 오디오 피스와 연관되어 저장된 정보를 검색하는 단계를 포함하고,
    상기 오디오 핑거프린트는 N x M의 행렬 A에 대한 특이값 분해(SVD)에 의해 생성된 행렬 VT의 표현(representation)이고[단, SVD(A) = USVT이고, U는 N x M 직교행렬이며, S는 M x M 대각선행렬이고, VT는 M x M 직교행렬의 전치행렬임],
    상기 행렬 A는 오디오 피스과 연관된 오디오 신호에 대한 복수의 주파수 측정값에 기초하여 만들어지는 것을 특징으로 하는,
    오디오 인식 방법.
  23. 제22항에 있어서,
    상기 행렬 A의 행은 시간을 나타내고, 상기 행렬 A의 열은 상기 주파수 측정값을 나타내는 것을 특징으로 하는, 오디오 인식 방법.
  24. 제21항에 있어서,
    상기 오디오 프로파일 벡터는 상기 오디오 피스의 오디오 신호의 자동 처리(automatic process)에 기초하여 생성되는, 오디오 인식 방법.
  25. 제21항에 있어서,
    상기 음향 프로파일 벡터에 포함된 복수의 상기 음향 속성 중 하나는 특정 오디오 클래스에 연관되며,
    상기 수치 값은 상기 오디오 피스로부터 상기 오디오 클래스까지의 거리를 가리키는,
    오디오 인식 방법.
  26. 제25항에 있어서,
    상기 오디오 클래스는 오디오 클래스 핑거프린트에 기초하여 식별되며, 상기 오디오 클래스 핑거프린트는 상기 오디오 클래스와 연관된 오디오 피스의 오디오 핑거프린트의 평균인,
    오디오 인식 방법.
  27. 제21항에 있어서,
    상기 복수의 저장된 오디오 핑거프린트의 서브세트에 대한 인덱스를 식별하는 단계; 및
    상기 대조를 위해 상기 식별된 서브세트를 검색하는 단계를 더 포함하며,
    상기 인덱스는 상기 서브세트 내의 상기 오디오 핑거프린트에서 가장 주요한 것으로 결정된 복수의 음악 주석을 식별하는 것인 오디오 인식 방법.
  28. 복수의 오디오 피스에 대한 복수의 오디오 핑거프린트를 저장하는 제1 데이터 저장소;
    클라이언트 기기로부터 특정 오디오 피스의 오디오 핑거프린트를 수신하기 위한 수단;
    대조를 위해, 상기 수신된 오디오 핑거프린트를 상기 복수의 저장된 오디오 핑거프린트와 비교하기 위한 수단;
    상기 수신된 오디오 핑거프린트가 상기 저장된 오디오 핑거프린트 중 특정 하나의 오디오 핑거프린트에 대응하는지 여부를 결정하기 위한 수단;
    만일 상기 수신된 오디오 핑거프린트가 상기 저장된 오디오 핑거프린트 중 특정 하나의 오디오 핑거프린트에 대응한다면, 상기 저장된 오디오 핑거프린트 중 상기 특정 하나의 오디오 핑거프린트에 연관되어 저장된 오디오 피스의 오디오 프로파일 벡터를 검색하기 위한 수단; 및
    상기 검색된 오디오 프로파일 벡터와 연관되어 저장된 정보를 상기 클라이언트 기기에 전송하기 위한 수단
    을 포함하고,
    상기 오디오 프로파일 벡터는 상기 오디오 피스의 N개의 음향 속성을 정량화하는 N개의 수치 값을 포함하며,
    상기 N은 N>0인,
    오디오 인식 시스템.
  29. 복수의 오디오 피스에 대한 복수의 오디오 핑거프린트를 저장하는 제1 데이터 저장소;
    특정 오디오 피스의 오디오 핑거프린트를 수신하기 위한 수단;
    대조를 위해, 상기 수신된 오디오 핑거프린트를 상기 복수의 저장된 오디오 핑거프린트와 비교하기 위한 수단;
    상기 오디오 핑거프린트의 대조에 응답하는 오디오 피스를 식별하기 위한 수단; 및
    상기 식별된 오디오 피스와 연관되어 저장된 정보를 검색하기 위한 수단
    을 포함하고,
    상기 오디오 핑거프린트는 N x M의 행렬 A에 대한 특이값 분해(SVD)에 의해 생성된 행렬 VT의 표현이고[단, SVD(A) = USVT)이고, U는 N x M 직교행렬이며, S는 M x M 대각선행렬이고, VT는 M x M 직교행렬의 전치행렬임],
    상기 행렬 A는 오디오 피스과 연관된 오디오 신호에 대한 복수의 주파수 측정값에 기초하여 만들어지는 것을 특징으로 하는 오디오 인식 시스템.
  30. 제29항에 있어서,
    상기 행렬 A의 행은 시간을 나타내고, 상기 행렬 A의 열은 상기 주파수 측정값을 나타내는 것을 특징으로 하는 오디오 인식 시스템.
  31. 제28항에 있어서,
    상기 저장된 오디오 핑거프린트 중 특정 하나의 오디오 핑거프린트에 연관하여 상기 오디오 프로파일 벡터를 저장하는 제2 데이터 저장소를 더 포함하며,
    상기 오디오 프로파일 벡터는 상기 오디오 피스의 오디오 신호의 자동 처리에 기초하여 생성되는,
    오디오 인식 시스템.
  32. 제31항에 있어서,
    상기 오디오 프로파일 벡터에 포함된 복수의 상기 음향 속성 중 하나는 특정 오디오 클래스에 연관되며,
    상기 수치 값은 상기 오디오 피스로부터 상기 오디오 클래스까지의 거리를 가리키는,
    오디오 인식 시스템.
  33. 제32항에 있어서,
    상기 오디오 클래스는 오디오 클래스 핑거프린트에 기초하여 식별되고,
    상기 오디오 클래스 핑거프린트는 상기 오디오 클래스와 연관된 오디오 피스의 오디오 핑거프린트의 평균인,
    오디오 인식 시스템.
  34. 제28항에 있어서,
    상기 복수의 저장된 오디오 핑거프린트의 서브세트에 대한 인덱스를 식별하기 위한 수단; 및
    상기 대조를 위해 상기 식별된 서브세트를 검색하기 위한 수단을 더 포함하며,
    상기 인덱스는 상기 서브세트 내의 상기 오디오 핑거프린트에서 가장 주요한 것으로 결정된 복수의 음악 주석을 식별하는 것인 오디오 인식 시스템.
  35. 제21항에 있어서,
    만일 상기 저장된 오디오 핑거프린트 중 어느 것도 상기 수신된 오디오 핑거프린트에 대응하지 않는다면, 상기 클라이언트 기기를 자극하여(invoke) 상기 오디오 피스의 상기 오디오 프로파일 벡터를 생성하는,
    오디오 인식 방법.
  36. 제21항에 있어서,
    상기 수신된 오디오 핑거프린트 및 상기 저장된 오디오 핑거프린트는 각각 벡터들로 이루어진 행렬로 표현되는(represent), 오디오 인식 방법.
  37. 제36항에 있어서,
    만일 상기 수신된 오디오 핑거프린트를 표현하는 행렬과 상기 저장된 오디오 핑거프린트 중 특정 하나의 오디오 핑거프린트를 표현하는 행렬간의 거리 계산(distance computation)의 결과값이 임계 거리(threshold distance)를 만족하는 단일 스칼라 거리 값(single scalar distance value)이라면, 상기 수신된 오디오 핑거프린트는 상기 저장된 오디오 핑거프린트 중 특정 하나의 오디오 핑거프린트에 대응하는,
    오디오 인식 방법,
  38. 제21항에 있어서,
    상기 클라이언트 기기로 전송된 상기 정보는 상기 수신된 오디오 프로파일 벡터인, 오디오 인식 방법.
  39. 제21항에 있어서,
    상기 오디오 프로파일 벡터를 기초로 하여 음악 아이템(music item)을 추천하는 단계를 더 포함하는, 오디오 인식 방법.
  40. 제21항에 있어서,
    상기 수신된 오디오 핑거프린트와 함께 상기 클라이언트 기기로부터 사용자 평가(user rating)을 수신하는 단계;
    상기 사용자 평가 및 상기 검색된 오디오 프로파일 벡터를 기초로 하여 사용자 선호도 정보(user preference information)를 수정(modifying)하는 단계; 및
    상기 사용자 선호도 정보를 기초로 하여 음악 아이템을 추천하는 단계
    를 더 포함하는, 오디오 인식 방법.
  41. 제26항에 있어서,
    상기 오디오 피스로부터 상기 오디오 클래스까지의 거리를 가리키는 상기 수치 값은 상기 수신된 오디오 핑거프린트 및 상기 오디오 클래스 핑거프린트의 거리 계산을 기초로 하여 결정되는,
    오디오 인식 방법.
  42. 삭제
  43. 삭제
  44. 삭제
  45. 삭제
  46. 삭제
  47. 삭제
  48. 삭제
  49. 삭제
KR1020067005805A 2003-09-23 2004-09-23 오디오 핑거프린팅 시스템 및 방법 KR100838674B1 (ko)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US10/668,926 2003-09-23
US10/668,926 US7013301B2 (en) 2003-09-23 2003-09-23 Audio fingerprinting system and method

Publications (2)

Publication Number Publication Date
KR20060095988A KR20060095988A (ko) 2006-09-05
KR100838674B1 true KR100838674B1 (ko) 2008-06-16

Family

ID=34313617

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020067005805A KR100838674B1 (ko) 2003-09-23 2004-09-23 오디오 핑거프린팅 시스템 및 방법

Country Status (9)

Country Link
US (2) US7013301B2 (ko)
EP (1) EP1671207A4 (ko)
JP (1) JP2007525697A (ko)
KR (1) KR100838674B1 (ko)
CN (1) CN100437572C (ko)
AU (1) AU2004277219B2 (ko)
CA (1) CA2536080A1 (ko)
TW (1) TW200632868A (ko)
WO (1) WO2005031517A2 (ko)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101369475B1 (ko) 2013-01-23 2014-03-06 (주)엔써즈 방송 시청률 조사 시스템 및 방법
KR101661666B1 (ko) 2015-11-20 2016-09-30 광운대학교 산학협력단 하이브리드 오디오 핑거프린팅 장치 및 방법
WO2017119604A1 (ko) * 2016-01-08 2017-07-13 주식회사 아이플래테아 시청률 산출 서버, 시청률 산출 방법, 및 시청률 산출 리모트 장치

Families Citing this family (205)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20060026048A1 (en) * 1997-08-08 2006-02-02 Kolawa Adam K Method and apparatus for automated selection, organization, and recommendation of items based on user preference topography
IL127569A0 (en) 1998-09-16 1999-10-28 Comsense Technologies Ltd Interactive toys
WO2000021020A2 (en) * 1998-10-02 2000-04-13 Comsense Technologies, Ltd. Card for interaction with a computer
US6607136B1 (en) 1998-09-16 2003-08-19 Beepcard Inc. Physical presence digital authentication system
US7013301B2 (en) * 2003-09-23 2006-03-14 Predixis Corporation Audio fingerprinting system and method
US20050038819A1 (en) * 2000-04-21 2005-02-17 Hicken Wendell T. Music Recommendation system and method
US8019609B2 (en) 1999-10-04 2011-09-13 Dialware Inc. Sonic/ultrasonic authentication method
US20060217828A1 (en) * 2002-10-23 2006-09-28 Hicken Wendell T Music searching system and method
US8205237B2 (en) 2000-09-14 2012-06-19 Cox Ingemar J Identifying works, using a sub-linear time search, such as an approximate nearest neighbor search, for initiating a work-based action, such as an action on the internet
US8010988B2 (en) * 2000-09-14 2011-08-30 Cox Ingemar J Using features extracted from an audio and/or video work to obtain information about the work
US9219708B2 (en) * 2001-03-22 2015-12-22 DialwareInc. Method and system for remotely authenticating identification devices
AU2002346116A1 (en) * 2001-07-20 2003-03-03 Gracenote, Inc. Automatic identification of sound recordings
US8053659B2 (en) * 2002-10-03 2011-11-08 Polyphonic Human Media Interface, S.L. Music intelligence universe server
EP1599879A1 (en) * 2003-02-26 2005-11-30 Koninklijke Philips Electronics N.V. Handling of digital silence in audio fingerprinting
US7379875B2 (en) * 2003-10-24 2008-05-27 Microsoft Corporation Systems and methods for generating audio thumbnails
WO2005050620A1 (en) * 2003-11-18 2005-06-02 Koninklijke Philips Electronics N.V. Matching data objects by matching derived fingerprints
US8229751B2 (en) * 2004-02-26 2012-07-24 Mediaguide, Inc. Method and apparatus for automatic detection and identification of unidentified Broadcast audio or video signals
US8468183B2 (en) 2004-02-26 2013-06-18 Mobile Research Labs Ltd. Method and apparatus for automatic detection and identification of broadcast audio and video signals
US20050215239A1 (en) * 2004-03-26 2005-09-29 Nokia Corporation Feature extraction in a networked portable device
CN1898720B (zh) * 2004-07-09 2012-01-25 日本电信电话株式会社 音响信号检测系统、音响信号检测服务器、影像信号搜索装置、影像信号搜索方法、影像信号搜索程序与记录介质、信号搜索装置、信号搜索方法、及信号搜索程序与记录介质
US20060212149A1 (en) * 2004-08-13 2006-09-21 Hicken Wendell T Distributed system and method for intelligent data analysis
US7623823B2 (en) * 2004-08-31 2009-11-24 Integrated Media Measurement, Inc. Detecting and measuring exposure to media content items
US7777125B2 (en) * 2004-11-19 2010-08-17 Microsoft Corporation Constructing a table of music similarity vectors from a music similarity graph
US20060155754A1 (en) * 2004-12-08 2006-07-13 Steven Lubin Playlist driven automated content transmission and delivery system
US7567899B2 (en) * 2004-12-30 2009-07-28 All Media Guide, Llc Methods and apparatus for audio recognition
US7451078B2 (en) * 2004-12-30 2008-11-11 All Media Guide, Llc Methods and apparatus for identifying media objects
US20070189544A1 (en) 2005-01-15 2007-08-16 Outland Research, Llc Ambient sound responsive media player
US20070156676A1 (en) * 2005-09-09 2007-07-05 Outland Research, Llc System, Method and Computer Program Product for Intelligent Groupwise Media Selection
US20060224798A1 (en) * 2005-02-22 2006-10-05 Klein Mark D Personal music preference determination based on listening behavior
JP2008532200A (ja) * 2005-03-04 2008-08-14 ミュージックアイピー コーポレイション 再生リストを作成するためのスキャンシャッフル
DE102005014477A1 (de) * 2005-03-30 2006-10-12 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Vorrichtung und Verfahren zum Erzeugen eines Datenstroms und zum Erzeugen einer Multikanal-Darstellung
US7647128B2 (en) * 2005-04-22 2010-01-12 Microsoft Corporation Methods, computer-readable media, and data structures for building an authoritative database of digital audio identifier elements and identifying media items
US20060242198A1 (en) * 2005-04-22 2006-10-26 Microsoft Corporation Methods, computer-readable media, and data structures for building an authoritative database of digital audio identifier elements and identifying media items
US7613736B2 (en) * 2005-05-23 2009-11-03 Resonance Media Services, Inc. Sharing music essence in a recommendation system
US20070028262A1 (en) * 2005-07-29 2007-02-01 Zermatt Systems, Inc. Virtual discovery of content available to a device
US20080147557A1 (en) * 2005-10-03 2008-06-19 Sheehy Dennis G Display based purchase opportunity originating from in-store identification of sound recordings
JP5329968B2 (ja) * 2005-11-10 2013-10-30 サウンドハウンド インコーポレイテッド 非テキストベースの情報を記憶し、検索する方法
KR100803206B1 (ko) * 2005-11-11 2008-02-14 삼성전자주식회사 오디오 지문 생성과 오디오 데이터 검색 장치 및 방법
KR100725018B1 (ko) * 2005-11-24 2007-06-07 삼성전자주식회사 음악 내용 자동 요약 방법 및 그 장치
JP2007172138A (ja) * 2005-12-20 2007-07-05 Sony Corp コンテンツ再生装置、リスト修正装置、コンテンツ再生方法及びリスト修正方法
US20090006337A1 (en) * 2005-12-30 2009-01-01 Mediaguide, Inc. Method and apparatus for automatic detection and identification of unidentified video signals
KR100774585B1 (ko) * 2006-02-10 2007-11-09 삼성전자주식회사 변조 스펙트럼을 이용한 음악 정보 검색 방법 및 그 장치
EP1826716A1 (en) 2006-02-22 2007-08-29 Sony Deutschland Gmbh Method for updating a user profile
US8285595B2 (en) 2006-03-29 2012-10-09 Napo Enterprises, Llc System and method for refining media recommendations
WO2007112111A2 (en) * 2006-03-29 2007-10-04 Packetvideo Corp. System and method for securing content ratings
US7772478B2 (en) * 2006-04-12 2010-08-10 Massachusetts Institute Of Technology Understanding music
US8156132B1 (en) 2007-07-02 2012-04-10 Pinehill Technology, Llc Systems for comparing image fingerprints
US9020964B1 (en) 2006-04-20 2015-04-28 Pinehill Technology, Llc Generation of fingerprints for multimedia content based on vectors and histograms
US8463000B1 (en) 2007-07-02 2013-06-11 Pinehill Technology, Llc Content identification based on a search of a fingerprint database
US7840540B2 (en) 2006-04-20 2010-11-23 Datascout, Inc. Surrogate hashing
US8549022B1 (en) 2007-07-02 2013-10-01 Datascout, Inc. Fingerprint generation of multimedia content based on a trigger point with the multimedia content
US8903843B2 (en) 2006-06-21 2014-12-02 Napo Enterprises, Llc Historical media recommendation service
US9003056B2 (en) 2006-07-11 2015-04-07 Napo Enterprises, Llc Maintaining a minimum level of real time media recommendations in the absence of online friends
US8059646B2 (en) 2006-07-11 2011-11-15 Napo Enterprises, Llc System and method for identifying music content in a P2P real time recommendation network
US8327266B2 (en) 2006-07-11 2012-12-04 Napo Enterprises, Llc Graphical user interface system for allowing management of a media item playlist based on a preference scoring system
US7970922B2 (en) 2006-07-11 2011-06-28 Napo Enterprises, Llc P2P real time media recommendations
US7680959B2 (en) 2006-07-11 2010-03-16 Napo Enterprises, Llc P2P network for providing real time media recommendations
US8805831B2 (en) 2006-07-11 2014-08-12 Napo Enterprises, Llc Scoring and replaying media items
US8620699B2 (en) * 2006-08-08 2013-12-31 Napo Enterprises, Llc Heavy influencer media recommendations
US8090606B2 (en) 2006-08-08 2012-01-03 Napo Enterprises, Llc Embedded media recommendations
US20080051029A1 (en) * 2006-08-25 2008-02-28 Bradley James Witteman Phone-based broadcast audio identification
US7590035B1 (en) 2006-08-29 2009-09-15 Resonance Media Services, Inc. System and method for generating and using table of content (TOC) prints
KR100784975B1 (ko) 2006-10-09 2007-12-11 삼성전자주식회사 이동통신 단말기의 데이터베이스 운용 방법 및 장치
US8874655B2 (en) * 2006-12-13 2014-10-28 Napo Enterprises, Llc Matching participants in a P2P recommendation network loosely coupled to a subscription service
US20090070185A1 (en) * 2007-01-17 2009-03-12 Concert Technology Corporation System and method for recommending a digital media subscription service
CN101226526A (zh) * 2007-01-17 2008-07-23 上海怡得网络有限公司 一种基于音乐片段信息查询的音乐搜索方法
US7873634B2 (en) * 2007-03-12 2011-01-18 Hitlab Ulc. Method and a system for automatic evaluation of digital files
JP4872751B2 (ja) * 2007-03-29 2012-02-08 ヤマハ株式会社 オーディオ信号配信管理システム、オーディオ信号取得送信装置、オーディオ信号識別出力装置及びオーディオ信号配信装置
US9224427B2 (en) 2007-04-02 2015-12-29 Napo Enterprises LLC Rating media item recommendations using recommendation paths and/or media item usage
US8112720B2 (en) 2007-04-05 2012-02-07 Napo Enterprises, Llc System and method for automatically and graphically associating programmatically-generated media item recommendations related to a user's socially recommended media items
US8280539B2 (en) * 2007-04-06 2012-10-02 The Echo Nest Corporation Method and apparatus for automatically segueing between audio tracks
US7949649B2 (en) * 2007-04-10 2011-05-24 The Echo Nest Corporation Automatically acquiring acoustic and cultural information about music
US8073854B2 (en) * 2007-04-10 2011-12-06 The Echo Nest Corporation Determining the similarity of music using cultural and acoustic information
US10489795B2 (en) 2007-04-23 2019-11-26 The Nielsen Company (Us), Llc Determining relative effectiveness of media content items
US20080300702A1 (en) * 2007-05-29 2008-12-04 Universitat Pompeu Fabra Music similarity systems and methods using descriptors
US8285776B2 (en) 2007-06-01 2012-10-09 Napo Enterprises, Llc System and method for processing a received media item recommendation message comprising recommender presence information
US9164993B2 (en) 2007-06-01 2015-10-20 Napo Enterprises, Llc System and method for propagating a media item recommendation message comprising recommender presence information
US20090049045A1 (en) 2007-06-01 2009-02-19 Concert Technology Corporation Method and system for sorting media items in a playlist on a media device
US9037632B2 (en) 2007-06-01 2015-05-19 Napo Enterprises, Llc System and method of generating a media item recommendation message with recommender presence information
US8839141B2 (en) 2007-06-01 2014-09-16 Napo Enterprises, Llc Method and system for visually indicating a replay status of media items on a media device
US20080301187A1 (en) * 2007-06-01 2008-12-04 Concert Technology Corporation Enhanced media item playlist comprising presence information
KR100916310B1 (ko) * 2007-06-05 2009-09-10 주식회사 코난테크놀로지 오디오 신호처리 기반의 음악 및 동영상간의 교차 추천 시스템 및 방법
JP5090523B2 (ja) * 2007-06-06 2012-12-05 ドルビー ラボラトリーズ ライセンシング コーポレイション 複数の検索の組み合わせを使用して、オーディオ/ビデオの指紋検索精度を改善する方法及び装置
US8140331B2 (en) * 2007-07-06 2012-03-20 Xia Lou Feature extraction for identification and classification of audio signals
EP2193420A4 (en) 2007-07-27 2010-10-06 Synergy Sports Technology Llc SYSTEM AND METHOD FOR USING A WEBSITE CONTAINING VIDEOS READING LISTS AS INTRODUCED ON A DOWNLOAD MANAGER
US9996612B2 (en) * 2007-08-08 2018-06-12 Sony Corporation System and method for audio identification and metadata retrieval
US8407230B2 (en) * 2007-08-13 2013-03-26 Yahoo! Inc. System and method for identifying similar media objects
US20090049030A1 (en) * 2007-08-13 2009-02-19 Concert Technology Corporation System and method for reducing the multiple listing of a media item in a playlist
EP2198376B1 (en) * 2007-10-05 2016-01-27 Dolby Laboratories Licensing Corp. Media fingerprints that reliably correspond to media content
US8494842B2 (en) * 2007-11-02 2013-07-23 Soundhound, Inc. Vibrato detection modules in a system for automatic transcription of sung or hummed melodies
US7865522B2 (en) 2007-11-07 2011-01-04 Napo Enterprises, Llc System and method for hyping media recommendations in a media recommendation system
US9060034B2 (en) 2007-11-09 2015-06-16 Napo Enterprises, Llc System and method of filtering recommenders in a media item recommendation system
US9224150B2 (en) 2007-12-18 2015-12-29 Napo Enterprises, Llc Identifying highly valued recommendations of users in a media recommendation network
US8396951B2 (en) 2007-12-20 2013-03-12 Napo Enterprises, Llc Method and system for populating a content repository for an internet radio service based on a recommendation network
US9734507B2 (en) 2007-12-20 2017-08-15 Napo Enterprise, Llc Method and system for simulating recommendations in a social network for an offline user
US8117193B2 (en) 2007-12-21 2012-02-14 Lemi Technology, Llc Tunersphere
US8316015B2 (en) 2007-12-21 2012-11-20 Lemi Technology, Llc Tunersphere
US8060525B2 (en) * 2007-12-21 2011-11-15 Napo Enterprises, Llc Method and system for generating media recommendations in a distributed environment based on tagging play history information with location information
US8776244B2 (en) * 2007-12-24 2014-07-08 Intel Corporation System and method for the generation of a content fingerprint for content identification
US20100023499A1 (en) * 2007-12-24 2010-01-28 Brian David Johnson System and method for a content fingerprint filter
GB2468080A (en) * 2007-12-31 2010-08-25 Orpheus Media Res Llc System and method for adaptive melodic segmentation and motivic identification
US8084677B2 (en) * 2007-12-31 2011-12-27 Orpheus Media Research, Llc System and method for adaptive melodic segmentation and motivic identification
WO2009093866A2 (en) * 2008-01-23 2009-07-30 Lg Electronics Inc. A method and an apparatus for processing an audio signal
EP2083585B1 (en) 2008-01-23 2010-09-15 LG Electronics Inc. A method and an apparatus for processing an audio signal
EP2101501A1 (en) * 2008-03-10 2009-09-16 Sony Corporation Method for recommendation of audio
US8725740B2 (en) * 2008-03-24 2014-05-13 Napo Enterprises, Llc Active playlist having dynamic media item groups
US8484311B2 (en) 2008-04-17 2013-07-09 Eloy Technology, Llc Pruning an aggregate media collection
US8275177B2 (en) * 2008-05-23 2012-09-25 Oracle America, Inc. System and method for media fingerprint indexing
GB2460306B (en) 2008-05-29 2013-02-13 Intrasonics Sarl Data embedding system
US20090307084A1 (en) * 2008-06-10 2009-12-10 Integrated Media Measurement, Inc. Measuring Exposure To Media Across Multiple Media Delivery Mechanisms
US20090307061A1 (en) * 2008-06-10 2009-12-10 Integrated Media Measurement, Inc. Measuring Exposure To Media
WO2010027847A1 (en) * 2008-08-26 2010-03-11 Dolby Laboratories Licensing Corporation Robust media fingerprints
US20100057527A1 (en) * 2008-08-29 2010-03-04 Disney Enterprises, Inc. System and method for personalized action based on a comparison of delivered content with a content fingerprint database
US8966394B2 (en) * 2008-09-08 2015-02-24 Apple Inc. System and method for playlist generation based on similarity data
CN101673262B (zh) * 2008-09-12 2012-10-10 未序网络科技(上海)有限公司 音频内容的搜索方法
US20100070537A1 (en) * 2008-09-17 2010-03-18 Eloy Technology, Llc System and method for managing a personalized universal catalog of media items
US8880599B2 (en) * 2008-10-15 2014-11-04 Eloy Technology, Llc Collection digest for a media sharing system
US8484227B2 (en) 2008-10-15 2013-07-09 Eloy Technology, Llc Caching and synching process for a media sharing system
CN101394604B (zh) * 2008-10-20 2011-09-28 中国移动通信集团北京有限公司 一种多媒体消息的识别方法和系统
US8977974B2 (en) * 2008-12-08 2015-03-10 Apple Inc. Ambient noise based augmentation of media playback
US8200602B2 (en) 2009-02-02 2012-06-12 Napo Enterprises, Llc System and method for creating thematic listening experiences in a networked peer media recommendation environment
US20100205222A1 (en) * 2009-02-10 2010-08-12 Tom Gajdos Music profiling
GB0904113D0 (en) * 2009-03-10 2009-04-22 Intrasonics Ltd Video and audio bookmarking
US9075897B2 (en) 2009-05-08 2015-07-07 Dolby Laboratories Licensing Corporation Storing and searching fingerprints derived from media content based on a classification of the media content
US8489774B2 (en) * 2009-05-27 2013-07-16 Spot411 Technologies, Inc. Synchronized delivery of interactive content
WO2010138777A1 (en) * 2009-05-27 2010-12-02 Arsh Technologies, Llc Automatic resource retrieval and use
US8620967B2 (en) * 2009-06-11 2013-12-31 Rovi Technologies Corporation Managing metadata for occurrences of a recording
CN101594527B (zh) * 2009-06-30 2011-01-05 成都艾索语音技术有限公司 从音频视频流中高精度检测模板的两阶段方法
US20110063503A1 (en) * 2009-07-06 2011-03-17 Brand Steven M Synchronizing secondary content to a multimedia presentation
US20110041154A1 (en) * 2009-08-14 2011-02-17 All Media Guide, Llc Content Recognition and Synchronization on a Television or Consumer Electronics Device
US8161071B2 (en) 2009-09-30 2012-04-17 United Video Properties, Inc. Systems and methods for audio asset storage and management
US8677400B2 (en) * 2009-09-30 2014-03-18 United Video Properties, Inc. Systems and methods for identifying audio content using an interactive media guidance application
US20110078020A1 (en) * 2009-09-30 2011-03-31 Lajoie Dan Systems and methods for identifying popular audio assets
US8321394B2 (en) * 2009-11-10 2012-11-27 Rovi Technologies Corporation Matching a fingerprint
US20110173185A1 (en) * 2010-01-13 2011-07-14 Rovi Technologies Corporation Multi-stage lookup for rolling audio recognition
US8886531B2 (en) * 2010-01-13 2014-11-11 Rovi Technologies Corporation Apparatus and method for generating an audio fingerprint and using a two-stage query
US8855101B2 (en) 2010-03-09 2014-10-07 The Nielsen Company (Us), Llc Methods, systems, and apparatus to synchronize actions of audio source monitors
AU2011252761B2 (en) * 2010-05-13 2016-12-15 Iomniscient Pty Ltd Automatic identity enrolment
US8542869B2 (en) * 2010-06-02 2013-09-24 Dolby Laboratories Licensing Corporation Projection based hashing that balances robustness and sensitivity of media fingerprints
US8584198B2 (en) * 2010-11-12 2013-11-12 Google Inc. Syndication including melody recognition and opt out
CN103250205B (zh) * 2010-12-07 2017-05-10 英派尔科技开发有限公司 用于端到端体验质量测量的音频指纹差
WO2012091938A1 (en) 2010-12-30 2012-07-05 Dolby Laboratories Licensing Corporation Ranking representative segments in media data
CN102622353B (zh) * 2011-01-27 2013-10-16 天脉聚源(北京)传媒科技有限公司 一种固定音频检索方法
US9093120B2 (en) 2011-02-10 2015-07-28 Yahoo! Inc. Audio fingerprint extraction by scaling in time and resampling
US8589171B2 (en) 2011-03-17 2013-11-19 Remote Media, Llc System and method for custom marking a media file for file matching
US8688631B2 (en) 2011-03-17 2014-04-01 Alexander Savenok System and method for media file synchronization
US8478719B2 (en) 2011-03-17 2013-07-02 Remote Media LLC System and method for media file synchronization
JP5333517B2 (ja) * 2011-05-26 2013-11-06 ヤマハ株式会社 データ処理装置およびプログラム
CN102214219B (zh) * 2011-06-07 2013-04-17 盛乐信息技术(上海)有限公司 音视频内容检索系统及其方法
US8805560B1 (en) 2011-10-18 2014-08-12 Google Inc. Noise based interest point density pruning
WO2012163013A1 (zh) * 2011-10-19 2012-12-06 华为技术有限公司 音乐查询方法和装置
US8909667B2 (en) 2011-11-01 2014-12-09 Lemi Technology, Llc Systems, methods, and computer readable media for generating recommendations in a media recommendation system
US8492633B2 (en) 2011-12-02 2013-07-23 The Echo Nest Corporation Musical fingerprinting
US8586847B2 (en) * 2011-12-02 2013-11-19 The Echo Nest Corporation Musical fingerprinting based on onset intervals
US8949872B2 (en) * 2011-12-20 2015-02-03 Yahoo! Inc. Audio fingerprint for content identification
CN103294696B (zh) * 2012-02-27 2018-01-19 上海果壳电子有限公司 音视频内容检索方法及系统
KR101407334B1 (ko) * 2012-04-13 2014-06-16 주식회사 네오위즈인터넷 음원 서비스를 제공하는 방법, 단말 및 서버
US9052986B1 (en) * 2012-04-18 2015-06-09 Google Inc. Pitch shift resistant audio matching
US9703932B2 (en) * 2012-04-30 2017-07-11 Excalibur Ip, Llc Continuous content identification of broadcast content
US9235867B2 (en) * 2012-06-04 2016-01-12 Microsoft Technology Licensing, Llc Concurrent media delivery
US8938089B1 (en) * 2012-06-26 2015-01-20 Google Inc. Detection of inactive broadcasts during live stream ingestion
WO2014002064A1 (en) 2012-06-29 2014-01-03 Ecole Polytechnique Federale De Lausanne (Epfl) System and method for media library navigation and recommendation
EP2731030A1 (en) * 2012-11-13 2014-05-14 Samsung Electronics Co., Ltd Music information searching method and apparatus thereof
US9159327B1 (en) * 2012-12-20 2015-10-13 Google Inc. System and method for adding pitch shift resistance to an audio fingerprint
US9529907B2 (en) * 2012-12-31 2016-12-27 Google Inc. Hold back and real time ranking of results in a streaming matching system
US9679583B2 (en) * 2013-03-15 2017-06-13 Facebook, Inc. Managing silence in audio signal identification
CN104125509B (zh) 2013-04-28 2015-09-30 腾讯科技(深圳)有限公司 节目识别方法、装置及服务器
NO341316B1 (no) * 2013-05-31 2017-10-09 Pexip AS Fremgangsmåte og system for å assosiere en ekstern enhet til en videokonferansesesjon.
CN104239306A (zh) * 2013-06-08 2014-12-24 华为技术有限公司 多媒体指纹哈希矢量构建方法及其装置
CN103440313B (zh) * 2013-08-27 2018-10-16 复旦大学 基于音频指纹特征的音乐检索系统
US9325646B2 (en) 2013-10-28 2016-04-26 Verizon Patent And Licensing Inc. Providing contextual messages relating to currently accessed content
WO2015100430A1 (en) 2013-12-24 2015-07-02 Digimarc Corporation Methods and system for cue detection from audio input, low-power data processing and related arrangements
US9583121B2 (en) 2014-05-16 2017-02-28 Alphonso Inc. Apparatus and method for determining co-location of services
US20160005410A1 (en) * 2014-07-07 2016-01-07 Serguei Parilov System, apparatus, and method for audio fingerprinting and database searching for audio identification
US9905233B1 (en) 2014-08-07 2018-02-27 Digimarc Corporation Methods and apparatus for facilitating ambient content recognition using digital watermarks, and related arrangements
JP6636506B2 (ja) * 2014-09-02 2020-01-29 コーニンクレッカ フィリップス エヌ ヴェKoninklijke Philips N.V. 画像のフィンガプリント生成
US9516466B2 (en) 2014-12-15 2016-12-06 Google Inc. Establishing presence by identifying audio sample and position
CN104881486A (zh) * 2015-06-05 2015-09-02 腾讯科技(北京)有限公司 一种信息查询方法、终端设备及系统
US9940948B2 (en) * 2015-08-02 2018-04-10 Resonance Software Llc Systems and methods for enabling information exchanges between devices
US10504300B2 (en) * 2015-09-04 2019-12-10 Michael J Costabile System for remotely starting and stopping a time clock in an environment having a plurality of distinct activation signals
US9928840B2 (en) 2015-10-16 2018-03-27 Google Llc Hotword recognition
US9747926B2 (en) 2015-10-16 2017-08-29 Google Inc. Hotword recognition
JP6463710B2 (ja) 2015-10-16 2019-02-06 グーグル エルエルシー ホットワード認識
US10409546B2 (en) 2015-10-27 2019-09-10 Super Hi-Fi, Llc Audio content production, audio sequencing, and audio blending system and method
US9973521B2 (en) 2015-12-28 2018-05-15 International Business Machines Corporation System and method for field extraction of data contained within a log stream
WO2017222569A1 (en) 2016-06-22 2017-12-28 Gracenote, Inc. Matching audio fingerprints
CN106910494B (zh) * 2016-06-28 2020-11-13 创新先进技术有限公司 一种音频识别方法和装置
GB2556023B (en) * 2016-08-15 2022-02-09 Intrasonics Sarl Audio matching
TWI584139B (zh) * 2016-09-09 2017-05-21 Speech recognition system and its information processing method applied to non - real - time signal source
US9854418B1 (en) 2016-09-15 2017-12-26 International Business Machines Corporation Automatic friend connection within a social network
CN106474738A (zh) * 2016-11-17 2017-03-08 成都中科创达软件有限公司 一种基于指纹识别的虚拟电子琴弹奏方法及装置
US9934785B1 (en) 2016-11-30 2018-04-03 Spotify Ab Identification of taste attributes from an audio signal
WO2018218034A1 (en) * 2017-05-25 2018-11-29 J. W. Pepper & Son, Inc. Sheet music search and discovery system
US10445366B2 (en) * 2017-07-17 2019-10-15 Jaap Dekkinga Methods and systems for saving a URL on a device
EP3474561A1 (en) 2017-10-23 2019-04-24 Advanced Digital Broadcast S.A. System and method for automatic adjustment of scheduled recording time
EP3474556A1 (en) 2017-10-23 2019-04-24 Advanced Digital Broadcast S.A. System and method for automatic adjustment of scheduled recording time
EP3477956A1 (en) 2017-10-31 2019-05-01 Advanced Digital Broadcast S.A. System and method for automatic categorization of audio/video content
US11032580B2 (en) 2017-12-18 2021-06-08 Dish Network L.L.C. Systems and methods for facilitating a personalized viewing experience
US10365885B1 (en) * 2018-02-21 2019-07-30 Sling Media Pvt. Ltd. Systems and methods for composition of audio content from multi-object audio
GB2578082A (en) * 2018-05-23 2020-04-22 Zoo Digital Ltd Comparing Audiovisual Products
CN112494950A (zh) * 2019-08-26 2021-03-16 上海海姆网络科技有限公司 一种网络游戏防沉迷系统及方法
US20220019618A1 (en) * 2020-07-15 2022-01-20 Pavan Kumar Dronamraju Automatically converting and storing of input audio stream into an indexed collection of rhythmic nodal structure, using the same format for matching and effective retrieval
CN112420023B (zh) * 2020-11-26 2022-03-25 杭州音度人工智能有限公司 一种音乐侵权检测方法
US11508395B1 (en) * 2021-05-03 2022-11-22 Dell Products, L.P. Intelligent selection of audio signatures based upon contextual information to perform management actions
CN115440234B (zh) * 2022-11-08 2023-03-24 合肥工业大学 基于midi和对抗生成网络的音频隐写方法和系统

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5644727A (en) * 1987-04-15 1997-07-01 Proprietary Financial Products, Inc. System for the operation and management of one or more financial accounts through the use of a digital communication and computation system for exchange, investment and borrowing

Family Cites Families (95)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US608455A (en) * 1898-08-02 Combined meat saw
DE3511832C2 (de) 1985-03-30 1995-02-16 Felix Johannes Dipl I Overbeck Einrichtung für die Informationsvermittlung
US4996642A (en) 1987-10-01 1991-02-26 Neonics, Inc. System and method for recommending items
US5124911A (en) * 1988-04-15 1992-06-23 Image Engineering, Inc. Method of evaluating consumer choice through concept testing for the marketing and development of consumer products
US5233520A (en) 1990-12-19 1993-08-03 The United States Of America As Represented By The Secretary Of Agriculture Method and system for measurement of intake of foods, nutrients and other food components in the diet
US5210611A (en) * 1991-08-12 1993-05-11 Keen Y. Yee Automatic tuning radio/TV using filtered seek
US5436653A (en) * 1992-04-30 1995-07-25 The Arbitron Company Method and system for recognition of broadcast segments
US5832446A (en) 1993-03-31 1998-11-03 Cornell Research Foundation, Inc. Interactive database method and system for food and beverage preparation
US5812937B1 (en) * 1993-04-08 2000-09-19 Digital Dj Inc Broadcast data system with multiple-tuner receiver
US5899502A (en) 1993-07-07 1999-05-04 Del Giorno; Joseph Method of making individualized restaurant menus
US5583763A (en) 1993-09-09 1996-12-10 Mni Interactive Method and apparatus for recommending selections based on preferences in a multi-user system
US5412564A (en) * 1994-02-03 1995-05-02 Ecer; Gunes M. System and method for diet control
US5724567A (en) 1994-04-25 1998-03-03 Apple Computer, Inc. System for directing relevance-ranked data objects to computer users
JP3246214B2 (ja) 1994-08-24 2002-01-15 松下電器産業株式会社 誘導加熱調理器
JP3121500B2 (ja) 1994-08-25 2000-12-25 株式会社日本食システム研究所 病院用献立作成システムおよび病院用献立作成方法
JP2897659B2 (ja) * 1994-10-31 1999-05-31 ヤマハ株式会社 カラオケ装置
US5758257A (en) 1994-11-29 1998-05-26 Herz; Frederick System and method for scheduling broadcast of and access to video programs and other data using customer profiles
JP3360705B2 (ja) * 1994-12-21 2002-12-24 ソニー株式会社 放送受信装置および放送受信方法
US5749081A (en) 1995-04-06 1998-05-05 Firefly Network, Inc. System and method for recommending items to a user
US6046021A (en) 1995-04-12 2000-04-04 Biolog, Inc. Comparative phenotype analysis of two or more microorganisms using a plurality of substrates within a multiwell testing device
US5616876A (en) * 1995-04-19 1997-04-01 Microsoft Corporation System and methods for selecting music on the basis of subjective content
US6112186A (en) 1995-06-30 2000-08-29 Microsoft Corporation Distributed system for facilitating exchange of user information and opinion using automated collaborative filtering
IL118580A0 (en) 1995-06-30 1996-10-16 Massachusetts Inst Technology Method and apparatus for item recommendation using automated collaborative filtering
US6041311A (en) * 1995-06-30 2000-03-21 Microsoft Corporation Method and apparatus for item recommendation using automated collaborative filtering
US5978766A (en) 1995-12-20 1999-11-02 Starwave Corporation Machine, method and medium for assisted selection of information from a choice space
US5859414A (en) * 1995-12-29 1999-01-12 Aironet Wireless Communications, Inc. Interactive customer information terminal
US5960440A (en) 1996-01-16 1999-09-28 Brother International Corporation Kitchen information and database management method and apparatus
US5872850A (en) * 1996-02-02 1999-02-16 Microsoft Corporation System for enabling information marketplace
US5704017A (en) 1996-02-16 1997-12-30 Microsoft Corporation Collaborative filtering utilizing a belief network
US5790426A (en) 1996-04-30 1998-08-04 Athenium L.L.C. Automated collaborative filtering system
US5954640A (en) * 1996-06-27 1999-09-21 Szabo; Andrew J. Nutritional optimization method
US6092105A (en) 1996-07-12 2000-07-18 Intraware, Inc. System and method for vending retail software and other sets of information to end users
US5918223A (en) * 1996-07-22 1999-06-29 Muscle Fish Method and article of manufacture for content-based analysis, storage, retrieval, and segmentation of audio information
US5979757A (en) 1996-09-05 1999-11-09 Symbol Technologies, Inc. Method and system for presenting item information using a portable data terminal
US6148094A (en) * 1996-09-30 2000-11-14 David J. Kinsella Pointing device with biometric sensor
US6088455A (en) 1997-01-07 2000-07-11 Logan; James D. Methods and apparatus for selectively reproducing segments of broadcast programming
US5963948A (en) 1996-11-15 1999-10-05 Shilcrat; Esther Dina Method for generating a path in an arbitrary physical structure
US6012051A (en) 1997-02-06 2000-01-04 America Online, Inc. Consumer profiling system with analytic decision processor
US6823225B1 (en) 1997-02-12 2004-11-23 Im Networks, Inc. Apparatus for distributing and playing audio information
JPH10326289A (ja) 1997-03-28 1998-12-08 Nippon Telegr & Teleph Corp <Ntt> 情報提供方法、システムおよびそのプログラムを格納した記憶媒体
US5987525A (en) * 1997-04-15 1999-11-16 Cddb, Inc. Network delivery of interactive entertainment synchronized to playback of audio recordings
US6370513B1 (en) 1997-08-08 2002-04-09 Parasoft Corporation Method and apparatus for automated selection, organization, and recommendation of items
US6236974B1 (en) 1997-08-08 2001-05-22 Parasoft Corporation Method and apparatus for automated selection and organization of products including menus
US20060026048A1 (en) * 1997-08-08 2006-02-02 Kolawa Adam K Method and apparatus for automated selection, organization, and recommendation of items based on user preference topography
US6236978B1 (en) * 1997-11-14 2001-05-22 New York University System and method for dynamic profiling of users in one-to-one applications
US6009392A (en) * 1998-01-15 1999-12-28 International Business Machines Corporation Training speech recognition by matching audio segment frequency of occurrence with frequency of words and letter combinations in a corpus
US6018738A (en) 1998-01-22 2000-01-25 Microsft Corporation Methods and apparatus for matching entities and for predicting an attribute of an entity based on an attribute frequency value
US5969283A (en) * 1998-06-17 1999-10-19 Looney Productions, Llc Music organizer and entertainment center
US6953886B1 (en) * 1998-06-17 2005-10-11 Looney Productions, Llc Media organizer and entertainment center
US6358546B1 (en) * 1999-01-15 2002-03-19 Ralston Purina Company Methods for customizing pet food
US20050038819A1 (en) * 2000-04-21 2005-02-17 Hicken Wendell T. Music Recommendation system and method
US7013301B2 (en) * 2003-09-23 2006-03-14 Predixis Corporation Audio fingerprinting system and method
US20010044719A1 (en) * 1999-07-02 2001-11-22 Mitsubishi Electric Research Laboratories, Inc. Method and system for recognizing, indexing, and searching acoustic signals
US20060242665A1 (en) * 1999-07-20 2006-10-26 United Video Properties, Inc. Interactive television program guide systems with initial channel tuning
US6941275B1 (en) * 1999-10-07 2005-09-06 Remi Swierczek Music identification system
US7022905B1 (en) * 1999-10-18 2006-04-04 Microsoft Corporation Classification of information and use of classifications in searching and retrieval of information
US6192340B1 (en) * 1999-10-19 2001-02-20 Max Abecassis Integration of music from a personal library with real-time information
US6961430B1 (en) * 1999-11-10 2005-11-01 The Directv Group, Inc. Method and apparatus for background caching of encrypted programming data for later playback
US7743092B2 (en) * 1999-11-12 2010-06-22 Wood Lawson A Method for recognizing and distributing music
US6288319B1 (en) * 1999-12-02 2001-09-11 Gary Catona Electronic greeting card with a custom audio mix
US7010485B1 (en) * 2000-02-03 2006-03-07 International Business Machines Corporation Method and system of audio file searching
US6442517B1 (en) * 2000-02-18 2002-08-27 First International Digital, Inc. Methods and system for encoding an audio sequence with synchronized data and outputting the same
US6721489B1 (en) * 2000-03-08 2004-04-13 Phatnoise, Inc. Play list manager
US6539395B1 (en) * 2000-03-22 2003-03-25 Mood Logic, Inc. Method for creating a database for comparing music
US20010053944A1 (en) * 2000-03-31 2001-12-20 Marks Michael B. Audio internet navigation system
US6453252B1 (en) * 2000-05-15 2002-09-17 Creative Technology Ltd. Process for identifying audio content
WO2002001439A2 (en) 2000-06-29 2002-01-03 Musicgenome.Com Inc. Using a system for prediction of musical preferences for the distribution of musical content over cellular networks
US7075000B2 (en) * 2000-06-29 2006-07-11 Musicgenome.Com Inc. System and method for prediction of musical preferences
US6657117B2 (en) * 2000-07-14 2003-12-02 Microsoft Corporation System and methods for providing automatic classification of media entities according to tempo properties
US6963975B1 (en) * 2000-08-11 2005-11-08 Microsoft Corporation System and method for audio fingerprinting
JP2002132278A (ja) 2000-07-19 2002-05-09 Chii-Shin Chan 旋律信号を通して歌を検索するための方法
US6990453B2 (en) * 2000-07-31 2006-01-24 Landmark Digital Services Llc System and methods for recognizing sound and music signals in high noise and distortion
US6671550B2 (en) * 2000-09-20 2003-12-30 Medtronic, Inc. System and method for determining location and tissue contact of an implantable medical device within a body
US6697779B1 (en) * 2000-09-29 2004-02-24 Apple Computer, Inc. Combined dual spectral and temporal alignment method for user authentication by voice
FI20002161A (fi) * 2000-09-29 2002-03-30 Nokia Mobile Phones Ltd Menetelmä ja järjestelmä melodian tunnistamiseksi
US6512837B1 (en) * 2000-10-11 2003-01-28 Digimarc Corporation Watermarks carrying content dependent signal metrics for detecting and characterizing signal alteration
US7031980B2 (en) * 2000-11-02 2006-04-18 Hewlett-Packard Development Company, L.P. Music similarity function based on signal analysis
DE10058811A1 (de) * 2000-11-27 2002-06-13 Philips Corp Intellectual Pty Verfahren zur Identifizierung von Musikstücken
CN100511422C (zh) * 2000-12-07 2009-07-08 索尼公司 内容检索方法和装置、通信系统和通信方法
US6961550B2 (en) * 2000-12-12 2005-11-01 International Business Machines Corporation Radio receiver that changes function according to the output of an internal voice-only detector
US7844666B2 (en) * 2000-12-12 2010-11-30 Microsoft Corporation Controls and displays for acquiring preferences, inspecting behavior, and guiding the learning and decision policies of an adaptive communications prioritization and routing system
US6725102B2 (en) * 2001-02-14 2004-04-20 Kinpo Electronics Inc. Automatic operation system and a method of operating the same
CA2742644C (en) * 2001-02-20 2016-04-12 Caron S. Ellis Multiple radio signal processing and storing method and apparatus
EP1244093B1 (en) * 2001-03-22 2010-10-06 Panasonic Corporation Sound features extracting apparatus, sound data registering apparatus, sound data retrieving apparatus and methods and programs for implementing the same
US7003515B1 (en) * 2001-05-16 2006-02-21 Pandora Media, Inc. Consumer item matching method and system
AU2002346116A1 (en) * 2001-07-20 2003-03-03 Gracenote, Inc. Automatic identification of sound recordings
US20030072463A1 (en) * 2001-10-17 2003-04-17 E-Lead Electronic Co., Ltd. Sound-activated song selection broadcasting apparatus
JP4088749B2 (ja) * 2001-11-09 2008-05-21 ソニー株式会社 情報処理装置および情報処理方法、並びにプログラム
US6995309B2 (en) * 2001-12-06 2006-02-07 Hewlett-Packard Development Company, L.P. System and method for music identification
US6941324B2 (en) * 2002-03-21 2005-09-06 Microsoft Corporation Methods and systems for processing playlists
US6933432B2 (en) * 2002-03-28 2005-08-23 Koninklijke Philips Electronics N.V. Media player with “DJ” mode
US6967275B2 (en) * 2002-06-25 2005-11-22 Irobot Corporation Song-matching system and method
US6996390B2 (en) * 2002-06-26 2006-02-07 Microsoft Corporation Smart car radio
US7081579B2 (en) * 2002-10-03 2006-07-25 Polyphonic Human Media Interface, S.L. Method and system for music recommendation
US8185840B2 (en) * 2003-08-15 2012-05-22 National Instruments Corporation Mixed signal analysis system and method of use

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5644727A (en) * 1987-04-15 1997-07-01 Proprietary Financial Products, Inc. System for the operation and management of one or more financial accounts through the use of a digital communication and computation system for exchange, investment and borrowing

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101369475B1 (ko) 2013-01-23 2014-03-06 (주)엔써즈 방송 시청률 조사 시스템 및 방법
KR101661666B1 (ko) 2015-11-20 2016-09-30 광운대학교 산학협력단 하이브리드 오디오 핑거프린팅 장치 및 방법
WO2017119604A1 (ko) * 2016-01-08 2017-07-13 주식회사 아이플래테아 시청률 산출 서버, 시청률 산출 방법, 및 시청률 산출 리모트 장치
US10587921B2 (en) 2016-01-08 2020-03-10 Iplateia Inc. Viewer rating calculation server, method for calculating viewer rating, and viewer rating calculation remote apparatus

Also Published As

Publication number Publication date
KR20060095988A (ko) 2006-09-05
TW200632868A (en) 2006-09-16
JP2007525697A (ja) 2007-09-06
CA2536080A1 (en) 2005-04-07
CN100437572C (zh) 2008-11-26
WO2005031517A2 (en) 2005-04-07
AU2004277219A1 (en) 2005-04-07
EP1671207A2 (en) 2006-06-21
US20060190450A1 (en) 2006-08-24
CN101014953A (zh) 2007-08-08
EP1671207A4 (en) 2008-12-17
US7013301B2 (en) 2006-03-14
WO2005031517A3 (en) 2006-08-31
US7487180B2 (en) 2009-02-03
AU2004277219B2 (en) 2009-07-16
US20050065976A1 (en) 2005-03-24

Similar Documents

Publication Publication Date Title
KR100838674B1 (ko) 오디오 핑거프린팅 시스템 및 방법
JP4945877B2 (ja) 高い雑音、歪み環境下でサウンド・楽音信号を認識するシステムおよび方法
KR100717387B1 (ko) 유사곡 검색 방법 및 그 장치
US7080253B2 (en) Audio fingerprinting
US20070106406A1 (en) Music-piece classifying apparatus and method, and related computer program
JP2004534274A (ja) 内容ベースのマルチメディア情報検索で使用するためデジタル表示で音楽情報を表示する方法およびシステム
CN1890665A (zh) 旋律数据库搜索
CN111192601A (zh) 音乐标注方法、装置、电子设备及介质
Gulati et al. An evaluation of methodologies for melodic similarity in audio recordings of indian art music
Nam et al. Intelligent query by humming system based on score level fusion of multiple classifiers
Zhang et al. A novel singer identification method using GMM-UBM
JP3934556B2 (ja) 信号識別子の抽出方法及びその装置、信号識別子からデータベースを作成する方法及びその装置、及び、検索時間領域信号を参照する方法及びその装置
Shirali-Shahreza et al. Fast and scalable system for automatic artist identification
US10776420B2 (en) Fingerprint clustering for content-based audio recognition
JP2004531758A5 (ko)
Thomas et al. Detection of similarity in music files using signal level analysis
Casey Audio tools for music discovery
EP1797507B1 (en) Apparatus and method for generating an encoded rhythmic pattern
KR101002731B1 (ko) 오디오 데이터의 특징 벡터 추출방법과 그 방법이 기록된컴퓨터 판독 가능한 기록매체 및 이를 이용한 오디오데이터의 매칭 방법
Jiang et al. Polyphonic music information retrieval based on multi-label cascade classification system
Luo et al. Content-based retrieval of music using mel frequency cepstral coefficient (MFCC)
Sonje et al. Audio Retrieval using Hash-Index SearchTechnique
Tavenard et al. Efficient Cover Song Identification using approximate nearest neighbors

Legal Events

Date Code Title Description
A201 Request for examination
N231 Notification of change of applicant
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant
LAPS Lapse due to unpaid annual fee