KR20050117558A - 개선된 데이터 검색 방법 및 시스템 - Google Patents

개선된 데이터 검색 방법 및 시스템 Download PDF

Info

Publication number
KR20050117558A
KR20050117558A KR1020057017118A KR20057017118A KR20050117558A KR 20050117558 A KR20050117558 A KR 20050117558A KR 1020057017118 A KR1020057017118 A KR 1020057017118A KR 20057017118 A KR20057017118 A KR 20057017118A KR 20050117558 A KR20050117558 A KR 20050117558A
Authority
KR
South Korea
Prior art keywords
content item
identifier
data
database
content
Prior art date
Application number
KR1020057017118A
Other languages
English (en)
Inventor
루이터 헨드리쿠스 에이. 에이. 엠. 드
자아프 에이. 하이트스마
아놀더스 제이. 엘. 엠. 멘돈크스
Original Assignee
코닌클리케 필립스 일렉트로닉스 엔.브이.
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 코닌클리케 필립스 일렉트로닉스 엔.브이. filed Critical 코닌클리케 필립스 일렉트로닉스 엔.브이.
Publication of KR20050117558A publication Critical patent/KR20050117558A/ko

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/10Office automation; Time management
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/60Information retrieval; Database structures therefor; File system structures therefor of audio data
    • G06F16/63Querying
    • G06F16/632Query formulation
    • G06F16/634Query by example, e.g. query by humming
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/60Information retrieval; Database structures therefor; File system structures therefor of audio data
    • G06F16/68Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/60Information retrieval; Database structures therefor; File system structures therefor of audio data
    • G06F16/68Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • G06F16/683Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04HBROADCAST COMMUNICATION
    • H04H20/00Arrangements for broadcast or for distribution combined with broadcast
    • H04H20/12Arrangements for observation, testing or troubleshooting
    • H04H20/14Arrangements for observation, testing or troubleshooting for monitoring programmes
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04HBROADCAST COMMUNICATION
    • H04H2201/00Aspects of broadcast communication
    • H04H2201/90Aspects of broadcast communication characterised by the use of signatures

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • General Physics & Mathematics (AREA)
  • Business, Economics & Management (AREA)
  • Library & Information Science (AREA)
  • Multimedia (AREA)
  • Databases & Information Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Human Resources & Organizations (AREA)
  • Strategic Management (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Quality & Reliability (AREA)
  • Economics (AREA)
  • Marketing (AREA)
  • Operations Research (AREA)
  • Mathematical Physics (AREA)
  • Tourism & Hospitality (AREA)
  • General Business, Economics & Management (AREA)
  • Signal Processing (AREA)
  • Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

컨텐츠 아이템과 관련된 데이터를 얻는 방법은 컨텐츠 아이템용 식별자를 얻는 단계(32), 데이터를 얻기 위하여 상기 식별자를 사용하여 데이터베이스 룩업을 수행하는 단계(33) 및 데이터베이스 룩업이 데이터를 얻는데 실패하면 사람(200)에 의해 처리되도록 컨텐츠 아이템을 출력(210)에 제공하는 단계(37)를 포함하며, 컨텐츠 아이템을 다수의 클래스들 중 한 클래스로 자동적으로 분류하고, 컨텐츠 아이템의 분류를 토대로 다른 단계들 중 적어도 한 단계를 조건부로 수행하는 단계(35)를 특징으로 한다. 일 실시예에서, 컨텐츠 아이템은 데이터베이스 룩업이 데이터를 얻는데 실패하고 컨텐츠 아이템은 다수의 미리 결정된 클래스들 중 한 클래스로 분류되는 경우(36)에만 출력에 제공된다. 또한, 서버(300) 및 컴퓨터 프로그램 제품은 이 방법을 실행하도록 배열된다.

Description

개선된 데이터 검색 방법 및 시스템{Improved data retrieval method and system}
본 발명은 컨텐츠 아이템용 식별자를 얻는 단계, 데이터를 얻기 위한 데이터베이스 룩업을 상기 식별자를 사용하여 수행하는 단계 및 상기 데이터베이스 룩업이 데이터를 얻는데 실패하면 사람에 의해 처리되도록 상기 컨텐츠 아이템을 출력에 제공하는 단계를 포함하는 컨텐츠 아이템과 관련된 데이터를 얻는 방법에 관한 것이다.
또한, 본 발명은 컨텐츠 아이템용 식별자를 얻는 수단, 데이터를 얻기 위한 데이터베이스 룩업을 상기 식별자를 사용하여 수행하는 수단 및 상기 데이터베이스 룩업이 데이터를 얻는데 실패하면 사람에 의해 처리되도록 출력에 컨텐츠 아이템을 제공하는 수단을 포함하는, 컨텐츠 아이템과 관련된 데이터를 얻는 시스템에 관한 것이다.
또한, 본 발명은 컴퓨터 프로그램 제품에 관한 것이다.
더 많은 컨텐츠가 이용가능하게 됨에 따라, 자동 방송 모니터링, 즉 라디오 또는 TV 방송국들의 플레이리스트들의 자동 발생이 점점 더 중요하게 되었다. 자동 컨텐츠 식별을 위한 공지된 기술들은 종종 핑거프린트들 또는 워터마크들을 토대로 한다. 워터마크-기반 시스템은 컨텐츠 아이템에 임베드된 워터마크의 페이로드(payload)로부터 컨텐츠 아이템용 식별자를 추출한다. 핑거프린트-기반 시스템은 아이템의 가장 적절한 인식 특징들의 표현을 계산하고 식별자로서 이를 사용한다. 다수의 컨텐츠 아이템들과 더불어 제목, 아티스트, 쟝르 등과 같은 이와 관련된 데이터용 식별자들이 데이터베이스에 저장된다. 특정 컨텐츠 아이템의 데이터는 자신의 식별자를 얻고 룩업 키 또는 질의 파라미터로서 식별자를 사용하여 데이터베이스에서 룩업 또는 질의를 수행함으로써 검색된다. 그 후, 룩업은 식별자와 관련된 데이터를 리턴한다.
이와 같은 시스템들은 노래들, 비디오클립들, 영화들 또는 식별자가 데이터베이스에 있는 다른 컨텐츠가 방송될 때를 자동적으로 식별한다. 그러나, 데이터베이스가 아무리 클지라도, 식별자가 데이터베이스에 없는 컨텐츠가 방송될 것이다. 예를 들어, 식별자가 데이터베이스에 부가되지 않은 새롭게 발표된 노래는 여전히 식별될 수 없다. 게다가, 상기는 매우 큰 데이터베이스에 대해 매우 비용 효율적이지 않는데, 그 이유는 시스템의 비용은 데이터베이스의 크기와 선형적으로 증가한다. 게다가, 한 국가내의 라디오 방송국들에 의해 방송되는 노래들의 98%는 작은 노래들의 세트(전형적으로 20000 내지 30000)에 속한다.
모든 컨텐츠 아이템 방송을 식별하길 원하는 현재 방송 모니터링 제공자들은 사람들이 식별되지 않은 모든 컨텐츠를 청취하거나 시청하게 한다. 이는 수동 동작이기 때문에, 제공자들은 큰 비용을 초래한다.
오디오 핑거프린팅용 애플리케이션은 소비자가 자신의 이동 전화를 사용하여 그가 제목을 알지 못하는 노래들을 식별하는 서비스이다. 최적의 소비자 만족을 위하여, 소비자가 식별하길 원하는 노래의 핑거프린트가 데이터베이스에 있을 확률이 중요하다. 그러므로, 핑거프린트 서비스를 위한 모든 전화 호출들은 오디오 파일들에 기록되고, 예를 들어, 이들 파일들 모두(또는 특정 %)는 일주일에 한번 수동으로 식별된다. 이는 핑거프린트 데이터베이스의 컨텐츠를 최적화하기 위하여 행해짐으로, 소비자들이 식별하길 원하는 노래들의 핑거프린트들이 데이터베이스에 있는 확률을 최대화한다. 비디오용 유사한 애플리케이션이 또한 가능하다.
미국 특허 5,862,223호는 이들 전문가들에 의한 응답을 위하여 전문가들에 사용자 요청들을 할당하는 전문가 정합 방법 및 장치를 서술한다. 요청이 수신될 때, 데이터베이스는 전문가들에 의한 이중 작업을 피하도록 유사한 요청들에 대해서 탐색된다. 유사한 요청이 발견되지 않으면, 적절한 전문가를 위한 탐색은 키워드들 또는 이 요청에서 발견되는 주제 지정자들을 사용하여 요청의 식별을 토대로 수행된다.
미국 특허 출원 2003/0037010은 디지털 저작물들의 인증받지 않은 전송에 대해 검출하는 방법을 서술한다. 관심을 둔 저작물이 인식되고 MP3, AVI, ASF 또는 OGG와 같은 관심을 둔 파일 유형으로 식별된다 데이터베이스는 해당 작업이 데이터베이스 내의 컨텐츠에 정합하는지를 결정하기 위하여 질의받는다. 컨텐츠 아이템을 위한 메타데이터는 데이터베이스 룩업에 의해 얻어진다. 데이터베이스 룩업이 실패하면, 메타데이터는 수동으로 제공될 수 있다. 데이터베이스는 작업용 식별자를 사용하여 탐색된다. 데이터베이스 탐색이 드러나면, 이 작업은 저작권에 의해 보호되는 것으로서 식별되며, 적절한 작용(전송 차단등)이 취해진다.
도1은 식별자로서 핑거프린트를 사용하여 컨텐츠 아이템과 관련된 데이터를 얻도록 배열되는 시스템을 개요적으로 도시한 도면.
도2는 워터마크의 페이로드로부터 추출되는 식별자를 사용하여 컨텐츠 아이템과 관련된 데이터를 얻도록 배열된 개요적으로 도시한 시스템.
도3은 본 발명을 따른 방법의 실시예를 도시한 순서도.
도4는 본 발명을 따른 방법의 또 다른 실시예를 도시한 순서도.
도5는 본 발명을 따른 방법의 또한 다른 실시예를 도시한 순서도.
본 발명의 목적은 종래 기술에 필요로 되는 수작업을 감소시키는 도입부에 따른 방법을 제공하는 것이다.
이 목적은 컨텐츠 아이템을 다수의 클래스들 중 한 클래스로 자동적으로 분류하고, 컨텐츠 아이템의 분류를 토대로 다른 단계들 중 적어도 한 단계를 조건부로 수행하는 단계를 특징으로 하는 방법에 의해 본 발명에 따라서 성취된다. 컨텐츠 식별 기술들과 자동 분류 기술들을 결합함으로써, 데이터베이스에서 실패된 룩업들을 수동으로 처리하는 비용이 크게 감소된다. 본 발명은 자동 분류 단계가 데이터베이스 룩업 및/또는 컨텐츠 아이템을 사람에게 제공하는 것이 실용적인 목적에 맞는다는 정통한 판단을 허용하는 관찰(insight)에 기초한다.
상술된 종래 기술 문헌들에서, 이 관찰은 개시되거나 제안되지 않았다. 미국 특허 5,862,223호에서, 데이터베이스 탐색은 이 분류를 토대로 조건부로 전문가의 탐색을 수행하지 않도록 한다. 즉, 2개의 단계들이 요청이 분류되는 클래스와 관계없이 수행된다. 이 클래스는 탐색이 필요로 되지 않는다는 것을 결정하는데 사용되는 것이 아니라 탐색들을 용이하게 하는데 사용된다. 미국 특허 출원 2003/0037010에서, MP3 또는 AVI로서 컨텐츠를 인식하는 단계는 데이터베이스 룩업이 필요로되지 않는다는 것을 결정하는데 사용되는 것이 아니라 적절한 컨텐츠 식별자 모듈을 선택하는데 사용된다. 메타데이터 데이터베이스 또는 등록된 컨텐츠를 지닌 데이터베이스에 질의하는 것은 MP3 또는 AVI로서 컨텐츠의 인식시에 조건부가 되지 않는다.
이들 시스템들은 처리될 모든 컨텐츠가 인식될 것이라는 암시적 추정을 토대로 구축된다. 그러므로, 데이터베이스 룩업은 결코 스킵될 수 없고, 데이터베이스 룩업이 실패되면, 이는 항상 수동 식별을 위한 컨텐츠를 제공함을 의미한다. 따라서, 이들 시스템들은 해당 컨텐츠가 식별이 가능하지 않는 단순한 랜덤 잡음인 경우 조차도 항상 데이터베이스 룩업을 수행하고 수동 식별을 위한 컨텐츠를 제공한다.
본 발명의 제1 양상에서, 이 방법은 컨텐츠 아이템이 다수의 미리 결정된 클래스들 중 한 클래스로 분류되는 경우 및 이 경우에만 데이터베이스 룩업을 수행하는 것을 포함한다. 이 방식으로, 실패에 대해서도 보장되는 룩업들은 방지된다. 예를 들어, 컨텐츠 아이템이 클래스 '음악'으로 분류되면, 음악을 지닌 데이터베이스에서 룩업은 성공적이될 수 있지만, '잡음'으로서 분류된 컨텐츠 아이템은 발견되지 않을 것이고 또한 생략될 수 있다.
본 발명의 제2 양상에서, 이 방법은 데이터베이스 룩업이 데이터를 얻는데 실패하고 컨텐츠 아이템이 다수의 미리 결정된 클래스들 중 한 클래스로 분류되는 경우에만 출력에 컨텐츠 아이템을 제공하는 단계를 포함한다. 이는 운영자들이 청취하거나 시청하여야 하는 컨텐츠 량을 감소시킨다. 예를 들어, 방송 오디오 모니터링 경우에, '음악' 및 '비음악' 간을 구별하는 간단한 2-클래스 분류자(classifier)가 사용될 수 있다. 이 경우에, '음악'으로서 분류되고 핑거프린팅에 의해 식별되지 않는 오디오 만이 수동으로 식별되어야 한다. 비식별된 오디오의 많은 %는 음성으로 이루어지기 때문에, 노동력을 상당히 감소시킬 수 있다.
또한, 운영자들에게 전달되는 데이터 량이 최소화되는 이점을 제공한다. 서버에 의해 인식되지 않는 모든 컨텐츠는 운영자들이 이들을 청취하거나 시청할 수 있는 단말기들에 전송되어야 한다. 이는 잠재적으로 많은 량의 오디오 또는 비디오 컨텐츠가 운영자들에 전송되어야 한다는 것을 의미한다. 운영자들이 물리적으로 먼 설비에 위치되면, 필요로 되는 대역폭이 값비쌀 수 있다. 본 발명을 따르면, 인식할 수 없는 것으로서 분류되는 컨텐츠는 전송될 필요가 없어, 필요로 되는 대역폭을 감소시킨다.
부가적인 실시예에서, 이 방법은 컨텐츠 아이템이 분류되는 클래스를 토대로 복수의 출력들로부터 출력을 선택하는 단계를 포함한다. 특정 쟝르(팝, 클래식 등)로 비식별된 컨텐츠를 라벨링할 수 있는 더욱 복잡한 분류자는 비식별된 컨텐츠가 각 쟝르의 전문가인 적절한 사람에게 자동적으로 분배될 수 있는 여분의 확률을 부가한다.
부가적인 실시예에서, 이 방법은 컨텐츠 아이템용 핑거프린트를 계산함으로써 식별자를 얻는 단계를 포함한다. 오디오 또는 비디오 클립과 같은 컨텐츠 아이템의 핑거프린트는 해당 아이템의 가장 관련성이 있는 인식 특징들의 표현이다. 이와 같은 핑거프린트들을 때때로 "(로버스트) 해시들"로 공지되어 있다.
부가적인 실시예에서, 이 방법은 컨텐츠 아이템에 임베드된 워터마크의 페이로드로부터 식별자를 추출함으로써 식별자를 얻는 단계를 포함한다. 워터마크 검출은 특히 비디오 워터마크 검출의 경우에 상당량의 프로세싱을 필요로 할 수 있다.
본 발명의 제3 양상을 따르면, 식별자가 핑거프린트 계산 또는 워터마크 페이로드 추출에 의해 얻어진다면, 컨텐츠 아이템이 다수의 미리 결정된 클래스들 중 하나로 분류되는 경우 및 이 경우에만 이들 작용들을 수행하는 이점이 있다.
워터마크들의 경우에, 워터마크를 포함하지 않는 것으로서 인식되는 컨텐츠를 분류 및 무시함으로써, 필요로 되는 처리 량은 감소된다. 워터마크가 없는 것을 표시하는 클래스로 식별될 수 있는 컨텐츠가 제공될 것인데, 예를 들어 상업적인 또는 랜덤 잡음은 현재 워터마크 검출될 필요가 없다.
핑거프린트 계산의 경우에, 일부 구성들에서 핑거프린트 계산은 데이터베이스 룩업들이 수행되는 위치로부터 물리적으로 떨어진 위치에서 행해진다. 이와 같은 구성에서, 핑거프린트들은 또한 음성 또는 잡음과 같은 인식할 수 없는 컨텐츠 또는 상업적인 광고 또는 뉴스와 같이 식별되지 않아야 하는 컨텐츠에 대해 계산된다. 이와 같이 인식할 수 없는 컨텐츠를 "제거"하기 위하여 분류자를 적용함으로써, 데이터베이스 룩업 요소에 전달될 필요가 있는 핑거프린트들의 량은 감소된다. 이는 또한 전송될 데이터 량을 감소시킨다.
본 발명의 또 다른 목적은 종래 기술에 필요로 되는 노동력을 감소시키는 전제부에 따른 시스템을 제공하는 것이다.
이 목적은 이 수단 중 적어도 하나가 컨텐츠 아이템을 다수의 클래스들 중 하나로 분류하는 출력 수단에 따라서 동작하도록 적응되는 시스템에 의해 본 발명에 따라서 성취된다.
일 실시예에서, 사람에 의한 처리를 위하여 컨텐츠 아이템을 제공하는 수단은 데이터를 얻는데 실패한 데이터베이스 룩업을 수행하는 수단 및 컨텐츠 아이템을 다수의 미리 결정된 클래스들 중 한 클래스로 분류하는 분류 수단 상에 조건부로 컨텐츠 아이템을 제공하도록 배열된다.
본 발명의 이들 및 다른 목적들은 도면에 도시된 실시예들을 참조하여 명백하게 이해될 것이다.
전체 도면들에 걸쳐서, 동일한 참조 번호들 유사하거나 대응하는 특징들을 나타낸다. 전체 도면들에서 도시된 특징들 중 일부 특징들은 전형적으로 소프트웨어로 구현되고 소프트웨어 모듈들 또는 오브젝트들과 같은 소프트웨어 엔터티들을 표시한다.
도1은 클라이언트(101), 서버(300) 및 핑거프린트 데이터베이스(310)을 개요적으로 도시한다. 클라이언트(101)는 라디오와 같은 오디오 인스톨레이션 또는 텔레비젼 수상기와 같은 비디오 신호들의 소스일 수 있다. 이는 또한 이동 전화일 수 있다. 클라이언트(101)는 통상적으로, 또 다른 소스로부터 렌더링되는 컨텐츠 아이템을 얻는다. 예를 들어, 라디오는 공중 또는 케이블 접속으로부터 방송 전송을 선택하여 이로부터 가청 신호들을 발생/렌더링한다. 전화는 내장 마이크로폰을 사용하여 오디오 또는 내장 카메라를 사용하여 비디오를 수신할 수 있다.
간결성을 위하여, 도1의 실시예는 오디오 클립들과 관련하여 서술되지만, 본 발명은 마찬가지로 비디오 클립에 대해서도 양호하게 작동될 수 있다.
서버(300)는 이 예에서, 입력 모듈(301), 핑거프린팅 모듈(302), 데이터베이스 관리 시스템(DBMS) 백엔드 모듈(backend module)(303), 및 응답 모듈(304)을 포함한다. 서버(300)는 클라이언트(101)에 전달되는 오디오 클립과 관련된 데이터를 얻는 작업이다. 통상적으로, 이 데이터는 오디오 클립의 제목 또는 아티스트와 같은 메타데이터가 될 것이지만, 이는 오디오 클립에서 광고되는 제품을 구매할 수 있는 인터넷상의 사이트와 같은 데이터일 수 있다.
입력 모듈(301)은 클라이언트(101)로부터 오디오 클립을 수신한다. 그 후, 오디오 클립들은 핑거프린팅 모듈(302)로 공급된다. 핑거프린팅 모듈(302)은 수신된 오디오 클립으로부터 핑거프린트를 계산한다. 로버스트 핑거프린트를 계산하는 한 가지 방법은 국제 특허 출원 WO 02/065782(대리인 번호 PHNL 010110)에 서술되어 있지만, 물론 핑거프린트를 계산하는 어떠한 방법도 사용될 수 있다. 그 후, 핑거프린팅 모듈(302)은 식별자로서 계산된 핑거프린트를 DBMS 백엔드 모듈(303)에 공급한다.
DBMS 백엔드 모듈(303)은 데이터베이스(310)상에서 질의를 수행하여 데이터베이스(310)로부터 수신된 식별자와 관련된 메타데이터의 세트를 검색한다. 도1에 도시된 바와 같이, 데이터베이스(310)는 핑거프린트들(FP1, FP2, FP3, FP4 및 FP5) 형태의 식별자들 및 메타데이터(MDS1, MDS2, MDS3, MDS4, 및 MDS5)의 각 관련된 세트들을 포함한다. 상술된 국제 특허 출원 WO 02/065782은 또한, 공지되지 않은 신호를 식별하기 위하여, 데이터베이스에 저장된 식별된 신호들의 다수의 핑거프린트들과 공지되지 않은 신호를 표시하는 핑거프린트를 정합시키는 효율적인 방법을 설명한다.
데이터베이스(310)는 질의 시간 및/또는 데이터 구성을 최적화하기 위한 각종 방법들로 구성될 수 있다. 핑거프린트 모듈(302)의 출력은 데이터베이스(310)에서 테이블들을 설계시 고려되어야 한다. 도1에 도시된 실시예에서, 데이터베이스(310)는 각 핑거프린트들 및 메타데이터의 세트를 포함하는 엔트리들(기록들)을 가진 단일 테이블을 포함한다.
데이터베이스(310)를 실현하는 또 다른 방법은 여러 테이블들을 설정하는 것이다. 제1 테이블은 메타데이터의 각 세트들과 각각 관련된 다수의 특정 식별자들(주 키들)을 포함한다. 이와 같은 테이블들은 각종 음악 식별 소스들로부터 얻어질 수 있다. 아티스트, 제목 및 발표 년도의 조합이 특정 식별자를 형성하도록 결합될 수 있지만, 이것이 특정한 것으로 보장되지 않음으로, 실제로 전반적으로 특정한 값이 사용되는 것이 바람직하다.
그리고 나서, 제2 테이블은 각 컨텐츠 아이템에 대해서 제1 테이블로부터 특정 식별자들 및 핑거프린트들을 포함하는 엔트리들이 설정되어 있다. 이 방식으로, 다수의 핑거프린트들은 메터데이터의 복제함이 없이 메터데이터의 한 세트와 관련될 수 있다. 다수의 핑거프린트들이 하나의 컨텐츠 아이템에 대해서 가능하다면, 모든 이들 핑거프린트들은 제2 테이블에 저장되는데, 이들 모두는 이 컨텐츠 아이템에 대한 하나의 특정 식별자와 관련된다.
그 후, DBMS 백엔드 모듈(303)은 제2 테이블에서 핑거프린트들에 대해서 수신된 핑거프린트에 정합하며, 식별자를 얻고 메타데이터를 얻기 위하여 제1 테이블에 대한 식별자에 정합한다. 데이터베이스(310)가 SQL 데이터베이스이면, 2개의 테이블들은 식별자를 토대로 결합될 수 있다. DBMS 백엔드 모듈(303)은 질의의 결과들을 응답 모듈(304)에 공급하는데, 이는 발견된 메타데이터를 클라이언트(101)로 다시 전송한다.
클라이언트(101)가 이동 전화이면, 메타데이터는 예를 들어, SMS 메시지 또는 이-메일 메시지로서 전송될 수 있다. 입력 모듈(301)에 의해 수신되는 오디오 클립이 이동 전화에 수신되면, 전화 번호는 호출자 ID 또는 자동 번호 식별 또는 유사한 수단을 통해서 얻어질 수 있다. 그 후, 입력 모듈(301)은 호출 번호를 응답 모듈(304)에 공급하여, SMS 메시지가 동일한 번호로 전송될 수 있도록 한다.
대안적으로, 입력 모듈(301)은 서버(300)에 접촉할 때 사용자에 의해 제공되는 사용자명 또는 이-메일 주소 사용자를 식별하는 또 다른 수단을 수신할 수 있다. 등록은 서비스를 사용하는데 필요로 될 수 있고, 그 후, 수신지 어드레스는 예를 들어 사용자에 의해 공급되는 사용자명을 토대로 사용자의 등록 상세사항들을 검사함으로써 얻어질 수 있다.
또한 대안적으로, 발견된 메타데이터는 바람직하게는, 클라이언트(101)용 식별자 및 엔트리가 기록되는 타임스탬프와 함께 로그파일에서 기록될 수 있다. 이 방식으로, 로그파일은 처리되는 컨텐츠 아이템들의 정확한 보고를 포함한다. 그 후, 이 로그파일은 예를 들어 특정 채널을 통해서 방송되는 것의 증거로서 역할할 수 있다. 이 로그파일은 American Society of Composers, Authors and Publishers(ASCAP) 또는 Dutch BUMA/Stemra와 같은 저작권 정보센터에 의해 사용되어, 얼마나 많은 로얄티들이 특정 저작권 소유자들에게 지불되어야 하는지를 결정한다. 이와 같은 로얄티들은 종종 특정 노래가 방송되는 횟수의 추정을 토대로 하고 이 리스트는 공명정대한 제3자에 의해 정확한 추정을 제공한다. 방송국은 특정 컨텐츠 아이템이 방송되는 횟수를 부족 또는 과다추정할 수 있거나 충분한 상세사항들을 공급하지 않을 수 있다.
물론, 이 리스트는 또한 많은 다른 목적들을 위하여 가치가 있을 수 있다. 이 방식으로 식별되는 컨텐츠 아이템들이 광고 또는 판매촉진 메시지들을 포함하는 경우, 이 리스트는 특정 광고 또는 메시지가 특정 시간에 방송된다는 것을 입증(또는 반증)하는데 사용될 수 있다. 이 방식으로, 방송국은 광고자에 대한 자신의 계약 의무들을 부합시킨다는 것을 보여줄 수 있다.
부가적인 개선은 국제 특허 출원 일련 번호 PCT/IB03/00260(대리인 번호 PHNL020101)에 서술된다. 이 문헌을 따르면, 서버(300)는 클라이언트(101)로부터의 프로세싱 요청들 이외에 하나 이상의 방송 채널들을 모니터하여야 한다. 이들 채널들상의 컨텐츠와 관련된 메타데이터는 2차 데이터베이스로 복제되어야 한다. 그 후, 2차 데이터베이스는 적은 수의 엔트리들을 포함한다. 따라서, 2차 데이터베이스에 대한 정합은 제1 데이터베이스에 대한 정합 보다 더 빠르게될 것이다. 정합이 2차 데이터베이스에서 발견되지 않을 때에만 주 데이터베이스에의 정합이 수행된다. 모니터링된 전송 채널(들)을 통해서 전송되는 컨텐츠 아이템들에 대해서 많은 요청들이 도달할 것으로 예측되기 때문에, 많은 요청들이 더욱 작고 빠른 2차 데이터베이스만을 사용하여 응답될 수 있도록 한다. 그래서, 평균적으로, 핑거프린트에 정합하는데 필요로 되는 시간은 감소된다.
도2는 핑거프린트 모듈(302)이 워터마크 추출 모듈(322)로 대체되는 도1의 시스템의 변화를 개요적으로 도시한 것이다. 수신 모듈(301)에 의해 수신되는 클립들은 현재 이 워터마크 추출 모듈(301)에 전달되는데, 이 추출 모듈은 클립에서 워터마킹된 데이터를 검출 및 추출하도록 시도한다. 그 후, 추출된 데이터는 식별자와 관련된 메타데이터를 얻기 위하여 데이터베이스 룩업을 수행하는 DBMS 백엔드 모듈(303)에 전달될 수 있는 식별자로서 사용된다.
도2에 도시된 바와 같이, 데이터베이스(302)는 식별자들(ID1, ID2, ID3, ID4 및 ID5)과 메타데이터(MDS1, MDS2, MDS3, MDS4 및 MDS5)의 각 관련된 세트들을 포함한다. 서버(300)의 나머지 동작은 도1과 관련하여 상술된 동작과 동일하다.
서버(300)에서, 핑거프린팅 또는 워터마킹 기술 또는 일부 다른 유형의 식별 메커니즘을 사용하는 동작하는지에 관계없이, 특정 식별자가 데이터베이스(310, 320)에서 발견될 수 없는 경우가 발생할 수 있다. 이와 같은 경우에, 해당 컨텐츠 아이템은 출력에 제공되어, 운영자(200)가 수동으로 컨텐츠 아이템을 검토하고 수동 인식을 시도하게 할 수 있다. 이 출력은 예를 들어, 단말기, 스피커, 디스플레이 스크린 또는 네트워크와의 접속부일 수 있다. 데이터베이스에서 발견될 수 없는 컨텐츠는 다른 수단에 의해 원격 위치로 이-메일 발송(e-mailed)되거나 전송될 수 있다. 그 후, 원격 장소에서의 운영자는 컨텐츠를 수동으로 검토할 수 있다.
도1 및 도2에서, 컨텐츠 아이템은 이와 같은 경우에 스피커들(loudspeakers)을 사용하여 단말기(210) 상에서 재생될 것이고 운영자(200)는 아이템을 청취하도록 예측되고 메타데이터를 입력 또는 선택할 것으로 예측된다. 그 후, 이 메타데이터는 응답 모듈(204)에 공급되어, 클라이언트에 다시 전송하거나 로그파일에 기록되고 또는 어떤 다른 방식으로 사용될 수 있도록 한다. 운영자(200)가 실시간으로 메타데이터를 입력하지 않거나 컨텐츠 아이템을 인식하는데 실패하면, 적절한 메시지는 응답 모듈(304)에 의해 클라이언트(101)에 전송되어야 한다.
본 발명은 서버(300)가 다수의 클래스들 중 한 클래스로 컨텐츠 아이템을 식별하는 자동 분류 기술들을 사용으로부터 이점을 얻는다는 관찰을 토대로 한다. 상술된 단계들 중 적어도 한 단계가 컨텐츠 아이템의 분류를 토대로 조건부로 수행되면, 서버(300)의 동작은 개선될 것이다.
이를 위하여, 서버(300)에는 자동 분류자(309)가 제공된다. 다수의 자동 분류 방법들은 이 명세서의 끝에서 논의된다. 자동 분류를 위한 전형적인 시스템들은 하나 이상의 컨텐츠 분류들에 이 특징들을 매핑하는 분류 스테이지보다 앞서 특징 추출 스테이지로 이루어진다.
분류자(309)는 컨텐츠 아이템을 분석하고 컨텐츠 아이템을 다수의 클래스들 중 한 클래스로 분류한다. 이 분류는 예를 들어 '음악' 또는 '비음악'(예를 들어, '음성' 또는 '잡음') 또는 '영화' 대 '상업 광고'와 같이 간단하게 될 수 있다. 쟝르 분류, 특정 컨텐츠 하이라이트의 자동 검출 및 자동 스피커 인식과 같은 더욱 상세한 분류들이 또한 이용될 수 있다. 이와 같은 분류 방법들은 '클래식', '록', '음성', '재즈', '랩' 등과 같은 클래스들로 오디오를 분류하거나 '영화', '상업 광고', '뉴스' 등과 같은 분류들로 비디오를 분류한다.
본 발명의 한 양상을 따르면, 데이터베이스 룩업이 데이터를 얻는데 실패하고 컨텐츠 아이템이 다수의 미리 결정된 클래스들 중 한 클래스로 분류되면, 사람에 의해 처리되도록 컨텐츠 아이템이 제공된다. 예를 들어, 방송 모니터링의 경우에, '음악' 및 '비음악'간을 식별하는 간단한 2-클래스 분류자가 사용될 수 있다. 이 경우에, 자동적으로 식별되지 않고 '음악'으로서 분류되는 오디오는 수동으로 식별될 필요가 있다. 비식별된 오디오의 많은 %가 음성으로 이루어지기 때문에, 노동력의 상당한 감소가 달성될 수 있다.
일 실시예에서, 컨텐츠 아이템을 처리하기 위하여 제공되는 출력은 컨텐츠 아이템이 분류되는 클래스에 기초하여 복수의 출력들로부터 선택된다. 다수의 클래스 분류자가 사용되면, 핑거프린트 데이터베이스의 컨텐츠를 고 레벨로 또한 관리할 수 있다. 특정 쟝르(팝, 클래식 등)를 가진 비식별된 음악을 라벨링할 수 있는 더욱 복잡한 분류자는 비식별된 오디오가 각 쟝르의 전문가인 적절한 사람에게 자동적으로 분배될 여분의 확률을 부가한다.
이를 위하여, 서버(300)는 컨텐츠 아이템을 복수의 출력들 중 한 출력에 제공하도록 프로그램된다. 각 출력은 하나의 특정 클래스와 관련된다. 예를 들어, 이 관련은 운영자가 특정 단말기에 로그 인할 때 수동으로 또는 자동으로 행해질 수 있다. 운영자는 이 정보를 입력하거나 이 운영자를 위한 사용자 프로필 또는 데이터베이스에 등록될 수 있음으로, 서버(300)는 이를 자동적으로 알 수 있게 된다. 그 후, 서버(300)는 컨텐츠 아이템을 컨텐츠가 분류되는 클래스와 관련된 특정 단말기에 제공한다.
이와 같은 복잡한 분류는 조정들이 데이터베이스(310, 320)의 컨텐츠에 대해 행하도록 하다. 예를 들어, 수동 식별을 위하여 제출된 컨텐츠 아이템들의 많은 %가 재즈로서 분류되면, 더 많은 재즈 음악은 데이터베이스(310, 320)에 부가되어야만 하는데, 그는 이것이 메타데이터에 대한 많은 요청들이 재즈 음악에 관심이 있고 데이터베이스가 현재 충분한 재즈 음악을 포함하지 않는다는 것을 명백히 표시하기 때문이다.
본 발명의 또 다른 양상을 따르면, 데이터베이스 룩업은 컨텐츠 아이템이 다수의 미리 결정된 클래스들 중 한 클래스로 분류되는 경우 수행된다. 예를 들어, 데이터베이스 룩업은 데이터베이스(310, 320)가 단지 음악 또는 광고들 각각을 포함하는 경우 컨텐츠 아이템이 '음악' 또는 '광고'로서 분류되는 경우에만 수행될 수 있다.
이동 전화 서비스의 경우에, 모든 기록된 비식별된 오디오 클립들의 상당한 %가 단지 잡음으로 이루어진다. 이는 통상적으로, 이동 전화가 오디오 소스로부터 너무 멀리 있을 때 발생된다. 2클래스 분류자가 사용될 때, '비음악' 또는 '잡음'으로서 분류되는 모든 기록들은 무시될 수 있다. 그러므로, 운영자(200)는 단지 '음악'으로서 분류되는 기록들을 청취하고 식별하여야 한다. 따라서, 비식별된 오디오 클립들의 식별은 더욱 효율적으로 행해질 수 있다.
그러나, 이 실시예에서, 매우 낮은 잘못된 부의 레이트(false negative rate)를 갖는 분류 기술을 선택하는 것이 중요하다. 즉, 미리 결정된 클래스들 중 하나로 분류되지 않는 아이템들의 수는 매우 낮아야만 된다. 본 발명가들은 실제로 전형적인 2-클래스 분류자들이 짧은 오디오 클립(5 내지 10초)에 대해 약 90%의 분류 수행성능을 가질 수 있다는 것이 발견되었다. 이는 음악의 10%가 비음악으로서 라벨링된다는 것을 의미한다. 그러므로, 결합된 분류/식별 시스템의 전체 수행성능은 90% 보다 아래로 강하되는데, 이는 명백하게 바람직하지 않다.
또한 다른 양상(도시되지 않음)에서, 핑거프린팅 모듈(302) 또는 워터마크 추출 모듈(322)은 분류자(309)에 의해 다수의 분류들 중 한 분류로 컨텐츠 아이템의 분류를 조건부로 동작시키도록 구성된다. 이 실시예에서, '잡음' 또는 '비음악'과 같은 클래스들에서 분류된 컨텐츠는 워터마크 페이로드 추출 또는 핑거프린트 계산을 겪을 필요가 없다.
상기 실시예들을 결합할 수 있다는 점에 유의한다. 예를 들어, 핑거프린트 계산은 분류를 토대로 조건부로 행해질 수 있고 , 이 분류를 토대로 비식별된 컨텐츠를 제공하기 위하여 어느 출력을 선택할 지가 자동적으로 행해질 수 있다. 즉 2클래스 분류자는 식별자를 얻는 것이 감지되는지를 결정하는데 사용될 수 있고, 다수 클래스 분류자가 출력에 컨텐츠를 제공하는지를 결정하기 위하여 사용되거나 어느 출력에 컨텐츠를 제공할지를 결정하기 위하여 사용될 수 있다.
도3은 본 발명을 따른 방법의 실시예를 도시한 순서도이다. 이 방법은 단계(30)에서 시작한다. 단계(31)에서, 컨텐츠 데이터, 예를 들어, 오디오 또는 비디오 클립이 수신된다. 단계(32)에서, 컨텐츠 아이템에 대한 식별자는 예를 들어 컨텐츠 아이템에 임베드된 워터마크의 페이로드로부터 식별자를 추출하거나 컨텐츠 아이템에 걸쳐서 핑거프린트를 계산함으로써 얻어진다.
단계(33)에서, 데이터베이스 룩업은 식별자와 관련된 데이터를 검색하도록 수행된다. 단계(34)에서, 룩업이 성공적이라고 결정되면, 요청된 데이터가 얻어지고 이 방법은 단계(39)에서 종료된다. 룩업이 실패되면, 이 방법은 단계(35)로 진행한다.
단계(35)에서, 컨텐츠 아이템은 예를 들어, '음악' 또는 '잡음' 중 어느 하나와 같이 다수의 클래스들 중 한 클래스로 분류된다. 그 후, 컨텐츠 아이템이 분류를 토대로 운영자(200)에게 제공되는지가 단계(36)에서 행해진다. 예를 들어, 컨텐츠가 '음악'으로서 분류되면, 이는 운영자(200)에게 제공된다.
판단이 컨텐츠 아이템을 제공하는 것이라면, 단계(37)에서, 데이터가 수신되며, 운영자(200)는 데이터베이스로부터 입력되거나 선택된다. 그 후, 이 방법은 또한 단계(39)에서 종료된다. 컨텐츠 아이템이 제공되지 않아야 하는 경우, 이 방법은 단계(39)에서 바로 종료된다. 이 경우에, 일종의 에러 메시지는 클라이언트(101)에 공급되어야 한다.
도4는 본 발명을 따른 방법의 또 다른 실시예를 도시한 순서도이다. 도3의 단계들과 동일한 단계들은 여기서 반복되지 않는다.
단계(35)로부터 얻어진 분류를 토대로, 식별자와 관련된 데이터를 검색하기 위하여 데이터베이스 룩업을 수행할지를 단계(44)에서 판정한다. 예를 들어, 컨텐츠 아이템이 '잡음'으로서 분류되면, 데이터베이스 룩업은 어떠한 정합들도 검색하지 않아야 하고, 따라서 스킵될 수 있다. 데이터베이스 룩업이 요구되면, 이 방법은 단계(33)로 진행하고 그렇치 않으면 단계(39)에서 종료된다. 단계(46)에서, 단계(33)의 룩업이 실패되었다라고 결정하면, 이 방법은 단계(37)로 진행하고, 그렇치 않다면 단계(39)에서 이 방법은 종료된다.
도5는 본 발명을 따른 방법의 또 다른 실시예를 도시한 순서도를 도시한 것이다. 도3 또는 도4의 단계들과 동일한 단계들은 여기서 반복되지 않는다.
단계(35)로부터 얻어진 분류를 토대로 컨텐츠 아이템용 식별자를 얻을지 여부를 단계(54)에서 판정이 행해진다. 예를 들어, 컨텐츠 아이템이 '잡음'으로서 분류되면, 검출할 워터마크가 존재하지 않거나, 잡음에 대한 핑거프린트의 계산이 컨텐츠 아이템에 대해 의미있는 식별자를 초래하지 않는다. 그러므로, 이와 같은 경우들에서는, 이 방법은 즉각적으로 종료될 수 있다. 다른 경우들에서, 이 방법은 단계(32)로 진행하여 식별자를 얻고 단계(33)로 진행하여 데이터베이스 룩업을 수행한다. 그 후, 이 단계들은 도4와 동일하게 된다.
당업자가 본 발명을 따른 서버를 구성하도록 하기 위하여, 참조된 기존 분류 기술들이 이하에 제공된다. 본 발명은 하나의 특정 분류 기술에 좌우되지 않는 다는 점에 유의하여야 한다. 특정 기술의 선택은 환경, 예를 들어 2-클래스 또는 다수-클래스 분류자가 필요로한지, 서버등에 단지 '음악' 및 '잡음'만이 제공될 것으로 예상되는 지에 좌우된다.
일부 2-클래스 분류 기술들은 다음과 같다.
상술된 실시예들은 본 발명을 제한하는 것이 아니고 당업자는 첨부된 청구범위로부터 벗어남이 없이 많은 대안적인 실시예들을 설계할 수 있다는 것을 주지하여야 한다.
예를 들어, 개인용 컴퓨터에 접속된 마이크로폰은 클라이언트(101)로서 사용될 수 있다. 그 후, 컴퓨터는 마이크로폰으로부터 음을 기록하고 이-메일 메시지와 같은 인터넷을 통해서 또는 FTP, HTTP 파일 업로드 또는 유사한 메커니즘을 사용하여 서버(300)에 기록을 전송한다. 기록 수단을 지닌 휴대용 장치는 또한 이와 같은 기록을 행하도록 사용될 수 있다. 그 후, 휴대용 장치는 전화선 또는 네트워크 접속을 통해서 서버에 접속될 수 있다. 인터넷 라디오와 같은 다른 전송 채널들은 컨텐츠 아이템을 직접 기록 및 전송하는데, 그 이유는 이 아이템이 디지털 포맷으로 전송되기 때문이다.
청구범위들에서, 괄호사이에 배치된 임의의 기준 부호들은 청구범위를 제한하는 것으로서 해석되지 않아야 한다. 단어 '포함하는'은 청구범위에 목록화된 것 이외의 소자들 또는 단계들의 존재를 배제하지 않는다. 단어 소자 앞에 있는 'a', 또는 'an'은 다수의 이와 같은 소자들의 존재를 배제하지 않는다.
본 발명은 여러 별개의 소자들을 포함하는 하드웨어에 의해 그리고 적절하게 프로그램된 컴퓨터에 의해 구현될 수 있다. 장치 청구항에서, 열거되는 여러 수단들, 이들 수단들중 여러 수단은 동일한 하드웨어로 구현될 수 있다. 특정 수단들이 서로 다른 종속항들에 인용되었지만 이들 수단들의 조합이 유용하게 사용될 수 없다는 것을 나타내지 않는다.

Claims (10)

  1. 컨텐츠 아이템과 관련된 데이터를 얻는 방법으로서,
    상기 컨텐츠 아이템용 식별자를 얻는 단계(32), 상기 데이터를 얻기 위한 데이터베이스 룩업(lookup)을 상기 식별자를 사용하여 수행하는 단계(33) 및 상기 데이터베이스 룩업이 상기 데이터를 얻는데 실패하면 사람(200)에 의해 처리되도록 상기 컨텐츠 아이템을 출력(210)에 제공하는 단계(37)를 포함하는, 상기 방법에 있어서,
    상기 컨텐츠 아이템을 다수의 클래스들 중 한 클래스로 자동적으로 분류하고 상기 컨텐츠 아이템의 분류를 토대로 다른 단계들 중 적어도 한 단계를 조건부로 수행하는 단계(35)를 포함하는 것을 특징으로 하는, 컨텐츠 아이템과 관련된 데이터 얻는 방법.
  2. 제1항에 있어서, 상기 컨텐츠 아이템이 다수의 미리 결정된 클래스들 중 한 클래스로 분류되는 경우에만(44) 상기 데이터베이스 룩업을 수행하는 단계를 포함하는, 컨텐츠 아이템과 관련된 데이터 얻는 방법.
  3. 제1항에 있어서, 상기 데이터베이스 룩업이 상기 데이터를 얻는데 실패하고 상기 컨텐츠 아이템이 다수의 미리 결정된 클래스들 중 한 클래스로 분류되는 경우에만(36) 상기 컨텐츠 아이템을 상기 출력에 제공하는 단계(37)를 포함하는, 컨텐츠 아이템과 관련된 데이터 얻는 방법.
  4. 제1항 내지 제3항 중 어느 한 항에 있어서, 상기 컨텐츠 아이템이 분류되는 클래스를 토대로 복수의 출력들로부터 상기 출력을 선택하는 단계를 포함하는, 컨텐츠 아이템과 관련된 데이터 얻는 방법.
  5. 제1항에 있어서, 상기 컨텐츠 아이템용 핑거프린트(fingerprint)를 계산함으로써 상기 식별자를 얻는 단계를 포함하는, 컨텐츠 아이템과 관련된 데이터 얻는 방법.
  6. 제1항에 있어서, 상기 컨텐츠 아이템에 임베드된 워터마크의 페이로드(payload)로부터 상기 식별자를 추출함으로써 상기 식별자를 얻는 단계를 포함하는, 컨텐츠 아이템과 관련된 데이터 얻는 방법.
  7. 제5항 또는 제6항에 있어서, 상기 컨텐츠 아이템이 다수의 미리 결정된 클래스들 중 한 클래스로 분류되는 경우에만 상기 식별자를 얻는 단계를 포함하는, 컨텐츠 아이템과 관련된 데이터 얻는 방법.
  8. 컨텐츠 아이템과 관련된 데이터를 얻는 시스템(300)으로서,
    상기 컨텐츠 아이템용 식별자를 얻는 수단(302, 322), 상기 데이터를 얻기 위하여 상기 컨텐츠 아이템에 대한 데이터베이스 룩업을 상기 식별자를 사용하여 수행하는 수단(303, 310) 및 상기 데이터베이스 룩업이 상기 데이터를 얻는데 실패하면 사람(200)에 의해 처리되도록 상기 컨텐츠 아이템을 출력(210)에 제공하는 수단을 포함하는, 상기 시스템에 있어서,
    상기 수단(302;322;303,310;210)중 적어도 한 수단은, 상기 컨텐츠 아이템을 다수의 클래스들 중 한 클래스로 분류하기 위하여 수단(309)의 출력에 따라서 동작하도록 적응되는 것을 특징으로 하는, 컨텐츠 아이템과 관련된 데이터 얻는 시스템(300).
  9. 제8항에 있어서, 상기 컨텐츠 아이템을 제공하는 수단(210)은, 상기 데이터를 얻는데 실패한 데이터베이스 룩업 수행 수단(303, 310) 및 상기 컨텐츠 아이템을 다수의 미리 결정된 클래스들 중 한 클래스로 분류하는 분류 수단(309)에 의존하여 조건부로 상기 컨텐츠 아이템을 제공하도록 배열되는, 컨텐츠 아이템과 관련된 데이터 얻는 시스템(300).
  10. 프로세서가 청구항 1의 방법을 실행하도록 배열되는 컴퓨터 프로그램 제품.
KR1020057017118A 2003-03-13 2004-03-03 개선된 데이터 검색 방법 및 시스템 KR20050117558A (ko)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
EP03100639.8 2003-03-13
EP03100639A EP1457889A1 (en) 2003-03-13 2003-03-13 Improved fingerprint matching method and system

Publications (1)

Publication Number Publication Date
KR20050117558A true KR20050117558A (ko) 2005-12-14

Family

ID=32748960

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020057017118A KR20050117558A (ko) 2003-03-13 2004-03-03 개선된 데이터 검색 방법 및 시스템

Country Status (8)

Country Link
US (1) US20060218126A1 (ko)
EP (2) EP1457889A1 (ko)
JP (1) JP2006527425A (ko)
KR (1) KR20050117558A (ko)
CN (1) CN1759396A (ko)
AU (1) AU2004219418A1 (ko)
BR (1) BRPI0408288A (ko)
WO (1) WO2004081817A1 (ko)

Cited By (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9686596B2 (en) 2008-11-26 2017-06-20 Free Stream Media Corp. Advertisement targeting through embedded scripts in supply-side and demand-side platforms
US9703947B2 (en) 2008-11-26 2017-07-11 Free Stream Media Corp. Relevancy improvement through targeting of information based on data gathered from a networked device associated with a security sandbox of a client device
US9716736B2 (en) 2008-11-26 2017-07-25 Free Stream Media Corp. System and method of discovery and launch associated with a networked media device
US9961388B2 (en) 2008-11-26 2018-05-01 David Harrison Exposure of public internet protocol addresses in an advertising exchange server to improve relevancy of advertisements
US9986279B2 (en) 2008-11-26 2018-05-29 Free Stream Media Corp. Discovery, access control, and communication with networked services
US10334324B2 (en) 2008-11-26 2019-06-25 Free Stream Media Corp. Relevant advertisement generation based on a user operating a client device communicatively coupled with a networked media device
US10419541B2 (en) 2008-11-26 2019-09-17 Free Stream Media Corp. Remotely control devices over a network without authentication or registration
US10567823B2 (en) 2008-11-26 2020-02-18 Free Stream Media Corp. Relevant advertisement generation based on a user operating a client device communicatively coupled with a networked media device
US10631068B2 (en) 2008-11-26 2020-04-21 Free Stream Media Corp. Content exposure attribution based on renderings of related content across multiple devices
US10880340B2 (en) 2008-11-26 2020-12-29 Free Stream Media Corp. Relevancy improvement through targeting of information based on data gathered from a networked device associated with a security sandbox of a client device
US10977693B2 (en) 2008-11-26 2021-04-13 Free Stream Media Corp. Association of content identifier of audio-visual data with additional data through capture infrastructure

Families Citing this family (41)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP1314110B1 (en) * 2000-08-23 2009-10-07 Gracenote, Inc. Method of enhancing rendering of a content item, client system and server system
US7890374B1 (en) 2000-10-24 2011-02-15 Rovi Technologies Corporation System and method for presenting music to consumers
US7277766B1 (en) 2000-10-24 2007-10-02 Moodlogic, Inc. Method and system for analyzing digital audio files
EP1362485B1 (en) * 2001-02-12 2008-08-13 Gracenote, Inc. Generating and matching hashes of multimedia content
US7477739B2 (en) * 2002-02-05 2009-01-13 Gracenote, Inc. Efficient storage of fingerprints
ATE426297T1 (de) * 2002-09-30 2009-04-15 Gracenote Inc Fingerabdruckextraktion
EP1561176A2 (en) * 2002-11-01 2005-08-10 Koninklijke Philips Electronics N.V. Improved audio data fingerprint searching
JP2006505821A (ja) * 2002-11-12 2006-02-16 コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ 指紋情報付マルチメディアコンテンツ
JP2005351994A (ja) * 2004-06-08 2005-12-22 Sony Corp コンテンツ配信サーバ,コンテンツ配信方法,プログラム
US7567899B2 (en) 2004-12-30 2009-07-28 All Media Guide, Llc Methods and apparatus for audio recognition
US20070106405A1 (en) * 2005-08-19 2007-05-10 Gracenote, Inc. Method and system to provide reference data for identification of digital content
US20080147557A1 (en) * 2005-10-03 2008-06-19 Sheehy Dennis G Display based purchase opportunity originating from in-store identification of sound recordings
KR100803206B1 (ko) * 2005-11-11 2008-02-14 삼성전자주식회사 오디오 지문 생성과 오디오 데이터 검색 장치 및 방법
US20070162761A1 (en) 2005-12-23 2007-07-12 Davis Bruce L Methods and Systems to Help Detect Identity Fraud
US7761293B2 (en) * 2006-03-06 2010-07-20 Tran Bao Q Spoken mobile engine
US7519619B2 (en) * 2006-08-21 2009-04-14 Microsoft Corporation Facilitating document classification using branch associations
US8010511B2 (en) 2006-08-29 2011-08-30 Attributor Corporation Content monitoring and compliance enforcement
US8738749B2 (en) 2006-08-29 2014-05-27 Digimarc Corporation Content monitoring and host compliance evaluation
US8707459B2 (en) 2007-01-19 2014-04-22 Digimarc Corporation Determination of originality of content
US9654447B2 (en) 2006-08-29 2017-05-16 Digimarc Corporation Customized handling of copied content based on owner-specified similarity thresholds
CN101553815A (zh) * 2006-11-14 2009-10-07 皇家飞利浦电子股份有限公司 用于分类内容项目的方法和设备
US10885543B1 (en) 2006-12-29 2021-01-05 The Nielsen Company (Us), Llc Systems and methods to pre-scale media content to facilitate audience measurement
US20080274687A1 (en) 2007-05-02 2008-11-06 Roberts Dale T Dynamic mixed media package
CN101359992A (zh) * 2007-07-31 2009-02-04 华为技术有限公司 内容类别请求方法、确定方法、交互方法及装置
JP5369105B2 (ja) * 2007-09-14 2013-12-18 ヤフー! インコーポレイテッド オンラインでシェアされる放送番組のクリップの番組情報を回復するための技術
US20090076950A1 (en) * 2007-09-18 2009-03-19 Ujin Chang Universal Network-Based Deposit Management Service
TWI413910B (zh) * 2008-01-25 2013-11-01 Univ Nat Taiwan 數值資料範圍區間查詢方法及系統
CN101981576A (zh) * 2008-03-31 2011-02-23 杜比实验室特许公司 使用媒体内容中识别出的对象将信息与媒体内容相关联
CN102132574B (zh) 2008-08-22 2014-04-02 杜比实验室特许公司 内容识别和质量监测
US8620967B2 (en) 2009-06-11 2013-12-31 Rovi Technologies Corporation Managing metadata for occurrences of a recording
US8677400B2 (en) 2009-09-30 2014-03-18 United Video Properties, Inc. Systems and methods for identifying audio content using an interactive media guidance application
US8161071B2 (en) 2009-09-30 2012-04-17 United Video Properties, Inc. Systems and methods for audio asset storage and management
US8886531B2 (en) 2010-01-13 2014-11-11 Rovi Technologies Corporation Apparatus and method for generating an audio fingerprint and using a two-stage query
WO2013001159A1 (en) * 2011-06-30 2013-01-03 Nokia Corporation Method and apparatus for providing audio-based item sharing
JP5982791B2 (ja) * 2011-11-16 2016-08-31 ソニー株式会社 情報処理装置及び情報処理方法、情報提供装置、並びに、情報提供システム
US9538040B2 (en) * 2011-12-16 2017-01-03 University Of Maryland, College Park Active sensing for dynamic spectrum access
US9275625B2 (en) * 2013-03-06 2016-03-01 Qualcomm Incorporated Content based noise suppression
CN107783834B (zh) 2016-08-30 2021-05-07 伊姆西公司 用于处理数据的方法和系统
US10554684B2 (en) * 2017-03-29 2020-02-04 Juniper Networks, Inc. Content-based optimization and pre-fetching mechanism for security analysis on a network device
US10958807B1 (en) 2018-02-08 2021-03-23 Digimarc Corporation Methods and arrangements for configuring retail scanning systems
US11995511B2 (en) * 2018-02-08 2024-05-28 Digimarc Corporation Methods and arrangements for localizing machine-readable indicia

Family Cites Families (54)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4677466A (en) * 1985-07-29 1987-06-30 A. C. Nielsen Company Broadcast program identification method and apparatus
US4870568A (en) * 1986-06-25 1989-09-26 Thinking Machines Corporation Method for searching a database system including parallel processors
US5206949A (en) * 1986-09-19 1993-04-27 Nancy P. Cochran Database search and record retrieval system which continuously displays category names during scrolling and selection of individually displayed search terms
US5019899A (en) * 1988-11-01 1991-05-28 Control Data Corporation Electronic data encoding and recognition system
JP2849161B2 (ja) * 1989-10-14 1999-01-20 三菱電機株式会社 情報再生装置
KR920006298B1 (ko) * 1990-04-30 1992-08-03 삼성전자 주식회사 인덱스 서취장치
DE4021707A1 (de) * 1990-07-07 1992-01-09 Nsm Ag Muenzbetaetigter musikautomat
US5488725A (en) * 1991-10-08 1996-01-30 West Publishing Company System of document representation retrieval by successive iterated probability sampling
US5446891A (en) * 1992-02-26 1995-08-29 International Business Machines Corporation System for adjusting hypertext links with weighed user goals and activities
US5388259A (en) * 1992-05-15 1995-02-07 Bell Communications Research, Inc. System for accessing a database with an iterated fuzzy query notified by retrieval response
US5337347A (en) * 1992-06-25 1994-08-09 International Business Machines Corporation Method and system for progressive database search termination and dynamic information presentation utilizing telephone keypad input
US5475835A (en) * 1993-03-02 1995-12-12 Research Design & Marketing Inc. Audio-visual inventory and play-back control system
DE69434349T2 (de) * 1993-05-26 2006-03-09 Pioneer Electronic Corp. Aufzeichnungsmedium für Karaoke
US5642337A (en) * 1995-03-14 1997-06-24 Sony Corporation Network with optical mass storage devices
US5616876A (en) * 1995-04-19 1997-04-01 Microsoft Corporation System and methods for selecting music on the basis of subjective content
US5659732A (en) * 1995-05-17 1997-08-19 Infoseek Corporation Document retrieval over networks wherein ranking and relevance scores are computed at the client for multiple database documents
US5740549A (en) * 1995-06-12 1998-04-14 Pointcast, Inc. Information and advertising distribution system and method
US5751672A (en) * 1995-07-26 1998-05-12 Sony Corporation Compact disc changer utilizing disc database
US5781897A (en) * 1996-04-18 1998-07-14 International Business Machines Corporation Method and system for performing record searches in a database within a computer peripheral storage device
US5727129A (en) * 1996-06-04 1998-03-10 International Business Machines Corporation Network system for profiling and actively facilitating user activities
US5903816A (en) * 1996-07-01 1999-05-11 Thomson Consumer Electronics, Inc. Interactive television system and method for displaying web-like stills with hyperlinks
US5918223A (en) * 1996-07-22 1999-06-29 Muscle Fish Method and article of manufacture for content-based analysis, storage, retrieval, and segmentation of audio information
US5862223A (en) * 1996-07-24 1999-01-19 Walker Asset Management Limited Partnership Method and apparatus for a cryptographically-assisted commercial network system designed to facilitate and support expert-based commerce
US5721827A (en) * 1996-10-02 1998-02-24 James Logan System for electrically distributing personalized information
US6005565A (en) * 1997-03-25 1999-12-21 Sony Corporation Integrated search of electronic program guide, internet and other information resources
US5959945A (en) * 1997-04-04 1999-09-28 Advanced Technology Research Sa Cv System for selectively distributing music to a plurality of jukeboxes
US7167857B2 (en) * 1997-04-15 2007-01-23 Gracenote, Inc. Method and system for finding approximate matches in database
US5987525A (en) * 1997-04-15 1999-11-16 Cddb, Inc. Network delivery of interactive entertainment synchronized to playback of audio recordings
US7308485B2 (en) * 1997-04-15 2007-12-11 Gracenote, Inc. Method and system for accessing web pages based on playback of recordings
US6175857B1 (en) * 1997-04-30 2001-01-16 Sony Corporation Method and apparatus for processing attached e-mail data and storage medium for processing program for attached data
US5987454A (en) * 1997-06-09 1999-11-16 Hobbs; Allen Method and apparatus for selectively augmenting retrieved text, numbers, maps, charts, still pictures and/or graphics, moving pictures and/or graphics and audio information from a network resource
US6112240A (en) * 1997-09-03 2000-08-29 International Business Machines Corporation Web site client information tracker
JPH11306022A (ja) * 1998-04-16 1999-11-05 Matsushita Electric Ind Co Ltd エージェント知識利用方法及び装置
US6201176B1 (en) * 1998-05-07 2001-03-13 Canon Kabushiki Kaisha System and method for querying a music database
US8332478B2 (en) * 1998-10-01 2012-12-11 Digimarc Corporation Context sensitive connected content
US6304523B1 (en) * 1999-01-05 2001-10-16 Openglobe, Inc. Playback device having text display and communication with remote database of titles
US6654735B1 (en) * 1999-01-08 2003-11-25 International Business Machines Corporation Outbound information analysis for generating user interest profiles and improving user productivity
US6941325B1 (en) * 1999-02-01 2005-09-06 The Trustees Of Columbia University Multimedia archive description scheme
US6963975B1 (en) * 2000-08-11 2005-11-08 Microsoft Corporation System and method for audio fingerprinting
US6657117B2 (en) * 2000-07-14 2003-12-02 Microsoft Corporation System and methods for providing automatic classification of media entities according to tempo properties
US7085613B2 (en) * 2000-11-03 2006-08-01 International Business Machines Corporation System for monitoring audio content in a video broadcast
WO2002046968A2 (en) * 2000-12-05 2002-06-13 Openglobe, Inc. Automatic identification of dvd title using internet technologies and fuzzy matching techniques
JP2002222302A (ja) * 2000-12-15 2002-08-09 Buzzhits Inc 需要刺激に対する消費者の反応に、オンデマンドで対応するためのシステム及び方法
EP1362485B1 (en) * 2001-02-12 2008-08-13 Gracenote, Inc. Generating and matching hashes of multimedia content
US7363278B2 (en) * 2001-04-05 2008-04-22 Audible Magic Corporation Copyright detection and protection system and method
US6968337B2 (en) * 2001-07-10 2005-11-22 Audible Magic Corporation Method and apparatus for identifying an unknown work
US7203692B2 (en) * 2001-07-16 2007-04-10 Sony Corporation Transcoding between content data and description data
US7877438B2 (en) * 2001-07-20 2011-01-25 Audible Magic Corporation Method and apparatus for identifying new media content
KR20040024870A (ko) * 2001-07-20 2004-03-22 그레이스노트 아이엔씨 음성 기록의 자동 확인
EP1421521A2 (en) * 2001-07-31 2004-05-26 Gracenote, Inc. Multiple step identification of recordings
US7117200B2 (en) * 2002-01-11 2006-10-03 International Business Machines Corporation Synthesizing information-bearing content from multiple channels
US6766523B2 (en) * 2002-05-31 2004-07-20 Microsoft Corporation System and method for identifying and segmenting repeating media objects embedded in a stream
US20040034441A1 (en) * 2002-08-16 2004-02-19 Malcolm Eaton System and method for creating an index of audio tracks
US20070106405A1 (en) * 2005-08-19 2007-05-10 Gracenote, Inc. Method and system to provide reference data for identification of digital content

Cited By (24)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9686596B2 (en) 2008-11-26 2017-06-20 Free Stream Media Corp. Advertisement targeting through embedded scripts in supply-side and demand-side platforms
US9706265B2 (en) 2008-11-26 2017-07-11 Free Stream Media Corp. Automatic communications between networked devices such as televisions and mobile devices
US9703947B2 (en) 2008-11-26 2017-07-11 Free Stream Media Corp. Relevancy improvement through targeting of information based on data gathered from a networked device associated with a security sandbox of a client device
US9716736B2 (en) 2008-11-26 2017-07-25 Free Stream Media Corp. System and method of discovery and launch associated with a networked media device
US9838758B2 (en) 2008-11-26 2017-12-05 David Harrison Relevancy improvement through targeting of information based on data gathered from a networked device associated with a security sandbox of a client device
US9848250B2 (en) 2008-11-26 2017-12-19 Free Stream Media Corp. Relevancy improvement through targeting of information based on data gathered from a networked device associated with a security sandbox of a client device
US9854330B2 (en) 2008-11-26 2017-12-26 David Harrison Relevancy improvement through targeting of information based on data gathered from a networked device associated with a security sandbox of a client device
US9866925B2 (en) 2008-11-26 2018-01-09 Free Stream Media Corp. Relevancy improvement through targeting of information based on data gathered from a networked device associated with a security sandbox of a client device
US9961388B2 (en) 2008-11-26 2018-05-01 David Harrison Exposure of public internet protocol addresses in an advertising exchange server to improve relevancy of advertisements
US9967295B2 (en) 2008-11-26 2018-05-08 David Harrison Automated discovery and launch of an application on a network enabled device
US9986279B2 (en) 2008-11-26 2018-05-29 Free Stream Media Corp. Discovery, access control, and communication with networked services
US10032191B2 (en) 2008-11-26 2018-07-24 Free Stream Media Corp. Advertisement targeting through embedded scripts in supply-side and demand-side platforms
US10074108B2 (en) 2008-11-26 2018-09-11 Free Stream Media Corp. Annotation of metadata through capture infrastructure
US10142377B2 (en) 2008-11-26 2018-11-27 Free Stream Media Corp. Relevancy improvement through targeting of information based on data gathered from a networked device associated with a security sandbox of a client device
US10334324B2 (en) 2008-11-26 2019-06-25 Free Stream Media Corp. Relevant advertisement generation based on a user operating a client device communicatively coupled with a networked media device
US10419541B2 (en) 2008-11-26 2019-09-17 Free Stream Media Corp. Remotely control devices over a network without authentication or registration
US10425675B2 (en) 2008-11-26 2019-09-24 Free Stream Media Corp. Discovery, access control, and communication with networked services
US10567823B2 (en) 2008-11-26 2020-02-18 Free Stream Media Corp. Relevant advertisement generation based on a user operating a client device communicatively coupled with a networked media device
US10631068B2 (en) 2008-11-26 2020-04-21 Free Stream Media Corp. Content exposure attribution based on renderings of related content across multiple devices
US10771525B2 (en) 2008-11-26 2020-09-08 Free Stream Media Corp. System and method of discovery and launch associated with a networked media device
US10791152B2 (en) 2008-11-26 2020-09-29 Free Stream Media Corp. Automatic communications between networked devices such as televisions and mobile devices
US10880340B2 (en) 2008-11-26 2020-12-29 Free Stream Media Corp. Relevancy improvement through targeting of information based on data gathered from a networked device associated with a security sandbox of a client device
US10977693B2 (en) 2008-11-26 2021-04-13 Free Stream Media Corp. Association of content identifier of audio-visual data with additional data through capture infrastructure
US10986141B2 (en) 2008-11-26 2021-04-20 Free Stream Media Corp. Relevancy improvement through targeting of information based on data gathered from a networked device associated with a security sandbox of a client device

Also Published As

Publication number Publication date
US20060218126A1 (en) 2006-09-28
BRPI0408288A (pt) 2006-03-07
JP2006527425A (ja) 2006-11-30
EP1606733A1 (en) 2005-12-21
AU2004219418A1 (en) 2004-09-23
EP1457889A1 (en) 2004-09-15
WO2004081817A1 (en) 2004-09-23
CN1759396A (zh) 2006-04-12

Similar Documents

Publication Publication Date Title
KR20050117558A (ko) 개선된 데이터 검색 방법 및 시스템
EP1474760B1 (en) Fast hash-based multimedia object metadata retrieval
US9424349B2 (en) Restoring program information for clips of broadcast programs shared online
CN107844586B (zh) 新闻推荐方法和装置
US10025841B2 (en) Play list generation method and apparatus
US9292519B2 (en) Signature-based system and method for generation of personalized multimedia channels
US7877438B2 (en) Method and apparatus for identifying new media content
Haitsma et al. A highly robust audio fingerprinting system with an efficient search strategy
CN110083714B (zh) 用于自动文件检测的对来自基于文件的媒体的特有信息的获取、恢复和匹配
CN100426861C (zh) 对嵌于媒介流中的重复对象提供用户控制的系统和方法
RU2422891C2 (ru) Система и способ для ускорения поисков в базе данных для множественных синхронизированных потоков данных
US20100023328A1 (en) Audio Recognition System
US20100146009A1 (en) Method of DJ commentary analysis for indexing and search
US20110066700A1 (en) Behavior monitoring system
Selvakumar et al. Content recognition using audio finger printing
Haitsma Audio Fingerprinting
TW200901745A (en) Communication system and information providing method
Haitsma et al. A New Technology To Identify Music
WOODHEAD et al. Patent 2965360 Summary

Legal Events

Date Code Title Description
N231 Notification of change of applicant
WITN Application deemed withdrawn, e.g. because no request for examination was filed or no examination fee was paid