KR20050085829A

KR20050085829A - 오디오 신호 식별 방법 및 시스템

Info

Publication number: KR20050085829A
Application number: KR1020057011544A
Authority: KR
Inventors: 칼 제이. 우드
Original assignee: 코닌클리케 필립스 일렉트로닉스 엔.브이.
Priority date: 2002-12-20
Filing date: 2003-12-10
Publication date: 2005-08-29
Also published as: JP2006511846A; AU2003303126A1; EP1579679A1; GB0307474D0; WO2004057861A1; US20060058997A1

Abstract

본 발명은 오디오 신호들의 세트로부터 오디오 신호를 식별하는 방법에 관한 것이다. 사용자 선호도(106)가 수신된다(104). 오디오 신호들의 세트는 예를 들어 다수의 무선 소스들로부터 동시에 수신된다(108). 오디오 신호들은 특징들(112)을 추출하기 위하여 분석된다(110). 오디오 신호들은 사용자 선호도(106)와 추출된 특징들(112)의 비교에 기초하여 식별된다(114). 선택적으로, 식별된 오디오 신호들이 출력된다(116).

Description

오디오 신호 식별 방법 및 시스템{AUDIO SIGNAL IDENTIFICATION METHOD AND SYSTEM}

본 발명은 다수의 오디오 신호들로부터 오디오 신호를 식별하는 방법 및 시스템에 관한 것이다.

고객들 및 다른 최종 사용자들에게 이용될 수 있는 시청각(AV) 콘텐트, 예를 들어 지상, 케이블, 위성 및 인터넷에 의해 전달되는 엔터테인먼트 서비스들의 양이 증가하고 있다. 비록 새로운 콘텐트가 이용 가능하지만, 많은 소비자들은 적당한 검색 보조기(aids)를 갖지 못하기 때문에 상기 컨텐트를 알지 못한채 있다. 프린트 매체 같은 종래 보조기들은 모든 이용할 수 있는 콘텐트의 소스에 탁월할 수 없다 - 상기 보조기들은 예를 들어 공개 유통 영역에서 수신할 수 있는 TV 및 라디오 스테이션들과 같은 제한된 세트의 콘텐트에 집중한다. 상기 모델은 예를 들어 위성 또는 인터넷을 통하여 분배되는 콘텐트와 같이 보다 넓은 비-지리적 기반의 콘텐트 분배를 완전히 서비스할 수 없다. 대안으로서, 전자 프로그램 가이드들(EPG)은 사용자가 보다 쉽게 아이템들을 선택할 수 있도록 도입되었지만, 상업적 또는 다른 이유들로, 이들은 사용자가 이용할 수 있는 모든 콘텐트를 커버하지 못한다. 게다가, 예를 들어 아이템의 설명에 기초하여 아이템을 선택할 때 사용자는 판단을 필요로 하고 - 상기 판단이 올바르지 않다면, 소비자가 관심있는 콘텐트를 잠재적으로 거절할 수 있고, 그 역도 또한 같다.

종래 소비자들은 요구가 있는 즉시 콘텐트에 액세스하기를 원한다. 이런 형태의 계획되지 않은 사용은 거의 계획이나 노력을 요구하지 않기 때문에 대중적이다. 실제로, 사용자들은 보거나 듣기 위해 콘텐트를 검색하는 이용 가능한 채널들을 샘플링한다. 상기 처리의 단점은 많은 채널들을 샘플링하는데 필요한 시간과 임의의 성공 가능성을 포함한다 : 통상적인 결과는 적당한 아이템을 발견하지만, 그 시작을 빠뜨리거나; 전체적으로 아이템을 놓칠 수 있다.

다른 접근법은 주제 채널들의 사용이다. 특정 주제에 대한 프로그램을 보기를 원하는 사용자는 상기 주제에 관한 특정한 채널들을 검토한다. 불행히도, 충분히 많은 청중을 끌어들이기 위하여, 주제 채널들은 임의의 특정 사용자의 흥미들보다 범위가 넓은 경향이 있다. 라디오 채널들에 대해서도 또한 동일하다.

엔터테인먼트 채널 내에서, 아이템들의 주제는 예를 들어 유럽 방송 연합에 의해 정의되고 많은 유럽 방송 방송자들에 의해 사용되는 프로그램 전달 제어부(Programme Delivery Control;PDC) 및 라디오 데이터 시스템(Radio Data System;RDS) 서비스들 내의 프로그램 타입 PTY 코드들과 같은 메타데이터 디스크립터들(metadata descriptors)에 의해 서술될 수 있다. PTY 코드는 예를 들어 클래식과 대중 음악 사이를 구별하는 것과 같이, 다수의 넓은 분류들 중 하나와 상기 코드를 연관시키기 위해 프로그램에 할당될 수 있다. 주제 채널들로 인해, 이러한 카테고리화는 일반적으로 특정 사용자 선호도(preference)보다 넓고, 그러므로, 방송자 및 서비스 제공자들에 의한 상기 메타데이터 서비스들의 전개는 널리 보급되지 못하였다.

사용자들은 특정 선호도들에 보다 적합한 콘텐트를 획득할 것을 기대하여 콘텐트를 액세스하는데 투자하고, 바람직하게는, 상기 사용자들은 요구시에 그리고 최소의 노력으로 콘텐트에 액세스하기를 원한다.

도 1은 다수의 오디오 신호들로부터 오디오 신호를 식별하는 방법의 흐름도.

도 2는 추가 단계들을 포함하는 도 1의 방법의 흐름도.

도 3은 다수의 오디오 신호들로부터 오디오 신호들을 식별하는 시스템의 개략적인 대표도.

도 4는 식별된 오디오 신호를 출력하기 위한 출력 장치를 더 포함하는 도 3의 시스템의 개략적인 대표도.

도 5는 바람직한 처리 수단을 나타내는 다수의 오디오 신호들로부터 오디오 신호를 식별하기 위한 시스템의 제 2 실시예의 개략적인 대표도.

도 6은 처리가 서비스 제공자 장치 및 사용자 장치들에 의해 수행되는 다수의 오디오 신호들로부터 오디오 신호를 식별하기 위한 도 5의 시스템의 제 1 애플리케이션의 개략적인 대표도.

도 7은 처리가 네트워크 서비스 제공자에 의해 수행되는 다수의 오디오 신호들로부터 오디오 신호를 식별하기 위한 도 5의 시스템의 제 2 애플리케이션의 개략적인 대표도.

본 발명의 목적은 알려진 기술을 개선하는 것이다.

본 발명의 제 1 양상에 따라 다수의 오디오 신호들로부터 오디오 신호를 식별하는 방법에 있어서,

사용자 선호도를 수신하는 단계;

다수의 오디오 신호들을 동시에 수신하는 단계;

특징들을 추출하기 위하여 상기 오디오 신호들을 분석하는 단계; 및

사용자 선호도와 추출된 특징들의 비교에 기초하여 제 1 오디오 신호를 식별하는 단계를 포함하는, 오디오 신호 식별 방법을 제공한다.

본 발명의 제 2 양상에 따라, 다수의 오디오 신호들로부터 오디오 신호를 식별하는 시스템에 있어서,

사용자 선호도를 수신하도록 동작하는 수신 장치;

다수의 오디오 신호들을 동시에 수신하도록 동작하는 오디오 입력 수단;

특징들을 추출하고 사용자 선호도 및 추출된 특징들의 비교에 기초하여 제 1 오디오 신호를 식별하기 위하여 오디오 신호들을 분석하도록 동작하는 처리 수단을 포함하는, 오디오 신호 식별 시스템을 제공한다.

본 발명으로 인해 효율적이고 정확한 방식으로 다수의 오디오 신호들로부터 사용자 선호도에 대응하는 오디오 신호를 식별하는 것이 가능하다. 오디오 신호들은 디지털 또는 아날로그일 수 있다.

바람직하게, 제 1 오디오 신호는 출력되고, 예를 들어 사용자 선호도와 실질적으로 매칭하는 동시에 이용할 수 있는 오디오 신호가 출력된다. 이상적으로, 오디오 신호들의 분석은 연속적으로 수행되고, 사용자 선호도 및 추출된 특징들의 비교에 기초하여 제 2 오디오 신호를 또한 식별한다. 이런 방식에서, 상기 방법은 가능한 미래 사용을 위한 부가적인 오디오 신호들을 식별한다. 바람직하고 미리 결정된 룰에 따라, 출력은 제 1 오디오 신호에서 제 2 오디오 신호로 스위칭한다. 상기 룰은 임의의 적당한 기준, 예를 들어 연산 성능 또는 사용자 요구에 따라 결정된다. 바람직하게, 상기 방법은 제 2 오디오 신호를 저장하고, 출력이 제 1 오디오 신호에서 제 2 오디오 신호로 스위칭할때, 저장부로부터 제 2 오디오 신호를 소환한다. 예를 들어, 이것은 제 1 오디오 신호의 출력이 제 2 오디오 신호의 출력을 시작하기 전에 완료되게 한다. 이상적으로, 제 2 오디오 신호의 저장은 제 2 신호의 식별을 시작한다. 이런 방식에서, 제 2 오디오 신호의 출력은 제 2 오디오 신호의 시작시에 실질적으로 시작될 수 있다. 다른 장점은 다수의 오디오 신호들을 저장함으로써 얻어진다. 상기 저장은 성능을 쉽게 개선시키고, 예를 들어 오디오 신호들이 식별되는 것과 다른 순서로 오디오 신호들이 출력되게 한다. 게다가, 사용자는 저장된 오디오 신호들의 출력을 예를 들어 현재 출력된 오디오 신호를 스킵함으로써 달성한다. 사용자는 그의 선호도를 변경할 수 있고 새로운 선호도에 따라 저장된 오디오 신호들의 재분석을 요구한다.

바람직하게, 사용자 선호도를 수신하는 것은 사용자 인터페이스로부터 상기 성능을 수신하는 것을 포함한다. 이것은 사용자가 임의의 적당한 사용자 인터페이스 방법에 의해 그의 선호도를 식별하게 한다. 선택적으로, 사용자 선호도를 수신하는 것은 저장소로부터 상기 선호도를 수신하는 것을 포함한다. 이 경우, 사용자 선호도는 하나 이상의 저장된 파라미터들을 참조하여 얻어지고, 상기 파라미터들은 예를 들어 종래 이용도를 모니터링함으로써 미리 결정된다. 선택적으로, 저장된 파라미터들은 고정되고 정적 사용자 선호도를 나타낸다. 임의의 실시예들에서, 상기 방법은 상기 사용자 선호도가 특징들로 변환되게 한다.

추출된 특징들은 오디오 신호들의 고유한 특징들을 포함한다. 음악 콘텐트를 포함하는 오디오 신호들에 대하여, 고유한 특징들은 음악적 특징들이다.

본 발명의 장점은 사용자가 다수의 오디오 신호들로부터 오디오 신호의 식별을 수행하기 위하여 오디오 신호들을 리뷰하기를 요구하지 않는 것이다. 게다가, 본 발명은 서비스 제공자들, 방송자들 등의 카테고리화된 콘텐트와 무관하게 또는 협력하여 임의의 오디오 신호의 식별에 응용할 수 있다. 게다가, 적당한 오디오 신호들은 디지털 네트워크 서비스들(예를 들어, 인터넷 라디오 스테이션들, AV 스트리밍 등)뿐 아니라 종래 텔레비젼 및 라디오 서비스들과 연관된 것을 포함한다. 게다가, 본 발명은 오디오 신호들의 실질적 실시간 식별 및 출력을 지원한다.

본 발명의 실시예들은 이제 첨부 도면을 참조하여 예로서만 기술될 것이다.

도 1은 다수의 오디오 신호들로부터 오디오 신호를 식별하는 방법의 흐름도를 도시한다. 상기 방법은 102에서 시작한다. 사용자 선호도(106)는 수신된다(104). 다수의 오디오 신호들은 오디오 신호들이 특징들(112)을 추출하도록 분석(110)하기 위하여 이용할 수 있도록 동시에 수신된다(108). 분석은 신호들, 또는 임의의 결합에서 차례로 또는 동시에 각각의 오디오 신호에서 순차적으로 수행될 수 있다. 이상적으로, 실질적으로 실시간 애플리케이션들을 위하여, 동시 분석은 오디오 신호들에서 수행된다. 그 다음 오디오 신호는 사용자 선호도 및 추출된 특징들의 비교에 기초하여 식별된다(114). 식별된 오디오 신호들은 선택적으로 출력된다(116)(점선으로 도시됨). 바람직하게, 오디오 신호들의 분석은 연속적으로 수행되고, 부가적인 오디오 신호들이 또한 식별된다. 출력이 의도되는 경우, 미리 규정된 룰에 따라 출력은 하나의 식별된 오디오 신호를 다른 오디오 신호로 스위칭한다. 임의의 적당한 미리 규정된 룰이 결정될 수 있다. 일례는 동시에 출력 식별된 오디오 신호의 단부에 기초하여 식별된 오디오 신호에 관련된 룰이다. 다른 실시예는 예를 들어 사용자가 현재 출력되어 식별된 오디오 신호의 나머지를 스킵하는 것을 요구하는 경우 사용자 입력에 응답하는 룰이다.

여기에 사용된 용어 "오디오 신호들"은 엔터테인먼트 채널들(예를 들어, 라디오 스테이션들, TV 채널들 및 인터넷 채널들)을 포함하는 하나 이상의 오디오 신호들, 엔터테인먼트 채널들(예를 들어, 라디오 및 TV 쇼들)내의 프로그램 아이템들 및 이산 아이템들(예를 들어, 음악 트랙들 및 유사한 짧은 아이템들)을 포함하는 콘텐트와 연관된다. 오디오 신호들로부터 추출된 특징들은 오디오 신호들의 고유한 특징들을 포함한다. 용어 "고유한 특징들"은 예를 들어 음악적 특징들인 오디오 신호의 속성들을 포함하는 오디오 신호의 특징들을 의미한다; 상기 오디오 신호는 메타데이터 또는 볼륨 레벨 같은 오디오 신호와 단순히 연관되는 것과 같은 다른 특징들과 다르다. 음악적 특징들의 예들은 음악 키, 가락 및 템포를 포함한다. 수신된 사용자 선호도는 사용자 선호도를 함께 제공하는 하나 이상의 특징들을 식별한다. 적당한 사용자 선호도는 인터페이스(예를 들어 사용자 인터페이스) 또는 저장소로부터 수신될 수 있다. 추후 방법은 예를 들어 이전에 규정된 사용자 선호도가 한번 이상 사용되어, 사용자 시간 및 노력을 저장한 경우 적당하다.

도 2는 추가 단계들을 포함하는 도 1의 방법의 흐름도를 도시한다. 상기 방법은 202에서 시작하고 사용자 선호도(206)는 204에서 수신된다. 다수의 오디오 신호들은 210에서 동시에 수신되고 이들은 212에서 저장된다. 오디오 신호들은 특징들(216)을 추출하기 위하여 분석된다(214). 오디오 신호들이 저장되기 때문에, 분석은 차례로 각각의 오디오 신호에서 수행되고, 이것은 동시 분석과 비교하여 잠재적으로 비용을 절약할 수 있다. 이 방법은 실질적으로 실시간 보다 이면 처리로서 오디오 신호들을 식별하는 애플리케이션들에 특히 적당하다. 오디오 신호들은 사용자 선호도 및 추출된 특징들의 비교에 기초하여 식별된다(218). 도면은 하나 이상의 특징들로 변환된(208) 사용자 선호도(206)를 도시한다. 식별된 신호는 저장되고(220) 신호들은 출력된다(222). 출력은 현재 오디오 신호로부터 저장소로부터 다음 오디오 신호를 소환하는 다음 오디오 신호로 스위칭한다. 바람직하게, 식별된 오디오 신호의 저장은 신호의 식별을 시작한다. 이것은 예를 들어 식별된 오디오 신호가 실질적으로 시작 시점에서 출력을 시작하게 한다.

도 3은 다수의 오디오 신호들로부터 오디오 신호를 식별하는 시스템의 개략적인 대표도를 도시한다. 시스템은 사용자 선호도(312)를 수신하는 수신 장치(310), 2개의 오디오 신호들(304, 306)을 동시에 수신하는 오디오 입력 수단(302) 및 특징들을 추출하고 사용자 선호도와 추출된 특징들의 비교에 기초하여 오디오 신호를 식별하기 위하여 오디오 신호들을 분석하는 처리기(308)를 포함한다. 수신 장치(310)는 사용자 인터페이스, 유선 인터페이스 또는 무선 인터페이스일 수 있다. 예를 들어, 수신 장치(310)는 사용자 선호도를 포함하는 저장소에 대한 인터페이스일 수 있다. 비록 단지 2개의 오디오 신호들(304, 306)이 도시되지만, 일반적으로 시스템은 목표된 애플리케이션에 적당한 수의 오디오 신호들을 수신할 것이다. 오디오 신호들(304, 306)은 아날로그 또는 디지털 코드화되고 방송 라디오(예를 들어, AM, FM, DAB), 텔레비젼(예를 들어, 지상, 케이블, 위성) 및 디지털 네트워크 서비스들(예를 들어, GSM, 3G, 인터넷)을 포함하는 임의의 적당한 소스로부터 발생한다. 인터넷 전달 서비스들은 다운로드할 수 있고 스트림되는 포맷들의 라디오 및 TV 서비스들을 포함한다. 오디오 입력 수단(302)은 처리기(308)에 오디오 신호들(304, 306)을 수신하고 이용할 수 있는 능력을 제공한다. 통상적으로, 오디오 입력 수단(302)은 각각의 오디오 입력, 예를 들어 하나 이상의 아날로그 FM 라디오 동조기들 및 인터넷 동조기(예를 들어 라디오 콘텐트를 스트림하는 URL에 액세스할 수 있도록)에 대한 수신 수단을 포함한다. 선택적으로, 처리기(308)는 다른 오디오 신호들이 동조기에 의해 수신될 수 있도록 동조기를 제어하는 능력을 포함한다. 오디오 입력 수단(302)은 사용자 CD 수집 같은 라이브러리 콘텐트를 수신하는 수단을 선택적으로 포함한다. 아날로그 오디오 신호가 수신되는 경우, 이것은 추후 처리를 용이하게 하기 위하여 오디오 입력 수단(302) 또는 처리기(308)에 의해 디지털 포맷으로 전환된다.

처리기(308)는 특징들을 추출하기 위하여 오디오 신호들을 분석한다. 상기 분석에 사용된 방법은 전체 애플리케이션에 다를 것이다. 본 발명은 실질적으로 실시간이고 또한 실시간이 아닌 애플리케이션들을 지원한다. 이전의 경우 분석에 사용된 시간을 최소화하는 것은 명백히 바람직하다. 특징들이 오디오 신호들에 고유하기 때문에, 보다 빠른(분석) 처리는 분석 시간을 최소화할 수 없다. 일반적으로, 실질적으로 실시간 애플리케이션들에 대해, 개선된 성능은 이하 도 5와 관련하여 추가로 논의된 바와 같이 수신된 오디오 신호에 하나의 분석기를 가지는 것에 의해 달성할 수 있다. 반대로, 비실시간 애플리케이션들에 대하여, 적당한 성능은 2개 이상의 오디오 신호들 사이에서 분석기를 공유함으로써 얻어질 수 있다. 분석되고 추출된 특징들을 가지는 처리기(308)는 사용자 선호도(312)와 추출된 특징들의 비교에 기초하여 오디오 신호를 식별한다. 본 발명은 예를 들어 라디오를 스위칭하고 오디오 신호가 사용자의 선호도에 동시에 대응하는 스테이션을 자동으로 식별하는 한번에 분석 및 식별을 지원한다. 본 발명은 이하에 추가로 논의되는 바와 같이 연속적인 분석 및 식별을 지원한다.

도 4는 식별된 오디오 신호의 출력에 대한 출력 장치를 추가로 포함하는 도 3의 시스템의 개략적인 대표도를 도시한다. 시스템은 사용자 선호도(412)를 수신하는 수신 장치(410), 2개의 오디오 신호들(404, 406)을 동시에 수신하는 오디오 입력 수단(402), 특징들을 추출하고, 사용자 선호도와 추출된 특징들의 비교에 기초하여 오디오 신호를 식별하고 식별된 오디오 신호를 출력(418)하는 출력 장치(416)를 제어하기(414) 위해 오디오 신호들을 분석하는 처리기(408)를 포함한다. 유용한 양상은 식별된 오디오 신호들을 출력하는 능력이다. 이 출력은 출력 장치를 제어하는 제어기에 의해 관리된다. 물리적 출력 장치는 처리기로부터 출력된 식별된 오디오 신호들이 출력 장치를 제어하는 처리기에 의해 결정되도록 처리기 그 자체내에 통합될 수 있다. 상기 실시예에서, 분리된 출력 장치(416)는 처리기(408)에 의해 제어된(414) 변경 스위칭 장치를 포함하는 것을 도시한다. 예를 들어, 오디오 신호(404)가 처리기에 의해 처음에 식별되는 경우, 스위칭 장치는 출력된(418) 오디오 신호(404)를 선택하기 위하여 제어된다. 처리기는 오디오 신호들을 연속적으로 분석하고 식별하기 위하여 배열될 수 있고, 이 경우 처리기는 처음 식별 다음 사용자 선호도 및 추출된 특징들의 비교에 기초하여 오디오 신호들을 추가로 식별할 수 있다. 미리 정의된 룰에 따라, 출력은 하나의 식별된 오디오 신호로부터 다른 식별된 오디오 신호로 스위칭될 수 있다. 임의의 적당한 룰은 예를 들어 현재 출력된 오디오 신호의 단부에서 스위칭하거나 처음에 식별된 바로 다음 오디오 신호를 출력하기 위하여 스위칭하는 것이 정의될 수 있다. 사용된 룰은 시스템으로부터 목표된 성능에 따른다. 추가 방법들은 하기에 논의되는 바와 같이 성능을 개선하기에 적당한 룰과 관련하여 사용될 수 있다. 도 4의 실시예와 관련하여, 적당한 룰은 오디오 신호가 식별될때 출력 장치를 식별할 수 있다. 룰은 처리기(408)에 포함된다. 오디오 신호(404)가 우선 식별되는 것을 가졍하면, 처리기(룰에 따라)는 출력될(418) 오디오 신호(404)를 선택하기 위하여 출력 장치(416)를 제어한다(414). 처리기는 오디오 신호들(404 및 406)을 계속 분석하고 이 시간 동안 게속 오디오 신호(404)를 식별한다. 추후에, 오디오 신호(406)는 식별되고 처리기(룰에 따라)는 오디오 신호(404)로부터 오디오 신호(406)를 스위칭하기 위하여 출력 장치(416)를 제어한다(414).

도 5는 바람직한 처리 수단을 나타내는 다수의 오디오 신호들로부터 오디오 신호를 식별하는 시스템의 제 2 실시예의 개략적인 대표도를 도시한다. 보다 융통성있는 실시예로 인해 도 4 이상의 추가 특징들은 인에이블된다. 도면은 처리기(500), 오디오 입력 수단(502), 출력 장치(504), 수신 장치(506) 및 버스(510)에 의해 모두 상호접속된 저장소(508)를 포함하는 시스템의 실시예를 도시한다. 오디오 입력 수단(502)은 표준 방송 및 네트워크 전달 서비스들과 연관된 오디오 신호들을 수신하기 위하여 하나 이상의 동조기들을 사용하여 다수의 오디오 신호들을 수신한다. 동조기들의 수 및 형태들은 애플리케이션에 따를 것이다; 동조기들의 예들은 지상 라디오 방송들(AM, FM, DAB), 지상 TV 방송들(아날로그 및 디지털), 위성 TV 및 라디오 방송들, 케이블 TV 및 라디오 채널들, 이동 전화 통신들(예를 들어, GSM, 및 3G 시스템들), 및 네트워크 서비스들(예를 들어, 인터넷 라디오 및 다른 시청각 서비스들)을 수신할 수 있는 것들을 포함한다. 처리기(500)는 버스(510)에 상호접속된 CPU(512), 분석기(514), 비위성 프로그램 저장소(예를 들어, ROM)(516) 및 휘발성 저장소(예를 들어, RAM)(518)를 포함한다. 오디오 입력 수단(502)은 다수의 오디오 신호들을 수신하고 이들을 버스(510)상에 배치한다. 분석기(514)는 특징들을 추출하기 위하여 오디오 신호들을 분석하고 저장한다. 분석기는 차례로 각각의 오디오 신호를 순차적으로 분석한다. 효율성을 위하여 각각의 오디오 신호가 동시에 분석되는 것이 바람직하다. 분석기는 예를 들어 ASIC 또는 CPU인 하나 이상의 전용 회로들을 사용하는 임의의 적당한 수단을 사용하여 실행될 수 있고; 각각의 회로는 몇몇 오디오 입력 수단 장치들(예를 들어, 동조기들) 사이에 공유될 수 있고; 이상적으로 각각의 회로는 하나의 장치에 할당된다. 예를 들어 실시간으로 동작하지 않는 것들인 몇몇 애플리케이션들에서, 분석기(514)의 기능은 CPU(512)에 의해 대신 수행될 수 있다. 비휘발성 프로그램 저장소는 CPU(512)에 대한 프로그램 명령들을 포함하고, 소프트웨어가 구동되는 경우 분석기에 대한 명령들을 포함한다. 수신 장치(506)는 그것이 버스(510)에 배치될 때 사용자 선호도를 수신한다. 수신 장치는 사용자 인터페이스의 일부이고, 사용자가 상호작용하고 사용자 선호도를 결정할 수 있는 임의의 사용자 인터페이스가 적당하다. 선택적으로, 수신 장치는 저장소(508) 또는 (유선 또는 무선) 네트워크 인터페이스 같은 다른 엔티티를 통하여 사용자 선호도를 간단히 수신할 수 있고, 이들의 예는 이하 도 6 및 도 7과 관련하여 논의된다. 임의의 적당한 방법은 사용자가 은연중에 선호도를 제공하는 경우들을 포함하는 사용자 선호도를 결정하기 위하여 사용될 수 있고, 일예는 현재 동조된 라디오 스테이션의 오디오 신호의 하나 이상의 특징들이 사용자 선호도를 제공하는 경우이다. CPU(512)는 사용자 선호도 및 추출된 특징들의 비교에 기초하여 오디오 신호를 식별한다. 사용자 선호도는 오디오 신호 식별을 위하여 특징들로 변환하는 것을 요구하는 포맷으로 수신될 수 있고, 수신 장치가 사용되지 않는 경우, 변환은 CPU(512)에 의해 수행된다. 그 다음 CPU(512)는 버스(510)를 통하여 출력 장치(504)로 선택되어 식별된 오디오 신호들을 보냄으로써 식별된 오디오 신호들의 출력을 제어한다. 차례로 출력 장치(504)는 필요성들을 인터페이스함에 따라, 예를 들어 다른 포맷으로 전환함에 따라(예를 들어, 디지털 아날로그 전환, 압축/압축해제 등) 오디오 신호들을 추가로 처리할 수 있다.

CPU(512)는 저장소(508)와 상호작용한다. 저장소(508)는 이용할수 있는 자기 및 광학 매체를 포함하는 임의의 적당한 형태이다. 예를 들어 하드 디스크 드라이브인 바람직하게 저장소는 동시에 기록 및 판독을 위하여 동작할 수 있다. 저장소(508)는 다음 목적의 임의의 결합에 사용될 수 있다. 하나의 목적은 추출된 특징들 및 사용자 선호도에 대응하는 특징들을 저장하는 것이다. 다른 목적은 오디오 신호들의 식별부들을 로그하는 것이고, 예를 들어 오디오 신호들이 식별되는 라디오 스테이션들을 로그하는 것이다. 상기 로그는 사용자가 선호하는 콘텐트를 포함하는 기대에서 사용자가 스테이션들을 액세스하도록 하기 위하여 사용될 수 있고, 이 능력은 오디오 신호들이 식별될때 이 기록들이 하루의 시간들을 가리키면 추가로 개선될 수 있다. 로그는 사용자 선호도를 나타낼 하나 이상의 기록들을 선택함으로써 너무 많거나 2개 이하의 오디오 신호들이 식별되는 경우 사용자 선호도를 규정하기 위하여 사용될 수 있다. 다른 목적은 식별된 오디오 신호들을 저장하는 것이다. 이것은 식별된 오디오 신호 전체를 출력한다. 게다가, 실시간 애플리케이션들에 대하여, 식별된 오디오 신호들의 출력 정도는 조절될 수 있다. 예로서, 처리기(500)는 수신된 라디오 서비스들로부터 오디오 신호들을 식별하고 사용자 선호도에 대응하는 라디오 서비스를 대리 실행하기 위하여 가장 최근 순서의 신호들을 출력하도록 배열한다. 현재 식별된 오디오 신호가 출력되는 동안, 처리기는 추가 오디오 신호를 식별하고, 그 다음 출력을 기다리는 식별된 오디오 신호들의 리스트의 시작을 저장하고 용이하게 한다. 다른 실시예에서, 한세트의 저장된 식별 오디오 신호들은 사용자에 의해 검토될 수 있고, 게다가, 상기 세트는 예를 들어 사용자 선호도를 규정하여(좁혀) 세트의 크기를 감소시키는 변형된 사용자 선호도에 대해 편집되거나 심지어 재분석될 수 있다. 다른 목적은 수신된 오디오 신호들을 저장하는 것이다. 이것은 오디오 신호들의 비실시간 분석들을 허용하는 장점을 가진다; 상기 분석은 이면 기능으로서 오디오 신호들을 식별하는 애플리케이션들에 적당하고 하나 이상의 오디오 신호 사이의 분석 수단을 공유함으로써 비용을 절약할 수 있다. 다른 장점은 예를 들어 사용자가 하나 이상의 선호도에서 검색하는 경우 수신된 오디오 신호들이 다수의 사용자 선호들을 사용하여 분석될 수 있는 것이다. 상기되고 도면에 도시된 버스(510) 구조는 이들 다양한 저장 옵션들을 용이하게 한다. 본 발명을 사용하는 시스템이 분배되는 것, 예를 들어 상기된 바와 같은 처리기(500)의 기능들이 서비스 제공자에서 수행되거나 사용자측에서 수행되거나 이들 위치들의 결합에서 사용되는 것이 주의된다.

도 6은 처리가 서비스 제공자 장치 및 사용자 장치에 의해 수행되는 다수의 오디오 신호들로부터 오디오 신호를 식별하는 도 5의 시스템의 제 1 애플리케이션의 개략적인 대표도를 도시한다. 서비스 제공자 장치(600)는 예를 들어 상기된 바와 같이 방송 서비스 제공자로부터 오디오 신호들(608)을 현재 수신하는 오디오 입력 수단(602)(동조기들 606 포함)을 포함한다. 사용자 선호도(604)는 저장소(612)로부터 수신되고 사용자들의 그룹의 선호도를 나타낸다. 선호도는 예를 들어 마켓 검색을 통하여 임의의 적당한 방식으로 서비스 제공자에 의해 결정될 수 있다. 처리기(610)는 특징들을 추출하기 위하여 오디오 신호들을 분석하고 사용자 선호도(604) 및 추출된 특징들의 비교에 기초하여 오디오 신호들을 식별한다. 처리기(610)의 일실시예는 도 5의 관련 아이템(500) 및 연관된 설명을 통하여 상기되었다. 식별된 오디오 신호들(620)은 출력 장치(614)에 의해 처리기(610)의 제어하에서 출력하고, 상기 장치는 예를 들어 방송 FM 라디오 전송기이다. 예로서, 서비스 제공자는 동조기들(606)에 의해 수신된 오디오 신호들로부터 전달된 하나 이상의 오디오 신호들 채널들(사용자들 그룹의 선호도에 대응)을 제공한다. 사용자 장치(650)는 동조기들(654) 및 라이브러리 판독기(656)를 포함하는 오디오 입력 수단(652)을 포함한다. 동조기들(654)은 서비스 제공자(600)로부터 오디오 신호들(620)을 수신한다(상기 오디오 신호들은 라디오 및 TV 방송들 및 인터넷 서비스들을 포함하는 임의의 곳으로부터의 오디오 신호들이다). 수신된 오디오 신호들(658)은 사용자 인터페이스(662)로부터 수신된 사용자 선호도(664)에 따라 처리기(660)에서 분석되고 식별된다. 처리기는 애플리케이션의 요구들(상기된 바와 같이)에 따라 저장소(666)를 사용하고 출력 장치(670)에 대한 식별된 오디오 신호들(668)의 출력을 제어한다. 처리기(660)의 일실시예는 도 5 및 연관된 설명의 참조된 아이템(500)과 관련하여 상기되었다. 본 실시예의 장점은 오디오 신호들이 사용자 장치에 의해 수신되고 처리되는 것을 덜 요구하기 때문에, 사용자 장치가 보다 경제적으로 이루어지고 주어진 선호도에 대해 보다 효과적으로 동작한다. 본 실시예는 특히 방송 통신 방법에 적당하다. 명확하게, 상기 실시예는 처리가 정규 방송 및 네트워크 서비스 제공자들로부터 수신된 오디오 신호들상에서 사용자 장치에 의해 독점적으로 수행되는 상황을 포함한다.

도 7은 처리가 네트워크 서비스 제공자에 의해 수행되는 다수의 오디오 신호들로부터 오디오 신호를 식별하는 도 5의 시스템의 제 2 애플리케이션의 개략적인 대표도를 도시한다. 이 실시예에서, 네트워크 서비스 제공자 장치(702)는 사용자 선호도(724)에 따라 서버(706)에 의해 분석되고 식별된 오디오 신호들(716)을 수신하는 오디오 입력 수단(710)(라이브러리 판독기 712 및 동조기들 714)을 포함한다. 서버(706)의 일 실시예는 도 5 및 그와 연관된 설명들의 참조된 아이템들(500 및 508)과 결합하여 상기에서 제공된다. 상기 실시예에서, 사용자 선호도(724)는 이동 전화(718)로부터 GSM 네트워크(722)를 통하여 보내진다. 서버는 출력 장치(708)에 대한 식별된 오디오 신호들(726)의 출력을 제어하고, 상기 장치는 예를 들어 HTTP 포트이다. 사용자는 식별된 오디오 신호들(726)을 수신하고 그것들을 플레이어(728)에서 플레이하고 및/또는 그것들을 PC, PDA, MP3 쥬크박스 등인 장치(730)에 다운로드한다. 이런 실시예는 특정화된 사용자 장치를 요구하지 않는 장점을 가지며, MP3 플레이어들 및 PC들 같은 종래 제품들은 사용될 수 있다. 상기 실시예는 물리적 매체 분배(예를 들어, 메일에 의한 CD-ROM)를 포함하는 피어-피어(peer) 통신 방법들에 특히 적당한다.

상기 방법 및 실시예는 본 발명의 장점을 나타내도록 당업자에 의해 쉽게 식별될 수 있는 방법들 및 실시예들의 범위의 선택을 예시적으로 제공한다.

도 1을 참조하여 상기된 설명에서, 한세트의 오디오 신호들로부터 오디오 신호를 식별하는 방법이 개시된다. 사용자 선호도(106)는 수신된다(104). 오디오 신호들의 세트는 동시에 다수의 라디오 소스들로부터 수신된다(108). 오디오 신호들은 특징들(112)을 추출하기 위하여 분석된다(110). 오디오 신호들은 사용자 선호도(106) 및 추출된 특징들(112)의 비교에 기초하여 식별된다(114). 선택적으로, 식별된 오디오 신호들은 출력된다(116).

Claims

다수의 오디오 신호들로부터 오디오 신호를 식별하는 방법에 있어서,

사용자 선호도(preference)를 수신하는 단계(104);

상기 다수의 오디오 신호들을 동시에 수신하는 단계(108);

특징들을 추출하기 위하여 상기 오디오 신호들을 분석하는 단계(110); 및

상기 사용자 선호도 및 추출된 특징들의 비교에 기초하여 제 1 오디오 신호를 식별하는 단계(114)를 포함하는, 오디오 신호 식별 방법.
제 1 항에 있어서, 상기 제 1 오디오 신호를 출력하는 단계(116)를 더 포함하는, 오디오 신호 식별 방법.
제 1 항 또는 제 2 항에 있어서, 상기 오디오 신호들을 분석하는 단계는 연속하여 수행되고, 상기 사용자 선호도와 추출된 특징들의 비교에 기초하여 제 2 오디오 신호를 또한 식별하는, 오디오 신호 식별 방법.
제 2 항 또는 제 3 항에 있어서, 미리 규정된 룰(rule)에 따라, 상기 출력하는 단계는 상기 제 1 오디오 신호에서 상기 제 2 오디오 신호로 스위칭하는, 오디오 신호 식별 방법.
제 4 항에 있어서, 상기 제 2 오디오 신호를 저장하는 단계(220)를 더 포함하고, 상기 출력하는 단계가 상기 제 1 오디오 신호에서 상기 제 2 오디오 신호로 스위칭할 때, 저장소로부터 상기 제 2 오디오 신호를 소환하는, 오디오 신호 식별 방법.
제 5 항에 있어서, 상기 제 2 오디오 신호를 저장하는 단계는 상기 제 2 신호의 식별을 시작하는, 오디오 신호 식별 방법.
제 1 항 내지 제 5 항 중 어느 한 항에 있어서, 상기 다수의 오디오 신호들을 저장하는 단계(212)를 더 포함하는, 오디오 신호 식별 방법.
제 1 항 내지 제 7 항 중 어느 한 항에 있어서, 상기 사용자 선호도를 수신하는 단계는 사용자 인터페이스로부터 상기 선호도를 수신하는 단계를 포함하는, 오디오 신호 식별 방법.
제 1 항 내지 제 7 항 중 어느 한 항에 있어서, 상기 사용자 선호도를 수신하는 단계는 저장소로부터 상기 선호도를 수신하는 단계를 포함하는, 오디오 신호 식별 방법.
제 1 항 내지 제 9 항 중 어느 한 항에 있어서, 상기 추출된 특징들은 고유한 특징들을 포함하는, 오디오 신호 식별 방법.
제 10 항에 있어서, 상기 고유한 특징들은 음악적 특징들인, 오디오 신호 식별 방법.
제 1 항 내지 제 11 항 중 어느 한 항에 있어서, 상기 사용자 선호도를 특징들로 변환하는 단계(208)를 더 포함하는, 오디오 신호 식별 방법.
다수의 오디오 신호들로부터 오디오 신호를 식별하는 시스템에 있어서,

사용자 선호도를 수신하도록 동작하는 수신 장치(310);

상기 다수의 오디오 신호들을 동시에 수신하도록 동작하는 오디오 입력 수단(302); 및

특징들을 추출하기 위해 상기 오디오 신호들을 분석하고, 상기 사용자 선호도와 추출된 특징들의 비교에 기초하여 제 1 오디오 신호를 식별하도록 동작하는 처리 수단(308)을 포함하는, 오디오 신호 식별 시스템.
제 13 항에 있어서, 상기 제 1 오디오 신호를 출력하기 위한 출력 장치(416)를 더 포함하고, 상기 처리 수단은 상기 출력 장치를 제어하도록 동작하는, 오디오 신호 식별 시스템.
제 13 항 또는 제 14 항에 있어서, 상기 처리 수단은 상기 오디오 신호들을 연속하여 분석하고, 상기 사용자 선호도와 추출된 특징들의 비교에 기초하여 제 2 오디오 신호를 또한 식별하도록 동작하는, 오디오 신호 식별 시스템.
제 14 항 또는 제 15 항에 있어서, 미리 규정된 룰에 따라, 상기 처리 수단은 상기 제 1 오디오 신호에서 상기 제 2 오디오 신호로 스위칭하기 위하여 상기 출력 장치를 제어하도록 동작하는, 오디오 신호 식별 시스템.
제 13 항 내지 제 16 항 중 어느 한 항에 있어서, 저장 수단(508)을 더 포함하는, 오디오 신호 식별 시스템.
제 17 항에 있어서, 상기 저장 수단은 동시에 기록 및 판독하도록 동작하는, 오디오 신호 식별 시스템.
제 13 항 내지 제 18 항 중 어느 한 항에 있어서, 상기 수신 장치는 사용자 인터페이스(662)인, 오디오 신호 식별 시스템.
제 13 항 내지 제 18 항 중 어느 한 항에 있어서, 상기 수신 장치는 무선 인터페이스(704)인, 오디오 신호 식별 시스템.
제 1 항 내지 제 12 항 중 어느 한 항의 방법을 수행하도록 동작하는 소프트웨어를 포함하는 기록 캐리어.
제 1 항 내지 제 12 항 중 어느 한 항에 청구된 방법 단계들을 수행하도록 구성된 소프트웨어 유틸리티.
처리 수단을 포함하는 시스템에 있어서,

상기 처리 수단은 제 22 항에 청구된 소프트웨어 유틸리티에 의해 작동되는, 시스템.