KR20200049887A

KR20200049887A - 네트워크 스트리밍 서비스의 소스를 식별하기 위한 제조 방법, 기기 및 물품

Info

Publication number: KR20200049887A
Application number: KR1020207012223A
Authority: KR
Inventors: 자파르 라피; 마커스 크레머; 봉준 김
Original assignee: 더 닐슨 컴퍼니 (유에스) 엘엘씨
Priority date: 2017-10-25
Filing date: 2018-10-23
Publication date: 2020-05-08
Also published as: EP3701522A4; EP3701522A1; US11651776B2; WO2019084065A1; US20190122673A1; CN111480198A; US10733998B2; US20230252999A1; KR102421425B1; US20210027792A1

Abstract

네트워크 스트리밍 서비스의 소스를 식별하기 위한 방법, 장치 및 물품이 개시된다. 예시적인 장치는 압축 해제된 제 2 오디오 신호를 나타내는 수신된 제 1 오디오 신호로부터, 제 2 오디오 신호를 형성하기 위해 제 3 오디오 신호를 압축하는데 사용되는 오디오 압축 구성을 식별하기 위한 코딩 포맷 식별자; 및 식별된 오디오 압축 구성에 기초하여 제 2 오디오 신호의 소스를 식별하는 소스 식별자를 포함한다.

Description

네트워크 스트리밍 서비스의 소스를 식별하기 위한 제조 방법, 기기 및 물품

본 개시는 일반적으로 네트워크 스트리밍 서비스에 관한 것으로, 보다 상세하게는 네트워크 스트리밍 서비스의 소스를 식별하기 위한 방법, 장치 및 물품에 관한 것이다.

시청자 미디어 측정 엔티티(AME)는 예를 들어 시청자 측정, 시청자 분류, 광고 노출의 측정, 미디어 노출의 측정 등을 수행하고, 이러한 측정 정보를 인구 통계 정보와 연결한다. AME는 등록된 패널 멤버를 기반으로 미디어의 시청자 참여 수준을 결정할 수 있다. 즉, AME는 모니터링되는 것에 동의하는 사람들을 패널에 등록한다. 그런 다음 AME는 해당 패널 멤버를 모니터링하여 해당 패널 멤버에 노출된 미디어(예를 들어, 텔레비전 프로그램 또는 라디오 프로그램, 영화, DVD, 광고(ads), 웹 사이트 등)를 결정한다.

본 발명의 내용에 포함됨.

도 1은 본 개시에 따라 예시적인 AME가 네트워크 스트리밍 서비스의 소스를 식별하는 예시적인 환경을 도시한 것이다.
도 2는 도 1의 예시적인 코딩 포맷 식별자의 예시적인 구현을 예시하는 블록도이다.
도 3은 도 2의 예시적인 코딩 포맷 식별자의 예시적인 동작을 나타내는 도면이다.
도 4는 예시적인 스코어 및 오프셋의 예시적인 극좌표 그래프이다.
도 5는 네트워크 스트리밍 서비스의 소스를 식별하기 위해 예시적인 AME를 구현하기 위해 실행될 수 있는 기계 판독가능 명령어로서 구현될 수 있는 예시적인 프로세스를 나타내는 흐름도이다.
도 6은 네트워크 스트리밍 서비스의 소스를 식별하기 위해 도 1 및/또는 도 2의 예시적인 코딩 포맷 식별자를 구현하기 위해 실행될 수 있는 기계 판독가능 명령어로서 구현될 수 있는 다른 예시적인 프로세스를 나타내는 흐름도이다.
도 7은 도 1 및/또는 도2의 예시적인 코딩 포맷 식별자를 구현하기 위해 도 6의 예시적인 기계 판독가능 명령어를 실행하도록 구성된 예시적인 프로세서 플랫폼을 도시한 것이다.
가능하다면, 동일한 참조번호는 도면(들) 및 첨부된 명세서 전체에 걸쳐 동일하거나 유사한 부분을 나타내기 위해 사용될 것이다. 제시된 다양한 도면들에 도시된 연결 라인들 또는 커넥터들은 다양한 요소들 사이의 예시적인 기능적 관계 및/또는 물리적 또는 논리적 커플링을 나타내도록 의도되어 있다.

AME는 전형적으로 미디어에 대한 노출을 측정할 때 미디어의 소스(예를 들어, 텔레비전 프로그램 또는 라디오 프로그램, 영화, DVD, 광고(ads), 웹 사이트 등)를 식별한다. 일부 예들에서, 미디어는 미디어 및 상기 미디어의 소스가 결정될 수 있게 하는 (예를 들어, 오디오 신호 부분에) 임베딩된 감지할 수 없는 시청자 측정 코드를 갖는다. 그러나, 네트워크 스트리밍 서비스(예를 들어, NETFLIX®, HULU®, YOUTUBE®, AMAZON PRIME®, APPLE TV®, 등)를 통해 전달된 미디어에는 미디어의 소스를 결정하기 위한 시청자 측정 코드가 포함되어 있지 않을 수 있어, 미디어 소스의 식별을 어렵게 한다.

일부 경우에, 상이한 스트리밍 미디어 소스(예를 들어, NETFLIX®, HULU®, YOUTUBE®, AMAZON PRIME®, APPLE TV® 등)가 호스팅하는 미디어를 저장 및 스트리밍하기 위해 상이한 오디오 압축 구성을 사용한다는 것이 유리하게 발견되었다. 일부 예에서, 오디오 압축 구성은 가능하게는 다른 것들 중에서 오디오 코딩 포맷(예를 들어, MP1, MP2, MP3, AAC, AC-3, Vorbis, WMA, DTS 등), 압축 파라미터, 프레이밍 파라미터 등을 정의하는 하나 이상의 파라미터의 세트이다. 상이한 소스는 상이한 오디오 압축을 사용하기 때문에, 미디어에 적용된 오디오 압축에 기초하여 소스를 구별(예를 들어, 식별, 검출, 결정 등을)할 수 있다. 재생 중에 미디어가 압축 해제된다. 일부 예들에서, 압축 해제된 오디오 신호는 압축 아티팩트에 대해 상이한 시험 오디오 압축 구성을 사용하여 압축된다. 특정 오디오 압축 구성이 원본 인코딩 중에 사용된 압축과 일치할 때 압축 아티팩트가 감지 가능(예를 들어, 인식 가능, 식별 가능, 구별 등)하기 때문에, 압축 아티팩트의 존재는 시험 오디오 압축 구성 중 하나를 원래 사용된 오디오 압축 구성으로서 식별하는 데 사용될 수 있다. 압축 구성이 식별된 후에, AME는 오디오의 원본 소스를 유추할 수 있다. 예시적인 압축 아티팩트는 스펙트로그램의 포인트, (예를 들어, 스펙트로그램의 다른 포인트에 비해 임계값 미만의) 작은 스펙트로그램 내의 복수의 포인트, 다른 값들(가령, 매우 많은 작은 값들) 등에 비해 어울리지 않는 발생 확률을 갖는 스펙트로그램의 하나 이상의 값 사이의 불연속성이다. 둘 이상의 소스가 동일한 오디오 압축 구성을 사용하고 압축 아티팩트와 연관된 경우, 오디오 압축 구성은 고려해야 할 소스의 수를 줄이는데 사용될 수 있다. 그런 다음 다른 방법을 사용하여 소스를 구별할 수 있다. 그러나, 설명을 간략히 하기 위해, 본 명세서에 개시된 예는 소스가 상이한 오디오 압축 구성과 관련되어 있는 것으로 가정한다.

개시된 예는 미디어(예를 들어, 매체의 오디오 부분에)에 적용된 오디오 압축을 식별함으로써 미디어의 소스(들)를 식별한다. 일부 예들에서, 오디오 압축 식별은 컨텐츠에 관계없이 오디오 신호가 겪은 압축의 식별을 포함한다. 압축 식별은, 예를 들어, 오디오 데이터가 인코딩된 비트 레이트의 식별, 시간-주파수 분해 단계에서 사용된 파라미터, 윈도잉 및 변환이 적용되기 전에 프레이밍이 발생한 오디오 신호의 샘플을 포함할 수 있다. 본 명세서에 개시된 바와 같이, 오디오 압축은 스피커와 같은 오디오 장치를 사용하여 압축 해제되고 출력된 미디어로부터 식별되고 기록될 수 있다. 손실 압축 및 손실 압축 해제를 겪은 녹음된 오디오는 서로 다른 시험 오디오 압축에 따라 다시 압축될 수 있다. 일부 예에서, 가장 큰 압축 아티팩트를 초래하는 시험 재압축은 원래 미디어를 압축하는 데 사용된 오디오 압축으로 식별된다. 식별된 오디오 압축은 미디어 소스를 식별하는 데 사용된다. 본 명세서에 개시된 예들은 오디오를 부분적으로 재압축(예를 들어, 압축의 시간-주파수 분석 단계만을 수행)하지만, 완전 재압축이 수행될 수 있다.

이제 본 개시의 비제한적인 예를 참조할 것이며, 그 예가 첨부도면에 도시되어있다. 이하, 도면을 참조로 예를 설명한다.

도 1은 본 개시에 따라 예시적인 AME(102)가 네트워크 스트리밍 서비스의 소스를 식별하는 예시적인 환경(100)을 도시한 것이다. 미디어(104)(예를 들어, 노래, 비디오(109) 및 오디오(110)를 포함하는 영화(105), 텔레비전 쇼, 게임 등)를 제공하기 위해, 예시적인 환경(100)은 하나 이상의 스트리밍 미디어 소스(예를 들어, NETFLIX®, HULU®, YOUTUBE®, AMAZON PRIME®, APPLE TV® 등)를 포함하고, 상기 예는 참조번호 106으로 표시되어 있다. 오디오 신호(111)로부터 압축된 오디오 신호(예를 들어, 비디오 프로그램(105)의 오디오(110))를 형성하기 위해, 예시적인 미디어 소스(106)는 예시적인 오디오 압축기(112)를 포함한다. 일부 예시에서, 오디오는 오디오 압축기(112)(또는 다른 곳에 구현된 다른 압축기)에 의해 압축되고 후속 리콜 및 스트리밍을 위해 미디어 데이터 저장소(108)에 저장된다. 오디오 신호는 임의의 개수 및/또는 유형(들)의 오디오 압축 구성(예를 들어, 오디오 코딩 포맷(가령, MP1, MP2, MP3, AAC, AC-3, Vorbis, WMA, DTS 등), 압축 파라미터, 프레이밍 파라미터 등)을 사용하여 예시적인 오디오 압축기(112)에 의해 압축될 수 있다. 미디어는 임의의 개수 및/또는 유형(들)의 데이터 구조(들)를 사용하여 예시적인 미디어 데이터 저장소(108)에 저장될 수 있다. 미디어 데이터 저장소(108)는 임의의 개수 및/또는 유형(들)의 비휘발성 및/또는 휘발성 컴퓨터 판독가능 저장 장치(들) 및/또는 저장 디스크(들)를 사용하여 구현될 수 있다.

미디어를 표현(예를 들어, 재생, 출력, 디스플레이 등)하기 위해, 도 1의 예시적인 환경(100)은 임의의 개수 및/또는 유형(들)의 예시적인 미디어 프리젠테이션 장치를 포함할 수 있고, 이들 중 하나가 참조번호 114로 표시된다. 미디어 프리젠테이션 장치(114)는 게임 콘솔, 개인용 컴퓨터, 랩톱 컴퓨터, 태블릿, 스마트 폰, 텔레비전, 셋톱 박스, 또는 보다 일반적으로는 미디어를 표현할 수 있는 임의의 장치를 포함하지만 이에 국한되지 않는다. 예시적인 미디어 소스(106)는 임의의 개수 및/또는 유형(들)의 예시적인 공개 및/또는 공개 네트워크(들)(116), 또는 보다 일반적으로, 임의의 수 및/또는 유형(들)의 통신 커플링을 이용하여 예시적인 미디어 프리젠테이션 장치(114)에 미디어(104)(가령, 압축 오디오(110)를 포함한 영화(105)를 제공한다.

오디오(예를 들어, 노래, 비디오의 오디오 부분 등)를 표현(예를 들어, 재생, 출력 등)하기 위해, 예시적인 미디어 프리젠테이션 장치(114)는 예시적인 오디오 압축 해제기(118) 및 예시적인 오디오 출력 장치(120)를 포함한다. 예시적인 오디오 압축 해제기(118)는 오디오(110)를 압축 해제하여 압축 해제된 오디오(122)를 형성한다. 일부 예에서, 오디오 압축기(112)는 오디오 압축을 위해 오디오 압축기(112)에 의해 사용되는 압축 구성을 압축된 오디오(110)에서 오디오 압축 해제기(118)로 명시한다. 압축 해제된 오디오(122)는 예시적인 오디오 출력 장치(120)에 의해 가청 신호(124)로서 출력된다. 예시적인 오디오 출력 장치(120)는 스피커, 오디오 증폭기, 헤드폰 등을 포함하지만, 이에 국한되지는 않는다. 도시하지 않았으나, 예시적인 미디어 프리젠테이션 장치(114)는 비디오 신호와 같은 신호를 표현할 수 있는 추가 출력 장치, 포트 등을 포함할 수 있다. 예를 들어, 텔레비전은 디스플레이 패널을 포함하고, 셋톱 박스는 비디오 출력 포트 등을 포함한다.

가청 오디오 신호(124)를 녹음하기 위해, 도 1의 예시적인 환경(100)은 예시적인 레코더(126)를 포함한다. 도 1의 예시적인 레코더(126)는 가청 오디오 신호(124)를 캡처, 저장 및 전달할 수 있는 임의의 유형의 장치이다. 일부 예에서, 레코더(126)는 본 출원의 출원인인 닐슨 컴퍼니(Nielsen Company)에 의해 소유되고 운영되는 피플미터에 의해 구현된다. 일부 예들에서, 미디어 프리젠테이션 장치(114)는 오디오(124)를 출력하고 연결된 또는 일체형 마이크로폰으로 오디오(124)를 녹음할 수 있는 장치(예를 들어, 개인용 컴퓨터, 랩톱 등)이다. 일부 예들에서, 압축 해제된 오디오(122)는 출력되지 않고 녹음된다. 예시적인 오디오 레코더(126)에 의해 녹음된 오디오 신호(128)는 분석을 위해 예시적인 AME(102)로 전달된다.

가청 오디오 신호(124)와 관련된 미디어 소스(106)를 식별하기 위해, 예시적인 AME(102)는 예시적인 코딩 포맷 식별자(130) 및 예시적인 소스 식별자(132)를 포함한다. 예시적인 코딩 포맷 식별자(130)는 오디오 압축기에 의해 적용된 오디오 압축을 식별하여 압축된 오디오 신호(110)를 형성한다. 코딩 포맷 식별자(130)는 오디오 출력 장치(120)에 의해 출력되고 오디오 레코더(126)에 의해 녹음된 압축 해제된 오디오 신호(124)로부터의 오디오 압축을 식별한다. 오디오 압축기(112)에서의 손실 압축, 및 오디오 압축 해제기(118)에서의 압축 해제를 겪은 녹음 오디오(128)는 상이한 시험 오디오 압축 유형 및/또는 설정에 따라 코딩 포맷 식별자(130)에 의해 재압축된다. 일부 예들에서, 가장 큰 압축 아티팩트를 초래하는 시험 재압축은 코딩 포맷 식별자(130)에 의해 미디어를 원래 압축하기 위해 오디오 압축기(112)에서 사용된 오디오 압축으로서 식별된다.

도 1의 예시적인 소스 식별자(130)는 미디어(104)의 소스(106)를 식별하기 위해 식별된 오디오 압축을 사용한다. 일부 예들에서, 소스 식별자(130)는 룩업 테이블을 이용하여 코딩 포맷 식별자(130)에 의해 식별된 오디오 압축과 연관된 미디어 소스(106)를 식별하기 위한 검색 공간을 식별하거나 좁힌다. 다른 데이터(예를 들어, 시간, 요일, 시청자, 위치 등) 중에서 미디어(104)와 미디어 소스(106)의 연관성은 후속하는 시청자 측정 통계의 개발을 위해 예시적인 노출 데이터베이스(134)에 기록된다.

도 2는 도 1의 예시적인 코딩 포맷 식별자(130)의 예시적인 구현을 예시하는 블록도이다. 도 3은 도 2의 예시적인 코딩 포맷 식별자(130)의 예시적인 동작을 나타내는 도면이다. 이해를 용이하게 하기 위해, 관심있는 독자는 도 2와 함께 도 3을 참조할 것이 제안된다. 가능하다면, 동일하거나 유사한 부분을 언급하기 위해 동일한 참조번호가 도 2 및 도 3, 및 첨부된 명세서에 사용된다.

녹음된 오디오(128)의 인입 샘플들을 저장(예를 들어, 버퍼, 홀드 등)하기 위해, 예시적인 코딩 포맷 식별자(130)는 예시적인 버퍼(202)를 포함한다. 도 2의 예시적인 버퍼(202)는 임의의 개수 및/또는 유형(들)의 비휘발성 및/또는 휘발성 컴퓨터 판독가능 저장 장치(들) 및/또는 저장 디스크(들)를 사용하여 구현될 수 있다.

시간-주파수 분석을 수행하기 위해, 예시적인 코딩 포맷 식별자(130)는 예시적인 시간-주파수 분석기(204)를 포함한다. 도 2의 예시적인 시간-주파수 분석기(204)는 녹음된 오디오(128)를 윈도우(예컨대, 슬라이딩 또는 이동 윈도우에 의해 정의된 버퍼(202)의 세그먼트)로 윈도우화하고, 각각의 윈도우에서 녹음된 오디오(128)의 스펙트럼 컨텐츠를 추정한다.

예시적인 버퍼(202)의 일부를 얻기 위해, 예시적인 코딩 포맷 식별자(130)는 예시적인 윈도우어(206)를 포함한다. 도 2의 예시적인 윈도우어(206)는 처리될 녹음된 오디오(128)의 L 샘플의 버퍼(202) 윈도우(S_1:L, S_2:L+1, …, S_N/2+1:L+N/2)(예를 들어, 세그먼트, 부분 등)로부터 획득하도록 구성 가능하다. 예시적인 윈도우어(206)는 버퍼(202)에서 지정된 시작 오프셋(1, 2, …, N/2+1)로 시작하는 지정된 수의 샘플을 획득한다. 윈도우어(206)는 스펙트럼 누출을 줄이기 위해 샘플의 획득된 윈도우(S_1:L, S_2:L+1, …, S_N/2+1:L+N/2)에 윈도윙 기능을 적용하도록 구성될 수 있다. 예를 들어, 직사각형 윈도우, 사인 윈도우, 슬로프 윈도우, 카이저-베셀 파생 윈도우(Kaiser-Bessel derived window) 등을 포함하는 임의의 개수 및/또는 유형(들)의 윈도우 기능이 구현될 수 있다.

윈도우어(206)에 의해 획득되고 윈도우화된 샘플들(이 중 3개는 참조번호 304, 305 및 306으로 지정됨)을 스펙트로그램으로 변환하기 위해, 도 2의 예시적인 코딩 포맷 식별자(130)는 예시적인 변환기(210)를 포함한다. 다상 직교 필터(PQF), 변형된 이산 코사인 변환(MDCT), 이들의 하이브리드 등을 포함하지만 이에 국한되지 않는 변환기(210)에 의해 임의의 개수 및/또는 유형(들)의 변환이 계산될 수 있다. 예시적인 변환기(210)는 각 윈도우(S_1:L, S_2:L+1, …, S_N/2+1:L+N/2)를 대응하는 스펙트로그램(304, 305,…, 306)으로 변환한다.

압축 아티팩트를 계산하기 위해, 도 2의 예시적인 코딩 포맷 식별자(130)는 예시적인 아티팩트 컴퓨터(212)를 포함한다. 도 2의 예시적인 아티팩트 컴퓨터(212)는 스펙트로그램(304 내지 306)에서 작은 값(예를 들어, 0으로 양자화된 값)을 검출한다. 스펙트로그램(304 내지 306)에서의 작은 값은 압축 아티팩트를 나타내고, 일부 예에서, 시험 오디오 압축이 오디오 압축기(112)(도 1)에 의해 적용된 오디오 압축과 일치하는 때를 결정하기 위해 사용된다.

스펙트로그램(304-306)의 값의 평균을 계산하기 위해, 도 2의 아티팩트 컴퓨터(212)는 예시적인 평균기(214)를 포함한다. 도 2의 예시적인 평균기(214)는 샘플 블록(202)의 복수의 윈도우(S_1:L, S_2:L+1, …, S_N/2+1:L+N/2)에 대한 대응하는 스펙트로그램(304-306)의 값의 평균(A₁, A₂, …, A_N/2+1)을 계산한다. 평균기(214)는 산술 평균, 기하 평균 등과 같은 다양한 수단을 계산할 수 있다. 오디오 컨텐츠가 2개의 인접한 스펙트로그램(304, 305, …, 306) 사이에서 대략 동일하게 유지된다고 가정하면, 평균(A₁, A₂, …, A_N/2+1)도 또한 비슷할 것이다. 그러나, 오디오 압축 구성 및 프레이밍이 오디오 압축기(112)에서 사용된 것과 일치할 경우, 작은 값들이 특정 스펙트로그램(304-306)에 나타나고 평균(A₁, A₂, …, A_N/2+1) 간의 차(D₁, D₂, …, D_N/2)가 나타날 것이다. 스펙트로그램(304-306)에서 이들 작은 값의 존재 및/또는 평균(A₁, A₂, …, A_N/2+1) 간의 차(D₁, D₂, …, D_N/2)는 일부 예에서 시험 오디오 압축 구성으로 압축 아티팩트가 발생할 때를 식별하기 위해 사용될 수 있다.

작은 값을 검출하기 위해, 예시적인 아티팩트 컴퓨터(212)는 예시적인 미분기(216)를 포함한다. 도 2의 예시적인 미분기(216)는 상이한 윈도우 위치(1, 2, …, N/2+1)를 사용하여 계산된 스펙트로그램(304-306)의 평균(A₁, A₂, …, A_N/2+1) 간의 차(D₁, D₂, …, D_N/2)를 계산한다(도 3 참조). 스펙트로그램(304-306)이 잠재적 압축 아티팩트를 나타내는 작은 값을 가질 때, 이는 다른 윈도우 위치에 대한 스펙트로그램(304-306)보다 더 작은 스펙트로그램 평균(A₁, A₂, …, A_N/2+1)을 가질 것이다. 따라서, 다른 윈도우 위치에 대한 스펙트로그램(304-306)과의 차(D₁, D₂, …, D_N/2)는 다른 쌍의 스펙트로그램(304-306) 간의 차(D₁, D₂, …, D_N/2)보다 클 것이다. 일부 예들에서, 미분기(216)는 절대(예를 들어, 양의 값) 차를 계산한다.

스펙트로그램(304-306)의 평균(A₁, A₂, …, A_N/2+1) 간의 가장 큰 차(D₁, D₂, …, D_N/2)를 식별하기 위해, 도 2의 예시적인 아티팩트 컴퓨터(212)는 예시적인 예시적인 피크 식별자(218)를 포함한다. 도 2의 예시적인 예시적인 피크 식별자(218)는 복수의 윈도우 위치(1, 2, …, N/2+1)에 대한 가장 큰 차(D₁, D₂, …, D_N/2)를 식별한다. 상기 가장 큰 차(D₁, D₂, …, D_N/2)는 오디오 압축기(112)에 의해 사용된 윈도우 위치(1, 2, …, N/2+1)에 대응한다. 도 3의 예에 도시된 바와 같이, 피크 식별자(218)는 가장 큰 값을 갖는 차(D₁, D₂, …, D_N/2)를 식별한다. 아래에서 설명되는 바와 같이, 일부 예들에서, 가장 큰 값은 신뢰 스코어(308)로 간주되고(예를 들어, 그 값이 클수록 압축 아티팩트가 발견되었다는 신뢰가 커짐), 평균(A₁, A₂, …, A_N/2+1)과 관련된 윈도우(S_1:L, S_2:L+1, …, S_N/2+1:L+N/2)의 위치를 나타내는 오프셋(310)(예를 들어, 1, 2,…, N/2+1)과 관련된다. 예시적인 피크 식별자(218)는 신뢰 스코어(308) 및 오프셋(310)을 코딩 포맷 스코어 데이터 저장소(220)에 저장한다. 신뢰 스코어(308) 및 오프셋(310)은 임의의 수 및/또는 유형(들)의 데이터 구조(들)을 사용하여 예시적인 코딩 포맷 스코어 데이터 저장소(220)에 저장될 수 있다. 코딩 포맷 스코어 데이터 저장소(220)는 임의의 개수 및/또는 유형(들)의 비휘발성 및/또는 휘발성 컴퓨터 판독가능 저장장치(들) 및/또는 저장 디스크(들)를 사용하여 구현될 수 있다.

차(D₁, D₂, …, D_N/2)에서의 피크는 신호에서 T개의 샘플마다 공칭으로 발생한다. 일부 예에서, T는 전형적으로 윈도우 길이(L)의 절반인 코딩 포맷의 시간-주파수 분석 스테이지의 홉 크기이다. 일부 예에서, 더 긴 오디오의 레코딩의 샘플들의 다수 블록으로부터의 신뢰 스코어(308) 및 오프셋(310)이 코딩 포맷 식별의 정확도를 높이기 위해 결합된다. 일부 예에서, 선택된 임계값 미만의 스코어를 갖는 블록은 무시된다. 일부 예에서, 임계값은 차, 예를 들어, 최대를 평균으로 나눈 값으로부터 계산된 통계일 수 있다. 일부 예에서, 차는 또한 예를 들어 표준 스코어를 사용함으로써 먼저 정규화될 수 있다. 신뢰도 스코어(308)와 오프셋(310)을 결합하기 위해, 예시적인 코딩 포맷 식별자(130)는 예시적인 포스트 프로세서(222)를 포함한다. 도 2의 예시적인 포스트 프로세서(222)는 신뢰 스코어(308) 및 오프셋(310) 쌍을 극좌표로 변환한다. 일부 예들에서, 신뢰 스코어(308)는 반경(예를 들어, 데시벨로 표현됨)로 변환되고, 오프셋(310)은 각도(예를 들어, 라디안 모듈로 주기성으로 표현됨)에 맵핑된다. 일부 예들에서, 예시적인 포스트 프로세서(222)는 이들 극좌표 포인트의 원형 평균(즉, 원점에 대해 원형 영역에 대해 계산된 평균)을 계산하고, 반경이 전체 신뢰 스코어(224)에 해당하는 평균 극좌표를 획득한다. 일부 예에서, 원형 평균에 스코어가 선택된 임계값을 초과한 블록의 수를 곱함으로써 원형 합이 계산될 수 있다. 점들의 쌍들이 원에서 서로 더 가까울수록, 이들이 중심으로부터 멀어질수록, 전체 신뢰 스코어(224)는 더 커진다. 일부 예에서, 포스트 프로세서(222)는 원형 평균과 스코어가 선택한 임계 값보다 높은 블록의 수를 곱함으로써 원형 합을 계산한다. 예시적인 포스트 프로세서(222)는 임의의 수 및/또는 유형(들)의 데이터 구조(들)를 사용하여 코딩 포맷 스코어 데이터 저장소(220)에 전체 신뢰 스코어(224)를 저장한다. 5가지 상이한 오디오 압축 구성: MP3, AAC, AC-3, Vorbis 및 WMA에 대해 예시적인 스코어 및 오프셋 쌍의 예시적인 극좌표(400)가 도 4에 도시되어 있다. 도 4에 도시된 바와 같이, AC-3 코딩 포맷은 다른 코딩과 유사한 각도(예를 들어, 유사한 윈도우 오프셋) 및 더 큰 스코어(예를 들어, 더 큰 반경)를 갖는 복수의 포인트(예를 들어, 예시 영역(402)의 예시 포인트를 참조)를 갖는다. 각 구성에 대해 원형 평균이 계산되면 MP3, AAC, Vorbis 및 WMA에 대한 평균이 원점에 가까운 반면, AC-3에 대한 평균은 오디오(128)가 원래 AC-3 코딩 포맷으로 원래 압축된 것을 나타내며 원점과 구별될 수 있다.

오디오 압축 구성 세트를 저장하기 위해, 도 2의 예시적인 코딩 포맷 식별자(130)는 예시적인 압축 구성 데이터 저장소(226)를 포함한다. 코딩 포맷 식별을 제어하기 위해, 도 2의 예시적인 코딩 포맷 식별자(130)는 예시적인 컨트롤러(228)를 포함한다. 오디오(128)에 적용된 오디오 압축을 식별하기 위해, 예시적인 컨트롤러(228)는 상이한 압축 구성으로 시간-주파수 분석기(204)를 구성한다. 시험 압축 구성(예를 들어, AC-3) 및 복수의 윈도우 오프셋 각각의 조합에 대해, 시간-주파수 분석기(204)는 스펙트로그램(304-306)을 계산한다. 예시적인 아티팩트 컴퓨터(212) 및 예시적인 포스트 프로세서(222)는 각각의 시험 압축 구성에 대한 전체 신뢰 스코어(224)를 결정한다. 예시적인 컨트롤러(228)는 오디오(128)에 적용된 압축 구성으로서 가장 큰 전체 신뢰 스코어(224)를 갖는 시험 압축 구성 중 하나를 식별(예를 들어, 선택)한다.

압축 구성은 임의의 개수 및/또는 유형(들)의 데이터 구조(들)를 사용하여 예시적인 압축 구성 데이터 저장소(226)에 저장될 수 있다. 압축 구성 데이터 저장소(226)는 임의의 개수 및/또는 유형(들)의 비휘발성 및/또는 휘발성 컴퓨터 판독가능 저장 장치(들) 및/또는 저장 디스크(들)를 사용하여 구현될 수 있다. 도 2의 예시적인 컨트롤러(228)는 예를 들어, 각각의 회로, 논리 회로, 프로그램 가능 프로세서, 프로그램 가능 컨트롤러, GPU(Graphics Processing Unit), DSP(Digital Signal Processor), ASIC(Application Specific Integrated Circuit), PLD(Programmable Logic Device), FPGA(Field Programmable Gate Array) 및/또는 FPLD(Field Programmable Logic Device) 중 하나 이상을 사용하여 구현될 수 있다.

코딩 포맷 식별자(130)의 예시적인 구현이 도 2에 도시되어 있으나, 머신 러닝 등과 같은 다른 구현도 추가로 및/또는 대안으로 사용될 수 있다. 도 1의 코딩 포맷 식별자(130)를 구현하는 예시적인 방식이 도 2에 도시되어 있으나, 도 2에 도시된 요소, 프로세스 및/또는 장치 중 하나 이상이 임의의 방식으로 조합, 분할, 재배열, 생략, 제거 및/또는 구현될 수 있다. 또한, 예시적인 시간-주파수 분석기(204), 예시적인 윈도우어(206), 예시적인 변환기(210), 예시적인 아티팩트 컴퓨터(212), 예시적인 평균기(214), 예시적인 미분기(216), 예시적인 피크 식별자(218), 예시적인 포스트 프로세서(222), 예시 컨트롤러(228) 및/또는 보다 일반적으로, 도 2의 예시적인 코딩 포맷 식별자(130)가 하드웨어, 소프트웨어, 펌웨어 및/또는 하드웨어, 소프트웨어 및/또는 펌웨어의 임의의 조합으로 구현될 수 있다. 따라서, 예를 들어, 예시적인 시간-주파수 분석기(204), 예시적인 윈도우어(206), 예시적인 변환기(210), 예시적인 아티팩트 컴퓨터(212), 예시적인 평균기(214), 예시적인 미분기(216), 예시적인 피크 식별자(218), 예시적인 포스트 프로세서(222), 예시적인 컨트롤러(228) 및/또는 보다 일반적으로, 예시적인 코딩 포맷 식별자(130)는 하나 이상의 아날로그 또는 디지털 회로(들), 논리 회로, 프로그램 가능 프로세서(들), 프로그램 가능 컨트롤러(들), GPU(s), DSP(s), ASIC(s), PLD(s), FPGA(s) 및/또는 FPLD(s)에 의해 구현될 수 있다.

순전히 소프트웨어 및/또는 펌웨어 구현을 포함하도록 본 특허의 장치 또는 시스템 청구항 중 어느 하나를 읽을 때, 예를 들어, 시간-주파수 분석기(204), 예시적 윈도어(206), 예시적인 변환기(210), 예시적인 아티팩트 컴퓨터(212), 예시적인 평균기(214), 예시적인 미분기(216), 예시적인 피크 식별자(218), 예시적인 포스트 프로세서(222), 예시적인 컨트롤러(228) 및/또는 예시적인 코딩 포맷 식별자(130) 중 적어도 하나가 이에 의해 소프트웨어 및/또는 펌웨어를 포함하는 메모리, DVD(digital versatile disk), CD(compact disk), Blu-ray 디스크 등과 같은 비일시적 컴퓨터 판독가능 저장 장치 또는 저장 디스크를 포함하도록 명시적으로 정의된다. 또한 여전히, 도 1의 예시적인 코딩 포맷 식별자(130)는 도 2에 도시된 것에 더하여 또는 대신에 하나 이상의 요소, 프로세스 및/또는 장치를 포함할 수 있고/있거나 도시된 요소, 프로세스 및 장치 중 하나 이상을 포함할 수 있다.

도 1의 예시적인 AME(102)를 구현하기 위한 예시적인 기계 판독가능 명령어를 나타내는 흐름도가 도 5에 도시되어 있다. 이 예에서, 기계 판독가능 명령어는도 7과 관련하여 아래에서 논의되는 예시적인 프로세서 플랫폼(700)에 도시된 프로세서(710)와 같은 프로세서에 의해 실행하기 위한 프로그램을 포함한다. 프로그램은 CD, 플로피 디스크, 하드 드라이브, DVD, 블루 레이 디스크, 또는 프로세서(710)와 관련된 메모리와 같은 비일시적 컴퓨터 판독가능 저장매체에 저장된 소프트웨어로 구현될 수 있으나, 전체 프로그램 및/또는 그 일부는 대안으로 프로세서(710) 이외의 장치에 의해 실행될 수 있고/있거나 펌웨어 또는 전용 하드웨어로 구현될 수 있다. 또한, 예시적인 프로그램이 도 5에 도시된 흐름도를 참조하여 설명되나, 예시적인 AME(102)를 구현하는 많은 다른 방법들이 대안으로 사용될 수 있다. 예를 들어, 블록의 실행 순서가 변경될 수 있고/있거나 설명된 블록 중 일부가 변경, 제거 또는 조합될 수 있다. 추가적으로 및/또는 대안으로, 임의의 또는 모든 블록은 소프트웨어 또는 펌웨어를 실행하지 않고 해당 동작을 수행하도록 구성된 하나 이상의 하드웨어 회로(예를 들어, 이산 및/또는 적분 아날로그 및/또는 디지털 회로, FPGA(s), ASIC(s), 비교기(s), 연산 증폭기(op-amp)(s), 논리 회로 등)에 의해 구현될 수 있다.

도 5의 예시적인 프로그램은 블록(502)에서 시작하며, 여기서 AME(102)는 압축 해제된 제 2 오디오 신호(예를 들어, 예시적인 오디오 신호(110))를 나타내는 제 1 오디오 신호(예를 들어, 예시적인 오디오 신호(128))를 수신한다(블록 502). 예시적인 코딩 포맷 식별자(130)는 제 2 오디오 신호를 형성하기 위해 제 3 오디오 신호(예를 들어, 예시적인 오디오 신호(111))를 압축하는데 사용되는 오디오 압축 구성을 제 1 오디오 신호로부터 식별한다(블록 504). 예시적인 소스 식별자(132)는 식별된 오디오 압축 구성에 기초하여 제 2 오디오 신호의 소스를 식별한다(블록 506). 제어는 도 5의 예시적인 프로그램으로부터 빠져 나온다.

도 1 및/또는 도 2의 예시적인 코딩 포맷 식별자(130)를 구현하기 위한 예시적인 기계 판독가능 명령어를 나타내는 흐름도가 도 6에 도시되어 있다. 이 예에서, 기계 판독가능 명령어는 도 7과 관련하여 아래에서 논의되는 예시적인 프로세서 플랫폼(700)에 도시된 프로세서(710)와 같은 프로세서에 의해 실행하기 위한 프로그램을 포함한다. 프로그램은 CD, 플로피 디스크, 하드 드라이브, DVD, 블루 레이 디스크, 또는 프로세서(710)와 관련된 메모리와 같은 비일시적 컴퓨터 판독가능 저장매체에 저장된 소프트웨어로 구현될 수 있으나, 전체 프로그램 및/또는 그 일부는 대안으로 프로세서(710) 이외의 장치에 의해 실행될 수 있고/있거나 펌웨어 또는 전용 하드웨어로 구현될 수 있다. 또한, 예시적인 프로그램이 도 6에 도시된 흐름도를 참조하여 설명되나, 예시적인 코딩 포맷 식별자(130)를 구현하는 많은 다른 방법들이 대안으로 사용될 수 있다. 예를 들어, 블록의 실행 순서가 변경될 수 있고/있거나 설명된 블록 중 일부가 변경, 제거 또는 조합될 수 있다. 추가로 및/또는 대안으로, 임의의 또는 모든 블록은 소프트웨어 또는 펌웨어를 실행하지 않고 해당 동작을 수행하도록 구성된 하나 이상의 하드웨어 회로(예를 들어, 이산 및/또는 적분 아날로그 및/또는 디지털 회로, FPGA(s), ASIC(s), 비교기(들), 연산 증폭기(op-amp)(들), 논리 회로 등)에 의해 구현될 수 있다.

도 6의 예시적인 프로그램은 블록(602)에서 시작하는데, 여기서 각각의 시험 압축 구성 세트, 샘플의 각 블록(202)(블록 603) 및 각각의 윈도우 오프셋 M(블록 604)에 대해, 예시적인 윈도우(206)는 윈도우(S_M:L+M)를 생성하고(블록 606). 예시적인 변환기(210)는 윈도우(S_M:L+M)의 스펙트로그램(304-306)을 계산한다(블록 608). 평균(214)은 스펙트로그램(304-306)의 평균(A_M)을 계산한다(블록 610). 스펙트로그램(304-306)의 평균(A_M)이 각각의 윈도우 오프셋(M)에 대해 계산되면(블록 612), 예시적인 차(216)는 평균(A_M)의 쌍들 간의 차 (D₁, D₂, …, D_N/2)를 계산한다(블록 614). 예시적인 피크 식별자(218)는 가장 큰 차를 식별하고(블록 616), 코딩 포맷 스코어 데이터 저장소(220)에 가장 큰 차를 스코어(308)로서 그리고 연관된 오프셋(M)을 오프셋(310)으로서 저장한다(블록 618).

모든 블록이 처리되면(블록 620), 예시적인 포스트 프로세서(222)는 현재 고려된 시험 코딩 포맷 파라미터 세트에 대한 스코어(308) 및 오프셋(310) 쌍을 극좌표로 변환하고, 현재 고려되는 압축 구성에 대한 전체 신뢰 스코어로서 쌍의 원형 평균을 극좌표로 계산한다(블록 622).

모든 시험 압축 구성이 처리된 경우(블록 624), 컨트롤러(228)는 가장 큰 전체 신뢰 스코어로 설정된 시험 압축 구성을 오디오 압축기(112)에 의해 적용된 오디오 압축으로서 식별한다(블록 626). 그 후 제어는 도 6의 예시적인 프로그램으로부터 빠져 나온다.

위에서 언급한 바와 같이, 도 5 내지 도 6의 예시적인 프로세스는 비일시적 컴퓨터 및/또는 하드 디스크 드라이브, 플래시 메모리, ROM, 콤팩트 디스크(CD), DVD, 캐시, 랜덤 액세스 메모리 및/또는 정보가 임의의 기간 동안(예를 들어, 연장된 기간 동안, 영구적으로, 짧은 인스턴스 동안, 정보의 임시 버퍼링 동안 및/또는 캐싱 동안) 저장되는 임의의 다른 저장 장치 또는 저장 디스크와 같은 기계 판독가능 매체에 저장된 코딩된 명령어(예를 들어, 컴퓨터 및/또는 기계 판독가능 명령어)를 사용하여 구현될 수 있다. 본 명세서에 사용된 바와 같이, 비일시적 컴퓨터 판독가능 매체라는 용어는 임의의 유형의 컴퓨터 판독가능 저장 장치 및/또는 저장 디스크를 포함하고 전송 미디어를 배제하도록 명확하게 정의된다.

도 7은 도 1 및/또는 도 2의 코딩 포맷 식별자(130)를 구현하기 위해 도 6의 명령어를 실행할 수 있는 예시적인 프로세서 플랫폼(700)의 블록도이다. 프로세서 플랫폼(700)은, 가령, 서버, 개인용 컴퓨터, 워크 스테이션 또는 임의의 다른 유형의 컴퓨팅 장치일 수 있다.

도시된 예의 프로세서 플랫폼(700)은 프로세서(710)를 포함한다. 도시된 예의 프로세서(710)는 하드웨어이다. 예를 들어, 프로세서(710)는 임의의 원하는 제품군 또는 제조업체로부터의 하나 이상의 집적 회로, 논리 회로, 마이크로 프로세서, GPU, DSP 또는 컨트롤러에 의해 구현될 수 있다. 하드웨어 프로세서는 반도체 기반(예를 들어, 실리콘 기반) 장치일 수 있다. 이 예에서, 프로세서는 예시적인 시간-주파수 분석기(204), 예시적인 윈도우어(206), 예시적인 변환기(210), 예시적인 아티팩트 컴퓨터(212), 예시적인 평균기(214), 예시적인 미분기(216), 예시적인 피크 식별자(218), 예시적인 포스트 프로세서(222) 및 예시적인 컨트롤러(228)를 구현한다.

도시된 예의 프로세서(710)는 로컬 메모리(712)(예를 들어, 캐시)를 포함한다. 도시된 예의 프로세서(710)는 버스(718)를 통해 휘발성 메모리(714) 및 비휘발성 메모리(716)를 포함하는 메인 메모리와 통신한다. 휘발성 메모리(714)는 SDRAM(Synchronous Dynamic Random-Access Memory), DRAM(Dynamic Random-access Memory), RAMBUS® Dynamic Random-access Memory(RDRAM®) 및/또는 임의의 유형의 랜덤 액세스 메모리 장치에 의해 구현될 수 있다. 비휘발성 메모리(716)는 플래시 메모리 및/또는 임의의 다른 원하는 유형의 메모리 장치에 의해 구현될 수 있다. 메인 메모리(714, 716)로의 액세스는 메모리 컨트롤러(미도시)에 의해 제어된다. 이 예에서, 로컬 메모리(712) 및/또는 메모리(714)는 버퍼(202)를 구현한다.

도시된 예의 프로세서 플랫폼(700)은 또한 인터페이스 회로(720)를 포함한다. 인터페이스 회로(720)는 이더넷 인터페이스, USB(Universal Serial Bus) 인터페이스, Bluetooth® 인터페이스, 근거리 통신(NFC) 인터페이스 및/또는 PCI(Peripheral Component Interface) 익스프레스 인터페이스와 같은 임의의 유형의 인터페이스 표준에 의해 구현될 수 있다.

도시된 예에서, 하나 이상의 입력 장치(722)가 인터페이스 회로(720)에 연결된다. 입력 장치(722)는 사용자가 데이터 및/또는 명령어를 프로세서(710)에 입력하는 것을 허용한다. 입력 장치(들)은 예를 들어 오디오 센서, 마이크로폰, 카메라(정지 또는 동영상), 키보드, 버튼, 마우스, 터치 스크린, 트랙 패드, 트랙볼, 아이소포인트 및/또는 음성 인식 시스템에 의해 구현될 수 있다. .

하나 이상의 출력 장치(724)는 또한 도시된 예의 인터페이스 회로(720)에 연결된다. 출력 장치들(724)은 예를 들어 디스플레이 장치들(예를 들어, 발광 다이오드(LED), 유기 발광 다이오드(OLED), 액정 디스플레이(LCD), 음극선관 디스플레이(CRT), IPS(in-plane switching) 디스플레이, 터치 스크린 등), 촉각 출력 장치, 프린터 및/또는 스피커에 의해 구현될 수 있다. 도시된 예의 인터페이스 회로(720)는 일반적으로 그래픽 드라이버 카드, 그래픽 드라이버 칩 및/또는 그래픽 드라이버 프로세서를 포함한다.

도시된 예의 인터페이스 회로(720)는 또한 네트워크(726)(예를 들어, 이더넷 연결, 디지털 가입자 회선(DSL), 전화선, 동축 케이블, 휴대전화 시스템, Wi-Fi 시스템 등)를 통한 외부 기기(가령, 임의의 종류의 컴퓨팅 장치)와의 데이터 교환을 용이하게 하는 송신기, 수신기, 트랜시버, 모뎀, 주거용 게이트웨이 및/또는 네트워크 인터페이스와 같은 통신 장치를 포함한다. Wi-Fi 시스템의 일부 예에서, 인터페이스 회로(720)는 무선 주파수(RF) 모듈, 안테나(들), 증폭기, 필터, 변조기 등을 포함한다.

도시된 예의 프로세서 플랫폼(700)은 또한 소프트웨어 및/또는 데이터를 저장하기 위한 하나 이상의 대용량 저장 장치(728)를 포함한다. 이러한 대용량 저장 장치(728)의 예는 플로피 디스크 드라이브, 하드 드라이브 디스크, CD 드라이브, 블루레이 디스크 드라이브, RAID(Redundant Array of Independent Disk) 시스템 및 DVD 드라이브를 포함한다.

도 6의 코딩된 명령을 포함하는 코딩된 명령어(732)가 대용량 저장 장치(728), 휘발성 메모리(714), 비휘발성 메모리(716) 및/또는 CD 또는 DVD와 같은 제거 가능한 유형의 컴퓨터 판독가능 저장매체에 저장될 수 있다.

상술한 내용으로부터, 네트워크 스트리밍 서비스의 소스를 식별하는 예시적인 방법, 장치 및 물품이 개시되었다는 것이 이해될 것이다. 상기로부터, 네트워크 스트리밍 서비스의 소스를 식별하는 정확성 및 가능성을 향상시키기 위해 컴퓨터의 동작을 향상시키는 방법, 장치 및 물품이 개시되어 있음을 이해할 것이다. 일부 예에서, 네트워크 스트리밍 서비스의 소스 식별을 수행하기 위해 상기 기술에 기초하여 컴퓨터 동작이 보다 효율적이고 정확하고 강건해질 수 있다. 즉, 이러한 프로세스의 사용을 통해, 네트워크 스트리밍 서비스의 소스 식별을 비교적 빠르게 수행함으로써 컴퓨터가보다 효율적으로 작동할 수 있다. 또한, 본 명세서에 개시된 예시적인 방법, 장치 및/또는 물품은 네트워크 스트리밍 서비스의 소스 식별을 수행할 수 없는 종래 기술의 부정확성 및 무능력을 식별하고 극복한다.

네트워크 스트리밍 서비스의 소스를 식별하기 위한 예시적인 방법, 장치 및 물품이 본 명세서에 개시된다. 추가의 예 및 이들의 조합은 적어도 다음을 포함한다.

실시예 1은:

압축 해제된 제 2 오디오 신호를 나타내는 수신된 제 1 오디오 신호로부터, 제 2 오디오 신호를 형성하기 위해 제 3 오디오 신호를 압축하는데 사용되는 오디오 압축 구성을 식별하기 위한 코딩 포맷 식별자; 및 식별된 오디오 압축 구성에 기초하여 제 2 오디오 신호의 소스를 식별하는 소스 식별자를 포함하는 장치이다.

실시예 2는 실시예 1의 장치로서,

제 1 시험 압축 구성에 따라 제 1 오디오 신호의 제 1 블록의 제 1 시간-주파수 분석을 수행하고, 제 2 시험 압축 구성에 따라 제 1 오디오 신호의 제 1 블록의 제 2 시간-주파수 분석을 수행하기 위한 시간-주파수 분석기;

제 1 시간-주파수 분석으로 인한 제 1 압축 아티팩트를 결정하고, 제 2 시간-주파수 분석으로 인한 제 2 압축 아티팩트를 결정하는 아티팩트 컴퓨터; 및

제 1 시험 압축 구성과 제 2 시험 압축 구성 중에서 제 1 압축 아티팩트 및 제 2 압축 아티팩트에 기초하여 오디오 압축 구성으로서 선택하는 컨트롤러를 더 포함한다.

실시예 3은 실시예 2의 장치로서,

컨트롤러는 제 1 압축 아티팩트 및 상기 제 1 압축 아티팩트에 기초한 제 2 시험 압축 구성 중에서 선택하고, 제 2 압축 아티팩트는 제 1 압축 아티팩트와 제 2 압축 아티팩트를 비교하는 것을 포함한다.

실시예 4는 실시예 2의 장치로서,

시간-주파수 분석기는 제 1 시험 압축 구성에 따라 제 1 오디오 신호의 제 2 블록의 제 3 시간-주파수 분석을 수행하고, 제 2 시험 압축 구성에 따라 제 1 오디오 신호의 제 2 블록의 제 4 시간-주파수 분석을 수행하며,

아티팩트 컴퓨터는 제 3 시간-주파수 분석으로 인한 제 3 압축 아티팩트를 결정하고, 제 4 시간-주파수 분석으로 인한 제 4 압축 아티팩트를 결정하며;

컨트롤러는 제 1 시험 압축 구성과 제 2 시험 압축 구성 중에서 제 1 압축 아티팩트, 제 2 압축 아티팩트, 제 3 압축 아티팩트 및 제 4 압축 아티팩트에 기초하여 오디오 압축 구성으로서 선택한다.

실시예 5는 실시예 4의 장치로서,

제 1 압축 아티팩트 및 제 3 압축 아티팩트를 결합하여 제 1 스코어를 형성하고, 제 2 압축 아티팩트 및 제 4 압축 아티팩트를 결합하여 제 2 스코어를 형성하기 위한 포스트 프로세서를 더 포함하고, 컨트롤러는 제 1 스코어와 제 2 스코어를 비교함으로써 제 1 시험 압축 구성과 제 2 시험 압축 구성 중에서 오디오 압축 구성으로서 선택한다.

실시예 6은 실시예 5의 장치로서,

포스트 프로세서는:

제 1 압축 아티팩트 및 상기 제 1 압축 아티팩트와 연관된 제 1 오프셋을 제 1 극좌표에 맵핑하고,

제 3 압축 아티팩트 및 제 2 압축 아티팩트와 연관된 제 2 오프셋을 제 2 극좌표에 맵핑하며,

제 1 스코어를 제 1 극좌표 및 제 2 극좌표의 원형 평균으로서 계산함으로써 상기 제 1 압축 아티팩트와 상기 제 3 압축 아티팩트를 결합하여 상기 제 1 스코어를 형성한다.

실시예 7은 제 1 오디오 신호가 미디어 프리젠테이션 장치에서 기록되는 실시예 1의 장치이다.

실시예 8은:

압축 해제된 제 2 오디오 신호를 나타내는 제 1 오디오 신호를 수신하는 단계;

상기 제 1 오디오 신호로부터, 제 2 오디오 신호를 형성하기 위해 제 3 오디오 신호를 압축하는데 사용되는 오디오 압축 구성을 식별하는 단계; 및

식별된 오디오 압축 구성에 기초하여 제 2 오디오 신호의 소스를 식별하는 단계를 포함하는 방법이다.

실시예 9는 실시예 8의 방법으로서,

식별된 오디오 압축 구성에 기초하여 제 2 오디오 신호의 소스를 식별하는 단계는:

식별된 오디오 압축 구성에 기초하여 코딩 포맷을 식별하는 단계; 및

상기 코딩 포맷에 기초하여 소스를 식별하는 단계를 포함한다.

실시예 10은 실시예 8의 방법으로서,

제 1 오디오 신호로부터 오디오 압축 구성을 식별하는 단계는:

제 1 시험 압축 구성에 따라 상기 제 1 오디오 신호의 제 1 블록의 제 1 시간-주파수 분석을 수행하는 단계;

제 1 시간-주파수 분석으로 인한 제 1 압축 아티팩트를 결정하는 단계;

제 2 시험 압축 구성에 따라 상기 제 1 오디오 신호의 제 1 블록의 제 2 시간-주파수 분석을 수행하는 단계;

제 2 시간-주파수 분석으로 인한 제 2 압축 아티팩트를 결정하는 단계; 및

제 1 시험 압축 구성과 제 2 시험 압축 구성 중에서 제 1 압축 아티팩트 및 제 2 압축 아티팩트에 기초하여 오디오 압축 구성으로서 선택하는 단계를 포함한다.

실시예 11은 실시예 10의 방법으로서,

제 1 압축 아티팩트 및 제 2 압축 아티팩트에 기초하여 제 1 시험 압축 구성및 제 2 시험 압축 구성 중에서 선택하는 단계는 상기 제 1 압축 아티팩트와 상기 제 2 압축 아티팩트를 비교하는 단계를 포함한다.

실시예 12는 실시예 10의 방법으로서,

제 1 시험 압축 구성에 따라 제 1 오디오 신호의 제 2 블록의 제 3 시간-주파수 분석을 수행하는 단계;

제 3 시간-주파수 분석으로 인한 제 3 압축 아티팩트를 결정하는 단계;

제 2 시험 압축 구성에 따라 제 1 오디오 신호의 제 2 블록의 제 4 시간-주파수 분석을 수행하는 단계;

제 4 시간-주파수 분석으로 인한 제 4 압축 아티팩트를 결정하는 단계; 및

제 1 시험 압축 구성과 제 2 시험 압축 구성 중에서 제 1 압축 아티팩트, 제 2 압축 아티팩트, 제 3 압축 아티팩트 및 제 4 압축 아티팩트에 기초하여 오디오 압축 구성으로서 선택하는 단계를 더 포함한다.

실시예 13은 실시예 12의 방법으로서,

제 1 시험 압축 구성과 제 2 시험 압축 구성 중에서 제 1 압축 아티팩트, 제 2 압축 아티팩트, 제 3 압축 아티팩트 및 제 4 압축 아티팩트에 기초하여 오디오 압축 구성으로서 선택하는 단계는:

제 1 압축 아티팩트와 제 3 압축 아티팩트를 결합하여 제 1 스코어를 형성하는 단계;

제 2 압축 아티팩트와 제 4 압축 아티팩트를 결합하여 제 2 스코어를 형성하는 단계; 및

상기 제 1 스코어와 제 2 스코어를 비교하는 단계를 포함한다.

실시예 14는 실시예 13의 방법으로서,

제 1 압축 아티팩트와 제 3 압축 아티팩트를 결합하여 제 1 스코어를 형성하는 단계는:

제 1 압축 아티팩트 및 상기 제 1 압축 아티팩트와 연관된 제 1 오프셋을 제 1 극좌표에 맵핑하는 단계;

제 3 압축 아티팩트 및 상기 제 2 압축 아티팩트와 연관된 제 2 오프셋을 제 2 극좌표에 맵핑하는 단계; 및

제 1 스코어를 제 1 극좌표 및 제 2 극좌표의 원형 평균으로서 계산하는 단계를 포함한다.

실시예 15는 실시예 8의 방법으로서,

제 1 오디오 신호는 미디어 프리젠테이션 장치에 기록된다.

실시예 16은 실시예 8의 방법으로서,

오디오 압축 구성은 시간-주파수 변환, 윈도우 함수 또는 윈도우 길이 중 적어도 하나를 나타낸다.

실시예 17은 실행시, 기계로 하여금:

압축 해제된 제 2 오디오 신호를 나타내는 제 1 오디오 신호를 수신하고;

상기 제 1 오디오 신호로부터, 제 2 오디오 신호를 형성하기 위해 제 3 오디오 신호를 압축하는데 사용되는 오디오 압축 구성을 식별하며;

식별된 오디오 압축 구성에 기초하여 제 2 오디오 신호의 소스를 식별하게 하는 명령어를 포함하는 비일시적 컴퓨터 판독가능 저장매체이다.

실시예 18은 실시예 17의 비일시적 컴퓨터 판독가능 저장매체로서,

실행시, 기계로 하여금:

식별된 오디오 압축 구성에 기초하여 코딩 포맷을 식별하고,

상기 코딩 포맷에 기초하여 소스를 식별함으로써,

식별된 오디오 압축 구성에 기초하여 제 2 오디오 신호의 소스를 식별하게 하는 명령어를 더 포함한다.

실시예 19는 실시예 17의 비일시적 컴퓨터 판독가능 저장매체로서,

실행시, 기계로 하여금:

제 1 시험 압축 구성에 따라 제 1 오디오 신호의 제 1 블록의 제 1 시간-주파수 분석을 수행하고,

제 1 시간-주파수 분석으로 인한 제 1 압축 아티팩트를 결정하며,

제 2 시험 압축 구성에 따라 제 1 오디오 신호의 제 1 블록의 제 2 시간-주파수 분석을 수행하고,

제 2 시간-주파수 분석으로 인한 제 2 압축 아티팩트를 결정하며,

제 1 시험 압축 구성과 제 2 시험 압축 구성 중에서 제 1 압축 아티팩트 및 제 2 압축 아티팩트에 기초하여 오디오 압축 구성으로서 선택함으로써, 상기 제 1 오디오 신호로부터, 상기 오디오 압축 구성을 식별하게 하는 명령어를 더 포함한다.

실시예 20은 실시예 19의 비일시적 컴퓨터 판독가능 저장매체로서,

실행시, 기계로 하여금:

제 1 시험 압축 구성에 따라 제 1 오디오 신호의 제 2 블록의 제 3 시간-주파수 분석을 수행하고,

제 3 시간-주파수 분석으로 인한 제 3 압축 아티팩트를 결정하며,

제 2 시험 압축 구성에 따라 제 1 오디오 신호의 제 2 블록의 제 4 시간-주파수 분석을 수행하고,

제 4 시간-주파수 분석으로 인한 제 4 압축 아티팩트를 결정하며,

제 1 시험 압축 구성과 제 2 시험 압축 구성 중에서 제 1 압축 아티팩트, 제 2 압축 아티팩트, 제 3 압축 아티팩트 및 제 4 압축 아티팩트에 기초한 오디오 압축 구성으로서 선택하게 하는 명령어를 더 포함한다.

실시예 21은 실시예 20의 비일시적 컴퓨터 판독가능 저장매체로서,

실행시, 기계로 하여금:

제 1 압축 아티팩트와 제 3 압축 아티팩트를 조합하여 제 1 스코어를 형성하고,

제 2 압축 아티팩트와 제 4 압축 아티팩트를 조합하여 제 2 스코어를 형성하며,

제 1 스코어와 제 2 스코어를 비교함으로써,

제 1 시험 압축 구성과 제 2 시험 압축 구성 중에서 제 1 압축 아티팩트, 제 2 압축 아티팩트, 제 3 압축 아티팩트, 및 제 4 압축 아티팩트에 기초한 오디오 압축 구성을 선택하게 하는 명령어를 더 포함한다.

실시예 22는 실시예 21의 비일시적 컴퓨터 판독가능 저장매체로서,

실행시, 기계로 하여금:

제 1 압축 아티팩트 및 제 1 압축 아티팩트와 연관된 제 1 오프셋을 제 1 극좌표에 맵핑하고,

제 1 스코어를 제 1 극좌표 및 제 2 극좌표의 원형 평균으로서 계산함으로써,

제 1 압축 아티팩트와 제 3 압축 아티팩트를 결합하여 제 1 스코어를 형성하도록하는 명령어를 더 포함한다.

실시예 23은:

오디오 압축 구성에 따라 제 3 오디오 신호를 압축함으로써 형성된 압축 해제된 제 2 오디오 신호를 나타내는 제 1 오디오 신호를 수신하는 단계;

제 1 시험 압축 구성에 따라 제 1 오디오 신호의 제 1 블록의 제 1 시간-주파수 분석을 수행하는 단계;

제 2 시험 압축 구성에 따라 제 1 오디오 신호의 제 1 블록의 제 2 시간-주파수 분석을 수행하는 단계;

제 1 시험 압축 구성과 제 2 시험 압축 구성 중에서 제 1 압축 아티팩트 및 제 2 압축 아티팩트에 기초하여 오디오 압축 구성으로서 선택하는 단계를 포함하는 방법이다.

실시예 24는 시예 23의 방법으로서,

제 1 시험 압축 구성과 상기 제 2 시험 압축 구성 중에서 제 1 압축 아티팩트 및 제 2 압축 아티팩트에 기초하여 오디오 압축 구성으로서 선택하는 단계는 상기 제 1 압축 아티팩트 및 상기 제 2 압축 아티팩트를 비교하는 단계를 포함한다.

실시예 25는 실시예 23의 방법으로서,

제 1 시험 압축 구성과 제 2 시험 압축 구성 중에서 제 1 압축 아티팩트, 제 2 압축 아티팩트, 제 3 압축 아티팩트 및 제 4 압축 아티팩트에 기초하여 오디오 압축 구성으로서 선택하는 단계를 더 포함한다 :

실시예 26은 실시예 25의 방법으로서,

제 1 스코어와 제 2 스코어를 비교하는 단계를 포함한다.

실시예 27은 실시예 26의 방법으로서,

제 1 압축 아티팩트 및 제 1 압축 아티팩트와 연관된 제 1 오프셋을 제 1 극좌표에 맵핑하는 단계;

제 3 압축 아티팩트 및 제 2 압축 아티팩트와 연관된 제 2 오프셋을 제 2 극좌표에 맵핑하는 단계; 및

"포함하는" 및 "구비하는"(및 이의 모든 형태 및 시제)는 본 명세서에서 개방형 용어로 사용된다. 따라서, 청구범위가 "포함한다" 또는 "구비한다"의 임의의 형태(예를 들어, 구비한다, 포함한다, 구비하는, 포함하는, 갖는 등)를 따르는 것을 열거할 때마다, 추가적인 요소, 용어 등은 해당 청구범위를 벗어남이 없이 있을 수 있다. 본 명세서에 사용된 바와 같이, "적어도"라는 용어가 청구항의 전제부블에서 전이 용어로서 사용될 때, "구비하는" 및 "포함하는"이라는 용어는 개방형 동일한 방식으로 개방형이다. "및", "또는" 및 "및/또는"과 같은 접속사는 문맥상 명백하게 달리 지시하지 않는 한 포괄적이다. 예를 들어, "A 및/또는 B"는 A만, B만 및 A와 B를 포함한다. 본 명세서 및 첨부된 청구범위에서, 문맥상 달리 명확하게 지시하지 않는 한, 단수 형태 "a", "an" 및 "the"는 복수 참조를 배제하지 않는다.

본 명세서에 인용된 간행물, 특허 출원 및 특허를 포함하는 임의의 참고문헌은 각각의 참고문헌이 개별적으로 그리고 구체적으로 참고로 포함되고 본원에 전체적으로 제시된 것과 동일한 정도로 참고로 포함된다.

특정 예시적인 방법, 장치 및 물품이 본 명세서에 개시되었지만, 본 특허의 범위는 이에 국한되지 않는다. 반대로, 본 특허는 본 특허 청구범위 내에 있는 모든 방법, 장치 및 물품을 포함한다.

Claims

압축 해제된 제 2 오디오 신호를 나타내는 수신된 제 1 오디오 신호로부터, 제 2 오디오 신호를 형성하기 위해 제 3 오디오 신호를 압축하는데 사용되는 오디오 압축 구성을 식별하기 위한 코딩 포맷 식별자; 및
식별된 오디오 압축 구성에 기초하여 제 2 오디오 신호의 소스를 식별하는 소스 식별자를 포함하는 장치.
제 1 항에 있어서,
제 1 시험 압축 구성에 따라 제 1 오디오 신호의 제 1 블록의 제 1 시간-주파수 분석을 수행하고, 제 2 시험 압축 구성에 따라 제 1 오디오 신호의 제 1 블록의 제 2 시간-주파수 분석을 수행하기 위한 시간-주파수 분석기;
제 1 시간-주파수 분석으로 인한 제 1 압축 아티팩트를 결정하고, 제 2 시간-주파수 분석으로 인한 제 2 압축 아티팩트를 결정하는 아티팩트 컴퓨터; 및
제 1 시험 압축 구성과 제 2 시험 압축 구성 중에서 제 1 압축 아티팩트 및 제 2 압축 아티팩트에 기초하여 오디오 압축 구성으로서 선택하는 컨트롤러를 더 포함하는 장치.
제 2 항에 있어서,
컨트롤러는 제 1 압축 아티팩트 및 상기 제 1 압축 아티팩트에 기초한 제 2 시험 압축 구성 중에서 선택하고, 제 2 압축 아티팩트는 제 1 압축 아티팩트와 제 2 압축 아티팩트를 비교하는 것을 포함하는 장치.
제 2 항에 있어서,
시간-주파수 분석기는 제 1 시험 압축 구성에 따라 제 1 오디오 신호의 제 2 블록의 제 3 시간-주파수 분석을 수행하고, 제 2 시험 압축 구성에 따라 제 1 오디오 신호의 제 2 블록의 제 4 시간-주파수 분석을 수행하며,
아티팩트 컴퓨터는 제 3 시간-주파수 분석으로 인한 제 3 압축 아티팩트를 결정하고, 제 4 시간-주파수 분석으로 인한 제 4 압축 아티팩트를 결정하며;
컨트롤러는 제 1 시험 압축 구성과 제 2 시험 압축 구성 중에서 제 1 압축 아티팩트, 제 2 압축 아티팩트, 제 3 압축 아티팩트 및 제 4 압축 아티팩트에 기초하여 오디오 압축 구성으로서 선택하는 장치.
제 4 항에 있어서,
제 1 압축 아티팩트 및 제 3 압축 아티팩트를 결합하여 제 1 스코어를 형성하고, 제 2 압축 아티팩트 및 제 4 압축 아티팩트를 결합하여 제 2 스코어를 형성하기 위한 포스트 프로세서를 더 포함하고, 컨트롤러는 제 1 스코어와 제 2 스코어를 비교함으로써 제 1 시험 압축 구성과 제 2 시험 압축 구성 중에서 오디오 압축 구성으로서 선택하는 장치.
제 5 항에 있어서,
포스트 프로세서는,
제 1 압축 아티팩트 및 상기 제 1 압축 아티팩트와 연관된 제 1 오프셋을 제 1 극좌표에 맵핑하고,
제 3 압축 아티팩트 및 제 2 압축 아티팩트와 연관된 제 2 오프셋을 제 2 극좌표에 맵핑하며,
제 1 스코어를 제 1 극좌표 및 제 2 극좌표의 원형 평균으로서 계산함으로써 상기 제 1 압축 아티팩트와 상기 제 3 압축 아티팩트를 결합하여 상기 제 1 스코어를 형성하는 장치.
제 1 항에 있어서,
상기 제 1 오디오 신호는 미디어 프리젠테이션 장치에서 기록되는 장치.
압축 해제된 제 2 오디오 신호를 나타내는 제 1 오디오 신호를 수신하는 단계;
상기 제 1 오디오 신호로부터, 제 2 오디오 신호를 형성하기 위해 제 3 오디오 신호를 압축하는데 사용되는 오디오 압축 구성을 식별하는 단계; 및
식별된 오디오 압축 구성에 기초하여 제 2 오디오 신호의 소스를 식별하는 단계를 포함하는 방법.
제 8 항에 있어서,
식별된 오디오 압축 구성에 기초하여 제 2 오디오 신호의 소스를 식별하는 단계는:
식별된 오디오 압축 구성에 기초하여 코딩 포맷을 식별하는 단계; 및
상기 코딩 포맷에 기초하여 소스를 식별하는 단계를 포함하는 방법.
제 8 항에 있어서,
제 1 오디오 신호로부터 오디오 압축 구성을 식별하는 단계는:
제 1 시험 압축 구성에 따라 상기 제 1 오디오 신호의 제 1 블록의 제 1 시간-주파수 분석을 수행하는 단계;
제 1 시간-주파수 분석으로 인한 제 1 압축 아티팩트를 결정하는 단계;
제 2 시험 압축 구성에 따라 상기 제 1 오디오 신호의 제 1 블록의 제 2 시간-주파수 분석을 수행하는 단계;
제 2 시간-주파수 분석으로 인한 제 2 압축 아티팩트를 결정하는 단계; 및
제 1 시험 압축 구성과 제 2 시험 압축 구성 중에서 제 1 압축 아티팩트 및 제 2 압축 아티팩트에 기초하여 오디오 압축 구성으로서 선택하는 단계를 포함하는 방법.
제 10 항에 있어서,
제 1 압축 아티팩트 및 제 2 압축 아티팩트에 기초하여 제 1 시험 압축 구성및 제 2 시험 압축 구성 중에서 선택하는 단계는 상기 제 1 압축 아티팩트와 상기 제 2 압축 아티팩트를 비교하는 단계를 포함하는 방법.
제 10 항에 있어서,
제 1 시험 압축 구성에 따라 제 1 오디오 신호의 제 2 블록의 제 3 시간-주파수 분석을 수행하는 단계;
제 3 시간-주파수 분석으로 인한 제 3 압축 아티팩트를 결정하는 단계;
제 2 시험 압축 구성에 따라 제 1 오디오 신호의 제 2 블록의 제 4 시간-주파수 분석을 수행하는 단계;
제 4 시간-주파수 분석으로 인한 제 4 압축 아티팩트를 결정하는 단계; 및
제 1 시험 압축 구성과 제 2 시험 압축 구성 중에서 제 1 압축 아티팩트, 제 2 압축 아티팩트, 제 3 압축 아티팩트 및 제 4 압축 아티팩트에 기초하여 오디오 압축 구성으로서 선택하는 단계를 포함하는 방법.
제 12 항에 있어서,
제 1 시험 압축 구성과 제 2 시험 압축 구성 중에서 제 1 압축 아티팩트, 제 2 압축 아티팩트, 제 3 압축 아티팩트 및 제 4 압축 아티팩트에 기초하여 오디오 압축 구성으로서 선택하는 단계는:
제 1 압축 아티팩트와 제 3 압축 아티팩트를 결합하여 제 1 스코어를 형성하는 단계;
제 2 압축 아티팩트와 제 4 압축 아티팩트를 결합하여 제 2 스코어를 형성하는 단계; 및
상기 제 1 스코어와 제 2 스코어를 비교하는 단계를 포함하는 방법.
제 13 항에 있어서,
제 1 압축 아티팩트와 제 3 압축 아티팩트를 결합하여 제 1 스코어를 형성하는 단계는:
제 1 압축 아티팩트 및 상기 제 1 압축 아티팩트와 연관된 제 1 오프셋을 제 1 극좌표에 맵핑하는 단계;
제 3 압축 아티팩트 및 상기 제 2 압축 아티팩트와 연관된 제 2 오프셋을 제 2 극좌표에 맵핑하는 단계; 및
제 1 스코어를 제 1 극좌표 및 제 2 극좌표의 원형 평균으로서 계산하는 단계를 포함하는 방법.
제 8 항에 있어서,
제 1 오디오 신호는 미디어 프리젠테이션 장치에 기록되는 방법.
제 8 항에 있어서,
오디오 압축 구성은 시간-주파수 변환, 윈도우 함수 또는 윈도우 길이 중 적어도 하나를 나타내는 방법.
실행시, 기계로 하여금:
압축 해제된 제 2 오디오 신호를 나타내는 제 1 오디오 신호를 수신하고;
상기 제 1 오디오 신호로부터, 제 2 오디오 신호를 형성하기 위해 제 3 오디오 신호를 압축하는데 사용되는 오디오 압축 구성을 식별하며;
식별된 오디오 압축 구성에 기초하여 제 2 오디오 신호의 소스를 식별하게 하는 명령어를 포함하는 비일시적 컴퓨터 판독가능 저장매체.
제 17 항에 있어서,
실행시, 기계로 하여금:
식별된 오디오 압축 구성에 기초하여 코딩 포맷을 식별하고,
상기 코딩 포맷에 기초하여 소스를 식별함으로써,
식별된 오디오 압축 구성에 기초하여 제 2 오디오 신호의 소스를 식별하게 하는 명령어를 더 포함하는 비일시적 컴퓨터 판독가능 저장매체.
제 17 항에 있어서,
실행시, 기계로 하여금:
제 1 시험 압축 구성에 따라 제 1 오디오 신호의 제 1 블록의 제 1 시간-주파수 분석을 수행하고,
제 1 시간-주파수 분석으로 인한 제 1 압축 아티팩트를 결정하며,
제 2 시험 압축 구성에 따라 제 1 오디오 신호의 제 1 블록의 제 2 시간-주파수 분석을 수행하고,
제 2 시간-주파수 분석으로 인한 제 2 압축 아티팩트를 결정하며,
제 1 시험 압축 구성과 제 2 시험 압축 구성 중에서 제 1 압축 아티팩트 및 제 2 압축 아티팩트에 기초하여 오디오 압축 구성으로서 선택함으로써, 상기 제 1 오디오 신호로부터, 상기 오디오 압축 구성을 식별하게 하는 명령어를 더 포함하는 비일시적 컴퓨터 판독가능 저장매체.
제 19 항에 있어서,
실행시, 기계로 하여금:
제 1 시험 압축 구성에 따라 제 1 오디오 신호의 제 2 블록의 제 3 시간-주파수 분석을 수행하고,
제 3 시간-주파수 분석으로 인한 제 3 압축 아티팩트를 결정하며,
제 2 시험 압축 구성에 따라 제 1 오디오 신호의 제 2 블록의 제 4 시간-주파수 분석을 수행하고,
제 4 시간-주파수 분석으로 인한 제 4 압축 아티팩트를 결정하며,
제 1 시험 압축 구성과 제 2 시험 압축 구성 중에서 제 1 압축 아티팩트, 제 2 압축 아티팩트, 제 3 압축 아티팩트 및 제 4 압축 아티팩트에 기초한 오디오 압축 구성으로서 선택하게 하는 명령어를 더 포함하는 비일시적 컴퓨터 판독가능 저장매체.
제 20 항에 있어서,
실행시, 기계로 하여금:
제 1 압축 아티팩트와 제 3 압축 아티팩트를 조합하여 제 1 스코어를 형성하고,
제 2 압축 아티팩트와 제 4 압축 아티팩트를 조합하여 제 2 스코어를 형성하며,
제 1 스코어와 제 2 스코어를 비교함으로써,
제 1 시험 압축 구성과 제 2 시험 압축 구성 중에서 제 1 압축 아티팩트, 제 2 압축 아티팩트, 제 3 압축 아티팩트, 및 제 4 압축 아티팩트에 기초한 오디오 압축 구성을 선택하게 하는 명령어를 더 포함하는 비일시적 컴퓨터 판독가능 저장매체.
제 21 항에 있어서,
실행시, 기계로 하여금:
제 1 압축 아티팩트 및 제 1 압축 아티팩트와 연관된 제 1 오프셋을 제 1 극좌표에 맵핑하고,
제 3 압축 아티팩트 및 제 2 압축 아티팩트와 연관된 제 2 오프셋을 제 2 극좌표에 맵핑하며,
제 1 스코어를 제 1 극좌표 및 제 2 극좌표의 원형 평균으로서 계산함으로써,
제 1 압축 아티팩트와 제 3 압축 아티팩트를 결합하여 제 1 스코어를 형성하도록하는 명령어를 더 포함하는 비일시적 컴퓨터 판독가능 저장매체.
오디오 압축 구성에 따라 제 3 오디오 신호를 압축함으로써 형성된 압축 해제된 제 2 오디오 신호를 나타내는 제 1 오디오 신호를 수신하는 단계;
제 1 시험 압축 구성에 따라 제 1 오디오 신호의 제 1 블록의 제 1 시간-주파수 분석을 수행하는 단계;
제 1 시간-주파수 분석으로 인한 제 1 압축 아티팩트를 결정하는 단계;
제 2 시험 압축 구성에 따라 제 1 오디오 신호의 제 1 블록의 제 2 시간-주파수 분석을 수행하는 단계;
제 2 시간-주파수 분석으로 인한 제 2 압축 아티팩트를 결정하는 단계; 및
제 1 시험 압축 구성과 제 2 시험 압축 구성 중에서 제 1 압축 아티팩트 및 제 2 압축 아티팩트에 기초하여 오디오 압축 구성으로서 선택하는 단계를 포함하는 방법.
제 23 항에 있어서,
제 1 시험 압축 구성과 제 2 시험 압축 구성 중에서 제 1 압축 아티팩트 및 제 2 압축 아티팩트에 기초하여 오디오 압축 구성으로서 선택하는 단계는 상기 제 1 압축 아티팩트 및 상기 제 2 압축 아티팩트를 비교하는 단계를 포함하는 방법.
제 23 항에 있어서,
제 1 시험 압축 구성에 따라 제 1 오디오 신호의 제 2 블록의 제 3 시간-주파수 분석을 수행하는 단계;
제 3 시간-주파수 분석으로 인한 제 3 압축 아티팩트를 결정하는 단계;
제 2 시험 압축 구성에 따라 제 1 오디오 신호의 제 2 블록의 제 4 시간-주파수 분석을 수행하는 단계;
제 4 시간-주파수 분석으로 인한 제 4 압축 아티팩트를 결정하는 단계; 및
제 1 시험 압축 구성과 제 2 시험 압축 구성 중에서 제 1 압축 아티팩트, 제 2 압축 아티팩트, 제 3 압축 아티팩트 및 제 4 압축 아티팩트에 기초하여 오디오 압축 구성으로서 선택하는 단계를 포함하는 방법.
제 25 항에 있어서,
제 1 시험 압축 구성과 제 2 시험 압축 구성 중에서 제 1 압축 아티팩트, 제 2 압축 아티팩트, 제 3 압축 아티팩트 및 제 4 압축 아티팩트에 기초하여 오디오 압축 구성으로서 선택하는 단계는:
제 1 압축 아티팩트와 제 3 압축 아티팩트를 결합하여 제 1 스코어를 형성하는 단계;
제 2 압축 아티팩트와 제 4 압축 아티팩트를 결합하여 제 2 스코어를 형성하는 단계; 및
제 1 스코어와 제 2 스코어를 비교하는 단계를 포함하는 방법.
제 26 항에 있어서,
제 1 압축 아티팩트와 제 3 압축 아티팩트를 결합하여 제 1 스코어를 형성하는 단계는:
제 1 압축 아티팩트 및 제 1 압축 아티팩트와 연관된 제 1 오프셋을 제 1 극좌표에 맵핑하는 단계;
제 3 압축 아티팩트 및 제 2 압축 아티팩트와 연관된 제 2 오프셋을 제 2 극좌표에 맵핑하는 단계; 및
제 1 스코어를 제 1 극좌표 및 제 2 극좌표의 원형 평균으로서 계산하는 단계를 포함하는 방법.