KR20080077085A

KR20080077085A - 오디오 장치 품질의 판단

Info

Publication number: KR20080077085A
Application number: KR1020087007770A
Authority: KR
Inventors: 안톤 더블유. 크란츠; 윌리암 엘. 루니
Original assignee: 마이크로소프트 코포레이션
Priority date: 2005-11-17
Filing date: 2006-10-30
Publication date: 2008-08-21
Also published as: US20070112563A1; ES2421927T3; EP1913708A4; WO2007061584A1; EP1913708A1; JP5053285B2; CN101313482A; CN101313482B; EP1913708B1; JP2009518662A

Abstract

컴퓨터 시스템의 특정 오디오 장치 구성의 품질이 판단된다. 컴퓨팅 장치의 메모리에 저장된 모델 샘플 오디오 파일은 컴퓨터 시스템과 접속된 스피커를 통해 재생된다. 이에 의해 생성된 사운드는 포착된 오디오 신호를 생성하기 위하여 컴퓨터 시스템과 접속된 마이크에 의해 포착된다. 포착된 오디오 신호는 포착된 오디오 신호의 충실도를 판단하기 위하여 샘플 오디오 신호와 상호연관된다. 포착된 오디오 신호를 샘플 오디오 신호와 상호연관시키기 위한 알고리즘은 오디오 신호의 볼륨 및 주파수 특징을 고려할 수 있다. 장치 품질 점수가 컴퓨팅되고, 최적의 오디오 장치 구성이 컴퓨터 시스템에 의해 자동으로 선택될 수 있다.

포착된 오디오 신호, 샘플 오디오 파일, 오디오 장치, 스피커, 마이크, 최소 제곱값

Description

오디오 장치 품질의 판단{DETERMINATION OF AUDIO DEVICE QUALITY}

네트워크 연결된 컴퓨팅 장치들을 사용한 실시간 통신이 점차 대중화되고 있다. 이는 예컨대, VOIP(voice over Internet protocol) 전화, 오디오 가능형(audio-enabled) 채팅 프로그램, 웹 비디오 컨퍼런스, 및 오디오 및 비디오 스트리밍의 형태를 취할 수 있다. 실시간 통신 오디오 클라이언트들을 제공하는 많은 회사들 사이에서는, 고품질의 오디오 및/또는 비디오 경험을 제공하는 것이 핵심적인 차별적 요소(differentiator)일 수 있다. 많은 예에서, 사용자는 통신 세션에 사용될 수 있는 복수의 오디오 장치들을 가질 수 있다. 실시간 오디오 클라이언트는 통상적으로 전화를 하는 데에 사용하기 위한 오디오 장치들을 사용자에게 선택 및 구성하라고 요청한다. 그러나, 오디오 클라이언트는 선택된 오디오 장치들이 양질의 통신 경험으로 되는 것을 보장하지 않고, 심지어는 선택된 장치들이 최상의 구성 선택을 제공하는지 여부를 나타내는 것도 보장하지 않는다.

본 명세서의 이 배경 기술에 포함된 정보는 단지 기술적인 참조를 위한 것이며, 본 발명의 범위가 정해지는 대상 문제로 고려되는 것이 아니다.

여기서 기재되고 청구되는 기술은 컴퓨터 시스템의 특정 오디오 출력 또는 입력 장치들, 또는 그 조합들의 품질의 자동 감지에 관한 것이다. 컴퓨팅 장치의 메모리에 저장된 모델 샘플 오디오 파일은 컴퓨터 시스템과 연결된 스피커 출력 장치를 통해 재생된다. 이에 의해 생성되는 사운드는, 컴퓨터 시스템에 의한 기록 및 프로세싱을 위한 포착된 오디오 신호를 생성하기 위하여, 컴퓨터 시스템과 연결된 마이크 입력 장치에 의해 포착되고 변환된다. 포착된 오디오 신호는 포착된 오디오 신호의 충실도(fidelity)를 판단하기 위하여 샘플 오디오 신호와 상호연관된다.

포착된 오디오 신호와 샘플 오디오 신호의 상호연관을 위한 알고리즘은, 포착된 오디오 신호와 샘플 오디오 신호를 비교할 때, 예컨대 비교 에너지 레벨 또는 강도, 주파수 표현 범위, 왜곡 레벨 및 신호 대 노이즈 비와 같은 인자들 중 하나 이상을 고려할 수 있다. 추가적으로 또는 다르게는, 다른 오디오 품질 인자들이 샘플 오디오 신호와 포착된 오디오 신호 간의 비교 오디오 품질을 계산하는 데에 사용될 수 있다. 상이한 오디오 장치 구성들 간의 상대적인 장점에 대한 간단한 표시를 사용자에게 제공하기 위해 장치 품질 점수가 컴퓨팅될 수 있다. 오디오 입력 장치와 출력 장치의 최적의 쌍은, 가능한 장치 조합들 전부를 자동으로 비교하고 장치 품질 점수가 가장 높은 구성을 활성화시킨 후에, 컴퓨터 시스템에 의해 자동으로 선택될 수 있다.

일부 실시예에서는, 컴퓨터 프로그램 제품과 같은 제조물이 제공된다. 컴퓨터 프로그램 제품의 하나의 구현은 컴퓨터 시스템에 의해 판독가능하고 컴퓨터 프로그램을 인코딩한 컴퓨터 프로그램 저장 매체를 제공한다. 컴퓨터 프로그램 제품의 다른 구현은 컴퓨터 시스템에 의해 반송파(carrier wave)로 구현되고 컴퓨터 프로그램을 인코딩한 컴퓨터 데이터 신호로 제공될 수 있다. 본 상세한 설명은 이하 실시예에서 더욱 기술되는 개념들의 선택을 간략화된 형태로 도입하기 위하여 제공되는 것이다. 본 상세한 설명은 청구 대상의 핵심적인 특징들 또는 결정적인 특징들을 식별하기 위한 것이 아니고, 또한 청구 대상의 범주를 제한하는 데에 사용되는 것도 아니다. 청구 대상의 다른 특징들, 상세들, 유틸리티들 및 이점들은, 첨부 도면들에 더욱 도시되어 있고 첨부되는 청구범위에 규정되어 있는 바와 같이 이하에서 보다 구체적으로 기재되는 다양한 실시 형태들과 구현들의 실시예에서 명백해질 것이다.

도 1은 복수의 오디오 장치들이 부착된 예시적인 퍼스널 컴퓨터 시스템을 도시하는 도면.

도 2는 오디오 장치 구성들의 품질을 판단하기 위한 컴퓨터 시스템의 예시적인 모듈들을 도시하는 도면.

도 3은 오디오 장치 품질을 판단하기 위하여 모듈들에 의해 행해지는 예시적인 일련의 동작들을 도시하는 도면.

도 4는 오디오 장치 품질 점수를 판단하기 위하여 행해지는 예시적인 다른 일련의 동작들을 도시하는 도면.

도 5는 실시간 통신 세션들 및 기타 오디오 입출력 기능들을 수행하기 위한 예시적인 컴퓨터 시스템을 도시하는 도면.

여기서 기재되는 기술의 구현은 컴퓨터 시스템과 연관된 오디오 장치 구성들의 품질을 자동으로 판단하기 위해 제공된다. 본 기술은, 실시간 통신 세션들 및 기타 오디오 환경 세션들을 수행하는 컴퓨터 시스템의 사용자에게, 이러한 세션들을 수행하기 위해 선택되는 장치들이 가능한 최상의 오디오 품질 구성을 포함하는 것을 보장하는 것을 돕는다. 예컨대, 오디오 컨퍼런스, 예컨대 퍼스널 컴퓨터 시스템을 사용하여 VOIP 전화 통화를 수행할 때는, 오디오 입력 장치, 예컨대 마이크, 및 오디오 출력 장치, 예컨대 하나 이상의 스피커 모두가 통신 세션을 수행하는 데에 필요하다. 만약 선택된 마이크와 스피커 중 어느 하나 또는 모두가 적절하게 구성되지 않았거나 그 조합이 열악하게 동작되면, 사용자는 나쁜 오디오 품질 때문에 실망스러운 통신 경험을 하게 될 수 있다. 여기서 기재되는 시스템 및 방법은, 통신 세션 기간 동안 오디오 경험의 품질을 최대화하기 위하여, 컴퓨터 시스템의 사용자에게 오디오 입출력 장치의 최적의 구성에 관한 정보를 제공하기 위한 자동 조력자(automatic aid)로서 기능한다.

컴퓨터 시스템의 사용자는 통신 세션에 사용될 수 있는 다양한 선택적인 오디오 장치들과 대면할 수 있다. 예컨대, 컴퓨터 시스템은 내장형 마이크, 내장형 마이크를 갖는 표시 장치, 내장형 마이크를 갖는 웹 카메라, 핸드셋 및 스피커폰 선택 사항을 갖는 VOIP 전화, 마이크 및 헤드폰을 갖는 헤드셋, 내장형 스피커, 내장형 스피커를 갖는 표시 장치, 외장형 스피커, 및 스피커가 있는 별도의 홈 오디오 시스템과의 연결 중 어느 하나 이상을 포함할 수 있다.

예컨대, 도 1은 다양한 오디오 주변 장치들이 구비된 예시적인 퍼스널 컴퓨 터 시스템(100)을 도시한다. 통상적인 퍼스널 컴퓨터 시스템(100)은 컴퓨터(102)와 비디오 모니터(104), 키보드(106), 및 컴퓨터(102)에 연결된 마우스(108)를 포함할 수 있다. 컴퓨터(102)는 사운드 생성을 위해 내장형 스피커(118)를 포함할 수있다. 또한, 비디오 모니터(104)에는 스피커(110) 쌍이 구비될 수 있다. 또한, 퍼스널 컴퓨터 시스템(100)의 사용자는 외장형 스피커 세트(112)를 컴퓨터(102)에 부착시킬 수 있다. 또한, 퍼스널 컴퓨터 시스템(100)은 인터넷 비디오 컨퍼런스를 수행하기 위해 비디오 카메라와 마이크의 조합(114)을 포함할 수 있다. 또한, 사용자는 VOIP 또는 인터넷 비디오 컨퍼런스에 참여하기 위해 이어폰 스피커와 마이크를 조합한 헤드셋(116)을 착용할 수 있다.

예시적인 오디오 구성에서, 컴퓨터 시스템은 원하는 오디오 세션을 위해 장치들의 최상의 구성을 자동으로 선택하고 활성화시킬 수 있다. 샘플 오디오 파일은 컴퓨터 시스템과 연결된 스피커 장치를 통해 출력될 수 있다. 샘플 오디오 파일은 컴퓨터 시스템과 연관된 메모리에 저장될 수도 있고, 또는 네트워크를 통해 원격 컴퓨터 시스템으로부터 액세스될 수도 있다. 샘플 오디오 파일은 아날로그 신호로 변환되어 스피커로 전송될 수 있다. 다르게는, 오디오 신호는 명령어 세트에 따라 동시에 생성될 수 있다. 스피커가 디지털 형식인 예에서는, 스피커가 아날로그 디지털 컨버터를 구비하므로, 샘플 오디오 파일이 스피커에 직접 전송될 수 있다. 스피커는 대기(atomosphere)에 음파를 생성하기 위하여 아날로그 오디오 신호를 음향 에너지(acoustic energy)로 변환한다.

샘플 오디오 파일이 스피커에 의해 재생되는 기간과 동일한 기간 동안, 마이 크에 의해 수신된 사운드를 기록하기 위하여 테스트가 행해진다. 샘플 오디오 파일에 대응하는 사운드를 비롯한 임의의 음파가 마이크에 의해 포착되고, 마찬가지로 아날로그 오디오 신호로 변환된다. 아날로그 오디오 신호는 컴퓨터 시스템에 의해 디지털 데이터 포맷으로 변환된다. 다르게는, 디지털 마이크의 경우, 컴퓨터에 입력되기 위해 음파가 즉시 디지털 신호로 변환될 수 있다.

마이크에 의해 포착된 오디오 데이터 및 샘플 오디오 파일은 필요 시에 공통 데이터 포맷으로 변환된다. 그 후, 포착된 사운드로부터의 오디오 데이터는, 포착된 오디오 데이터의 전반적인 품질 및 충실도를 판단하기 위하여, 모델 오디오 샘플 파일로부터의 오디오 데이터와 비교된다. 포착된 오디오 데이터와 모델 오디오 샘플의 상호연관을 위한 알고리즘은 예컨대, 비교 에너지 레벨 또는 강도, 주파수 표현 범위, 왜곡 레벨 및 신호 대 노이즈 비를 포함한 여러 인자들을 비교할 수 있다. 사용자에게 오디오 장치 구성의 품질에 대한 간단한 표시를 제공하기 위하여 이들 인자들에 기초하여 장치 품질 점수가 컴퓨팅될 수 있다.

오디오 입출력 장치들의 최적의 쌍은, 가능한 장치 조합들 전부를 자동으로 비교하고 장치 품질 점수가 가장 높은 구성을 활성화시킨 후에, 컴퓨터 시스템에 의해 자동으로 선택될 수 있다. 다르게는, 컴퓨터 시스템과 연결된 오디오 장치, 예컨대 마이크 및 스피커의 품질이 판단되고, 사용자에게 보고될 수 있다. 그러면, 사용자는 테스트용 오디오 장치의 다른 구성을 수동으로 선택할 수 있고, 결국에는 각각의 품질 점수에 기초하여 오디오 세션을 위한 최상의 구성을 선택할 수 있다.

품질 판단 기술을 구현하기 위한 모듈들 및 컴포넌트들을 구비한 예시적인 컴퓨터 시스템(200)이 도 2에 도시되어 있다. 2개의 예시적인 주변 장치, 즉 마이크(202) 및 스피커(204)가 컴퓨터 시스템(200)과 연결되어 있다. 오디오 포착 모듈(206)에 대한 입력 장치로서 마이크(202)가 컴퓨터 시스템(200)에 연결될 수 있다. 오디오 렌더링 모듈(208)에 대한 출력 장치로서 스피커(204)가 컴퓨터 시스템(200)에 연결될 수 있다.

마이크(202)는 컴퓨터 시스템(200)에 내장된 하드웨어 장치, 또는 유선 또는 무선 접속을 통해 컴퓨터 시스템(200)에 접속된 외장형 장치일 수 있다. 마찬가지로, 스피커(204)는 컴퓨터 시스템(200)에 내장된 하드웨어 장치, 또는 유선 또는 무선 접속을 통해 컴퓨터 시스템(200)에 접속된 외장형 장치일 수 있다. 스피커(204)는 단일 스피커, 스피커들의 쌍, 또는 예컨대 "서라운드 사운드(surround sound)" 구성의 복수의 스피커들의 시스템일 수 있다. 다르게는, 마이크(202) 및 스피커(204)가 단일의 장치, 예컨대 전화 핸드셋 또는 헤드셋으로 조합될 수 있다.

도 2에 도시된 바와 같이, 자동 장치 구성 감지 기능은 점선(210)으로 나타낸 바와 같이, 예컨대, 컴퓨터 시스템(200)의 커널과 사용자 모드 모두에 리소스를 갖는 컴퓨터 시스템(200)의 명령어 레벨 및 리소스의 조합에 의해 구현된다. 다른 운영 체제 및 컴퓨팅 환경에서는, 이러한 컴포넌트 및 모듈이 소프트웨어 아키텍쳐의 다른 레벨로 제어될 수 있다. 커널은, 프로세서, 메모리 및 낮은 수준의 하드웨어 인터페이스를 포함한 기계의 하드웨어 리소스를 관리하고, 다른 소프트웨어 컴포넌트, 예컨대 사용자 모드 컴포넌트가 예컨대, 장치 드라이버, 메모리 관리 루 틴, 스케쥴러 및 시스템 호출을 통해 이들 리소스에 액세스할 수 있는 방식을 제어한다.

오디오 포착 모듈(206) 및 오디오 렌더링 모듈(208)은 모두 커널에 존재한다. 컴퓨터 시스템(200)에 의한 그 이상의 프로세싱을 위하여, 오디오 포착 모듈(206)은 음파로부터 마이크(202)에 의해 변환된 아날로그 오디오 신호를 디지털 데이터 신호, 예컨대 PCM(pulse code modulated), CDR(compact disc raw) 데이터 또는 기타 공통 데이터 포맷으로 변환한다. PCM 데이터는 예컨대 PCM 16, PCM 32 또는 PCM 48과 같은 다양한 품질의 것일 수 있다. 스피커(204)에 의한 음향 변환을 위하여, 오디오 렌더링 모듈(208)은 예컨대, WAV(waveform audio), MPEG 1, DSM(digital sound module) 포맷 또는 기타 공통 데이터 포맷의 디지털 오디오 파일을 아날로그 오디오 신호로 변환한다.

사용자 모드에서는, 마이크(202)와 오디오 포착 모듈(206)에 의해 수신된 오디오 데이터뿐만 아니라 다른 데이터에서 동작되는 소프트웨어 프로세싱 루틴과 같은 추가적인 기능이 구현된다. 품질 감지 모듈(212)은 샘플 오디오 파일(214), 신호 프로세서(216), 및 신호 상호연관 및 품질 측정 모듈(218)을 포함한다. 샘플 오디오 파일(214)은 품질 감지 모듈(212)에 의해 수행되는 동작들에 의해 액세스되고, 오디오 렌더링 모듈(208)과 신호 프로세서(216) 중 어느 하나 또는 이들 모두에 전송될 수 있다. 샘플 오디오 파일(214)은, 스피커(204) 및 마이크(202)의 품질 구성 테스트를 행하기 위하여, 스피커(204)에 출력하기 위한 모델 오디오 샘플로서 오디오 렌더링 모듈(208)로 전송된다.

샘플 오디오 파일(214)은 생성된 사운드의 어트리뷰트를 위해 선택되는 디지털 오디오 파일, 예컨대 WAV 파일일 수 있다. 예컨대, 샘플 오디오 파일(214)은 특정 범위의 주파수를 포함하는 사운드를 생성할 수 있는데, 이 주파수는 마이크(202)를 통해 감지하는 것이 용이하거나, 또는 스피커(204)와 마이크(202) 조합의 주파수 응답에 대한 좋은 표시를 제공한다. 또한, 샘플 오디오 파일(214)은 사용자가 듣기에 마음에 드는 사운드, 예컨대 음악 시퀀스(musical sequence)를 생성하기 위해 추가적으로 선택될 수도 있고, 또는 사용자에게 가치있는 정보, 예컨대 구성 명령어 또는 광고를 제공할 수도 있다.

또한, 마이크(202)로부터 수신된 오디오 신호는 오디오 포착 모듈(206)로부터 신호 프로세서(216)로 전송된다. 오디오 포착 모듈(206)로부터의 오디오 신호와 샘플 오디오 파일(214) 중 어느 하나 또는 이들 모두는, 오디오 신호의 비교를 위해 오디오 신호를 공통 데이터 포맷으로 변환하기 위하여, 신호 프로세서(216)에 의해 처리될 수 있다. 오디오 신호(및 다른 디지털 데이터 신호)는 임의의 포맷으로 변환되고 저장될 수 있다. 예컨대, 만약 오디오 포착 모듈(206)로부터의 오디오 신호가 PCM 포맷이고, 오디오 샘플 파일(214)이 WAV 포맷인 경우, 오디오 샘플 파일(214)은 신호 프로세서(216)에 의해 PCM 포맷으로 변환될 수 있다. 다르게는, 오디오 포착 모듈(206)로부터의 오디오 신호가 신호 프로세서에 의해 WAV 포맷으로 변환될 수 있다. 또 다른 예에서는, 오디오 포착 모듈(206)로부터의 오디오 신호와 오디오 샘플 파일(214) 모두가 신호 프로세서(216)에 의해 제3 포맷, 예컨대 AIFF(audio interchange file format)로 변환될 수 있는데, 이는 이러한 제3 포맷 이 품질 감지 모듈(212)에 의한 그 이상의 프로세싱에 도움이 되는 경우에 그러하다.

오디오 포착 모듈(206)로부터의 오디오 신호와 샘플 오디오 파일(214) 중 어느 하나 또는 이들 모두가 신호 프로세서(216)에 의해 처리되고 나면, 품질 측정값을 판단하기 위하여, 포착된 오디오 신호가 신호 상호연관 및 품질 측정 모듈(218)에 의해 샘플 오디오 파일(214)과 비교된다. 오디오 포착 모듈(206)로부터의 오디오 신호를 샘플 오디오 파일(214)과 비교하는 것은 오디오 장치 구성의 품질의 객관적인 측정을 판단하는 데에 바람직하다.

품질 평가에 앞서, 신호 상호연관 및 품질 측정 모듈(218)은 마이크(202)에 의해 포착된 사운드가 스피커(204)에 의해 생성되었는지 아니면 단지 마이크(202)가 위치한 환경의 주변 음향인지 여부를 식별할 수 있다. 이 신호 상호연관 기능은 상호연관된 오디오 데이터가 비교되는 것을 보장하기 위하여, 포착된 오디오 신호와 샘플 오디오 파일(214) 사이의 합리적인 상호연관을 식별하도록, 마이크(202)로부터 포착된 오디오 신호의 창 또는 스냅샷을 연속적으로 비교하기를 시도한다.

신호 상호연관 기능은, 어떤 샘플 오디오 파일(214)이 스피커(204)에 의해 재생되는 동안에 그 기간에 대응하는 시간의 특정 창의 시간 동안, 마이크(202)로부터 오디오 신호를 포착하고 기록함으로써 도움이 될 수 있다. 따라서, 신호 상호연관 및 품질 측정 모듈(218)은 오디오 포착 모듈(206)로부터의 오디오 신호에 대응하는 데이터의 특징들, 예컨대 주파수, 강도 및 타이밍을 오디오 샘플 파일(214)로부터의 데이터와 비교하여, 데이터에 매치가 존재하는지 여부를 판단한 다. 만약 데이터가 상호연관되어 있으면, 신호 상호연관 및 품질 측정 모듈(218)은 도 3 및 도 4에 대하여 더욱 기재된 바와 같이, 포착된 데이터의 품질 분석을 수행하고, 특정 오디오 장치 구성에 대한 품질 점수를 생성한다.

또한, 도 2에 도시된 바와 같이, 컴퓨터 시스템(200)은 사용자 모드 내에서 동작하는 오디오 애플리케이션(222)을 포함한다. 오디오 애플리케이션(222)은 구성 중인 입출력 장치, 예컨대 마이크(202) 및 스피커(204)를 제어하는 사용자에 의해 인스턴스화된 소프트웨어 프로그램일 수 있다. 예시적인 오디오 애플리케이션은 VOIP 클라이언트 및 오디오 가능형 채팅 프로그램일 수 있다. 다르게는, 오디오 애플리케이션(222)은 단지 새로운 오디오 장치를 설치하거나 또는 이전에 설치된 오디오 장치의 특징들을 최적화하기 위하여 인스턴스화된 오디오 장치 구성 프로그램, 예컨대 "마법사(wizard)" 프로그램일 수 있다.

구성 품질 점수를 갖는 데이터를 오디오 애플리케이션(222)에 전송하기 위하여, "오디오 장치 품질 측정"(220) 애플리케이션 프로그램 인터페이스(API)가 품질 감지 모듈(212) 내의 신호 상호연관 및 품질 측정 모듈(218)과 오디오 애플리케이션(222) 사이의 인터페이스로서 동작한다. 오디오 애플리케이션(222)은 사용자에게 오디오 장치 구성에 관한 정보를 통신하기 위하여 오디오 장치 품질 측정 API(220)로부터의 데이터를 사용할 수 있다. 예컨대, 만약 스피커(204)에 의해 생성되고 마이크(202)에 의해 포착되는 사운드의 강도가 약하다는 표시가 있으면, 오디오 애플리케이션(222)은 사용자에게 스피커(204)의 문제를 해결하라고 경고할 수 있는데, 예컨대 스피커(204)의 볼륨 출력을 증가시키거나 또는 스피커(204)를 움직 이라고 경고할 수 있다. 다르게는, 오디오 애플리케이션(222)은 사용자에게 다른 스피커 선택 사항, 예컨대 외장형 스피커 세트로부터 부착 모니터에 내장된 다른 스피커로 스위칭하는 것을 선택하라고 추천하여, 다른 스피커가 보다 양호한 품질로 되는지 여부를 판단한다. 하나의 예시적인 형태에서, 오디오 애플리케이션(222)은 그래픽 사용자 인터페이스(GUI)의 메시지를 통해 사용자에게 경고할 수 있다(예컨대, 표시 장치 모니터에 "팝업" 창을 표시할 수 있음).

제2 API, 즉 오디오 장치 선택 API(224)는 오디오 애플리케이션(222)과 인터페이스되고, 또한 입출력 포트와도 인터페이스되며, 이 입출력 포트를 통해 마이크(202) 및 스피커(204)가 컴퓨터 시스템(200)에 접속된다. (비록 도 2에 도시되어 있지는 않지만, 오디오 애플리케이션(222)은 스피커(204)의 오디오 애플리케이션(222)(예컨대, VOIP 전화 통화)에 의해 수행되는 통신 세션으로부터 사운드를 생성하기 위하여, 별도의 API를 갖는 오디오 렌더링 모듈(208)과도 추가적으로 인터페이스될 수 있다.) 오디오 장치 선택 API(224)는 선택된 마이크(202) 및 스피커(204) 구성과 접속된 입력 포트 또는 출력 포트를 활성화시킨다. 예컨대, 사용자의 컴퓨터 시스템(200)은 복수의 마이크(202), 예컨대 표시 장치 모니터에 일체화된 제1 마이크, 웹 카메라에 일체화된 제2 마이크, 및 복수의 스피커(204), 예컨대 컴퓨터 시스템(200)에 배선 연결된 스피커들의 제1 세트 및 표시 장치 모니터에 일체화된 스피커들의 제2 세트를 포함할 수 있다.

오디오 애플리케이션(222)은 사용자가 오디오 통신을 위한 목적으로 사용하고 싶은 스피커 세트 및 마이크가 어느 것인지를 사용자에게 문의할 수 있다. 오 디오 애플리케이션(222)은 원하는 마이크(202) 및 스피커(204) 조합을 활성화시키기 위하여 오디오 장치 선택 API(224)를 통해 적절한 데이터 포트를 개폐한다. 또한, 오디오 애플리케이션(222)은, 품질 점수가 가장 높은 오디오 장치 구성을 배치하기 위하여, 컴퓨터 시스템(200)과 접속된 임의의 이용가능한 장치들을 통해 자동으로 순환하도록 오디오 장치 선택 API(224)를 호출할 수 있다.

자동 품질 감지 기능을 행하기 위하여 컴퓨터 시스템에 의해 수행되는 예시적인 일련의 동작들이 도 3에 도시되어 있다. 도 2의 컴퓨터 시스템(200)의 예시적인 구성과 관련하여, 신호 상호연관 및 품질 측정 모듈은 컴퓨터 시스템과 연결된 각각의 가능한 마이크/스피커 구성에 대한 객관적인 품질 평가를 판단하도록 구성된다. 비록 도 2의 컴퓨터 시스템과 관련하여 기술되어 있지만, 여기에 기재된 동작들은 컴퓨터 시스템(200) 이외의 시스템들에 의해서도 행해질 수 있음을 이해하여야 한다. 또한, 여기에 기재된 임의의 동작들은 하드웨어, 소프트웨어, 펌웨어 또는 그 임의의 조합에 의해 행해질 수 있다.

처음에, 선택 동작(302)에서는, 오디오 애플리케이션이 오디오 세션, 예컨대 오디오 통신 세션에서 사용하기 위한 초기 오디오 장치 구성을 자동으로 선택하거나, 또는 사용자에게 선택하라고 프롬프트한다. 이러한 프롬프트 또는 요청은 GUI 메시지를 통해 표시 장치 모니터에 표시될 수 있다. 구성이 선택되고 나면, 재생 동작(304)은 선택된 스피커를 통해 재생하도록 샘플 오디오 파일을 오디오 렌더링 장치로 전송시킨다.

포착 동작(306)은 샘플 오디오 파일과 상호연관된 스피커에 의해 생성된 사 운드를 비롯한, 마이크에 의해 포착된 음파를 기록한다. 음파는, 마이크에 의해 아날로그 신호로 변환되고, 또한 오디오 포착 모듈에 의해 디지털 오디오 포맷으로도 변환된다. 또한, 샘플 오디오 파일은 신호 프로세서에 의해 액세스되고, 변환 동작(308)에서, 포착된 오디오 데이터의 포맷과 용이하게 비교될 수 있는 데이터 포맷으로 변환된다. 예컨대, 만약 포착된 오디오 데이터는 PMC 포맷이고 샘플 오디오 파일은 WAV 포맷인 경우, 샘플 오디오 파일은 WAV로부터 PMC로 변환될 수 있다. 다른 동작(도 3에는 도시 안됨)에서는, 포착된 오디오 데이터가 신호 프로세서에 의해 샘플 오디오 파일의 포맷으로 변환될 수 있다. 또 다른 동작(도 3에는 도시 안됨)에서는, 포착된 오디오 데이터 및 샘플 오디오 파일 모두의 데이터 포맷이 제3의 공통 포맷으로 변환될 수 있다.

일단 샘플 오디오 파일과 포착된 오디오 데이터가 공통 포맷이면, 제1 분석 동작(310)이, 변환된 샘플 파일에 대응하는 오디오 신호의 주파수 범위 및 에너지 레벨을 분석한다. 마찬가지로, 제2 분석 동작(312)은 포착된 오디오 데이터에 대응하는 오디오 신호의 주파수 범위 및 에너지 레벨을 분석한다. 제2 분석 동작(312)은 상호연관 동작(314)을 돕기 위하여, 포착된 오디오 데이터의 창 또는 스냅샷을 연속적으로 분석할 수 있다.

상호연관 동작(314)은 상호연관된 오디오 데이터가 품질 판단 프로세스에서 비교되는 것을 보장하기 위하여, 포착된 오디오 신호의 각각의 창에 대한 주파수 범위 및 에너지 레벨과, 변환된 샘플 파일에 대한 주파수 범위 및 에너지 레벨 사이의 합리적인 상호연관을 식별한다. 즉, 상호 연관 프로세스는 스피커에 의해 재 생되는 샘플 오디오 파일의 기록인 포착된 오디오 신호의 일부를 식별하기 위한 시도를 한다. 오디오 신호의 주파수 범위 및 에너지 레벨은 동일할 필요는 없고, 상당히 가깝기만 하면 된다. 상당히 가깝다고 생각되는 값 차이의 임계값 또는 범위는 미리 결정될 수도 있고 또는 사용자가 설정할 수도 있다. 상호연관 동작(314)은 어떤 샘플 오디오 파일이 스피커에 의해 재생되는 동안의 기간에 대응하는 특정 기간으로부터 창을 선택함으로써 상호연관에 대해 검토되는 포착된 오디오 신호의 창을 협소하게 할 수 있다.

포착된 오디오 신호와 샘플 오디오 파일 사이의 상호연관이 식별되고 나면, 컴퓨팅 동작(316)이 오디오 장치 구성에 대한, 예컨대 특정 마이크/스피커 조합에 대한 오디오 품질 점수를 컴퓨팅한다. 오디오 품질 점수는 샘플 오디오 파일에 의해 생성된 오디오 신호 및 마이크에 의해 포착된 오디오 신호의 오디오 품질 사이의 충실도 인자들에 기초한다. 충실도 인자들은 오디오 신호들 간의 비교 에너지, 주파수 범위의 유사성, 신호 왜곡 및 신호 대 노이즈 비를 포함할 수 있다. 예시적인 컴퓨팅 동작이 도 3과 관련하여 여기서 보다 상세히 설명된다.

쿼리 동작(318)은 추가적인 장치 구성이 가능한지 여부를 자동으로 판단할 수 있다. 만약 그렇다면, 컴퓨터 시스템은 품질 분석을 위해 마이크 및 스피커의 다른 구성을 선택하도록 선택 동작(302)으로 리턴된다. 컴퓨터 시스템은 각각의 기능적인 부착된 스피커 및 마이크 장치를 식별하고, 도 3에 열거된 품질 테스트 프로세스를 행하기 위하여 마이크와 스피커 각각의 가능한 쌍을 반복한다.

다르게는, 쿼리 동작(318)은 사용자가 다른 장치 구성의 품질을 판단하고 싶 은지 여부를 GUI 메시지를 통해 사용자에게 문의할 수 있다. 만약 그렇다면, 컴퓨터 시스템은 품질 분석을 위해 마이크와 스피커의 다른 구성을 선택하도록 선택 동작(302)으로 리턴된다. 만약 사용자가 다른 장치 구성의 품질을 판단하기를 원하지 않거나 또는 컴퓨터 시스템이 자동으로 다른 구성이 가능하지 않다고 판단하면, 표시/선택 동작(320) 각각은 (예컨대, GUI 메시지를 통해) 사용자에게 각각의 분석된 장치 구성의 오디오 품질 점수를 표시하거나, 오디오 품질 점수의 비교에 기초하여 최상의 장치 구성을 자동으로 선택하거나, 또는 둘 다를 행한다.

오디오 장치 구성을 위한 품질 점수를 계산하기 위한 예시적인 프로세스는 도 4에 도시되어 있다. 이들 동작은 예컨대, 도 2의 컴퓨터 시스템(200) 내의 품질 감지 모듈(212)의 신호 상호연관 및 품질 측정 모듈(218) 내에서 발생할 수 있다. 도 4에 도시된 바와 같이, 수신 동작(402)은 포착된 오디오 신호 데이터를 오디오 포착 모듈 및 신호 프로세서를 통해 마이크로부터 수신한다. 포착된 오디오 신호 데이터는 제1 판단 동작(404)에서 분석되며, 이 동작에서는 포착된 오디오 신호의 볼륨 특징들, 예컨대 볼륨 강도, 신호 대 노이즈 비, 동작 범위(dynamic range) 및 전체 고조파 왜곡(harmonic distortion)이 측정된다. 다음, 제2 판단 동작(406)이 포착된 오디오 신호의 주파수 특징들, 예컨대 주파수 범위(예컨대, 포착된 오디오 신호에서의 최고 주파수 및 최저 주파수 표시), 주파수 합성(예컨대, 포착된 오디오 신호에서의 별개의 주파수들의 표시) 및 강도(예컨대, 포착된 오디오 신호의 특정 주파수에서의 세기)를 조사한다.

포착된 오디오 신호의 볼륨 및 주파수 특징이 판단되고 나면, 이 특징들은 상호연관 동작(408)에서, 샘플 오디오 파일의 대응하는 볼륨 및 주파수 특징과 상호연관된다. 상호연관 동작에 대한 값을 제공하기 위하여, 포착된 오디오 신호의 분석과 동시에 샘플 오디오 파일에 대응하는 샘플 오디오 신호에 대해 동일한 볼륨 및 주파수 분석이 행해질 수 있다. 다르게는, 샘플 오디오 파일이 미리 선택되고 알려져 있기 때문에, 샘플 오디오 파일에 대한 볼륨 및 주파수 특징은 단지 메모리에 저장되어 있고 비교 동작에서의 사용에 이용가능한 데이터일 수 있다. 그 후, 계산 동작(410)에서, 상호연관된 데이터는 포착된 오디오 신호와 샘플 오디오 파일 사이의 충실도에 대해 분석된다.

계산 동작(410)에서는, 샘플 오디오 파일의 원래 신호와 포착된 오디오 신호 사이의 상대적인 충실도를 판단하는 데에 "최소 제곱(least squares)" 방법이 사용될 수 있다. 최소 제곱 접근 방식은, 데이터와 예측된 값 사이의 차(오차(residual)라고도 함)의 제곱값의 합을 최소화하려고 함으로써, 데이터의 세트(이 경우에는 포착된 오디오 신호)와 예측된 값(이 경우에는 샘플 오디오 파일) 사이의 "최적합(best fit)"을 찾아내려고 하는 수학적인 최적화 기술이다. 포착된 오디오 신호의 충실도는 오디오 구성의 품질, 예컨대 스피커와 마이크 각각의 주파수 응답, 마이크의 민감성, 스피커의 볼륨, 마이크와 스피커의 서로에 대한 물리적인 위치, 오디오 장치가 배치되는 물리적 환경 및 주변 소음에 의해 영향을 받는다.

그 후, 컴퓨팅 동작(412)에서, 판단되고 비교되는 볼륨 및 주파수 특징들 각각에 대한 충실도의 최소 제곱 차이에 대응하는 값이 컴퓨팅되고, 특정 오디오 장 치 구성에 대한 오디오 품질 점수로 고려된다. 또한, 오디오 품질에 대한 특정 특징의 기여도의 중요성에 기초하여, 각각의 특징이 상이한 가중치로 할당되거나 크기 조정될 수 있다. 이 오디오 품질 점수는 저장되어, 기타 이용가능한 오디오 장치 구성에 대한 오디오 품질 점수와 비교되고, 통신 세션을 위한 컴퓨터 시스템 또는 특정 오디오 애플리케이션에 대한 컴퓨터 시스템의 동작을 위하여 최상의 오디오 품질 점수를 갖는 구성이 사용자에게 자동으로 선택되거나 추천될 수 있다.

다르게는, 혹은 또는, 최상의 오디오 품질 점수에 대응하는 오디오 구성의 탑셋(top set)이 표시될 수 있다. 또한, 어떤 오디오 장치 구성이 특정 환경 또는 특정 사용자에 대해 가장 적합한지를 나타내는 피드백이 사용자에게 표시될 수 있다. 예컨대, 어떤 오디오 장치 구성은 실외에서의 사용에 보다 적합하지만, 다른 오디오 장치 구성은 컴퓨팅 장치가 좁은 영역에 배치되어 있을 때의 사용에 보다 적합할 수 있다. 다른 예로서, 어떤 오디오 장치 구성은 높은 주파수 범위의 사운드를 발생시키는 여성 음성에 보다 적합하지만, 다른 구성은 낮은 주파수 범위의 사운드를 발생시키는 남성 음성에 보다 적합할 수 있다.

도 5는, 네트워크를 통해 실시간 통신 세션을 수행하는 데에 사용될 수 있고 여기서 기재되는 품질 측정 기술이 동작될 수 있는 예시적인 컴퓨터 시스템(500)을 도시한다. 일 실시예에서, 컴퓨터 시스템(500)은 데스크톱 또는 랩톱 컴퓨터에 의해 실시될 수 있지만, 다른 구현들, 예컨대 비디오 게임 콘솔, 셋톱 박스, 휴대용 게임 시스템, 퍼스널 디지털 어시스턴트 및 휴대 전화가 상기 기술을 일체화할 수도 있다. 컴퓨터 시스템(500)은 통상적으로 적어도 하나의 처리 장치(502) 및 메 모리(504)를 포함한다. 컴퓨터 시스템(500)의 정확한 구성 및 유형에 따라, 메모리(504)는 휘발성(예컨대, RAM), 비휘발성(예컨대, ROM 및 플래시 메모리), 또는 이들의 일부 조합일 수 있다. 컴퓨터 시스템(500)의 가장 기본적인 구성은 점선(506)으로 나타낸 바와 같이 처리 장치(502) 및 메모리(504)만 포함하는 것을 필요로 한다.

또한, 컴퓨터 시스템(500)은 메모리 저장 또는 리트리브를 위한 추가적인 장치들을 필요로 할 수 있다. 이들 장치는 이동식 저장 장치(508) 또는 비이동식 저장 장치(510), 예컨대 자기 및 광학 매체 상의 메모리 저장 및 리트리브를 위한 자기 디스크 드라이브, 자기 테이프 드라이브 및 광학 드라이브일 수 있다. 저장 매체는 휘발성 및 비휘발성 매체, 이동식 및 비이동식 매체 모두를 포함할 수 있고, 다수의 구성들, 예컨대 RAM, ROM, EEPROM, 플래시 메모리, CD-ROM, DVD 또는 기타 광학 저장 매체, 자기 카세트, 자기 테이프, 자기 디스크, 또는 기타 자기 저장 장치, 또는 데이터를 저장하는 데에 사용되고 처리 장치(502)에 의해 액세스가능한 임의의 기타 메모리 기술 또는 매체 중 임의의 것으로 제공될 수 있다. 정보는 데이터의 저장을 위한 임의의 방법 또는 기술, 예컨대 컴퓨터 판독가능 명령어, 데이터 구조 및 프로그램 모듈을 사용하여 저장 매체에 저장될 수 있다.

또한, 컴퓨터 시스템(500)은 시스템(500)으로 하여금 다른 장치와 통신할 수 있게 하는 하나 이상의 통신 인터페이스(512)를 포함할 수 있다. 통신 인터페이스(512)는 LAN(local area network), WAN(wide area network), 전화 네트워크, 케이블 네트워크, 인터넷, 직접 배선 접속, 무선 네트워크, 예컨대, 무선 주파수, 적 외선, 마이크로파 또는 음향, 또는 장치들 간의 데이터 전송을 가능하게 하는 다른 네트워크와 접속될 수 있다. 데이터는 일반적으로 피변조(modulated) 데이터 신호, 예컨대 반송파(carrier wave) 또는 기타 전송 매체를 통해 네트워크 상의 통신 인터페이스(512)에 전송되고, 또한 이 통신 인터페이스(512)로부터도 전송된다. 피변조 데이터 신호는 신호 내에 데이터를 인코딩하는 방식으로 설정되거나 변경될 수 있는 특징을 갖는 전자기 신호이다.

또한, 컴퓨터 시스템(500)은 다양한 입력 장치(514) 및 출력 장치(516)를 포함할 수 있다. 예시적인 입력 장치(514)는 키보드, 마우스, 태블릿, 터치 스크린 장치, 스캐너, 시각적 입력 장치 및 마이크 또는 기타 사운드 입력 장치를 포함할 수 있다. 예시적인 출력 장치(516)는 표시 장치 모니터, 프린터 및 스피커를 포함할 수 있다. 이러한 입력 장치(514) 및 출력 장치(516)는 컴퓨터 시스템(500)과 일체화될 수도 있고, 또는 유선을 통해 또는 무선으로, 예컨대 블루투스(Bluetooth) 프로토콜을 통해 컴퓨터 시스템(500)에 접속될 수도 있다. 이들 일체화된 입출력 장치 또는 주변 입출력 장치는 일반적으로 잘 알려져 있으므로, 여기서는 자세히 논의하지 않도록 한다. 일 구현에서는, 예컨대, 샘플 오디오 파일을 포함한 오디오 품질을 판단하기 위한 방법 또는 모듈을 구현하는 프로그램 명령어가 메모리(504) 및 저장 장치(508 및 510)에 구현되고, 처리 장치(502)에 의해 실행된다. 예컨대, 오디오 렌더링 모듈 및 오디오 포착 모듈에 의해 실행되는 기타 기능들은 컴퓨터 시스템(500)의 비휘발성 메모리(504)의 운영 체제에 의해 실행될 수 있다.

여기에 기재된 기술은 하나 이상의 시스템의 논리 동작 및/또는 모듈로서 구현된다. 논리 동작은 하나 이상의 컴퓨터 시스템에서 실행되는 프로세서 구현 단계들의 시퀀스로서 또한 하나 이상의 컴퓨터 시스템 내의 상호접속된 기계 또는 회로 모듈로서 구현될 수 있다. 마찬가지로, 다양한 컴포넌트 모듈들의 설명이 모듈에 의해 실행되거나 모듈에 의해 영향받는 동작의 관점에서 제공될 수 있다. 결과적인 구현은, 기재된 기술을 구현하는 근본적인 시스템의 성능 요구 사항에 따른 선택의 문제이다. 따라서, 여기에 기재된 기술의 실시예를 이루는 논리 동작들은 동작들, 단계들, 객체들 또는 모듈들로서 다양하게 참조된다. 또한, 논리 동작들은, 명백하게 청구되어 있지 않거나, 그렇지 않으면 구체적인 순서가 청구범위에 의해 고유하게 필요한 경우가 아닌 한, 임의의 순서로 행해질 수 있음을 이해하여야 한다.

상기한 설명, 실시예 및 데이터는 본 발명의 예시적인 실시예의 구조 및 사용에 대한 완전한 설명을 제공한다. 비록 본 발명의 다양한 실시예들이 어느 정도 특정되어, 또는 하나 이상의 개별적인 실시예에 대하여 상술되었지만, 당업자는 본 발명의 사상 또는 범주를 벗어나지 않고도 개시된 실시예에 대해 수많은 변경을 행할 수 있다. 특히, 설명된 기술은 퍼스널 컴퓨터와 무관하게 사용될 수 있음을 이해하여야 한다. 따라서, 다른 실시예들이 고려된다. 위의 설명에 포함되고 첨부 도면에 도시된 모든 문제는 특정 실시예의 예로서만 해석되어야 하고, 이를 제한하는 것으로 해석되어서는 안된다. 이하의 청구범위에 정의된 바와 같이 본 발명의 기본적인 구성 요소로부터 벗어나지 않고도, 상세 또는 구조에 변화를 가할 수 있 다.

Claims

컴퓨터 시스템(200, 500)과 접속된 마이크(202) 및 스피커(204)를 포함하는 오디오 장치 구성의 품질을 판단하기 위한 방법으로서,

상기 컴퓨터 시스템(200, 500)의 메모리(504)에 저장된 샘플 오디오 파일(214)로부터 생성되는 샘플 사운드를 상기 스피커(204)를 통해 출력하는 단계(304);

포착된(captured) 오디오 신호를 생성하기 위하여 상기 마이크(202)를 통해 상기 샘플 사운드를 포착하는 단계(306);

상기 포착된 오디오 신호의 오디오 특징들을 분석하는 단계(310);

상기 포착된 오디오 신호의 오디오 특징들을 상기 샘플 오디오 파일에 대응하는 샘플 오디오 신호의 알려진 특징들과 상호연관시키는 단계(314); 및

상기 오디오 장치 구성에 대응하는 상기 상호연관된 오디오 특징들에 기초하여 품질 측정값을 컴퓨팅하는 단계(316)

를 포함하는 오디오 장치 구성 품질 판단 방법.
제1항에 있어서,

상기 마이크에 의해 포착된 샘플 사운드를 포착된 오디오 신호로 변환하는 단계(308)를 더 포함하는 오디오 장치 구성 품질 판단 방법.
제1항에 있어서,

상기 컴퓨터 시스템의 사용자에게 상기 품질 측정값에 대한 표시를 나타내는 단계(320)를 더 포함하는 오디오 장치 구성 품질 판단 방법.
제1항에 있어서,

상기 분석하는 단계는, 상기 샘플 오디오 신호, 상기 포착된 오디오 신호 또는 이들 둘 다를 공통 포맷으로 변환하기 위하여 상기 샘플 오디오 신호 및 상기 포착된 오디오 신호 중 적어도 하나를 처리하는 단계(308)를 더 포함하는 오디오 장치 구성 품질 판단 방법.
제1항에 있어서,

상기 분석하는 단계는 상기 포착된 오디오 신호의 주파수 범위 및 에너지 레벨 중 적어도 하나를 분석하는 단계(310)를 더 포함하는 오디오 장치 구성 품질 판단 방법.
제1항에 있어서,

상기 컴퓨팅하는 단계는 상기 상호연관된 오디오 특징들의 최소 제곱값(least squares value)을 계산하는 단계(410)를 더 포함하는 오디오 장치 구성 품질 판단 방법.
제1항에 있어서,

상기 컴퓨팅하는 단계는 상기 상호연관된 오디오 특징들에 가중치 인자(weighting factor)를 적용하는 단계를 더 포함하는 오디오 장치 구성 품질 판단 방법.
제1항에 있어서,

상기 스피커(204)가 복수의 스피커들을 포함하거나, 상기 마이크(202)가 복수의 마이크들을 포함하거나, 또는 이들 둘 다이고, 이에 의해 복수의 오디오 장치 구성들을 도입하고,

상기 방법은,

상기 복수의 오디오 장치 구성들 각각에 대하여 제1항의 단계들을 반복하는 단계(318)를 더 포함하는 오디오 장치 구성 품질 판단 방법.
제8항에 있어서,

상기 복수의 오디오 장치 구성들 중에서, 상기 복수의 오디오 장치 구성들 각각의 품질 측정값들 중에서 최고 품질 측정값을 갖는 오디오 장치 구성을 선택하는 단계(320)를 더 포함하는 오디오 장치 구성 품질 판단 방법.
제1항의 방법을 구현하는 컴퓨터 프로세스를 행하기 위한 컴퓨터 실행가능 명령어들을 포함하는 컴퓨터 판독가능 매체.
컴퓨터 시스템(200, 500)과 접속된 마이크(202) 및 스피커(204)를 포함하는 오디오 장치 구성의 품질을 판단하기 위한 방법으로서,

상기 컴퓨터 시스템(200, 500)의 메모리(504)에 저장된 샘플 오디오 파일(214)로부터 생성되는 샘플 사운드를 상기 스피커(204)를 통해 출력하는 단계(304);

포착된 오디오 신호를 생성하기 위하여 상기 마이크를 통해 상기 샘플 사운드를 포착하는 단계(306, 402);

상기 포착된 신호의 볼륨 특징들을 판단하는 단계(312, 404);

상기 포착된 오디오 신호의 주파수 특징들을 판단하는 단계(312, 406);

상기 샘플 오디오 파일에 대응하는 샘플 오디오 신호의 볼륨 특징들을 판단하는 단계(310);

상기 샘플 오디오 신호의 주파수 특징들을 판단하는 단계(310); 및

상기 포착된 오디오 신호의 볼륨 특징들 및 주파수 특징들을 상기 샘플 오디오 신호의 볼륨 특징들 및 주파수 특징들과 각각 비교하는 것에 기초하여 상기 오디오 장치 구성의 충실도(fidelity) 측정을 계산하는 단계(316)

를 포함하는 오디오 장치 구성 품질 판단 방법.
제11항에 있어서,

상기 볼륨 특징들은 볼륨 강도, 신호 대 노이즈 비, 동작 범위(dynamic range) 및 전체 고조파 왜곡(harmonic distortion) 중 적어도 하나를 포함하는(404) 오디오 장치 구성 품질 판단 방법.
제11항에 있어서,

상기 주파수 특징들은 주파수 범위, 주파수 합성 및 주파수 강도 중 적어도 하나를 포함하는(406) 오디오 장치 구성 품질 판단 방법.
제11항에 있어서,

상기 계산하는 단계는 상기 주파수 특징들, 상기 볼륨 특징들, 또는 이들 둘 다 중 하나 이상에 가중치 인자를 적용하는 단계를 더 포함하는 오디오 장치 구성 품질 판단 방법.
제11항에 있어서,

상기 계산하는 단계는, 상기 포착된 오디오 신호의 볼륨 특징들 및 주파수 특징들과, 상기 샘플 오디오 신호의 볼륨 특징들 및 주파수 특징들 사이의 최소 제곱값을 각각 계산하는 단계(410)를 더 포함하는 오디오 장치 구성 품질 판단 방법.
제11항에 있어서,

상기 스피커(204)가 복수의 스피커들을 포함하거나, 상기 마이크(202)가 복수의 마이크들을 포함하거나, 또는 이들 둘 다이고, 이에 의해 복수의 오디오 장치 구성들을 도입하고,

상기 방법은,

상기 복수의 오디오 장치 구성들 각각에 대하여 제11항의 단계들을 반복하는 단계(318)를 더 포함하는 오디오 장치 구성 품질 판단 방법.
제16항에 있어서,

상기 복수의 오디오 장치 구성들 중에서, 상기 복수의 오디오 장치 구성들 각각의 충실도 측정값들 중에서 가장 높은 충실도 측정값을 갖는 오디오 장치 구성을 선택하는 단계(320)를 더 포함하는 오디오 장치 구성 품질 판단 방법.
제11항의 방법을 구현하는 컴퓨터 프로세스를 행하기 위한 컴퓨터 실행가능 명령어들을 포함하는 컴퓨터 판독가능 매체.
복수의 오디오 장치 구성의 품질을 판단하는 컴퓨터 시스템(200, 500)으로서,

프로세서(502);

상기 프로세서(502)에 의해 액세스 가능하고 샘플 오디오 파일(214)을 저장하는 메모리(504);

상기 프로세서(502)의 제어 하에 있고, 상기 샘플 오디오 파일(214)로부터 생성되는 샘플 사운드를 출력할 수 있는 스피커(204, 516);

상기 프로세서(502)의 제어 하에 있고, 포착된 오디오 신호를 생성하기 위하여 상기 샘플 사운드를 수신할 수 있는 마이크(202, 514) - 상기 스피커(204) 및 마이크(202)는 함께 모여 오디오 장치 구성을 이룸 - ; 및

품질 감지 모듈(218)

을 포함하고,

상기 품질 감지 모듈(218)은,

상기 프로세서(502)의 제어 하에 있고,

상기 메모리로부터 상기 샘플 오디오 파일을 액세스하고,

상기 샘플 오디오 파일로부터 샘플 오디오 신호를 생성하고,

상기 마이크로부터 상기 포착된 오디오 신호를 수신하고,

상기 포착된 오디오 신호의 오디오 특징들을 분석하고,

상기 포착된 오디오 신호의 오디오 특징들을 상기 샘플 오디오 신호의 알려진 특징들과 상호연관시키고,

상기 오디오 장치 구성에 대응하는 상기 상호연관된 오디오 특징들에 기초한 품질 측정값을 컴퓨팅하는 컴퓨터 시스템(200, 500).
제19항에 있어서,

상기 스피커(204)가 복수의 스피커들을 포함하거나, 상기 마이크(202)가 복수의 마이크들을 포함하거나, 또는 이들 둘 다이고, 이에 의해 복수의 오디오 장치 구성들을 도입하고,

상기 컴퓨터 시스템(200, 500)은,

상기 샘플 사운드의 출력 및 상기 샘플 사운드의 수신에 대하여 각각의 오디오 장치 구성을 자동으로 반복하도록 구성되는 장치 선택 모듈(224)

을 더 포함하는 컴퓨터 시스템(200, 500).