KR20110074887A

KR20110074887A - 변환-도메인 로그-압신을 사용하는 신호 프로세싱을 위한 방법 및 장치

Info

Publication number: KR20110074887A
Application number: KR1020117009533A
Authority: KR
Inventors: 하리나쓰 가루다드리; 옌-리앙 슈이; 솜데브 마줌다르
Original assignee: 콸콤 인코포레이티드
Priority date: 2008-09-26
Filing date: 2009-09-25
Publication date: 2011-07-04
Also published as: CN102165699A; EP2345166A1; JP2013081229A; WO2010036897A1; US20100106269A1; TW201019315A; JP2012504373A; KR101278880B1

Abstract

수신측 상에서 디코딩되는 인코딩된 오디오 신호를 제공하기 위해서 오디오 신호들의 스펙트럼 도메인 또는 시간 도메인 표현들 상에 로그 압신을 적용시킴으로써 오디오 신호 프로세싱하기 위한 방법 및 장치가 설명된다. 오디오 신호의 주파수 도메인 표현 또는 시간 도메인 표현은 각각이 계수를 가지는 특정 주파수 대역들로 오디오 신호를 분리시킴으로써 계산된다. 상이한 압축 비들을 가지는 로그 압신은 인코딩된 신호를 제공하기 위해서 각각의 계수 상에서 수행된다. 인코딩된 신호의 수신 시에, 역 로그 압신 및 시간 주파수 또는 시간 스케일 재구성이 오디오 신호를 제공하기 위해서 수행된다.

Description

변환-도메인 로그-압신을 사용하는 신호 프로세싱을 위한 방법 및 장치{METHOD AND APPARATUS FOR SIGNAL PROCESSING USING TRANSFORM-DOMAIN LOG-COMPANDING}

본 발명은 일반적으로 통신들에 관한 것으로, 보다 상세하게는, 스펙트럼 도메인 로그 압신을 사용하는 신호 압축에 관한 것이다.

본 출원은 미국 출원번호가 제61/100,645호(변리사 명부 번호 082855P1)이고, 발명의 명칭이 "Transform-Domain Log Companding"이며, 출원일이 2008년 9월 26일인 미국 가출원 및 미국 출원번호가 제61/101,070호이고, 발명의 명칭이 "Transform-Domain Log Companding"이며, 출원일이 2008년 9월 29일(변리사 명부 번호 082855P2)인 미국 가출원에 대한 우선권을 주장한다. 상기 출원들 각각은 본 발명의 양수인에게 양도되고, 본 명세서에 참조로서 명시적으로 통합된다.

디지털 기법들에 의한 음성 및 음악과 같은 오디오의 송신은 특히, 장거리 텔레포니(telephony), VoIP(Voice over Internet Protocol)와 같은 패킷-스위칭된 텔레포니 및 셀룰러 텔레포니와 같은 디지털 무선 텔레포니에서, 널리 보급되었다. 이러한 확산은 재구성된 스피치의 인지된 품질을 유지하면서, 송신 채널을 통해 음성 통신을 전송하는데 사용되는 정보의 양을 감소시키는데 관심을 가진다. 예를 들어, 이용가능한 무선 시스템 대역폭의 최적의 사용을 도모하는 것이 바람직할 수 있다. 시스템 대역폭을 효율적으로 사용하기 위한 하나의 방식은 신호 압축 기법들을 사용하는 것이다. 스피치 신호들을 전달하는 무선 시스템들에 대하여, 스피치 압축 (또는 "스피치 코딩") 기법들은 이러한 목적을 위해서 통상적으로 사용된다. 여기에 기재되는 기법들은 건강 관리(healthcare) 및 신체 단련(fitness) 애플리케이션들에 대한 생체의학 신호들과 같은 다른 신호들에 적합할 수 있다.

휴먼 스피치 생성(human speech generation)의 모델과 관련된 파라미터들을 추출함으로써 스피치를 압축하도록 구성되는 디바이스들은 종종 "음성 코더들", "보코더들", "오디오 코더들", "스피치 코더들" 또는 "코덱들"로 지칭된다. 코덱은 일반적으로 인코더 및 디코더를 포함한다. 인코더는 전형적으로 인입 스피치 신호(오디오 정보를 표현하는 디지털 신호)를 "프레임들"로 지칭되는 시간의 세그먼트들로 분할하고, 특정한 관련 파라미터들을 추출하기 위해서 각각의 프레임을 분석하며, 파라미터들을 인코딩된 프레임으로 양자화한다. 인코딩된 프레임들은 송신 채널(즉, 유선 또는 무선 네트워크 접속)을 통해 디코더를 포함하는 수신기로 송신된다. 디코더는 인코딩된 프레임들을 수신 및 프로세싱하고, 파라미터들을 생성하기 위해서 이들을 역양자화하며, 역양자화된 파라미터들을 사용하여 스피치 프레임들을 재생성한다.

전형적인 오디오/스피치 압축 방법들은 높은 품질 레벨을 유지하면서 상당한 압축을 달성하기 위하여 복잡한 심리음향 모델(psychoacoustic model)들에 의존한다. MP3(MPEG-I Audio Layer 3) 및 AAC(Advanced Audio Coding) 방식들과 같은 전형적인 오디오 압축 방법들은 전형적으로, 휴먼 청각 시스템에 대한 정보에 의존하는 심리음향 모델들에 기초한다. 이러한 방식들은 원래의 비압축된(uncompressed) 컨텐츠의 품질 레벨과 근접한 재생 품질 레벨을 유지하면서, 상당한 압축(예를 들어, 대략 원래의 신호의 1/10 비트 레이트들)을 달성할 수 있다. 그러나, 이러한 큰 압축 비들을 달성하지만, 이러한 방법들은 복잡하고, 압축/비압축 회로, 상당한 레이턴시를 소비하는 높은 전력에 대한 비용이 따를 수 있으며, 일반적으로 낮은 전력, 낮은 레이턴시 애플리케이션들/디바이스들에 적절하지 않다. 현대적인 디바이스들에서의 대역폭의 증가로써, 헤비 압축(heavy compression)에 대한 요건은 낮은 복잡도 인코딩/디코딩 방식들과 교환해서 완화될 수 있다.

핸즈-프리 동작을 가지는 무선 헤드셋들은 모바일 텔레포니에서 점점 더 흔해지고 있다. 인체 영역 네트워크들(BAN)의 맥락에서 단-거리 무선 기술들에 대한 트랜드는 보다 낮은 전력 소비를 가지는 보다 높은 데이터 레이트들을 제공하는 것이다. BAN 무선장치(radio)들에 대한 점진적인 트랜드는 오직 수 밀리와트(mW)의 전력 소비를 사용하여 수 메가비트/초의 스루풋을 달성할 수 있는 낮은 전력 무선장치들을 포함한다. 착용가능한 디바이스들에 대한 BAN의 맥락에서, 배터리 수명을 증가시키고, 폼 팩터(form factor)들을 축소시키며, 비용을 저감하는 것이 바람직할 수 있다.

대화 서비스들의 맥락에서, 3G 네트워크들에서의 AMR-WB 및 EVRC-WB와 같은 광대역 코덱들의 배치로써, 음성 품질을 향상시키고 BAN에서의 보다 낮은 전력을 감소시킬 필요성이 존재한다. 유사하게, 오디오 스트리밍 서비스들에 있어서, 사용자 경험이 손상되지 않도록 무선 헤드폰들과의 유선 품질을 보존할 필요성이 존재한다.

따라서, 전술된 결점들 중 하나 이상을 해결하는 것이 바람직할 것이다.

다음의 설명은 하나 이상의 양상들에 대한 기본적인 이해를 제공하기 위해서 이러한 양상들의 간략화된 요약을 제공한다. 이러한 요약은 모든 양상들의 포괄적인 개요는 아니며, 이러한 양상들의 핵심 또는 중요한 엘리먼트들을 식별하거나, 이러한 양상들의 범위를 서술하고자 의도되지도 않는다. 이러한 요약의 목적은 후에 제시되는 보다 상세한 설명에 대한 도입부로서 간략화된 형태로 설명된 하나 이상의 양상들의 일부 개념들을 제공하기 위함이다.

본 발명의 일 양상에서, 인코딩을 위한 방법이 기재된다. 상기 방법은 데이터 신호를 수신하는 단계, 적어도 2개의 계수들을 제공하기 위해서 상기 데이터 신호의 변환을 수행하는 단계, 및 압축된 데이터 신호를 제공하기 위해서 상기 적어도 2개의 계수들의 로그 압신을 수행하는 단계를 포함한다.

본 발명의 다른 양상에서, 디코딩을 위한 방법이 기재된다. 상기 방법은 압축된 데이터 신호를 수신하는 단계, 적어도 2개의 계수들을 획득하기 위해서 상기 압축된 데이터 신호의 역 로그 압신에 의해 확장(expansion)을 수행하는 단계 및 데이터 신호를 제공하기 위해서 상기 적어도 2개의 계수들 상에서 역 변환을 수행하는 단계를 포함한다.

본 발명의 다른 양상에서, 인코딩을 위한 장치가 기재된다. 상기 장치는 데이터 신호를 수신하도록 구성되는 수신기, 적어도 2개의 계수들을 제공하기 위해서 상기 데이터 신호를 분해하도록 구성되는 변환 회로 및 압축된 데이터 신호를 제공하기 위해서 상기 적어도 2개의 계수들을 인코딩하도록 구성되는 로그 압신 회로를 포함한다.

본 발명의 추가적인 양상에서, 디코딩을 위한 장치가 기재된다. 상기 장치는 압축된 데이터 신호를 수신하도록 구성되는 수신기, 적어도 2개의 계수들을 획득하기 위해서 상기 압축된 데이터 신호를 디코딩하도록 구성되는 역 로그 압신 회로 및 상기 적어도 2개의 계수들로부터 데이터 신호를 재구성하도록 구성되는 역 변환 회로를 포함한다.

본 발명의 추가적인 양상에서, 인코딩을 위한 장치가 기재된다. 상기 장치는 데이터 신호를 수신하기 위한 수단, 적어도 2개의 계수들을 제공하기 위해서 상기 데이터 신호의 변환을 수행하기 위한 수단 및 압축된 데이터 신호를 제공하기 위해서 상기 적어도 2개의 계수들의 로그 압신을 수행하기 위한 수단을 포함한다.

본 발명의 추가적인 양상에서, 디코딩을 위한 장치가 기재된다. 상기 장치는 압축된 데이터 신호를 수신하기 위한 수단, 적어도 2개의 계수들을 획득하기 위해서 상기 압축된 데이터 신호를 디코딩함으로써 역 로그 압신을 수행하기 위한 수단 및 데이터 신호를 제공하기 위해서 상기 적어도 2개의 계수들 상에서 역 변환을 수행하기 위한 수단을 포함한다.

본 발명의 추가적인 양상에서, 인코딩을 위한 컴퓨터 프로그램 물건이 기재된다. 상기 컴퓨터 프로그램 물건은 데이터 신호를 수신하고, 적어도 2개의 계수들을 제공하기 위해서 상기 데이터 신호의 변환을 수행하며, 압축된 데이터 신호를 제공하기 위해서 상기 적어도 2개의 계수들의 로그 압신을 수행하기 위해서 실행가능한 명령들을 포함하는 컴퓨터-판독가능 매체를 포함한다.

본 발명의 추가적인 양상에서, 디코딩을 위한 컴퓨터 프로그램 물건이 기재된다. 상기 컴퓨터 프로그램 물건은 압축된 데이터 신호를 수신하고, 적어도 2개의 계수들을 획득하기 위해서 상기 압축된 데이터 신호를 디코딩함으로써 역 로그 압신을 수행하며, 데이터 신호를 제공하기 위해서 상기 적어도 2개의 계수들 상에서 역 변환을 수행하기 위해서 실행가능한 명령들을 포함하는 컴퓨터-판독가능 매체를 포함한다.

본 발명의 추가적인 양상에서, 헤드셋이 기재된다. 상기 헤드셋은 압축된 데이터 신호를 수신하도록 구성되는 수신기, 적어도 2개의 계수들을 획득하기 위해서 상기 압축된 데이터 신호를 디코딩하도록 구성되는 역 로그 압신 회로, 상기 적어도 2개의 계수들로부터 데이터 신호를 재구성하도록 구성되는 역 변환 회로 및 상기 재구성된 데이터 신호에 기초하여 오디오 출력을 제공하도록 구성되는 트랜스듀서를 포함한다.

본 발명의 추가적인 양상에서, 센싱 디바이스가 기재된다. 상기 센싱 디바이스는 데이터 신호를 검출하도록 구성되는 센서, 적어도 2개의 계수들을 제공하기 위해서 상기 데이터 신호를 분해하도록 구성되는 변환 회로, 압축된 데이터 신호를 제공하기 위해서 상기 적어도 2개의 계수들을 인코딩하도록 구성되는 로그 압신 회로 및 상기 압축된 데이터 신호를 송신하도록 구성되는 송신기를 포함한다.

본 발명의 추가적인 양상에서, 헤드셋이 기재된다. 상기 헤드셋은 오디오 신호를 검출하도록 구성되는 트랜스듀서, 적어도 2개의 계수들을 제공하기 위해서 상기 오디오 신호를 분해하도록 구성되는 변환 회로, 압축된 오디오 신호를 제공하기 위해서 상기 적어도 2개의 계수들을 인코딩하도록 구성되는 로그 압신 회로 및 상기 압축된 오디오 신호를 송신하도록 구성되는 안테나를 포함한다. 본 발명의 추가적인 양상에서, 시계가 기재된다. 상기 시계는 압축된 데이터 신호를 수신하도록 구성되는 수신기, 적어도 2개의 계수들을 획득하기 위해서 상기 압축된 데이터 신호를 디코딩하도록 구성되는 역 로그 압신 회로, 상기 적어도 2개의 계수들로부터 데이터 신호를 재구성하도록 구성되는 역 변환 회로 및 상기 재구성된 데이터 신호에 기초하여 표시를 제공하도록 구성되는 사용자 인터페이스를 포함한다.

상술한 목적 및 관련된 목적을 달성하기 위해서, 하나 이상의 양상들은 이하에서 완전히 설명되고, 특히 청구항들에서 특정되는 특징들을 포함한다. 다음의 설명 및 관련 도면들은 하나 이상의 양상들의 특정한 예시적인 특징들을 상세하게 설명한다. 그러나, 이러한 특징들은 다양한 양상들의 원리들이 사용될 수 있는 몇 가지 다양한 방식들을 나타내지만, 이러한 설명은 이러한 모든 양상들 및 그 균등물들을 포함하는 것으로 의도된다.

기재된 양상들은 이후 첨부되는 도면들과 함께 설명될 것이고, 기재된 양상들을 예시하지만 제한하지 않는 것으로 제공될 것이며, 여기서 유사한 지정들은 유사한 엘리먼트들을 나타낸다.

도 1은 무선 네트워크의 예를 예시하는 다이어그램이다.
도 2는 여기에서 기재되는 다양한 양상들에 따라 구성되는 신호 압축 시스템을 예시하는 블록 다이어그램이다.
도 3A-3C는 본 발명의 다양한 양상들에 따른 제 1, 제 2 및 제 6 이산 코사인 변환(Discret Cosine Transform : DCT) 계수들의 예시적인 확률 분포들의 도면들이다.
도 4A 및 4B는 본 발명의 양상들에 따라 수행되는 인코딩/디코딩 기능들을 예시하는 흐름 다이어그램들이다.
도 5는 본 발명의 양상들에 따라, 무선 네트워크에서의 스피치/오디오 신호 프로세싱을 용이하게 하기 위한 시스템을 예시하는 블록 다이어그램이다.
도 6은 본 발명의 양상들에 따라, 향상된 무선 오디오/스피치 디코딩을 용이하게 하기 위한 수신기를 예시하는 블록 다이어그램이다.
도 7은 본 발명의 양상들에 따라 스피치/오디오 신호 압축을 용이하게 하기 위한 송신기를 예시하는 블록 다이어그램이다.
도 8은 본 발명의 양상들에 따라 구성되는 인코딩 장치를 예시하는 블록 다이어그램이다.
도 9는 본 발명의 양상들에 따라 구성되는 디코딩 장치를 예시하는 블록 다이어그램이다.

다양한 양상들이 첨부되는 도면들을 참조하여 이후에서 보다 완전히 설명된다. 그러나, 여기에서 기재되는 양상들은 많은 상이한 형태들로 구현될 수 있고, 본 명세서 전반에 걸쳐 제시되는 임의의 특정 구조 또는 기능으로 제한되는 것으로 이해되어서는 안된다. 오히려, 이러한 양상들은 본 발명이 완전하고 완벽하며, 당업자에게 본 발명의 범위를 완전히 전달할 수 있도록 제공된다. 여기에서의 교시내용들에 기초하여, 당업자는 본 발명의 범위가 임의의 다른 양상과 결합하여 구현되든 또는 독립적으로 구현되든, 여기에서 기재되는 임의의 양상을 커버하는 것으로 의도된다는 것을 이해하여야 한다. 예를 들어, 여기에서 설명되는 임의의 수의 양상들을 사용하여 장치가 구현될 수 있거나 방법이 실시될 수 있다. 또한, 본 발명의 범위는 여기에서 설명되는 다양한 양상들에 추가하여, 또는 여기에서 설명되는 다양한 양상들 외에 다른 구조, 기능, 또는 구조 및 기능을 사용하여 실시되는 이러한 장치 또는 방법을 커버하는 것으로 의도된다. 여기에서 기재되는 임의의 양상은 청구항의 하나 이상의 엘리먼트들에 의해 구현될 수 있다는 것이 이해되어야 한다.

압축 효율에 비해 낮은 전력이 중요한 새로운 등급(class)의 높은 품질 스피치 및 오디오 해결책들에 대한 필요성이 존재한다.

본 명세서 전반에 걸쳐 제시되는 하나 이상의 양상들을 지원하는데 적합한 단거리 통신 네트워크의 예는 도 1에서 예시된다. 네트워크(100)는 임의의 적합한 무선 기술 또는 무선 프로토콜을 사용하여 통신하는 다양한 무선 노드들을 포함하는 것으로 도시된다. 예로서, 무선 노드들은 초-광대역(UWB) 기술을 지원하도록 구성될 수 있다. 대안적으로, 무선 노드들은 몇 개만 예를 들자면, 블루투스 또는 IEEE 802.11과 같은 다양한 무선 프로토콜들을 지원하도록 구성될 수 있다.

네트워크(100)는 다른 무선 노드들과의 통신에서 컴퓨터(102)를 포함하는 것으로 도시된다. 이러한 예에서, 컴퓨터(102)는 디지털 카메라(104)로부터 디지털 사진들을 수신하고, 프린트하기 위한 프린트기(106)로 문서들을 전송하며, 개인용 디지털 보조기(PDA)(108) 상에서 e-메일을 싱크-업(synch-up)하고, 디지털 오디오 재생기(예를 들어, MP3 재생기)(110)로 음악 파일들을 전송하며, 모바일 저장 디바이스(112)로 데이터 및 파일들을 백업하고, 무선 허브(114)를 통해 원격 네트워크(예를 들어, 인터넷)와 통신할 수 있다. 또한, 네트워크(100)는 인체에 착용가능하거나 이식(implant)된 다수의 모바일 및 컴팩트 노드들을 포함할 수도 있다. 예로서, 사람은 컴퓨터(102)로부터 스트리밍된 오디오를 수신하는 헤드셋(116)(예를 들어, 헤드폰들, 이어폰, 등), 컴퓨터(102)에 의해 세팅되는 시계(118) 및/또는 필수적인 신체 파라미터들(예를 들어, 생체인식 센서, 심박계, 보수계(pedometer) 및 EKG 디바이스 등)을 모니터링하는 센서(120)를 착용하고 있을 수 있다.

단거리 통신들을 지원하는 네트워크로서 도시되지만, 본 발명의 전반에 걸쳐 제시되는 양상들은 몇 가지 예를 들자면, 예로서, EV-DO(Evolution-Data Optimized), UMB(Ultra Mobile Broadband), CDMA(Code Division Multiple Access) 2000, LTE(Long Term Evolution) 또는 W-CDMA(Wideband CDMA)를 포함하는 임의의 적합한 무선 프로토콜을 지원하는 광역 네트워크에서의 통신들을 지원하도록 구성될 수도 있다. 대안적으로, 무선 노드는 케이블 모뎀, 디지털 가입자 회선(DSL), 광섬유들, 이더넷, 홈RF 또는 임의의 다른 적합한 유선 액세스 프로토콜을 사용하여 유선 통신들을 지원하도록 구성될 수 있다.

일부 양상들에서, 무선 디바이스는 임펄스-기반 무선 통신 링크를 통해 통신할 수 있다. 예를 들어, 임펄스-기반 무선 통신 링크는 상대적으로 짧은 길이(예를 들어, 수 나노초들 또는 그 미만 정도) 및 상대적으로 넓은 대역을 가지는 초-광대역 펄스들을 이용할 수 있다. 일부 양상들에서, 초-광대역 펄스들은 대략 20% 또는 그 이상 정도의 부분 대역폭(fractional bandwidth)을 가지고 그리고/또는 대략 500MHz 또는 그 이상 정도의 대역폭을 가질 수 있다.

여기에서의 교시내용들은 다양한 장치들(예를 들어, 디바이스들)에 포함될 수 있다(예를 들어, 이들 내에서 구현되거나 또는 이들에 의해 수행될 수 있음). 예를 들어, 여기에서 교시되는 하나 이상의 양상들은 폰(예를 들어, 셀룰러 폰), 개인용 데이터 보조기("PDA"), 엔터테인먼트 디바이스(예를 들어, 음악 또는 비디오 디바이스), 헤드셋(예를 들어, 헤드폰들, 이어폰 등), 마이크로폰, 의료 센싱 디바이스(예를 들어, 생체인식 센서, 심박계, 보수계, EKG 디바이스, 스마트 밴드(smart bandage) 등), 사용자 I/O 디바이스(예를 들어, 시계, 원격 제어, 광 스위치, 키보드, 마우스 등), 환경 센싱 디바이스(예를 들어, 타이어 공기압 모니터), 의료 또는 환경 센싱 디바이스로부터 데이터를 수신할 수 있는 모니터, 컴퓨터, 판매-점 디바이스(point-of-sale device), 엔터테인먼트 디바이스, 보청기, 셋-톱 박스 또는 임의의 다른 적합한 디바이스에 포함될 수 있다.

이러한 디바이스들은 상이한 전력 및 데이터 요건들을 가질 수 있다. 일부 양상들에서, 여기에서의 교시내용들은 (예를 들어, 임펄스-기반 시그널링 방식 및 낮은 듀티 사이클 모드들의 사용을 통해) 낮은 전력 애플리케이션들에서의 사용에 적응될 수 있고, (예를 들어, 높은-대역폭 펄스들의 사용을 통해) 상대적으로 높은 데이터 레이트들을 포함하는 다양한 데이터 레이트들을 지원할 수 있다.

다양한 양상들 또는 특징들은 다수의 디바이스들, 컴포넌트들, 모듈들 등을 포함할 수 있는 시스템들에 관하여 제시될 것이다. 다양한 시스템들은 추가적인 디바이스들, 컴포넌트들, 모듈들 등을 포함할 수 있고 그리고/또는 도면들과 관련하여 논의되는 디바이스들, 컴포넌트들, 모듈들 등 모두를 포함하지 않을 수 있다는 것이 이해되어야 한다. 또한, 이러한 방식들의 결합이 사용될 수도 있다. 당업자가 용이하게 이해할 것과 같이, 여기에서 기재되는 양상들은 변환-도메인 로그-압신을 사용하여 신호 압축을 현재 구현하는 임의의 다른 장치, 시스템, 방법, 프로세스, 디바이스 또는 물건으로 확장될 수 있다.

여기에서 기재되는 양상들은 사람의 귀가 시간-도메인에서 드롭-아웃(drop-out)들을 은닉(concealment)하는 것보다 주파수 도메인에서 드롭-아웃들을 은닉하는 것에 덜 민감하다는 사실을 이용한다. 따라서, 여기에서 기재되는 양상들은 특히, 오디오, 초-광대역 스피치, 광대역 스피치 및 협대역 스피치를 포함하는 신호들의 넓은 범위에 동등하게 잘 적용된다.

본 발명의 양상들은 스펙트럼 도메인 로그-압신(압축 및 확장)을 이용하고 광대역 스피치 및 오디오에 대한 투명한 품질(transparent quality)을 달성하는 오디오/스피치 압축에 대한 채널 에러 해결을 위한 낮은-복잡도, 낮은-레이턴시 및 강건함(robust)을 제공한다. 여기에서 기재되는 양상들은 전형적인 디코더들보다 적은 전력 및 영역을 요구하는 시프트-및-덧셈(shift-and-add)들과 같은 하드웨어 친화적인 연산들로써 구현될 수 있다.

여기에서 기재되는 양상들은 신호들의 스펙트럼 도메인 표현들 상에 로그 압신을 적용시킴으로써 신호 압축에 접근한다. 본 발명의 양상들은 신호의 주파수 도메인 표현을 먼저 컴퓨팅함으로써 이러한 개념들을 결합한다. 변환들은 일부 심리음향 마스킹의 애플리케이션을 허용하는 방식으로 원래의 데이터를 표현하는 목적으로 하나의 기반(basis)으로부터 다른 하나로 데이터를 투영(project)한다. 전형적으로, 이것은 예를 들어, MP3 인코더의 경우에서와 같이, 변환들의 사용을 통해 특정 주파수 대역들(여기에서 "빈들"로 상호가능하게 지칭됨)로 신호를 분리시킴으로써 행해진다.

오디오/스피치 신호들의 스펙트럼 도메인 표현들을 컴퓨팅할 시에, 본 발명의 양상들은 각각의 스펙트럼 계수 상에서 상이한 압축 비들로써 로그 압신을 수행한다. 매우 작은 오디오/스피치 에너지가 상위 주파수 대역들에 상주하므로, 이러한 대역들에서의 극소수의 비트들의 할당은 좋은 품질을 유지할 수 있다. 따라서, 샘플당 비트들의 결과적인 평균 개수는 감소할 수 있고, 오디오/스피치 품질에 따라 스케일가능(scalable)하다. 또한, 신호가 스펙트럼 도메인에서 인코딩되므로, 버스트 채널 에러(bursty channel error)들이 존재하는 경우, 그들은 시간상에서의 단순한 드롭아웃들보다는 시간-주파수 평면에서 주파수 대역들에 영향을 미친다. 이러한 에러들은 사람의 귀에 훨씬 덜 불쾌할 수 있고, 단순한 스펙트럼 도메인 보간을 받을 시에, 효율적으로 은닉될 수 있다.

본 발명은 시간-주파수 도메인에 추가하여, 시간-스케일 도메인에서 변환을 수행함으로써 구현될 수 있다는 것이 인식될 것이다. 이러한 시간-스케일 변환의 예는 웨이블렛(wavelet)이다.

이제, 도 2를 참조하면, 여기에서 기재되는 다양한 양상들에 따라 구성되는 신호 압축 시스템(200)이 도시된다. 시스템(200)은 인코더(210) 및 디코더(220)를 포함한다. 인코더(210)는 시간-대-주파수 분해 블록(212), 복수의 압신기(214) 및 패킷화기(packetizer)(216)를 포함한다. 디코더(220)는 패킷화 해제기(unpacketizer)(222), 복수의 역 압신기들(224) 및 역 변환 블록(226)을 포함한다.

일 양상에 따르면, 시간-대-주파수 분해 블록(212)은 각각이 스펙트럼 DCT 계수를 가지는 다수의 주파수 대역들로 입력 신호 s(n)를 역상관(decorrelate)하기 위해서 이산 코사인 변환(DCT) 알고리즘을 사용한다. DCT 알고리즘은 다수의 주파수 대역들 또는 빈들로 신호를 역상관한다. 예를 들어, 포인트 개수가 변경될 수 있지만, 8-포인트 DCT 변환이 수행될 수 있다. 각각의 스펙트럼 계수의 통계적 분포는 사실상 보다 높은 진폭 계수들에 비해, 보다 낮은 진폭 계수들에 대한 훨씬 더 높은 확률을 가지는 라플라시안(Laplacian)이라는 점에 유의하여야 한다. 또한, 상위 스펙트럼 DCT 계수들에 대하여, 계수들의 변동(variance)들이 상당히 감소한다는 점에 유의하여야 한다. 제 1, 제 2 및 제 6 DCT 계수들의 예시적인 확률 분포들은 도 3A-3C에 각각 도시된다. 도 3A-3C에서의 예시적인 분포들로부터 보여질 수 있는 바와 같이, 더 적은 비트들이 보다 높은 DCT 계수들에 대하여 할당될 수 있다. 또한, DCT 알고리즘을 참조하여 양상들이 설명되지만, 다수의 주파수 대역들로 신호를 역상관하는 임의의 변환이 유사한 결과들을 달성하는데 사용될 수 있다는 점에 유의하여야 한다.

본 발명의 일 양상에 따르면, DCT의 사용은 균등하게 분배되는 주파수 대역들로 신호의 에너지를 분류하기 위해서 비교될 수 있다. 예를 들어, 32/48 kHz에서 샘플링되는 데이터에 대하여, 8-포인트 DCT로부터의 계수들은 연속적인 2/3 kHz 주파수 대역들에서의 에너지의 양을 대략 16/24 kHz로 표현할 수 있다. 사람의 청각은 16 kHz 이상의 주파수들에서 덜 민감해진다는 것이 심리음향 모델링으로부터 알려져 있다.

μ-law/A-law 알고리즘과 같은 로그 압신은 라플라시안/지수 분포를 가지는 신호들에 대한 효율적인 압축 툴(too)이고, 넓은 동적 범위를 가짐에도 불구하고, 라플라시안 분포와 유사한 분포를 가지는 스피치와 같은 신호들에 대하여 양호하게 작동(work)한다. 로그 압신에서, 보다 개략적인 양자화(coarser quantization)는 보다 큰 샘플 값들에 대하여 사용되고, 점진적으로 보다 미세한 양자화(finer quantization)는 보다 작은 샘플 값들에 대하여 사용된다. 이러한 특성은 훨씬 더 낮은 비트레이트들로(예를 들어, 샘플당 8 비트들로) 스피치의 이해가능한(intelligible) 송신을 허용하는 텔레포니 압축 알고리즘들 예를 들어, G.711 사양들에서 성공적으로 이용되어 왔다. G.711 로그 압신(압축 및 확장) 사양들은 ITU-T(International Telecommunication Union) Recommendation G.711 (1988년 11월) -- Pulse code modulation (PCM) of voice frequencies 에서 그리고 G711.C, G.711 ENCODING/DECODING FUNCTIONS에서 설명되고, 이들의 전체 내용에서 여기에 포함된다.

2개의 G.711 로그 압신 방식들: μ-law 압신 방식 및 A-law 압신 방식이 존재한다. μ-law 압신 방식 및 A-law 압신 방식은 펄스 코드 변조(PCM) 방법들이다. 즉, 아날로그 신호가 샘플링되고, 각각의 샘플링된 신호의 진폭이 양자화되며, 즉, 디지털 값이 할당된다. μ-law 및 A-law 압신 방식들 모두는 샘플링된 신호의 로그 곡선의 선형 근사치에 의해 샘플링된 신호를 양자화한다.

μ-law 및 A-law 압신 방식들 모두는 로그 곡선 상에서 동작한다. 따라서, 로그 곡선은 세그먼트들로 분배되고, 여기서 각각의 연속적인 세그먼트는 이전 세그먼트의 길이의 2배이다. A-law 및 μ-law 압신 방식들은 상이한 세그먼트 길이들을 가지는데, 그 이유는 μ-law 및 A-law 압신 방식들은 선형 근사치를 상이하게 계산하기 때문이다. 양상들이 G.711 사양들을 사용하는 로그 압신을 참조하여 설명되지만 낮은 비트레이트들로의 스피치의 이해가능한 송신을 허용하는 임의의 로그 압신 사양이 유사한 목적들을 달성하는데 사용될 수 있다는 점에 유의하여야 한다.

도 2를 다시 참조하면, 일 양상에 따라, -1 및 1 사이의 값들 상에서 동작하는 로그 압신은 각각이 μ상수(μ₁ 내지 μ_n)와 같은 상이한 압신 파라미터를 사용하는 복수의 로그 압신기들(214) 에 의해 DCT 계수들 상에 적용된다. 로그 압신은 0 부근에서 보다 많은 양자화 단계들을 효과적으로 할당하고, 샘플 값들이 증가함에 따라 더 적게 할당한다. (도 3A-3C로부터 알 수 있는 바와 같이) 스피치/오디오 신호들이 상위 주파수 대역들에서 보다 샤프(sharp)함에 따라, 보다 적은 비트들이 양호한 품질을 유지하면서 상기 대역들에서 할당될 수 있다. 예를 들어, 제 1, 제 2 및 제 3 계수들은 복수의 로그 압신기(214)에 대하여 보정 데이터 범위를 보장하는 4, 2 및 2의 인자만큼 각각 축소(scale down)될 수 있다. 일 양상에 따라, 1 이상의 크기를 가지는 DCT 계수 값들 상에서의 클리핑(clipping)이 수행된다.

상기 변화에 따라, 디코더(220)는 신호를 압축하도록 수행되는 압신 및 DCT 변환을 반전(reverse)시킨다. 수신된 신호가 패킷화 해제기(222)에 의해 패킷화 해제(unpacketize)된 이후, 첫 번째 3개의 계수들은 4, 2 및 2에 의해 각각 확대(scale up)되고, 역 로그 압신은 역 압신기들(224)에서 수행된다. 역 DCT 변환은 재구성된 시간-주파수 신호를 획득하기 위해서 역 변환 블록(226)에서 수행된다.

이제, 도 4A 및 4B를 참조하면, 여기에서 기재되는 양상들에 따라 수행되는 기능들의 흐름 다이어그램들이 도시된다. 인코더에서 수행되는 기능들의 예들이 도 4A의 인코딩 프로세스(400A)에 도시된다. 단계(410)에서 데이터 신호를 수신하면, 변환은 신호의 시간-주파수 분해를 달성하기 위해서 단계(420)에서 수행된다. μ 상수들과 같은 상이한 압신 파라미터들을 가지는 로그 압신은 단계(430)에서 수행되고, 압축된 데이터 신호는 단계(440)에서 출력된다.

디코더에서 수행되는 기능들의 예들은 도 4B의 디코딩 프로세스(400B)에 도시된다. 단계(450)에서 압축된 데이터 신호를 수신하면, 역 로그 압신이 단계(460)에서 수행된다. 역 변환은 단계(470)에서 수행되고, 데이터 신호는 단계(480)에서 출력된다.

도 5를 참조하면, 다양한 양상들에 따른, 무선 네트워크에서 스피치/오디오 신호 프로세싱을 용이하게 하는 시스템(500)이 예시된다.

시스템(500)은 예를 들어, 인코더(510) 및 디코더(540)를 포함할 수 있다. 인코더(510)는 예를 들어, 기지국 내에서 적어도 부분적으로 상주할 수 있다. 시스템(500)은 프로세서, 소프트웨어 또는 이들의 조합(예를 들어, 펌웨어)에 의해 구현되는 기능들을 표현하는 기능적 블록들일 수 있는 기능적 블록들을 포함하는 것으로 표현되는 것이 이해되어야 한다. 인코더(510)는 함께 동작할 수 있는 전기적 컴포넌트들(520, 530)의 논리적 그룹을 포함한다. 또한, 디코더(540)는 함께 동작할 수 있는 전기적 컴포넌트들(550, 560)의 논리적 그룹을 포함한다.

예를 들어, 논리적 그룹(520, 530)은 수신된 스피치/오디오 신호 상에서 변환을 수행하기 위한 수단(520)을 포함할 수 있고, 이는 다수의 주파수 대역들로 스피치 오디오 신호의 시간-주파수 분해를 수행하도록 기능한다. 추가적으로, 논리적 그룹(520, 530)은 로그 압신을 수행하기 위한 수단(530)을 포함할 수 있고, 이는 각각의 주파수 대역에 대하여 각각의 스펙트럼 계수 상에서 상이한 압축 비들을 적용시킴으로써 신호를 압축하도록 기능한다. 추가적으로, 논리적 그룹(520, 530)은 전기적 컴포넌트들(520, 530)과 연관되는 기능들을 실행하기 위한 명령들을 유지하는 메모리(미도시)를 포함할 수 있다.

추가적으로, 논리적 그룹(550, 560)은 역 압축 비들을 적용시킴으로써 신호를 디코딩하도록 기능하는 역 로그 압신을 수행하기 위한 수단(550) 및 신호의 시간-주파수 분해를 역으로 수행(inverse)하도록 시간-주파수 재구성 회로로서 기능하는 역 변환(560)을 위한 수단(560)을 포함할 수 있다.

도 6은 향상된 무선 오디오/스피치 디코딩을 용이하게 하는 수신기(500)의 도면이다. 수신기(500)는 예를 들어, 수신 안테나(미도시)로부터 신호를 수신하고, 수신된 신호에 대하여 전형적인 동작들(예를 들어, 필터링, 증폭, 하향변환 등)을 수행하며, 샘플들을 획득하기 위해서 조정(condition)된 신호를 디지털화한다. 수신기(602)는 수신된 심볼들을 복조하고, 이들을 채널 추정들을 위한 프로세서(606)로 제공할 수 있는 복조기(604)를 포함할 수 있다. 프로세서(606)는 수신기(600)에 의해 수신되는 정보를 분석하는데 전용하는 프로세서, 수신기(600)의 하나 이상의 컴포넌트들을 제어하는 프로세서, 및/또는 수신기(600)에 의해 수신되는 정보를 분석하고 수신기(600)의 하나 이상의 컴포넌트들을 제어하는 프로세서일 수 있다.

수신기(600)는 프로세서(606)에 동작적으로 커플링되고, 송신될 데이터, 수신된 데이터, 이용가능한 채널들과 관련된 정보, 분석된 신호 및/또는 간섭 강도와 연관되는 데이터, 할당된 채널, 전력, 레이트 등과 관련된 정보, 및 채널을 추정하고 채널을 통해 통신하기 위한 임의의 다른 적합한 정보를 저장할 수 있는 메모리(608)를 추가적으로 포함할 수 있다. 메모리(608)는 (예를 들어, 성능 기반, 용량 기반 등의) 채널을 추정하고 그리고/또는 이용하는 것과 연관되는 알고리즘들 및/또는 프로토콜들을 추가적으로 저장할 수 있다. 추가적으로, 메모리(608)는 실행가능한 코드 및/또는 명령들을 저장할 수 있다. 예를 들어, 메모리(608)는 수신된 스피치/오디오 신호를 역압축(decompress)하기 위한 명령들을 저장할 수 있다. 추가적으로, 메모리(608)는 역 인코딩 비들을 적용시킴으로써 신호를 디코딩하도록 역 로그 압신을 수행하기 위한, 그리고 신호의 시간-주파수 분해를 역으로 수행하도록 역 변환을 수행하기 위한 명령들을 저장할 수 있다.

여기에서 설명되는 데이터 저장소(예를 들어, 메모리(608)는 휘발성 메모리 또는 비휘발성 메모리일 수 있거나, 또는 휘발성 및 비휘발성 메모리 모두를 포함할 수 있다는 것이 이해될 것이다. 제한이 아닌 예시로서, 비휘발성 메모리는 판독 전용 메모리(ROM), 프로그램가능한 ROM(PROM), 전기적 프로그램가능한 ROM(EPROM), 전기적 삭제가능한 PROM(EEPROM) 또는 플래시 메모리를 포함할 수 있다. 휘발성 메모리는 외부의 캐시 메모리로서 동작하는 랜덤 액세스 메모리(RAM)를 포함할 수 있다. 제한이 아닌 예시로서, RAM은 동기식 RAM(SRAM), 동적 RAM(DRAM), 동기식 DRAM(SDRAM), 2배속 SDRAM(DDR SDRAM), 강화된 SDRAM(ESDRAM), 싱크링크 DRAM(SLDRAM), 및 다이렉트 램버스 RAM(DRRAM)과 같은 많은 형태들로 이용가능하다. 주요 시스템들 및 방법들의 메모리(608)는 이러한 그리고 임의의 다른 적합한 타입들의 메모리를 포함하지만, 이들로 제한되지 않는 것으로 의도된다.

프로세서(606)는 추가적으로, 역 로그 압신 블록(612)이 역 압축 비들을 적용시킴으로써 신호를 디코딩하도록 역 로그 압신을 수행할 수 있는 디코더(610)에 동작적으로 커플링되고, 역 변환 블록(618)(예를 들어, 시간-주파수 재구성 회로)은 신호의 시간-주파수 분해를 역으로 수행하도록 역 변환을 수행할 수 있다. 역 로그 압신 블록(612) 및/또는 역 변환 블록(618)은 시간-주파수 재구성된 신호를 획득하기 위해서 도 2-5를 참조하여 전술된 바와 같은 양상들을 포함할 수 있다. 프로세서(606)로부터 분리된 것으로 도시되지만, 역 로그 압신 블록(612) 및/또는 역 변환 블록(618)은 프로세서(606)의 일부 또는 다수의 프로세서들(미도시)일 수 있다. 출력 블록(620)은 프로세서(606)로부터의 출력을 제공한다.

도 7은 여기에서 기재되는 양상들에 따라, 스피치/오디오 신호 압축을 용이하게 하는 예시적인 송신기 시스템(700)의 도면이다. 시스템(700)은 복수의 송신 안테나들(미도시)을 통해 하나 이상의 모바일 디바이스들(미도시)로 송신하는 송신기(724)를 포함한다. 송신기로의 입력은 도 6에 대하여 전술된 프로세서와 유사할 수 있는 프로세서(714)에 의해 분석될 수 있고, 이는 모바일 디바이스(들)(미도시) 또는 개별 기지국(미도시)로 송신될 또는 모바일 디바이스(들) 또는 개별 기지국(미도시)로부터 수신될 데이터와 관련된 정보 및/또는 여기에서 설명되는 다양한 동작들 및 기능들을 수행하는 것과 관련된 임의의 다른 적합한 정보를 저장하는 메모리(716)에 커플링된다.

프로세서(714)는 변환 블록(720)이 수신된 스피치/오디오 신호의 시간 주파수 분해를 수행할 수 있고, 로그 압신 블록(722)이 각각의 주파수 대역에 대하여 각각의 스펙트럼 계수 상에 상이한 압축 비를 적용시킴으로써 신호를 인코딩하도록 로그 압신을 수행할 수 있는 인코더(718)에 추가적으로 커플링된다. 변환 블록(720) 및/또는 로그 압신 블록(722)은 도 2-5를 참조하여 전술된 바와 같은 양상들을 포함할 수 있다. 송신될 정보는 변조기(726)로 제공될 수 있다. 변조기(726)는 송신기(724)에 의한 안테나(미도시)를 통한 모바일 디바이스(들)(미도시)로의 송신을 위한 정보를 멀티플렉싱할 수 있다. 프로세서(714)로부터 분리되는 것으로 도시되지만, 변환 블록(720) 및/또는 로그 압신 블록(722)은 프로세서(714)의 일부 또는 다수의 프로세서들(미도시)일 수 있다는 것이 이해되어야 한다.

도 6을 참조하여 설명되는 수신기 및 도 7을 참조하여 설명되는 송신기 시스템이 단일 디바이스(예를 들어, 모바일 디바이스)에서 결합될 수 있거나 또는 다른 디바이스들(예를 들어, 필수적인 신체상의 기능들을 모니터링하는 이어폰 또는 센서)의 분리된 부분들일 수 있다는 것에 유의하여야 한다.

도 8은 시간-주파수 분해 및 로그 압신을 사용하여 데이터 신호를 인코딩하도록 동작가능한 다양한 모듈들을 가지는 무선 통신 디바이스에 대한 데이터 신호를 인코딩하기 위한 인코딩 장치(800)를 예시한다. 데이터 신호 수신기(802)는 데이터 신호를 수신하기 위해서 사용된다. 시간-주파수 분해기(804)는 적어도 2개의 스펙트럼 계수들을 제공하기 위해서 데이터 신호의 시간-주파수 분해를 수행하도록 구성된다. 로그 압신기(806)는 압축된 데이터 신호를 제공하기 위해서 적어도 2개의 스펙트럼 계수들의 로그 압신을 수행하도록 구성된다.

도 9는 역 로그 압신 및 역 시간-주파수 분해를 사용하여 데이터 신호를 디코딩하도록 동작가능한 다양한 모듈들을 가지는 무선 통신 디바이스에 대한 데이터 신호를 디코딩하기 위한 디코딩 장치(900)를 예시한다. 압축된 신호 수신기(902)는 압축된 신호를 수신하기 위해서 사용된다. 역 로그 압신기(904)는 적어도 2개의 스펙트럼 계수들을 획득하기 위해서 압축된 데이터 신호를 디코딩함으로써 역 로그 압신을 수행하도록 구성된다. 시간-주파수 분해기(906)는 데이터 신호를 제공하기 위해서 적어도 2개의 스펙트럼 계수들 상에서 역 시간-주파수 분해를 수행하도록 구성된다.

여기에서 설명되는 기법들은 CDMA, TDMA, FDMA, OFDMA, SC-FDMA 및 다른 시스템들과 같은 다양한 무선 통신 시스템들에 대하여 사용될 수 있다. 용어들 "시스템" 및 "네트워크"는 종종 상호 교환가능하게 사용된다. CDMA 시스템은 유니버셜 지상 무선 액세스(UTRA), cdma2000 등과 같은 무선 기술을 구현할 수 있다. UTRA는 광대역-CDMA(W-CDMA) 및 CDMA의 다른 변형들을 포함한다. cdma2000은 IS-2000, IS-95 및 IS-856 표준들을 커버한다. TDMA 시스템은 글로벌 모바일 통신 시스템(GSM)과 같은 무선 기술을 구현할 수 있다. OFDMA 시스템은 개선형 UTRA(E-UTRA), 울트라 모바일 광대역(UMB), IEEE 802.11(Wi-Fi), IEEE 802.16(WiMAX), IEEE 802.20, 플래시-OFDM 등과 같은 무선 기술을 구현할 수 있다. UTRA 및 E-UTRA는 유니버셜 모바일 통신 시스템(UMTS)의 일부이다. 3GPP 롱 텀 에벌루션(LTE)은 다운링크 상에서 OFDMA를 사용하고 업링크 상에서 SC-FDMA를 사용하는, E-UTRA를 사용하는 릴리스이다. UTRA, E-UTRA, UMTS, LTE 및 GSM은 "3GPP(3rd Generation Partnership Project)"라고 지칭되는 기구로부터의 문헌들에 기술된다. 추가적으로, cdma2000 및 UMB는 "3GPP2(3rd Generation Partnership Project 2)"라고 지칭되는 기구로부터의 문헌들에 기술된다. 추가적으로, 이러한 무선 통신 시스템들은 비대칭 비승인 스펙트럼(unpaired unlicensed spectrum), 802.xx 무선 LAN, BLUETOOTH 및 임의의 다른 단거리 또는 장거리의 무선 통신 기법들을 종종 사용하는 피어-투-피어(예를 들어, 모바일-투-모바일) 애드 혹 네트워크 시스템들을 추가적으로 포함할 수 있다.

하나 이상의 예시적인 양상들에서, 기재된 기능들은 하드웨어, 소프트웨어, 펌웨어, 또는 이들 임의의 조합을 통해 구현될 수 있다. 소프트웨어로 구현되는 경우, 상기 기능들은 컴퓨터-판독가능 매체 상에 하나 이상의 명령들 또는 코드로서 저장되거나, 또는 이들을 통해 송신될 수 있다. 컴퓨터-판독가능 매체는 컴퓨터 저장 매체, 및 하나의 장소에서 다른 장소로 컴퓨터 프로그램의 이전을 용이하게 하는 임의의 매체를 포함하는 통신 매체 모두를 포함한다. 저장 매체는 컴퓨터에 의해 액세스될 수 있는 임의의 이용가능한 매체일 수 있다. 제한이 아닌 예시로서, 이러한 컴퓨터-판독가능 매체는 RAM, ROM, EEPROM, CD-ROM 또는 다른 광학 디스크 저장 매체, 자기 디스크 저장 매체 또는 다른 자기 저장 디바이스들, 또는 희망하는 프로그램 코드를 명령들 또는 데이터 구조들의 형태로 전달 또는 저장하기 위해서 사용될 수 있고, 컴퓨터에 의해 액세스될 수 있는 임의의 다른 매체를 포함할 수 있다. 또한, 임의의 접속 수단은 컴퓨터-판독가능 매체로 지칭된다. 예를 들어, 소프트웨어가 웹사이트, 서버, 또는 다른 원격 소스로부터 동축 케이블, 광섬유 케이블, 트위스티드 페어(twisted pair), 디지털 가입자 회선(DSL), 또는 적외선, 라디오, 및 마이크로웨이브와 같은 무선 기술들을 통해 송신되는 경우, 이러한 동축 케이블, 광섬유 케이블, 트위스티드 페어, DSL, 또는 적외선, 라디오, 및 마이크로웨이브와 같은 무선 기술들이 이러한 매체의 정의 내에 포함된다. 여기서 사용되는 disk 및 disc은 컴팩트 disc(CD), 레이저 disc, 광 disc, 디지털 다목적 디스크(DVD), 플로피 disk, 및 블루-레이 disc를 포함하며, 여기서 disk들은 통상적으로 데이터를 자기적으로 재생하지만, disc들은 통상적으로 레이저들을 통해 광학적으로 데이터를 재생한다. 또한, 상기 조합들 역시 컴퓨터-판독가능 매체의 범위 내에 포함될 수도 있다.

여기에서 설명되는 컴포넌트들은 다양한 방식들로 구현될 수 있다. 예를 들어, 장치는 예를 들어, 하나 이상의 집적 회로(예를 들어, ASIC) 등에 의해 구현되는 기능들을 표현할 수 있거나 또는 여기에서 교시되는 바와 같은 소정의 다른 방식으로 구현될 수 있는 일련의 상호관련된 기능적 블록들로서 표현될 수 있다. 여기에서 논의되는 바와 같이, 집적 회로는 프로세서, 소프트웨어, 다른 컴포넌트들 또는 이들의 일부 조합들을 포함할 수 있다. 이러한 장치는 다양한 도면들에 대하여 전술된 기능들 중 하나 이상을 수행할 수 있는 하나 이상의 모듈들을 포함할 수 있다.

전술된 바와 같이, 일부 양상들에서, 이러한 컴포넌트들은 적절한 프로세서 컴포넌트들을 통해 구현될 수 있다. 일부 양상들에서 이러한 프로세서 컴포넌트들은 적어도 부분적으로 여기에서 교시되는 바와 같은 구조를 사용하여 구현될 수 있다. 일부 양상들에서, 프로세서는 이러한 컴포넌트들 중 하나 이상의 기능의 일부 또는 전부를 구현하기 위해서 적응될 수 있다.

전술된 바와 같이, 장치는 하나 이상의 집적 회로들을 포함할 수 있다. 예를 들어, 일부 양상들에서, 단일 집적 회로는 예시되는 컴포넌트들 중 하나 이상의 기능을 구현할 수 있지만, 다른 양상들에서는 둘 이상의 집적 회로가 예시되는 컴포넌트들 중 하나 이상의 기능을 구현할 수 있다.

또한, 여기에서 설명되는 컴포넌트들 및 기능들은 임의의 적합한 수단을 사용하여 구현될 수 있다. 또한, 이러한 수단은 적어도 부분적으로 여기에서 교시되는 바와 같은 대응하는 구조를 사용하여 구현될 수 있다. 예를 들어, 전술된 컴포넌트들은 "ASIC"에서 구현될 수 있고, 유사하게 지정되는 "~를 위한 수단" 기능에 대응할 수 있다. 따라서, 일부 양상들에서, 이러한 수단 중 하나 이상은 프로세서 컴포넌트들, 집적 회로들 또는 여기에서 교시되는 바와 같은 다른 적합한 구조 중 하나 이상을 사용하여 구현될 수 있다.

또한, "제 1", "제 2" 등과 같은 지정을 사용하는 여기에서의 엘리먼트에 대한 임의의 지칭은 일반적으로 이러한 엘리먼트들의 양 또는 순서를 제한하지 않는다는 것이 이해되어야 한다. 이러한 지정들은 여기에서 둘 이상의 엘리먼트들 또는 엘리먼트의 인스턴스들을 구별하는 편리한 방법으로서 사용된다. 따라서, 제 1 및 제 2 엘리먼트들에 대한 지칭은 오직 2개의 엘리먼트들이 사용될 수 있다는 것 또는 제 1 엘리먼트가 소정의 방식으로 제 2 엘리먼트에 선행하여야 한다는 것을 의미하지는 않는다. 또한, 별도로 표시되지 않는 한, 엘리먼트들의 세트는 하나 이상의 엘리먼트들을 포함할 수 있다. 또한, 상세한 설명 또는 청구항에서 사용되는 형태 "A, B 또는 C 중 적어도 하나"의 용어는 "A 또는 B 또는 C 또는 이들의 임의의 조합"을 의미한다.

당업자는 정보 및 신호들이 다양한 상이한 기술들 및 기법들 중 임의의 것을 사용하여 표현될 수 있다는 것을 이해할 것이다. 예를 들어, 설명의 전반에 걸쳐 언급될 수 있는 데이터, 명령들, 커맨드들, 정보, 신호들, 비트들, 심볼들, 및 칩들은 전압들, 전류들, 전자기파들, 자기장 또는 입자들, 광 필드들 또는 입자들 또는 이들의 임의의 조합으로 표현될 수 있다.

당업자는 여기에서 기재된 양상들과 관련하여 설명된 다양한 예시적인 논리 블록들, 모듈들, 프로세서들, 수단, 회로들 및 알고리즘 단계들 중 임의의 것이 전자 하드웨어(예를 들어, 소스 코딩 또는 소정의 다른 기법을 사용하여 설계될 수 있는 디지털 구현, 아날로그 구현 또는 이 둘의 조합), (여기에서 편의상 "소프트웨어" 또는 "소프트웨어 모듈"로 지칭될 수 있는) 명령들을 포함하는 다양한 형태들의 프로그램 또는 설계 코드, 또는 이 둘의 조합들로서 구현될 수 있다는 것을 추가적으로 이해할 것이다. 하드웨어 및 소프트웨어의 이러한 상호교환가능성을 명백하게 예시하기 위해서, 다양한 예시적인 컴포넌트들, 블록들, 모듈들, 회로들 및 단계들이 일반적으로 그들의 기능에 관하여 전술되었다. 이러한 기능이 하드웨어로서 구현되는지 또는 이러한 기능이 소프트웨어로서 구현되는지는 전체 시스템 상에 부과되는 특정 애플리케이션 및 설계 제약들에 의존한다. 당업자는 각각의 특정 애플리케이션에 대하여 가지각색의 방식들로 설명된 기능을 구현할 수 있지만, 이러한 구현 결정들은 여기에서 기재되는 양상들의 범위를 벗어나는 것으로 해석되어서는 안된다.

여기에서 기재된 양상들과 관련하여 설명된 다양한 예시적인 논리 블록들, 모듈들, 및 회로들이 집적 회로("IC"), 액세스 단말, 또는 액세스 포인트 내에서 구현되거나 이들에 의해 수행될 수 있다. IC는 범용 프로세서, 디지털 신호 프로세서(DSP), 주문형 집적 회로(ASIC), 필드 프로그램가능한 게이트 어레이(FPGA) 또는 다른 프로그램가능한 로직 디바이스, 이산 게이트 또는 트랜지스터 로직, 이산 하드웨어 컴포넌트들, 전기적 컴포넌트들, 광학 컴포넌트들, 기계적 컴포넌트 또는 여기에서 설명된 기능들을 수행하도록 설계된 이들의 임의의 조합을 포함할 수 있고, IC 내부에, IC 외부에 또는 이 둘에 상주하는 코드들 또는 명령들을 실행할 수 있다. 범용 프로세서는 마이크로프로세서일 수 있지만, 대안적으로, 이러한 프로세서는 임의의 종래의 프로세서, 제어기, 마이크로제어기, 또는 상태 머신일 수 있다. 프로세서는 예를 들어, DSP 및 마이크로프로세서의 조합, 복수의 마이크로프로세서들, DSP 코어와 결합된 하나 이상의 마이크로프로세서들, 또는 이러한 임의의 다른 구성과 같은 컴퓨팅 디바이스들의 조합으로서 구현될 수도 있다.

임의의 기재된 프로세스들의 단계들의 특정 순서 또는 계층이 샘플 방식의 예라는 것이 이해된다. 설계 선호도들에 기초하여, 프로세스들의 단계들의 특정 순서 또는 계층이 여기에서 기재되는 양상들의 범위를 벗어나지 않고, 재배열될 수 있다는 것이 이해된다. 첨부한 방법 청구항들은 샘플 순서로 다양한 단계들의 엘리먼트들을 제시하는데, 제시된 특정 순서 또는 계층에 제한되는 것을 의미하지는 않는다.

여기에서 기재된 양상들과 관련하여 설명된 알고리즘 또는 방법의 단계들은 하드웨어에서, 프로세서에 의해 실행되는 소프트웨어 모듈에서, 또는 이 둘의 조합에 의해 직접 구현될 수 있다. (예를 들어, 실행가능한 명령들 및 관련 데이터를 포함하는) 소프트웨어 모듈 및 다른 데이터는 RAM 메모리, 플래시 메모리, ROM 메모리, EPROM 메모리, EEPROM 메모리, 레지스터들, 하드디스크, 휴대용 디스크, CD-ROM, 또는 공지된 컴퓨터-판독가능 저장 매체의 임의의 다른 형태로서 상주할 수 있다. 샘플 저장 매체는 예를 들어, (본 명세서에서 편의상, "프로세서"로서 지칭될 수 있는) 컴퓨터/프로세서와 같은 머신에 커플링될 수 있어, 프로세서는 저장 매체로부터 정보(예를 들어, 코드)를 판독하고, 저장 매체에 정보를 기록할 수 있다. 샘플 저장 매체는 프로세서의 구성요소일 수 있다. 프로세서 및 저장매체는 ASIC에 상주할 수 있다. ASIC 는 사용자 장비에 상주할 수 있다. 대안적으로, 프로세서 및 저장 매체는 사용자 장비에서 개별적인 컴포넌트들로서 상주할 수 있다. 또한, 일부 양상들에서, 임의의 적합한 컴퓨터-프로그램 물건은 여기에서 기재된 양상들 중 하나 이상과 관련된 (예를 들어, 적어도 하나의 컴퓨터에 의해 실행가능한) 코드들을 포함하는 컴퓨터-판독가능 매체를 포함할 수 있다. 일부 양상들에서, 컴퓨터 프로그램 물건은 패키지물(packaging material)들을 포함할 수 있다.

상기 설명은 당업자가 본 발명의 전체 범위를 완전히 이해할 수 있게 하기 위해서 제공된다. 여기에서 기재되는 다양한 구성들에 대한 수정들은 당업자에게 명백할 것이다. 따라서, 청구항들은 여기에서 설명되는 본 발명의 다양한 양상들에 제한되는 것으로 의도되는 것이 아니지만, 청구항들의 용어와 일치하는 전체 범위에 따를 것이며, 여기서 단수형의 엘리먼트에 대한 지칭은 특별히 "하나 그리고 오직 하나"로 표시되지 않는 한, "하나 그리고 오직 하나"를 의미하는 것으로 의도되는 것은 아니며, "하나 이상"을 의미하는 것으로 의도된다. 추가적으로, 청구항들에서 사용되는 어구 "a, b 및 c 중 적어도 하나"는 a, b 또는 c, 또는 이들의 임의의 조합으로 지향되는 청구항으로서 해석되어야 한다. 별도로 표시되지 않는 한, 용어 "일부" 또는 "적어도 하나"는 하나 이상의 엘리먼트들을 지칭한다. 당업자에게 알려져 있거나, 추후에 알려질 본 명세서 전반에 걸쳐 설명되는 다양한 양상들의 엘리먼트들에 대한 모든 구조적 그리고 기능적 균등물들은 참조로 여기에 명시적으로 포함될 수 있고 청구항들에 의해 포함된다는 것으로 의도된다. 또한, 이러한 발명이 청구항들에서 명백하게 인용되는지의 여부에 관계 없이, 여기에 기재되는 어떤 것도 공적으로 전용되는 것으로 의도되지 않는다. 어구 "~하기 위한 수단"을 사용하여 엘리먼트가 명시적으로 인용되지 않거나, 또는 방법 청구항의 경우, 엘리먼트가 어구 "~하기 위한 단계"를 사용하여 인용되지 않는 한, 어떠한 청구항 엘리먼트도 35 U.S.C.§112 여섯 번째 단락의 규정들 하에서 해석되지 않을 것이다.

상기 설명은 예시적인 양상들 및/또는 양상들을 논의하지만, 첨부되는 청구항들에 의해 정의되는 바와 같이 설명된 양상들 및/또는 양상들의 범위를 벗어나지 않고 다양한 변화들 및 수정들이 여기에서 이루어질 수 있다는 것에 유의하여야 한다. 또한, 설명된 양상들 및/또는 양상들의 엘리먼트들은 단수의 형태로 설명 또는 청구되지만, 단수형에 대한 명백한 한정이 기재되지 않는 한 복수의 형태로 고려될 수도 있다. 추가적으로, 별도로 표시되지 않는 한, 임의의 다른 양상 및/또는 양상의 전부 또는 일부는 임의의 다른 양상 및/또는 양상의 전부 또는 일부와 함께 이용될 수 있다.

Claims

인코딩을 위한 방법으로서,
데이터 신호를 수신하는 단계;
적어도 2개의 계수들을 제공하기 위해서 상기 데이터 신호의 변환을 수행하는 단계; 및
압축된 데이터 신호를 제공하기 위해서 상기 적어도 2개의 계수들의 로그 압신(log companding)을 수행하는 단계를 포함하는,
인코딩을 위한 방법.
제 1 항에 있어서,
상기 변환은 시간-주파수 분해 및 시간 스케일 분해 중 하나인,
인코딩을 위한 방법.
제 1 항에 있어서,
상기 변환은 이산 코사인 변환(Discrete Cosine Transform : DCT) 변환인,
인코딩을 위한 방법.
제 1 항에 있어서,
상기 변환은 변형 이산 코사인 변환(modified Discrete Cosine Transform : MDCT) 변환인,
인코딩을 위한 방법.
제 1 항에 있어서,
각각의 계수는 스펙트럼 계수인,
인코딩을 위한 방법.
제 1 항에 있어서,
상기 로그 압신은 적어도 2개의 압신 파라미터들을 사용하여 상기 적어도 2개의 계수들을 인코딩하는 것을 포함하는,
인코딩을 위한 방법.
제 6 항에 있어서,
상기 적어도 2개의 압신 파라미터는 동일한 값을 가지는,
인코딩을 위한 방법.
제 1 항에 있어서,
상기 데이터 신호는 오디오 신호, 스피치 신호 및 생체의학 신호 중 하나인,
인코딩을 위한 방법.
디코딩을 위한 방법으로서,
압축된 데이터 신호를 수신하는 단계;
적어도 2개의 계수들을 획득하기 위해서 상기 압축된 데이터 신호를 디코딩함으로써 역 로그 압신을 수행하는 단계; 및
데이터 신호를 제공하기 위해서 상기 적어도 2개의 계수들 상에서 역 변환을 수행하는 단계를 포함하는,
디코딩을 위한 방법.
제 9 항에 있어서,
상기 역 변환은 역 시간-주파수 분해 및 역 시간 스케일 분해 중 하나인,
디코딩을 위한 방법.
제 9 항에 있어서,
상기 역 변환은 역 이산 코사인 변환(DCT) 변환인,
디코딩을 위한 방법.
제 9 항에 있어서,
상기 역 변환은 역 변형 이산 코사인 변환(MDCT) 변환인,
디코딩을 위한 방법.
제 9 항에 있어서,
각각의 계수는 스펙트럼 계수인,
디코딩을 위한 방법.
제 9 항에 있어서,
상기 역 로그 압신은 적어도 2개의 압신 파라미터들을 사용하여 상기 압축된 데이터 신호를 디코딩함으로써 수행되는,
디코딩을 위한 방법.
제 14 항에 있어서,
상기 압신 파라미터들은 동일한 값을 가지는,
디코딩을 위한 방법.
제 9 항에 있어서,
상기 데이터 신호는 오디오 신호, 스피치 신호 및 생체의학 신호 중 하나인,
디코딩을 위한 방법.
인코딩을 위한 장치로서,
데이터 신호를 수신하도록 구성되는 수신기;
적어도 2개의 계수들을 제공하기 위해서 상기 데이터 신호를 분해하도록 구성되는 변환 회로; 및
압축된 데이터 신호를 제공하기 위해서 상기 적어도 2개의 계수들을 인코딩하도록 구성되는 로그 압신 회로를 포함하는,
인코딩을 위한 장치.
제 17 항에 있어서,
상기 변환은 시간-주파수 분해 및 시간 스케일 분해 중 하나인,
인코딩을 위한 장치.
제 17 항에 있어서,
상기 변환은 DCT 변환인,
인코딩을 위한 장치.
제 17 항에 있어서,
상기 변환은 변형 DCT(MDCT) 변환인,
인코딩을 위한 장치.
제 17 항에 있어서,
각각의 계수는 스펙트럼 계수인,
인코딩을 위한 장치.
제 17 항에 있어서,
상기 로그 압신 회로는 상이한 압신 파라미터를 사용하여 각각의 계수를 인코딩하는,
인코딩을 위한 장치.
제 22 항에 있어서,
상기 상이한 압신 파라미터는 동일한 값을 가지는,
인코딩을 위한 장치.
제 17 항에 있어서,
상기 데이터 신호는 오디오 신호 및 스피치 신호 중 하나인,
인코딩을 위한 장치.
디코딩을 위한 장치로서,
압축된 데이터 신호를 수신하도록 구성되는 수신기;
적어도 2개의 계수들을 획득하기 위해서 상기 압축된 데이터 신호를 디코딩하도록 구성되는 역 로그 압신 회로; 및
상기 적어도 2개의 계수들로부터 데이터 신호를 재구성하도록 구성되는 역 변환 회로를 포함하는,
디코딩을 위한 장치.
제 25 항에 있어서,
상기 역 변환 회로는 역 시간-주파수 분해 및 역 시간 스케일 분해 중 하나인,
디코딩을 위한 장치.
제 25 항에 있어서,
상기 역 변환 회로는 역 DCT 변환인,
디코딩을 위한 장치.
제 25 항에 있어서,
상기 역 변환 회로는 역 변형 DCT(MDCT) 변환인,
디코딩을 위한 장치.
제 25 항에 있어서,
각각의 계수는 스펙트럼 계수인,
디코딩을 위한 장치.
제 25 항에 있어서,
상기 역 로그 압신 회로는 적어도 2개의 압신 파라미터들을 사용하여 상기 압축된 데이터 신호를 디코딩하는,
디코딩을 위한 장치.
제 30 항에 있어서,
상기 압신 파라미터들은 동일한 값을 가지는,
디코딩을 위한 장치.
제 25 항에 있어서,
상기 데이터 신호는 오디오 신호 및 스피치 신호 중 하나인,
디코딩을 위한 장치.
인코딩을 위한 장치로서,
데이터 신호를 수신하기 위한 수단;
적어도 2개의 계수들을 제공하기 위해서 상기 데이터 신호의 변환을 수행하기 위한 수단; 및
압축된 데이터 신호를 제공하기 위해서 상기 적어도 2개의 계수들의 로그 압신을 수행하기 위한 수단을 포함하는,
인코딩을 위한 장치.
제 33 항에 있어서,
상기 변환은 시간-주파수 분해 및 시간 스케일 분해 중 하나인,
인코딩을 위한 장치.
제 33 항에 있어서,
상기 변환은 DCT 변환인,
인코딩을 위한 장치.
제 33 항에 있어서,
상기 변환은 변형 DCT(MDCT) 변환인,
인코딩을 위한 장치.
제 33 항에 있어서,
각각의 계수는 스펙트럼 계수인,
인코딩을 위한 장치.
제 33 항에 있어서,
상기 로그 압신은 적어도 2개의 압신 파라미터들을 사용하여 각각의 계수를 인코딩함으로써 수행되는,
인코딩을 위한 장치.
제 38 항에 있어서,
상기 압신 파라미터들은 동일한 값을 가지는,
인코딩을 위한 장치.
제 33 항에 있어서,
상기 데이터 신호는 오디오 신호 및 스피치 신호 중 하나인,
인코딩을 위한 장치.
디코딩을 위한 장치로서,
압축된 데이터 신호를 수신하기 위한 수단;
적어도 2개의 계수들을 획득하기 위해서 상기 압축된 데이터 신호를 디코딩함으로써 역 로그 압신을 수행하기 위한 수단; 및
데이터 신호를 제공하기 위해서 상기 적어도 2개의 계수들 상에서 역 변환을 수행하기 위한 수단을 포함하는,
디코딩을 위한 장치.
제 41 항에 있어서,
상기 역 변환은 역 시간-주파수 분해 및 역 시간 스케일 분해 중 하나인,
디코딩을 위한 장치.
제 41 항에 있어서,
상기 역 변환은 역 DCT 변환인,
디코딩을 위한 장치.
제 41 항에 있어서,
상기 역 변환은 역 변형 DCT(MDCT) 변환인,
디코딩을 위한 장치.
제 41 항에 있어서,
각각의 계수는 스펙트럼 계수인,
디코딩을 위한 장치.
제 41 항에 있어서,
상기 역 로그 압신은 적어도 2개의 압신 파라미터들을 사용하여 상기 압축된 데이터 신호를 디코딩함으로써 수행되는,
디코딩을 위한 장치.
제 46 항에 있어서,
상기 압신 파라미터들은 동일한 값을 가지는,
디코딩을 위한 장치.
제 41 항에 있어서,
상기 데이터 신호는 오디오 신호, 스피치 신호 및 생체의학 신호 중 하나인,
디코딩을 위한 장치.
컴퓨터-판독가능 매체를 포함하는 인코딩을 위한 컴퓨터 프로그램 물건으로서,
상기 컴퓨터-판독가능 매체는,
데이터 신호를 수신하고;
적어도 2개의 계수들을 제공하기 위해서 상기 데이터 신호의 변환을 수행하고; 그리고
압축된 데이터 신호를 제공하기 위해서 상기 적어도 2개의 계수들의 로그 압신을 수행하기 위해서 실행가능한 명령들로 인코딩되는,
컴퓨터 프로그램 물건.
컴퓨터-판독가능 매체를 포함하는 디코딩을 위한 컴퓨터 프로그램 물건으로서,
상기 컴퓨터-판독가능 매체는,
압축된 데이터 신호를 수신하고;
적어도 2개의 계수들을 획득하기 위해서 상기 압축된 데이터 신호를 디코딩함으로써 역 로그 압신을 수행하고; 그리고
데이터 신호를 제공하기 위해서 상기 적어도 2개의 계수들 상에서 역 변환을 수행하기 위해서 실행가능한 명령들로 인코딩되는,
컴퓨터 프로그램 물건.
헤드셋으로서,
압축된 데이터 신호를 수신하도록 구성되는 수신기;
적어도 2개의 계수들을 획득하기 위해서 상기 압축된 데이터 신호를 디코딩하도록 구성되는 역 로그 압신 회로;
상기 적어도 2개의 계수들로부터 데이터 신호를 재구성하도록 구성되는 역 변환 회로; 및
상기 재구성된 데이터 신호에 기초하여 오디오 출력을 제공하도록 구성되는 트랜스듀서를 포함하는,
헤드셋.
센싱 디바이스로서,
데이터 신호를 검출하도록 구성되는 센서;
적어도 2개의 계수들을 제공하기 위해서 상기 데이터 신호를 분해하도록 구성되는 변환 회로;
압축된 데이터 신호를 제공하기 위해서 상기 적어도 2개의 계수들을 인코딩하도록 구성되는 로그 압신 회로; 및
상기 압축된 데이터 신호를 송신하도록 구성되는 송신기를 포함하는,
센싱 디바이스.
헤드셋으로서,
오디오 신호를 검출하도록 구성되는 트랜스듀서;
적어도 2개의 계수들을 제공하기 위해서 상기 오디오 신호를 분해하도록 구성되는 변환 회로;
압축된 오디오 신호를 제공하기 위해서 상기 적어도 2개의 계수들을 인코딩하도록 구성되는 로그 압신 회로; 및
상기 압축된 오디오 신호를 송신하도록 구성되는 안테나를 포함하는,
헤드셋.
시계로서,
압축된 데이터 신호를 수신하도록 구성되는 수신기;
적어도 2개의 계수들을 획득하기 위해서 상기 압축된 데이터 신호를 디코딩하도록 구성되는 역 로그 압신 회로;
상기 적어도 2개의 계수들로부터 데이터 신호를 재구성하도록 구성되는 역 변환 회로; 및
상기 재구성된 데이터 신호에 기초하여 표시를 제공하도록 구성되는 사용자 인터페이스를 포함하는,
시계.