JP2013081229A - 変換領域ログコンパンディングを使用する信号処理のための方法および装置 - Google Patents
変換領域ログコンパンディングを使用する信号処理のための方法および装置 Download PDFInfo
- Publication number
- JP2013081229A JP2013081229A JP2012268459A JP2012268459A JP2013081229A JP 2013081229 A JP2013081229 A JP 2013081229A JP 2012268459 A JP2012268459 A JP 2012268459A JP 2012268459 A JP2012268459 A JP 2012268459A JP 2013081229 A JP2013081229 A JP 2013081229A
- Authority
- JP
- Japan
- Prior art keywords
- data signal
- inverse
- coefficients
- companding
- transform
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 64
- 238000012545 processing Methods 0.000 title abstract description 4
- 230000005236 sound signal Effects 0.000 claims abstract description 40
- 230000003595 spectral effect Effects 0.000 claims abstract description 28
- 238000000354 decomposition reaction Methods 0.000 claims description 36
- 230000009466 transformation Effects 0.000 claims description 27
- 238000006243 chemical reaction Methods 0.000 claims description 20
- 238000004590 computer program Methods 0.000 claims description 15
- 230000002441 reversible effect Effects 0.000 claims description 13
- 238000001514 detection method Methods 0.000 claims description 3
- 230000006835 compression Effects 0.000 abstract description 29
- 238000007906 compression Methods 0.000 abstract description 29
- 230000006870 function Effects 0.000 description 26
- 238000004891 communication Methods 0.000 description 15
- 238000005516 engineering process Methods 0.000 description 11
- 238000010586 diagram Methods 0.000 description 10
- 238000009826 distribution Methods 0.000 description 9
- 230000005540 biological transmission Effects 0.000 description 6
- 230000008569 process Effects 0.000 description 6
- 230000003287 optical effect Effects 0.000 description 5
- 238000013139 quantization Methods 0.000 description 4
- 238000013459 approach Methods 0.000 description 3
- 230000006837 decompression Effects 0.000 description 3
- 238000013461 design Methods 0.000 description 3
- 239000000835 fiber Substances 0.000 description 3
- 238000012986 modification Methods 0.000 description 3
- 230000004048 modification Effects 0.000 description 3
- 230000003321 amplification Effects 0.000 description 2
- 230000001413 cellular effect Effects 0.000 description 2
- 238000012937 correction Methods 0.000 description 2
- 230000007613 environmental effect Effects 0.000 description 2
- 230000007774 longterm Effects 0.000 description 2
- 238000003199 nucleic acid amplification method Methods 0.000 description 2
- 230000008520 organization Effects 0.000 description 2
- 230000002829 reductive effect Effects 0.000 description 2
- 230000001360 synchronised effect Effects 0.000 description 2
- 238000012546 transfer Methods 0.000 description 2
- 238000003491 array Methods 0.000 description 1
- 230000008901 benefit Effects 0.000 description 1
- 230000001010 compromised effect Effects 0.000 description 1
- 230000001143 conditioned effect Effects 0.000 description 1
- 238000013500 data storage Methods 0.000 description 1
- 230000002452 interceptive effect Effects 0.000 description 1
- 239000006249 magnetic particle Substances 0.000 description 1
- 230000000873 masking effect Effects 0.000 description 1
- 238000010295 mobile communication Methods 0.000 description 1
- 238000012544 monitoring process Methods 0.000 description 1
- 239000005022 packaging material Substances 0.000 description 1
- 239000002245 particle Substances 0.000 description 1
- 238000007639 printing Methods 0.000 description 1
- 230000011664 signaling Effects 0.000 description 1
- 238000001228 spectrum Methods 0.000 description 1
- 230000002123 temporal effect Effects 0.000 description 1
- 238000000844 transformation Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
-
- H—ELECTRICITY
- H03—ELECTRONIC CIRCUITRY
- H03M—CODING; DECODING; CODE CONVERSION IN GENERAL
- H03M7/00—Conversion of a code where information is represented by a given sequence or number of digits to a code where the same, similar or subset of information is represented by a different sequence or number of digits
- H03M7/30—Compression; Expansion; Suppression of unnecessary data, e.g. redundancy reduction
- H03M7/50—Conversion to or from non-linear codes, e.g. companding
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/032—Quantisation or dequantisation of spectral components
-
- H—ELECTRICITY
- H03—ELECTRONIC CIRCUITRY
- H03M—CODING; DECODING; CODE CONVERSION IN GENERAL
- H03M7/00—Conversion of a code where information is represented by a given sequence or number of digits to a code where the same, similar or subset of information is represented by a different sequence or number of digits
- H03M7/30—Compression; Expansion; Suppression of unnecessary data, e.g. redundancy reduction
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/0204—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using subband decomposition
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/0212—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using orthogonal transformation
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Signal Processing (AREA)
- Theoretical Computer Science (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Nonlinear Science (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
- Telephone Function (AREA)
Abstract
【課題】オーディオ信号のスペクトル領域表現または時間領域表現に対してログコンパンディングを適用して、エンコードされたオーディオ信号を提供することによる、オーディオ信号処理のための方法および装置の提供。
【解決手段】エンコードされたオーディオ信号は、受信次第デコードされる。それぞれが係数を有する特定の周波数帯域にオーディオ信号を分離することにより、オーディオ信号の周波数領域表現または時間領域表現が計算される。異なる圧縮比によるログコンパンディングが、各係数に対して実行されて、エンコードされた信号が提供される。エンコードされた信号を受信次第、逆ログコンパンディング、および、時間周波数または時間スケールの再構成が実行されて、オーディオ信号が提供される。
【選択図】図4A
【解決手段】エンコードされたオーディオ信号は、受信次第デコードされる。それぞれが係数を有する特定の周波数帯域にオーディオ信号を分離することにより、オーディオ信号の周波数領域表現または時間領域表現が計算される。異なる圧縮比によるログコンパンディングが、各係数に対して実行されて、エンコードされた信号が提供される。エンコードされた信号を受信次第、逆ログコンパンディング、および、時間周波数または時間スケールの再構成が実行されて、オーディオ信号が提供される。
【選択図】図4A
Description
特許に対する本出願は、2008年9月26日に出願され、“変換領域ログコンパンディング”と題する、仮出願第61/100,645号(代理人ドケット第082855P1号)と、2008年9月29日に出願され、“変換領域ログコンパンディング”と題する、仮出願第61/101,070号(代理人ドケット第082855P2号)とに対する優先権を主張する。上記の出願のそれぞれは、本出願の譲受人に譲渡され、参照により明白にここに組み込まれている。
本開示は、一般に、通信に関連し、より詳細には、スペクトル領域ログコンパンディングを使用する信号圧縮に関連する。
デジタル技術による、音声および音楽のようなオーディオの送信は、特に、長距離電話、ボイスオーバインターネットプロトコル(VoIP)のようなパケット交換電話、および、セルラ電話のようなデジタル無線電話において、普及している。そのような普及は、送信チャネルによって音声通信を転送するために使用される情報量を低減させる一方で、再構成されるスピーチの、知覚される品質を維持することに関心をもたらしている。例えば、利用可能なワイヤレスシステム帯域幅を最大限に利用することが望まれる。システム帯域幅を効率的に使用する1つの方法は、信号圧縮技術を用いることである。スピーチ信号を搬送するワイヤレスシステムに対して、スピーチ圧縮(すなわち、“スピーチコーディング”)技術が、この目的のために一般に用いられている。ここで記述する技術は、ヘルスケアおよびフィットネスの用途のための生体信号のような、他の信号に対して適用できる。
人間のスピーチ発生のモデルに関連するパラメータを抽出することにより、スピーチを圧縮するように構成されているデバイスは、“音声コーダ”、“ボコーダ”、“オーディオコーダ”、“スピーチコーダ”、または、“コーデック”と呼ばれることが多い。コーデックは一般に、エンコーダおよびデコーダを備える。エンコーダは通常、入力スピーチ信号(オーディオ情報を表すデジタル信号)を、“フレーム”と呼ばれる時間のセグメントに分割し、各フレームを分析して、いくつかの関連するパラメータを抽出し、パラメータをエンコードされたフレームに量子化する。エンコードされたフレームは、送信チャネル(すなわち、ワイヤードまたはワイヤレスのネットワーク接続)によって、デコーダを含む受信機に送信される。デコーダは、エンコードされたフレームを受信および処理し、それらを逆量子化してパラメータを生成させ、逆量子化されたパラメータを使用して、スピーチフレームを再現する。
従来のオーディオ/スピーチ圧縮方法は、著しい圧縮を達成する一方で高レベルの品質を維持するために、複雑な音響心理学モデルに依拠する。MPEG−1オーディオレイヤ3(MP3)およびアドバンストオーディオコーディング(AAC)スキームのような、従来のオーディオ圧縮方法は、通常、人間の聴覚システムに関する情報に依拠する音響心理学モデルに基づいている。これらのスキームは、著しい圧縮(例えば、原信号のおおよそ1/10のビットレート)を達成する一方で、元の、圧縮されていないコンテンツの品質レベルに近い、再現品質のレベルを維持することができる。しかしながら、これらの大きな圧縮比を達成するとはいえ、これらの方法は、複雑であり、高電力を消費する圧縮/非圧縮回路、著しい待ち時間の犠牲を払うようになり、一般に、低電力、少ない待ち時間のアプリケーション/デバイスに十分に適していない。現代のデバイスにおける帯域幅の増加により、重い圧縮に対する要求は、複雑さの低いエンコーディング/デコーディングスキームと引き換えで緩和できる。
ハンズフリーの動作を有するワイヤレスヘッドセットが、移動体電話において、ますます普通のことになっている。人体近傍ネットワーク(BAN)という状況における、短距離無線技術に対する傾向は、より低い電力消費とともにより高いデータレートを提供することである。BAN無線に対する進化傾向は、わずか数ミリワット(mW)の電力消費を使用して、数メガビット/秒のスループットを達成できる低電力無線を伴う。着用できるデバイスに対するBANの状況において、バッテリー寿命を増加させ、要素を減らし、コストを低減させることが望まれる。
会話形サービスの状況において、3GネットワークにおけるAMR−WBおよびEVRC−WBのような広帯域コーデックの展開では、BANにおいて、音声品質を向上させ、電力を低減させる必要性が存在する。同様に、オーディオストリーミングサービスに対して、ユーザ体験を損なわないように、ワイヤラインの品質をワイヤレスヘッドフォンに対して維持する必要性が存在する。
したがって、上述の欠点のうちの1つ以上に対処することが望まれる。
1つ以上の観点の基本的な理解を提供するために、以下の記述は、そのような観点の簡略化した概要を与える。この概要は、考えられるすべての観点の広範な概観ではなく、すべての観点の主なまたは重要な要素を識別するようにも、いくつかのまたはすべての観点の範囲を詳細に描写するようにも向けられていない。その唯一の目的は、後に与えられるより詳細な説明に対するプレリュードとして、簡略化した形態で1つ以上の観点のいくつかの概念を与えることである。
本開示の1つの観点において、エンコードするための方法を開示する。方法は、データ信号を受信することと、データ信号の変換を実行して、少なくとも2つの係数を提供することと、少なくとも2つの係数のログコンパンディングを実行して、圧縮されたデータ信号を提供することとを含む。
本開示の別の観点において、デコードするための方法を開示する。方法は、圧縮されたデータ信号を受信することと、圧縮データ信号の逆ログコンパンディングにより伸張を実行して、少なくとも2つの係数を取得することと、少なくとも2つの係数に対して逆変換を実行して、データ信号を提供することとを含む。
本開示のさらに別の観点において、エンコードする装置を開示する。装置は、データ信号を受信するように構成されている受信機と、データ信号を分解して、少なくとも2つの係数を提供するように構成されている変換回路と、少なくとも2つの係数をエンコードして、圧縮されたデータ信号を提供するように構成されているログコンパンディング回路とを備える。
本開示のさらなる観点において、デコードする装置を開示する。装置は、圧縮されたデータ信号を受信するように構成されている受信機と、圧縮データ信号をデコードして、少なくとも2つの係数を取得するように構成されている逆ログコンパンディング回路と、少なくとも2つの係数からデータ信号を再構成するように構成されている逆変換回路とを備える。
本開示のさらなる観点において、エンコードする装置を開示する。装置は、データ信号を受信する手段と、データ信号の変換を実行して、少なくとも2つの係数を提供する手段と、少なくとも2つの係数のログコンパンディングを実行して、圧縮されたデータ信号を提供する手段とを備える。
本開示のさらなる観点において、デコードする装置を開示する。装置は、圧縮されたデータ信号を受信する手段と、圧縮データ信号をデコードすることにより逆ログコンパンディングを実行して、少なくとも2つの係数を取得する手段と、少なくとも2つの係数に対して逆変換を実行して、データ信号を提供する手段とを備える。
本開示のさらなる観点において、エンコードするコンピュータプログラムプロダクトを開示する。コンピュータプログラムプロダクトは、データ信号を受信し、データ信号の変換を実行して、少なくとも2つの係数を提供し、少なくとも2つの係数のログコンパンディングを実行して、圧縮されたデータ信号を提供するように実行可能な命令を含むコンピュータ読み取り可能媒体を備える。
本開示のさらなる観点において、デコードするコンピュータプログラムプロダクトを開示する。コンピュータプログラムプロダクトは、圧縮されたデータ信号を受信し、圧縮データ信号をデコードすることにより逆ログコンパンディングを実行して、少なくとも2つの係数を取得し、少なくとも2つの係数に対して逆変換を実行して、データ信号を提供するように実行可能な命令を含むコンピュータ読み取り可能媒体を備える。
本開示のさらなる観点において、ヘッドセットを開示する。ヘッドセットは、圧縮されたデータ信号を受信するように構成されている受信機と、圧縮データ信号をデコードして、少なくとも2つの係数を取得するように構成されている逆ログコンパンディング回路と、少なくとも2つの係数からデータ信号を再構成するように構成されている逆変換回路と、再構成されたデータ信号に基づいて、オーディオ出力を提供するように構成されているトランスデューサとを備える。
本開示のさらなる観点において、検知デバイスを開示する。検知デバイスは、データ信号を検出するように構成されているセンサーと、データ信号を分解して、少なくとも2つの係数を提供するように構成されている変換回路と、少なくとも2つの係数をエンコードして、圧縮されたデータ信号を提供するように構成されているログコンパンディング回路と、圧縮データ信号を送信するように構成されている送信機とを備える。
本開示のさらなる観点において、ハンドセットを開示する。ハンドセットは、オーディオ信号を検出するように構成されているトランスデューサと、オーディオ信号を分解して、少なくとも2つの係数を提供するように構成されている変換回路と、少なくとも2つの係数をエンコードして、圧縮されたオーディオ信号を提供するように構成されているログコンパンディング回路と、圧縮オーディオ信号を送信するように構成されているアンテナとを備える。本開示のさらなる観点において、ウォッチを開示する。ウォッチは、圧縮されたデータ信号を受信するように構成されている受信機と、圧縮データ信号をデコードして、少なくとも2つの係数を取得するように構成されている逆ログコンパンディング回路と、少なくとも2つの係数からデータ信号を再構成するように構成されている逆変換回路と、再構成されたデータ信号に基づいて、表示を提供するように構成されているユーザインターフェースとを備える。
先のおよび関連する目的を達成するために、1つ以上の観点は、以下で十分に記述し、特に特許請求の範囲において示す特徴を備えている。以下の記述および添付図面は、1つ以上の観点のいくつかの例示的な特徴を詳細に示す。これらの特徴は、さまざまな実施形態の原理を用いてもよいさまざまな方法のうちのほんのいくつかを表すにすぎず、本記述は、このようなすべての観点およびそれらの均等物を含むように向けられている。
同じ指定が同じ要素を表し、開示した観点を図示し、開示した観点を限定しないように提供される添付図面とともに、開示した観点を以下で記述する。
図1は、ワイヤレスネットワークの例を図示する図である。
図2は、ここで開示したさまざまな観点にしたがって構成されている信号圧縮システムを図示するブロック図である。
図3Aは、本開示のさまざまな観点にしたがった、第1の離散コサイン変換(DCT)係数の例示的な確率分布のプロットである。
図3Bは、本開示のさまざまな観点にしたがった、第2の離散コサイン変換(DCT)係数の例示的な確率分布のプロットである。
図3Cは、本開示のさまざまな観点にしたがった、第6の離散コサイン変換(DCT)係数の例示的な確率分布のプロットである。
図4Aは、本開示の観点にしたがって実行されるエンコーディング機能を説明するフロー図である。
図4Bは、本開示の観点にしたがって実行されるデコーディング機能を説明するフロー図である。
図5は、本開示の観点にしたがって、ワイヤレスネットワーク中でスピーチ/オーディオ信号の処理を容易にするシステムを図示するブロック図である。
図6は、本開示の観点にしたがった、ワイヤレスのオーディオ/スピーチのデコーディングの向上を容易にする受信機を図示するブロック図である。
図7は、本開示の観点にしたがった、スピーチ/オーディオ信号の圧縮を容易にする送信機を図示するブロック図である。
図8は、本開示の観点にしたがって構成されているエンコーディング装置を図示するブロック図である。
図9は、本開示の観点にしたがって構成されているデコーディング装置を図示するブロック図である。
添付図面を参照して、さまざまな観点を以下でより十分に記述する。しかしながら、ここで開示した観点は、多くの異なる形態で具現でき、本開示全体を通して与えられる、何らかの特定の構造または機能に限定されるものとして解釈すべきでない。むしろ、これらの観点は、本開示が完全かつ徹底的であり、本開示の範囲を当業者に十分に伝えるように提供される。ここで開示したいくつかの観点が、独自に実現されようと、他の何らかの観点と組み合わされようと、ここでの教示に基づいて、本開示の範囲が、そのような観点をカバーするように向けられていることを当業者は理解するはずである。例えば、ここで示した任意の数の観点を使用して、装置を実現してもよく、方法を実施してもよい。さらに、ここで示したさまざまな観点に加えて、または、それらの観点以外に、他の構造、機能、または、構造および機能を使用して実施されるような、装置または方法をカバーするように、本開示の範囲は向けられている。ここで開示した任意の観点を、請求項の1つ以上の要素により具現してもよいことを理解すべきである。
圧縮効率と比較して低電力が重要な、高品質のスピーチおよびオーディオのソリューションの新規なクラスに対する必要性が存在する。
本開示全体を通して与えられる1つ以上の観点をサポートするのに適した短距離通信ネットワークの例を、図1中で図示する。ネットワーク100は、任意の適切な無線技術またはワイヤレスプロトコルを使用して通信する、さまざまなワイヤレスノードとともに示されている。一例として、ワイヤレスノードは、超広帯域(UWB)技術をサポートするように構成されていてもよい。代わりに、ワイヤレスノードは、いくつかを挙げてみると、ブルートゥース(登録商標)またはIEEE802.11のような、さまざまなワイヤレスプロトコルをサポートするように構成されていてもよい。
ネットワーク100は、他のワイヤレスノードと通信するコンピュータ102とともに示されている。この例において、コンピュータ102は、デジタルカメラ104からデジタル写真を受け取り、印刷するために文書をプリンタ106に送り、パーソナルデジタルアシスタント(PDA)108上のeメールと同期をとり、音楽ファイルをデジタルオーディオプレイヤー(例えば、MP3プレイヤー)110に、バックアップデータおよびファイルを移動記憶デバイス112に転送し、ワイヤレスハブ114を介してリモートネットワーク(例えば、インターネット)と通信してもよい。ネットワーク100はまた、着用可能な、または、人体に植え込まれる、多数の移動ノードおよびコンパクトノードを含んでいてもよい。一例として、人間が、コンピュータ102から、ストリーミングされたオーディオを受信するヘッドセット116(例えば、ヘッドフォン、イヤホンなど)、コンピュータ102により設定されるウォッチ118、および/または、重要な身体パラメータを監視するセンサー120(例えば、バイオメトリックセンサー、心拍数モニター、歩数計、および、EKGデバイスなど)を身につけていてもよい。
短距離通信をサポートするネットワークとして示されているが、本開示全体を通して与えられる観点はまた、一例として、いくつかを挙げてみると、最適化エボリューションデータ(EV−DO)、ウルトラモバイルブロードバンド(UMB)、コード分割多元接続(CDMA)2000、ロングタームエボリューション(LTE)、または、広帯域CDMA(W−CDMA)を含む、任意の適切なワイヤレスプロトコルをサポートするワイドエリアネットワーク中での通信をサポートするように構成されていてもよい。代わりに、ワイヤレスノードは、ケーブルモデム、デジタル加入者線(DSL)、光ファイバ、イーサネット(登録商標)、ホームRF、または、他の任意の適切なワイヤードアクセスプロトコルを使用して、ワイヤード通信をサポートするように構成されていてもよい。
いくつかの観点において、ワイヤレスデバイスは、インパルスベースのワイヤレス通信リンクによって通信してもよい。例えば、インパルスベースのワイヤレス通信リンクは、(例えば、数ナノ秒またはより短い長さの)比較的短い長さと、比較的幅の広い帯域幅とを有する、超広帯域パルスを利用してもよい。いくつかの観点において、超広帯域パルスは、おおよそ20%またはより大きい大きさの比帯域を有し、および/または、おおよそ500MHzまたはより大きい大きさの帯域幅を有していてもよい。
ここでの教示は、さまざまな装置(例えば、デバイス)に組み込まれてもよい(例えば、それらの内部で実現されるか、または、それらによって実行されてもよい)。例えば、ここで教示される1つ以上の観点は、電話機(例えば、セルラ電話機)、パーソナルデータアシスタント(“PDA”)、エンターテイメントデバイス(例えば、音楽またはビデオデバイス)、ヘッドセット(例えば、ヘッドフォン、イヤホンなど)、マイクロフォン、医療検知デバイス(例えば、バイオメトリックセンサー、心拍数モニター、歩数計、EKGデバイス、スマートバンデージなど)、ユーザI/Oデバイス(例えば、ウォッチ、リモート制御、光スイッチ、キーボード、マウスなど)、環境検知デバイス(例えば、タイヤ圧力モニター)、医療または環境検知デバイスからデータを受け取るモニター、コンピュータ、ポイントオブセールデバイス、エンターテイメントデバイス、補聴器、セットトップボックス、または、他の任意の適切なデバイスに組み込まれていてもよい。
これらのデバイスは、異なる、電力およびデータ要求を有するかもしれない。いくつかの観点において、ここでの教示は、(例えば、インパルスベースのシグナリングスキームおよび低デューティーサイクルモードの使用により)低電力アプリケーションにおける使用に適合していてもよく、(例えば、高帯域幅パルスの使用により)比較的高いデータレートを含むさまざまなデータレートをサポートしてもよい。
さまざまな観点または特徴が、多数のデバイス、コンポーネント、および、これらに類似するものを含んでいてもよいシステムの点で、与えられるであろう。さまざまなシステムは、付加的なデバイス、コンポーネント、モジュールなどを含んでいてもよく、および/または、図に関して記述される、デバイス、コンポーネント、モジュールなどのすべてを含んでいなくてもよいことを理解および認識すべきである。これらのアプローチの組み合わせを使用してもよい。当業者が容易に認識するように、変換領域ログコンパンディングを使用して信号圧縮を現在実現している、他の任意の装置、システム、方法、プロセス、デバイス、または、プロダクトに、ここで記述した観点を適用してもよい。
ここで開示した観点は、人間の耳が、時間領域中のドロップアウトの隠蔽よりも、周波数領域中のドロップアウトの隠蔽に感度が低いという事実を利用する。したがって、ここで開示した観点は、とりわけ、オーディオ、超広帯域スピーチ、高帯域スピーチ、および、狭帯域スピーチを含む、幅広い範囲の信号について、等しく適切に適用する。
開示の観点は、スペクトル領域ログコンパンディング(圧縮および伸張)を利用し、広帯域スピーチおよびオーディオに対してトランスペアレントな品質を達成するオーディオ/スピーチ圧縮へのチャネル誤差ソリューションに、低い複雑さ、少ない待ち時間、および、頑強性を提供する。ここで開示した観点は、従来のデコーダよりも電力および領域を必要としない、シフトおよび加算のような、ハードウェアフレンドリな演算により実現できる。
ここで開示した観点は、信号の周波数領域表現上でログコンパンディングを適用することにより、信号圧縮にアプローチする。本開示の観点は、信号の周波数領域表現を最初に計算することにより、これらの概念を組み合せる。変換は、何らかの音響心理学のマスキングの適用を考慮する方法で、元データを表そうという目標により、1つのベースから別のベースへデータを投影する。通常、これは、例えば、MP3エンコーダの場合のように、変換の使用により、信号を特定の周波数帯域(ここでは、区別なく、“ビン”とも呼ばれる)に分離することにより実施される。
オーディオ/スピーチ信号のスペクトル領域表現を計算すると、本開示の観点は、各スペクトル係数に対して異なる圧縮比でログコンパンディングを実行する。オーディオ/スピーチのエネルギーは、上部の周波数帯域中に存在しないことから、それらの帯域における、非常に少ないビットの割振りにより、良好な品質を維持できる。それゆえに、結果として生じる、サンプル当たりのビットの平均数は、低減させることができ、オーディオ/スピーチの品質によりスケーラブルである。さらに、信号は、スペクトル領域中でエンコードされることから、バースト性のチャネル誤差がある場合、それらは、時間における単純なドロップアウトの代わりに、時間周波数平面中の周波数帯域に影響を及ぼす。これらの誤差は、人間の耳にとって、それほど不快ではなく、単純なスペクトル領域補間にかけられるとき、効果的に隠蔽できる。
時間周波数領域に加えて、時間スケール領域中で変換を実行することにより、本発明を実現してもよいことが認識されるであろう。そのような時間スケール変換の例は、ウェーブレットである。
これから図2を参照すると、ここで開示したさまざまな観点にしたがって構成されている信号圧縮システム200が示されている。システム200は、エンコーダ210とデコーダ220とを含む。エンコーダ210は、時間周波数分解ブロック212と、複数のコンパンダー214と、パケット化器216とを含む。デコーダ220は、非パケット化器222と、複数の逆コンパンダー224と、逆変換ブロック226とを含む。
1つの観点にしたがうと、時間周波数分解ブロック212は、離散コサイン変換(DCT)アルゴリズムを使用して、それぞれがスペクトルDCT係数を有する、複数の周波数帯域に、入力信号s(n)を無相関化する。DCTアルゴリズムは、複数の周波数帯域またはビンに信号を無相関化する。例えば、8ポイントDCT変換を実行してもよいが、ポイント数を変えてもよい。各スペクトル係数の統計的分布は、より高い増幅係数と比較して、より低い増幅係数に対してはるかに高い確率を有する、本質的にラプラシアンであることに注目すべきである。上部のスペクトルDCT係数に対して、係数の分散は著しく減少することにも注目すべきである。第1、第2、および、第6のDCT係数の例示的な確率分布を、それぞれ、図3Aないし図3C中で示す。図3Aないし図3C中の例示的な分布から理解できるように、より高いDCT係数に対して、より少ないビットを割り振ってもよい。DCTアルゴリズムに関して、観点を記述しているが、信号を複数の周波数帯域に無相関化する任意の変換を使用して、同様の結果を達成してもよいことに注目すべきである。
本開示の1つの観点にしたがうと、信号のエネルギーを均等に分割された周波数帯域に分類するために、DCTの使用を比較してもよい。例えば、32/48kHzでサンプリングされたデータに対して、8ポイントDCTからの係数は、連続する2/3kHz周波数帯域ないし16/24kHz周波数帯域における、エネルギーの量をおおよそ表すことができる。人間の聴覚が、16kHzを超える周波数で感度が低くなるという、音響心理学のモデリングから、そのことは知られている。
μ−law/A−lawアルゴリズムのようなログコンパンディングは、ラプラス/指数分布を有する信号に対して効率的な圧縮ツールであり、幅広いダイナミックレンジを有するにもかかわらず、ラプラス分布に似ている分布を有する、スピーチのような信号に対して適切に機能する。ログコンパンディングにおいては、より粗い量子化が、より大きいサンプル値に対して使用され、次第により精細になる量子化が、より小さいサンプル値に対して使用される。この特性は、例えば、はるかに低いビットレート(例えば、サンプル当たり8ビット)における、スピーチの明瞭な送信を考慮するG.711仕様のような、電話通信圧縮アルゴリズム中で首尾よく活用されている。G.711ログコンパンディング(圧縮および伸張)仕様は、国際電気通信連合(ITU−T)勧告G.711(1988年11月)--音声周波数のパルスコード変調(PCM)中で、および、G.711.C、G.711エンコーディング/デコーディング機能中で説明されており、それらの全体がここに組み込まれている。
μ−lawコンパンディングスキームおよびA−lawコンパンディングスキームの、2つのG.711ログコンパンディングスキームが存在する。μ−lawコンパンディングスキームおよびA−lawコンパンディングスキームの両方は、パルスコード変調(PCM)方式である。すなわち、アナログ信号がサンプリングされて、サンプリングされた各信号の振幅が量子化され、すなわち、デジタル値が割り当てられる。μ−lawおよびA−lawのコンパンディングスキームの両方は、サンプリングされた信号の対数曲線の線形近似により、サンプリングされた信号を量子化する。
μ−lawおよびA−lawのコンパンディングスキームの両方は、対数曲線に対して作用する。それゆえに、対数曲線はセグメントに分割され、連続する各セグメントは、前のセグメントの2倍の長さである。μ−lawおよびA−lawのコンパンディングスキームは、異なるように線形近似を計算することから、μ−lawおよびA−lawのコンパンディングスキームは、異なるセグメント長を有する。G.711仕様を使用するログコンパンディングに関して観点を記述しているが、低ビットレートで、スピーチの明瞭な送信を可能にする、任意のログコンパンディング仕様を使用して、同様の目標を達成してもよいことに注目すべきである。
図2を再度参照すると、1つの観点にしたがって、−1と1との間の値に対して作用するログコンパンディングが、複数のログコンパンダー214により、DCT係数に対して適用される。各ログコンパンダーは、μ定数(μ1ないしμn)のような、異なるコンパンディングパラメータを使用する。ログコンパンディングは、0のまわりに、より大きい量子化ステップを、サンプル値が増えるにつれて、より小さい量子化ステップを、効果的に割り振る。スピーチ/オーディオ信号は、(図3Aないし3Cから理解できるように)上部の周波数帯域中で、より鋭いことから、より少ないビットを、それらの帯域中に割り振ることができる一方で、良好な品質を維持できる。例えば、第1、第2、および、第3の係数は、それぞれ、4分の1、2分の1、2分の1にスケールダウンされてもよく、それは、複数のログコンパンダー214に対して、適正なデータ範囲を保証する。1つの観点にしたがって、1より大きい大きさを有するDCT係数値に関してクリッピングが実行される。
デコーダ220は、上述のバリエーションに応じて、信号を圧縮するために実行された、コンパンディングおよびDCT変換を逆にする。受信信号が、非パケット化器222により非パケット化された後、最初の3つの係数が、それぞれ、4倍、2倍、2倍にスケールアップされ、逆ログコンパンディングが、逆コンパンダー224中で実行される。逆DCT変換が、逆変換ブロック226中で実行されて、再構成された時間周波数信号が取得される。
これから図4Aおよび図4Bを参照すると、ここで開示した観点にしたがって実行される機能のフロー図が示されている。エンコーダ中で実行される機能の例は、図4Aのエンコーディングプロセス400A中で示されている。ステップ410においてデータ信号を受信すると、ステップ420において、信号の時間周波数分解を達成するために、変換が実行される。ステップ430において、μ定数のような、異なるコンパンディングパラメータによるログコンパンディングが実行されて、ステップ440において、圧縮されたデータ信号が、出力される。
デコーダ中で実行される機能の例は、図4Bのデコーディングプロセス400B中で示されている。ステップ450において、圧縮されたデータ信号を受信すると、ステップ460において、逆ログコンパンディングが実行される。ステップ470において、逆変換が実行されて、ステップ480において、データ信号が出力される。
図5を参照すると、さまざまな観点にしたがって、ワイヤレスネットワーク中でスピーチ/オーディオ信号の処理を容易にするシステム500が図示されている。
システム500は、例えば、エンコーダ510とデコーダ540とを含んでいてもよい。エンコーダ510は、例えば、基地局内に少なくとも部分的に存在することができる。システム500は、機能ブロックを含むように表されており、機能ブロックは、プロセッサ、ソフトウェア、または、これらの組み合わせ(例えば、ファームウェア)により実現される機能を表す機能ブロックとすることができることを理解すべきである。エンコーダ510は、一緒に作動できる電気コンポーネント520、530の論理グループ分けを含む。デコーダ540はまた、一緒に作動できる電気コンポーネント550、560の論理グループ分けを含む。
例えば、論理グループ分け520、530は、受信したスピーチ/オーディオ信号に対して変換を実行する手段520を含むことができる。手段520は、スピーチオーディオ信号の時間周波数分解を実行して、複数の周波数帯域にするように機能する。さらに、論理グループ分け520、530は、ログコンパンディングを実行する手段530を含むことができ、手段530は、各周波数帯域に対する各スペクトル係数に対して、異なる圧縮比を適用することにより、信号を圧縮するように機能する。さらに、論理グループ分け520、530は、電気コンポーネント520、530に関係付けられている機能を実行するための命令を保持する(示していない)メモリを含むことができる。
さらに、論理グループ分け550、560は、逆ログコンパンディングを実行する手段550と、逆変換手段560とを含むことができる。逆ログコンパンディングを実行する手段550は、逆圧縮比を適用することにより、信号をデコードするように機能し、逆変換手段560は、信号の時間周波数分解を逆にする、時間周波数再構成回路として機能する。
図6は、ワイヤレスのオーディオ/スピーチのデコーディングの向上を容易にする受信機600の説明図である。受信機600は、例えば、(示していない)受信アンテナから信号を受け取り、受け取った信号に対して通常の動作を実行し(例えば、フィルタリングし、増幅し、ダウンコンバートするなど)、調整された信号をデジタル化して、サンプルを取得する。受信機600は、復調器604を含むことができ、復調器604は、受け取ったシンボルを復調して、チャネル推定のために、それらをプロセッサ606に提供できる。プロセッサ606は、受信機600により受信された情報を分析するのに専用のプロセッサ、受信機600の1つ以上のコンポーネントを制御するプロセッサ、および/または、受信機600により受信された情報を分析し、かつ、受信機600の1つ以上のコンポーネントを制御するプロセッサとすることができる。
受信機600は、さらに、メモリ608を備えることができ、メモリ608は、プロセッサ606に動作可能に結合されており、送信すべきデータ、受信データ、利用可能なチャネルに関する情報、分析された信号および/または干渉強度に関係付けられているデータ、割り当てられているチャネル、電力、レート、または、これらに類似するものに関連する情報、ならびに、チャネルを推定し、チャネルによって通信するための、他の適切な情報を記憶してもよい。(例えば、性能ベースで、容量ベースで、など)チャネルを推定すること、および/または利用することに関係付けられたプロトコルおよび/またはアルゴリズムをメモリ608は付加的に記憶できる。さらに、メモリ608は、実行可能なコードおよび/または命令を記憶してもよい。例えば、メモリ608は、受信したスピーチ/オーディオ信号を復元するための命令を記憶してもよい。さらに、メモリ608は、逆エンコーディング比を適用することにより、逆ログコンパンディングを実行して、信号をデコードするための命令と、逆変換を実行して、信号の時間周波数分解を逆にするための命令とを記憶してもよい。
ここで記述したデータ記憶装置(例えば、メモリ608)は、揮発性メモリまたは不揮発性メモリのいずれかとすることができ、あるいは揮発性および不揮発性メモリの両方を含むことができる理解される。実例として、これに限定されないが、不揮発性メモリは、読み出し専用メモリ(ROM)、プログラム可能ROM(PROM)、電気的にプログラム可能ROM(EPROM)、電気的に消去可能PROM(EEPROM)、またはフラッシュメモリを含むことができる。揮発性メモリは、外部キャッシュメモリとして動作するランダムアクセスメモリ(RAM)を含むことができる。実例として、これに限定されないが、RAMは多くの形態で利用でき、例えば同期RAM(SRAM)、ダイナミックRAM(DRAM)、同期DRAM(SDRAM)、倍速データレートSDRAM(DDR SDRAM)、エンハンストSDRAM(ESDRAM)、シンクリンクDRAM(SLDRAM)、およびダイレクトラムバスRAM(DRRAM)がある。本主題のシステムおよび方法のメモリ608は、これらに限定されず、これらおよび他の任意の適当なタイプのメモリを具備するように意図されている。
プロセッサ606はさらに、デコーダ610に動作可能に結合されており、デコーダ610において、逆ログコンパンディングブロック612が、逆圧縮比を適用することにより、逆ログコンパンディングを実行して、信号をデコードしてもよく、逆変換ブロック618(例えば、時間周波数再構成回路)が、逆変換を実行して、信号の時間周波数分解を逆にしてもよい。逆ログコンパンディングブロック612および/または逆変換ブロック618は、時間周波数の再構成された信号を取得するために、図2ないし5に関して上述した観点を含んでいてもよい。プロセッサ606から分離しているものとして描写しているが、逆ログコンパンディングブロック612および/または逆変換ブロック618は、プロセッサ606または(示していない)多数のプロセッサの一部であってもよいことを理解すべきである。出力ブロック620は、プロセッサ606からの出力を提供する。
図7は、ここで開示した観点にしたがって、スピーチ/オーディオ信号の圧縮を容易にする、例示的な送信機システム700の説明図である。システム700は、(示していない)複数の送信アンテナを通して(示していない)1つ以上の移動デバイスに送信する送信機724を備えている。送信機への入力は、図6に関して上述したプロセッサと同様のものとすることができるプロセッサ714により分析してもよい。プロセッサ714は、メモリ716に結合されており、メモリ716は、(示していない)移動デバイスまたは(示していない)異なる基地局に送信されるデータあるいは移動デバイスまたは異なる基地局から受信したデータに関連した情報、および/または、ここで示したさまざまな動作および機能を実行することに関連した、他の任意の適切な情報を記憶する。
プロセッサ714はさらに、エンコーダ718に結合されており、エンコーダ718において、変換ブロック720は、受信したスピーチ/オーディオ信号の時間周波数分解を実行でき、ログコンパンディングブロック722は、各周波数帯域に対する各スペクトル係数に対して異なる圧縮比を適用することにより、ログコンパンディングを実行して、信号をエンコードできる。変換ブロック720および/またはログコンパンディングブロック722は、図2ないし図5に関して上述した観点を含んでいてもよい。送信すべき情報を変調器726に提供してもよい。変調器726は、送信機724により、(示していない)アンテナを通して(示していない)移動デバイスに送信するために、情報を多重化できる。プロセッサ714から分離しているものとして描写しているが、変換ブロック720および/またはログコンパンディングブロック722は、プロセッサ714または(示していない)多数のプロセッサの一部であってもよいことを理解すべきである。
図6に関して記述した受信機および図7に関して記述した送信機システムは、単一のデバイス(例えば、移動デバイス)中で組み合わされていてもよく、または、他のデバイス(例えば、イヤホンまたは重要な身体機能を監視するセンサー)の、分離した部分であってもよいことに注目すべきである。
図8は、時間周波数分解およびログコンパンディングを使用して、データ信号をエンコードするように動作可能なさまざまなモジュールを有するワイヤレス通信デバイスのための、データ信号をエンコードするエンコーディング装置800を図示する。データ信号受信機802が、データ信号を受信するために使用される。時間−周波数分解器804が、データ信号の時間周波数分解を実行して、少なくとも2つのスペクトル係数を提供するように構成されている。ログコンパンダー806が、少なくとも2つのスペクトル係数のログコンパンディングを実行して、圧縮されたデータ信号を提供するように構成されている。
図9は、逆ログコンパンディングおよび逆時間周波数分解を使用して、データ信号をデコードするように動作可能なさまざまなモジュールを有するワイヤレス通信デバイスのための、データ信号をデコードするデコーディング装置900を図示する。圧縮信号受信機902が、圧縮された信号を受信するために使用される。逆ログコンパンダー904が、圧縮データ信号をデコードすることにより、逆ログコンパンディングを実行して、少なくとも2つのスペクトル係数を取得するように構成されている。時間周波数分解器906が、少なくとも2つのスペクトル係数に対して逆時間周波数分解を実行して、データ信号を提供するように構成されている。
ここで記述した技術は、CDMAシステムや、TDMAシステムや、FDMAシステムや、OFDMAシステムや、SC−FDMAシステムや、他のシステムのような、さまざまなワイヤレス通信システムに対して使用してもよい。用語“システム”および“ネットワーク”は、区別なく使用されることが多い。CDMAシステムは、ユニバーサル地上無線アクセス(UTRA)や、cdma2000などのような無線技術を実現できる。UTRAは、広帯域CDMA(WCDMA)と、CDMAの他の変形体とを含む。さらに、cdma2000は、IS−2000、IS−95およびIS−856の標準規格をカバーする。TDMAシステムは、移動体通信用グローバルシステム(GSM(登録商標))のような無線技術を実現できる。OFDMAシステムは、進化型UTRA(E−UTRA)や、ウルトラモバイルブロードバンド(UMB)や、IEEE802.11(Wi−Fi)や、IEEE802.16(WiMAX)や、IEEE802.20や、フラッシュ−OFDM(登録商標)などのような無線技術を実現できる。UTRAおよびE−UTRAは、ユニバーサル移動体電気通信システム(UMTS)の一部である。3GPPロングタームエボリューション(LTE)は、E−UTRAを使用するUMTSのリリースであり、E−UTRAは、ダウンリンク上でOFDMAを用い、アップリンク上でSC−FDMAを用いる。UTRA、E−UTRA、UMTS、LTE、および、GSMは、“第3世代パートナーシップ・プロジェクト”(3GPP)と名付けられた組織からの文書で説明されている。さらに、cdma2000およびUMBは、“第3世代パートナーシップ・プロジェクト2”(3GPP2)と名付けられた組織からの文書で説明されている。さらに、そのようなワイヤレス通信システムは、対になっていない、認可されていないスペクトルを使用することが多いピアツーピア(例えば、モバイル対モバイル)アドホックネットワークシステム、802.xxワイヤレスLANまたはBLUETOOTH(登録商標)、および、他の任意の、短距離または長距離のワイヤレス通信技術を付加的に含んでいてもよい。
1つ以上の観点において、記述した機能は、ハードウェア、ソフトウェア、ファームウェア、またはこれらの任意の組み合わせ中で実現してもよい。ソフトウェアにおいて実現する場合、コンピュータ読み取り可能媒体上に、1つ以上の命令またはコードとして、機能を記憶させてもよく、または機能を送信してもよい。コンピュータ読み取り可能媒体は、コンピュータ記憶媒体と、ある場所から別の場所へのコンピュータプログラムの転送を容易にする何らかの媒体を含む通信媒体との両方を含む。記憶媒体は、コンピュータによりアクセスできる任意の利用可能な媒体であってもよい。一例として、限定ではないが、そのようなコンピュータ読み取り可能媒体は,RAM、ROM、EEPROM、CD−ROMまたは他の光学ディスク記憶装置、磁気ディスク記憶装置または他の磁気記憶デバイス、あるいは、命令またはデータ構造の形態で所望のプログラムコードを搬送または記憶するために使用でき、そして、コンピュータによりアクセスできる他の任意の媒体を備えることができる。さらに、いくつかの接続は、コンピュータ読み取り可能媒体と呼ばれる。例えば、ソフトウェアが、同軸ケーブル、光ファイバケーブル、ツイストペア線、デジタル加入者線(DSL)、あるいは、赤外線、無線、およびマイクロ波のようなワイヤレス技術を使用して、ウェブサイト、サーバまたは他のリモート情報源から送信される場合、同軸ケーブル、光ファイバケーブル、ツイストペア線、DSL、あるいは、赤外線、無線、およびマイクロ波のようなワイヤレス技術は、媒体の定義に含まれる。ここで使用されるディスク(Diskおよびdisc)は、コンパクトディスク(CD)、レーザーディスク(登録商標)、光ディスク、デジタルバーサタイルディスク(DVD)、フロッピー(登録商標)ディスク、およびブルーレイディスクを含み、ディスク(disk)は通常、磁気的にデータを再生し、一方、ディスク(disc)は、レーザにより光学的にデータを再生する。上述の組み合わせもまた、コンピュータ読み取り可能媒体の範囲内に含まれるべきである。
ここで記述したコンポーネントは、さまざまな方法で実現してもよい。例えば、装置は、例えば、1つ以上の集積回路(例えば、ASIC)により実現される機能を表してもよい、一連の相互関係のある機能ブロックとして表されてもよく、または、ここで教示される他の何らかの方法で実現されてもよい。ここで記述するとき、集積回路は、プロセッサ、ソフトウェア、他のコンポーネント、または、これらのいくつかの組み合わせを含んでいてもよい。そのような装置は、さまざまな図に関して上述した機能のうちの1つ以上を実行してもよい、1つ以上のモジュールを含んでいてもよい。
先に注目したように、いくつかの観点において、これらのコンポーネントは、適切なプロセッサコンポーネントにより実現してもよい。これらのプロセッサコンポーネントは、いくつかの観点において、少なくとも部分的に、ここで教示した構造を使用して、実現されてもよい。いくつかの観点において、プロセッサは、これらのコンポーネントのうちの1つ以上の機能の一部またはすべてを実現するように適合されていてもよい。
先に注目したように、装置は、1つ以上の集積回路を備えていてもよい。例えば、いくつかの観点において、単一の集積回路が、説明されているコンポーネントのうちの1つ以上の機能を実現してもよく、一方、他の観点において、1つより多い集積回路が、説明されているコンポーネントのうちの1つ以上の機能を実現してもよい。
さらに、ここで記述したコンポーネントおよび機能は、任意の適切な手段を使用して実現してもよい。そのような手段は、少なくとも部分的に、ここで教示した、対応する構造を使用して、実現されてもよい。例えば、上述したコンポーネントは、“ASIC”中で実現してもよく、また、同様に指定された“手段”機能に対応してもよい。したがって、いくつかの観点において、そのような手段のうちの1つ以上は、プロセッサコンポーネント、集積回路、または、ここで教示した他の適切な構造、のうちの1つ以上を使用して実現してもよい。
さらに、“第1の”、“第2の”などのような呼称を使用する、ここでの要素に対する何らかの参照は、一般に、それらの要素の量または順序を限定しない。むしろ、これらの呼称は、2つ以上の要素または要素の実例を区別する便利な方法として、ここで使用されている。したがって、第1および第2の要素に対する参照は、2つの要素だけが、そこで用いられること、または、第1の要素が、何らかの方法で、第2の要素に先行しなければならないことを意味するものではない。さらに、特に述べない限り、1組の要素は、1つ以上の要素から構成されていてもよい。さらに、詳細な説明または特許請求の範囲中で使用される、用語の形態“A、B、または、Cのうちの少なくとも1つ”は、“AまたはBまたはC、あるいは、これらのいくつかの組み合わせ”を意味する。
当業者は、さまざまな異なる技術および技法のいずれかを使用して、情報および信号を表してもよいことを理解するであろう。例えば、先の説明全体を通して参照されている、データ、命令、コマンド、情報、信号、ビット、シンボル、および、チップを、電圧、電流、電磁波、磁界または磁気の粒子、光学界または光の粒子、あるいはこれらの何らかの組み合わせにより、表してもよい。
電子ハードウェア(例えば、ソースコーディングまたは他の何らかの技術を使用して設計されてもよい、デジタル構成、アナログ構成、あるいは、2つの組み合わせ)、(便宜上、“ソフトウェア”または“ソフトウェアモジュール”として、ここでは呼ばれている)命令を組み込んでいる、さまざまな形態のプログラムまたは設計コード、あるいは、両方の組み合わせとして、ここで開示した観点に関して記述したさまざまな実例となる論理ブロック、モジュール、プロセッサ、手段、回路、および、アルゴリズムステップを実現してもよいことを、当業者はさらに理解するであろう。ハードウェアおよびソフトウェアのこの互換性を明瞭に説明するために、さまざまな実例となるコンポーネント、ブロック、モジュール、回路、およびステップをそれらの機能の点から一般的に上述した。このような機能がハードウェアまたはソフトウェアとして実現されるかどうかは、特定の用途およびシステム全体に課される設計制約によって決まる。それぞれの特定の用途に対してさまざまな方法で、当業者は記述した機能を実現するかもしれないが、このような実現決定は、ここで開示した観点の範囲から逸脱を生じさせるものとして解釈すべきではない。
ここで開示した観点に関連して記述したさまざまな実例となる論理ブロック、モジュールおよび回路は、集積回路(“IC”)、アクセス端末、または、アクセスポイント内で実現してもよい。ICは、汎用プロセッサ、デジタル信号プロセッサ(DSP)、特定用途向け集積回路(ASIC),フィールドプログラム可能ゲートアレイ(FPGA)または他のプログラム可能論理デバイス、ディスクリートゲートまたはトランジスタ論理、ディスクリートハードウェアコンポーネント、電気コンポーネント、光コンポーネント、機械式コンポーネント、あるいはここで記述した機能を実行するために設計されたそれらの任意の組み合わせを含んでいてもよく、ICの内部に、ICの外部に、またはその両方に存在するコードまたは命令を実行してもよい。汎用プロセッサは、マイクロプロセッサであってもよいが、代替として、プロセッサは、任意の従来のプロセッサ、制御装置、マイクロ制御装置、または状態遷移機械であってもよい。プロセッサはまた、計算デバイスの組み合わせ、例えば、DSPとマイクロプロセッサとの組み合わせ、複数のマイクロプロセッサ、DSPコアに関連した1つ以上のマイクロプロセッサ、または他の任意のこのような構成として実現してもよい。
開示したプロセスにおける、ステップの特定の順序またはヒエラルキーは、例示的なアプローチの一例であることが理解される。デザイン嗜好に基づいて、プロセスにおける、ステップの特定の順序またはヒエラルキーは、ここで開示した観点の範囲内にとどまりながら並べ替えてもよいことが理解される。方法の請求項は、サンプルの順序におけるさまざまなステップの要素を示し、示した、特定の順序またはヒエラルキーに限定するように向けられていない。
ここで開示した観点に関して記述した方法またはアルゴリズムのステップを、ハードウェア中で直接、プロセッサにより実行されるソフトウェアモジュール中で、またはその2つの組み合わせ中で具現してもよい。(例えば、実行可能な命令および関連データを含む)ソフトウェアモジュールおよび他のデータは、RAMメモリ、フラッシュメモリ、ROMメモリ、EPROMメモリ、EEPROMメモリ、レジスタ、ハードディスク、リムーバルディスク、CD−ROM,または技術的に知られている他の任意の形態のコンピュータ読み取り可能記憶媒体中に存在してもよい。プロセッサが記憶媒体から情報(例えば、コード)を読み取ることができ、記憶媒体に情報を書き込むことができるように、例示的な記憶媒体は、例えば、(ここでば、便宜上、“プロセッサ”と呼ばれている)コンピュータ/プロセッサのような機械に結合されている。例示的な記憶媒体は、プロセッサと一体化されていてもよい。プロセッサおよび記憶媒体は、ASIC中に存在してもよい。ASICはユーザ機器中に存在してもよい。代わりに、プロセッサおよび記憶媒体は、ユーザ機器中にディスクリートコンポーネントとして存在してもよい。さらに、いくつかの観点において、任意の適切なコンピュータプログラムプロダクトは、ここで開示した観点のうちの1つ以上に関する(例えば、少なくとも1つのコンピュータにより実行可能な)コードを含むコンピュータ読み取り可能媒体を備えていてもよい。いくつかの観点において、コンピュータプログラムプロダクトは、実装材料を備えていてもよい。
いかなる当業者であっても、本開示の全部の範囲を十分に理解できるように、記述をこれまでに提供している。ここで開示したさまざまな構成に対する修正が当業者に容易に明らかとなるであろう。したがって、特許請求の範囲は、ここで記述した開示のさまざまな観点に限定されるように意図されていないが、特許請求の範囲の言語に矛盾しない全範囲に一致すべきであり、単一の要素に対する参照は、特にそう述べられていない限り、“1つおよびただ1つ”を意味するように意図されておらず、むしろ“1以上”を意味するように意図されている。さらに、特許請求の範囲中で使用される、語句“a、b、および、cのうちの少なくとも1つ”は、a、b、または、c、あるいは、これらの任意の組み合せに向けられる請求項として解釈すべきである。特に述べられていない限り、用語“いくつか”または“少なくとも1つ”は、1つ以上の要素を指す。当業者に知られている、または後に知られるようになる、本開示全体を通して記述したさまざまな観点の要素に対するすべての構造的および機能的な均等物は、明白に、参照によりここに組み込まれ、特許請求の範囲により包含されるように意図されている。さらに、ここで開示したものは、そのような開示が特許請求の範囲中で明示的に記載されているかどうかにかかわらず、公開専用のものであるように意図されていない。要素が、語句“手段”を使用して明白に記載されていない限り、または方法の請求項のケースにおいて、要素が、語句“ステップ”を使用して記載されていない限り、請求項の要素は、合衆国法典第35部112条第6項のもとで解釈すべきでない。
先の開示は、実例となる観点および/または観点を論じているが、特許請求の範囲により規定される、記述した観点および/または観点の範囲から逸脱することなく、さまざまな変更および修正を実施できることに注目すべきである。さらに、記述した観点および/または観点の要素は、単数で記述または請求されているかもしれないが、単数への制限が明示的に述べられていない限り、複数が考えられる。さらに、特に述べていない限り、何らかの観点および/または観点のすべてまたは一部を、他の何らかの観点および/または観点のすべてまたは一部とともに利用してもよい。
先の開示は、実例となる観点および/または観点を論じているが、特許請求の範囲により規定される、記述した観点および/または観点の範囲から逸脱することなく、さまざまな変更および修正を実施できることに注目すべきである。さらに、記述した観点および/または観点の要素は、単数で記述または請求されているかもしれないが、単数への制限が明示的に述べられていない限り、複数が考えられる。さらに、特に述べていない限り、何らかの観点および/または観点のすべてまたは一部を、他の何らかの観点および/または観点のすべてまたは一部とともに利用してもよい。
以下に、本願出願の当初の特許請求の範囲に記載された発明を付記する。
[1]エンコードするための方法において、
前記方法は、
データ信号を受信することと、
前記データ信号の変換を実行して、少なくとも2つの係数を提供することと、
前記少なくとも2つの係数のログコンパンディングを実行して、圧縮されたデータ信号を提供することとを含む方法。
[2]前記変換は、時間周波数分解と、時間スケール分解とのうちの1つである上記[1]記載の方法。
[3]前記変換は、離散コサイン変換(DCT)変換である上記[1]記載の方法。
[4]前記変換は、修正離散コサイン変換(MDCT)変換である上記[1]記載の方法。
[5]各係数は、スペクトル係数である上記[1]記載の方法。
[6]前記ログコンパンディングは、少なくとも2つのコンパンディングパラメータを使用して、前記少なくとも2つの係数をエンコードすることを含む上記[1]記載の方法。
[7]前記少なくとも2つのコンパンディングパラメータは、同じ値を有する上記[6]記載の方法。
[8]前記データ信号は、オーディオ信号と、スピーチ信号と、生体信号とのうちの1つである上記[1]記載の方法。
[9]デコードするための方法において、
前記方法は、
圧縮されたデータ信号を受信することと、
前記圧縮データ信号をデコードすることにより逆ログコンパンディングを実行して、少なくとも2つの係数を取得することと、
前記少なくとも2つの係数に対して逆変換を実行して、データ信号を提供することとを含む方法。
[10]前記逆変換は、逆時間周波数分解と、逆時間スケール分解とのうちの1つである上記[9]記載の方法。
[11]前記逆変換は、逆離散コサイン変換(DCT)変換である上記[9]記載の方法。
[12]前記逆変換は、逆修正離散コサイン変換(MDCT)変換である上記[9]記載の方法。
[13]各係数は、スペクトル係数である上記[9]記載の方法。
[14]前記逆ログコンパンディングは、少なくとも2つのコンパンディングパラメータを使用して、前記圧縮データ信号をデコードすることにより実行される上記[9]記載の方法。
[15]前記コンパンディングパラメータは、同じ値を有する上記[14]記載の方法。
[16]前記データ信号は、オーディオ信号と、スピーチ信号と、生体信号とのうちの1つである上記[9]記載の方法。
[17]エンコードする装置において、
前記装置は、
データ信号を受信するように構成されている受信機と、
前記データ信号を分解して、少なくとも2つの係数を提供するように構成されている変換回路と、
前記少なくとも2つの係数をエンコードして、圧縮されたデータ信号を提供するように構成されているログコンパンディング回路とを具備する装置。
[18]前記変換は、時間周波数分解と、時間スケール分解とのうちの1つである上記[17]記載の装置。
[19]前記変換は、DCT変換である上記[17]記載の装置。
[20]前記変換は、修正DCT(MDCT)変換である上記[17]記載の装置。
[21]各係数は、スペクトル係数である上記[17]記載の装置。
[22]前記ログコンパンディング回路は、異なるコンパンディングパラメータを使用して、各係数をエンコードする上記[17]記載の装置。
[23]前記異なるコンパンディングパラメータは、同じ値を有する上記[22]記載の装置。
[24]前記データ信号は、オーディオ信号と、スピーチ信号とのうちの1つである上記[17]記載の装置。
[25]デコードする装置において、
前記装置は、
圧縮されたデータ信号を受信するように構成されている受信機と、
前記圧縮データ信号をデコードして、少なくとも2つの係数を取得するように構成されている逆ログコンパンディング回路と、
前記少なくとも2つの係数からデータ信号を再構成するように構成されている逆変換回路とを具備する装置。
[26]前記逆変換回路は、逆時間周波数分解と、逆時間スケール分解とのうちの1つである上記[25]記載の装置。
[27]前記逆変換回路は、逆DCT変換である上記[25]記載の装置。
[28]前記逆変換回路は、逆修正DCT(MDCT)変換である上記[25]記載の装置。
[29]各係数は、スペクトル係数である上記[25]記載の装置。
[30]前記逆ログコンパンディング回路は、少なくとも2つのコンパンディングパラメータを使用して、前記圧縮データ信号をデコードする上記[25]記載の装置。
[31]前記コンパンディングパラメータは、同じ値を有する上記[30]記載の装置。
[32]前記データ信号は、オーディオ信号と、スピーチ信号とのうちの1つである上記[25]記載の装置。
[33]エンコードする装置において、
前記装置は、
データ信号を受信する手段と、
前記データ信号の変換を実行して、少なくとも2つの係数を提供する手段と、
前記少なくとも2つの係数のログコンパンディングを実行して、圧縮されたデータ信号を提供する手段とを具備する装置。
[34]前記変換は、時間周波数分解と、時間スケール分解とのうちの1つである上記[33]記載の装置。
[35]前記変換は、DCT変換である上記[33]記載の装置。
[36]前記変換は、修正DCT(MDCT)変換である上記[33]記載の装置。
[37]各係数は、スペクトル係数である上記[33]記載の装置。
[38]前記ログコンパンディングは、少なくとも2つのコンパンディングパラメータを使用して、各係数をエンコードすることにより実行される上記[33]記載の装置。
[39]前記コンパンディングパラメータは、同じ値を有する上記[38]記載の装置。
[40]前記データ信号は、オーディオ信号と、スピーチ信号とのうちの1つである上記[33]記載の装置。
[41]デコードする装置において、
前記装置は、
圧縮されたデータ信号を受信する手段と、
前記圧縮データ信号をデコードすることにより逆ログコンパンディングを実行して、少なくとも2つの係数を取得する手段と、
前記少なくとも2つの係数に対して逆変換を実行して、データ信号を提供する手段とを具備する装置。
[42]前記逆変換は、逆時間周波数分解と、逆時間スケール分解とのうちの1つである上記[41]記載の装置。
[43]前記逆変換は、逆DCT変換である上記[41]記載の装置。
[44]前記逆変換は、逆修正DCT(MDCT)変換である上記[41]記載の装置。
[45]各係数は、スペクトル係数である上記[41]記載の装置。
[46]前記逆ログコンパンディングは、少なくとも2つのコンパンディングパラメータを使用して、前記圧縮データ信号をデコードすることにより実行される上記[41]記載の装置。
[47]前記コンパンディングパラメータは、同じ値を有する上記[46]記載の装置。
[48]前記データ信号は、オーディオ信号と、スピーチ信号と、生体信号とのうちの1つである上記[41]記載の装置。
[49]エンコードするコンピュータプログラムプロダクトにおいて、
データ信号を受信し、
前記データ信号の変換を実行して、少なくとも2つの係数を提供し、
前記少なくとも2つの係数のログコンパンディングを実行して、圧縮されたデータ信号を提供するように実行可能な命令によりエンコードされているコンピュータ読み取り可能媒体を具備するコンピュータプログラムプロダクト。
[50]デコードするコンピュータプログラムプロダクトにおいて、
圧縮されたデータ信号を受信し、
前記圧縮データ信号をデコードすることにより逆ログコンパンディングを実行して、少なくとも2つの係数を取得し、
前記少なくとも2つの係数に対して逆変換を実行して、データ信号を提供するように実行可能な命令によりエンコードされているコンピュータ読み取り可能媒体を具備するコンピュータプログラムプロダクト。
[51]ヘッドセットにおいて、
圧縮されたデータ信号を受信するように構成されている受信機と、
前記圧縮データ信号をデコードして、少なくとも2つの係数を取得するように構成されている逆ログコンパンディング回路と、
前記少なくとも2つの係数からデータ信号を再構成するように構成されている逆変換回路と、
前記再構成されたデータ信号に基づいて、オーディオ出力を提供するように構成されているトランスデューサとを具備するヘッドセット。
[52]検知デバイスにおいて、
データ信号を検出するように構成されているセンサーと、
前記データ信号を分解して、少なくとも2つの係数を提供するように構成されている変換回路と、
前記少なくとも2つの係数をエンコードして、圧縮されたデータ信号を提供するように構成されているログコンパンディング回路と、
前記圧縮データ信号を送信するように構成されている送信機とを具備する検知デバイス。
[53]ハンドセットにおいて、
オーディオ信号を検出するように構成されているトランスデューサと、
前記オーディオ信号を分解して、少なくとも2つの係数を提供するように構成されている変換回路と、
前記少なくとも2つの係数をエンコードして、圧縮されたオーディオ信号を提供するように構成されているログコンパンディング回路と、
前記圧縮オーディオ信号を送信するように構成されているアンテナとを具備するハンドセット。
[54]ウォッチにおいて、
圧縮されたデータ信号を受信するように構成されている受信機と、
前記圧縮データ信号をデコードして、少なくとも2つの係数を取得するように構成されている逆ログコンパンディング回路と、
前記少なくとも2つの係数からデータ信号を再構成するように構成されている逆変換回路と、
前記再構成されたデータ信号に基づいて、表示を提供するように構成されているユーザインターフェースとを具備するウォッチ。
以下に、本願出願の当初の特許請求の範囲に記載された発明を付記する。
[1]エンコードするための方法において、
前記方法は、
データ信号を受信することと、
前記データ信号の変換を実行して、少なくとも2つの係数を提供することと、
前記少なくとも2つの係数のログコンパンディングを実行して、圧縮されたデータ信号を提供することとを含む方法。
[2]前記変換は、時間周波数分解と、時間スケール分解とのうちの1つである上記[1]記載の方法。
[3]前記変換は、離散コサイン変換(DCT)変換である上記[1]記載の方法。
[4]前記変換は、修正離散コサイン変換(MDCT)変換である上記[1]記載の方法。
[5]各係数は、スペクトル係数である上記[1]記載の方法。
[6]前記ログコンパンディングは、少なくとも2つのコンパンディングパラメータを使用して、前記少なくとも2つの係数をエンコードすることを含む上記[1]記載の方法。
[7]前記少なくとも2つのコンパンディングパラメータは、同じ値を有する上記[6]記載の方法。
[8]前記データ信号は、オーディオ信号と、スピーチ信号と、生体信号とのうちの1つである上記[1]記載の方法。
[9]デコードするための方法において、
前記方法は、
圧縮されたデータ信号を受信することと、
前記圧縮データ信号をデコードすることにより逆ログコンパンディングを実行して、少なくとも2つの係数を取得することと、
前記少なくとも2つの係数に対して逆変換を実行して、データ信号を提供することとを含む方法。
[10]前記逆変換は、逆時間周波数分解と、逆時間スケール分解とのうちの1つである上記[9]記載の方法。
[11]前記逆変換は、逆離散コサイン変換(DCT)変換である上記[9]記載の方法。
[12]前記逆変換は、逆修正離散コサイン変換(MDCT)変換である上記[9]記載の方法。
[13]各係数は、スペクトル係数である上記[9]記載の方法。
[14]前記逆ログコンパンディングは、少なくとも2つのコンパンディングパラメータを使用して、前記圧縮データ信号をデコードすることにより実行される上記[9]記載の方法。
[15]前記コンパンディングパラメータは、同じ値を有する上記[14]記載の方法。
[16]前記データ信号は、オーディオ信号と、スピーチ信号と、生体信号とのうちの1つである上記[9]記載の方法。
[17]エンコードする装置において、
前記装置は、
データ信号を受信するように構成されている受信機と、
前記データ信号を分解して、少なくとも2つの係数を提供するように構成されている変換回路と、
前記少なくとも2つの係数をエンコードして、圧縮されたデータ信号を提供するように構成されているログコンパンディング回路とを具備する装置。
[18]前記変換は、時間周波数分解と、時間スケール分解とのうちの1つである上記[17]記載の装置。
[19]前記変換は、DCT変換である上記[17]記載の装置。
[20]前記変換は、修正DCT(MDCT)変換である上記[17]記載の装置。
[21]各係数は、スペクトル係数である上記[17]記載の装置。
[22]前記ログコンパンディング回路は、異なるコンパンディングパラメータを使用して、各係数をエンコードする上記[17]記載の装置。
[23]前記異なるコンパンディングパラメータは、同じ値を有する上記[22]記載の装置。
[24]前記データ信号は、オーディオ信号と、スピーチ信号とのうちの1つである上記[17]記載の装置。
[25]デコードする装置において、
前記装置は、
圧縮されたデータ信号を受信するように構成されている受信機と、
前記圧縮データ信号をデコードして、少なくとも2つの係数を取得するように構成されている逆ログコンパンディング回路と、
前記少なくとも2つの係数からデータ信号を再構成するように構成されている逆変換回路とを具備する装置。
[26]前記逆変換回路は、逆時間周波数分解と、逆時間スケール分解とのうちの1つである上記[25]記載の装置。
[27]前記逆変換回路は、逆DCT変換である上記[25]記載の装置。
[28]前記逆変換回路は、逆修正DCT(MDCT)変換である上記[25]記載の装置。
[29]各係数は、スペクトル係数である上記[25]記載の装置。
[30]前記逆ログコンパンディング回路は、少なくとも2つのコンパンディングパラメータを使用して、前記圧縮データ信号をデコードする上記[25]記載の装置。
[31]前記コンパンディングパラメータは、同じ値を有する上記[30]記載の装置。
[32]前記データ信号は、オーディオ信号と、スピーチ信号とのうちの1つである上記[25]記載の装置。
[33]エンコードする装置において、
前記装置は、
データ信号を受信する手段と、
前記データ信号の変換を実行して、少なくとも2つの係数を提供する手段と、
前記少なくとも2つの係数のログコンパンディングを実行して、圧縮されたデータ信号を提供する手段とを具備する装置。
[34]前記変換は、時間周波数分解と、時間スケール分解とのうちの1つである上記[33]記載の装置。
[35]前記変換は、DCT変換である上記[33]記載の装置。
[36]前記変換は、修正DCT(MDCT)変換である上記[33]記載の装置。
[37]各係数は、スペクトル係数である上記[33]記載の装置。
[38]前記ログコンパンディングは、少なくとも2つのコンパンディングパラメータを使用して、各係数をエンコードすることにより実行される上記[33]記載の装置。
[39]前記コンパンディングパラメータは、同じ値を有する上記[38]記載の装置。
[40]前記データ信号は、オーディオ信号と、スピーチ信号とのうちの1つである上記[33]記載の装置。
[41]デコードする装置において、
前記装置は、
圧縮されたデータ信号を受信する手段と、
前記圧縮データ信号をデコードすることにより逆ログコンパンディングを実行して、少なくとも2つの係数を取得する手段と、
前記少なくとも2つの係数に対して逆変換を実行して、データ信号を提供する手段とを具備する装置。
[42]前記逆変換は、逆時間周波数分解と、逆時間スケール分解とのうちの1つである上記[41]記載の装置。
[43]前記逆変換は、逆DCT変換である上記[41]記載の装置。
[44]前記逆変換は、逆修正DCT(MDCT)変換である上記[41]記載の装置。
[45]各係数は、スペクトル係数である上記[41]記載の装置。
[46]前記逆ログコンパンディングは、少なくとも2つのコンパンディングパラメータを使用して、前記圧縮データ信号をデコードすることにより実行される上記[41]記載の装置。
[47]前記コンパンディングパラメータは、同じ値を有する上記[46]記載の装置。
[48]前記データ信号は、オーディオ信号と、スピーチ信号と、生体信号とのうちの1つである上記[41]記載の装置。
[49]エンコードするコンピュータプログラムプロダクトにおいて、
データ信号を受信し、
前記データ信号の変換を実行して、少なくとも2つの係数を提供し、
前記少なくとも2つの係数のログコンパンディングを実行して、圧縮されたデータ信号を提供するように実行可能な命令によりエンコードされているコンピュータ読み取り可能媒体を具備するコンピュータプログラムプロダクト。
[50]デコードするコンピュータプログラムプロダクトにおいて、
圧縮されたデータ信号を受信し、
前記圧縮データ信号をデコードすることにより逆ログコンパンディングを実行して、少なくとも2つの係数を取得し、
前記少なくとも2つの係数に対して逆変換を実行して、データ信号を提供するように実行可能な命令によりエンコードされているコンピュータ読み取り可能媒体を具備するコンピュータプログラムプロダクト。
[51]ヘッドセットにおいて、
圧縮されたデータ信号を受信するように構成されている受信機と、
前記圧縮データ信号をデコードして、少なくとも2つの係数を取得するように構成されている逆ログコンパンディング回路と、
前記少なくとも2つの係数からデータ信号を再構成するように構成されている逆変換回路と、
前記再構成されたデータ信号に基づいて、オーディオ出力を提供するように構成されているトランスデューサとを具備するヘッドセット。
[52]検知デバイスにおいて、
データ信号を検出するように構成されているセンサーと、
前記データ信号を分解して、少なくとも2つの係数を提供するように構成されている変換回路と、
前記少なくとも2つの係数をエンコードして、圧縮されたデータ信号を提供するように構成されているログコンパンディング回路と、
前記圧縮データ信号を送信するように構成されている送信機とを具備する検知デバイス。
[53]ハンドセットにおいて、
オーディオ信号を検出するように構成されているトランスデューサと、
前記オーディオ信号を分解して、少なくとも2つの係数を提供するように構成されている変換回路と、
前記少なくとも2つの係数をエンコードして、圧縮されたオーディオ信号を提供するように構成されているログコンパンディング回路と、
前記圧縮オーディオ信号を送信するように構成されているアンテナとを具備するハンドセット。
[54]ウォッチにおいて、
圧縮されたデータ信号を受信するように構成されている受信機と、
前記圧縮データ信号をデコードして、少なくとも2つの係数を取得するように構成されている逆ログコンパンディング回路と、
前記少なくとも2つの係数からデータ信号を再構成するように構成されている逆変換回路と、
前記再構成されたデータ信号に基づいて、表示を提供するように構成されているユーザインターフェースとを具備するウォッチ。
Claims (54)
- エンコードするための方法において、
前記方法は、
データ信号を受信することと、
前記データ信号の変換を実行して、少なくとも2つの係数を提供することと、
前記少なくとも2つの係数のログコンパンディングを実行して、圧縮されたデータ信号を提供することとを含む方法。 - 前記変換は、時間周波数分解と、時間スケール分解とのうちの1つである請求項1記載の方法。
- 前記変換は、離散コサイン変換(DCT)変換である請求項1記載の方法。
- 前記変換は、修正離散コサイン変換(MDCT)変換である請求項1記載の方法。
- 各係数は、スペクトル係数である請求項1記載の方法。
- 前記ログコンパンディングは、少なくとも2つのコンパンディングパラメータを使用して、前記少なくとも2つの係数をエンコードすることを含む請求項1記載の方法。
- 前記少なくとも2つのコンパンディングパラメータは、同じ値を有する請求項6記載の方法。
- 前記データ信号は、オーディオ信号と、スピーチ信号と、生体信号とのうちの1つである請求項1記載の方法。
- デコードするための方法において、
前記方法は、
圧縮されたデータ信号を受信することと、
前記圧縮データ信号をデコードすることにより逆ログコンパンディングを実行して、少なくとも2つの係数を取得することと、
前記少なくとも2つの係数に対して逆変換を実行して、データ信号を提供することとを含む方法。 - 前記逆変換は、逆時間周波数分解と、逆時間スケール分解とのうちの1つである請求項9記載の方法。
- 前記逆変換は、逆離散コサイン変換(DCT)変換である請求項9記載の方法。
- 前記逆変換は、逆修正離散コサイン変換(MDCT)変換である請求項9記載の方法。
- 各係数は、スペクトル係数である請求項9記載の方法。
- 前記逆ログコンパンディングは、少なくとも2つのコンパンディングパラメータを使用して、前記圧縮データ信号をデコードすることにより実行される請求項9記載の方法。
- 前記コンパンディングパラメータは、同じ値を有する請求項14記載の方法。
- 前記データ信号は、オーディオ信号と、スピーチ信号と、生体信号とのうちの1つである請求項9記載の方法。
- エンコードする装置において、
前記装置は、
データ信号を受信するように構成されている受信機と、
前記データ信号を分解して、少なくとも2つの係数を提供するように構成されている変換回路と、
前記少なくとも2つの係数をエンコードして、圧縮されたデータ信号を提供するように構成されているログコンパンディング回路とを具備する装置。 - 前記変換は、時間周波数分解と、時間スケール分解とのうちの1つである請求項17記載の装置。
- 前記変換は、DCT変換である請求項17記載の装置。
- 前記変換は、修正DCT(MDCT)変換である請求項17記載の装置。
- 各係数は、スペクトル係数である請求項17記載の装置。
- 前記ログコンパンディング回路は、異なるコンパンディングパラメータを使用して、各係数をエンコードする請求項17記載の装置。
- 前記異なるコンパンディングパラメータは、同じ値を有する請求項22記載の装置。
- 前記データ信号は、オーディオ信号と、スピーチ信号とのうちの1つである請求項17記載の装置。
- デコードする装置において、
前記装置は、
圧縮されたデータ信号を受信するように構成されている受信機と、
前記圧縮データ信号をデコードして、少なくとも2つの係数を取得するように構成されている逆ログコンパンディング回路と、
前記少なくとも2つの係数からデータ信号を再構成するように構成されている逆変換回路とを具備する装置。 - 前記逆変換回路は、逆時間周波数分解と、逆時間スケール分解とのうちの1つである請求項25記載の装置。
- 前記逆変換回路は、逆DCT変換である請求項25記載の装置。
- 前記逆変換回路は、逆修正DCT(MDCT)変換である請求項25記載の装置。
- 各係数は、スペクトル係数である請求項25記載の装置。
- 前記逆ログコンパンディング回路は、少なくとも2つのコンパンディングパラメータを使用して、前記圧縮データ信号をデコードする請求項25記載の装置。
- 前記コンパンディングパラメータは、同じ値を有する請求項30記載の装置。
- 前記データ信号は、オーディオ信号と、スピーチ信号とのうちの1つである請求項25記載の装置。
- エンコードする装置において、
前記装置は、
データ信号を受信する手段と、
前記データ信号の変換を実行して、少なくとも2つの係数を提供する手段と、
前記少なくとも2つの係数のログコンパンディングを実行して、圧縮されたデータ信号を提供する手段とを具備する装置。 - 前記変換は、時間周波数分解と、時間スケール分解とのうちの1つである請求項33記載の装置。
- 前記変換は、DCT変換である請求項33記載の装置。
- 前記変換は、修正DCT(MDCT)変換である請求項33記載の装置。
- 各係数は、スペクトル係数である請求項33記載の装置。
- 前記ログコンパンディングは、少なくとも2つのコンパンディングパラメータを使用して、各係数をエンコードすることにより実行される請求項33記載の装置。
- 前記コンパンディングパラメータは、同じ値を有する請求項38記載の装置。
- 前記データ信号は、オーディオ信号と、スピーチ信号とのうちの1つである請求項33記載の装置。
- デコードする装置において、
前記装置は、
圧縮されたデータ信号を受信する手段と、
前記圧縮データ信号をデコードすることにより逆ログコンパンディングを実行して、少なくとも2つの係数を取得する手段と、
前記少なくとも2つの係数に対して逆変換を実行して、データ信号を提供する手段とを具備する装置。 - 前記逆変換は、逆時間周波数分解と、逆時間スケール分解とのうちの1つである請求項41記載の装置。
- 前記逆変換は、逆DCT変換である請求項41記載の装置。
- 前記逆変換は、逆修正DCT(MDCT)変換である請求項41記載の装置。
- 各係数は、スペクトル係数である請求項41記載の装置。
- 前記逆ログコンパンディングは、少なくとも2つのコンパンディングパラメータを使用して、前記圧縮データ信号をデコードすることにより実行される請求項41記載の装置。
- 前記コンパンディングパラメータは、同じ値を有する請求項46記載の装置。
- 前記データ信号は、オーディオ信号と、スピーチ信号と、生体信号とのうちの1つである請求項41記載の装置。
- エンコードするコンピュータプログラムプロダクトにおいて、
データ信号を受信し、
前記データ信号の変換を実行して、少なくとも2つの係数を提供し、
前記少なくとも2つの係数のログコンパンディングを実行して、圧縮されたデータ信号を提供するように実行可能な命令によりエンコードされているコンピュータ読み取り可能媒体を具備するコンピュータプログラムプロダクト。 - デコードするコンピュータプログラムプロダクトにおいて、
圧縮されたデータ信号を受信し、
前記圧縮データ信号をデコードすることにより逆ログコンパンディングを実行して、少なくとも2つの係数を取得し、
前記少なくとも2つの係数に対して逆変換を実行して、データ信号を提供するように実行可能な命令によりエンコードされているコンピュータ読み取り可能媒体を具備するコンピュータプログラムプロダクト。 - ヘッドセットにおいて、
圧縮されたデータ信号を受信するように構成されている受信機と、
前記圧縮データ信号をデコードして、少なくとも2つの係数を取得するように構成されている逆ログコンパンディング回路と、
前記少なくとも2つの係数からデータ信号を再構成するように構成されている逆変換回路と、
前記再構成されたデータ信号に基づいて、オーディオ出力を提供するように構成されているトランスデューサとを具備するヘッドセット。 - 検知デバイスにおいて、
データ信号を検出するように構成されているセンサーと、
前記データ信号を分解して、少なくとも2つの係数を提供するように構成されている変換回路と、
前記少なくとも2つの係数をエンコードして、圧縮されたデータ信号を提供するように構成されているログコンパンディング回路と、
前記圧縮データ信号を送信するように構成されている送信機とを具備する検知デバイス。 - ハンドセットにおいて、
オーディオ信号を検出するように構成されているトランスデューサと、
前記オーディオ信号を分解して、少なくとも2つの係数を提供するように構成されている変換回路と、
前記少なくとも2つの係数をエンコードして、圧縮されたオーディオ信号を提供するように構成されているログコンパンディング回路と、
前記圧縮オーディオ信号を送信するように構成されているアンテナとを具備するハンドセット。 - ウォッチにおいて、
圧縮されたデータ信号を受信するように構成されている受信機と、
前記圧縮データ信号をデコードして、少なくとも2つの係数を取得するように構成されている逆ログコンパンディング回路と、
前記少なくとも2つの係数からデータ信号を再構成するように構成されている逆変換回路と、
前記再構成されたデータ信号に基づいて、表示を提供するように構成されているユーザインターフェースとを具備するウォッチ。
Applications Claiming Priority (6)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US10064508P | 2008-09-26 | 2008-09-26 | |
US61/100,645 | 2008-09-26 | ||
US10107008P | 2008-09-29 | 2008-09-29 | |
US61/101,070 | 2008-09-29 | ||
US12/428,336 US20100106269A1 (en) | 2008-09-26 | 2009-04-22 | Method and apparatus for signal processing using transform-domain log-companding |
US12/428,336 | 2009-04-22 |
Related Parent Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2011529264A Division JP2012504373A (ja) | 2008-09-26 | 2009-09-25 | 変換領域ログコンパンディングを使用する信号処理のための方法および装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2013081229A true JP2013081229A (ja) | 2013-05-02 |
Family
ID=41667444
Family Applications (2)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2011529264A Withdrawn JP2012504373A (ja) | 2008-09-26 | 2009-09-25 | 変換領域ログコンパンディングを使用する信号処理のための方法および装置 |
JP2012268459A Pending JP2013081229A (ja) | 2008-09-26 | 2012-12-07 | 変換領域ログコンパンディングを使用する信号処理のための方法および装置 |
Family Applications Before (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2011529264A Withdrawn JP2012504373A (ja) | 2008-09-26 | 2009-09-25 | 変換領域ログコンパンディングを使用する信号処理のための方法および装置 |
Country Status (7)
Country | Link |
---|---|
US (1) | US20100106269A1 (ja) |
EP (1) | EP2345166A1 (ja) |
JP (2) | JP2012504373A (ja) |
KR (1) | KR101278880B1 (ja) |
CN (1) | CN102165699A (ja) |
TW (1) | TW201019315A (ja) |
WO (1) | WO2010036897A1 (ja) |
Families Citing this family (15)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
FR2965687A1 (fr) * | 2010-09-30 | 2012-04-06 | France Telecom | Limitation de bruit pour une transmission dans un canal a voies multiples |
US9767823B2 (en) | 2011-02-07 | 2017-09-19 | Qualcomm Incorporated | Devices for encoding and detecting a watermarked signal |
US9767822B2 (en) | 2011-02-07 | 2017-09-19 | Qualcomm Incorporated | Devices for encoding and decoding a watermarked signal |
US9177570B2 (en) * | 2011-04-15 | 2015-11-03 | St-Ericsson Sa | Time scaling of audio frames to adapt audio processing to communications network timing |
US9077183B2 (en) | 2011-09-06 | 2015-07-07 | Portland State University | Distributed low-power wireless monitoring |
CN103974268B (zh) * | 2013-01-29 | 2017-09-29 | 上海携昌电子科技有限公司 | 精细粒度可调的低延时传感器网络数据传输方法 |
US9642543B2 (en) | 2013-05-23 | 2017-05-09 | Arizona Board Of Regents | Systems and methods for model-based non-contact physiological data acquisition |
CN103532936A (zh) * | 2013-09-28 | 2014-01-22 | 福州瑞芯微电子有限公司 | 一种蓝牙音频自适应传输方法 |
US9626521B2 (en) | 2014-04-16 | 2017-04-18 | Arizona Board Of Regents On Behalf Of Arizona State University | Physiological signal-based encryption and EHR management |
US10230394B2 (en) * | 2014-09-19 | 2019-03-12 | Telefonaktiebolaget Lm Ericsson (Publ) | Methods for compressing and decompressing IQ data, and associated devices |
US10542961B2 (en) | 2015-06-15 | 2020-01-28 | The Research Foundation For The State University Of New York | System and method for infrasonic cardiac monitoring |
WO2017080835A1 (en) * | 2015-11-10 | 2017-05-18 | Dolby International Ab | Signal-dependent companding system and method to reduce quantization noise |
JP6652096B2 (ja) * | 2017-03-22 | 2020-02-19 | ヤマハ株式会社 | 音響システム、及びヘッドホン装置 |
US10373630B2 (en) | 2017-03-31 | 2019-08-06 | Intel Corporation | Systems and methods for energy efficient and low power distributed automatic speech recognition on wearable devices |
CN110035299B (zh) * | 2019-04-18 | 2021-02-05 | 雷欧尼斯(北京)信息技术有限公司 | 沉浸式对象音频的压缩传输方法与系统 |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2002542648A (ja) * | 1999-04-12 | 2002-12-10 | ドルビー・ラボラトリーズ・ライセンシング・コーポレーション | 合成フィルタ雑音伸長の補償を持つ知覚音声コーダの量子化 |
JP2005233280A (ja) * | 2004-02-18 | 2005-09-02 | Toyota Motor Corp | 車両用無段変速機の制御装置 |
Family Cites Families (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5222189A (en) * | 1989-01-27 | 1993-06-22 | Dolby Laboratories Licensing Corporation | Low time-delay transform coder, decoder, and encoder/decoder for high-quality audio |
US6778966B2 (en) * | 1999-11-29 | 2004-08-17 | Syfx | Segmented mapping converter system and method |
US6377916B1 (en) * | 1999-11-29 | 2002-04-23 | Digital Voice Systems, Inc. | Multiband harmonic transform coder |
US6681207B2 (en) * | 2001-01-12 | 2004-01-20 | Qualcomm Incorporated | System and method for lossy compression of voice recognition models |
US20030135374A1 (en) * | 2002-01-16 | 2003-07-17 | Hardwick John C. | Speech synthesizer |
US7225135B2 (en) * | 2002-04-05 | 2007-05-29 | Lectrosonics, Inc. | Signal-predictive audio transmission system |
US7043423B2 (en) * | 2002-07-16 | 2006-05-09 | Dolby Laboratories Licensing Corporation | Low bit-rate audio coding systems and methods that use expanding quantizers with arithmetic coding |
US20070094035A1 (en) * | 2005-10-21 | 2007-04-26 | Nokia Corporation | Audio coding |
JP5236005B2 (ja) * | 2008-10-10 | 2013-07-17 | 日本電信電話株式会社 | 符号化方法、符号化装置、復号方法、復号装置、プログラム及び記録媒体 |
-
2009
- 2009-04-22 US US12/428,336 patent/US20100106269A1/en not_active Abandoned
- 2009-09-25 JP JP2011529264A patent/JP2012504373A/ja not_active Withdrawn
- 2009-09-25 KR KR1020117009533A patent/KR101278880B1/ko active IP Right Grant
- 2009-09-25 EP EP09793011A patent/EP2345166A1/en not_active Withdrawn
- 2009-09-25 CN CN2009801377943A patent/CN102165699A/zh active Pending
- 2009-09-25 WO PCT/US2009/058387 patent/WO2010036897A1/en active Application Filing
- 2009-09-28 TW TW098132773A patent/TW201019315A/zh unknown
-
2012
- 2012-12-07 JP JP2012268459A patent/JP2013081229A/ja active Pending
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2002542648A (ja) * | 1999-04-12 | 2002-12-10 | ドルビー・ラボラトリーズ・ライセンシング・コーポレーション | 合成フィルタ雑音伸長の補償を持つ知覚音声コーダの量子化 |
JP2005233280A (ja) * | 2004-02-18 | 2005-09-02 | Toyota Motor Corp | 車両用無段変速機の制御装置 |
Also Published As
Publication number | Publication date |
---|---|
US20100106269A1 (en) | 2010-04-29 |
CN102165699A (zh) | 2011-08-24 |
EP2345166A1 (en) | 2011-07-20 |
TW201019315A (en) | 2010-05-16 |
WO2010036897A1 (en) | 2010-04-01 |
KR20110074887A (ko) | 2011-07-04 |
JP2012504373A (ja) | 2012-02-16 |
KR101278880B1 (ko) | 2013-06-26 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP2013081229A (ja) | 変換領域ログコンパンディングを使用する信号処理のための方法および装置 | |
JP4977471B2 (ja) | 符号化装置及び符号化方法 | |
CN103069484B (zh) | 时/频二维后处理 | |
KR101612096B1 (ko) | 데이터를 프로세싱 및 재구성하기 위한 방법 및 장치 | |
US10217470B2 (en) | Bandwidth extension system and approach | |
EP1080542B1 (en) | System and method for masking quantization noise of audio signals | |
KR102417047B1 (ko) | 잡음 환경에 적응적인 신호 처리방법 및 장치와 이를 채용하는 단말장치 | |
JP5937064B2 (ja) | オーディオ/音声符号化装置、オーディオ/音声復号装置、オーディオ/音声符号化方法およびオーディオ/音声復号方法 | |
WO2007075226A1 (en) | Wireless headset and method for robust voice data communication | |
US8190440B2 (en) | Sub-band codec with native voice activity detection | |
JP2009533716A (ja) | オーディオ符号化並びに復号化における励起の処理 | |
EP3175457B1 (en) | Method for estimating noise in an audio signal, noise estimator, audio encoder, audio decoder, and system for transmitting audio signals | |
JP2009512895A (ja) | スペクトル・ダイナミックスに基づく信号コーディング及びデコーディング | |
JP5437505B2 (ja) | 定常ビットレートアプリケーションのための最適なビット割当を備えるオーディオ及びスピーチ処理 | |
US8311481B2 (en) | Data format conversion for electronic devices | |
TWI602173B (zh) | 音訊處理方法與非暫時性電腦可讀媒體 | |
CN118400463A (zh) | 一种视频彩铃的数据处理方法、系统、设备及介质 | |
CN118486325A (zh) | 一种语音信号处理方法及装置、设备、存储介质、芯片 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20131029 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20140325 |