JP4270868B2 - オーディオ信号の符号化 - Google Patents
オーディオ信号の符号化 Download PDFInfo
- Publication number
- JP4270868B2 JP4270868B2 JP2002550638A JP2002550638A JP4270868B2 JP 4270868 B2 JP4270868 B2 JP 4270868B2 JP 2002550638 A JP2002550638 A JP 2002550638A JP 2002550638 A JP2002550638 A JP 2002550638A JP 4270868 B2 JP4270868 B2 JP 4270868B2
- Authority
- JP
- Japan
- Prior art keywords
- subfile
- file
- encoded
- server
- encoding
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Lifetime
Links
- 230000005236 sound signal Effects 0.000 title claims abstract description 17
- 238000000034 method Methods 0.000 claims abstract description 46
- 230000002123 temporal effect Effects 0.000 claims abstract description 20
- 230000004044 response Effects 0.000 claims description 6
- 239000000463 material Substances 0.000 abstract description 3
- 239000000872 buffer Substances 0.000 description 35
- 230000008569 process Effects 0.000 description 21
- 230000008859 change Effects 0.000 description 9
- 238000004891 communication Methods 0.000 description 6
- 238000005070 sampling Methods 0.000 description 6
- 230000006870 function Effects 0.000 description 5
- 238000012546 transfer Methods 0.000 description 5
- 230000006835 compression Effects 0.000 description 4
- 238000007906 compression Methods 0.000 description 4
- 238000010586 diagram Methods 0.000 description 4
- IJJWOSAXNHWBPR-HUBLWGQQSA-N 5-[(3as,4s,6ar)-2-oxo-1,3,3a,4,6,6a-hexahydrothieno[3,4-d]imidazol-4-yl]-n-(6-hydrazinyl-6-oxohexyl)pentanamide Chemical compound N1C(=O)N[C@@H]2[C@H](CCCCC(=O)NCCCCCC(=O)NN)SC[C@@H]21 IJJWOSAXNHWBPR-HUBLWGQQSA-N 0.000 description 3
- 230000007246 mechanism Effects 0.000 description 3
- 230000003139 buffering effect Effects 0.000 description 2
- 230000002441 reversible effect Effects 0.000 description 2
- 238000000638 solvent extraction Methods 0.000 description 2
- 238000010561 standard procedure Methods 0.000 description 2
- 238000013475 authorization Methods 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 238000012790 confirmation Methods 0.000 description 1
- 238000012217 deletion Methods 0.000 description 1
- 230000037430 deletion Effects 0.000 description 1
- 238000002716 delivery method Methods 0.000 description 1
- 230000001419 dependent effect Effects 0.000 description 1
- 208000018459 dissociative disease Diseases 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 230000009191 jumping Effects 0.000 description 1
- 239000012464 large buffer Substances 0.000 description 1
- 239000000203 mixture Substances 0.000 description 1
- 238000012545 processing Methods 0.000 description 1
- 238000013139 quantization Methods 0.000 description 1
- 230000002459 sustained effect Effects 0.000 description 1
- 230000009897 systematic effect Effects 0.000 description 1
- 230000007704 transition Effects 0.000 description 1
- 230000001960 triggered effect Effects 0.000 description 1
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L27/00—Modulated-carrier systems
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/16—Vocoder architecture
- G10L19/18—Vocoders using multiple modes
- G10L19/24—Variable rate codecs, e.g. for generating different qualities using a scalable representation such as hierarchical encoding or layered encoding
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/16—Vocoder architecture
- G10L19/167—Audio streaming, i.e. formatting and decoding of an encoded audio signal representation into a data stream for transmission or storage purposes
Landscapes
- Engineering & Computer Science (AREA)
- Signal Processing (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Computational Linguistics (AREA)
- Quality & Reliability (AREA)
- Computer Networks & Wireless Communication (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Signal Processing For Digital Recording And Reproducing (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
- Reduction Or Emphasis Of Bandwidth Of Signals (AREA)
- Transmission Systems Not Characterized By The Medium Used For Transmission (AREA)
- Amplifiers (AREA)
- Signal Processing Not Specific To The Method Of Recording And Reproducing (AREA)
Description
【発明の属する技術分野】
本発明は、ユーザに提供するためのデジタル符号化されたマテリアルの通信リンクによる配信に関する。
【0002】
【従来の技術】
明細書および図面の記載は、本出願と同日出願であるGB0030706.6号を優先権の基礎とする国際特許出願[発明の名称「オーディオ信号および、またはビデオマテリアルの配信」]の記載と同様である。
【0003】
【発明が解決しようとする課題】
本発明は、オーディオ信号を符号化する方法を提供する。
【0004】
【課題を解決するための手段】
本発明の1特徴によれば、概念的に入力信号を時間的に連続している時間的部分に分割し、
前記入力された時間的部分を第1のフレーム長を有する第1の符号化アルゴリズムを使用して符号化して、符号化された時間的部分の第1の符号化されたシーケンスを生成し、
前記入力された時間的部分を第2のフレーム長を使用して符号化して、符号化された時間的部分の第2のシーケンスを生成し、
符号化ステップの少なくとも1つは、先行する時間的部分の終り、および、またはすぐ後に続く時間的部分の最初と共に1つの入力された時間的部分を符号化して前記時間的部分により整数のフレームを構成するオーディオ信号の符号化方法が提供される。
【0005】
本発明の別の特徴によれば、第1のフレーム長を有する第1の符号化アルゴリズムによって入力信号の連続する第1の時間的部分のそれぞれを符号化し、それらの時間的部分は前記第1のフレーム長の整数に対応し、第1の符号化されたシーケンスを生成するために連続するか、オーバーラップし、第2のフレーム長を有する第2の符号化アルゴリズムによって入力信号の連続する第2の時間的部分のそれぞれを符号化し、それらの時間的部分は前記第2のフレーム長の整数に対応し、前記第1のフレーム長の整数には対応せず、第2の符号化されたシーケンスを生成するためにオーバーラップし、第2の符号化されたシーケンスの各オーバーラップしている部分は少なくとも部分的に間の境界を含み、或いは入力信号の連続する時間的部分に対応する第1の符号化されたシーケンスの間またはオーバーラップした領域部分を含んでいるオーディオ信号を符号化する方法が提供される。
【0006】
その他の本願発明の特徴はその他の従属する請求項に記載されている。
【0007】
【発明の実施の形態】
図面を参照にして本発明のいくつかの実施形態を説明する。
図1に示されたシステムは、デジタル符号化されたオーディオ信号を通信ネットワークを介して対応する音響がユーザに対して再生されるユーザ端末へ配信することを目的としている。しかしながら、以下詳細に説明するように、このシステムはオーディオ信号の代りに、或いはオーディオ信号に付加してビデオ信号を伝送するために使用することもできる。この例では、ネットワークは、原理的には他のデジタルリンクまたはネットワークを使用することが可能であるが、ハイパーテキスト転送プロトコル(詳細はRFC1945/2068 参照)にしたがって動作するインターネットまたは他のパケットネットワークである。オーディオ信号はISO MPEG−1層III 標準方式(MP3標準方式)を使用する圧縮された形態で記録されていると仮定する。しかしながら、この特定のフォーマットの使用は本質的なことではない。事実、特に利用できるビットレートが制限され、或いは記憶スペースが限定されている場合には圧縮の使用は非常に望ましいことであるが、本質的に必要なことではない。図1ではサーバ1 はインターネット2 を介して1つしか示されていないユーザ端末3 に接続されている。サーバ1 の機能はデータファイルを記憶し、所望のデータファイルの配信のためのリクエストをユーザ端末から受信し、リクエストに応答してそのファイルをネットワークを介してユーザ端末に送信することである。通常そのようなリクエストはネットワーク配信機構(例えば、ハイパーテキスト転送プロトコルまたはファイル転送プロトコルに対してはそれぞれhttp://またはファイル://)を指示する第1の部分の形態を取り、それに続いてサーバのネットワークアドレス(例えばwwwサーバ1.com)が付加され、さらにそれに続いてリクエストされているファイル名を付けられている。与えられた例ではそのような名称はタイプ上の理由で//で示されている。
【0008】
これらの例では、ハイパーテキスト転送プロトコルを使用するものと仮定し、これは本質的なことではないが、そのプロトコルによって与えられた承認およびセキュリティ特徴(秘密ソケット層のような)の使用ができる利点がある。
【0009】
通常MP3ファイルの受渡し用のサーバはいわゆるストリーマの形態をとり、それはユーザ端末での応答要求に応じてデータが送信される速度をダイナミックに制御し、パケット損失によるエラーをマスクし、ユーザの介入が許容されている場合にはサーバとクライアントとの間のデータ流を制御する処理装置を含んでいる。しかしながら、ここではサーバ1 はそのような設備を含んでいない。したがって、それは通常の“ウエブサーバ”である。
【0010】
データファイルがサーバ1 に記憶される方法について説明する。MP3フォーマットのファイルが生成されてサーバに記憶されると考える。それはJ.S.バッハのトッカータとフーガD短調(BWV565 )の記録であり、典型的に9分の演奏時間を有する。元来これは単一のデータファイルとして生成され、通常のストリーマではこれは1つの単一のファイルとして記憶される。しかしながら、ここではファイルはサーバ1 に記憶される前に小さいファイルに分割される。これらの小さいファイルはそれぞれ固定された演奏時間、恐らく4秒に対応する大きさである。MP3のような圧縮されたフォーマットにより、これはそれらのファイルが実際に含んでいるビットの数に対して異なった大きさであることを意味している。したがって9分の期間のバッハのファイルはそれぞれ4秒の演奏時間の135の小さいファイルに分割される。この例ではこれらは所定のファイル名を与えられ、それはもとのファイル中のそれらの順序を示す通し番号を含んでおり、例えば、
【0011】
ファイルのこれらの小さいサブファイルへの分割は典型的にウエブサーバ1 へロードするためのファイルを処理する人によって行われることができる(ここで使用されるサブファイルという用語は、全体の記録を含んでいるもとのファイルと区別するためにここで使用されているが、しかしながらサーバが関係される限りサブファイルは他のファイルと同様のファイルであることを強調しておく)。それらを生成する正確な方法について以下さらに十分に説明する。これらのサブファイルは、一度生成されると、任意の他のファイルがウエブサーバへロードされる通常の方法でサーバにアップロードされる。もちろんファイル名は特定の記録を識別する文字を含むことができる(MP3ファイルを再生するときサブファイルは著者、著作権等の情報を得る付加的な情報のタグを付けられることもできる)が、この例ではサブファイルはサーバ中で特定の記録、例えばmp3 bwv565に特定された名簿またはホルダー中に記憶される。したがってサブファイルは必要なとき次の形態でリクエストされることができる。
【0012】
http://wwwサーバ1 .com/mp3 bwv565/000003.ビン
ここで“wwwサーバ1 .com ”はサーバ1 のURLである。
【0013】
それはまた、各記録に対してリンクページ(典型的にはhtmフォーマットで)を生成するためにサーバにロードするためのサブファイルを処理する人に対して都合がよい。このリンクページもまたサーバに記憶され(恐らくファイルネームmp3 bwv565/link.htmにより)、その構造および目的については後述する。
【0014】
また、対応するリンクページに対するハイパーリンクを有する利用可能な記録のリストを含む1以上の(html)メニューページ(例えばmenu.htm)を記憶することも都合のよいことである。
【0015】
次に、端末について説明すると、これは典型的に通常のデスクトップコンピュータの形態のものでよいが、前述したオーディオファイルの受信を処理するための付加的なソフトウエアを有している。所望ならば端末は、手持ち形コンピュータの形態をとることができ、移動体電話機中に内蔵されてもよい。したがって、図2はそのような端末を示し、それは中央プロセッサ30、メモリ31、ディスク記憶装置32、キーボード33、ビデオディスプレイ34、通信インターフェース35、オーディオインターフェース(音響カード)36を備えている。ビデオ配信のためには、音響カード36の代りに或いはそれに追加してビデオカードが使用される。ディスク記憶装置32には通常の方法でプロセッサ30により実行されるためにメモリ中で検索されることのできるプログラムが記憶されている。これらのプログラムは呼出しおよびhtmページの表示のための通信プログラム37、すなわちNetscape NavigatorまたはMicrosoft Explorerのような“ウエブブラウザ”プログラムおよび本発明のこの実施形態にしたがってオーディオファイルの再生のために必要な機能性を与えるここで“プレイヤープログラム”と呼ばれているような別のプログラム38を含んでいる。また、メモリ31の39で示される領域はバッファとして割当てられている。これは再生されるために待機しているデータを含む復調されたオーディオバッファである(典型的にバッファの動作継続時間は10秒である)。オーディオインターフェースまたは音響カード36は通常のカードであり、単にPCMオーディオ信号を受信してそれをアナログオーディオ信号に変換するように、例えばスピーカにより再生するように機能する。最初に、HTTPおよび内蔵またはプラグインされたクライアント装置を使用するとき、所望の記録を検索して再生する端末装置の動作の概要について簡単に説明する。
【0016】
1.ユーザはブラウザを使用してサーバ1 からメニューページmenu.htmを検索して表示する。
【0017】
2.ユーザはメニューページ内のハイパーリンクの1つを選択し、それはブラウザにサーバを検索させ、この例ではファイルmp3 bwv565 link.htmのような所望の記録に対するリンクページを表示させる。このページの実際の表示は重要ではない(恐らくそれがシステムが正確に動作していることをユーザに再確認させるメッセージを含んでいることを除いて)。このページで重要なことは、プレイヤープログラム37が実行される第2のプロセスをプロセッサ30に開始させる命令(または埋設タグ)を含むことである。この方法における第2のプロセスの開始は実際によく知られている(そのようなプロセスはプラグインとしてNetscapeシステムで、また、“アクチブX”としてマイクロソフトシステムで知られている)。このような命令はまた第2のプロセスに送られるパラメータを含むこともでき、図1のシステムで命令は記録のサーバURLを含んでおり、それはバッハのチピースに対してhttp//www.サーバ1/mp3 bwv565 である。
【0018】
3.プレイヤープログラム37はMP3デコーダを含み、その動作自体は通常のものである。この説明でさらに重要なことはプログラムの制御機能であり、それについて以下説明する。
【0019】
4.URLを受信したプレイヤープログラムはこれに第1のサブファイルのファイルネームを付加してサブファイルに対する完全なアドレスを生成する。すなわち、www.サーバ1/mp3 bwv565/000000.binを生成する。サブファイルが上に示した方法で名前を付けられことに基づいて、このシステムが組織化されることが観察され、その結果端末はファイルネームを報告する必要がない。このプログラムはこのURLを有するファイルに対するリクエストメッセージを構成し、それを通信インターフェース35およびインターネット2 を介してサーバ1 に送信する(URLをIPアドレスに変換するプロセス、無効のエラー報告、不完全または利用できないURLは通常のものであり、ここでは説明しない)。プレイヤープログラムはブラウザを介するのではなく、直接通信インターフェースにリクエストを送信することが予想される。サーバはリクエストされたサブファイルを送信することによって応答する。
【0020】
5.プレイヤープログラムはファイルからこのサブファイル中で使用されたオーディオ符号化を決定し、関係した標準方式にしたがって(この例ではMP3)粗PCM値にファイルをデコードして戻し、このサブファイルの演奏時間のノートを作成する。一般にオーディオファイルは使用された符号化を説明するファイルの最初における識別子を含んでいる。デコードされたオーディオデータはその後オーディオバッファ38に記憶される。
【0021】
6.プレイヤープログラムは演奏終了時間Tp と呼ばれるパラメータを有している。この例ではそれは10秒に設定されている(所望ならばユーザ選択可能にされることができる)。それは端末が行なうバッファの程度を決定する。
【0022】
7.プレイヤープログラムはファイルネームを000001.binへインクリメントし、リクエストし、受信し、デコードして上記の(4)および(5)で記載したように第2のサブファイルを記憶する。このプロセスはバッファの内容がこの演奏終了時間Tp に到達するか、それを越えるまで反復される。デコードがバッファの前に行なわれることは実際には重要なことではないが、簡単になることに注意すべきである。それはオーディオはデコードされて粗PCMに戻され、その後、バッファされたマテリアルの継続時間は明瞭に知られるからである。各サブファイルが同じオーディオ再生サイズであるならばオーディオバッファの制御は簡単にされる。
【0023】
8.演奏終了時間Tp に到達したとき、デコードされたデータはバッファからオーディオインターフェース36に送られ、それはスピーカ(図示せず)によって音を再生する。
【0024】
9.上記(8)で音が再生される一方で、プレイヤープログラムは連続的にバッファの満杯状態について監視し、これがTp より小さくなったときファイルネームを再びインクリメントしてサーバからさらに別のサブファイルを得る。このプロセスは“ファイルはエラーを発見しない”が戻されるまで反復される。
【0025】
10.このプロセス中にバッファが空になった場合には、プレイヤープログラムはさらにデータが到着するまで演奏を停止する。
【0026】
ここで使用される0で開始される数字の簡単な固定長のシーケンスのサブファイルネーミングは構成が簡単であるので好ましいが、任意の他のネーミング方法が第1のサブファイルのネームおよび連続する1を計算することを可能にするアルゴリズムのいずれかを含むか(または送信される)プレイヤープログラムを与えるために或いはファイルネームのリストを送信するために使用することができる。
【0027】
上述のシステムはユーザの再生プロセスに介入するための機会を何等提供しないことが認められるであろう。また、バッファのアンダーフロー(例えばネットワークの衝突によって)の可能性に対しても何等救済しない。それ故、第2のさらに精巧なこの発明の実施形態について以下説明し、それはさらに次のような特徴を提供する。
【0028】
a)サーバは異なった圧縮率で記録された記録の2以上のバージョンを記憶し[例えば、それぞれ、8 ,16, 24, 32 キロビット/秒の(連続的な)データレートに対応する圧縮率で]、プレイヤープログラムは自動的にそれらの間で切換えることができる。
【0029】
b)プレイヤープログラムはユーザに対して制御パネルを表示し、それによりユーザは再生を開始し、それを中断し、それを再開し(最初から、或いは中止した点から)、または記録中の異なる点(後方または前方)にジャンプすることが可能になる。
【0030】
これらの特徴は相互依存性ではなく、ユーザ制御はレートスイッチングなしに或いはその反対に行われることができる。
【0031】
レートスイッチングを行なうために、サーバにロードするためにファイルを処理する人は、異なったレートで複数回同じPCMファイルを符号化することによって幾つかのソースファイルを処理する。彼は各ソースファイルを前述したようにサブファイルに区分する。これらは異なったレートに対応する別々のディレクトリ(登録簿)でサーバにロードされる。例えば、次の例の構成ではディレクトリネーム中の“008k”“024k”は8キロビット/秒または24キロビット/秒等のレートを示している。
【0032】
彼はまたインデックスファイル(例えばindex.htm )を生成し、その主目的は利用可能なデータレートのリストを提供することである。
【0033】
【表1】
サブファイルの長さは前に説明したように固定された時間長に対応しているから、サブファイルの数は各ディレクトリに対して同じである。サブディレクトリネームはキロビット/秒のデータレート(3デジット)プラス文字“k”を含んでおり、この例ではオーディオサンプリングレート(11.025kHz )の指示であって、モノとステレオのフラグが確認のために付加されている。
【0034】
インデックスファイルはしたがって次のような形態のステートメントを含む。
【0035】
<!オーディオ信号=“024k 11 s 032k 11 s 018k 11 s 016k 11 m 018k 11 m ”…>
(<!…... …>は単にステートメントがhtmlファイル中のコメント[または簡単なテキストファイルが使用可能である]として埋設されていることを示している。)典型的なインデックスファイルは図3に示されており、それには他の情報が含まれている。すなわち、LFIは最高のサブファイル数(すなわち45のサブファイル)であり、SLは全体の再生時間である(178秒)。“モード”は“記録された(ここで)”または“ライブ(以下説明する)”を示している。他のエントリは自明であり、或いは標準的なhtmlコマンドである。
【0036】
最初に、プレイヤープログラムはリンクファイル、インデックスファイルで特定されたディレクトリからのリクエストにより開始し、将来の基準のために利用可能なデータレートのリストを局部的に記憶する。(このファイルまたは丁度特定したディレクトリの明瞭なリクエストであってもよく、大抵のサーバはファイルネームが特定されていなければindex.htm にデフォルトである。)。その後、インデックスファイル−viz.024k 11 s (または端末はその端末に局部的に設定されたデフォルトレートにこれに修正することによってこれに重ね書きされる)中の最初に挙げた“レート”ディレクトリから前述のようにオーディオサブファイルのリクエストが開始される。それからのプロセスは、プレイヤープログラムがサーバから受信されている実際のデータレートを測定してある期間にわたって(例えば30秒)平均する。全てのURLリクエストをタイミング制御することによって、クライアントとサーバとの間で得られる転送レート(毎秒当たりのビット数)が決定される。この図の正確さはリクエスト数が増加するにしたがって改善される。プレイヤーは現在のレートと測定されたレートをそれぞれ示している2つの記憶されたパラメータを維持する。
【0037】
レート変化の開始がトリガーされる。
a)バッファが空であり、かつ、測定されたレートが現在のレートよりも小さく、かつ、測定されたバッファロウ(L0w)%がステップダウンしきい値(以下説明する)を越える場合には、現在のレートを減少させる(バッファがすでに空であるとき、音響カードは何もプレーしないのが有効であるので時間を変化させ、オーディオサンプリングレート、ステレオ−モノ設定、またはビット幅[サンプル当たりのビット数]が変化された場合にはそれは再構成することが必要である可能性がある)。
【0038】
b)測定されたレートが現在のレートを越えているだけではなく、所定の期間(例えば120秒:これは所望ならばユーザにより調整可能にされることができる)に対して次に高いレートを越えるならば、現在のレートを増加させる。
【0039】
バッファロウ%はバッファの内容がプレイアウト時間(すなわち、バッファがからに近くなる)の25%よりも小さい時間の割合である。ステップダウンしきい値が0%に設定され、そのときバッファは空であるならば、システムは他の条件が満足されたときには常にステップダウンする。ステップダウンしきい値を5%に設定する(これは我々の好ましいデフォルト値である)ことは、バッファは空であるが、測定されたバッファロウ%が5%よりも大きければステップダウンは行わないことを意味している。さらに、バッファの空はこの測定されたレートを明らかに増加させ、レートが持続できない場合には、バッファロウ%が5%を越えることにより再びバッファを最終的に空にする。値を100%に設定することは、クライアントが決してステップダウンを行わないことを意味している。
【0040】
実際のレート変化は、データレートを8kビット/秒から24kビット/秒に増加するために“008k”を“024k”に変更するようにサブファイルアドレスの関係する部分を変更し、現在のレートのパラメータを整合するように変更するプレイヤープログラムによって簡単に行うことができる。その結果、サーバに対する次のリクエストはもっと高い(またはもっと低い)レートに対するリクエストとなり、新しいディレクトリからサブファイルが受信され、デコードされてバッファに入力される。以上説明したプロセスは以下のフローチャートに要約されている。
【0041】
【表2】
【表3】
【表4】
【表5】
ユーザ制御は、キーボードまたはマウスのようなその他の入力装置を使用してユーザが選択できる以下のオプションをスクリーン上に提供するようにユーザにより行われる。
【0042】
a)スタート:上記の与えられた番号のステップ4から実行される。記録が最初に選択されたとき、プレーが自動的に開始されるか、またはユーザからのスタート指令が必要かは随意であり、事実、所望ならばその選択はリンクファイル中の“自動プレイ”パラメータにより行われることができる。
【0043】
b)中断:MP3デコーダへの命令によって実行され、バッファからのデータの読出しを中断する。
【0044】
c)再開:MP3デコーダへの命令によって実行され、バッファからのデータの読出しを再開する。
【0045】
d)ジャンプ:例えば、記録の全期間を表している表示されたバー上の所望の点にカーソルを移動させることによって、ユーザはその希望している記録の部分へジャンプする位置を示すことによってユーザにより実行される。その後、プレーヤはこの点がバーに沿ってx%であることを決定して、次のサブファイルが必要としている数を計算し、それは次のリクエストに対して使用される。前記のバッハの例では125のサブファイルがあり、20%の点から演奏することがリクエストされ、26番目のサブファイル、すなわち、000025.binに対してリクエストを生成する。この計算は、各サブファイルが同じ固定した期間に対応している場合には著しく簡単になることは明らかである。ジャンプの場合には、新しいリクエストがすぐに送られるようにデコードを中断し、バッファをクリアすることが好ましいが、これは実際には重要なことではない。
【0046】
もとのファイルをサブファイルに区分するプロセスについてさらに議論することは重要である。最初に、もしも、(前述した最初のバージョンのように)もとのシーケンス中にそれにすぐに後続している以外のサブファイルによってサブファイルが後続される場合には期待されるものはなく、サブファイル間の境界が位置している場所は重要ではない。その場合には、サブファイルの大きさは固定数のビットであるか、或いは固定された再生時間長であり(またはそれらのいずれも存在しない場合)、ただ一つの実際の決定はどのような大きさのサブファイルが存在しなければならないかである。ジャンプが予想される場合に(時間的、または異なったデータレートの間)他の考察も存在する。多数のタイプのスピーチまたはオーディオ符号化方式(MP3を含む)が存在する場合には、信号はフレームで符号化され、サブファイルはフレームの全体数を含んでいなければならない。レートスイッチングの場合には、実際には重要ではないが、サブファイル境界が各レートに対して同じであることは非常に望ましく、そのため、新しいレートで受信された第1のサブファイルは終了した古いレートの最後のサブファイルを記録する同じ地点から連続する。同じ固定時間長(例えば上述の4秒)を表さなければならない全てのサブファイルはこれを解決するただ1つの方法ではないが、たしかに最も便利である。しかしながら、使用する符号化システムに応じて、サブファイルがフレームの全数含んでいなければならないと言う要求は、サブファイルの再生期間が多少変化することを意味することもできる。本発明のこの実施形態では、利用できるデータレートは、異なった量子化程度を使用し、モノで符号化するかステレオで符号化するかで異なっているが、全て同じオーディオサンプリングレートを使用し、結果的に同じフレームサイズである。異なったフレームサイズが使用されるとき、アドレスされる必要について以下説明する。
【0047】
実際のサブファイル長に対しては、過度に短いサブファイルは、(a)より多くのリクエストの形態で余分のネットワークトラヒックを生成するため、および(b)IPネットワークを含むある形式のパケットネットワークにおいて、小さいパケットにより伝送されなければならないので不経済であり、そのためリクエストプロセスにより与えられるオーバーヘッドおよびパケットヘッダが比例して大きくなるために避けることが好ましい。他方で、過度に大きいサブファイルでは、大きいバッファが必要であり、再生を開始するとき、および、またはジャンプ或いはレート変化が求められたときに余分の遅延を生じて不利である。プレイアウト時間の30%乃至130%の範囲のサブファイルサイズ、または好ましくはプレイアウト時間のほぼ半分のサブファイルサイズ(上記の与えられた例のような)が満足できるものであることが認められた。
【0048】
サブファイルを変換する実際のプロセスは論じられた基準にしたがってプログラムされたコンピュータによって実行されることができる。これはサブファイルがサーバへアップロードされることのできる別のコンピュータで行うことが好ましい。
【0049】
別の改善方法は、より複雑なサブファイルネーミング方法を置換できて、サブファイルを権限のない人がコピーして別のサーバにそれを提供することを困難にするによりセキュリティを増加させる。1例は疑似ランダムシーケンス発生器を使用してファイルネームを生成することである。例えば、次の形態のファイルネームを生成する。
この場合に、プレイヤープログラムは同一の疑似ランダムシーケンス発生器を含んでいる。サーバは第1のファイルネームまたは4デジットの“シード”を送り、プレイヤー中の発生器はそのときその発生器を同期して正確なシーケンスで要求されたサブファイルネームを生成する。
【0050】
レートスイッチングの上記の例において、使用される全てのデータレートは同じフレームサイズであり、特に11.025KHzでサンプリングされたPCMオーディオのMP3コード化および1152サンプルの(PCM)フレームサイズである。もしも異なったフレームサイズを有するMP3(または他の)記録との間でレートスイッチングを行うことが所望されるならば、フレーム境界がそのとき一致しないためにサブファイルが全体のフレーム数を含まなければならないと言う要求によって問題が生じる。この問題はサブファイルを生成するために以下の修正された手順によって解決することができる。特に、この手順は、レートスイッチングが要求され、上述した特定の受渡し方法に制限がない状態で使用されることができる。
【0051】
図4はオーディオサンプルのシーケンスを概略的に示している。それにおいて連続する4秒のセグメントは境界マーク(図において)B1 ,B2 等によって規定される。11.025KHzにおいて、各セグメント中には44,100のサンプルがある。1.オーディオ信号を符号化し、境界B1 でスタートし、フレーム毎に、MP3サブファイルを生成し、少なくとも4秒の全体の期間を有するフレームの全体数が符号化されるまで続けられる。1152サンプルのフレームサイズによれば4秒は38.3フレームに対応し、そのため39フレームを表すサブファイルS1は全体で4.075秒の期間を表し、正確に符号化される。
【0052】
2.オーディオ信号を符号化し、同じように境界B2 でスタートする。
【0053】
3.反復的に、4秒の境界でそれぞれスタートし、それ故この方法でオーバーラップするサブファイルのセットが符号化される全体のオーディオシーケンスに対して生成される。最後のセグメント(それは4秒よりも短くてよい)はもちろんそれに後続するものは何もなく、ゼロ(すなわち沈黙)を詰められる。
異なったフレームサイズを使用するその他のデータレートの符号化は同様な方法で行われる。
【0054】
端末において、制御機構は変更されないが、デコードおよびバッファプロセスは変更される。:
1.サブファイルS1を受信する。;
2.サブファイルS1をデコードする。;
3.デコードされたオーディオサンプルの最初の4秒だけをバッファに書込む(残りは廃棄する);
4.サブファイルS2を受信する。;
5.サブファイルS2をデコードする。;
6.デコードされたオーディオサンプルの最初の4秒だけをバッファに書込む(残りは廃棄する);
7.サブファイルS3等について続ける。
このようにして、全てのレートに対するサブファイルセットはもとのPCMシーケンスの同じ点に対応するサブファイル境界を有する。
【0055】
したがって最後のものを除いて各4秒の期間は符号化に先立って次の4秒の期間からのオーディオサンプルを詰込まれ、それによりサブファイルサイズをMP3フレームの全体数までにする。所望ならば、詰込むサンプルは後続するものの最初のものの代りに(或いはそれと同様に)先行する4秒の期間の終わりから取ることができる。
【0056】
MP3標準はある情報が1つのオーディオフレームから他へキャリーオーバーされることを可能にする(ビット保存として知られている方式により)。これに関連してこれはサブファイル内に受入れることが可能であるが、サブファイルの間で受入れ可能ではない。しかしながら、標準方式は当然記録の終わりまたは始めでそのようなキャリーオーバーを許容しないから、この問題は、あだかも単一の記録であるかのように各サブファイルを別々に符号化することによって容易に解決される。
【0057】
サンプルレートの変化(および事実モノとステレオの動作の切換え)はオーディオインターフェース36の動作に対して実際的な連携を有する。多くの通常の音響カードは、異なった設定範囲で動作可能であるが、サンプリングレートを変更するために再設定を必要とし、これはそのオーディオ出力に中断を生じさせる必要がある。したがって、さらに別の変形では、予想される最高のサンプリングレートで音響カードを連続的に動作させることを提案する。プレイヤープログラムが低いサンプリングレートでバッファにデータを供給しているとき、このデータはバッファの前、または後でこの最高のレートにアップサンプリングされる。同様に、カードが常にステレオモードで動作されるならば、デコードされたモノ信号は並列に音響カード入力の左右の両チヤンネルに供給される。再び、デコードされた信号のサンプル当たりのビット数がカードによって予測されたよりも低い場合には、ビット数は0を詰めることによって増加されることができる。
【0058】
自動データレートに対して最初に説明した基準を思い出すと、下方向のスイッチングはバッファのアンダーフローの場合にのみレート減少(それ故出力における中断を含む)を予想させ、この変形により、そのような中断は避けることができ、それ故、アンダーフローを期待する基準を使用することが好ましく、主要な場合にそれを避けることができる。この場合には上述した3つのアンド条件の最初のもの(すなわちバッファが空である)は省略される。
【0059】
同じ原理は、ビデオ記録または、もちろん添付された音響トラックを有するビデオ記録の受渡しに適用できる。簡単なバージョンではただ1つの記録しかない場合に、システムはオーディオバージョンのみのときとは異なり、ファイルはビデオファイルであり(例えばH.261またはMPEGフォーマット)、プイヤープログラムはビデオデコーダを伴っている。ファイルをサブファイルに区分する方法は変更されない。
【0060】
オーディオの場合のように、すでに説明したように制御機構により選択された異なったデータレートに対応する2以上の記録が存在する可能性がある。また、高速順方向または高速逆方向のような異なった再生モードに対応する付加的な記録を行うことができ、それらはすでに説明したようにユーザの制御装置の拡張によって選択されることができる。再び、ファイルおよびディレクトリネームの系統的なコンベンションにしたがうことができ、プイヤープログラムは例えばサブファイルアドレスを訂正することによって高速順方向命令に応答することができる。
【0061】
しかしながら、ビデオ記録の受渡しは、スイッチングまたはジャンプが許容されるならばファイル区分に対するさらに別の関係を有する。画像の各フレームが独立に符号化される記録の場合には、サブファイルが画像のフレームの全数を含んでいることで十分である。しかしながら、インターフレーム技術を含む圧縮が使用されている場合には、状態はもっと複雑になる。そのようなシステムの幾つかは(例えばMPEG標準方式)独立に符号化されたフレームの混合したもの(“イントラフレーム”)および予測された符号化されたフレームを発生し、この場合には各サブファイルはイントラフレームで開始されることが好ましい。
【0062】
頻繁で規則的なイントラフレームの含有に対して与えられていないITU H.261標準方式のようなインターフレーム符号化システムの場合にはこれは可能ではない。これは例としてレートスイッチングを採用しているために、低いビットレート記録のサブファイルn+1が後続する高いビットレート記録のサブファイルnをリクエストした場合に、低いビットレートサブファイルの最初のフレームは低いビットレート記録のサブファイルnの最後にデコードされたフレームを使用してインターフレームベースで符号化されるであろう。それはもちろん端末は勝手な処分はできない。それは高いビットレート記録のサブファイルn最後にデコードされたフレームを有している。したがってデコーダの重大なミストラッキングが発生する。
【0063】
正常の再生と高速再生のモード切換えの場合には、実際の状態は少し異なっている。例えば正常な速度の5倍の高速順方向再生において、5番目毎のフレームだけを符号化する。その結果として、インターフレーム相関は著しく減少され、インターフレーム符号化は魅力的ではなくなり、そのため一般的にイントラフレームとして高速再生シーケンスを符号化することが望まれている。正常速度から高速への切換えはイントラフレームが困難なくデコードされるので問題を生じない。しかしながら、正常再生へ戻るときにミストラッキングの問題が再び発生する。それは端末は先行するフレームでは有していない予測された符号化されたフレームを与えられるからである。
【0064】
いずれの場合にも、問題は国際特許出願WO98/26604号(米国特許6002440号として発行)に記載された原理を使用することによって解決することができる。これは先行するシーケンスの最後のフレームと新しいシーケンスの最初のフレームとの間のギャップをブリッジする中間のフレームシーケンスを符号化することを含んでいる。
【0065】
この動作について高速順方向再生動作(高速まき戻しは類似しているが逆方向である)について説明する。この例では9分のビデオシーケンスがH.261標準方式にしたがって96kビット/秒で符号化されており、H.261のインフラフレームで全体的に正常なレートの5倍の速度であり、結果的に得られたファイルは4秒のサブファイルに区分されていると仮定する。したがって4秒はもとのビデオ信号の期間と呼ばれ、高速順方向再生時間ではない。上述した使用に類似したネーミングコンベンションにしたがってサブファイルは次の表で示されている。
【0066】
【表6】
ここで、“ネーム”は特定の記録を識別するための名前であり、“x1”は正常なレートを示し、“x5”は5倍の正常なレートを示す。すなわち高速順方向レートである。
【0067】
正常の再生から高速順方向へ切換えるためにはプレイヤープログラムをポイントへのサブファイルアドレスを高速順方向シーケンスへ変更することだけが必要である。例えば、
リクエストmpg name/096K x1/000055.bin に後続して、
リクエストmpg name/096K x5/000055.bin
正常な再生へ戻すように切換えるために、ブリッジングシーケンスを構成するために各可能な転移に対してブリッジサブファイルを構成することが必要である。前述の国際特許出願明細書に記載されているように、一般にブリッジングに対しては3または4フレームのシーケンスで十分であり、それ故、実行する簡単な方法は4フレーム期間だけのブリッジングサブファイルを構成することである。例えば、
それ故、切換えは次のような1連のリクエストによって行われる。
【0068】
リクエストmpg name/096k x5/000099.bin
リクエストmpg name/096k 5 >1/000099.bin
リクエストmpg name/096k x1/000100.bin
ブリッジングサブファイルは次のようにして生成される。
・高速順方向シーケンスをデコードしてサブファイル99の最後のフレームのデコードされたバージョンを得る(毎秒25フレームにおいて、これはもとのビデオ信号のフレーム100,000 である)。
【0069】
・正常のシーケンスをデコードしてサブファイル100の最初のフレームのデコードされたバージョンを得る(すなわちフレーム100,001 である)。最初の基準フレームとしてこの1フレームをデコードされたフレーム100,000 に基づいてH.261インターフレームコード化を使用して4回再符号化する。
【0070】
・したがって、デコーダが高速フォワードサブファイルをデコードしたとき、それに続いてサブファイルをブリッジすることによりフレーム100,000 が正確に再構成され、正常の(x1)フレームをデコードする準備ができる。付随的に、この手順で同じフレームを複数回符号化する理由は、1度しか行わないと、H.261の量的特性により生成される画像の品質が貧弱になるからである。
【0071】
正確に同じプロセスがレート切換えに対しても使用できる(この場合にはサブファイルのブリッジングは両方向に必要であるが)。しかしながら、説明したようにブリッジングサブファイルは4フレーム期間、すなわち(毎秒25フレームで)160ミリ秒のあいだ画像を凍結する。高速再生から正常の再生への切換えにおいて、これは許容可能である。事実この時点でバッファのクリアを選択する可能性がある。それはレート切換えが許容可能であっても可能でなくてもよい。それ故、代りに4秒ブリッジングシーケンスを構成してもよい。
【0072】
リクエストシリーズは次のように表される。
【0073】
mpg name/096k x1/000099.bin
mpg name/096k/128 x1/000100.bin
mpg name/128k x1/000101.bin
ブリッジングサブファイルはその場合に、基準フレームとしてデコードされた96kビット/秒のフレーム100,000 によりスタートしてデコードされた4倍の128kビット/秒シーケンスの第5のデコードされたフレームを記録するか、或いは基準フレームとしてデコードされた96kビット/秒のフレーム100,000 によりスタートしてデコードされた128kビット/秒シーケンスの第1、第4フレームを符号化するかのいずれかによって構成されることができる。両方の場合においてブリッジングサブファイルの残りの96フレームは128kビット/秒サブファイルのコピーである。
【0074】
受渡されるファイルは“記録”と呼ばれる。しかしながら、オーディオまたはビデオシーケンス全体が符号化されなければならないこと、または受渡しが開始される前に存在していることは必要ではない。すなわち、コンピュータはライブフィードを受信し、それを選択された符号化方式を使用して符号化してサブファイルを生成し、それらをサーバへアップロードし、それにより幾つかのサブファイルがサーバ上に存在すれば受渡しが開始される。
【0075】
この受渡しシステムの1つの応用は、図5に示されているような音声メッセージシステムに対するものであり、それにおいては、サーパ1 、ネットワーク2 、および端末3 が示されている。音声メッセージインターフェース4 は例えば公共電話ネットワーク(PSTN)5 を介して電話呼を受信するように機能し、メッセージを記録し、符号化してそれをサブファイルに区分し、それらをサーパ1 へアップロードし、そこにおいてそれらは前述したようにアクセスされる。その代りに第2のインターフェース6 が設けられて、端末3 と同様に動作するが、遠隔の電話5 によってPSTNを介して遠隔的に制御されて、それに中継されたオーディオ信号が送信されてもよい。
【0076】
同じシステムはライブオーディオ(またはビデオ)フィードに対して使用されることができる。それは意味的には依然として“記録された”であり、主要な相違点は受渡し、および再生が記録が終了する前に開始することである。もっとも当然ながら、固有の遅延が存在し、それにおいては少なくとも1サブファイルが記録されてサーバ1 にロードされるまで待機しなければならない。
【0077】
システムは上述のように動作し、最初に再生がスタートすることを除いては全く満足すべきものであり、一方ユーザが最も望無可能性があることは今スタートすることである。すなわち、最も最近に生成されたサブファイルを有することである。
【0078】
長いオーディオシーケンスによって、記憶量を節約するために古いサブファイルを消去することを選択できる。連続的なフィードにより(すなわち24時間1日)これは不可避であり、さらに、サブファイルネームを再使用し(我々のプロトタイプのシステムでは、000000.bin乃至009768.binを使用し、それから000000.binでスタートする)、それによって古いサブファイルが一定して新しいもので重書きされる必要がある。最も最近のサブファイルによりスタートする受渡しを確実にする方法は、適当なサブファイルをリクエストすることによってスタートするためにプレイヤープログラムに命令する余分の命令をインデックスファイル中に含めることである。しかしながら、これはそのインデックスファイルが非常に頻繁に変更されなければならない欠点が有り、理想的には新しいサブファイルが生成される都度行われなければならない。それ故、本発明ではプレイヤープログラムがサーバを走査する方法は次のようにしてスタートするサブファイルを発見する。インデックスファイルでは、モードパラメータは“ライブ”に設定され、プレイヤープログラムをトリガーしてこの方法を開始させる。LFIはサブファイルの最大数を示すように設定され、それは、例えば9768として記憶される。この方法は次のようなステップを含み、(通常のように)各サブファイルの“最後に変更した”時間および日付が決定されたことを予想する。HTTPプロトコルを使用するとき、これはヘッドリクエストを使用して達成されることができ、それはリクエストされたサブファイルの受渡しを生じるのではなく、サブファイルがサーバに書込まれた時間を示すヘッダ情報だけを生成し、或いはサブファイルが存在しない場合にはゼロを生成する。
【0079】
この時間はGetURL(LiveIndex)として以下に記載され、ここでLiveIndexは問題としているサブファイルのシーケンス番号である。コメントに先行して“//”が付けられている。
【0080】
【表7】
LiveIndexを発見したとき、Tp (プレイアウト時間)に慎重にステップバックし、そこからオーディオバッファを満たすためにリクエストを行うことを開始する。再生は正常の方法で開始されることができる。
【0081】
記録が実際に完了すると、インデックスファイルは所望ならば変更されてモードを“記録された”に設定し、任意の長さのパラメータにすることができる。
【0082】
所望ならば、プレイヤープログラムは周期的に検査されてインデックスファイルが“ライブ”から“記録された”に変化したか否か観察し、変化していれば、“記録された”モード再生に切換える。
【0083】
もっと簡単で、ずっと速い“最後のサブファイル”の識別方法について以下説明する。まず、単一の連続的なサブファイルナンバリングシーケンスと仮定する。
【0084】
1.端末は最初のサブファイル(例えば000000.bin)に対してヘッドリクエストを発行する。
【0085】
2.サーバはこのファイルのヘッダを送ることによって応答し、ファイルが最後に変更された日付と時間(MODTIME)およびこの応答が送られた日付と時間(REPLYTIME)が含まれる(これらの両者は標準のhttp. フィールドである)。
【0086】
3.端末は2つを減算することによって経過時間(ELTIME)を計算し(ELTIME=REPLYTIME−MODTIME)、これをサブファイルの再生時間(この例では4秒)で割算することによってLIVEINDEX=ELTIME/4を得る。
【0087】
4.端末はこのインデックスを有しているサブファイルのファイルネームを計算する。
【0088】
5.端末はこのファイルネームによりヘッドリクエストを発行し、必要ならばゼロを受取るまで(ファイルは発見されない)次のファイルネームのヘッドリクエストを発行し、“現在のサブファイル”として発見された最後のサブファイルに関するものである。
【0089】
6.端末はファイルのリクエストを開始し、前に示したフローチャートのポイントJ1でスタートする。
【0090】
この方法は循環式にナンバーを付けたサブファイルに対して上記したものよりかなり速い。古いサブファイルは消去されてもよく、スタートサブファイルが維持されている限り記憶要求を減少させる。しかしながら、この方法はファイルネームの再使用に適合するように変更されることができるが、次のことが要求される。
(i)スタートのサブファイルネーム(例えば00000000.bin)は再使用せず、それ故常にステップ2でヘッダ情報を供給するために利用できる。したがって、009768.binでラップすることにより、サブファイル009768.binはサブファイル000001.binによって後続される。
(ii)ステップ3で計算されたLIVEINDEXはモジュロ9768を取る(すなわちELTIME/4が9768によって割算されたときの剰余)。
(iii)サブファイルの消去は常に新しいサブファイルの生成に導き、そのため最も新しいサブファイルと最も古い消されていないサブファイルとの間にいくつかのファイルネームは存在しない。そのためにステップ5で期待される“ファイルは発見されない”応答が生じる。
【0091】
記録動作よりも少し速い、または少し遅い再生動作が行われる危険性が存在する可能性がある。前者に対して保護するために、プレイヤープログラムは以前のものよりも遅い時間でマークされたか否かを確認するために受信する各サブファイルを検査し、もしもサブファイルが廃棄されていなければ、繰返してリクエストし(恐らく3回)、それに続いてこれらのリクエストが成功しないか否かインデックスファイルを検査する。
【0092】
もしも、再生イングが記録プロセスの後であるならば、現在リクエストされているものよりもさらに最近サブファイルの可なりの数が存在したことについてサーバを検査するプレイヤープログラムによって識別され、そのようなサブファイルが存在していれば、例えば少量のデータを規則的に廃棄することによって“キャッチアップ”プロセスが開始される。
【図面の簡単な説明】
【図1】 記載されたシステムの全体のアーキテクチャを示す概略図。
【図2】 そのようなシステム端末のブロック図。
【図3】 典型的なインデックスファイルの内容を示す図。
【図4】 サブファイル生成の変形された方法を示すタイミング図。
【図5】 変形されたアーキテクチャを示す図。
Claims (3)
- 第1のフレーム長を有する第1の符号化アルゴリズムによって入力信号の連続する第1の時間的部分のそれぞれを符号化して、第1の符号化されたシーケンスを生成し、
第2のフレーム長を有する第2の符号化アルゴリズムによって入力信号の連続する第2の時間的部分のそれぞれを符号化して、第2の符号化されたシーケンスの各オーバーラップする部分が第1の符号化されたシーケンスの部分の間の少なくとも境界を含むように第2の符号化されたシーケンスを生成し、
さらに、出力部に一方の符号化されたシーケンスを供給し、スイッチング命令に応答してもう一方の符号化されたシーケンスを供給するように出力をスイッチングし、
前記第1の時間的部分は、前記第1のフレーム長の整数に対応し、そして隣接するか、オーバーラップしており、
前記第2の時間的部分は、前記第2のフレーム長の整数に対応し、前記第1のフレーム長の整数には対応せず、オーバーラップしており、
前記スイッチングは、1つの符号化された時間的部分と次のものとの間の境界で行われる入力オーディオ信号の符号化方法。 - 第1および第2の符号化アルゴリズムはそれぞれ異なった出力データレートに対応している請求項1記載の方法。
- 請求項1乃至2のいずれか1項記載の方法を使用して信号を符号化し、
ディスクリートな部分をデコードし、
先行する時間部的分の終りおよび、またはすぐ後に続く時間的部分の始めに対応するデコードされた信号の一部分を廃棄するオーディオ信号の送信方法。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
EP00311275A EP1215663A1 (en) | 2000-12-15 | 2000-12-15 | Encoding audio signals |
PCT/GB2001/005082 WO2002049008A1 (en) | 2000-12-15 | 2001-11-19 | Encoding audio signals |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2004516505A JP2004516505A (ja) | 2004-06-03 |
JP4270868B2 true JP4270868B2 (ja) | 2009-06-03 |
Family
ID=8173454
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2002550638A Expired - Lifetime JP4270868B2 (ja) | 2000-12-15 | 2001-11-19 | オーディオ信号の符号化 |
Country Status (11)
Country | Link |
---|---|
US (1) | US7222068B2 (ja) |
EP (2) | EP1215663A1 (ja) |
JP (1) | JP4270868B2 (ja) |
KR (1) | KR100838052B1 (ja) |
CN (1) | CN1217317C (ja) |
AT (1) | ATE347729T1 (ja) |
AU (2) | AU1512202A (ja) |
CA (1) | CA2429735C (ja) |
DE (1) | DE60125061T2 (ja) |
ES (1) | ES2277954T3 (ja) |
WO (1) | WO2002049008A1 (ja) |
Families Citing this family (22)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7840412B2 (en) | 2002-01-18 | 2010-11-23 | Koninklijke Philips Electronics N.V. | Audio coding |
US9323571B2 (en) * | 2004-02-06 | 2016-04-26 | Intel Corporation | Methods for reducing energy consumption of buffered applications using simultaneous multi-threading processor |
US20050185541A1 (en) * | 2004-02-23 | 2005-08-25 | Darren Neuman | Method and system for memory usage in real-time audio systems |
US7594254B2 (en) * | 2004-03-22 | 2009-09-22 | Cox Communications, Inc | System and method for transmitting files from a sender to a receiver in a television distribution network |
KR20070001267A (ko) * | 2004-04-09 | 2007-01-03 | 닛본 덴끼 가부시끼가이샤 | 음성 통신 방법 및 장치 |
US8868772B2 (en) | 2004-04-30 | 2014-10-21 | Echostar Technologies L.L.C. | Apparatus, system, and method for adaptive-rate shifting of streaming content |
US7818444B2 (en) | 2004-04-30 | 2010-10-19 | Move Networks, Inc. | Apparatus, system, and method for multi-bitrate content streaming |
DE102004047032A1 (de) * | 2004-09-28 | 2006-04-06 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Vorrichtung und Verfahren zum Bezeichnen von verschiedenen Segmentklassen |
DE102004047069A1 (de) * | 2004-09-28 | 2006-04-06 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Vorrichtung und Verfahren zum Ändern einer Segmentierung eines Audiostücks |
US8683066B2 (en) | 2007-08-06 | 2014-03-25 | DISH Digital L.L.C. | Apparatus, system, and method for multi-bitrate content streaming |
US8370514B2 (en) * | 2005-04-28 | 2013-02-05 | DISH Digital L.L.C. | System and method of minimizing network bandwidth retrieved from an external network |
JP4639966B2 (ja) * | 2005-05-31 | 2011-02-23 | ヤマハ株式会社 | オーディオデータ圧縮方法およびオーディオデータ圧縮回路並びにオーディオデータ伸張回路 |
CN101231850B (zh) * | 2007-01-23 | 2012-02-29 | 华为技术有限公司 | 编解码方法及装置 |
EP2112653A4 (en) * | 2007-05-24 | 2013-09-11 | Panasonic Corp | AUDIO DEODICATION DEVICE, AUDIO CODING METHOD, PROGRAM AND INTEGRATED CIRCUIT |
EP2131590A1 (en) * | 2008-06-02 | 2009-12-09 | Deutsche Thomson OHG | Method and apparatus for generating or cutting or changing a frame based bit stream format file including at least one header section, and a corresponding data structure |
JP2009294603A (ja) * | 2008-06-09 | 2009-12-17 | Panasonic Corp | データ再生方法、データ再生装置及びデータ再生プログラム |
US8321401B2 (en) | 2008-10-17 | 2012-11-27 | Echostar Advanced Technologies L.L.C. | User interface with available multimedia content from multiple multimedia websites |
US9510029B2 (en) | 2010-02-11 | 2016-11-29 | Echostar Advanced Technologies L.L.C. | Systems and methods to provide trick play during streaming playback |
US9942593B2 (en) * | 2011-02-10 | 2018-04-10 | Intel Corporation | Producing decoded audio at graphics engine of host processing platform |
CN103117958B (zh) * | 2013-01-08 | 2015-11-25 | 北京百度网讯科技有限公司 | 网络数据包聚集方法、系统及装置 |
CN105409230A (zh) * | 2014-05-27 | 2016-03-16 | 华为技术有限公司 | 媒体文件处理方法及装置 |
CN105429983B (zh) * | 2015-11-27 | 2018-09-14 | 刘军 | 采集媒体数据的方法、媒体终端及音乐教学系统 |
Family Cites Families (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CA2140850C (en) * | 1994-02-24 | 1999-09-21 | Howard Paul Katseff | Networked system for display of multimedia presentations |
US5835495A (en) * | 1995-10-11 | 1998-11-10 | Microsoft Corporation | System and method for scaleable streamed audio transmission over a network |
US6118790A (en) * | 1996-06-19 | 2000-09-12 | Microsoft Corporation | Audio server system for an unreliable network |
US6124895A (en) * | 1997-10-17 | 2000-09-26 | Dolby Laboratories Licensing Corporation | Frame-based audio coding with video/audio data synchronization by dynamic audio frame alignment |
US5903872A (en) * | 1997-10-17 | 1999-05-11 | Dolby Laboratories Licensing Corporation | Frame-based audio coding with additional filterbank to attenuate spectral splatter at frame boundaries |
KR100526218B1 (ko) * | 1997-12-15 | 2005-11-04 | 마츠시타 덴끼 산교 가부시키가이샤 | 광디스크, 기록장치, 기록 프로그램을 저장하는 컴퓨터 판독가능 저장매체 및 기록방법 |
US6061655A (en) * | 1998-06-26 | 2000-05-09 | Lsi Logic Corporation | Method and apparatus for dual output interface control of audio decoder |
US6366888B1 (en) * | 1999-03-29 | 2002-04-02 | Lucent Technologies Inc. | Technique for multi-rate coding of a signal containing information |
-
2000
- 2000-12-15 EP EP00311275A patent/EP1215663A1/en not_active Withdrawn
-
2001
- 2001-11-19 AT AT01983700T patent/ATE347729T1/de not_active IP Right Cessation
- 2001-11-19 AU AU1512202A patent/AU1512202A/xx active Pending
- 2001-11-19 AU AU2002215122A patent/AU2002215122B2/en not_active Ceased
- 2001-11-19 EP EP01983700A patent/EP1342231B1/en not_active Expired - Lifetime
- 2001-11-19 JP JP2002550638A patent/JP4270868B2/ja not_active Expired - Lifetime
- 2001-11-19 ES ES01983700T patent/ES2277954T3/es not_active Expired - Lifetime
- 2001-11-19 KR KR1020037007741A patent/KR100838052B1/ko active IP Right Grant
- 2001-11-19 WO PCT/GB2001/005082 patent/WO2002049008A1/en active IP Right Grant
- 2001-11-19 US US10/433,054 patent/US7222068B2/en not_active Expired - Lifetime
- 2001-11-19 CN CN018205879A patent/CN1217317C/zh not_active Expired - Lifetime
- 2001-11-19 CA CA002429735A patent/CA2429735C/en not_active Expired - Lifetime
- 2001-11-19 DE DE60125061T patent/DE60125061T2/de not_active Expired - Lifetime
Also Published As
Publication number | Publication date |
---|---|
KR20030060984A (ko) | 2003-07-16 |
WO2002049008A1 (en) | 2002-06-20 |
AU2002215122B2 (en) | 2007-10-25 |
AU1512202A (en) | 2002-06-24 |
EP1342231A1 (en) | 2003-09-10 |
ATE347729T1 (de) | 2006-12-15 |
DE60125061D1 (de) | 2007-01-18 |
EP1215663A1 (en) | 2002-06-19 |
EP1342231B1 (en) | 2006-12-06 |
KR100838052B1 (ko) | 2008-06-12 |
DE60125061T2 (de) | 2007-06-06 |
JP2004516505A (ja) | 2004-06-03 |
CA2429735A1 (en) | 2002-06-20 |
CA2429735C (en) | 2008-08-26 |
ES2277954T3 (es) | 2007-08-01 |
US7222068B2 (en) | 2007-05-22 |
CN1481547A (zh) | 2004-03-10 |
US20040030547A1 (en) | 2004-02-12 |
CN1217317C (zh) | 2005-08-31 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP4087706B2 (ja) | オーディオおよび、またはビデオマテリアルの送信および受信 | |
JP4270868B2 (ja) | オーディオ信号の符号化 | |
KR100908954B1 (ko) | 오디오 또는 비디오 자료의 전송방법 및 장치 | |
AU2002220927A1 (en) | Transmission and reception of audio and/or video material | |
AU2002215122A1 (en) | Encoding audio signals | |
US20180097862A1 (en) | Streaming media delivery system | |
EP2475149B1 (en) | Method for streaming multimedia data over a non-streaming protocol | |
JP4949591B2 (ja) | ビデオ誤り回復方法 | |
US8639832B2 (en) | Variant streams for real-time or near real-time streaming to provide failover protection | |
EP3300372B1 (en) | Updating a playlist for streaming content | |
CN102577308A (zh) | 使用可伸缩编码的增强型块请求流送 | |
CN102549999A (zh) | 使用协作式并行http和前向纠错的增强型块请求流送 | |
CN102577411A (zh) | 使用信令或块创建的增强型块请求流送系统 | |
CN102550034A (zh) | 使用块划分或请求控制以获得改善的客户端侧处置的增强型块请求流送 | |
JP4882441B2 (ja) | 配信サーバ装置、クライアント装置、及びそれらに用いるプログラム | |
WO2002049342A1 (en) | Delivery of audio and/or video material | |
JP2005121693A (ja) | ストリーミング配信システム及びストリーミング配信方法 | |
JP3920716B2 (ja) | ストリーミングサービスの配信レート変更方法及びストリーム配信サーバ並びにストリーム配信プログラム及びその情報記録媒体 | |
JP2001111433A (ja) | 圧縮データ処理装置および圧縮データ処理方法ならびに情報記録媒体 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20041118 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20070724 |
|
A601 | Written request for extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A601 Effective date: 20071024 |
|
A602 | Written permission of extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A602 Effective date: 20071031 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20080123 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20090127 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20090224 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120306 Year of fee payment: 3 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 4270868 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120306 Year of fee payment: 3 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130306 Year of fee payment: 4 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130306 Year of fee payment: 4 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20140306 Year of fee payment: 5 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
EXPY | Cancellation because of completion of term |