JP2005341061A - 多重化装置及び多重化方法 - Google Patents

多重化装置及び多重化方法 Download PDF

Info

Publication number
JP2005341061A
JP2005341061A JP2004155116A JP2004155116A JP2005341061A JP 2005341061 A JP2005341061 A JP 2005341061A JP 2004155116 A JP2004155116 A JP 2004155116A JP 2004155116 A JP2004155116 A JP 2004155116A JP 2005341061 A JP2005341061 A JP 2005341061A
Authority
JP
Japan
Prior art keywords
data
aac
interval time
video data
codec
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2004155116A
Other languages
English (en)
Inventor
Hiroshi Ishimaru
浩 石丸
Harumi Aoyama
春巳 青山
Atsuhito Miyata
篤人 宮田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NTT Docomo Inc
Original Assignee
NTT Docomo Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NTT Docomo Inc filed Critical NTT Docomo Inc
Priority to JP2004155116A priority Critical patent/JP2005341061A/ja
Publication of JP2005341061A publication Critical patent/JP2005341061A/ja
Pending legal-status Critical Current

Links

Images

Landscapes

  • Television Systems (AREA)
  • Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)
  • Time-Division Multiplex Systems (AREA)

Abstract

【課題】 音声の再生遅延がより少なくなるように、MPEG-4のAACデータとビデオデータとを多重化する。
【解決手段】 入力されたAACデータを、符復号最小単位(フレームデータ単位)に分割し(1)、1フレーム構成サンプル数をサンプリングレートで割ることでフレームデータの符復号間隔時間を算出する(2)。当該時間間隔を空けるように上記分割されたフレームデータを再生順に配置する(3)。入力されたビデオデータを、符復号間隔時間に対応するサイズに分割し、分割されたビデオデータを、配置された複数のフレームデータの間に配置する(4)。これにより、フレームデータが符復号間隔時間の間隔を空けて配置された3G-324Mストリームが得られる。以後、生成されたメディアデータ列の各要素をAL-SDUとして、再生順にAL-PDU化、MUX-SDU化、MUX-PDU化を行うことでH.223ビットストリームを生成する(5)。
【選択図】 図2

Description

本発明は、MPEG-4のAAC(Advanced Audio Coding)データとビデオデータとを多重化する(即ち、MPEG-4 AACデータのH.223多重化を行う)多重化装置及び多重化方法に関する。
現在、インターネット上やパソコン上でのマルチメディアデータの汎用符号化の標準的な方式として、MPEG-4符号化方式が広く採用されており、例えば、RTPプロトコルを利用した汎用的なインターネット上のライブストリーミングシステムにおける映像及び音声の符号化方式としても採用されている。このうちMPEG-4の音声符号化方式としては、AAC(Advanced Audio Coding)が知られており、このAACは、スピーチ用符号化方式であるAMR(adaptive multi-rate)に対し「高圧縮」、「多チャンネルサラウンド」といった点で優れている。このようなAACによるデータ再生に関する技術は下記の特許文献1に記載されている。
また、移動体通信においても、第三世代移動体通信の標準化団体である3GPP(3rd Generation Partnership Project)は、第三世代移動体通信におけるテレビ電話通話プロトコル(3G-324M)の映像符号化方式としてMPEG-4 Visualを採用している。
特開2003−29792号公報
しかしながら、第三世代移動体通信におけるテレビ電話通話プロトコル(3G-324M)の音声符号化方式には、3GPPが標準音声符号化方式として策定したAMRのみが採用され、上記のAACは採用されていない。このため、前述したAACの特徴(利点)を第三世代移動体テレビ電話通話で活かすことは困難である。つまり、第三世代移動体テレビ電話通話では、AMRによっては表現が難しい音楽や音響情報を、上記のAACの特徴(「高圧縮」、「多チャンネルサラウンド」)を活かして実現することは困難であり、上記の特徴を活かした効果的な音楽や音響情報の通信を実現することは困難である。
そのため、例えば、MPEG-4 Visualの一時的にデータ量が大きいビデオストリームデータ(Intraフレーム等)の受信時には、上記の特徴を活かしながら、MPEG-4の音声符号化方式であるAACデータの受信及び再生を遅延無く行うことが待望されていた。
本発明は、上記課題を解決するために成されたものであり、音声の再生遅延がより少なくなるように、MPEG-4のAACデータとビデオデータとを多重化することができる多重化装置及び多重化方法を提供することを目的とする。
上記目的を達成するために、本発明に係る多重化装置は、MPEG-4のAACデータとビデオデータとを多重化する多重化装置において、AACデータを入力するAACデータ入力手段と、ビデオデータを入力するビデオデータ入力手段と、前記AACデータ入力手段により入力されたAACデータを複数のAACフレームデータに分割する分割手段と、前記AACデータ入力手段により入力されたAACデータに基づいて、AACフレームデータの符復号間隔時間を算出する符復号間隔時間算出手段と、前記符復号間隔時間算出手段により算出された符復号間隔時間の間隔を空けるように、前記分割手段により分割された複数のAACフレームデータを再生順に配置するAACフレーム配置手段と、前記ビデオデータ入力手段により入力されたビデオデータを、前記符復号間隔時間に対応するサイズに分割し、分割されたビデオデータを、前記配置された複数のAACフレームデータの間に配置するビデオデータ配置手段とを備えたことを特徴とする。なお、「AACデータ」とは、AACの音声符号化方式による符号化処理により得られたデータを意味し、「AACフレームデータ」とは、AACデータを、AACの符復号最小単位であるフレームデータ単位に分割することで得られるデータを意味する。また、AACデータ入力手段及びビデオデータ入力手段における「入力」とは、外部から多重化装置へのデータ入力全般を広く含む概念であり、外部からの「受信」も含まれる。
また、本発明に係る多重化方法は、入力されたMPEG-4のAACデータとビデオデータとを多重化するための多重化方法において、入力されたAACデータを複数のAACフレームデータに分割する分割工程と、前記AACデータに基づいて、AACフレームデータの符復号間隔時間を算出する符復号間隔時間算出工程と、算出された符復号間隔時間の間隔を空けるように、前記分割された複数のAACフレームデータを再生順に配置するAACフレーム配置工程と、入力されたビデオデータを、前記符復号間隔時間に対応するサイズに分割し、分割されたビデオデータを、前記配置された複数のAACフレームデータの間に配置するビデオデータ配置工程とを有することを特徴とする。
上記のような本発明では、入力されたAACデータが複数のAACフレームデータに分割され、上記AACデータに基づいてAACフレームデータの符復号間隔時間が算出される。このとき、AACデータの1フレーム構成サンプル数をAACサンプリングレートによって割る割り算で得られた値を、符復号間隔時間として算出することが望ましい。
そして、算出された符復号間隔時間の間隔を空けるように、上記分割された複数のAACフレームデータが再生順に配置される。入力されたビデオデータは、符復号間隔時間に対応するサイズに分割され、当該分割されたビデオデータは、上記配置された複数のAACフレームデータの間に配置される。
これにより、複数のAACフレームデータが符復号間隔時間の間隔を空けて配置された3G-324Mストリームを得ることが可能となるため、3G-324Mストリーム復号・再生器を搭載した第三世代移動体は、復号・再生すべきAACフレームデータを常に符復号時間間隔で受信することが可能となる。従って、例えば、MPEG-4 Visualの一時的にデータ量が大きいビデオストリームデータ(Intraフレーム等)の受信時においても、AACデータの受信及び再生を遅延無く行うことが可能となる。
以上、本発明によれば、音声の再生遅延がより少なくなるように、MPEG-4のAACデータとビデオデータとを多重化することができる。
以下、本発明に係る多重化装置及び多重化方法の一実施形態を説明する。
図1には、本発明に係る多重化装置10の構成例を示す。この図1に示すように、多重化装置10は、MPEG-4 AACデータを入力するAACデータ入力部11と、ビデオデータを入力するビデオデータ入力部12と、入力されたAACデータを、AACの符復号最小単位であるフレームデータ(Audio Mux Elementともいう)単位に分割する(「フレームデータ単位に切り出す」ともいう)AACフレーム分割部(本発明に係る分割手段に対応)13と、AACフレームデータの符復号間隔時間を算出する符復号間隔時間算出部14と、算出された符復号間隔時間の間隔を空けるように、上記分割された複数のAACフレームデータを再生順に配置するAACフレーム配置部15と、入力されたビデオデータを、符復号間隔時間に対応するサイズに分割し、分割されたビデオデータを、配置された複数のAACフレームデータの間に配置するビデオデータ配置部16と、ビデオデータ配置部16による配置により生成されたメディアデータ列の各要素をAL-SDU(Adaptation Layer - Service Data Unit)として、再生順にAL-PDU(Adaptation Layer - Protocol Data Unit)化、MUX-SDU(Multiplex Layer - Service Data Unit)化、MUX-PDU(Multiplex Layer - Protocol Data Unit)化を順に行うことで、H.223ビットストリームを生成するH.223多重化部17と、H.223多重化部17により生成されたH.223ビットストリームを外部へ出力するH.223ストリーム出力部18とを含んで構成されている。
上記の符復号間隔時間算出部14は、以下の式(A)によって、AACフレームデータの符復号間隔時間を算出する。
AACフレームデータの符復号間隔時間[ms]=1フレーム構成サンプル数/AACサンプリングレート[Hz] ・・・(A)
次に、図2を用いて、多重化装置10におけるMPEG-4 AACのH.223多重化処理の一例を説明する。
H.223多重化処理では、まず図1のAACデータ入力部11がテレビ電話通信におけるAACデータを入力するとともに、ビデオデータ入力部12がビデオデータを入力する。AACフレーム分割部13は、入力されたAACデータを、AACの符復号最小単位であるフレームデータ(Audio Mux Elementともいう)単位に分割する(図2の処理(1);本発明に係る分割工程に相当)。
次に、符復号間隔時間算出部14は、上記の式(A)によって、AACフレームデータの符復号間隔時間を算出する。
例えば、AACの1フレーム構成サンプル数を1024、AACサンプリングレートを32[kHz]とすると、AACフレームデータの符復号間隔時間は、(1フレーム構成サンプル数/AACサンプリングレート=1024/32=)32[ms]となる(図2の処理(2);本発明に係る符復号間隔時間算出工程に相当)。
その後、AACフレーム配置部15は、算出された符復号間隔時間の間隔を空けるように、上記分割された複数のAACフレームデータを再生順に配置する(図2の処理(3);本発明に係るAACフレーム配置工程に相当)。そして、ビデオデータ配置部16は、上記入力されたビデオデータを、符復号間隔時間に対応するサイズに分割し、分割されたビデオデータを、配置された複数のAACフレームデータの間に配置する(図2の処理(4);本発明に係るビデオデータ配置工程に相当)。
さらに、H.223多重化部17は、ビデオデータ配置部16による配置により生成されたメディアデータ列の各要素をAL-SDUとして、再生順にAL-PDU化、MUX-SDU化、MUX-PDU化を順に行うことで、H.223ビットストリームを生成する(図2の処理(5))。そして、H.223ストリーム出力部18は、H.223多重化部17により生成されたH.223ビットストリームを外部へ出力する。
以上のような多重化処理によれば、複数のAACフレームデータが符復号間隔時間の間隔を空けて配置された3G-324Mストリームを得ることが可能となるため、3G-324Mストリーム復号・再生器を搭載した第三世代移動体は、復号・再生すべきAACフレームデータを常に符復号時間間隔で受信することが可能となる。従って、例えば、MPEG-4 Visualの一時的にデータ量が大きいビデオストリームデータ(Intraフレーム等)の受信時においても、AACデータの受信及び再生を遅延無く行うことが可能となる。
以上のように、音声の再生遅延がより少なくなるように、MPEG-4のAACデータとビデオデータとを多重化することができる。
なお、ビデオデータの入力は、AACデータの入力と同時でなくてもよく、ビデオデータ配置部16による分割及び配置処理の前までに実行されればよい。
発明の実施形態における多重化装置の構成図である。 発明の実施形態におけるH.223多重化処理例を説明するための図である。
符号の説明
10…多重化装置、11…AACデータ入力部、12…ビデオデータ入力部、13…AACフレーム分割部、14…符復号間隔時間算出部、15…AACフレーム配置部、16…ビデオデータ配置部、17…H.223多重化部、18…H.223ストリーム出力部。

Claims (3)

  1. MPEG-4のAACデータとビデオデータとを多重化する多重化装置において、
    AACデータを入力するAACデータ入力手段と、
    ビデオデータを入力するビデオデータ入力手段と、
    前記AACデータ入力手段により入力されたAACデータを複数のAACフレームデータに分割する分割手段と、
    前記AACデータ入力手段により入力されたAACデータに基づいて、AACフレームデータの符復号間隔時間を算出する符復号間隔時間算出手段と、
    前記符復号間隔時間算出手段により算出された符復号間隔時間の間隔を空けるように、前記分割手段により分割された複数のAACフレームデータを再生順に配置するAACフレーム配置手段と、
    前記ビデオデータ入力手段により入力されたビデオデータを、前記符復号間隔時間に対応するサイズに分割し、分割されたビデオデータを、前記配置された複数のAACフレームデータの間に配置するビデオデータ配置手段と、
    を備えた多重化装置。
  2. 前記符復号間隔時間算出手段は、
    AACデータの1フレーム構成サンプル数をAACサンプリングレートによって割る割り算で得られた値を、前記符復号間隔時間として算出することを特徴とする請求項1記載の多重化装置。
  3. 入力されたMPEG-4のAACデータとビデオデータとを多重化するための多重化方法において、
    入力されたAACデータを複数のAACフレームデータに分割する分割工程と、
    前記AACデータに基づいて、AACフレームデータの符復号間隔時間を算出する符復号間隔時間算出工程と、
    算出された符復号間隔時間の間隔を空けるように、前記分割された複数のAACフレームデータを再生順に配置するAACフレーム配置工程と、
    入力されたビデオデータを、前記符復号間隔時間に対応するサイズに分割し、分割されたビデオデータを、前記配置された複数のAACフレームデータの間に配置するビデオデータ配置工程と、
    を有する多重化方法。
JP2004155116A 2004-05-25 2004-05-25 多重化装置及び多重化方法 Pending JP2005341061A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2004155116A JP2005341061A (ja) 2004-05-25 2004-05-25 多重化装置及び多重化方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2004155116A JP2005341061A (ja) 2004-05-25 2004-05-25 多重化装置及び多重化方法

Publications (1)

Publication Number Publication Date
JP2005341061A true JP2005341061A (ja) 2005-12-08

Family

ID=35494139

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2004155116A Pending JP2005341061A (ja) 2004-05-25 2004-05-25 多重化装置及び多重化方法

Country Status (1)

Country Link
JP (1) JP2005341061A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106210768A (zh) * 2009-12-21 2016-12-07 艾科星科技公司 用编解码器强制的帧大小进行音频分割

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH024068A (ja) * 1988-06-21 1990-01-09 Nippon Hoso Kyokai <Nhk> パケット多重化装置

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH024068A (ja) * 1988-06-21 1990-01-09 Nippon Hoso Kyokai <Nhk> パケット多重化装置

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106210768A (zh) * 2009-12-21 2016-12-07 艾科星科技公司 用编解码器强制的帧大小进行音频分割
US10230958B2 (en) 2009-12-21 2019-03-12 Dish Technologies Llc Audio splitting with codec-enforced frame sizes
CN106210768B (zh) * 2009-12-21 2019-04-26 迪讯技术有限责任公司 用编解码器强制的帧大小进行音频分割

Similar Documents

Publication Publication Date Title
CN103460288B (zh) 用于生成可由实施不同解码协议的解码器解码的统一比特流的音频编码方法及系统
EP1624448B1 (en) Packet multiplexing multi-channel audio
EP2959669B1 (en) Teleconferencing using steganographically-embedded audio data
JP5011305B2 (ja) オーディオデータパケットの生成方法及びその復調方法
JP5713296B2 (ja) 信号ソースに関連付けられた少なくとも1つのパラメータを符号化するための装置および方法
CN102971788B (zh) 音频信号的样本精确表示的方法及编码器和解码器
JPWO2007043388A1 (ja) 音響信号処理装置および音響信号処理方法
EP3120353A1 (en) Method for compressing a higher order ambisonics (hoa) signal, method for decompressing a compressed hoa signal, apparatus for compressing a hoa signal, and apparatus for decompressing a compressed hoa signal
EP2276192A2 (en) Method and apparatus for transmitting/receiving multi - channel audio signals using super frame
KR100636145B1 (ko) 확장된 고해상도 오디오 신호 부호화 및 복호화 장치
CN108122558A (zh) 一种latm aac音频流的实时转容实现方法及装置
WO2009122757A1 (ja) ステレオ信号変換装置、ステレオ信号逆変換装置およびこれらの方法
CN107659603A (zh) 用户与推送信息互动的方法及装置
WO2013102403A1 (zh) 一种音频信号处理方法、装置及终端
KR20050021812A (ko) 이동통신 단말기에서 출력 버퍼링을 이용한 멀티미디어재생 장치 및 그 제어 방법
EP2084704B1 (en) Apparatus and method for transmitting or replaying multi-channel audio signal
JP2005341061A (ja) 多重化装置及び多重化方法
CN107733833B (zh) 一种CDMA与VoLTE终端的语音互通方法与系统
TW200625954A (en) Video playback apparatus and video playback method
JP2004304410A (ja) 通信処理装置、および通信処理方法、並びにコンピュータ・プログラム
WO2009142017A1 (ja) ステレオ信号変換装置、ステレオ信号逆変換装置およびこれらの方法
JP6763194B2 (ja) 符号化装置、復号装置、通信システム
Preston Audio Engineering Considerations for a Modern Mixnet
GB2596107A (en) Managing network jitter for multiple audio streams
JP2011087188A (ja) 携帯端末装置および音声録音方法ならびにプログラム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20070405

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20100126

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20100326

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20100413