JP2005072708A - Apparatus and method for frame format conversion - Google Patents
Apparatus and method for frame format conversion Download PDFInfo
- Publication number
- JP2005072708A JP2005072708A JP2003209383A JP2003209383A JP2005072708A JP 2005072708 A JP2005072708 A JP 2005072708A JP 2003209383 A JP2003209383 A JP 2003209383A JP 2003209383 A JP2003209383 A JP 2003209383A JP 2005072708 A JP2005072708 A JP 2005072708A
- Authority
- JP
- Japan
- Prior art keywords
- frame
- bit
- extracted
- configuration
- unit
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Abstract
Description
【0001】
【発明の属する技術分野】
本発明は、符号化ビットレートをフレーム単位で切り替えることができる所定の音声圧縮符号化方式、例えば、Adaptive Multi−Rate(AMR)に基づいて符号化された音声符号化ビットが含まれるフレームの構成を変換するフレーム構成変換装置及びフレーム構成変換方法に関する。
【0002】
【従来の技術】
従来、第3世代移動通信システムにおいて利用される標準の音声符号化方式として、フレーム単位で符号化ビットレートを切り替えることができるAdaptive Multi−Rate(AMR)が、標準化団体である3GPP(3rd Generation Partnership Project)において策定されている(例えば、非特許文献1参照)。
【0003】
AMRは、第3世代移動通信システムにおいて、映像配信サービスによって映像とともに配信される音声コンテンツを符号化する場合や、TV電話サービスにおいて伝送される音声を符号化する場合に用いられている。
【0004】
また、AMRは、インターネット上などにおいて、RTP(Real−time Transport Protocol)を使用してストリーミングデータとして配信される音声コンテンツを符号化する場合の音声符号化方式としても普及してきている。
【0005】
【非特許文献1】
“Mandatory speech codec speech processing functions; Adaptive Multi−Rate (AMR) speech codec frame structure − TS26.101 release 5”、The 3rd Generation Partnership Project, 2002年6月
【0006】
【発明が解決しようとする課題】
しかしながら、AMRには、その用途、すなわち使用される通信プロトコルに応じて、複数のフレーム構成(フレームフォーマット)が存在し、かつ、それぞれのフレームフォーマットは、他のフレームフォーマットと互換性がないという問題があった。
【0007】
例えば、RTPを使用してAMRによって符号化されたAMRデータを配信する場合のフレーム構成(RTP Payload Format)は、第3世代移動通信システムにおけるTV電話通信プロトコル(3G−324M)を使用してAMRデータを配信する場合のフレーム構成(Interface Format 2)とは互換性がないため、RTP Payload Formatを有するAMRデータを、第3世代移動通信システムにおいて使用される移動電話端末などに直接配信することができないという問題があった。
【0008】
そこで、本発明は、上述した問題点を解決すべくなされたものであり、AMRなど、符号化ビットレートをフレーム単位で切り替えることができる音声符号化方式によって符号化された音声符号化ビットが含まれるフレームを、当該音声符号化方式の他のフレームに変換することができるフレーム構成変換装置及びフレーム構成変換方法を提供することをその目的とする。
【0009】
【課題を解決するための手段】
上述した課題を解決するため、本発明は、次のような特徴を有している。まず、本発明の第1の特徴は、符号化ビットレートをフレーム単位で切り替えることができる所定の音声圧縮符号化方式、例えば、Adaptive Multi−Rate(AMR)に基づいて符号化された音声符号化ビットと、フレームの種別を示すフレーム種別ビット(Frame Type)と、付加情報ビット(Change mode Requestビット、フレーム品質インジケータなど)とが、所定の順序で配列された第1のフレーム(例えば、RTP Payload Format)を、第2のフレーム(例えば、Interface Format 2)に変換するフレーム構成変換装置であって、連続して入力された前記第1のフレームをフレーム単位で抜き出すフレーム抜出部(フレーム抜出部102)と、抜き出された抜出フレームの中から、前記フレーム種別ビットを検出するフレーム種別検出部(FT検出・格納部103)と、前記第2のフレームの構成に基づいて、前記抜出フレームに含まれている前記音声符号化ビットを前記抜出フレーム上の所定の位置に変更する処理部(不要ビット削除部104、ビットシフト部105及びビット反転部106)と、前記第2のフレームの構成に基づいて、前記フレーム種別検出部によって検出された前記フレーム種別ビットを前記抜出フレーム上の所定の位置に配置するフレーム種別ビット配置部(FT配置部107)とを備えることを要旨とする。
【0010】
かかる特徴によれば、処理部が、第2のフレーム構成に基づいて、音声符号化ビットをフレーム抜出部によって抜き出された抜出フレームの所定の位置に変更し、フレーム種別ビット配置部が、フレーム種別ビットを抜出フレーム上の所定の位置に配置するため、符号化ビットレートをフレーム単位で切り替えることができる所定の音声圧縮符号化方式に基づいて符号化された音声符号化ビットを含むフレームの構成を変換することができる。
【0011】
本発明の第2の特徴は、本発明の第1の特徴において、前記処理部が、前記抜出フレームに含まれている前記フレーム種別ビットと、前記付加情報ビットとを削除し、前記抜出フレーム上の前記音声符号化ビットの位置をシフトさせることにより、前記音声符号化ビットを前記所定の位置に変更することを要旨とする。
【0012】
本発明の第3の特徴は、本発明の第2の特徴において、前記処理部が、前記抜出フレーム上に順次配置されている所定ビット数の前記音声符号化ビットの順序を反転させることにより、前記音声符号化ビットを前記所定の位置に変更することを要旨とする。
【0013】
かかる特徴によれば、ビットシフト部が、音声符号化ビットの抜出フレーム上の位置をシフトさせ、ビット反転部が、抜出フレーム上に順次配置されている所定ビット数の音声符号化ビットの順序を反転させるため、より少ない処理ステップ数でフレーム構成を変換することができる。
【0014】
すなわち、かかる特徴によれば、第1のフレーム構成から第2のフレーム構成に変換するために必要な処理の内容を、予めビット削除部、ビットシフト部及びビット反転部に登録しておくことにより、少ない処理ステップ数によるフレーム構成の変換が図れ、フレーム構成の変換に係る処理速度を向上させることができる。
【0015】
本発明の第4の特徴は、本発明の第1乃至第3の特徴において、前記所定の音声圧縮符号化方式として、Adaptive Multi−Rateにより符号化された前記音声符号化ビットが含まれるフレームの構成を変換することを要旨とする。
【0016】
かかる特徴によれば、AMRによって符号化されたAMRデータを、例えば、RTP Payload Formatから、Interface Format 2に変換することができる。この結果、本発明に係るフレーム構成変換装置を用いることにより、例えば、インターネット上において公開されているRTP Payload Formatを有するAMRデータを、第3世代移動通信システムにおいて使用される移動電話端末などに配信することが可能となる。
【0017】
本発明の第5の特徴は、符号化ビットレートをフレーム単位で切り替えることができる所定の音声圧縮符号化方式に基づいて符号化された音声符号化ビットと、フレームの種別を示すフレーム種別ビットと、付加情報ビットとが、所定の順序で配列された第1のフレームを、第2のフレームに変換するフレーム構成変換方法であって、連続して入力された前記第1のフレームをフレーム単位で抜き出すステップと、抜き出された抜出フレームの中から、前記フレーム種別ビットを検出するステップと、前記第2のフレームの構成とに基づいて、前記抜出フレームに含まれている前記音声符号化ビットを前記抜出フレーム上の所定の位置に変更するステップと、前記第2のフレームの構成に基づいて、前記フレーム種別ビットを検出するステップによって検出された前記フレーム種別ビットを前記抜出フレーム上の所定の位置に配置するステップとを備えることを要旨とする。
【0018】
【発明の実施の形態】
(フレーム構成変換装置の構成)
本発明の実施形態について図1乃至図3を参照しながら説明する。図1は、本実施形態に係るフレーム構成変換装置の論理ブロック構成を示している。
【0019】
同図に示すように、フレーム構成変換装置100は、データ入力部101と、フレーム抜出部102と、FT検出・格納部103と、不要ビット削除部104と、ビットシフト部105と、ビット反転部106と、FT配置部107と、データ出力部108とを備えている。
【0020】
データ入力部101は、外部から入力されたAMRデータをフレーム抜出部102に送出するものであり、本実施形態では、AMR(Adaptive Multi−Rate)によって符号化され、IETF RFC3267において規定されるRTP Payload Format(第1のフレーム)の構成を有するAMRデータが、データ入力部101に入力される。
【0021】
なお、データ入力部101が具備する入力インターフェースとしては、通信ネットワークを介してAMRデータを取得する100BASE−TXなどのLANカードや、CD−ROM及びDVD−ROMなどの外部記憶媒体に記憶されたAMRデータを読み込む外部記憶媒体アクセス装置などを用いることができる。
【0022】
フレーム抜出部102は、データ入力部101に連続して入力されたRTP Payload Formatを有するAMRデータ・フレームをフレーム単位で抜き出すものである。
【0023】
具体的には、フレーム抜出部102は、データ入力部101から送出されたRTP Payload Formatを有するAMRデータを、CMR(Change Mode Request)ビットを最上位ビット(MSB: Most Significant Bit)として、フレーム単位で抜き出し、抜き出したAMRデータ・フレームをFT検出・格納部103に送出する。
【0024】
ここで、図2は、フレーム抜出部102によって抜き出されたRTP Payload Formatを有するAMRデータのフレーム構成を示している。
【0025】
同図に示すように、RTP Payload Formatを有するAMRデータは、AMRによって符号化された音声符号化ビット(D)と、フレーム種別を示すフレーム種別ビット、つまり、符号化ビットレートなどを示す情報(FT:フレームタイプ)と、符号化ビットレートなどを変更する際に用いられるCMRビット(CMR)や、後に続くフレームの有無を示す確認ビット(F)などの付加情報ビットとから構成されている。
【0026】
FT検出・格納部103は、フレーム抜出部102によって抜き出されたAMRデータ・フレームの中から、フレーム種別ビット(FT)を検出するものであり、本実施形態では、フレーム種別検出部を構成する。
【0027】
具体的には、FT検出・格納部103は、図2に示したOctet 1の第2〜5ビットに位置するフレーム種別ビット(FT)を検出するとともに、検出したフレーム種別ビット(FT)の内容を格納し、その内容をFT配置部107に転送する。
【0028】
また、FT検出・格納部103は、フレーム種別ビット(FT)を検出後、フレーム抜出部102から送出されたAMRデータ・フレームを不要ビット削除部104に送出する。
【0029】
不要ビット削除部104は、出力すべきInterface Format 2(第2のフレーム)の構成)とに基づいて、FT検出・格納部103から送出されたAMRデータ・フレームの中から、フレーム種別ビット(FT)と、CMRビットや確認ビット(F)などの付加情報ビットとを削除するものである。
【0030】
具体的には、不要ビット削除部104は、図2に示したOctet 0及びOctet 1に位置する情報を削除する。
【0031】
また、不要ビット削除部104は、フレーム種別ビット(FT)と、CMRビットや確認ビット(F)などの付加情報ビットとを削除したAMRデータ・フレームをビットシフト部105に送出する。
【0032】
ビットシフト部105は、RTP Payload Formatの構成と、Interface Format 2の構成とに基づいて、不要ビット削除部104から送出されたAMRデータ・フレーム上の音声符号化ビット(D)の位置をシフトさせるものである。
【0033】
具体的には、ビットシフト部105は、音声符号化ビット(D)をLSB側に4ビットシフトさせる。さらに、ビットシフト部105は、音声符号化ビット(D)が位置する最終オクテットに含まれているパディングビット(P)を削除する。
【0034】
また、ビットシフト部105は、音声符号化ビット(D)をシフトさせ、パディングビット(P)を削除したAMRデータ・フレームをビット反転部106に送出する。
【0035】
ビット反転部106は、RTP Payload Formatの構成と、Interface Format 2の構成とに基づいて、ビットシフト部105から送出されたAMRデータ・フレーム上に順次配置されている所定ビット数の音声符号化ビット(D)の順序を反転させるものである。
【0036】
具体的には、ビット反転部106は、ビットシフト部105から送出されたAMRデータ・フレーム上において、オクテット毎、つまり8ビット単位で音声符号化ビット(D)の順序を反転させる。
【0037】
例えば、AMRデータ・フレーム上のあるオクテットに、D(236)−D(237)−D(238)−D(239)−D(240)−D(241)−D(242)−D(243)と、音声符号化ビットがMSB側からLSB(Least Significant Bit)側へ順次配置されていた場合、音声符号化ビットの当該オクテット上の配列を、D(243)−D(242)−D(241)−D(240)−D(239)−D(238)−D(237)−D(236)に反転させる。すなわち、ビット反転部106は、音声符号化ビット(D)をオクテット(8ビット)単位で、MSB firstからLSB firstに変更する。
【0038】
また、ビット反転部106は、音声符号化ビット(D)の順序を反転させたAMRデータ・フレームをFT配置部107に送出する。
【0039】
なお、本実施形態では、不要ビット削除部104と、ビットシフト部105と、ビット反転部106とによって、処理部を構成する。また、不要ビット削除部104と、ビットシフト部105と、ビット反転部106による、より具体的なフレーム構成の変換方法については、後述する。
【0040】
FT配置部107は、Interface Format 2の構成に基づいて、FT検出・格納部103によって検出されたフレーム種別ビット(FT)を、ビット反転部106から送出されたAMRデータ・フレーム上の所定位置に配置するものであり、本実施形態では、フレーム種別ビット配置部を構成する。
【0041】
具体的には、FT配置部107は、FT検出・格納部103から転送されたフレーム種別ビット(FT)を、ビット反転部106から送出されたAMRデータ・フレームのOctet 0の第5ビットから、LSB側へ順次配置、つまりMSB firstで配置する。
【0042】
また、FT配置部107は、フレーム種別ビット(FT)を配置したAMRデータ・フレームをデータ出力部108に送出する。
【0043】
データ出力部108は、不要ビット削除部104と、ビットシフト部105と、ビット反転部106と、FT配置部107とによって処理されたAMRデータを、Interface Format 2を有するAMRデータとして出力するものであり、本実施形態では、出力部を構成する。
【0044】
具体的には、データ出力部108は、FT配置部107から送出されたAMRデータをInterface Format 2を有するAMRデータとして、外部に出力する。ここで、図3は、データ出力部108から出力されるInterface Format 2を有するAMRデータ・フレームの構成を示している。
【0045】
同図に示すように、Interface Format 2を有するAMRデータは、AMRによって符号化された音声符号化ビット(D)と、フレーム種別を示すフレーム種別ビット(FT)とから構成されている。
【0046】
さらに、図2に示したRTP Payload Formatを有するAMRデータと比較すると、音声符号化ビット(D)は、オクテット毎に、LSBからMSB側へ順次配置、つまりLSB firstで配置されている。
【0047】
また、データ出力部108が具備する出力インターフェースとしては、通信ネットワークを介してAMRデータを出力する100BASE−TXなどのLANカードなどを用いることができる。なお、かかる場合、データ入力部101と、データ出力部108とは、同一のLANカードによって構成することも勿論可能である。
【0048】
(フレーム構成変換方法)
次に、上述した本実施形態に係るフレーム構成変換装置を用いたAMRデータのフレーム構成の変換方法について説明する。
【0049】
図4は、AMRデータ・フレームをRTP Payload FormatからInterface Format 2に変換する場合におけるフレーム構成変換装置100の処理フローを示している。
【0050】
同図に示すように、ステップS10において、フレーム構成変換装置100は、入力されたRTP Payload Formatを有するAMRデータをフレーム単位で抜き出す。ステップS10において抜き出されたAMRデータ・フレームは、上述したように、図2に示したフレーム構成を有している。
【0051】
ステップS20において、フレーム構成変換装置100は、ステップS10において抜き出したAMRデータ・フレームの中から、フレーム種別ビット(FT)を検出するとともに、検出したフレーム種別ビット(FT)の内容を格納する。
【0052】
ここで、図5は、ステップS20において検出されるフレーム種別ビット(FT)のAMRデータ・フレーム上の位置を示している。同図に示すように、RTP Payload Formatでは、フレーム種別ビット(FT)は、Octet 1の第2〜5ビットに配置されている。
【0053】
ステップS30において、フレーム構成変換装置100は、ステップS10において抜き出されたAMRデータ・フレームの中から、フレーム種別ビット(FT)と、CMRビットや確認ビット(F)などの付加情報ビットとを削除する。
【0054】
ここで、図6は、ステップS30において削除される、フレーム種別ビット(FT)と、CMRビットや確認ビット(F)などの付加情報ビットとのAMRデータ・フレーム上の位置を示している。同図に示すように、フレーム構成変換装置100は、ステップS10において抜き出されたAMRデータ・フレームの中から、Octet 0及びOctet 1に位置するフレーム種別ビット(FT)と、CMRビットや確認ビット(F)などの付加情報ビットを削除する。
【0055】
ステップS40において、フレーム構成変換装置100は、AMRデータ・フレームの中に含まれている音声符号化ビット(D)をLSB側に4ビットシフトさせる。
【0056】
ステップS50において、フレーム構成変換装置100は、音声符号化ビット(D)が位置する最終オクテットに含まれているパディングビット(P)を削除する。
【0057】
ここで、図7(a)は、ステップS40における音声符号化ビット(D)のビットシフト処理が実行される前のAMRデータ・フレームの構成を示している。また、図7(b)は、ステップS40及びS50における処理、すなわち音声符号化ビット(D)をLSB側に4ビットシフトさせ、パディングビット(P)を削除した後のAMRデータ・フレームの構成を示している。同図(b)に示すように、Octet 0のMSBから4ビットは、ビットシフト処理の結果、何も情報が配置されていない状態となっている。
【0058】
ステップS60において、フレーム構成変換装置100は、ステップS40及びS50の処理が実行されたAMRデータ・フレーム上において、オクテット(8ビット)単位で音声符号化ビット(D)の順序を反転させる、すなわち、音声符号化ビット(D)をオクテット単位で、MSB firstからLSB firstに変更する。
【0059】
ここで、図8(a)は、音声符号化ビット(D)の順序を反転させる前のAMRデータ・フレームの構成を示している。また、図8(b)は、音声符号化ビット(D)の順序を反転させた後のAMRデータ・フレームの構成を示している。
【0060】
例えば、反転前にOctet 30のMSBに位置するD(236)は、ステップS60の処理により反転させられることにより、Octet 30のLSBに配置、つまり反転前のD(242)の位置に配置される。以下、同図(a)の矢印で示すように、D(237)〜D(242)の位置が反転させられるとともに、他の音声符号化ビット(D)についても同様にオクテット単位で、順序が反転させられる。
【0061】
ステップS70において、フレーム構成変換装置100は、ステップS20において検出したフレーム種別ビット(FT)をAMRデータ・フレーム上の所定の位置に配置する。
【0062】
ここで、図9は、ステップS70において、フレーム種別ビット(FT)が配置される位置を示している。同図に示すように、フレーム構成変換装置100は、フレーム種別ビット(FT)を、AMRデータ・フレームのOctet 0の第5ビットからLSB方向へ順次配置、つまりMSB firstで配置する。
【0063】
ステップS80において、フレーム構成変換装置100は、ステップS70においてフレーム種別ビット(FT)が配置されたAMRデータを、Interface Format 2を有するAMRデータとして出力する。
【0064】
(作用・効果)
本実施形態によれば、不要ビット削除部104と、ビットシフト部105と、ビット反転部106とが、Interface Format 2の構成に基づいて、音声符号化ビット(D)をフレーム抜出部102によって抜き出されたAMRデータ・フレームの所定の位置に変更し、FT配置部107が、フレーム種別ビット(FT)を抜き出されたAMRデータ・フレーム上の所定の位置に配置するため、AMRなど、符号化ビットレートをフレーム単位で切り替えることができる所定の音声圧縮符号化方式に基づいて符号化された音声符号化ビットを含むフレームの構成を変換することができる。
【0065】
本実施形態によれば、ビットシフト部105が、音声符号化ビット(D)のAMRデータ・フレーム上の位置をシフトさせ、ビット反転部106が、当該フレーム上に順次配置されている所定ビット数の音声符号化ビット(D)の順序を反転させるため、より少ない処理ステップ数でRTP Payload FormatからInterface Format 2に変換することができる。
【0066】
すなわち、本実施形態によれば、RTP Payload FormatからInterface Format 2に変換するために必要な処理の内容を、予め不要ビット削除部104、ビットシフト部105及びビット反転部106に登録しておくことにより、少ない処理ステップ数によるフレーム構成の変換が図れ、フレーム構成の変換に係る処理速度を向上させることができる。
【0067】
さらに、本実施形態によれば、フレーム構成変換装置100を用いることにより、例えば、インターネット上において公開されているRTP Payload Formatを有するAMRデータを、第3世代移動通信システムにおいて使用される移動電話端末などに配信することが可能となる。
【0068】
(変更例)
上述した本発明の実施形態においては、RTP Payload Formatを有するAMRデータをInterface Format 2を有するAMRデータに変換する形態を例として説明したが、フレーム構成変換装置100に入力されるフレームの構成から出力すべきフレームの構成に変換するための処理の内容を、不要ビット削除部104、ビットシフト部105、ビット反転部106などに予め登録することにより、本発明は、他のフレーム構成にも適用することができる。
【0069】
【発明の効果】
以上説明したように本発明によれば、AMR(Adaptive Multi−Rate)など、符号化ビットレートをフレーム単位で切り替えることができる音声符号化方式によって符号化された音声符号化ビットが含まれるフレームを、当該音声符号化方式の他のフレームに変換することができるフレーム構成変換装置及びフレーム構成変換方法を提供することができる。
【図面の簡単な説明】
【図1】本発明の実施形態に係るフレーム構成変換装置の論理ブロック構成を示す図である。
【図2】本発明の実施形態に係るフレーム構成変換装置に入力されるデータのフレーム構成を示す図である。
【図3】本発明の実施形態に係るフレーム構成変換装置から出力されるデータのフレーム構成を示す図である。
【図4】本発明の実施形態に係るフレーム構成変換装置によるフレーム構成の変換方法を示す図である。
【図5】本発明の実施形態に係るフレーム構成変換装置によるフレーム構成の変換途中におけるフレーム上のデータの配置状態を示す図である。
【図6】本発明の実施形態に係るフレーム構成変換装置によるフレーム構成の変換途中におけるフレーム上のデータの配置状態を示す図である。
【図7】本発明の実施形態に係るフレーム構成変換装置によるフレーム構成の変換途中におけるフレーム上のデータの配置状態を示す図である。
【図8】本発明の実施形態に係るフレーム構成変換装置によるフレーム構成の変換途中におけるフレーム上のデータの配置状態を示す図である。
【図9】本発明の実施形態に係るフレーム構成変換装置によるフレーム構成の変換途中におけるフレーム上のデータの配置状態を示す図である。
【符号の説明】
100…フレーム構成変換装置、101…データ入力部、102…フレーム抜出部、103…FT検出・格納部、104…不要ビット削除部、105…ビットシフト部、106…ビット反転部、107…FT配置部、108…データ出力部[0001]
BACKGROUND OF THE INVENTION
The present invention relates to a configuration of a frame including audio encoded bits encoded based on a predetermined audio compression encoding method capable of switching an encoding bit rate in units of frames, for example, Adaptive Multi-Rate (AMR). The present invention relates to a frame configuration conversion apparatus and a frame configuration conversion method.
[0002]
[Prior art]
Conventionally, Adaptive Multi-Rate (AMR), which is capable of switching the coding bit rate in units of frames, is a standard speech coding method used in the third generation mobile communication system, 3GPP (3rd Generation Partnership) (See, for example, Non-Patent Document 1).
[0003]
AMR is used in the third generation mobile communication system when encoding audio content distributed together with video by a video distribution service, or encoding audio transmitted in a TV phone service.
[0004]
AMR has also become widespread as an audio encoding method for encoding audio content distributed as streaming data using RTP (Real-time Transport Protocol) on the Internet and the like.
[0005]
[Non-Patent Document 1]
“Mandatory spec code spec processing functions; Adaptive Multi-Rate (AMR) spec code frame structure − TS26.101
[0006]
[Problems to be solved by the invention]
However, AMR has a plurality of frame configurations (frame formats) depending on its use, that is, a communication protocol to be used, and each frame format is not compatible with other frame formats. was there.
[0007]
For example, the frame structure (RTP Payload Format) when distributing AMR data encoded by AMR using RTP is AMR using the TV telephone communication protocol (3G-324M) in the third generation mobile communication system. Since the frame configuration (Interface Format 2) for data distribution is not compatible, AMR data having RTP Payload Format can be directly distributed to mobile phone terminals used in the third generation mobile communication system. There was a problem that I could not.
[0008]
Therefore, the present invention has been made to solve the above-described problems, and includes speech encoded bits encoded by a speech encoding method in which the encoding bit rate can be switched on a frame basis, such as AMR. It is an object of the present invention to provide a frame configuration conversion apparatus and a frame configuration conversion method that can convert a frame to be converted into another frame of the speech encoding method.
[0009]
[Means for Solving the Problems]
In order to solve the above-described problems, the present invention has the following features. First, the first feature of the present invention is that a voice coding encoded based on a predetermined voice compression coding method capable of switching a coding bit rate in units of frames, for example, Adaptive Multi-Rate (AMR). A first frame (for example, RTP Payload) in which a bit, a frame type bit (Frame Type) indicating a frame type, and an additional information bit (Change mode Request bit, frame quality indicator, etc.) are arranged in a predetermined order A frame configuration conversion device for converting (Format) into a second frame (for example, Interface Format 2), wherein a frame extraction unit (frame extraction) extracts the first frame that is continuously input in units of frames. Part 102) and extracted Based on the configuration of the frame type detection unit (FT detection / storage unit 103) that detects the frame type bit from the outgoing frame and the second frame, the speech code included in the extracted frame Based on the configuration of the processing unit (unnecessary
[0010]
According to this feature, the processing unit changes the speech encoded bit to a predetermined position of the extracted frame extracted by the frame extracting unit based on the second frame configuration, and the frame type bit arrangement unit In order to arrange the frame type bit at a predetermined position on the extracted frame, the encoded bit rate includes audio encoded bits encoded based on a predetermined audio compression encoding method that can be switched in units of frames. The structure of the frame can be converted.
[0011]
According to a second feature of the present invention, in the first feature of the present invention, the processing unit deletes the frame type bit and the additional information bit included in the extracted frame, and extracts the extracted information. The gist is to change the speech coding bits to the predetermined position by shifting the position of the speech coding bits on the frame.
[0012]
A third feature of the present invention is that, in the second feature of the present invention, the processing unit reverses the order of the speech encoded bits having a predetermined number of bits sequentially arranged on the extracted frame. The gist of the present invention is to change the speech coding bit to the predetermined position.
[0013]
According to such a feature, the bit shift unit shifts the position of the speech encoded bits on the extracted frame, and the bit inversion unit stores the speech encoded bits of a predetermined number of bits sequentially arranged on the extracted frame. Since the order is reversed, the frame configuration can be converted with a smaller number of processing steps.
[0014]
That is, according to this feature, by registering in advance the contents of processing necessary for conversion from the first frame configuration to the second frame configuration in the bit deletion unit, the bit shift unit, and the bit inversion unit. The frame configuration can be converted with a small number of processing steps, and the processing speed related to the frame configuration conversion can be improved.
[0015]
According to a fourth aspect of the present invention, in the first to third aspects of the present invention, as the predetermined audio compression encoding method, a frame including the audio encoded bits encoded by Adaptive Multi-Rate is included. The gist is to convert the configuration.
[0016]
According to this feature, AMR data encoded by AMR can be converted from, for example, RTP Payload Format to
[0017]
A fifth feature of the present invention is that a speech coding bit that is coded based on a predetermined speech compression coding method that can switch a coding bit rate in units of frames, a frame type bit that indicates a frame type, A frame configuration conversion method for converting a first frame in which additional information bits are arranged in a predetermined order into a second frame, wherein the first frame that is continuously input is converted into a frame unit. The speech encoding included in the extracted frame based on the step of extracting, the step of detecting the frame type bit from the extracted extracted frame, and the configuration of the second frame A step of changing a bit to a predetermined position on the extracted frame, and a step of detecting the frame type bit based on the configuration of the second frame. And summarized in that comprises the steps of placing the frame type bit is detected in a predetermined position on said extraction frames by.
[0018]
DETAILED DESCRIPTION OF THE INVENTION
(Configuration of frame configuration conversion device)
An embodiment of the present invention will be described with reference to FIGS. FIG. 1 shows a logical block configuration of the frame configuration conversion apparatus according to the present embodiment.
[0019]
As shown in the figure, the frame
[0020]
The
[0021]
The
[0022]
The
[0023]
Specifically, the
[0024]
Here, FIG. 2 shows a frame configuration of AMR data having the RTP payload format extracted by the
[0025]
As shown in the figure, the AMR data having the RTP Payload Format includes voice encoded bits (D) encoded by the AMR, frame type bits indicating the frame type, that is, information indicating the encoding bit rate ( FT: frame type) and additional information bits such as a CMR bit (CMR) used when changing the encoding bit rate and a confirmation bit (F) indicating the presence or absence of a subsequent frame.
[0026]
The FT detection /
[0027]
Specifically, the FT detection /
[0028]
Further, after detecting the frame type bit (FT), the FT detection /
[0029]
The unnecessary
[0030]
Specifically, the unnecessary
[0031]
Unnecessary
[0032]
The
[0033]
Specifically, the
[0034]
Also, the
[0035]
Based on the configuration of RTP Payload Format and the configuration of
[0036]
Specifically, the
[0037]
For example, an octet on an AMR data frame can be represented by D (236) -D (237) -D (238) -D (239) -D (240) -D (241) -D (242) -D (243 ) And the coded speech bits are sequentially arranged from the MSB side to the LSB (Least Significant Bit) side, the arrangement of the coded speech bits on the octet is represented by D (243) -D (242) -D ( 241) -D (240) -D (239) -D (238) -D (237) -D (236). That is, the
[0038]
In addition, the
[0039]
In the present embodiment, the unnecessary
[0040]
Based on the configuration of
[0041]
Specifically, the
[0042]
Also, the
[0043]
The
[0044]
Specifically, the
[0045]
As shown in the figure, AMR data having
[0046]
Further, compared with the AMR data having the RTP Payload Format shown in FIG. 2, the speech coding bits (D) are sequentially arranged from the LSB to the MSB side for each octet, that is, LSB first.
[0047]
As an output interface provided in the
[0048]
(Frame structure conversion method)
Next, a method for converting the frame configuration of AMR data using the above-described frame configuration conversion apparatus according to the present embodiment will be described.
[0049]
FIG. 4 shows a processing flow of the frame
[0050]
As shown in the figure, in step S10, the frame
[0051]
In step S20, the frame
[0052]
Here, FIG. 5 shows the position of the frame type bit (FT) detected in step S20 on the AMR data frame. As shown in the figure, in the RTP Payload Format, the frame type bit (FT) is arranged in the second to fifth bits of
[0053]
In step S30, the frame
[0054]
Here, FIG. 6 shows the positions on the AMR data frame of the frame type bits (FT) and additional information bits such as CMR bits and confirmation bits (F) to be deleted in step S30. As shown in the figure, the frame
[0055]
In step S40, the frame
[0056]
In step S50, the frame
[0057]
Here, FIG. 7A shows the configuration of the AMR data frame before the bit shift processing of the speech encoded bit (D) in step S40 is executed. FIG. 7B shows the structure of the AMR data frame after the processing in steps S40 and S50, that is, the speech encoded bit (D) is shifted by 4 bits to the LSB side and the padding bit (P) is deleted. Show. As shown in FIG. 4B, the 4 bits from the MSB of
[0058]
In step S60, the frame
[0059]
Here, FIG. 8A shows the structure of the AMR data frame before the order of the speech coding bits (D) is reversed. FIG. 8B shows the structure of the AMR data frame after the order of the speech coding bits (D) is reversed.
[0060]
For example, D (236) located in the MSB of
[0061]
In step S70, the frame
[0062]
Here, FIG. 9 shows the position where the frame type bit (FT) is arranged in step S70. As shown in the figure, the frame
[0063]
In step S80, the frame
[0064]
(Action / Effect)
According to the present embodiment, the unnecessary
[0065]
According to the present embodiment, the
[0066]
That is, according to the present embodiment, the contents of processing necessary for conversion from RTP Payload Format to Interface
[0067]
Furthermore, according to the present embodiment, by using the frame
[0068]
(Example of change)
In the embodiment of the present invention described above, an example in which AMR data having RTP Payload Format is converted to AMR data having
[0069]
【The invention's effect】
As described above, according to the present invention, a frame including speech encoded bits encoded by a speech encoding method in which the encoding bit rate can be switched on a frame basis, such as AMR (Adaptive Multi-Rate). In addition, it is possible to provide a frame configuration conversion apparatus and a frame configuration conversion method that can convert the speech encoding scheme into another frame.
[Brief description of the drawings]
FIG. 1 is a diagram showing a logical block configuration of a frame configuration conversion apparatus according to an embodiment of the present invention.
FIG. 2 is a diagram showing a frame configuration of data input to the frame configuration conversion apparatus according to the embodiment of the present invention.
FIG. 3 is a diagram showing a frame configuration of data output from the frame configuration conversion apparatus according to the embodiment of the present invention.
FIG. 4 is a diagram illustrating a frame configuration conversion method by the frame configuration conversion apparatus according to the embodiment of the present invention.
FIG. 5 is a diagram showing an arrangement state of data on a frame in the middle of frame configuration conversion by the frame configuration conversion apparatus according to the embodiment of the present invention.
FIG. 6 is a diagram showing an arrangement state of data on a frame in the middle of frame configuration conversion by the frame configuration conversion apparatus according to the embodiment of the present invention.
FIG. 7 is a diagram showing an arrangement state of data on a frame in the middle of frame configuration conversion by the frame configuration conversion apparatus according to the embodiment of the present invention.
FIG. 8 is a diagram showing an arrangement state of data on a frame in the middle of frame configuration conversion by the frame configuration conversion apparatus according to the embodiment of the present invention.
FIG. 9 is a diagram showing an arrangement state of data on a frame in the middle of frame configuration conversion by the frame configuration conversion apparatus according to the embodiment of the present invention.
[Explanation of symbols]
DESCRIPTION OF
Claims (5)
連続して入力された前記第1のフレームをフレーム単位で抜き出すフレーム抜出部と、
抜き出された抜出フレームの中から、前記フレーム種別ビットを検出するフレーム種別検出部と、
前記第2のフレームの構成に基づいて、前記抜出フレームに含まれている前記音声符号化ビットを前記抜出フレーム上の所定の位置に変更する処理部と、
前記第2のフレームの構成に基づいて、前記フレーム種別検出部によって検出された前記フレーム種別ビットを前記抜出フレーム上の所定の位置に配置するフレーム種別ビット配置部と
を備えることを特徴とするフレーム構成変換装置。An audio encoding bit encoded based on a predetermined audio compression encoding method in which an encoding bit rate can be switched in units of frames, a frame type bit indicating a frame type, and an additional information bit are predetermined A frame configuration conversion device that converts first frames arranged in order into second frames,
A frame extraction unit for extracting the first frame continuously input in units of frames;
A frame type detection unit for detecting the frame type bit from the extracted extracted frame;
Based on the configuration of the second frame, a processing unit that changes the speech encoded bits included in the extracted frame to a predetermined position on the extracted frame;
And a frame type bit arrangement unit that arranges the frame type bits detected by the frame type detection unit at a predetermined position on the extracted frame based on the configuration of the second frame. Frame configuration conversion device.
前記抜出フレームに含まれている前記フレーム種別ビットと、前記付加情報ビットとを削除し、
前記抜出フレーム上の前記音声符号化ビットの位置をシフトさせることにより、前記音声符号化ビットを前記所定の位置に変更することを特徴とする請求項1に記載のフレーム構成変換装置。The processor is
Deleting the frame type bit and the additional information bit included in the extracted frame;
2. The frame configuration conversion device according to claim 1, wherein the speech coding bit is changed to the predetermined position by shifting the position of the speech coding bit on the extracted frame.
連続して入力された前記第1のフレームをフレーム単位で抜き出すステップと、
抜き出された抜出フレームの中から、前記フレーム種別ビットを検出するステップと、
前記第2のフレームの構成とに基づいて、前記抜出フレームに含まれている前記音声符号化ビットを前記抜出フレーム上の所定の位置に変更するステップと、前記第2のフレームの構成に基づいて、前記フレーム種別ビットを検出するステップによって検出された前記フレーム種別ビットを前記抜出フレーム上の所定の位置に配置するステップと
を備えることを特徴とするフレーム構成変換方法。An audio encoding bit encoded based on a predetermined audio compression encoding method in which an encoding bit rate can be switched in units of frames, a frame type bit indicating a frame type, and an additional information bit are predetermined A frame configuration conversion method for converting a first frame arranged in order into a second frame,
Extracting the first frames input consecutively in units of frames;
Detecting the frame type bit from the extracted extracted frame;
Based on the configuration of the second frame, the step of changing the speech coding bits included in the extracted frame to a predetermined position on the extracted frame; and the configuration of the second frame And a step of arranging the frame type bit detected by the step of detecting the frame type bit at a predetermined position on the extracted frame.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2003209383A JP4209733B2 (en) | 2003-08-28 | 2003-08-28 | Frame configuration conversion apparatus and frame configuration conversion method |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2003209383A JP4209733B2 (en) | 2003-08-28 | 2003-08-28 | Frame configuration conversion apparatus and frame configuration conversion method |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2005072708A true JP2005072708A (en) | 2005-03-17 |
JP4209733B2 JP4209733B2 (en) | 2009-01-14 |
Family
ID=34402345
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2003209383A Expired - Fee Related JP4209733B2 (en) | 2003-08-28 | 2003-08-28 | Frame configuration conversion apparatus and frame configuration conversion method |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP4209733B2 (en) |
-
2003
- 2003-08-28 JP JP2003209383A patent/JP4209733B2/en not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
JP4209733B2 (en) | 2009-01-14 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US8125507B2 (en) | Video call apparatus for mobile communication terminal and method thereof | |
US7813492B2 (en) | Method and system for establishing a multimedia connection by negotiating capability in an outband control channel | |
US7920578B2 (en) | System and method for monitoring a video phone service | |
US8989805B2 (en) | Mobile communication device providing N-way communication through a plurality of communication devices | |
US11799922B2 (en) | Network core facilitating terminal interoperation | |
US7227922B2 (en) | Method and device for the transmission of data in a packet-oriented data network | |
JP2006157120A (en) | Network communication apparatus | |
JP2005176352A (en) | Wireless moving picture streaming file, method and system for moving picture streaming service of mobile communication terminal | |
EP2011320A1 (en) | System and method of conferencing endpoints | |
US9826072B1 (en) | Network-terminal interoperation using compatible payloads | |
CN111327580A (en) | Message transmission method and device | |
CN106921843A (en) | Data transmission method and device | |
JP5311059B2 (en) | Gateway apparatus and system, and communication method | |
JP2006141006A (en) | Exchange of encoded data packets | |
CN100579105C (en) | Method and device for treating data stream | |
KR100683339B1 (en) | Caller confirmaion system based on image | |
JP4209733B2 (en) | Frame configuration conversion apparatus and frame configuration conversion method | |
JP5093526B2 (en) | Gateway apparatus and system, and communication method | |
TWI523461B (en) | Communication system and method | |
WO2001049014A1 (en) | Mobile communications system provided with answering service function and network device thereof and radio communication terminal | |
JP2011101246A (en) | Communication system, communication equipment, communication method and program | |
KR100923390B1 (en) | Method for interworking between voip network and wcdma network | |
JPH06311233A (en) | Voice mail system | |
WO2010075794A1 (en) | Method and apparatus for processing compressed multiplexed messages | |
KR100854883B1 (en) | Communication Terminal and Method for Caller Identification Display in Communication Terminal |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20060411 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20080702 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20080708 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20080908 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20080930 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20081023 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20111031 Year of fee payment: 3 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20121031 Year of fee payment: 4 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20131031 Year of fee payment: 5 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
LAPS | Cancellation because of no payment of annual fees |