JP2005184168A - Device and method for video coding - Google Patents
Device and method for video coding Download PDFInfo
- Publication number
- JP2005184168A JP2005184168A JP2003418949A JP2003418949A JP2005184168A JP 2005184168 A JP2005184168 A JP 2005184168A JP 2003418949 A JP2003418949 A JP 2003418949A JP 2003418949 A JP2003418949 A JP 2003418949A JP 2005184168 A JP2005184168 A JP 2005184168A
- Authority
- JP
- Japan
- Prior art keywords
- data
- character
- video
- macroblock
- input
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Landscapes
- Compression Of Band Width Or Redundancy In Fax (AREA)
- Television Systems (AREA)
- Compression Or Coding Systems Of Tv Signals (AREA)
Abstract
Description
本発明は、映像信号に文字信号を多重して伝送する映像符号化装置および映像符号化方法に関する。 The present invention relates to a video encoding apparatus and a video encoding method for multiplexing and transmitting a character signal to a video signal.
従来の映像符号化装置は、例えばHTML文書など映像データと文字データとを含む入力データを送信した場合、受信機側で文字データを映像に変換するためのフォントデータを用意して、受信した文字データを映像に変換してから表示していた。 When a conventional video encoding device transmits input data including video data and character data such as an HTML document, for example, the receiver side prepares font data for converting the character data into video and receives the received character. It was displayed after converting the data to video.
しかし上記の方法では、受信機側で大容量のフォントデータを用意するため、部品点数が多くなり、表示を行う際の変換にも負荷がかかる。そのため送信側で、映像データと、文字データを文字フォントファイルを用いて変換した映像データとを同一の記憶装置に蓄え、HTML文書の変換終了後に、この記憶装置から画像データを順次送信していた。(例えば、特許文献1参照)。 However, in the above method, since a large amount of font data is prepared on the receiver side, the number of parts is increased, and a load is also imposed on conversion at the time of display. Therefore, on the transmission side, the video data and the video data obtained by converting the character data using the character font file are stored in the same storage device, and the image data is sequentially transmitted from the storage device after the conversion of the HTML document is completed. . (For example, refer to Patent Document 1).
上記のような、従来の映像符号化装置では、入力された映像データと、文字データから生成した映像データとを別々の情報として蓄えて送信していたので、受信機側で、画像と文字画像とが重ねて表示される場合は、一画面分の画像データと比較すると、画像が重なった部分だけ余分に画像データを送信することになり、通信コストが高くなると言う問題があった。さらに、送信側に文字を画像に変換するために文字フォントファイルを用意する必要があるが、通常フォントファイルは多種の文字入力に対処するために多数のエントリを持つため、大容量の記憶媒体を必要とし、装置のコストが上昇させていた。また、入力文字は用意されたフォントでしか表示できないという制約もあった。 In the conventional video encoding apparatus as described above, since the input video data and the video data generated from the character data are stored and transmitted as separate information, the image and the character image are transmitted on the receiver side. Is displayed in an overlapping manner, compared to the image data for one screen, there is a problem that the image data is transmitted only for the portion where the images overlap, which increases the communication cost. In addition, it is necessary to prepare a character font file for converting characters into images on the transmission side. However, since a normal font file has a large number of entries to deal with various character inputs, a large-capacity storage medium must be used. Necessary and increased the cost of the equipment. In addition, there is a restriction that input characters can be displayed only in a prepared font.
本発明は、かかる問題点を解消するためになされたもので、入力された文字データを効率よく映像データに多重することにより、送信する画像データの容量を抑えた映像符号化装置および映像符号化方法を提供することを目的とする。 The present invention has been made to solve such a problem, and a video encoding apparatus and a video encoding in which the amount of image data to be transmitted is suppressed by efficiently multiplexing input character data onto video data. It aims to provide a method.
この発明にかかる映像符号化装置は、文字データと映像データとを有す入力データの入力部と、前記映像データを、1以上の画素を含む矩形領域に対応した第1のマクロブロックに変換する映像変換部と、前記文字データに対応する第1のビットマップデータを記憶する記憶手段を有し、文字データ入力に対し、上記記憶手段が出力するビットマップデータの1ビットに1マクロブロックを対応させ、前記文字データを前記第1のビットマップデータのビットと相似に配置した、第2のマクロブロックに変換する文字/映像変換部と、前記第1のマクロブロックと前記第2のマクロブロックとを合成した多重化マクロブロックを生成する多重化部とを備えたものである。 The video encoding apparatus according to the present invention converts an input unit of input data having character data and video data, and the video data into a first macroblock corresponding to a rectangular area including one or more pixels. A video conversion unit and storage means for storing the first bitmap data corresponding to the character data, and one macroblock corresponding to one bit of the bitmap data output from the storage means for character data input A character / video conversion unit for converting the character data into a second macroblock arranged in a manner similar to the bits of the first bitmap data; the first macroblock and the second macroblock; And a multiplexing unit for generating a multiplexed macroblock obtained by synthesizing.
以上のように、この発明にかかる映像符号化装置は、文字データと映像データとを有す入力データの入力部と、前記映像データを、1以上の画素を含む矩形領域に対応した第1のマクロブロックに変換する映像変換部と、前記文字データに対応する第1のビットマップデータを記憶する記憶手段を有し、文字データ入力に対し、上記記憶手段が出力するビットマップデータの1ビットに1マクロブロックを対応させ、前記文字データを前記第1のビットマップデータのビットと相似に配置した、第2のマクロブロックに変換する文字/映像変換部と、前記第1のマクロブロックと前記第2のマクロブロックとを合成した多重化マクロブロックを生成する多重化部とを備えている。 As described above, the video encoding apparatus according to the present invention includes an input unit for input data having character data and video data, and the first video data corresponding to a rectangular area including one or more pixels. A video conversion unit for converting into a macro block and a storage unit for storing the first bitmap data corresponding to the character data, and for character data input, 1 bit of the bitmap data output from the storage unit A character / video conversion unit that converts one macroblock into correspondence and converts the character data into a second macroblock arranged similarly to the bits of the first bitmap data; the first macroblock and the first macroblock; And a multiplexing unit that generates a multiplexed macroblock by combining the two macroblocks.
そのため、映像データのマクロブロックと文字映像データのビットに対応させて多重化するために、多重化の処理コストが抑えられるとともに、伝送する映像データの量を抑えて、通信コストを低減できる。 Therefore, since multiplexing is performed in correspondence with the macroblocks of the video data and the bits of the character video data, the multiplexing processing cost can be suppressed, and the amount of the video data to be transmitted can be suppressed to reduce the communication cost.
実施の形態1.
図1は、本発明の実施の形態1による映像符号化装置のブロック図である。
FIG. 1 is a block diagram of a video encoding apparatus according to
図1において、映像符号化装置10の入力部11に入力された、映像データと文字データとを含む入力データ100は、映像データ101と文字データ102とに配分される。この映像データ101を映像変換部14で変換して映像マクロブロック105が生成される。文字データ102を文字/映像変換部12で変換して、映像に変換した文字マクロブロック103が生成される。映像マクロブロック105と文字マクロブロック103とは多重化部13で重ね合わせられ、多重化マクロブロック104が出力される。多重化マクロブロック104は、映像符号化部15で符号化されて、映像符号化データ106を出力し、映像符号化装置はこれを送信する。
In FIG. 1,
本実施の形態では、入力データ100の内容として、映像データ101と文字データ102のみを提示したが、音声データなど他の種類のデータを含んでもよく、これを限定しない。また映像データ101は、静止画でなく、複数の映像が集合した動画データでもよい。また、映像符号化データ106には、例えばMPEG−2(ISO/IEC13818−2)などの標準化規格があるが、これを限定しない。また、図1の構成に限定せず、例えば、多重化部13と映像符号化部15とを一体に構成してもよく、これを限定しない。
In the present embodiment, only the
次に、図1を用いて本実施の形態の映像符号化装置への入力データ100がHTML文書である場合について、その動作を説明するが、入力をHTML文書に限定するものではない。HTMLでは<>で囲まれた内容が、その制御内容を規定するタグである、タグ埋め込み型の言語である。例えば、<IMG SRC=”xxx.gif”>は、ファイル名:xxx.gifの映像データの表示を指令している。映像の表示位置は、絶対座標などで別途指定があるときは、その指定位置に、特に指定がない場合は、直前までの記述から決まるデフォルト位置になる。HTMLでは、特にタグが付与されていない文字列は、文字データとして表示される。また、<H1>目次</H1>のようにタグを付与して、表示サイズ、表示色、表示フォントなどを指定する。また、文字についても映像データと同様に、表示位置の制御が可能である。
Next, the operation of the case where the
入力部11では、以上のようなHTMLの文法に基づき入力データ100の内容を解析し、映像データ101および文字データ102を抽出し、それぞれ映像変換部14および文字/映像変換部12に送出される。また、図示しない表示位置や表示サイズなど抽出したタグ情報も、必要に応じて、映像変換部14および文字/映像変換部12に送出される。なお、本実施の形態では、映像データ101および文字データ102が多重化した入力データ100が入力された場合を説明するが、入力部11が解析を行わず、映像符号化装置に、映像データ101および文字データ102が別々に入力するように構成してもよく、これを限定しない。
The
図2(藤原洋監修「最新MPEG教科書」アスキー出版局、P.154より抜粋)は、映像変換部14が映像データ101をマクロブロックへ映像変換を行う例として、階層構成であるMPEG−2の映像データ構造を示す図である。図2において、ピクチャ層301はスライス層302から、スライス層302はマクロブロック303から構成されている。図2に示す様に、マクロブロック303は、輝度信号(Y)と、色差信号(Pb,Pr)とが重なりあって構成され、クロマフォーマット4:2:0時は輝度信号(Y)が8×8のブロック303Yを4個、色差信号(Pb,Pr)がそれぞれ8×8のブロック303b、8×8のブロック303rが各1個でずつで構成される。
FIG. 2 (extracted from Hiroshi Fujiwara “Latest MPEG Textbook” ASCII Publishing Bureau, P. 154) shows an example of MPEG-2 having a hierarchical structure as an example in which the
図3は、文字/映像変換部12が文字データ102を文字マクロブロック103に変換するビットマップの一例を入力文字が「A」の場合について示したものである。文字/映像変換部12からは、文字を構成する1ビットに対して1つのブロック303Yおよび、文字の表示色に合わせたブロック303b、ブロック303rが生成される。例えば、文字の字画をあらわす部分には黒色などのマクロブロックが、背景部分には白色などのマクロブロックを対応させて、文字マクロブロック103に変換される。
FIG. 3 shows an example of a bitmap in which the character /
次に多重化部13では、入力された映像データ101毎に、表示領域を決定し、映像マクロブロック105を蓄積する。また、入力された文字データ102毎に、必要に応じそのタグ情報を参照して、表示領域を決定し、文字マクロブロック103を蓄積する。
Next, the
多重化部13に蓄積された映像マクロブロック105および文字マクロブロック103の多重化の手順を、図4のフローチャートを用いて説明する。
A procedure for multiplexing the
ここで、多重化部13に入力されたM個の文字マクロブロック103を、それぞれC(i)とする(M≧i≧1)。また、多重化部13に入力された映像マクロブロック105は、それぞれの表示領域を参照し、予め重ね合わせられて1枚の映像マクロブロック105になっているとする。まずステップS101で、iに1が代入される。次にステップS102で、C(i)が映像マクロブロック105と重なるかを判定し、重なる場合はステップS103に、そうでない場合はステップS105に進む。ステップS103で、C(i)と映像マクロブロック105は、それぞれの表示領域を参照して重ねられ、映像マクロブロック105をこの重ねたデータに更新する。ステップS104で、M≧k≧i+1のC(k)を1つずつシフトして、文字マクロブロック103からC(i)が除去され、文字マクロブロック103の総数をM−1に減じる。ここで、i=Mの場合は条件を満たすkは存在せず、MをM−1に減じる処理だけが行われる。ステップ105で、i=Mかを判定し、i=Mの場合は処理を完了し、そうでない場合はステップS106に進む。ステップS106で、iを1インクリメントしてステップS102に戻る。
Here, each of the
映像データ同士を重ね合わせて多重化する方法は、複数の方法が考えられる。例えばえ映像Aと映像Bとの間に順序が定義されており映像Aの方が順位が先なら、両者が重なる部分では映像Aを用いるというように、順位が上位の映像を上書きして多重化する方法が考えられるが、これを限定しない。 A plurality of methods can be considered as a method of superimposing and multiplexing video data. For example, if the order is defined between video A and video B, and video A has a higher order, video A is used in the overlapping portion, so that the higher-order video is overwritten and multiplexed. However, this is not a limitation.
一方、映像データ101に対応する映像マクロブロック105と文字マクロブロック103を重ねる方法も、複数考えられる。例えば、文字の字画をあらわす部分のみ、文字マクロブロック103に置換してもよく、背景を含めて文字マクロブロック103に置換してもよく、これを限定しない。
On the other hand, a plurality of methods for superimposing the video
図4のフローチャートの処理の結果、多重化部13では、互いに重なり合う部分を持たない、1つの映像マクロブロック105が生成され、映像符号化部15で符号化されて、映像符号化装置10から送信される。
As a result of the processing of the flowchart of FIG. 4, the multiplexing
本実施の形態では文字を表す1ビットを1マクロブロックに対応させたが、任意個のビットパタンに任意個のマクロブロックを対応させてもよく、これを限定しない。 In the present embodiment, one bit representing a character is associated with one macroblock, but any number of macroblocks may be associated with any number of bit patterns, and this is not limiting.
また、文字マクロブロック103は映像符号化装置10内で動作するソフトウェア(図示せず)に記述しても良いし、映像符号化装置10の回路を構成するプログラム中に記述してもよい。
The character macroblock 103 may be described in software (not shown) that operates in the
以上のように、本実施の形態によれば、映像符号化装置10において映像マクロブロック105と文字マクロブロック103とを多重して符号化、出力するために、多重化を行わない場合と比べ、伝送する映像データの量を抑えて、通信コストを低減できる。
As described above, according to the present embodiment, since the
また、本実施の形態によれば、映像符号化装置10において映像マクロブロック105と文字マクロブロック103とを多重して符号化、出力するために、映像復号装置31に、文字を表示するために特別な回路やメモリを備える必要がない。
Further, according to the present embodiment, in order to multiplex and encode and output the
また、1つの映像マクロブロック105に文字を表すビットマップの1つのビットを対応させているので、多重化処理の負荷が非常に軽く、動画などの変換も実時間で行える。
実施の形態2.
図5は、本発明の実施の形態2による映像符号化装置のブロック図である。図中、図1と同一符号は同一、または相当部分を示し説明を省略する。
In addition, since one bit of a bitmap representing characters is associated with one
Embodiment 2. FIG.
FIG. 5 is a block diagram of a video encoding apparatus according to Embodiment 2 of the present invention. In the figure, the same reference numerals as those in FIG.
図5において、入力データ100は、映像データ101と文字データ102と変換データ201を有している。ここで、変換データ201とは、1つの文字と、この文字の映像データとのセットで構成されたデータで、例えば文字コードとビットマップのセットである。本実施の形態では同じ入力ファイル100に含まれる文字データ102を映像データに変換し、例えば文字フォントデータなどが用いられる。入力部11で入力データ100は、映像データ101と文字データ102と変換データ201とにに配分される。このうち映像データ101は映像変換部14へ、文字データ102と変換データ201とは文字/映像変換部12に入力される。文字/映像変換部12は入力された変換データ201に基づき文字データ102を文字マクロブロック103へと変換して多重化部13へ出力する。以降の処理は、実施の形態1と同様である。
In FIG. 5,
ここで、すべての文字データ102を文字マクロブロック103に変換するためには、変換データ201は文字データ102に含まれる文字種に対応する文字と映像データとのセットを含んでいれば必要かつ十分である。(ここでの文字種とは、同じ文字でも表示したときのサイズや字体が異なる文字を区別したものである。)一般に、文字をイメージに変換するには、JISやISOなどの規格に基づいた文字フォントファイルが用いられるが、文字フォントファイルは規格に適合した文字すべてに対応しておるので、多数の文字とイメージのセットを含んでいる。そのため、変換データの容量が非常に大きくなり、文字データ102に対応するセットを検索する手間もかかる。しかし、通常扱う文書で必要とされる文字種はごくごく少数で、文字フォントファイルの大部分は、全くアクセスされないものである。
Here, in order to convert all the
以上のように、本実施の形態によれば、文字をイメージに変換するのに必要十分なだけのデータを外部から入力させるように構成したので、文字フォントファイルなどの大容量の専用メモリが不要である。 As described above, according to the present embodiment, since only the data necessary and sufficient for converting characters into an image is input from the outside, a large-capacity dedicated memory such as a character font file is unnecessary. It is.
また、本実施の形態によれば、多種のサイズや字体の文字を含む文字データをイメージに変換する場合でも、変換用のデータをコンパクトに構成できる。 Further, according to the present embodiment, even when character data including characters of various sizes and fonts is converted into an image, the conversion data can be made compact.
また、本実施の形態によれば、文字をイメージに変換するデータのエントリが少ないので、変換のコストが少なくできる。 Further, according to the present embodiment, since there are few data entries for converting characters into images, the conversion cost can be reduced.
10 映像符号化装置、11 入力部、12 文字/映像変換部、13 多重化部、14 映像変換部、15 映像符号化部、100 入力データ、101 映像データ、102 文字データ、103 文字マクロブロック、104 多重化マクロブロック、105 映像マクロブロック、106 映像符号化データ 10 video encoding device, 11 input unit, 12 character / video conversion unit, 13 multiplexing unit, 14 video conversion unit, 15 video encoding unit, 100 input data, 101 video data, 102 character data, 103 character macroblock, 104 multiplexed macroblocks, 105 video macroblocks, 106 video encoded data
Claims (5)
前記映像データを、1以上の画素を含む矩形領域に対応した第1のマクロブロックに変換する映像変換部と、
前記文字データに対応する第1のビットマップデータを記憶する記憶手段を有し、文字データ入力に対し、上記記憶手段が出力するビットマップデータの1ビットに1マクロブロックを対応させ、前記文字データを前記第1のビットマップデータのビットと相似に配置した、第2のマクロブロックに変換する文字/映像変換部と、
前記第1のマクロブロックと前記第2のマクロブロックとを合成した多重化マクロブロックを生成する多重化部と、
を備えたことを特徴とする映像符号化装置。 An input portion of input data having character data and video data;
A video conversion unit for converting the video data into a first macroblock corresponding to a rectangular area including one or more pixels;
Storage means for storing the first bitmap data corresponding to the character data, wherein one character block corresponding to one bit of the bitmap data output from the storage means is associated with the character data input, and the character data A character / video conversion unit for converting into a second macroblock, which is arranged in a similar manner to the bits of the first bitmap data,
A multiplexing unit that generates a multiplexed macroblock obtained by combining the first macroblock and the second macroblock;
A video encoding device comprising:
前記多重化部は、前記位置データを参照して、前記第1のマクロブロックと前記第2のマクロブロックとを重ね合わせることを特徴とする請求項1に記載の映像符号化装置。 The input data includes position data of the character data and / or the video data,
The video encoding apparatus according to claim 1, wherein the multiplexing unit superimposes the first macroblock and the second macroblock with reference to the position data.
前記記憶手段は、前記入力データから抽出された前記第2のビットマップデータを記憶することを特徴とする請求項1または2に記載の映像符号化装置。 The input data has second bitmap data corresponding to characters included in the character data;
The video encoding apparatus according to claim 1 or 2, wherein the storage unit stores the second bitmap data extracted from the input data.
前記映像データを、1以上の画素を含む矩形領域に対応した第1のマクロブロックに変換する映像変換ステップと、
前記文字データを映像に変換する第1のビットマップデータに基づき、前記文字データを対応する第2のマクロブロックに変換する文字/映像変換ステップと、
前記第1のマクロブロックと前記第2のマクロブロックとを重ね合わせた多重化マクロブロックを生成する多重化ステップと、
を有すことを特徴とする映像符号化方法。 An input step of input data including character data and video data;
A video conversion step of converting the video data into a first macroblock corresponding to a rectangular area including one or more pixels;
A character / video conversion step of converting the character data into a corresponding second macroblock based on the first bitmap data for converting the character data into a video;
A multiplexing step for generating a multiplexed macroblock obtained by superimposing the first macroblock and the second macroblock;
A video encoding method characterized by comprising:
前記第2のビットマップデータを前期入力データから読みとり、記憶する記憶ステップを有し、
前記文字/映像変換ステップでは、前記第1および第2のビットマップデータのみに基づいて前記文字データを変換することを特徴とする請求項4に記載の映像符号化方法。 The input data includes second bitmap data corresponding to characters included in the character data,
A storage step of reading and storing the second bitmap data from the previous input data;
5. The video encoding method according to claim 4, wherein in the character / video conversion step, the character data is converted based only on the first and second bitmap data.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2003418949A JP2005184168A (en) | 2003-12-17 | 2003-12-17 | Device and method for video coding |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2003418949A JP2005184168A (en) | 2003-12-17 | 2003-12-17 | Device and method for video coding |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2005184168A true JP2005184168A (en) | 2005-07-07 |
Family
ID=34780984
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2003418949A Pending JP2005184168A (en) | 2003-12-17 | 2003-12-17 | Device and method for video coding |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2005184168A (en) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2019210822A1 (en) * | 2018-05-02 | 2019-11-07 | 中兴通讯股份有限公司 | Video encoding and decoding method, device, and system, and storage medium |
WO2021095824A1 (en) | 2019-11-15 | 2021-05-20 | 富士フイルム和光純薬株式会社 | Method, kit, and biomarker for assisting in diagnosis of colon cancer |
-
2003
- 2003-12-17 JP JP2003418949A patent/JP2005184168A/en active Pending
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2019210822A1 (en) * | 2018-05-02 | 2019-11-07 | 中兴通讯股份有限公司 | Video encoding and decoding method, device, and system, and storage medium |
US11445201B2 (en) | 2018-05-02 | 2022-09-13 | Zte Corporation | Video encoding and decoding method, device, and system, and storage medium |
WO2021095824A1 (en) | 2019-11-15 | 2021-05-20 | 富士フイルム和光純薬株式会社 | Method, kit, and biomarker for assisting in diagnosis of colon cancer |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US6985630B2 (en) | Image processing apparatus and method, program and storage medium | |
KR100257614B1 (en) | Image signal padding method, image signal coding apparatus, image signal decoding apparatus | |
EP0469852A2 (en) | Image processing method and apparatus | |
JP2011071767A (en) | Image processing apparatus and processing method therefor | |
JP4156631B2 (en) | Image processing method and image processing apparatus | |
JP2006121645A (en) | Image compression apparatus and image compression program | |
US6404930B2 (en) | Signal processing equipment | |
JP2611012B2 (en) | Character separation encoding method | |
US9560311B2 (en) | Video signal encoding apparatus and video signal encoding method | |
JPH0766913A (en) | Image communication equipment | |
US7557951B2 (en) | Image processor and image printer | |
JP2005184168A (en) | Device and method for video coding | |
US7197078B2 (en) | Video coding/decoding buffering apparatus and buffering method thereof | |
JP6719200B2 (en) | Digital signal transmission device and digital signal transmission method | |
JP2009239852A (en) | Image processing apparatus and image processing method | |
JP2004120122A (en) | Image processing apparatus | |
JP3023215B2 (en) | Image processing device | |
JP4757172B2 (en) | Image coding apparatus and control method thereof | |
JP2010098743A (en) | Image processing device, image reading device, and image processing method | |
JP3950791B2 (en) | Image processing apparatus and image data processing method | |
EP0820186B1 (en) | Signal processor | |
JP3666079B2 (en) | Image processing device | |
Triantaphillidou et al. | Digital image file formats | |
CN115941981A (en) | JPEG image part modifying method and device | |
JP5523177B2 (en) | Image coding apparatus and control method thereof |