JP2001060875A - Embedding device, digital camera and recording medium - Google Patents

Embedding device, digital camera and recording medium

Info

Publication number
JP2001060875A
JP2001060875A JP23389799A JP23389799A JP2001060875A JP 2001060875 A JP2001060875 A JP 2001060875A JP 23389799 A JP23389799 A JP 23389799A JP 23389799 A JP23389799 A JP 23389799A JP 2001060875 A JP2001060875 A JP 2001060875A
Authority
JP
Japan
Prior art keywords
embedding
unit
coefficients
coefficient
audio data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP23389799A
Other languages
Japanese (ja)
Other versions
JP3398343B2 (en
Inventor
Hiromatsu Aoki
博松 青木
Masao Hiramoto
政夫 平本
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Panasonic Holdings Corp
Original Assignee
Matsushita Information Systems Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Matsushita Information Systems Co Ltd filed Critical Matsushita Information Systems Co Ltd
Priority to JP23389799A priority Critical patent/JP3398343B2/en
Publication of JP2001060875A publication Critical patent/JP2001060875A/en
Application granted granted Critical
Publication of JP3398343B2 publication Critical patent/JP3398343B2/en
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Landscapes

  • Television Signal Processing For Recording (AREA)
  • Editing Of Facsimile Originals (AREA)
  • Studio Devices (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

PROBLEM TO BE SOLVED: To provide an embedding device which causes reduced deterioration of picture quality and can embed voice data as much as possible. SOLUTION: An entropy decoding part 105 decodes with entropy a JPEG image and outputs a quantization DCT(discrete cosine transform) coefficient block. A selection part 106 selects 16 AC coefficients among the AC coefficients of low frequency which are included in the quantization DCT coefficient block and the AC coefficients having absolute value not smaller than its threshold, i.e., the AC coefficients having reduced influence of image deterioration. An embedding processing part 107 replaces the least significant bit of a prescribed number of AC coefficients with the partial compressed voice data of 16 bits which are inputted from a compressed voice input part 104.

Description

【発明の詳細な説明】DETAILED DESCRIPTION OF THE INVENTION

【0001】[0001]

【発明の属する技術分野】本発明は、画像に音声データ
を埋め込む埋め込み装置及び圧縮画像に圧縮音声データ
を埋め込む埋め込み装置を備えたデジタルカメラに関す
る。
BACKGROUND OF THE INVENTION 1. Field of the Invention The present invention relates to an embedding apparatus for embedding audio data in an image and a digital camera having an embedding apparatus for embedding compressed audio data in a compressed image.

【0002】[0002]

【従来の技術】従来より、デジタルカメラ等により撮影
された画像に音声データを付け加えたいという要望があ
った。この要望に応えるものとしてFlashPixという、画
像と音声データとを1つのファイルとして扱うファイル
形式がある。ただしこのFlashPixは、付け加える音声デ
ータのデータ量が多ければ多いほど全体のデータ量は多
くなるという問題がある。データ量が多ければ、保管や
伝送効率が悪くなる。
2. Description of the Related Art Heretofore, there has been a demand for adding audio data to an image taken by a digital camera or the like. To meet this demand, there is a file format called FlashPix which handles image and audio data as one file. However, this FlashPix has a problem that the larger the data amount of audio data to be added, the larger the total data amount. If the amount of data is large, the storage and transmission efficiency will deteriorate.

【0003】そこで全体のデータ量を増やさない手段と
して埋め込み装置の利用が考えられる。埋め込み装置
は、画像の一部分を別情報に置き換えることによって埋
め込みを行うので、別情報が埋め込まれた画像のデータ
量は、埋め込まれる前のデータ量と変わらない。
Therefore, use of an embedding device can be considered as a means for preventing the total data amount from increasing. Since the embedding device performs embedding by replacing a part of the image with another information, the data amount of the image in which the different information is embedded is not different from the data amount before the embedding.

【0004】[0004]

【発明が解決しようとする課題】しかし従来の埋め込み
装置は、別情報として、署名やマーク等のデータ量が少
ないものを埋め込み対象としており、音声データのよう
に多量のものを埋め込み対象とすることは考慮されてい
ない。上記の点に鑑み本発明は、画質の劣化が少なく、
できるだけ多くのデータを埋め込むことのできる埋め込
み装置の提供を目的とする。
However, the conventional embedding apparatus is intended to embed a small amount of data such as a signature or a mark as separate information, and to embed a large amount of data such as voice data. Is not taken into account. In view of the above points, the present invention has little degradation of image quality,
An object of the present invention is to provide an embedding device capable of embedding as much data as possible.

【0005】また本発明は、撮影された画像に数秒程度
の音声データを画像の劣化が少なく埋めこむことのでき
るデジタルカメラの提供を目的とする。
Another object of the present invention is to provide a digital camera capable of embedding audio data of about several seconds in a captured image with little deterioration of the image.

【0006】[0006]

【課題を解決するための手段】上記問題を解決するた
め、本発明の埋め込み装置は、画像に離散コサイン変換
(DCT:Discrete Cosine Transform)と量子化とを
施すことにより生成される量子化DCT係数ブロック
中、低周波のAC係数と絶対値が第1しきい値以上のA
C係数とから所定個のAC係数を選択する選択手段と、
前記選択手段により選択された所定個のAC係数の最下
位ビットを音声データに置き換える置換え手段とを備え
る。
In order to solve the above problems, an embedding apparatus according to the present invention provides a quantized DCT coefficient generated by performing discrete cosine transform (DCT) and quantization on an image. During the block, the AC coefficient and the absolute value of the low frequency are equal to or higher than the first threshold value.
Selecting means for selecting a predetermined number of AC coefficients from the C coefficients;
Replacement means for replacing the least significant bit of the predetermined number of AC coefficients selected by the selection means with audio data.

【0007】また前記選択手段は、絶対値が第1しきい
値以上のAC係数を選択する第1選択部と、第1選択手
段によって選択されたAC係数の個数が所定個に満たな
い場合には、第1しきい値未満であってより低周波のA
C係数から順に所定個になるまでAC係数を選択する第
2選択部とを備える。前記選択手段は、さらに、絶対値
が第1しきい値より大きい第2しきい値以上のAC係数
を選択する第3選択部を備え、前記置換え手段は、さら
に前記第3選択部により選択されたAC係数の最下位か
ら2ビット目に音声データを埋め込むよう構成される。
The selection means may include a first selection unit for selecting an AC coefficient having an absolute value equal to or greater than a first threshold value, and an AC coefficient selected by the first selection means when the number is less than a predetermined number. Is less than the first threshold and the lower frequency A
A second selection unit for selecting AC coefficients in order from the C coefficient until a predetermined number is reached. The selection unit further includes a third selection unit that selects an AC coefficient whose absolute value is equal to or greater than a second threshold value that is greater than the first threshold value, and the replacement unit is further selected by the third selection unit. The audio data is embedded in the second least significant bit of the AC coefficient.

【0008】本発明の埋め込み方法は、画像に離散コサ
イン変換(DCT)と量子化とを施すことにより生成さ
れる量子化DCT係数ブロック中、低周波のAC係数と
絶対値が第1しきい値以上のAC係数とから所定個のA
C係数を選択する選択ステップと、前記選択ステップに
より選択された所定個のAC係数の最下位ビットを音声
データに置き換える置換えステップとを備える。
According to the embedding method of the present invention, in a quantized DCT coefficient block generated by performing discrete cosine transform (DCT) and quantization on an image, a low-frequency AC coefficient and an absolute value are set to a first threshold value. From the above AC coefficient, a predetermined number of A
The method includes a selecting step of selecting a C coefficient, and a replacing step of replacing the least significant bit of the predetermined number of AC coefficients selected in the selecting step with audio data.

【0009】また前記選択ステップは、絶対値が第1し
きい値以上のAC係数を選択する第1選択ステップと、
第1選択手段によって選択されたAC係数の個数が所定
個に満たない場合には、第1しきい値未満であってより
低周波のAC係数から順に所定個になるまでAC係数を
選択する第2選択ステップとを備える。本発明のデジタ
ルカメラは、圧縮画像に数秒間の音声データに相当する
圧縮音声データを埋め込むデジタルカメラであって、圧
縮画像から離散コサイン変換と量子化とが施された量子
化DCT係数ブロックを得る獲得手段と、前記圧縮音声
データを分割して所定ビットの部分圧縮音声データにす
る分割手段と、獲得される量子化DCT係数ブロック
中、低周波のAC係数と絶対値が第1しきい値以上のA
C係数とから前記所定個のAC係数を選択する選択手段
と、前記選択手段により選択された前記所定個のAC係
数の最下位ビットを前記部分圧縮音声データに置き換え
る置換え手段とを備える。
[0009] The selecting step includes a first selecting step of selecting an AC coefficient having an absolute value equal to or greater than a first threshold.
If the number of AC coefficients selected by the first selecting means is less than a predetermined number, the AC coefficients are selected until the predetermined number of AC coefficients are less than the first threshold and sequentially from lower frequency AC coefficients. 2 selecting steps. The digital camera of the present invention is a digital camera that embeds compressed audio data corresponding to audio data for several seconds into a compressed image, and obtains a quantized DCT coefficient block subjected to discrete cosine transform and quantization from the compressed image. Acquiring means; dividing means for dividing the compressed audio data into partial compressed audio data of a predetermined bit; wherein, in the obtained quantized DCT coefficient block, the low-frequency AC coefficient and the absolute value are equal to or more than a first threshold value. A
A selecting means for selecting the predetermined number of AC coefficients from the C coefficients; and a replacing means for replacing least significant bits of the predetermined number of AC coefficients selected by the selecting means with the partially compressed audio data.

【0010】また本発明の記録媒体は、画像に音声デー
タを埋め込ませる処理をコンピュータに実行させるため
のプログラムを記録したコンピュータ読み取り可能な記
録媒体であって、当該プログラムはコンピュータに、画
像に離散コサイン変換(DCT)と量子化とを施すこと
により生成される量子化DCT係数ブロック中、低周波
のAC係数と絶対値が第1しきい値以上のAC係数とか
ら所定個のAC係数を選択する選択ステップと、前記選
択ステップにより選択された所定個のAC係数の最下位
ビットを音声データに置き換える置換えステップとを実
行させることを特徴とする。
A recording medium according to the present invention is a computer-readable recording medium in which a program for causing a computer to execute a process of embedding audio data in an image is recorded. In a quantized DCT coefficient block generated by performing transform (DCT) and quantization, a predetermined number of AC coefficients are selected from a low-frequency AC coefficient and an AC coefficient whose absolute value is equal to or greater than a first threshold. And a replacement step of replacing the least significant bit of the predetermined number of AC coefficients selected by the selection step with audio data.

【0011】また前記選択ステップは、絶対値が第1し
きい値以上のAC係数を選択する第1選択ステップと、
第1選択手段によって選択されたAC係数の個数が所定
個に満たない場合には、第1しきい値未満であってより
低周波のAC係数から順に所定個になるまでAC係数を
選択する第2選択ステップとからなる。
The selecting step includes a first selecting step of selecting an AC coefficient having an absolute value equal to or greater than a first threshold value;
If the number of AC coefficients selected by the first selecting means is less than a predetermined number, the AC coefficients are selected until the predetermined number of AC coefficients are less than the first threshold and sequentially from lower frequency AC coefficients. It consists of two selection steps.

【0012】[0012]

【発明の実施の形態】(実施形態1)以下、本発明の埋
め込み装置の一実施形態であるデジタルカメラ1につい
て図面を用いて説明する。本実施形態において埋め込み
装置はデジタルカメラ1内部に埋め込み部として備えら
れる。 (デジタルカメラ1の外観構成)図1及び図2は、デジ
タルカメラ1の正面側及び背面側の外観図である。
(Embodiment 1) Hereinafter, a digital camera 1 which is an embodiment of an embedding device of the present invention will be described with reference to the drawings. In the present embodiment, the embedding device is provided inside the digital camera 1 as an embedding unit. (External Configuration of Digital Camera 1) FIGS. 1 and 2 are external views of the digital camera 1 on the front side and the rear side.

【0013】同図に示すようにデジタルカメラ1は、正
面に音声データ再生用のスピーカ11、音声データ録音
用のマイク12、レンズ18を備え、背面に画像表示部
13、画像及び音声データ再生指示用の再生ボタン21
a、21b、音声データ録音指示用の録音ボタン22、
ファインダー17を備え、上面にシャッターボタン1
4、シャッター速度や絞り値などを表示する状態表示部
15を備え、側面にはフラッシュメモリの一種であるメ
モリカード20が挿入されるメモリカード挿入口19を
備える。
As shown in FIG. 1, the digital camera 1 includes a speaker 11 for reproducing audio data, a microphone 12 for recording audio data, and a lens 18 on the front, and an image display unit 13, an image and audio data reproducing instruction on the rear. Play button 21 for
a, 21b, recording button 22 for voice data recording instruction,
It has a viewfinder 17 and a shutter button 1 on the top.
4. A status display unit 15 for displaying a shutter speed, an aperture value and the like is provided, and a memory card insertion slot 19 for inserting a memory card 20 which is a kind of flash memory is provided on a side surface.

【0014】デジタルカメラ1の操作例を以下に簡単に
説明しておく。利用者がファインダー17又は画像表示
部13により撮像範囲を定めてシャッターボタン14を
押下すると、レンズ18を通して撮影された画像が内部
で符号化されて圧縮画像となり、メモリカード20に記
憶される。このメモリカード20は、圧縮画像を数十枚
記憶することができる。
An operation example of the digital camera 1 will be briefly described below. When the user sets the imaging range using the viewfinder 17 or the image display unit 13 and presses the shutter button 14, the image captured through the lens 18 is internally encoded into a compressed image, and stored in the memory card 20. This memory card 20 can store several tens of compressed images.

【0015】また利用者が録音ボタン22を押下する
と、その時点からマイク12より所定時間(本実施形態
においては約10秒間)の音声データが集音され符号化
されて圧縮音声データとなる。圧縮音声データは、メモ
リカード20に記憶されている圧縮画像のうち利用者に
選択された圧縮画像に埋め込まれる。以下、圧縮音声デ
ータが埋め込まれた圧縮画像を音声付き圧縮画像、埋め
込まれていない圧縮画像を音声なし圧縮画像と区別して
呼び、音声データ付きか音声データなしかを特に区別し
ない場合には単に圧縮画像と呼ぶこととする。
When the user presses the record button 22, sound data for a predetermined time (about 10 seconds in the present embodiment) is collected from the microphone 12 from that point and is encoded to be compressed sound data. The compressed audio data is embedded in the compressed image selected by the user among the compressed images stored in the memory card 20. Hereinafter, a compressed image in which compressed audio data is embedded will be referred to as a compressed image with audio, and a non-embedded compressed image will be referred to as a compressed image without audio. It is called an image.

【0016】また利用者が再生ボタン21a、21bを押
下する度に、メモリカード20に記憶されている圧縮画
像が一枚ずつ復号されて、その画像が画像表示部13に
表示される。音声付き圧縮画像が復号された場合には、
その 復号された画像の表示と同時に圧縮音声データが
抽出、復号されてスピーカ11より再生される。 (デジタルカメラ1の概略構成)図3は、デジタルカメ
ラ1の概略構成図である。
Each time the user presses the play buttons 21a and 21b, the compressed images stored in the memory card 20 are decoded one by one, and the images are displayed on the image display unit 13. If the compressed image with audio is decoded,
Simultaneously with the display of the decoded image, the compressed audio data is extracted, decoded, and reproduced from the speaker 11. (Schematic Configuration of Digital Camera 1) FIG. 3 is a schematic configuration diagram of the digital camera 1.

【0017】同図に示すようにデジタルカメラ1は、画
像符号化部3、符号用メモリ35、メモリカード入出力
部36、音声符号化部4、埋め込み部37、音声復号化
部5、画像復号化部6、抽出部83から構成される。画
像符号化部3は、シャッターボタン14が押下されたと
き、レンズ18を介して撮像される画像をJPEG方式
により符号化して音声なし圧縮画像を生成し、符号用メ
モリ35に出力する。
As shown in FIG. 1, the digital camera 1 includes an image encoding unit 3, an encoding memory 35, a memory card input / output unit 36, an audio encoding unit 4, an embedding unit 37, an audio decoding unit 5, and an image decoding unit. And an extraction unit 83. When the shutter button 14 is pressed, the image encoding unit 3 encodes an image captured through the lens 18 by the JPEG method to generate a compressed image without sound, and outputs the compressed image to the encoding memory 35.

【0018】符号用メモリ35は、画像符号化部3、メ
モリカード入出力部36、埋め込み部37、画像復号化
部6の間で入出力される圧縮画像を一時的に記憶する。
メモリカード入出力部36は、符号用メモリ35に記憶
されている圧縮画像をメモリカード20へ書きこみ、ま
たメモリカード20に記憶される圧縮画像を符号用メモ
リ35に読み出す。
The encoding memory 35 temporarily stores compressed images input and output among the image encoding unit 3, the memory card input / output unit 36, the embedding unit 37, and the image decoding unit 6.
The memory card input / output unit 36 writes the compressed image stored in the encoding memory 35 to the memory card 20 and reads the compressed image stored in the memory card 20 to the encoding memory 35.

【0019】音声符号化部4は、録音ボタン22が押下
されたとき、マイク12を介して約10秒間の外部の音
声データを集音し、IMA(Interactive Multimedia As
sociation)方式のADPCM(Adaptive Differential P
CM)により符号化し、その結果の圧縮音声データを音声
符号化部4内部のメモリ(後述のオーディオメモリ4
4)に記憶する。
When the recording button 22 is depressed, the audio encoding section 4 collects external audio data for about 10 seconds through the microphone 12, and outputs an IMA (Interactive Multimedia As
ADPCM (Adaptive Differential P)
CM), and the resulting compressed audio data is stored in a memory (audio memory
4).

【0020】埋め込み部37は、符号用メモリ35に記
憶される音声なし圧縮画像に前記圧縮音声データを埋め
込んで音声付き圧縮画像を生成し、符号用メモリ35に
戻す。埋め込み部37は、本発明の主要な構成要素であ
るので後に詳細に説明する。画像復号化部6は、画像符
号化部3による符号化とは逆の操作により符号用メモリ
35に記憶される圧縮画像から画像を復号し、画像表示
部13に表示する。
The embedding section 37 embeds the compressed audio data in the compressed image without audio stored in the encoding memory 35 to generate a compressed image with audio, and returns the compressed image with audio to the encoding memory 35. The embedding section 37 is a main component of the present invention, and will be described later in detail. The image decoding unit 6 decodes the image from the compressed image stored in the encoding memory 35 by an operation reverse to the encoding performed by the image encoding unit 3, and displays the image on the image display unit 13.

【0021】抽出部83は、埋め込み部37による音声
データの埋め込みと逆の操作によって、音声付き圧縮画
像から圧縮音声データを抽出して音声復号化部5に出力
する。音声復号化部5は、音声符号化部4による符号化
とは逆の操作により、抽出部83より出力された圧縮音
声データから音声データを復号し、スピーカー11より
再生する。 (画像符号化部3、音声符号化部4、音声復号化部5、
画像復号化部6の詳細構成)図4は、図3の詳細構成図
であり、図5、図6は、図4を部分的に示す詳細構成図
である。同図を用いて以下に画像符号化部3、音声符号
化部4、音声復号化部5、画像復号化部6について説明
する。 (画像符号化部3の詳細構成)図4において画像符号化
部3は、撮像部31、撮影画像メモリ33、符号化部3
4より構成される。 (撮像部31)撮像部31は、レンズ18、CCD(図
外)、色変換器(図外)などから構成され、シャッター
ボタン14が押されたときに、レンズ18、CCDを介
して得られるRGB信号を色変換器によりYCrCb成
分から成る画像に変換して撮影画像メモリ33に書き込
む。
The extraction unit 83 extracts compressed audio data from the compressed image with audio and outputs the extracted compressed audio data to the audio decoding unit 5 by performing an operation reverse to the embedding of the audio data by the embedding unit 37. The audio decoding unit 5 decodes the audio data from the compressed audio data output from the extraction unit 83 and reproduces the audio data from the speaker 11 by an operation reverse to the encoding performed by the audio encoding unit 4. (The image encoding unit 3, the audio encoding unit 4, the audio decoding unit 5,
FIG. 4 is a detailed configuration diagram of FIG. 3, and FIGS. 5 and 6 are detailed configuration diagrams partially showing FIG. The image encoding unit 3, the audio encoding unit 4, the audio decoding unit 5, and the image decoding unit 6 will be described below with reference to FIG. (Detailed Configuration of Image Encoding Unit 3) In FIG. 4, the image encoding unit 3 includes an imaging unit 31, a captured image memory 33, and an encoding unit 3.
4 (Imaging Unit 31) The imaging unit 31 includes a lens 18, a CCD (not shown), a color converter (not shown), and the like, and is obtained via the lens 18 and the CCD when the shutter button 14 is pressed. The RGB signal is converted into an image composed of YCrCb components by a color converter, and written into the captured image memory 33.

【0022】1つの画像は、1280画素×960ライ
ン、合計1228800画素からなる輝度成分Yと、6
40画素×480ライン(又は水平方向のみを間引いた
640画素×960ライン)、合計307200画素
(又は614400画素)からなる色差成分Cr、Cb
とから構成される。 (撮影画像メモリ33)撮影画像メモリ33は、撮像部
31により書き込まれる画像を一時的に記憶する。 (符号化部34)符号化部34は、撮影画像メモリ33
に記憶されている画像を8画素×8ラインのブロック毎
にJPEG方式により圧縮符号化して、それによって得
られる圧縮符号列を符号用メモリ35に書きこむ。1画
面分の圧縮符号列が音声なし圧縮画像に相当する。
One image has a luminance component Y consisting of 1280 pixels × 960 lines, a total of 1,228,800 pixels, and 6
Color difference components Cr and Cb composed of 40 pixels × 480 lines (or 640 pixels × 960 lines thinned only in the horizontal direction), for a total of 307200 pixels (or 614400 pixels)
It is composed of (Captured Image Memory 33) The captured image memory 33 temporarily stores an image written by the imaging unit 31. (Encoding unit 34) The encoding unit 34 includes the captured image memory 33
Is compressed and encoded by the JPEG method for each block of 8 pixels × 8 lines, and the resulting compressed code string is written in the coding memory 35. A compressed code string for one screen corresponds to a compressed image without sound.

【0023】図7は、1画面分の輝度成分Yとブロック
との関係を示す。輝度成分Yは、横160ブロック、縦
120ブロック、合計19200個のブロックから構成
され、各ブロックは、8画素×8ライン、合計64個の
画素から構成される。例えば同図においてブロック10
2は、1画面分の輝度成分Yに含まれる1つのブロック
である。1画面分の色差成分Cr、Cbも同様に、それ
ぞれ横80ブロック、縦60ブロック、合計4800個
(640画素×960ラインのものについては横80ブ
ロック、縦120ブロック、合計9600個)のブロッ
クから構成される。
FIG. 7 shows the relationship between the luminance component Y for one screen and blocks. The luminance component Y is composed of 160 blocks in the horizontal direction and 120 blocks in the vertical direction, for a total of 19,200 blocks. Each block is composed of 8 pixels × 8 lines, that is, a total of 64 pixels. For example, in FIG.
Reference numeral 2 denotes one block included in the luminance component Y for one screen. Similarly, the color difference components Cr and Cb for one screen are also divided from 80 horizontal blocks and 60 vertical blocks, respectively, for a total of 4800 blocks (80 horizontal blocks, 120 vertical blocks, and a total of 9600 blocks for 640 pixels × 960 lines). Be composed.

【0024】図8(a)は、輝度成分Yの1ブロック分
の画素の具体例Yxy(x,y=0〜7;x,yはブロック中の
画素位置を表わす)を示す。なお、同図のYxyは、元の
信号値から128を引いたものである。これは後の離散
コサイン変換(Discrete Cosine Transform、以下DC
Tと省略する)によって得られるDCT係数の期待値を
0にレベルシフトするためである。 (符号化部34の詳細構成)符号化部34は、図5の構
成図に示すように、DCT部71、量子化部72、エン
トロピー符号化部74から構成される。 (DCT部71)DCT部71は、撮影画像メモリ33
から輝度成分Y、色差成分Cr、Cbをブロック毎に順
次読み出してDCTを行い、8×8要素のDCT係数か
ら成るDCT係数ブロックSuv(u,v=0〜7)を生成
し、量子化部72へ出力する。ここでSuvは、直流成分
を表わすS00をDC係数と呼び、S00以外の交流成分を
表わすDCT係数をAC係数と呼ぶ。またSuvは、u、v
の値が大きくなるほど高周波成分となる。
FIG. 8A shows a specific example Yxy (x, y = 0 to 7; x, y represents a pixel position in a block) of a pixel of one block of the luminance component Y. Note that Yxy in the figure is obtained by subtracting 128 from the original signal value. This is a discrete cosine transform (DC).
This is for level-shifting the expected value of the DCT coefficient obtained by T) to 0. (Detailed Configuration of Encoding Unit 34) The encoding unit 34 includes a DCT unit 71, a quantization unit 72, and an entropy encoding unit 74, as shown in the configuration diagram of FIG. (DCT unit 71) The DCT unit 71
, The luminance component Y and the chrominance components Cr and Cb are sequentially read out for each block and DCT is performed to generate a DCT coefficient block Suv (u, v = 0 to 7) composed of DCT coefficients of 8 × 8 elements, and a quantization unit 72. Here, Suv refers to S00 representing a DC component as a DC coefficient, and DCT coefficients representing AC components other than S00 as an AC coefficient. Suv is u, v
The higher the value, the higher the frequency component.

【0025】図8(b)は、Yxyに対してDCTを行う
ことにより得られるDCT係数ブロックSuvを示す。同
図においてS00=823がDC係数であり、その他はA
C係数である。u、vが大きくなるほど、つまり高周波成
分になるほど値が小さくなっていることがわかる。なお
DCTの具体的な演算式は公知であるので説明を省略す
る。 (量子化部72)量子化部72は、8×8要素の量子化
係数から成る量子化テーブルQuv(u,v=0〜7)を備
え、これを用いてDCT係数ブロックSuvを量子化し、
8×8要素の量子化DCT係数から成る量子化DCT係
数ブロックRuv(u,v=0〜7)を生成し、エントロピ
ー符号化部74へ出力する。
FIG. 8B shows a DCT coefficient block Suv obtained by performing DCT on Yxy. In the figure, S00 = 823 is the DC coefficient, and the others are A
C coefficient. It can be seen that the value decreases as u and v increase, that is, as the frequency component increases. Note that the specific arithmetic expression of DCT is well-known, and thus description thereof is omitted. (Quantization Unit 72) The quantization unit 72 includes a quantization table Quv (u, v = 0 to 7) including quantization coefficients of 8 × 8 elements, and quantizes the DCT coefficient block Suv using this.
A quantized DCT coefficient block Ruv (u, v = 0 to 7) composed of 8 × 8 element quantized DCT coefficients is generated and output to the entropy coding unit 74.

【0026】量子化DCT係数ブロックRuvは以下のよ
うにして算出される。 (式1) Ruv=round(Suv/Quv) ここで、round()は、()内の値をもっとも近い整数
へ整数化することを意味する関数である。
The quantized DCT coefficient block Ruv is calculated as follows. (Equation 1) Ruv = round (Suv / Quv) Here, round () is a function meaning that the value in () is converted into an integer to the nearest integer.

【0027】JPEG方式においては量子化係数の値は
規定されていない。よってアプリケーション毎や画像毎
に自由に値を設定することができる。一般的に、量子化
係数は、u、vの値が大きくなるほど大きな値が設定され
る。このように高周波成分ほど量子化係数の値を大きく
するのは、視覚的に劣化の目立ちにくい高周波成分を粗
く量子化すれば、画質を保護しつつ圧縮効率を良くする
ことができるからである。
In the JPEG system, the value of the quantization coefficient is not specified. Therefore, a value can be freely set for each application or each image. In general, the quantization coefficient is set to a larger value as the values of u and v become larger. The reason why the value of the quantization coefficient is increased as the frequency component increases is that if the high-frequency component that is hardly noticeable in deterioration is roughly quantized, the compression efficiency can be improved while protecting the image quality.

【0028】図8(c)に量子化テーブルQuvの具体例
を示す。図8(d)は、図8(b)に示したDCT係数
ブロックSuvを図8(c)の量子化テーブルQuvで量子
化した場合の量子化DCT係数ブロックRuvを示す。こ
の例によればR10=round(S10/Q10)=round(−1
35/4)=−34である。 (エントロピー符号化部74)エントロピー符号化部7
4は、量子化部71から受け取った量子化DCT係数ブ
ロックRuvをエントロピー符号化して圧縮符号列を生成
し、符号用メモリ35へ書き込む。1画面分の圧縮符号
列が圧縮画像に相当する。エントロピー復号については
公知であるので説明を省略する。 (音声符号化部4の詳細構成)音声符号化部4は、集音
部41、オーディオ符号化部43、オーディオメモリ4
4から構成される。 (集音部41)集音部41は、マイク12、増幅器(図
外)、AD変換回路(図外)、量子化回路(図外)など
から構成され、利用者により録音ボタン22が押下され
たときから約10秒間分の外部のアナログ音声データを
集音し、11kHzのサンプリング、AD変換等を施し
てデジタル音声データに変換し、オーディオ符号化部4
3へ出力する。 (オーディオ符号化部43)オーディオ符号化部43
は、IMA方式のADPCMに基づいて前記デジタル音
声データを圧縮音声データに変換してオーディオメモリ
44へ出力する。なお、IMA方式のADPCMについ
ては公知であるので説明を省略する。 (オーディオメモリ44)オーディオメモリ44は、オ
ーディオ符号化部43により出力される圧縮音声データ
を記憶する。 (音声復号化部5の詳細構成)音声復号化部5は、オー
ディオメモリ54、オーディオ復号化部53、音声再生
部51から構成される。 (オーディオメモリ54)オーディオメモリ54は、抽
出部83により圧縮画像から抽出された圧縮音声データ
を一時的に記憶する。 (オーディオ復号化部53)オーディオ復号化部53
は、IMA方式のADPCMに基づいて、オーディオメ
モリ54に記憶されている圧縮音声データからデジタル
音声データを復号し、音声再生部51へ出力する。 (音声再生部51)音声再生部51は、DA変換回路
(図外)、スピーカ11などから構成され、オーディオ
復号化部53により復号されたデジタル音声データをア
ナログ音声データに変換して再生する。 (画像復号化部6の詳細構成)画像復号化部6は、復号
化部62、表示用画像メモリ61、画像表示部13から
構成される。 (復号化部62)復号化部62は、符号用メモリ35に
記憶される音声なし圧縮画像又は音声付き圧縮画像を読
み出してJPEG方式による復号化を行い、結果の画像を表
示用画像メモリ61に出力する。
FIG. 8C shows a specific example of the quantization table Quv. FIG. 8D shows a quantized DCT coefficient block Ruv when the DCT coefficient block Suv shown in FIG. 8B is quantized by the quantization table Quv in FIG. 8C. According to this example, R10 = round (S10 / Q10) = round (-1)
35/4) = − 34. (Entropy coding unit 74) Entropy coding unit 7
4 entropy-encodes the quantized DCT coefficient block Ruv received from the quantization unit 71 to generate a compressed code string, and writes it to the code memory 35. A compressed code string for one screen corresponds to a compressed image. Since the entropy decoding is known, its description is omitted. (Detailed Configuration of Speech Encoding Unit 4) The speech encoding unit 4 includes a sound collection unit 41, an audio encoding unit 43, and an audio memory 4.
4 (Sound Collection Unit 41) The sound collection unit 41 includes the microphone 12, an amplifier (not shown), an AD conversion circuit (not shown), a quantization circuit (not shown), and the like, and the recording button 22 is pressed by the user. The external analog audio data for about 10 seconds from the time when the analog audio data is collected is converted into digital audio data by performing 11 kHz sampling, AD conversion, and the like.
Output to 3. (Audio encoding unit 43) Audio encoding unit 43
Converts the digital audio data into compressed audio data based on IMA ADPCM and outputs the compressed audio data to the audio memory 44. Since the IMA type ADPCM is publicly known, the description is omitted. (Audio Memory 44) The audio memory 44 stores the compressed audio data output by the audio encoding unit 43. (Detailed Configuration of Audio Decoding Unit 5) The audio decoding unit 5 includes an audio memory 54, an audio decoding unit 53, and an audio reproducing unit 51. (Audio Memory 54) The audio memory 54 temporarily stores the compressed audio data extracted from the compressed image by the extraction unit 83. (Audio Decoding Unit 53) Audio Decoding Unit 53
Decodes the digital audio data from the compressed audio data stored in the audio memory 54 based on the IMA type ADPCM, and outputs the digital audio data to the audio reproduction unit 51. (Audio Reproducing Unit 51) The audio reproducing unit 51 is composed of a DA conversion circuit (not shown), the speaker 11, and the like, and converts digital audio data decoded by the audio decoding unit 53 into analog audio data and reproduces the same. (Detailed Configuration of Image Decoding Unit 6) The image decoding unit 6 includes a decoding unit 62, a display image memory 61, and an image display unit 13. (Decoding Unit 62) The decoding unit 62 reads out the compressed image without sound or the compressed image with sound stored in the encoding memory 35, decodes the compressed image with the JPEG method, and stores the resulting image in the display image memory 61. Output.

【0029】図6は、復号化部62のより詳細な構成図
である。同図において復号化部62は、エントロピー復
号化部84、逆量子化部82、逆DCT部81から構成
される。 (エントロピー復号化部84)エントロピー復号化部8
4は、符号用メモリ35に記憶されている圧縮画像をエ
ントロピー復号することにより量子化DCT係数ブロッ
クRuv(又はR’uv)を生成して抽出部83と逆量子化
部82とに出力する。ここにおいて、圧縮音声データを
含まない量子化DCT係数ブロックをRuv、圧縮音声デ
ータを含む量子化DCT係数ブロックをR’uvとして区
別する。 (逆量子化部82)逆量子化部82は、量子化部71と
同一の量子化テーブルQuvを備え、Quvと量子化DCT
係数ブロックRuv(又はR’uv)とから(式2)に示す
逆量子化によりDCT係数ブロックS’uvを生成して逆
DCT部81へ出力する。ここにおいて、量子化DCT
係数ブロックRuv又はR’uvより生成されたDCT係数
ブロックをS’uvとし、量子化前のDCT係数ブロック
をSuvとして区別する。 (式2) S'uv=Ruv(又はR’uv)×Quv (逆DCT部81)逆DCT部81は、逆DCTを施す
ことによりDCT係数ブロックS’uvから輝度成分Y、
色差成分Cr、Cbをブロック単位で復号して表示用画
像メモリ61へ書き込む。逆DCTについては公知であ
るので説明を省略する。 (表示用画像メモリ61)表示用画像メモリ61は、復
号化部62により復号された輝度成分Y、色差成分C
r、Cbからなる画像を一時的に記憶する。 (画像表示部13)画像表示部13は、液晶ディスプレ
イなどから構成され、表示用画像メモリ61に記憶され
ている画像を表示する。 (埋め込み部37の詳細構成)埋め込み部37は、符号
用メモリ35に記憶される音声なし圧縮画像を読み出し
てエントロピー復号し、量子化DCT係数ブロックRuv
に戻す。次に埋め込み部37は、輝度成分Yの量子化D
CT係数ブロックRuv毎に、64個のうちDC係数(R
00)を除く63個の量子化DCT係数(AC係数)の中
から所定数Nの量子化DCT係数を埋め込み用として選
択する。本実施形態ではこの所定数Nを16個としてい
る。さらに埋め込み部37は、圧縮音声データをNビッ
ト(すなわち16ビット)ずつの部分圧縮音声データに
分割する。最後に埋め込み部37は、各ブロックに各部
分圧縮音声データを対応させて、埋め込み用の16個の
量子化DCT係数の最下位ビットに部分圧縮音声データ
を1ビットずつ埋め込む。ここで量子化DCT係数の最
下位ビットに部分圧縮音声データを1ビット埋め込むと
は、すなわち量子化DCT係数の最下位ビットの値を部
分圧縮音声データの1ビットに置き換えることを意味す
る。
FIG. 6 is a more detailed block diagram of the decoding section 62. In the figure, the decoding unit 62 includes an entropy decoding unit 84, an inverse quantization unit 82, and an inverse DCT unit 81. (Entropy decoding unit 84) Entropy decoding unit 8
4 generates a quantized DCT coefficient block Ruv (or R'uv) by entropy decoding the compressed image stored in the encoding memory 35, and outputs it to the extraction unit 83 and the inverse quantization unit 82. Here, the quantized DCT coefficient block that does not include the compressed audio data is identified as Ruv, and the quantized DCT coefficient block that includes the compressed audio data is identified as R'uv. (Inverse Quantization Unit 82) The inverse quantization unit 82 includes the same quantization table Quv as the quantization unit 71,
A DCT coefficient block S′uv is generated from the coefficient block Ruv (or R′uv) by inverse quantization shown in (Equation 2) and output to the inverse DCT unit 81. Here, the quantized DCT
The DCT coefficient block generated from the coefficient block Ruv or R'uv is identified as S'uv, and the DCT coefficient block before quantization is identified as Suv. (Equation 2) S′uv = Ruv (or R′uv) × Quv (Inverse DCT section 81) The inverse DCT section 81 performs inverse DCT to obtain a luminance component Y,
The color difference components Cr and Cb are decoded in block units and written into the display image memory 61. Since the inverse DCT is known, its description is omitted. (Display Image Memory 61) The display image memory 61 stores the luminance component Y and the chrominance component C decoded by the decoding unit 62.
The image composed of r and Cb is temporarily stored. (Image Display Unit 13) The image display unit 13 is configured by a liquid crystal display or the like, and displays an image stored in the display image memory 61. (Detailed Configuration of the Embedding Unit 37) The embedding unit 37 reads out the compressed image without sound stored in the encoding memory 35, performs entropy decoding, and performs quantization DCT coefficient block Ruv.
Return to Next, the embedding unit 37 performs quantization D of the luminance component Y.
For each CT coefficient block Ruv, the DC coefficient (R
(00), a predetermined number N of the quantized DCT coefficients (AC coefficients) other than the 63 quantized DCT coefficients are selected for embedding. In the present embodiment, the predetermined number N is set to 16. Further, the embedding unit 37 divides the compressed audio data into partial compressed audio data of N bits (ie, 16 bits). Finally, the embedding unit 37 embeds the partial compressed audio data one bit at a time in the least significant bit of the 16 quantized DCT coefficients for embedding so that each block corresponds to each partial compressed audio data. Here, embedding one bit of partially compressed audio data in the least significant bit of the quantized DCT coefficient means that the value of the least significant bit of the quantized DCT coefficient is replaced with one bit of partially compressed audio data.

【0030】最後に埋め込み部37は、埋め込みの済ん
だ量子化DCT係数ブロックR’uvを再びエントロピー
符号化して符号用メモリ35に戻す。図9は、埋め込み
部37の詳細な構成図である。同図において埋め込み部
37は、圧縮画像入力部101、判定値入力部102、
埋め込み量入力部103、圧縮音声入力部104、エン
トロピー復号化部105、選択部106、埋め込み処理
部107、出力部108から構成される。
Finally, the embedding unit 37 entropy-encodes the embedded quantized DCT coefficient block R'uv again and returns it to the encoding memory 35. FIG. 9 is a detailed configuration diagram of the embedding unit 37. In the figure, an embedding unit 37 includes a compressed image input unit 101, a determination value input unit 102,
It comprises an embedding amount input unit 103, a compressed speech input unit 104, an entropy decoding unit 105, a selection unit 106, an embedding processing unit 107, and an output unit 108.

【0031】圧縮画像入力部101は、符号用メモリに
記憶される圧縮符号列を読み出してエントロピー復号化
部105に出力する。判定値入力部102は、判定値J
を予め記憶する。判定値Jは、選択部106が量子化D
CT係数ブロックRuvの中から埋め込み用の量子化DC
T係数を決定する際のしきい値となる。本実施形態にお
いて判定値Jは2とする。この判定値2以上の量子化D
CT係数が埋め込み用の候補となる。
The compressed image input section 101 reads out a compressed code string stored in the coding memory and outputs it to the entropy decoding section 105. The judgment value input unit 102 sets the judgment value J
Is stored in advance. The determination value J is determined by the quantization
Quantization DC for embedding from CT coefficient block Ruv
This is a threshold for determining the T coefficient. In the present embodiment, the judgment value J is 2. Quantization D of this judgment value 2 or more
CT coefficients are candidates for embedding.

【0032】埋め込み量入力部103は、埋め込み量N
を予め記憶する。埋め込み量Nは、約10秒分に相当す
る圧縮音声データのデータ量38400バイトを、輝度
成分の総ブロック数で割って、ビットに換算した値であ
り、本実施形態においてNは38400バイト÷192
00ブロック=16ビットである。圧縮音声入力部10
4は、オーディオメモリ44に記憶される圧縮音声デー
タを、埋め込み量入力部103に記憶される埋め込み量
Nに分割して、埋め込み処理部107に出力する。
The embedding amount input unit 103 has an embedding amount N
Is stored in advance. The embedding amount N is a value obtained by dividing the data amount of 38400 bytes of the compressed audio data corresponding to about 10 seconds by the total number of blocks of the luminance component and converting it into bits. In the present embodiment, N is 38400 bytes / 192.
00 block = 16 bits. Compressed voice input unit 10
Reference numeral 4 divides the compressed audio data stored in the audio memory 44 into the embedding amount N stored in the embedding amount input unit 103 and outputs the divided data to the embedding processing unit 107.

【0033】エントロピー復号化部105は、圧縮画像
入力部101より出力される圧縮符号列をエントロピー
復号し、輝度成分の量子化DCT係数ブロックRuvを選
択部106に出力する。 (選択部106)選択部106は、エントロピー復号化
部105より出力される量子化DCT係数ブロックRuv
毎に、DC係数(R00)を除く63個の量子化DCT係
数(AC係数)の中から合計N個(16個)の量子化D
CT係数を埋め込み用として選択し、選択結果を埋め込
み処理部107に出力する。
The entropy decoding unit 105 entropy decodes the compressed code string output from the compressed image input unit 101 and outputs a quantized DCT coefficient block Ruv of the luminance component to the selection unit 106. (Selection Unit 106) The selection unit 106 is a quantized DCT coefficient block Ruv output from the entropy decoding unit 105.
Each time, a total of N (16) quantized Ds out of 63 quantized DCT coefficients (AC coefficients) excluding the DC coefficient (R00)
The CT coefficient is selected for embedding, and the selection result is output to the embedding processing unit 107.

【0034】選択部106は、量子化DCT係数ブロッ
クRuvに対応する8×8個の埋め込みフラグEuv(u,v
=0〜7)を有し、選択された量子化DCT係数に対応
する埋め込みフラグEuvをセットすることにより前記選
択結果を記録する。より具体的には、埋め込みフラグE
uvは、初期設定では全てオフに設定されており、選択部
106は、埋め込み用として選択した量子化DCT係数
に対応する選択フラグをオンに設定する。埋め込み用と
して選択されなかった量子化DCT係数に対応する選択
フラグについてはオフのままである。
The selecting section 106 selects 8 × 8 embedding flags Euv (u, v) corresponding to the quantized DCT coefficient block Ruv.
= 0 to 7), and the selection result is recorded by setting an embedding flag Euv corresponding to the selected quantized DCT coefficient. More specifically, the embedding flag E
uv is initially set to off, and the selection unit 106 sets the selection flag corresponding to the quantized DCT coefficient selected for embedding to on. The selection flag corresponding to the quantized DCT coefficient not selected for embedding remains off.

【0035】選択部106は、後に画像が復号された場
合に、符号化前の元の画像と比べて視覚的な劣化が極力
少なくなるように埋め込み用の量子化DCT係数を選択
する。そうするために本実施形態では選択部106は、
量子化DCT係数の絶対値が判定値J以上のもの、
低周波のもの、の中からをより優先させながら、埋
め込み用の量子化DCT係数を選択する。
The selecting section 106 selects a quantization DCT coefficient for embedding so that, when an image is decoded later, visual deterioration is minimized as compared with the original image before encoding. To do so, in the present embodiment, the selection unit 106
The absolute value of the quantized DCT coefficient is equal to or larger than the judgment value J,
An embedding quantized DCT coefficient is selected while giving priority to low frequency ones.

【0036】の条件を用いる理由は、絶対値が小さい
量子化DCT係数は、絶対値の大きい量子化DCT係数
に比べて、1ビットの値が変化したときの誤差が大き
い。したがって絶対値の大きい量子化DCT係数に埋め
込みを行う方が劣化が少なくなるからである。の条件
を用いる理由は、図8(c)の量子化テーブルQuvを見
ればわかるように、高周波の量子化DCT係数は、低周
波の量子化DCT係数に比べて、より大きな値で逆量子
化される。このため高周波の量子化DCT係数は、低周
波の量子化DCT係数に埋め込みを行った場合と比べ
て、逆量子化した結果のDCT係数は、符号化時のDC
T係数と比較して誤差が大きくなる。したがって高周波
よりも低周波の量子化DCT係数の方が埋め込みを行っ
た場合の劣化が少なくなるからである。
The reason for using the condition (1) is that a quantized DCT coefficient having a small absolute value has a larger error when a 1-bit value changes than a quantized DCT coefficient having a large absolute value. Therefore, embedding in a quantized DCT coefficient having a large absolute value causes less deterioration. The reason for using the condition is that the high-frequency quantized DCT coefficient is inversely quantized with a larger value than the low-frequency quantized DCT coefficient, as can be seen from the quantization table Quv in FIG. Is done. For this reason, the high-frequency quantized DCT coefficient is compared with a case where the low-frequency quantized DCT coefficient is embedded, and the DCT coefficient resulting from the inverse quantization is a DCT coefficient at the time of encoding.
The error increases as compared with the T coefficient. Therefore, the quantization DCT coefficient of a low frequency is less deteriorated when embedding is performed than the high frequency.

【0037】をより優先させる理由は、よりの
方が値が変化したときの劣化が少ないからである。図1
0は、選択部106による、選択処理を示すフローチャ
ートである。同図において選択部106は、量子化DC
T係数(AC係数)を1つ読み出して、その絶対値が判
定値J(=2)以上であるか否かを判定する(ステップ
11、12)。この判定は、量子化DCT係数の下位か
ら2番目以上のビット値に1があるか否かによって判定
すればよい。すなわち選択部106は、量子化DCT係
数の絶対値の下位から2番目以上のビット値に、1が1
つでもあれば量子化DCT係数の絶対値は2以上の値で
あり、1が1つもなければ量子化DCT係数の絶対値
は、2より小さい値であると判定する。
The reason for giving higher priority is that the higher the value, the less the deterioration when the value changes. FIG.
0 is a flowchart showing a selection process by the selection unit 106. In the same figure, the selection unit 106
One T coefficient (AC coefficient) is read, and it is determined whether or not its absolute value is equal to or greater than a determination value J (= 2) (steps 11 and 12). This determination may be made based on whether or not there is 1 in the second or more least significant bit value of the quantized DCT coefficient. That is, the selection unit 106 sets 1 to 1 from the lowest bit value of the absolute value of the quantized DCT coefficient.
If there is more than one, the absolute value of the quantized DCT coefficient is a value of 2 or more, and if there is no 1, the absolute value of the quantized DCT coefficient is smaller than 2.

【0038】判定の結果、絶対値が判定値J以上の場合
には、対応する埋め込みフラグをセットし、変数Cに1
を足しこむ(ステップ13、14)。変数Cは、セット
された埋め込みフラグの数、つまり埋め込み用として選
択された量子化DCT係数の数を示す。このように選択
部106は、量子化DCT係数ブロックをジグザグ順に
走査しながら、63個の量子化DCT係数(AC係数)
についてステップ11〜14の処理を繰り返す。この処
理は、変数Cが埋め込み量N以上の場合、又は、63個
の量子化DCT係数(AC係数)全てについてステップ
11〜14の処理を行った場合に終了して、ステップ1
6に進む。
If the result of the determination indicates that the absolute value is equal to or greater than the determination value J, the corresponding embedding flag is set and the variable C is set to 1
Is added (steps 13 and 14). The variable C indicates the number of set embedding flags, that is, the number of quantized DCT coefficients selected for embedding. As described above, the selecting unit 106 scans the quantized DCT coefficient block in the zigzag order, and executes the 63 quantized DCT coefficients (AC coefficients).
, The processing of steps 11 to 14 is repeated. This processing ends when the variable C is equal to or greater than the embedding amount N or when the processing of steps 11 to 14 is performed for all of the 63 quantized DCT coefficients (AC coefficients).
Proceed to 6.

【0039】ステップ16において選択部106は、変
数Cが埋め込み量Nより小さいか否かを判定する。判定
の結果、変数Cが埋め込み量Nより小さい場合、埋め込
み用として選択された量子化DCT係数の個数が、部分
圧縮音声データのデータ量に達していないということで
あるから、選択部106は、低周波側からジグザグスキ
ャン順に、埋め込みフラグがオフになっているものの中
から(埋め込み量N−変数C)個を埋め込み用と選択し
て埋め込みフラグをセットする(ステップ17)。
In step 16, the selection unit 106 determines whether or not the variable C is smaller than the embedding amount N. If the result of the determination is that the variable C is smaller than the embedding amount N, it means that the number of quantized DCT coefficients selected for embedding has not reached the data amount of the partially compressed audio data. From the low-frequency side, in the zigzag scan order, the embedding flags are set by selecting (embedding amount N-variable C) pieces for embedding from among those whose embedding flags are turned off (step 17).

【0040】選択部106は、以上の手順によってN個
の埋め込み用の量子化DCT係数を選択する。 (選択処理例1)図11(a)は、選択部106が図8
(d)の量子化DCT係数ブロックRuvについて選択処
理を行った場合に埋め込み用として選択される量子化D
CT係数を丸印で囲って示している。
The selecting unit 106 selects N embedding quantized DCT coefficients by the above procedure. (Selection Processing Example 1) FIG.
The quantization D selected for embedding when the selection processing is performed on the quantized DCT coefficient block Ruv in (d).
The CT coefficients are shown by circles.

【0041】選択部106は、量子化DCT係数ブロッ
クRuvをジグザグ順に走査しながら、各量子化DCT係
数(AC係数)について判定値J以上であるか否かを判
定する。同図(a)の例では、選択部106は、−34、
26、−19、30、…の順に埋め込み用として選択し
ていき、最後に−2を選択した時点で選択した量子化D
CT係数の数が埋め込み量Nに達したので選択処理を終
了している。
The selector 106 determines whether each quantized DCT coefficient (AC coefficient) is equal to or greater than the judgment value J while scanning the quantized DCT coefficient block Ruv in a zigzag order. In the example shown in FIG.
, -19, 30,... Are sequentially selected for embedding, and the quantization D
Since the number of CT coefficients has reached the embedding amount N, the selection process has been completed.

【0042】同図(b)は、選択部106が同図(a)
について選択処理を行った場合の選択結果の埋め込みフ
ラグEuvを示す。同図(b)において1はフラグがセッ
トされていることを示し、その位置に対応する量子化D
CT係数が埋め込み用として選択されたことを示す。ま
た0はフラグがセットされていないことを示し、その位
置に対応する量子化DCT係数は埋め込み用として選択
されていないことを示す。 (選択処理例2)図12(a)は、選択部106が図8
(d)とは別の量子化DCT係数ブロックについて図1
0のステップ11〜15を繰り返した結果、埋め込み用
として選択された量子化DCT係数を丸印で囲って示
す。同図に示すように選択部106は、ジグザグスキャ
ン順に、10、−11、−12、5、5、12、…の順
に埋め込み用として選択していき、量子化DCT係数ブ
ロックの最後まで走査している。
FIG. 4B shows that the selecting unit 106 is the same as FIG.
Indicates an embedding flag Euv of the selection result when the selection process is performed for the. In FIG. 9B, 1 indicates that the flag is set, and the quantization D corresponding to the position is set.
Indicates that the CT coefficient has been selected for embedding. Further, 0 indicates that the flag is not set, and indicates that the quantized DCT coefficient corresponding to that position is not selected for embedding. (Selection Processing Example 2) FIG.
FIG. 1 shows a quantized DCT coefficient block different from (d).
As a result of repeating steps 11 to 15 of 0, the quantized DCT coefficients selected for embedding are indicated by circles. As shown in the drawing, the selection unit 106 selects the embedding order in the order of 10, -11, -12, 5, 5, 12,... In the zigzag scanning order, and scans to the end of the quantized DCT coefficient block. ing.

【0043】図12(a)に対応する埋め込みフラグを
同図(b)に示す。同図(b)に示すようにセットされ
ている埋め込みフラグの数は13個であり、埋め込み量
N(=16)より少ない。そこで選択部106は、ステ
ップ17の処理を行う。具体的には、同図(b)の埋め
込みフラグをジグザグスキャン順に走査して、16−3
=3個のセットされていない埋め込みフラグをセットし
て、全体として16個の埋め込みフラグをセットする。
同図(b)において丸印で囲まれた埋め込みフラグが、
ステップ17の処理により新たにセットされる。
FIG. 12B shows an embedding flag corresponding to FIG. As shown in FIG. 7B, the number of embedding flags set is thirteen, which is smaller than the embedding amount N (= 16). Then, the selection unit 106 performs the process of step 17. More specifically, the embedding flag shown in FIG.
= Set three unset embedding flags and set a total of 16 embedding flags.
The embedding flag surrounded by a circle in FIG.
It is newly set by the processing in step 17.

【0044】図12(c)は、選択部106の選択処理
による最終的な選択結果の埋め込みフラグを示す。 (埋め込み処理部107)埋め込み処理部107は、量
子化DCT係数ブロックRuv毎に、選択部106によっ
て埋め込み用として選択された16個の量子化DCT係
数に部分圧縮音声データの埋め込みを行う。
FIG. 12C shows an embedding flag of a final selection result by the selection processing of the selection unit 106. (Embedding Processing Unit 107) The embedding processing unit 107 embeds partially compressed audio data into the 16 quantized DCT coefficients selected for embedding by the selecting unit 106 for each quantized DCT coefficient block Ruv.

【0045】詳しくは、埋め込み処理部107は、選択
部106より出力される埋め込みフラグをジグザグスキ
ャン順に走査してセットされている埋め込みフラグを探
す。セットされている埋め込みフラグを見つけたら、埋
め込み処理部107は、その埋め込みフラグに対応する
量子化DCT係数の最下位ビットを、圧縮音声入力部1
04から入力される部分圧縮音声データの1ビットに変
更する。埋め込み処理部107は、この操作をセットさ
れている16個のフラグ分繰り返す。このようにして埋
め込み処理部107は、部分圧縮音声データの先頭から
1ビットずつを埋め込み用の量子化DCT係数の最下位
ビットに埋め込み、埋め込みの済んだ量子化DCT係数
ブロックを出力部108に出力する。 (埋め込み処理例)図13(a)は、部分圧縮音声デー
タの一例を示す。埋め込み処理部107は、この部分圧
縮音声データの先頭から1ビットずつを、埋め込み用と
して選択された量子化DCT係数に埋め込む。
More specifically, the embedding processing unit 107 scans the embedding flags output from the selecting unit 106 in a zigzag scan order, and searches for the set embedding flags. When finding the embedding flag that has been set, the embedding processing unit 107 converts the least significant bit of the quantized DCT coefficient corresponding to the embedding flag into the compressed audio input unit 1.
04 is changed to 1 bit of the partially compressed audio data. The embedding processing unit 107 repeats this operation for the set 16 flags. In this way, the embedding processing unit 107 embeds one bit at a time from the beginning of the partially compressed audio data in the least significant bit of the quantized DCT coefficient for embedding, and outputs the embedded quantized DCT coefficient block to the output unit 108. I do. (Example of Embedding Process) FIG. 13A shows an example of the partially compressed audio data. The embedding processor 107 embeds one bit at a time from the beginning of the partially compressed audio data into the quantized DCT coefficient selected for embedding.

【0046】同図(b)は、埋め込み処理部107が同
図(a)の部分圧縮音声データを図12(a)の量子化
DCT係数ブロックに埋め込んだ場合の結果を示す。図
13(b)において丸印で囲まれている量子化DCT係
数は、部分圧縮音声データが埋め込まれていることを示
す。埋め込み処理部107は、図12(c)の埋め込み
フラグをジグザグスキャン順に走査してセットされてい
る埋め込みフラグを探し、見つけたらそのフラグに対応
する量子化DCT係数に部分圧縮音声データを1ビット
埋め込む。 (出力部108)出力部108は、埋め込み処理部10
7によって埋め込みの済んだ量子化DCT係数ブロック
に対してエントロピー符号化部74と同様のエントロピ
ー符号化を行って、結果の圧縮符号列を符号用メモリ3
5に出力する。この圧縮符号列はすなわち音声付き圧縮
画像である。
FIG. 11B shows the result when the embedding processing unit 107 embeds the partially compressed audio data of FIG. 10A into the quantized DCT coefficient block of FIG. The quantized DCT coefficients circled in FIG. 13B indicate that the partially compressed audio data is embedded. The embedding processing unit 107 scans the embedding flag of FIG. 12C in a zigzag scan order to search for the set embedding flag, and when found, embeds one bit of the partially compressed audio data in the quantized DCT coefficient corresponding to the flag. . (Output unit 108) The output unit 108
7 performs the same entropy coding as the entropy coding unit 74 on the quantized DCT coefficient block embedded therein, and stores the resulting compressed code string in the coding memory 3.
5 is output. This compressed code string is a compressed image with sound.

【0047】以上のようにして埋め込み37は、圧縮符
号列を復号した量子化DCT係数ブロックに、部分圧縮
音声データの埋め込みを行って、再び圧縮符号列に符号
化して符号用メモリに出力するという処理を繰り返すこ
とにより、1枚の音声なし圧縮画像に約10秒の圧縮音
声データを埋め込む。このようにして埋め込み部37
は、各ブロックについて画像の劣化に影響しない16個
の量子化DCT係数の最下位ビットに部分圧縮音声デー
タの埋め込みを行うので、全体として2バイト×192
00ブロック=38400バイト分の埋め込みが行われ
ることとなり、より多くの圧縮音声データを画像の劣化
少なく埋め込むことができる。 (抽出部83の詳細構成)図14は、抽出部83の詳細
な構成図である。
As described above, the embedding 37 embeds the partially compressed audio data in the quantized DCT coefficient block obtained by decoding the compressed code string, encodes the compressed code string again, and outputs it to the coding memory. By repeating the process, compressed audio data of about 10 seconds is embedded in one compressed image without audio. Thus, the embedding section 37
Performs embedding of partially compressed audio data in the least significant bit of 16 quantized DCT coefficients that do not affect image degradation for each block, so that 2 bytes × 192
The embedding of 00 blocks = 38400 bytes is performed, so that more compressed audio data can be embedded with less image deterioration. (Detailed Configuration of Extraction Unit 83) FIG. 14 is a detailed configuration diagram of the extraction unit 83.

【0048】同図において抽出部83は、識別部83
1、抽出処理部832から構成される。識別部831
は、エントロピー復号化部84より量子化DCT係数ブ
ロックRuv又はR’uvが出力されると、図10のフロー
チャートと同じ処理によって、埋め込みフラグを生成す
る。ここで識別部831は、量子化DCT係数ブロック
がRuvであってもR’uvであっても埋め込みフラグの生
成を行う。つまり圧縮画像が音声なしであるか音声付き
であるかに関係なく埋め込みフラグの生成を行う。これ
により音声付き圧縮画像の量子化DCT係数ブロック
R’uvであれば、識別部831は選択部106によって
作成されたものと同じ埋め込みフラグを復元するし、音
声なし圧縮画像の量子化DCT係数ブロックRuvであれ
ば、識別部831は全てのフラグがオフの埋め込みフラ
グを生成する。
In the figure, the extraction unit 83 is composed of an identification unit 83
1. It is composed of an extraction processing unit 832. Identification unit 831
When the quantized DCT coefficient block Ruv or R'uv is output from the entropy decoding unit 84, an embedding flag is generated by the same processing as in the flowchart of FIG. Here, the identification unit 831 generates an embedding flag regardless of whether the quantized DCT coefficient block is Ruv or R'uv. That is, the embedding flag is generated regardless of whether the compressed image has no sound or has sound. As a result, if it is the quantized DCT coefficient block R'uv of the compressed image with sound, the identification unit 831 restores the same embedded flag created by the selecting unit 106, and the quantized DCT coefficient block of the compressed image without sound. If it is Ruv, the identification unit 831 generates an embedded flag in which all flags are off.

【0049】抽出処理部832は、識別部831により
復元された埋め込みフラグをジグザグスキャン順に参照
して、オンに設定されている埋め込みフラグに対応する
量子化DCT係数の最下位ビットを抽出してオーディオ
メモリ54に出力する。以上のようにして抽出部83
は、選択処理及び埋め込み処理と逆の処理を行うことに
よって、部分圧縮音声データが埋め込まれた量子化DC
T係数ブロックから部分圧縮音声データを抽出し、これ
を全ての量子化DCT係数ブロックについて行うことに
よって約10秒の圧縮音声データを抽出する。 (実施形態2)以下、本発明の実施形態2のデジタルカ
メラ2について説明する。
The extraction processing unit 832 refers to the embedding flags restored by the identification unit 831 in a zigzag scan order, extracts the least significant bit of the quantized DCT coefficient corresponding to the embedding flag set to ON, and outputs Output to the memory 54. As described above, the extraction unit 83
Is a quantization DC in which the partially compressed audio data is embedded by performing a process reverse to the selection process and the embedding process.
The compressed audio data of about 10 seconds is extracted by extracting the partially compressed audio data from the T coefficient block and performing this for all the quantized DCT coefficient blocks. Embodiment 2 Hereinafter, a digital camera 2 according to Embodiment 2 of the present invention will be described.

【0050】デジタルカメラ2は、デジタルカメラ1と
同様の方法により量子化DCT係数の最下位ビットに圧
縮音声データを埋め込むのに加えて、量子化DCT係数
の下位から2ビット目と3ビット目にも圧縮音声データ
を埋め込むことにより、実施形態1よりも1枚の画像に
多くの圧縮音声データを埋め込むことができる。その構
成は、図3に示すデジタルカメラ1の構成と比較して、
埋め込み部37と抽出部83の代わりに埋め込み部47
と抽出部93を備える点が異なっている。
The digital camera 2 embeds the compressed audio data in the least significant bit of the quantized DCT coefficient in the same manner as the digital camera 1 and also adds the second and third bits from the least significant bit of the quantized DCT coefficient. By embedding compressed audio data, more compressed audio data can be embedded in one image than in the first embodiment. Its configuration is different from that of the digital camera 1 shown in FIG.
An embedding unit 47 instead of the embedding unit 37 and the extraction unit 83
And an extraction unit 93.

【0051】以下、埋め込み部47と抽出部93につい
て説明する。 (埋め込み部47)図15は埋め込み部47の詳細構成
図を示す。同図において埋め込み部47は、圧縮画像入
力部101、判定値入力部202、埋め込み量入力部1
03、圧縮音声入力部204、エントロピー復号化部1
05、選択部206、埋め込み処理部207、出力部1
08から構成される。
Hereinafter, the embedding section 47 and the extracting section 93 will be described. (Embedding Unit 47) FIG. 15 is a detailed configuration diagram of the embedding unit 47. In the figure, an embedding unit 47 includes a compressed image input unit 101, a determination value input unit 202, and an embedding amount input unit 1.
03, compressed speech input unit 204, entropy decoding unit 1
05, selection unit 206, embedding processing unit 207, output unit 1
08.

【0052】同図において図9の埋め込み部37と同じ
符号の構成要素は同じ機能であるので説明を省略し、以
下符号の異なる構成要素について説明する。判定値入力
部202は、判定値J、J2、J3を予め記憶する。本
実施形態においてJ、J2、J3はそれぞれ2、4、8
である。圧縮音声入力部204は、オーディオメモリ4
4に記憶される圧縮音声データを埋め込み量単位に区切
って埋め込み処理部207に出力する。埋め込み量は、
量子化DCT係数ブロック毎に異なっており、選択部2
06より指示される。
In the figure, the components having the same reference numerals as those of the embedding unit 37 in FIG. 9 have the same functions, and thus the description thereof will be omitted, and the components having the different reference numerals will be described below. The determination value input unit 202 stores the determination values J, J2, and J3 in advance. In the present embodiment, J, J2, and J3 are 2, 4, and 8, respectively.
It is. The compressed voice input unit 204 is provided in the audio memory 4
4 is output to the embedding processing unit 207 by dividing the compressed audio data into units of embedding amount. The embedding amount is
It is different for each quantized DCT coefficient block.
06.

【0053】選択部206は、実施形態1と同じく図1
0に示す選択処理によって最下位ビットに埋め込むため
の量子化DCT係数を選択する。この処理は実施形態1
と同様であるので説明を省略する。上記選択処理に加え
て選択部206は、2ビット目、3ビット目に埋め込む
ための量子化DCT係数を選択する。
The selection unit 206 is the same as the first embodiment shown in FIG.
A quantization DCT coefficient to be embedded in the least significant bit is selected by a selection process indicated by “0”. This processing is performed in the first embodiment.
Therefore, the description is omitted. In addition to the above selection processing, the selection unit 206 selects a quantized DCT coefficient to be embedded in the second and third bits.

【0054】選択部206は各量子化DCT係数をその
絶対値の大きさに応じてクラス分けし、各クラスに属す
る量子化DCT係数の個数に応じて埋め込みを行う量子
化DCT係数の個数と埋め込みを行うビット位置とを決
定する。図16は、選択部206が埋め込みを行う量子
化DCT係数の数と埋め込みを行うビット位置とを決定
するための論理を表わすフローチャートである。
The selecting section 206 classifies each quantized DCT coefficient according to the magnitude of its absolute value, and embeds the number of quantized DCT coefficients to be embedded according to the number of quantized DCT coefficients belonging to each class and the embedding. Is determined. FIG. 16 is a flowchart illustrating the logic for determining the number of quantized DCT coefficients to be embedded and the bit position to be embedded by the selection unit 206.

【0055】同図において選択部206は、まず1つの
量子化DCT係数ブロック中の63個のAC係数におい
て、絶対値が4以上の量子化DCT係数の個数C2と絶
対値が8以上の量子化DCT係数の個数C3とを数える
(ステップ21)。次に選択部206は、C2、C3の
値に応じて以下の決定を行う。C3が8以上の場合、つ
まり量子化DCT係数ブロック中に絶対値が8以上の量
子化DCT係数の個数が8個以上ある場合(ステップ2
2)、選択部206は絶対値が8以上の4個の量子化D
CT係数についてその下位から3ビット目を埋め込み用
と決定し、また絶対値が4以上の8個の量子化DCT係
数についてその下位から2ビット目を埋め込み用と決定
する(ステップ23)。
In the figure, the selection unit 206 first determines the number C2 of quantized DCT coefficients whose absolute value is 4 or more and the quantized DCT coefficients whose absolute value is 8 or more in 63 AC coefficients in one quantized DCT coefficient block. The number C3 of DCT coefficients is counted (step 21). Next, the selection unit 206 makes the following determination according to the values of C2 and C3. When C3 is 8 or more, that is, when the number of quantized DCT coefficients whose absolute value is 8 or more is 8 or more in the quantized DCT coefficient block (step 2)
2), the selection unit 206 performs four quantizations D with absolute values of 8 or more.
The third bit from the lower order of the CT coefficient is determined to be embedded, and the second bit from the lower order is determined to be embedded for eight quantized DCT coefficients whose absolute values are 4 or more (step 23).

【0056】C3が8未満であってC2が8以上の場
合、つまり量子化DCT係数ブロック中に絶対値が8以
上の量子化DCT係数の個数が8個未満であって絶対値
が4以上の量子化DCT係数の個数が8個以上ある場合
(ステップ24)、選択部206は絶対値が4以上の8
個の量子化DCT係数についてその下位から2ビット目
を埋め込み用と決定する(ステップ25)。
When C3 is less than 8 and C2 is 8 or more, that is, the number of quantized DCT coefficients having an absolute value of 8 or more in a quantized DCT coefficient block is less than 8 and the absolute value is 4 or more. When the number of quantized DCT coefficients is eight or more (step 24), the selection unit 206 determines that the absolute value is
The second least significant bit of the quantized DCT coefficients is determined to be embedded (step 25).

【0057】C2が4以上8未満の場合、つまり量子化
DCT係数ブロック中に絶対値が4以上の量子化DCT
係数の個数が4個以上8個未満ある場合(ステップ2
6)、選択部206は絶対値が4以上の4個の量子化D
CT係数の下位から2ビット目を埋め込み用と決定する
(ステップ27)。選択部206は、実施形態1と同様
の埋め込みフラグEuvを有する他、下位から2ビット目
用と3ビット目用の埋め込みフラグE2uv(u,v=0〜
7)と埋め込みフラグE3uv(u,v=0〜7)とを有
し、先の決定結果に従って埋め込みフラグE2uv、E3
uvをセットする。
When C2 is 4 or more and less than 8, that is, the quantized DCT whose absolute value is 4 or more in the quantized DCT coefficient block
When the number of coefficients is 4 or more and less than 8 (step 2
6), the selector 206 selects four quantized Ds whose absolute values are 4 or more.
The second bit from the bottom of the CT coefficient is determined to be embedded (step 27). The selecting unit 206 has an embedding flag Euv similar to that of the first embodiment, and also includes an embedding flag E2uv (u, v = 0 to 2) for the second and third bits from the lower order.
7) and an embedding flag E3uv (u, v = 0 to 7), and the embedding flags E2uv and E3 according to the result of the above determination.
Set uv.

【0058】より具体的には、決定結果がステップ23
である場合、選択部206はDC係数を除く量子化DC
T係数(AC係数)をジグザグスキャン順に走査して、
絶対値が8以上の量子化DCT係数を4個選択してそれ
に対応する埋め込みフラグE3uvをセットし、また同様
にしてDC係数を除く量子化DCT係数(AC係数)を
ジグザグスキャン順に走査して、絶対値が4以上の量子
化DCT係数を8個選択してそれに対応する埋め込みフ
ラグE2uvをセットする。
More specifically, the result of the determination is
, The selection unit 206 performs quantization DC
Scan the T coefficient (AC coefficient) in zigzag scan order,
Four quantized DCT coefficients having an absolute value of 8 or more are selected, and the corresponding embedding flag E3uv is set. Similarly, the quantized DCT coefficients (AC coefficients) excluding the DC coefficients are scanned in a zigzag scan order. Eight quantized DCT coefficients having an absolute value of 4 or more are selected, and the corresponding embedding flag E2uv is set.

【0059】また決定結果がステップ25である場合、
選択部206はDC係数を除く量子化DCT係数(AC
係数)をジグザグスキャン順に走査して、絶対値が4以
上の量子化DCT係数を8個選択してそれに対応する埋
め込みフラグE2uvをセットする。埋め込みフラグE3
uvはセットしない。また決定結果がステップ27である
場合、選択部206はDC係数を除く量子化DCT係数
(AC係数)をジグザグスキャン順に走査して、絶対値
が4以上の量子化DCT係数を4個選択してそれに対応
する埋め込みフラグE2uvをセットする。埋め込みフラ
グE3uvはセットしない。
If the result of the determination is step 25,
The selection unit 206 outputs the quantized DCT coefficients (AC
Are scanned in the zigzag scan order, eight quantized DCT coefficients having an absolute value of 4 or more are selected, and the corresponding embedding flag E2uv is set. Embedded flag E3
uv is not set. If the determination result is step 27, the selection unit 206 scans the quantized DCT coefficients (AC coefficients) excluding the DC coefficients in a zigzag scan order, selects four quantized DCT coefficients having an absolute value of 4 or more, and The corresponding embedding flag E2uv is set. The embedding flag E3uv is not set.

【0060】例えば図12(a)に示す量子化DCT係
数ブロックについて決定処理を行った場合、絶対値が4
以上のAC係数は10、−11、−12、5、5、1
2、−7、−7、4の9個だからC2=9、絶対値が8
以上のAC係数は10、−11、−12、12の4個だ
からC3=4である(ステップ21)。よって決定結果
は、ステップ25に相当するので、図12(a)の量子
化DCT係数ブロックの中から絶対値が4以上の8個の
量子化DCT係数の下位から2ビット目が埋め込み用と
決定される。図17に、この決定結果に従ってセットさ
れた埋め込みフラグE2uvを示す。同図に示すように絶
対値が4以上の8個の量子化DCT係数がジグザグスキャ
ン順に選択され、それに対応する埋め込みフラグE2uv
がセットされる。なおステップ25の決定結果によれ
ば、埋め込みフラグE3uvは1つもセットされない。
For example, when the decision processing is performed on the quantized DCT coefficient block shown in FIG.
The above AC coefficients are 10, -11, -12, 5, 5, 1
Since 2, -7, -7 and 4 are 9 pieces, C2 = 9 and the absolute value is 8
Since the above-mentioned AC coefficients are 10, -11, -12, and 12, C3 = 4 (step 21). Therefore, since the determination result corresponds to step 25, the second bit from the lower order of the eight quantized DCT coefficients whose absolute values are 4 or more from the quantized DCT coefficient block in FIG. Is done. FIG. 17 shows the embedding flag E2uv set according to the determination result. As shown in the figure, eight quantized DCT coefficients whose absolute values are 4 or more are selected in zigzag scan order, and the corresponding embedding flag E2uv
Is set. According to the determination result of step 25, no embedding flag E3uv is set.

【0061】さらに選択部206は最下位ビット、下位
から2ビット目、3ビット目を合わせた埋め込み量を圧
縮音声入力部204に通知する。具体的には、決定結果
がステップ23の場合、下位から2ビット目への埋め込
みが8ビット、下位から3ビット目への埋め込みが4ビ
ット、また最下位ビットへの埋め込みが16ビットであ
るので、選択部206は12と16の合計28を埋め込
み量として通知する。
Further, the selection unit 206 notifies the compressed voice input unit 204 of the embedding amount including the least significant bit and the second and third bits from the lowest. Specifically, when the decision result is step 23, the embedding in the second bit from the lower order is 8 bits, the embedding in the third bit from the lower order is 4 bits, and the embedding in the least significant bit is 16 bits. , The selector 206 notifies the total 28 of 12 and 16 as the embedding amount.

【0062】また決定結果がステップ25の場合、下位
から2ビット目への埋め込みが8ビット、最下位ビット
への埋め込みが16ビットであるので、選択部206は
8と16の合計24を埋め込み量として通知する。また
決定結果がステップ27の場合、下位から2ビット目へ
の埋め込みは4ビット、最下位ビットへの埋め込みが1
6ビットであるので、選択部206は4と16の合計2
0を埋め込み量として通知する。
When the decision result is step 25, the embedding in the second bit from the lower order is 8 bits, and the embedding in the least significant bit is 16 bits. Notify as. If the determination result is step 27, the embedding in the second bit from the lower order is 4 bits, and the embedding in the least significant bit is 1
Since the number of bits is 6 bits, the selection unit 206 outputs a total of 2
0 is notified as the embedding amount.

【0063】埋め込み処理部207は、埋め込みフラグ
Euv、E2uv、E3uvに基づいて量子化DCT係数の最下
位ビット、下位から2ビット目、下位から3ビット目へ
の部分圧縮音声データの埋め込みを行う。詳しくは、埋
め込み処理部207は実施形態1と同様にして埋め込み
フラグEuvに基づいて最下位ビットへの埋め込みを行
う。これについては実施形態1と同様であるので説明を
省略する。
The embedding processing unit 207 embeds the partially compressed audio data in the least significant bit, the second least significant bit, and the least significant third bit of the quantized DCT coefficient based on the embedding flags Euv, E2uv, and E3uv. Specifically, the embedding processing unit 207 performs embedding in the least significant bit based on the embedding flag Euv in the same manner as in the first embodiment. Since this is the same as in the first embodiment, the description is omitted.

【0064】次に埋め込み処理部207は、埋め込みフ
ラグE2uvをジグザグスキャン順に走査して、セットさ
れている埋め込みフラグを探し、見つけたらそれに対応
する量子化DCT係数の下位から2ビット目を圧縮音声
入力部204から入力される部分圧縮音声データの1ビ
ットに変更する。埋め込みフラグE2uvの走査が終了す
ると、埋め込み処理部207は同様にして埋め込みフラ
グE3uvについてもジグザグスキャン順に走査して、セ
ットされている埋め込みフラグに対応する量子化DCT
係数の下位から3ビット目を部分圧縮音声データの1ビ
ットに変更する。
Next, the embedding processing section 207 scans the embedding flag E2uv in a zigzag scan order, searches for the set embedding flag, and if found, fetches the second lower bit of the corresponding quantized DCT coefficient into the compressed audio input signal. It is changed to one bit of the partially compressed audio data input from the unit 204. When the scanning of the embedding flag E2uv is completed, the embedding processing unit 207 similarly scans the embedding flag E3uv in the zigzag scanning order, and performs quantization DCT corresponding to the set embedding flag.
The third bit from the lower order of the coefficient is changed to 1 bit of the partially compressed audio data.

【0065】以上のようにして埋め込み部47は、各ブ
ロックについて画像の劣化に影響しない量子化DCT係
数とそのビット位置とを選択して、部分圧縮音声データ
の埋め込みを行うので、全体で約43〜48Kバイトの
圧縮音声データが埋め込まれることとなる。抽出部93
は、エントロピー復号化部84より量子化DCT係数ブ
ロックが出力されると、選択部206が行う処理と同様
の方法によって埋め込みフラグEuv、E2uv、E3uvを
復元し、それらのフラグに基づいて量子化DCT係数の
最下位ビット、下位から2ビット目、下位から3ビット
目より部分圧縮音声データを抽出し、オーディオメモリ
54に出力する。
As described above, the embedding section 47 selects the quantized DCT coefficient and its bit position which do not affect the image degradation for each block and embeds the partially compressed audio data. 4848 Kbytes of compressed audio data will be embedded. Extraction unit 93
When the quantized DCT coefficient block is output from the entropy decoding unit 84, the embedding flags Euv, E2uv, and E3uv are restored by the same method as the processing performed by the selecting unit 206, and the quantized DCT coefficient is Partially compressed audio data is extracted from the least significant bit, the second least significant bit, and the third least significant bit of the coefficient, and is output to the audio memory 54.

【0066】このように抽出部93は、埋め込み部47
とは逆の操作を行うことによって部分圧縮音声データを
抽出することができる。以上、本発明の実施形態1、2
について説明したが、本発明は実施形態1、2に限ら
ず、以下のようにしても良い。 (1)実施形態1において埋め込み部37はデジタルカ
メラ内部に備えられていたが、デジタルカメラ内部に備
えずに埋め込み部37単体で構成してもよい。実施形態
2の埋め込み部47についても同様である。
As described above, the extraction unit 93 is provided with the embedding unit 47.
By performing the reverse operation, the partially compressed audio data can be extracted. As described above, Embodiments 1 and 2 of the present invention
However, the present invention is not limited to the first and second embodiments, and may be as follows. (1) Although the embedding unit 37 is provided inside the digital camera in the first embodiment, the embedding unit 37 may be configured as a single unit without being provided inside the digital camera. The same applies to the embedding part 47 of the second embodiment.

【0067】また埋め込み部37及び47をパソコン等
の画像処理の可能な装置の内部に構成してもよい。 (2)実施形態1において埋め込み部37は、一度符号
化された圧縮画像をエントロピー復号によって量子化D
CT係数ブロックに戻してから部分圧縮音声データを埋
め込むという手順で埋め込みを行っていたが、符号化部
34による符号化の段階で埋め込みを行うように構成し
ても良い。より詳しくは、埋め込み部37は、符号化部
34におけるDCT部71、量子化部72によってDC
Tと量子化とが施された後であって、エントロピー符号
化部74によって符号化される前の量子化DCT係数ブ
ロックに対して埋め込みを行う。この場合埋め込み部3
7が有するエントロピー復号化部105と出力部108
とは不要となる。 (3)圧縮画像のデータ量、判定値、埋め込み量、量子
化テーブルQuv等は、実施形態1及び2に示す値に限ら
ない。
The embedding sections 37 and 47 may be configured inside a device capable of image processing such as a personal computer. (2) In the first embodiment, the embedding unit 37 quantizes the compressed image once encoded by entropy decoding.
Although the embedding is performed by the procedure of embedding the partially compressed audio data after returning to the CT coefficient block, the embedding may be performed at the stage of encoding by the encoding unit 34. More specifically, the embedding unit 37 uses the DCT unit 71 and the quantization unit 72 in the encoding unit 34
The embedding is performed on the quantized DCT coefficient block after being subjected to T and quantization and before being encoded by the entropy encoding unit 74. In this case, the embedding unit 3
7 has an entropy decoding unit 105 and an output unit 108
Becomes unnecessary. (3) The data amount of the compressed image, the determination value, the embedding amount, the quantization table Quv, and the like are not limited to the values described in the first and second embodiments.

【0068】例えば判定値Jは3や4でもよい。ただし
n(nは自然数)を用いるのが望ましい。その理由
は、選択部106は、量子化DCT係数の下位から(n
+1)番目以上のビット値に1があるか否かを判定する
ことにより、その係数が2n以上か否かを簡単に判定す
ることができるからである。また異なる量子化テーブル
を複数有するよう構成し、量子化テーブルに応じて判定
値や埋め込み量を変えても良い。
For example, the judgment value J may be 3 or 4. However, it is desirable to use 2 n (n is a natural number). The reason is that the selection unit 106 selects (n
This is because whether or not the coefficient is 2n or more can be easily determined by determining whether or not there is 1 in the (+1) th or more bit value. Further, a configuration may be adopted in which a plurality of different quantization tables are provided, and the determination value and the embedding amount may be changed according to the quantization tables.

【0069】画像の劣化と埋め込み量との兼ね合いを考
慮して量子化DCT係数の下位から1ビット目、2ビッ
ト目、3ビット目への埋め込み量を実施形態2よりも多
くしても良い。例えば量子化テーブルの値を全体的に小
さくして圧縮率を低くすれば、1ビット目に30ビッ
ト、2ビット目に16ビット、3ビット目に8ビットと
いうように埋め込み量を多くすることも可能である。 (4)エントロピー符号化部74と出力部108、エン
トロピー復号化部105とエントロピー復号化部84、
撮影画像メモリ33と表示用画像メモリ61、オーディ
オメモリ44とオーディオメモリ54等、デジタルカメ
ラ内部において同じ機能の2つの構成要素は、一方をな
くして1つだけで共用しても良い。 (5)実施形態1においてはデジタルカメラ1は、各量
子化DCT係数に部分圧縮音声データを一律に埋め込む
構成であった。この構成によれば、判定値J以上の量子
化DCT係数の数が埋め込み量Nより少ないブロックに
ついては、判定値Jより小さい値の量子化DCT係数に
も埋め込みが行われるので、そのブロックは、他のブロ
ックよりも劣化することになるという問題がある。この
ような問題に対して次のような方法で対処してもよい。
すなわち選択部106は、まず量子化DCT係数毎に、
DC係数を除く63個のAC係数中に、その絶対値が判
定値J以上の値の係数の数を数え上げる。次に選択部1
06は、数え上げた係数の数が埋め込み量Nの値以上で
あるか否かを判定する。判定の結果、埋め込み量Nの値
以上である場合には、その量子化DCT係数ブロックに
埋め込みを行う、と決定し、ジグザグスキャン順に判定
値J以上の量子化DCT係数ブロックを埋め込み用とし
て選択して埋め込みフラグをセットする。判定の結果、
埋め込み量Nの値よりも少ない場合には、その量子化D
CT係数ブロックには埋め込みを行わない、と決定し埋
め込みフラグのセットを行わない。埋め込み処理部10
7は、選択部106によってセットされている埋め込み
フラグのあるブロックについてのみ部分圧縮音声データ
の埋め込みを行う。これによって、実施形態1の構成よ
りも埋め込み可能な圧縮音声データのデータ量は少なく
なるが、実施形態1の構成よりも画質を保護できるとい
う効果がある。 (6)埋め込み部37の各構成要素の機能をプログラム
化してROMに記録し、CPU、RAM、ROMからな
るマイクロコンピュータにより実現してもよい。より具
体的には、CPUはROMからプログラムを読み出して
実行することにより、量子化DCT係数ブロックRuvの
中から低周波のAC係数と絶対値が判定値2以上のAC
係数とから16個のAC係数を選択する選択ステップ
と、選択処理によって選択された16個のAC係数の最
下位ビットを16ビットの部分圧縮音声データに置き換
える置き換えステップとを行う。選択ステップは図10
に示すフローチャートをプログラム化したもので、CP
Uは量子化DCT係数RuvのAC係数についてジグザグ
スキャンし、判定値2以上の量子化DCT係数があれば
それに対応する埋め込みフラグをオンする第1選択ステ
ップを行う。この埋め込みフラグはRAMに記憶されて
いる。CPUは埋め込みフラグをオンにした個数Cが埋
め込み量16に達したとき、または最後の量子化DCT
係数までジグザグスキャンしたとき第1選択ステップを
終了する。CPUはフラグをオンにした個数Cが埋め込
み量16より少ないか否かを判定し、少ない場合にはジ
グザグスキャン順にオフになっている埋め込みフラグ
(16−C)個をオンにする第2選択ステップを行う。
CPUは、埋め込みフラグがオンになっている量子化D
CT係数について上記置き換えステップによる置き換え
を行う。
The embedding amount in the first, second, and third bits from the lower order of the quantized DCT coefficient may be made larger than that in the second embodiment in consideration of the balance between the image deterioration and the embedding amount. For example, if the value of the quantization table is reduced as a whole to lower the compression ratio, the amount of embedding may be increased such as 30 bits for the first bit, 16 bits for the second bit, and 8 bits for the third bit. It is possible. (4) entropy encoding section 74 and output section 108, entropy decoding section 105 and entropy decoding section 84,
In the digital camera, two components having the same function, such as the photographed image memory 33 and the display image memory 61, the audio memory 44 and the audio memory 54, may be omitted and one may be used alone. (5) In the first embodiment, the digital camera 1 is configured to uniformly embed partially compressed audio data in each quantized DCT coefficient. According to this configuration, for a block in which the number of quantized DCT coefficients equal to or greater than the determination value J is smaller than the embedding amount N, embedding is performed also for quantized DCT coefficients having a value smaller than the determination value J. There is a problem that it will be deteriorated more than other blocks. Such a problem may be dealt with by the following method.
That is, the selecting unit 106 first sets, for each quantized DCT coefficient,
Among the 63 AC coefficients excluding the DC coefficient, the number of coefficients whose absolute value is equal to or greater than the determination value J is counted. Next, the selection unit 1
In step 06, it is determined whether the number of counted coefficients is equal to or larger than the value of the embedding amount N. As a result of the determination, when the embedding amount is equal to or more than the value of the embedding amount N, it is determined that embedding is performed in the quantized DCT coefficient block, and the quantized DCT coefficient blocks having the judgment value J or more are selected for embedding in zigzag scan order. To set the embedded flag. As a result of the judgment,
When the value is smaller than the value of the embedding amount N, the quantization D
It is determined that embedding is not performed in the CT coefficient block, and the embedding flag is not set. Embedding processing unit 10
7 embeds the partially compressed audio data only in the block having the embedding flag set by the selection unit 106. Thereby, the data amount of the compressed audio data that can be embedded is smaller than that of the configuration of the first embodiment, but there is an effect that the image quality can be protected more than the configuration of the first embodiment. (6) The function of each component of the embedding unit 37 may be programmed and recorded in the ROM, and may be realized by a microcomputer including a CPU, a RAM, and a ROM. More specifically, the CPU reads out the program from the ROM and executes the program, so that the low-frequency AC coefficient and the AC value whose absolute value is equal to or more than the determination value 2 are selected from the quantized DCT coefficient block Ruv.
A selection step of selecting 16 AC coefficients from the coefficients and a replacement step of replacing the least significant bit of the 16 AC coefficients selected by the selection process with 16-bit partially compressed audio data are performed. The selection step is shown in FIG.
Is a programmed version of the flowchart shown in
U performs a zigzag scan of the AC coefficient of the quantized DCT coefficient Ruv and performs a first selection step of turning on an embedding flag corresponding to the quantized DCT coefficient having a determination value of 2 or more, if any. This embedding flag is stored in the RAM. When the number C with the embedding flag turned on reaches the embedding amount 16, or when the last quantized DCT
When the zigzag scan is performed up to the coefficient, the first selection step ends. The CPU determines whether the number C of which the flags are turned on is smaller than the embedding amount 16, and if the number is smaller, the second selection step of turning on the embedding flags (16-C) which are turned off in the zigzag scanning order. I do.
The CPU executes the quantization D with the embedding flag turned on.
The CT coefficients are replaced in the above replacement step.

【0070】[0070]

【発明の効果】本発明の埋め込み装置は、画像に離散コ
サイン(DCT)変換と量子化とを施すことにより生成
される量子化DCT係数ブロック中、低周波のAC係数
と絶対値が第1しきい値以上のAC係数とから所定個の
AC係数を選択する選択手段と、前記選択手段により選
択された所定個のAC係数の最下位ビットを音声データ
に置き換える置換え手段とを備える。
According to the embedding apparatus of the present invention, in a quantized DCT coefficient block generated by performing discrete cosine transform (DCT) and quantization on an image, the low-frequency AC coefficient and the absolute value are first. A selection means for selecting a predetermined number of AC coefficients from the AC coefficients having a threshold value or more, and a replacement means for replacing the least significant bit of the predetermined number of AC coefficients selected by the selection means with audio data.

【0071】この構成によれば埋め込み装置は、最下位
ビットの値を変化させた場合に画像の劣化がより少なく
なるようなAC係数を選択して音声データを埋めこむの
で画像の劣化が少なくなるという効果がある。ここで画
像の劣化が少なくなるのは、以下の理由による。まず低
周波のAC係数について説明すると、低周波のAC係数
は、通常、高周波のAC係数に比べて小さい量子化レベ
ルで量子化されるという特徴がある。これは人間の視覚
特性が高周波成分に鈍感で低周波成分に敏感であるた
め、高周波成分を粗く量子化するで圧縮率を高めている
からである。AC係数は、復号の際、量子化レベルと同
じ値で逆量子化されるので、低周波のAC係数は小さい
レベルで逆量子化され、高周波のAC係数は大きいレベ
ルで逆量子化されることとなる。よって、同じように最
下位ビットを0から1に置き換えたとしても低周波の方
が高周波よりも逆量子化後の誤差が小さく、つまり画質
の劣化が少ない。
According to this configuration, the embedding apparatus selects an AC coefficient that causes less deterioration of the image when the value of the least significant bit is changed, and embeds the audio data, thereby reducing the deterioration of the image. This has the effect. Here, the deterioration of the image is reduced for the following reason. First, the low-frequency AC coefficient will be described. The low-frequency AC coefficient is characterized in that it is usually quantized at a smaller quantization level than the high-frequency AC coefficient. This is because human visual characteristics are insensitive to high-frequency components and sensitive to low-frequency components, so that high-frequency components are roughly quantized to increase the compression ratio. When decoding, the AC coefficients are inversely quantized at the same value as the quantization level, so that low-frequency AC coefficients are inversely quantized at a small level and high-frequency AC coefficients are inversely quantized at a large level. Becomes Therefore, even if the least significant bit is replaced from 0 to 1, the error after the inverse quantization is smaller at the low frequency than at the high frequency, that is, the image quality is less deteriorated.

【0072】また絶対値がしきい値以上のAC係数につ
いて説明すると、絶対値の大きいAC係数は、絶対値が
小さいAC係数と比較して、最下位ビットが変化した場
合の変化の割合が小さい。例えば16のAC係数の最下
位ビットが17になった場合と、0のAC係数が1にな
った場合とを比べると、16から17に変化した方が変
化の割合が小さい。また絶対値が大きいAC係数は、低
周波であることが多く(なぜなら低周波の方が小さい量
子化レベルで量子化されているので値が大きい場合が多
いからである)、その分逆量子化後の誤差が小さい。こ
れらから絶対値がしきい値以上のAC係数は、しきい値
より小さいAC係数に比べて画像の劣化が少ない。
An AC coefficient having an absolute value equal to or larger than a threshold value will be described. An AC coefficient having a large absolute value has a smaller rate of change when the least significant bit changes than an AC coefficient having a small absolute value. . For example, comparing the case where the least significant bit of the 16 AC coefficient is 17 and the case where the 0 AC coefficient is 1, the change ratio is smaller when changing from 16 to 17. Also, the AC coefficient having a large absolute value is often at a low frequency (because the low frequency is quantized at a smaller quantization level, so the value is often large), and the inverse quantization is performed accordingly. Later error is small. From these, the AC coefficient whose absolute value is equal to or larger than the threshold value has less image deterioration than the AC coefficient whose absolute value is smaller than the threshold value.

【0073】また前記選択手段は、絶対値が第1しきい
値以上のAC係数を選択する第1選択部と、第1選択手
段によって選択されたAC係数の個数が所定個に満たな
い場合には、第1しきい値未満であってより低周波のA
C係数から順に所定個になるまでAC係数を選択する第
2選択部とを備える。この構成によれば埋め込み装置
は、絶対値が大きいAC係数を低周波のAC係数よりも
優先させて選択することによって置換えを行った場合の
画質の劣化を少なくしている。これは絶対値が大きいA
C係数の方が低周波のAC係数よりも、最下位ビットを
置き換えた場合の画質の劣化が少ないからである。
Further, the selecting means includes a first selecting section for selecting an AC coefficient whose absolute value is equal to or greater than a first threshold value, and a selecting means for determining whether the number of AC coefficients selected by the first selecting means is less than a predetermined number. Is less than the first threshold and the lower frequency A
A second selection unit for selecting AC coefficients in order from the C coefficient until a predetermined number is reached. According to this configuration, the embedding apparatus reduces deterioration of image quality when replacement is performed by selecting an AC coefficient having a large absolute value with priority over an AC coefficient of a low frequency. This is A with a large absolute value
This is because the C coefficient causes less deterioration in image quality when the least significant bit is replaced than the low-frequency AC coefficient.

【0074】絶対値がしきい値未満の低周波のAC係数
は、逆量子化レベルが小さいという1つの要因によって
最下位ビットを変化させた場合の誤差を小さくしてい
る。一方、絶対値がしきい値以上のAC係数は、比較的
低周波側に分布するので、逆量子化レベルが小さい。こ
れに加えて絶対値がしきい値以上のAC係数は、絶対値
がしきい値より小さいAC係数に比べて最下位ビットが
変化した場合の変化率が小さい。このように絶対値がし
きい値以上のAC係数は逆量子化レベルが小さいことと
最下位ビットが変化した場合の変化率が小さいこととの
2つの要因から誤差を小さくしている。このことから埋
め込み装置は、絶対値が大きいAC係数を低周波のAC
係数より優先的に選択することによって、より画質の劣
化を低減している。
The low-frequency AC coefficient whose absolute value is less than the threshold value reduces an error when the least significant bit is changed due to one factor that the inverse quantization level is small. On the other hand, AC coefficients whose absolute values are equal to or larger than the threshold value are distributed on a relatively low frequency side, and thus have a low inverse quantization level. In addition, the AC coefficient whose absolute value is equal to or larger than the threshold has a smaller change rate when the least significant bit changes than the AC coefficient whose absolute value is smaller than the threshold. As described above, the error of the AC coefficient whose absolute value is equal to or larger than the threshold value is reduced due to two factors, that is, the inverse quantization level is small and the rate of change when the least significant bit changes is small. For this reason, the embedding apparatus converts the AC coefficient having a large absolute value into a low-frequency AC coefficient.
By selecting the coefficient with priority, the deterioration of the image quality is further reduced.

【0075】前記選択手段は、さらに、絶対値が第1し
きい値より大きい第2しきい値以上のAC係数を選択す
る第3選択部を備え、前記置換え手段は、さらに前記第
3選択部により選択されたAC係数の最下位から2ビッ
ト目に音声データを埋め込むよう構成される。この構成
によれば埋め込み装置は、最下位ビットに音声データを
埋め込むのに加えて、最下位から2ビット目にも音声デ
ータを埋め込むので、より多くの音声データを埋め込む
ことができるという効果がある。また絶対値が第2しき
い値以上のAC係数、つまり最下位から2ビット目が変
化した場合の変化率の小さいAC係数を埋め込み用とし
て選択するので、本埋め込み装置は、画像の劣化が少な
く、より多くの音声データを埋め込むことができる。
The selecting means further includes a third selecting section for selecting an AC coefficient whose absolute value is equal to or greater than a second threshold value and equal to or greater than a second threshold value, and the replacing means further includes a third selecting section. The audio data is embedded in the second least significant bit of the selected AC coefficient. According to this configuration, the embedding device embeds audio data in the second least significant bit in addition to embedding audio data in the least significant bit, so that there is an effect that more audio data can be embedded. . Further, since the AC coefficient whose absolute value is equal to or larger than the second threshold value, that is, the AC coefficient having a small change rate when the second bit changes from the least significant bit is selected for embedding, the embedding apparatus has less image deterioration. , More voice data can be embedded.

【0076】本発明のデジタルカメラは、圧縮画像に数
秒間の音声データに相当する圧縮音声データを埋め込む
デジタルカメラであって、圧縮画像から離散コサイン変
換と量子化とが施された量子化DCT係数ブロックを得
る獲得手段と、前記圧縮音声データを分割して所定ビッ
トの部分圧縮音声データにする分割手段と、獲得される
量子化DCT係数ブロック中、低周波のAC係数と絶対
値が第1しきい値以上のAC係数とから前記所定個のA
C係数を選択する選択手段と、前記選択手段により選択
された前記所定個のAC係数の最下位ビットを前記部分
圧縮音声データに置き換える置換え手段とを備える。
A digital camera according to the present invention is a digital camera in which compressed audio data corresponding to audio data for several seconds is embedded in a compressed image, wherein a quantized DCT coefficient obtained by performing discrete cosine transform and quantization from the compressed image. Acquiring means for obtaining a block, dividing means for dividing the compressed audio data into partial compressed audio data of a predetermined bit, and a low-frequency AC coefficient and an absolute value which are first in a quantized DCT coefficient block to be obtained. From the AC coefficient not less than the threshold value,
There is provided a selecting means for selecting a C coefficient, and a replacing means for replacing a least significant bit of the predetermined number of AC coefficients selected by the selecting means with the partial compressed audio data.

【0077】この構成によればデジタルカメラは、画像
の劣化が少なくて済む所定個のAC係数に所定ビットの
部分圧縮音声データを埋め込むという操作を各量子化D
CT係数ブロックに対して行うので、全体として所定ビ
ット×総ブロック数という多くの音声データを画像の劣
化少なく埋め込むことができる。
According to this configuration, the digital camera performs the operation of embedding the partially compressed audio data of a predetermined bit in a predetermined number of AC coefficients that requires little image degradation.
Since the processing is performed on the CT coefficient block, a large amount of audio data of predetermined bits × total number of blocks as a whole can be embedded with little deterioration of the image.

【図面の簡単な説明】[Brief description of the drawings]

【図1】デジタルカメラ1の正面側の外観図である。FIG. 1 is an external view of a front side of a digital camera 1. FIG.

【図2】デジタルカメラ1の背面側の外観図である。FIG. 2 is an external view of the back side of the digital camera 1. FIG.

【図3】デジタルカメラ1の概略構成図である。FIG. 3 is a schematic configuration diagram of the digital camera 1.

【図4】図3の詳細構成図である。FIG. 4 is a detailed configuration diagram of FIG. 3;

【図5】符号化部34のより詳細な構成図である。FIG. 5 is a more detailed configuration diagram of an encoding unit 34.

【図6】復号化部62のより詳細な構成図である。FIG. 6 is a more detailed configuration diagram of a decoding unit 62.

【図7】1画面分の輝度成分Yとブロックとの関係を示
す。
FIG. 7 shows a relationship between a luminance component Y for one screen and blocks.

【図8】(a)輝度成分Yの1ブロック分の画素の具体
例Yxy(x,y=0〜7;x,yはブロック中の画素位置を表
わす)を示す。 (b)Yxyに対してDCTを行うことにより得られるD
CT係数ブロックSuvを示す。 (c)量子化テーブルQuvの具体例を示す。 (d)図8(b)に示したDCT係数ブロックSuvを図
8(c)の量子化テーブルQuvで量子化した場合の量子
化DCT係数ブロックRuvを示す。
FIG. 8A shows a specific example Yxy (x, y = 0 to 7; x, y represents a pixel position in a block) of a pixel of one block of a luminance component Y. (B) D obtained by performing DCT on Yxy
4 shows a CT coefficient block Suv. (C) A specific example of the quantization table Quv is shown. (D) shows a quantized DCT coefficient block Ruv when the DCT coefficient block Suv shown in FIG. 8B is quantized by the quantization table Quv in FIG. 8C.

【図9】埋め込み部37の詳細な構成図である。9 is a detailed configuration diagram of an embedding unit 37. FIG.

【図10】選択部106による、選択処理を示すフロー
チャートである。
FIG. 10 is a flowchart showing a selection process by a selection unit 106;

【図11】(a)図8(d)の量子化DCT係数ブロッ
クRuvの中から埋め込み用として選択される量子化DC
T係数を丸印で囲って示す。 (b)選択部106が同図(a)について選択処理を行
った場合の選択結果の埋め込みフラグEuvを示す。
FIG. 11A shows a quantized DC selected for embedding from the quantized DCT coefficient block Ruv in FIG. 8D.
The T coefficient is indicated by a circle. (B) shows the embedding flag Euv of the selection result when the selection unit 106 performs the selection process on FIG.

【図12】(a)選択部106が図8(d)とは別の量
子化DCT係数ブロックの中から埋め込み用として選択
される量子化DCT係数を丸印で囲って示す。 (b)(a)に対応する埋め込みフラグを示す。 (c)選択部106の選択処理による最終的な選択結果
の埋め込みフラグを示す。
FIG. 12A shows a quantized DCT coefficient selected for embedding from a quantized DCT coefficient block different from that shown in FIG. (B) Indicates an embedding flag corresponding to (a). (C) shows an embedded flag of a final selection result by the selection processing of the selection unit 106.

【図13】(a)部分圧縮音声データの一例を示す。 (b)埋め込み処理部107が同図(a)の部分圧縮音
声データを図12(a)の量子化DCT係数ブロックに
埋め込んだ場合の結果を示す。
FIG. 13A shows an example of partially compressed audio data. FIG. 12B shows a result when the embedding processing unit 107 embeds the partially compressed audio data in FIG. 12A into the quantized DCT coefficient block in FIG.

【図14】抽出部83の詳細な構成図である。FIG. 14 is a detailed configuration diagram of an extraction unit 83.

【図15】埋め込み部47の詳細構成図である。15 is a detailed configuration diagram of an embedding section 47. FIG.

【図16】選択部206が埋め込みを行う量子化DCT
係数の数と埋め込みを行うビット位置とを決定するため
の論理を表わすフローチャートである。
FIG. 16 shows a quantized DCT in which a selection unit 206 embeds data.
9 is a flowchart illustrating logic for determining the number of coefficients and the bit position to be embedded.

【図17】この決定結果に従ってセットされた埋め込み
フラグE2uvを示す。
FIG. 17 shows an embedding flag E2uv set according to the result of this determination.

【符号の説明】[Explanation of symbols]

3 画像符号化部 35 符号用メモリ 36 メモリカード入出力部 4 音声符号化部 37 埋め込み部 5 音声復号化部 6 画像復号化部 83 抽出部 31 撮像部 33 撮影画像メモリ 34 符号化部 71 DCT部 72 量子化部 74 エントロピー符号化部 84 エントロピー復号化部 82 逆量子化部 81 逆DCT部 101 圧縮画像入力部 102 判定値入力部 103 埋め込み量入力部 104 圧縮音声入力部 105 エントロピー復号化部 106 選択部 107 埋め込み処理部 108 出力部 831 識別部 832 抽出処理部 Reference Signs List 3 image encoding unit 35 encoding memory 36 memory card input / output unit 4 audio encoding unit 37 embedding unit 5 audio decoding unit 6 image decoding unit 83 extraction unit 31 imaging unit 33 photographed image memory 34 encoding unit 71 DCT unit 72 quantization unit 74 entropy coding unit 84 entropy decoding unit 82 inverse quantization unit 81 inverse DCT unit 101 compressed image input unit 102 decision value input unit 103 embedding amount input unit 104 compressed audio input unit 105 entropy decoding unit 106 selection Unit 107 embedding processing unit 108 output unit 831 identification unit 832 extraction processing unit

───────────────────────────────────────────────────── フロントページの続き (51)Int.Cl.7 識別記号 FI テーマコート゛(参考) H04N 7/30 H04N 7/133 Z Fターム(参考) 5C022 AA13 AB00 AC01 AC32 AC42 AC71 AC72 5C053 FA07 GB07 GB11 GB22 GB34 GB36 HA33 JA03 JA07 JA12 KA04 KA05 LA01 LA06 5C059 KK02 KK08 LA01 MA00 MA23 MC04 MC14 MC23 MC26 MC32 MC34 PP01 RB06 RC32 RC38 SS15 TA36 TB07 TC04 TC06 TD12 UA02 UA05 UA38 5J064 AA01 BA16 BB11 BC25 BD03──────────────────────────────────────────────────続 き Continued on the front page (51) Int.Cl. 7 Identification symbol FI Theme coat ゛ (Reference) H04N 7/30 H04N 7/133 Z F-term (Reference) 5C022 AA13 AB00 AC01 AC32 AC42 AC71 AC72 5C053 FA07 GB07 GB11 GB22 GB34 GB36 HA33 JA03 JA07 JA12 KA04 KA05 LA01 LA06 5C059 KK02 KK08 LA01 MA00 MA23 MC04 MC14 MC23 MC26 MC32 MC34 PP01 RB06 RC32 RC38 SS15 TA36 TB07 TC04 TC06 TD12 UA02 UA05 UA38 5J064 AA01 BA16 BB11 BC25 BD03

Claims (8)

【特許請求の範囲】[Claims] 【請求項1】 画像に離散コサイン変換(DCT)と量
子化とを施すことにより生成される量子化DCT係数ブ
ロック中、低周波のAC係数と絶対値が第1しきい値以
上のAC係数とから所定個のAC係数を選択する選択手
段と、 前記選択手段により選択された所定個のAC係数の最下
位ビットを音声データに置き換える置換え手段とを備え
ることを特徴とする埋め込み装置。
1. A low-frequency AC coefficient and an AC coefficient whose absolute value is equal to or greater than a first threshold value in a quantized DCT coefficient block generated by performing discrete cosine transform (DCT) and quantization on an image. An embedding apparatus, comprising: a selection unit that selects a predetermined number of AC coefficients from a plurality of AC coefficients; and a replacement unit that replaces least significant bits of the predetermined number of AC coefficients selected by the selection unit with audio data.
【請求項2】 前記選択手段は、 絶対値が第1しきい値以上のAC係数を選択する第1選
択部と、 第1選択手段によって選択されたAC係数の個数が所定
個に満たない場合には、第1しきい値未満であってより
低周波のAC係数から順に所定個になるまでAC係数を
選択する第2選択部とを備えることを特徴とする請求項
1記載の埋め込み装置。
2. The method according to claim 1, wherein the selecting unit selects an AC coefficient whose absolute value is equal to or greater than a first threshold value, and the number of AC coefficients selected by the first selecting unit is less than a predetermined number. 2. The embedding apparatus according to claim 1, further comprising: a second selection unit that selects AC coefficients that are less than the first threshold value and that has a predetermined number in order from lower frequency AC coefficients.
【請求項3】 選択手段は、さらに、 絶対値が第1しきい値より大きい第2しきい値以上のA
C係数を選択する第3選択部を備え、 前記置換え手段は、さらに前記第3選択部により選択さ
れたAC係数の最下位から2ビット目に音声データを埋
め込むことを特徴とする請求項2記載の埋め込み装置。
3. The method according to claim 1, wherein said selecting means further comprises a signal having an absolute value equal to or greater than a second threshold value larger than said first threshold value.
3. The method according to claim 2, further comprising a third selection unit that selects a C coefficient, wherein the replacement unit embeds audio data in the second least significant bit of the AC coefficient selected by the third selection unit. Embedded device.
【請求項4】 画像に離散コサイン変換(DCT)と量
子化とを施すことにより生成される量子化DCT係数ブ
ロック中、低周波のAC係数と絶対値が第1しきい値以
上のAC係数とから所定個のAC係数を選択する選択ス
テップと、 前記選択ステップにより選択された所定個のAC係数の
最下位ビットを音声データに置き換える置換えステップ
とを備えることを特徴とする埋め込み方法。
4. A quantized DCT coefficient block generated by performing discrete cosine transform (DCT) and quantization on an image, wherein a low-frequency AC coefficient and an AC coefficient whose absolute value is equal to or greater than a first threshold value are included. An embedding method comprising: a selection step of selecting a predetermined number of AC coefficients from the above; and a replacement step of replacing the least significant bit of the predetermined number of AC coefficients selected by the selection step with audio data.
【請求項5】 前記選択ステップは、 絶対値が第1しきい値以上のAC係数を選択する第1選
択ステップと、 第1選択手段によって選択されたAC係数の個数が所定
個に満たない場合には、第1しきい値未満であってより
低周波のAC係数から順に所定個になるまでAC係数を
選択する第2選択ステップとを備えることを特徴とする
請求項4記載の埋め込み方法。
5. The method according to claim 1, wherein the selecting includes selecting an AC coefficient whose absolute value is equal to or greater than a first threshold value, and when the number of AC coefficients selected by the first selecting unit is less than a predetermined number. 5. The embedding method according to claim 4, further comprising the step of: selecting a plurality of AC coefficients from a lower frequency AC coefficient until the number of AC coefficients becomes smaller than a first threshold value.
【請求項6】 圧縮画像に数秒間の音声データに相当す
る圧縮音声データを埋め込むデジタルカメラであって、 圧縮画像から離散コサイン変換と量子化とが施された量
子化DCT係数ブロックを得る獲得手段と、 前記圧縮音声データを分割して所定ビットの部分圧縮音
声データにする分割手段と、 獲得される量子化DCT係数ブロック中、低周波のAC
係数と絶対値が第1しきい値以上のAC係数とから前記
所定個のAC係数を選択する選択手段と、 前記選択手段により選択された前記所定個のAC係数の
最下位ビットを前記部分圧縮音声データに置き換える置
換え手段とを備えることを特徴とするデジタルカメラ。
6. A digital camera that embeds compressed audio data corresponding to audio data for several seconds in a compressed image, wherein the acquisition unit obtains a quantized DCT coefficient block subjected to discrete cosine transform and quantization from the compressed image. Dividing means for dividing the compressed audio data into partial-compressed audio data of a predetermined bit;
Selecting means for selecting the predetermined number of AC coefficients from a coefficient and an AC coefficient whose absolute value is equal to or greater than a first threshold value; and compressing least significant bits of the predetermined number of AC coefficients selected by the selecting means. A digital camera, comprising: replacement means for replacing with audio data.
【請求項7】 画像に音声データを埋め込ませる処理を
コンピュータに実行させるためのプログラムを記録した
コンピュータ読み取り可能な記録媒体であって、当該プ
ログラムはコンピュータに、 画像に離散コサイン変換(DCT)と量子化とを施すこ
とにより生成される量子化DCT係数ブロック中、低周
波のAC係数と絶対値が第1しきい値以上のAC係数と
から所定個のAC係数を選択する選択ステップと、 前記選択ステップにより選択された所定個のAC係数の
最下位ビットを音声データに置き換える置換えステップ
とを実行させることを特徴とするプログラムを記録した
記録媒体。
7. A computer-readable recording medium in which a program for causing a computer to execute a process of embedding audio data in an image is recorded. The program stores the program in a computer by means of discrete cosine transform (DCT) and quantum Selecting a predetermined number of AC coefficients from a low-frequency AC coefficient and an AC coefficient whose absolute value is equal to or greater than a first threshold value in a quantized DCT coefficient block generated by performing Replacing the least significant bit of the predetermined number of AC coefficients selected by the step with audio data.
【請求項8】 前記選択ステップは、 絶対値が第1しきい値以上のAC係数を選択する第1選
択ステップと、 第1選択手段によって選択されたAC係数の個数が所定
個に満たない場合には、第1しきい値未満であってより
低周波のAC係数から順に所定個になるまでAC係数を
選択する第2選択ステップとからなることを特徴とする
プログラムを記載した請求項7記載の記録媒体。
8. The method according to claim 1, wherein the selecting includes selecting an AC coefficient whose absolute value is greater than or equal to a first threshold value, and when the number of AC coefficients selected by the first selecting unit is less than a predetermined number. 8. The program according to claim 7, wherein the program further comprises: a second selection step of selecting an AC coefficient from a lower frequency AC coefficient until the number of AC coefficients becomes smaller than a predetermined number. Recording medium.
JP23389799A 1999-08-20 1999-08-20 Embedding device, digital camera and recording medium Expired - Fee Related JP3398343B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP23389799A JP3398343B2 (en) 1999-08-20 1999-08-20 Embedding device, digital camera and recording medium

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP23389799A JP3398343B2 (en) 1999-08-20 1999-08-20 Embedding device, digital camera and recording medium

Publications (2)

Publication Number Publication Date
JP2001060875A true JP2001060875A (en) 2001-03-06
JP3398343B2 JP3398343B2 (en) 2003-04-21

Family

ID=16962297

Family Applications (1)

Application Number Title Priority Date Filing Date
JP23389799A Expired - Fee Related JP3398343B2 (en) 1999-08-20 1999-08-20 Embedding device, digital camera and recording medium

Country Status (1)

Country Link
JP (1) JP3398343B2 (en)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2003189088A (en) * 2001-09-27 2003-07-04 Canon Inc Information processing apparatus and method therefor, information processing program and storage medium
JP2007515126A (en) * 2003-12-19 2007-06-07 クリエイティブ テクノロジー リミテッド Method and system for processing digital images
JP2010288070A (en) * 2009-06-11 2010-12-24 Hitachi Kokusai Electric Inc Image coding apparatus
JP2017536740A (en) * 2014-10-10 2017-12-07 アドバンスト・マイクロ・ディバイシズ・インコーポレイテッドAdvanced Micro Devices Incorporated Hybrid block-based compression

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2003189088A (en) * 2001-09-27 2003-07-04 Canon Inc Information processing apparatus and method therefor, information processing program and storage medium
US7548633B2 (en) 2001-09-27 2009-06-16 Canon Kabushiki Kaisha Data processing apparatus and method, data processing program, and storage medium
JP2007515126A (en) * 2003-12-19 2007-06-07 クリエイティブ テクノロジー リミテッド Method and system for processing digital images
JP2010288070A (en) * 2009-06-11 2010-12-24 Hitachi Kokusai Electric Inc Image coding apparatus
JP2017536740A (en) * 2014-10-10 2017-12-07 アドバンスト・マイクロ・ディバイシズ・インコーポレイテッドAdvanced Micro Devices Incorporated Hybrid block-based compression

Also Published As

Publication number Publication date
JP3398343B2 (en) 2003-04-21

Similar Documents

Publication Publication Date Title
US6192138B1 (en) Apparatus and method for embedding/unembedding supplemental information
KR101089489B1 (en) Method for processing a digital image and image representation format
JP4682102B2 (en) Image coding apparatus and image coding method
JP4979655B2 (en) Image coding apparatus and control method thereof
US9167198B2 (en) Image processing apparatus and image processing method
EP1005230A2 (en) Coding apparatus and method, decoding apparatus and method, data processing system, and storage medium
JPWO2005029863A1 (en) Image processing display device and image processing display method
JP4288398B2 (en) Image recording apparatus, image reproducing apparatus, and recording medium recording image processing program
JP3398343B2 (en) Embedding device, digital camera and recording medium
JPH08205144A (en) Image encoding device
JPH09205647A (en) Image coder, image decoder and image processor
JP3260284B2 (en) Image compression device and image decompression device
KR100530745B1 (en) Method of displaying a high-resolution digital image on a low-resolution display
JP3234583B2 (en) IMAGE RECORDING APPARATUS, METHOD THEREOF, MEDIUM RECORDING THE PROGRAM AND IMAGE REPRODUCING APPARATUS, METHOD THEREOF, AND MEDIUM RECORDING THE PROGRAM
JP3954032B2 (en) Image coding apparatus, image coding method, image coding program, and computer-readable recording medium on which image coding program is recorded
JP4143535B2 (en) Image data processing apparatus, image data processing method, image data distribution apparatus, and image data transmission system
JP3356712B2 (en) Image encoding device, image decoding device, image encoding method, and image decoding method
JPH05167973A (en) Still picture file system
JP3504545B2 (en) Audio data embedding device
JP2001358983A (en) Image input device, image recording method, and computer-readable recording medium for storing program to perform the method
JP2001326939A (en) Image coding device, image decoding device, its method and storage medium
JPH08195928A (en) Data compressing and editing system
JPH11205793A (en) Image compression device, image decompression device and digital still camera
JPH01218187A (en) Compression and recording device and expansion and regenerating device for image signal
JPH1141503A (en) Device and method for photographing image

Legal Events

Date Code Title Description
FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080214

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090214

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100214

Year of fee payment: 7

LAPS Cancellation because of no payment of annual fees