JP3398343B2

JP3398343B2 - 埋め込み装置、デジタルカメラ及び記録媒体

Info

Publication number: JP3398343B2
Application number: JP23389799A
Authority: JP
Inventors: 博松青木; 政夫平本
Original assignee: Panasonic Corp; Matsushita Electric Industrial Co Ltd
Current assignee: Panasonic Corp; Panasonic Holdings Corp
Priority date: 1999-08-20
Filing date: 1999-08-20
Publication date: 2003-04-21
Anticipated expiration: 2019-08-20
Also published as: JP2001060875A

Description

【発明の詳細な説明】

【０００１】

【発明の属する技術分野】本発明は、画像に音声データ
を埋め込む埋め込み装置及び圧縮画像に圧縮音声データ
を埋め込む埋め込み装置を備えたデジタルカメラに関す
る。

【０００２】

【従来の技術】従来より、デジタルカメラ等により撮影
された画像に音声データを付け加えたいという要望があ
った。この要望に応えるものとしてFlashPixという、画
像と音声データとを１つのファイルとして扱うファイル
形式がある。ただしこのFlashPixは、付け加える音声デ
ータのデータ量が多ければ多いほど全体のデータ量は多
くなるという問題がある。データ量が多ければ、保管や
伝送効率が悪くなる。

【０００３】そこで全体のデータ量を増やさない手段と
して埋め込み装置の利用が考えられる。埋め込み装置
は、画像の一部分を別情報に置き換えることによって埋
め込みを行うので、別情報が埋め込まれた画像のデータ
量は、埋め込まれる前のデータ量と変わらない。

【０００４】

【発明が解決しようとする課題】しかし従来の埋め込み
装置は、別情報として、署名やマーク等のデータ量が少
ないものを埋め込み対象としており、音声データのよう
に多量のものを埋め込み対象とすることは考慮されてい
ない。上記の点に鑑み本発明は、画質の劣化が少なく、
できるだけ多くのデータを埋め込むことのできる埋め込
み装置の提供を目的とする。

【０００５】また本発明は、撮影された画像に数秒程度
の音声データを画像の劣化が少なく埋めこむことのでき
るデジタルカメラの提供を目的とする。

【０００６】

【課題を解決するための手段】上記問題を解決するた
め、本発明の埋め込み装置は、画像に離散コサイン変換
（ＤＣＴ：Discrete Cosine Transform）と量子化とを
施すことにより生成される量子化ＤＣＴ係数ブロック
中、低周波のＡＣ係数と絶対値が第１しきい値以上のＡ
Ｃ係数とから所定個のＡＣ係数を選択する選択手段と、
前記選択手段により選択された所定個のＡＣ係数の最下
位ビットを音声データに置き換える置換え手段とを備え
る。

【０００７】また前記選択手段は、絶対値が第１しきい
値以上のＡＣ係数を選択する第１選択部と、前記第１選
択部によって選択されたＡＣ係数の個数が所定個に満た
ない場合には、第１しきい値未満であってより低周波の
ＡＣ係数から順に所定個になるまでＡＣ係数を選択する
第２選択部とを備える。前記埋め込み装置は、さらに、
量子化ＤＣＴ係数ブロック中、絶対値が第１しきい値よ
り大きい第２しきい値以上のＡＣ係数を選択する追加選
択手段と、前記追加選択手段により選択されたＡＣ係数
の最下位から２ビット目を音声データに置き換える追加
置換え手段とを備える。

【０００８】本発明の埋め込み方法は、画像に離散コサ
イン変換（ＤＣＴ）と量子化とを施すことにより生成さ
れる量子化ＤＣＴ係数ブロック中、低周波のＡＣ係数と
絶対値が第１しきい値以上のＡＣ係数とから所定個のＡ
Ｃ係数を選択する選択ステップと、前記選択ステップに
より選択された所定個のＡＣ係数の最下位ビットを音声
データに置き換える置換えステップとを備える。

【０００９】前記選択ステップは、絶対値が第１しきい
値以上のＡＣ係数を選択する第１選択ステップと、前記
第１選択ステップによって選択されたＡＣ係数の個数が
所定個に満たない場合には、第１しきい値未満であって
より低周波のＡＣ係数から順に所定個になるまでＡＣ係
数を選択する第２選択ステップとを備える。本発明のデ
ジタルカメラは、圧縮画像に数秒間の音声データに相当
する圧縮音声データを埋め込むデジタルカメラであっ
て、圧縮画像から離散コサイン変換と量子化とが施され
た量子化ＤＣＴ係数ブロックを得る獲得手段と、前記圧
縮音声データを分割して所定ビットの部分圧縮音声デー
タにする分割手段と、獲得される量子化ＤＣＴ係数ブロ
ック中、低周波のＡＣ係数と絶対値が第１しきい値以上
のＡＣ係数とから前記所定個のＡＣ係数を選択する選択
手段と、前記選択手段により選択された前記所定個のＡ
Ｃ係数の最下位ビットを前記部分圧縮音声データに置き
換える置換え手段とを備える。

【００１０】また本発明の記録媒体は、画像に音声デー
タを埋め込ませる処理をコンピュータに実行させるため
のプログラムを記録したコンピュータ読み取り可能な記
録媒体であって、当該プログラムはコンピュータに、画
像に離散コサイン変換（ＤＣＴ）と量子化とを施すこと
により生成される量子化ＤＣＴ係数ブロック中、低周波
のＡＣ係数と絶対値が第１しきい値以上のＡＣ係数とか
ら所定個のＡＣ係数を選択する選択ステップと、前記選
択ステップにより選択された所定個のＡＣ係数の最下位
ビットを音声データに置き換える置換えステップとを実
行させることを特徴とする。

【００１１】また前記選択ステップは、絶対値が第１し
きい値以上のＡＣ係数を選択する第１選択ステップと、
前記第１選択ステップによって選択されたＡＣ係数の個
数が所定個に満たない場合には、第１しきい値未満であ
ってより低周波のＡＣ係数から順に所定個になるまでＡ
Ｃ係数を選択する第２選択ステップとからなる。

【００１２】

【発明の実施の形態】（実施形態１）以下、本発明の埋
め込み装置の一実施形態であるデジタルカメラ１につい
て図面を用いて説明する。本実施形態において埋め込み
装置はデジタルカメラ１内部に埋め込み部として備えら
れる。（デジタルカメラ１の外観構成）図１及び図２は、デジ
タルカメラ１の正面側及び背面側の外観図である。

【００１３】同図に示すようにデジタルカメラ１は、正
面に音声データ再生用のスピーカ１１、音声データ録音
用のマイク１２、レンズ１８を備え、背面に画像表示部
１３、画像及び音声データ再生指示用の再生ボタン２１
ａ、２１ｂ、音声データ録音指示用の録音ボタン２２、
ファインダー１７を備え、上面にシャッターボタン１
４、シャッター速度や絞り値などを表示する状態表示部
１５を備え、側面にはフラッシュメモリの一種であるメ
モリカード２０が挿入されるメモリカード挿入口１９を
備える。

【００１４】デジタルカメラ１の操作例を以下に簡単に
説明しておく。利用者がファインダー１７又は画像表示
部１３により撮像範囲を定めてシャッターボタン１４を
押下すると、レンズ１８を通して撮影された画像が内部
で符号化されて圧縮画像となり、メモリカード２０に記
憶される。このメモリカード２０は、圧縮画像を数十枚
記憶することができる。

【００１５】また利用者が録音ボタン２２を押下する
と、その時点からマイク１２より所定時間（本実施形態
においては約１０秒間）の音声データが集音され符号化
されて圧縮音声データとなる。圧縮音声データは、メモ
リカード２０に記憶されている圧縮画像のうち利用者に
選択された圧縮画像に埋め込まれる。以下、圧縮音声デ
ータが埋め込まれた圧縮画像を音声付き圧縮画像、埋め
込まれていない圧縮画像を音声なし圧縮画像と区別して
呼び、音声データ付きか音声データなしかを特に区別し
ない場合には単に圧縮画像と呼ぶこととする。

【００１６】また利用者が再生ボタン２１a、２１bを押
下する度に、メモリカード２０に記憶されている圧縮画
像が一枚ずつ復号されて、その画像が画像表示部１３に
表示される。音声付き圧縮画像が復号された場合には、
その復号された画像の表示と同時に圧縮音声データが
抽出、復号されてスピーカ１１より再生される。（デジタルカメラ１の概略構成）図３は、デジタルカメ
ラ１の概略構成図である。

【００１７】同図に示すようにデジタルカメラ１は、画
像符号化部３、符号用メモリ３５、メモリカード入出力
部３６、音声符号化部４、埋め込み部３７、音声復号化
部５、画像復号化部６、抽出部８３から構成される。画
像符号化部３は、シャッターボタン１４が押下されたと
き、レンズ１８を介して撮像される画像をＪＰＥＧ方式
により符号化して音声なし圧縮画像を生成し、符号用メ
モリ３５に出力する。

【００１８】符号用メモリ３５は、画像符号化部３、メ
モリカード入出力部３６、埋め込み部３７、画像復号化
部６の間で入出力される圧縮画像を一時的に記憶する。
メモリカード入出力部３６は、符号用メモリ３５に記憶
されている圧縮画像をメモリカード２０へ書きこみ、ま
たメモリカード２０に記憶される圧縮画像を符号用メモ
リ３５に読み出す。

【００１９】音声符号化部４は、録音ボタン２２が押下
されたとき、マイク１２を介して約１０秒間の外部の音
声データを集音し、ＩＭＡ(Interactive Multimedia As
sociation)方式のＡＤＰＣＭ(Adaptive Differential P
CM)により符号化し、その結果の圧縮音声データを音声
符号化部４内部のメモリ（後述のオーディオメモリ４
４）に記憶する。

【００２０】埋め込み部３７は、符号用メモリ３５に記
憶される音声なし圧縮画像に前記圧縮音声データを埋め
込んで音声付き圧縮画像を生成し、符号用メモリ３５に
戻す。埋め込み部３７は、本発明の主要な構成要素であ
るので後に詳細に説明する。画像復号化部６は、画像符
号化部３による符号化とは逆の操作により符号用メモリ
３５に記憶される圧縮画像から画像を復号し、画像表示
部１３に表示する。

【００２１】抽出部８３は、埋め込み部３７による音声
データの埋め込みと逆の操作によって、音声付き圧縮画
像から圧縮音声データを抽出して音声復号化部５に出力
する。音声復号化部５は、音声符号化部４による符号化
とは逆の操作により、抽出部８３より出力された圧縮音
声データから音声データを復号し、スピーカー１１より
再生する。（画像符号化部３、音声符号化部４、音声復号化部５、
画像復号化部６の詳細構成）図４は、図３の詳細構成図
であり、図５、図６は、図４を部分的に示す詳細構成図
である。同図を用いて以下に画像符号化部３、音声符号
化部４、音声復号化部５、画像復号化部６について説明
する。（画像符号化部３の詳細構成）図４において画像符号化
部３は、撮像部３１、撮影画像メモリ３３、符号化部３
４より構成される。（撮像部３１）撮像部３１は、レンズ１８、ＣＣＤ（図
外）、色変換器（図外）などから構成され、シャッター
ボタン１４が押されたときに、レンズ１８、ＣＣＤを介
して得られるＲＧＢ信号を色変換器によりＹＣｒＣｂ成
分から成る画像に変換して撮影画像メモリ３３に書き込
む。

【００２２】１つの画像は、１２８０画素×９６０ライ
ン、合計１２２８８００画素からなる輝度成分Ｙと、６
４０画素×４８０ライン（又は水平方向のみを間引いた
６４０画素×９６０ライン）、合計３０７２００画素
（又は６１４４００画素）からなる色差成分Ｃｒ、Ｃｂ
とから構成される。（撮影画像メモリ３３）撮影画像メモリ３３は、撮像部
３１により書き込まれる画像を一時的に記憶する。（符号化部３４）符号化部３４は、撮影画像メモリ３３
に記憶されている画像を８画素×８ラインのブロック毎
にＪＰＥＧ方式により圧縮符号化して、それによって得
られる圧縮符号列を符号用メモリ３５に書きこむ。１画
面分の圧縮符号列が音声なし圧縮画像に相当する。

【００２３】図７は、１画面分の輝度成分Ｙとブロック
との関係を示す。輝度成分Ｙは、横１６０ブロック、縦
１２０ブロック、合計１９２００個のブロックから構成
され、各ブロックは、８画素×８ライン、合計６４個の
画素から構成される。例えば同図においてブロック１０
２は、１画面分の輝度成分Ｙに含まれる１つのブロック
である。１画面分の色差成分Ｃｒ、Ｃｂも同様に、それ
ぞれ横８０ブロック、縦６０ブロック、合計４８００個
（６４０画素×９６０ラインのものについては横８０ブ
ロック、縦１２０ブロック、合計９６００個）のブロッ
クから構成される。

【００２４】図８（ａ）は、輝度成分Ｙの１ブロック分
の画素の具体例Ｙxy（x,y＝０〜７；x,yはブロック中の
画素位置を表わす）を示す。なお、同図のＹxyは、元の
信号値から１２８を引いたものである。これは後の離散
コサイン変換（Discrete Cosine Transform、以下ＤＣ
Ｔと省略する）によって得られるＤＣＴ係数の期待値を
０にレベルシフトするためである。（符号化部３４の詳細構成）符号化部３４は、図５の構
成図に示すように、ＤＣＴ部７１、量子化部７２、エン
トロピー符号化部７４から構成される。（ＤＣＴ部７１）ＤＣＴ部７１は、撮影画像メモリ３３
から輝度成分Ｙ、色差成分Ｃｒ、Ｃｂをブロック毎に順
次読み出してＤＣＴを行い、８×８要素のＤＣＴ係数か
ら成るＤＣＴ係数ブロックＳuv（u,v＝０〜７）を生成
し、量子化部７２へ出力する。ここでＳuvは、直流成分
を表わすＳ00をＤＣ係数と呼び、Ｓ00以外の交流成分を
表わすＤＣＴ係数をＡＣ係数と呼ぶ。またＳuvは、u、v
の値が大きくなるほど高周波成分となる。

【００２５】図８（ｂ）は、Ｙxyに対してＤＣＴを行う
ことにより得られるＤＣＴ係数ブロックSuvを示す。同
図においてＳ00＝８２３がＤＣ係数であり、その他はＡ
Ｃ係数である。u、vが大きくなるほど、つまり高周波成
分になるほど値が小さくなっていることがわかる。なお
ＤＣＴの具体的な演算式は公知であるので説明を省略す
る。（量子化部７２）量子化部７２は、８×８要素の量子化
係数から成る量子化テーブルＱuv（u,v＝０〜７）を備
え、これを用いてＤＣＴ係数ブロックＳuvを量子化し、
８×８要素の量子化ＤＣＴ係数から成る量子化ＤＣＴ係
数ブロックＲuv（u,v＝０〜７）を生成し、エントロピ
ー符号化部７４へ出力する。

【００２６】量子化ＤＣＴ係数ブロックＲuvは以下のよ
うにして算出される。（式１）Ｒuv＝round（Ｓuv／Ｑuv）ここで、round（）は、（）内の値をもっとも近い整数
へ整数化することを意味する関数である。

【００２７】ＪＰＥＧ方式においては量子化係数の値は
規定されていない。よってアプリケーション毎や画像毎
に自由に値を設定することができる。一般的に、量子化
係数は、u、vの値が大きくなるほど大きな値が設定され
る。このように高周波成分ほど量子化係数の値を大きく
するのは、視覚的に劣化の目立ちにくい高周波成分を粗
く量子化すれば、画質を保護しつつ圧縮効率を良くする
ことができるからである。

【００２８】図８（ｃ）に量子化テーブルＱuvの具体例
を示す。図８（ｄ）は、図８（ｂ）に示したＤＣＴ係数
ブロックＳuvを図８（ｃ）の量子化テーブルＱuvで量子
化した場合の量子化ＤＣＴ係数ブロックＲuvを示す。こ
の例によればＲ10＝round（Ｓ10／Ｑ10）＝round（−１
３５/４）＝−３４である。（エントロピー符号化部７４）エントロピー符号化部７
４は、量子化部７１から受け取った量子化ＤＣＴ係数ブ
ロックＲuvをエントロピー符号化して圧縮符号列を生成
し、符号用メモリ３５へ書き込む。１画面分の圧縮符号
列が圧縮画像に相当する。エントロピー復号については
公知であるので説明を省略する。（音声符号化部４の詳細構成）音声符号化部４は、集音
部４１、オーディオ符号化部４３、オーディオメモリ４
４から構成される。（集音部４１）集音部４１は、マイク１２、増幅器（図
外）、ＡＤ変換回路（図外）、量子化回路（図外）など
から構成され、利用者により録音ボタン２２が押下され
たときから約１０秒間分の外部のアナログ音声データを
集音し、１１ｋＨｚのサンプリング、ＡＤ変換等を施し
てデジタル音声データに変換し、オーディオ符号化部４
３へ出力する。（オーディオ符号化部４３）オーディオ符号化部４３
は、ＩＭＡ方式のＡＤＰＣＭに基づいて前記デジタル音
声データを圧縮音声データに変換してオーディオメモリ
４４へ出力する。なお、ＩＭＡ方式のＡＤＰＣＭについ
ては公知であるので説明を省略する。（オーディオメモリ４４）オーディオメモリ４４は、オ
ーディオ符号化部４３により出力される圧縮音声データ
を記憶する。（音声復号化部５の詳細構成）音声復号化部５は、オー
ディオメモリ５４、オーディオ復号化部５３、音声再生
部５１から構成される。（オーディオメモリ５４）オーディオメモリ５４は、抽
出部８３により圧縮画像から抽出された圧縮音声データ
を一時的に記憶する。（オーディオ復号化部５３）オーディオ復号化部５３
は、ＩＭＡ方式のＡＤＰＣＭに基づいて、オーディオメ
モリ５４に記憶されている圧縮音声データからデジタル
音声データを復号し、音声再生部５１へ出力する。（音声再生部５１）音声再生部５１は、ＤＡ変換回路
（図外）、スピーカ１１などから構成され、オーディオ
復号化部５３により復号されたデジタル音声データをア
ナログ音声データに変換して再生する。（画像復号化部６の詳細構成）画像復号化部６は、復号
化部６２、表示用画像メモリ６１、画像表示部１３から
構成される。（復号化部６２）復号化部６２は、符号用メモリ３５に
記憶される音声なし圧縮画像又は音声付き圧縮画像を読
み出してJPEG方式による復号化を行い、結果の画像を表
示用画像メモリ６１に出力する。

【００２９】図６は、復号化部６２のより詳細な構成図
である。同図において復号化部６２は、エントロピー復
号化部８４、逆量子化部８２、逆ＤＣＴ部８１から構成
される。（エントロピー復号化部８４）エントロピー復号化部８
４は、符号用メモリ３５に記憶されている圧縮画像をエ
ントロピー復号することにより量子化ＤＣＴ係数ブロッ
クＲuv（又はＲ’uv）を生成して抽出部８３と逆量子化
部８２とに出力する。ここにおいて、圧縮音声データを
含まない量子化ＤＣＴ係数ブロックをＲuv、圧縮音声デ
ータを含む量子化ＤＣＴ係数ブロックをＲ’uvとして区
別する。（逆量子化部８２）逆量子化部８２は、量子化部７１と
同一の量子化テーブルＱuvを備え、Ｑuvと量子化ＤＣＴ
係数ブロックＲuv（又はＲ’uv）とから（式２）に示す
逆量子化によりＤＣＴ係数ブロックＳ’uvを生成して逆
ＤＣＴ部８１へ出力する。ここにおいて、量子化ＤＣＴ
係数ブロックＲuv又はＲ’uvより生成されたＤＣＴ係数
ブロックをＳ’uvとし、量子化前のＤＣＴ係数ブロック
をＳuvとして区別する。（式２）Ｓ'uv＝Ｒuv（又はＲ’uv）×Ｑuv （逆ＤＣＴ部８１）逆ＤＣＴ部８１は、逆ＤＣＴを施す
ことによりＤＣＴ係数ブロックＳ’uvから輝度成分Ｙ、
色差成分Ｃｒ、Ｃｂをブロック単位で復号して表示用画
像メモリ６１へ書き込む。逆ＤＣＴについては公知であ
るので説明を省略する。（表示用画像メモリ６１）表示用画像メモリ６１は、復
号化部６２により復号された輝度成分Ｙ、色差成分Ｃ
ｒ、Ｃｂからなる画像を一時的に記憶する。（画像表示部１３）画像表示部１３は、液晶ディスプレ
イなどから構成され、表示用画像メモリ６１に記憶され
ている画像を表示する。（埋め込み部３７の詳細構成）埋め込み部３７は、符号
用メモリ３５に記憶される音声なし圧縮画像を読み出し
てエントロピー復号し、量子化ＤＣＴ係数ブロックＲuv
に戻す。次に埋め込み部３７は、輝度成分Ｙの量子化Ｄ
ＣＴ係数ブロックＲuv毎に、６４個のうちＤＣ係数（Ｒ
00）を除く６３個の量子化ＤＣＴ係数（ＡＣ係数）の中
から所定数Ｎの量子化ＤＣＴ係数を埋め込み用として選
択する。本実施形態ではこの所定数Ｎを１６個としてい
る。さらに埋め込み部３７は、圧縮音声データをＮビッ
ト（すなわち１６ビット）ずつの部分圧縮音声データに
分割する。最後に埋め込み部３７は、各ブロックに各部
分圧縮音声データを対応させて、埋め込み用の１６個の
量子化ＤＣＴ係数の最下位ビットに部分圧縮音声データ
を１ビットずつ埋め込む。ここで量子化ＤＣＴ係数の最
下位ビットに部分圧縮音声データを１ビット埋め込むと
は、すなわち量子化ＤＣＴ係数の最下位ビットの値を部
分圧縮音声データの１ビットに置き換えることを意味す
る。

【００３０】最後に埋め込み部３７は、埋め込みの済ん
だ量子化ＤＣＴ係数ブロックＲ’uvを再びエントロピー
符号化して符号用メモリ３５に戻す。図９は、埋め込み
部３７の詳細な構成図である。同図において埋め込み部
３７は、圧縮画像入力部１０１、判定値入力部１０２、
埋め込み量入力部１０３、圧縮音声入力部１０４、エン
トロピー復号化部１０５、選択部１０６、埋め込み処理
部１０７、出力部１０８から構成される。

【００３１】圧縮画像入力部１０１は、符号用メモリに
記憶される圧縮符号列を読み出してエントロピー復号化
部１０５に出力する。判定値入力部１０２は、判定値J
を予め記憶する。判定値Jは、選択部１０６が量子化Ｄ
ＣＴ係数ブロックＲuvの中から埋め込み用の量子化ＤＣ
Ｔ係数を決定する際のしきい値となる。本実施形態にお
いて判定値Jは２とする。この判定値２以上の量子化Ｄ
ＣＴ係数が埋め込み用の候補となる。

【００３２】埋め込み量入力部１０３は、埋め込み量Ｎ
を予め記憶する。埋め込み量Ｎは、約１０秒分に相当す
る圧縮音声データのデータ量３８４００バイトを、輝度
成分の総ブロック数で割って、ビットに換算した値であ
り、本実施形態においてＮは３８４００バイト÷１９２
００ブロック＝１６ビットである。圧縮音声入力部１０
４は、オーディオメモリ４４に記憶される圧縮音声デー
タを、埋め込み量入力部１０３に記憶される埋め込み量
Ｎに分割して、埋め込み処理部１０７に出力する。

【００３３】エントロピー復号化部１０５は、圧縮画像
入力部１０１より出力される圧縮符号列をエントロピー
復号し、輝度成分の量子化ＤＣＴ係数ブロックＲuvを選
択部１０６に出力する。（選択部１０６）選択部１０６は、エントロピー復号化
部１０５より出力される量子化ＤＣＴ係数ブロックＲuv
毎に、ＤＣ係数（Ｒ00）を除く６３個の量子化ＤＣＴ係
数（ＡＣ係数）の中から合計Ｎ個（１６個）の量子化Ｄ
ＣＴ係数を埋め込み用として選択し、選択結果を埋め込
み処理部１０７に出力する。

【００３４】選択部１０６は、量子化ＤＣＴ係数ブロッ
クＲuvに対応する８×８個の埋め込みフラグＥuv（u,v
＝０〜７）を有し、選択された量子化ＤＣＴ係数に対応
する埋め込みフラグＥuvをセットすることにより前記選
択結果を記録する。より具体的には、埋め込みフラグＥ
uvは、初期設定では全てオフに設定されており、選択部
１０６は、埋め込み用として選択した量子化ＤＣＴ係数
に対応する選択フラグをオンに設定する。埋め込み用と
して選択されなかった量子化ＤＣＴ係数に対応する選択
フラグについてはオフのままである。

【００３５】選択部１０６は、後に画像が復号された場
合に、符号化前の元の画像と比べて視覚的な劣化が極力
少なくなるように埋め込み用の量子化ＤＣＴ係数を選択
する。そうするために本実施形態では選択部１０６は、
量子化ＤＣＴ係数の絶対値が判定値Ｊ以上のもの、
低周波のもの、の中からをより優先させながら、埋
め込み用の量子化ＤＣＴ係数を選択する。

【００３６】の条件を用いる理由は、絶対値が小さい
量子化ＤＣＴ係数は、絶対値の大きい量子化ＤＣＴ係数
に比べて、１ビットの値が変化したときの誤差が大き
い。したがって絶対値の大きい量子化ＤＣＴ係数に埋め
込みを行う方が劣化が少なくなるからである。の条件
を用いる理由は、図８（ｃ）の量子化テーブルＱuvを見
ればわかるように、高周波の量子化ＤＣＴ係数は、低周
波の量子化ＤＣＴ係数に比べて、より大きな値で逆量子
化される。このため高周波の量子化ＤＣＴ係数は、低周
波の量子化ＤＣＴ係数に埋め込みを行った場合と比べ
て、逆量子化した結果のＤＣＴ係数は、符号化時のＤＣ
Ｔ係数と比較して誤差が大きくなる。したがって高周波
よりも低周波の量子化ＤＣＴ係数の方が埋め込みを行っ
た場合の劣化が少なくなるからである。

【００３７】をより優先させる理由は、よりの
方が値が変化したときの劣化が少ないからである。図１
０は、選択部１０６による、選択処理を示すフローチャ
ートである。同図において選択部１０６は、量子化ＤＣ
Ｔ係数（ＡＣ係数）を１つ読み出して、その絶対値が判
定値Ｊ（＝２）以上であるか否かを判定する（ステップ
１１、１２）。この判定は、量子化ＤＣＴ係数の下位か
ら２番目以上のビット値に１があるか否かによって判定
すればよい。すなわち選択部１０６は、量子化ＤＣＴ係
数の絶対値の下位から２番目以上のビット値に、１が１
つでもあれば量子化ＤＣＴ係数の絶対値は２以上の値で
あり、１が１つもなければ量子化ＤＣＴ係数の絶対値
は、２より小さい値であると判定する。

【００３８】判定の結果、絶対値が判定値J以上の場合
には、対応する埋め込みフラグをセットし、変数Ｃに１
を足しこむ（ステップ１３、１４）。変数Ｃは、セット
された埋め込みフラグの数、つまり埋め込み用として選
択された量子化ＤＣＴ係数の数を示す。このように選択
部１０６は、量子化ＤＣＴ係数ブロックをジグザグ順に
走査しながら、６３個の量子化ＤＣＴ係数（ＡＣ係数）
についてステップ１１〜１４の処理を繰り返す。この処
理は、変数Ｃが埋め込み量Ｎ以上の場合、又は、６３個
の量子化ＤＣＴ係数（ＡＣ係数）全てについてステップ
１１〜１４の処理を行った場合に終了して、ステップ１
６に進む。

【００３９】ステップ１６において選択部１０６は、変
数Ｃが埋め込み量Ｎより小さいか否かを判定する。判定
の結果、変数Ｃが埋め込み量Ｎより小さい場合、埋め込
み用として選択された量子化ＤＣＴ係数の個数が、部分
圧縮音声データのデータ量に達していないということで
あるから、選択部１０６は、低周波側からジグザグスキ
ャン順に、埋め込みフラグがオフになっているものの中
から（埋め込み量Ｎ−変数Ｃ）個を埋め込み用と選択し
て埋め込みフラグをセットする（ステップ１７）。

【００４０】選択部１０６は、以上の手順によってＮ個
の埋め込み用の量子化ＤＣＴ係数を選択する。（選択処理例１）図１１（ａ）は、選択部１０６が図８
（ｄ）の量子化ＤＣＴ係数ブロックＲuvについて選択処
理を行った場合に埋め込み用として選択される量子化Ｄ
ＣＴ係数を丸印で囲って示している。

【００４１】選択部１０６は、量子化ＤＣＴ係数ブロッ
クＲuvをジグザグ順に走査しながら、各量子化ＤＣＴ係
数（ＡＣ係数）について判定値Ｊ以上であるか否かを判
定する。同図(a)の例では、選択部１０６は、−３４、
２６、−１９、３０、…の順に埋め込み用として選択し
ていき、最後に−２を選択した時点で選択した量子化Ｄ
ＣＴ係数の数が埋め込み量Ｎに達したので選択処理を終
了している。

【００４２】同図（ｂ）は、選択部１０６が同図（ａ）
について選択処理を行った場合の選択結果の埋め込みフ
ラグＥuvを示す。同図（ｂ）において１はフラグがセッ
トされていることを示し、その位置に対応する量子化Ｄ
ＣＴ係数が埋め込み用として選択されたことを示す。ま
た０はフラグがセットされていないことを示し、その位
置に対応する量子化ＤＣＴ係数は埋め込み用として選択
されていないことを示す。（選択処理例２）図１２（ａ）は、選択部１０６が図８
（ｄ）とは別の量子化ＤＣＴ係数ブロックについて図１
０のステップ１１〜１５を繰り返した結果、埋め込み用
として選択された量子化ＤＣＴ係数を丸印で囲って示
す。同図に示すように選択部１０６は、ジグザグスキャ
ン順に、１０、−１１、−１２、５、５、１２、…の順
に埋め込み用として選択していき、量子化ＤＣＴ係数ブ
ロックの最後まで走査している。

【００４３】図１２（ａ）に対応する埋め込みフラグを
同図（ｂ）に示す。同図（ｂ）に示すようにセットされ
ている埋め込みフラグの数は１３個であり、埋め込み量
Ｎ（＝１６）より少ない。そこで選択部１０６は、ステ
ップ１７の処理を行う。具体的には、同図（ｂ）の埋め
込みフラグをジグザグスキャン順に走査して、１６−３
＝３個のセットされていない埋め込みフラグをセットし
て、全体として１６個の埋め込みフラグをセットする。
同図（ｂ）において丸印で囲まれた埋め込みフラグが、
ステップ１７の処理により新たにセットされる。

【００４４】図１２（ｃ）は、選択部１０６の選択処理
による最終的な選択結果の埋め込みフラグを示す。（埋め込み処理部１０７）埋め込み処理部１０７は、量
子化ＤＣＴ係数ブロックＲuv毎に、選択部１０６によっ
て埋め込み用として選択された１６個の量子化ＤＣＴ係
数に部分圧縮音声データの埋め込みを行う。

【００４５】詳しくは、埋め込み処理部１０７は、選択
部１０６より出力される埋め込みフラグをジグザグスキ
ャン順に走査してセットされている埋め込みフラグを探
す。セットされている埋め込みフラグを見つけたら、埋
め込み処理部１０７は、その埋め込みフラグに対応する
量子化ＤＣＴ係数の最下位ビットを、圧縮音声入力部１
０４から入力される部分圧縮音声データの１ビットに変
更する。埋め込み処理部１０７は、この操作をセットさ
れている１６個のフラグ分繰り返す。このようにして埋
め込み処理部１０７は、部分圧縮音声データの先頭から
１ビットずつを埋め込み用の量子化ＤＣＴ係数の最下位
ビットに埋め込み、埋め込みの済んだ量子化ＤＣＴ係数
ブロックを出力部１０８に出力する。（埋め込み処理例）図１３（ａ）は、部分圧縮音声デー
タの一例を示す。埋め込み処理部１０７は、この部分圧
縮音声データの先頭から１ビットずつを、埋め込み用と
して選択された量子化ＤＣＴ係数に埋め込む。

【００４６】同図（ｂ）は、埋め込み処理部１０７が同
図（ａ）の部分圧縮音声データを図１２（ａ）の量子化
ＤＣＴ係数ブロックに埋め込んだ場合の結果を示す。図
１３（ｂ）において丸印で囲まれている量子化ＤＣＴ係
数は、部分圧縮音声データが埋め込まれていることを示
す。埋め込み処理部１０７は、図１２（ｃ）の埋め込み
フラグをジグザグスキャン順に走査してセットされてい
る埋め込みフラグを探し、見つけたらそのフラグに対応
する量子化ＤＣＴ係数に部分圧縮音声データを１ビット
埋め込む。（出力部１０８）出力部１０８は、埋め込み処理部１０
７によって埋め込みの済んだ量子化ＤＣＴ係数ブロック
に対してエントロピー符号化部７４と同様のエントロピ
ー符号化を行って、結果の圧縮符号列を符号用メモリ３
５に出力する。この圧縮符号列はすなわち音声付き圧縮
画像である。

【００４７】以上のようにして埋め込み３７は、圧縮符
号列を復号した量子化ＤＣＴ係数ブロックに、部分圧縮
音声データの埋め込みを行って、再び圧縮符号列に符号
化して符号用メモリに出力するという処理を繰り返すこ
とにより、１枚の音声なし圧縮画像に約１０秒の圧縮音
声データを埋め込む。このようにして埋め込み部３７
は、各ブロックについて画像の劣化に影響しない１６個
の量子化ＤＣＴ係数の最下位ビットに部分圧縮音声デー
タの埋め込みを行うので、全体として２バイト×１９２
００ブロック＝３８４００バイト分の埋め込みが行われ
ることとなり、より多くの圧縮音声データを画像の劣化
少なく埋め込むことができる。（抽出部８３の詳細構成）図１４は、抽出部８３の詳細
な構成図である。

【００４８】同図において抽出部８３は、識別部８３
１、抽出処理部８３２から構成される。識別部８３１
は、エントロピー復号化部８４より量子化ＤＣＴ係数ブ
ロックＲuv又はＲ’uvが出力されると、図１０のフロー
チャートと同じ処理によって、埋め込みフラグを生成す
る。ここで識別部８３１は、量子化ＤＣＴ係数ブロック
がＲuvであってもＲ’uvであっても埋め込みフラグの生
成を行う。つまり圧縮画像が音声なしであるか音声付き
であるかに関係なく埋め込みフラグの生成を行う。これ
により音声付き圧縮画像の量子化ＤＣＴ係数ブロック
Ｒ’uvであれば、識別部８３１は選択部１０６によって
作成されたものと同じ埋め込みフラグを復元するし、音
声なし圧縮画像の量子化ＤＣＴ係数ブロックＲuvであれ
ば、識別部８３１は全てのフラグがオフの埋め込みフラ
グを生成する。

【００４９】抽出処理部８３２は、識別部８３１により
復元された埋め込みフラグをジグザグスキャン順に参照
して、オンに設定されている埋め込みフラグに対応する
量子化ＤＣＴ係数の最下位ビットを抽出してオーディオ
メモリ５４に出力する。以上のようにして抽出部８３
は、選択処理及び埋め込み処理と逆の処理を行うことに
よって、部分圧縮音声データが埋め込まれた量子化ＤＣ
Ｔ係数ブロックから部分圧縮音声データを抽出し、これ
を全ての量子化ＤＣＴ係数ブロックについて行うことに
よって約１０秒の圧縮音声データを抽出する。（実施形態２）以下、本発明の実施形態２のデジタルカ
メラ２について説明する。

【００５０】デジタルカメラ２は、デジタルカメラ１と
同様の方法により量子化ＤＣＴ係数の最下位ビットに圧
縮音声データを埋め込むのに加えて、量子化ＤＣＴ係数
の下位から２ビット目と３ビット目にも圧縮音声データ
を埋め込むことにより、実施形態１よりも１枚の画像に
多くの圧縮音声データを埋め込むことができる。その構
成は、図３に示すデジタルカメラ１の構成と比較して、
埋め込み部３７と抽出部８３の代わりに埋め込み部４７
と抽出部９３を備える点が異なっている。

【００５１】以下、埋め込み部４７と抽出部９３につい
て説明する。（埋め込み部４７）図１５は埋め込み部４７の詳細構成
図を示す。同図において埋め込み部４７は、圧縮画像入
力部１０１、判定値入力部２０２、埋め込み量入力部１
０３、圧縮音声入力部２０４、エントロピー復号化部１
０５、選択部２０６、埋め込み処理部２０７、出力部１
０８から構成される。

【００５２】同図において図９の埋め込み部３７と同じ
符号の構成要素は同じ機能であるので説明を省略し、以
下符号の異なる構成要素について説明する。判定値入力
部２０２は、判定値Ｊ、Ｊ２、Ｊ３を予め記憶する。本
実施形態においてＪ、Ｊ２、Ｊ３はそれぞれ２、４、８
である。圧縮音声入力部２０４は、オーディオメモリ４
４に記憶される圧縮音声データを埋め込み量単位に区切
って埋め込み処理部２０７に出力する。埋め込み量は、
量子化ＤＣＴ係数ブロック毎に異なっており、選択部２
０６より指示される。

【００５３】選択部２０６は、実施形態１と同じく図１
０に示す選択処理によって最下位ビットに埋め込むため
の量子化ＤＣＴ係数を選択する。この処理は実施形態１
と同様であるので説明を省略する。上記選択処理に加え
て選択部２０６は、２ビット目、３ビット目に埋め込む
ための量子化ＤＣＴ係数を選択する。

【００５４】選択部２０６は各量子化ＤＣＴ係数をその
絶対値の大きさに応じてクラス分けし、各クラスに属す
る量子化ＤＣＴ係数の個数に応じて埋め込みを行う量子
化ＤＣＴ係数の個数と埋め込みを行うビット位置とを決
定する。図１６は、選択部２０６が埋め込みを行う量子
化ＤＣＴ係数の数と埋め込みを行うビット位置とを決定
するための論理を表わすフローチャートである。

【００５５】同図において選択部２０６は、まず１つの
量子化ＤＣＴ係数ブロック中の６３個のＡＣ係数におい
て、絶対値が４以上の量子化ＤＣＴ係数の個数Ｃ２と絶
対値が８以上の量子化ＤＣＴ係数の個数Ｃ３とを数える
（ステップ２１）。次に選択部２０６は、Ｃ２、Ｃ３の
値に応じて以下の決定を行う。Ｃ３が８以上の場合、つ
まり量子化ＤＣＴ係数ブロック中に絶対値が８以上の量
子化ＤＣＴ係数の個数が８個以上ある場合（ステップ２
２）、選択部２０６は絶対値が８以上の４個の量子化Ｄ
ＣＴ係数についてその下位から３ビット目を埋め込み用
と決定し、また絶対値が４以上の８個の量子化ＤＣＴ係
数についてその下位から２ビット目を埋め込み用と決定
する（ステップ２３）。

【００５６】Ｃ３が８未満であってＣ２が８以上の場
合、つまり量子化ＤＣＴ係数ブロック中に絶対値が８以
上の量子化ＤＣＴ係数の個数が８個未満であって絶対値
が４以上の量子化ＤＣＴ係数の個数が８個以上ある場合
（ステップ２４）、選択部２０６は絶対値が４以上の８
個の量子化ＤＣＴ係数についてその下位から２ビット目
を埋め込み用と決定する（ステップ２５）。

【００５７】Ｃ２が４以上８未満の場合、つまり量子化
ＤＣＴ係数ブロック中に絶対値が４以上の量子化ＤＣＴ
係数の個数が４個以上８個未満ある場合（ステップ２
６）、選択部２０６は絶対値が４以上の４個の量子化Ｄ
ＣＴ係数の下位から２ビット目を埋め込み用と決定する
（ステップ２７）。選択部２０６は、実施形態１と同様
の埋め込みフラグＥuvを有する他、下位から２ビット目
用と３ビット目用の埋め込みフラグＥ２uv（u,v＝０〜
７）と埋め込みフラグＥ３uv（u,v＝０〜７）とを有
し、先の決定結果に従って埋め込みフラグＥ２uv、Ｅ３
uvをセットする。

【００５８】より具体的には、決定結果がステップ２３
である場合、選択部２０６はＤＣ係数を除く量子化ＤＣ
Ｔ係数（ＡＣ係数）をジグザグスキャン順に走査して、
絶対値が８以上の量子化ＤＣＴ係数を４個選択してそれ
に対応する埋め込みフラグＥ３uvをセットし、また同様
にしてＤＣ係数を除く量子化ＤＣＴ係数（ＡＣ係数）を
ジグザグスキャン順に走査して、絶対値が４以上の量子
化ＤＣＴ係数を８個選択してそれに対応する埋め込みフ
ラグＥ２uvをセットする。

【００５９】また決定結果がステップ２５である場合、
選択部２０６はＤＣ係数を除く量子化ＤＣＴ係数（ＡＣ
係数）をジグザグスキャン順に走査して、絶対値が４以
上の量子化ＤＣＴ係数を８個選択してそれに対応する埋
め込みフラグＥ２uvをセットする。埋め込みフラグＥ３
uvはセットしない。また決定結果がステップ２７である
場合、選択部２０６はＤＣ係数を除く量子化ＤＣＴ係数
（ＡＣ係数）をジグザグスキャン順に走査して、絶対値
が４以上の量子化ＤＣＴ係数を４個選択してそれに対応
する埋め込みフラグＥ２uvをセットする。埋め込みフラ
グＥ３uvはセットしない。

【００６０】例えば図１２（ａ）に示す量子化ＤＣＴ係
数ブロックについて決定処理を行った場合、絶対値が４
以上のＡＣ係数は１０、−１１、−１２、５、５、１
２、−７、−７、４の９個だからＣ２＝９、絶対値が８
以上のＡＣ係数は１０、−１１、−１２、１２の４個だ
からＣ３＝４である（ステップ２１）。よって決定結果
は、ステップ２５に相当するので、図１２（ａ）の量子
化ＤＣＴ係数ブロックの中から絶対値が４以上の８個の
量子化ＤＣＴ係数の下位から２ビット目が埋め込み用と
決定される。図１７に、この決定結果に従ってセットさ
れた埋め込みフラグＥ２uvを示す。同図に示すように絶
対値が４以上の８個の量子化DCT係数がジグザグスキャ
ン順に選択され、それに対応する埋め込みフラグＥ２uv
がセットされる。なおステップ２５の決定結果によれ
ば、埋め込みフラグＥ３uvは１つもセットされない。

【００６１】さらに選択部２０６は最下位ビット、下位
から２ビット目、３ビット目を合わせた埋め込み量を圧
縮音声入力部２０４に通知する。具体的には、決定結果
がステップ２３の場合、下位から２ビット目への埋め込
みが８ビット、下位から３ビット目への埋め込みが４ビ
ット、また最下位ビットへの埋め込みが１６ビットであ
るので、選択部２０６は１２と１６の合計２８を埋め込
み量として通知する。

【００６２】また決定結果がステップ２５の場合、下位
から２ビット目への埋め込みが８ビット、最下位ビット
への埋め込みが１６ビットであるので、選択部２０６は
８と１６の合計２４を埋め込み量として通知する。また
決定結果がステップ２７の場合、下位から２ビット目へ
の埋め込みは４ビット、最下位ビットへの埋め込みが１
６ビットであるので、選択部２０６は４と１６の合計２
０を埋め込み量として通知する。

【００６３】埋め込み処理部２０７は、埋め込みフラグ
Ｅuv、Ｅ２uv、Ｅ３uvに基づいて量子化DCT係数の最下
位ビット、下位から２ビット目、下位から３ビット目へ
の部分圧縮音声データの埋め込みを行う。詳しくは、埋
め込み処理部２０７は実施形態１と同様にして埋め込み
フラグＥuvに基づいて最下位ビットへの埋め込みを行
う。これについては実施形態１と同様であるので説明を
省略する。

【００６４】次に埋め込み処理部２０７は、埋め込みフ
ラグＥ２uvをジグザグスキャン順に走査して、セットさ
れている埋め込みフラグを探し、見つけたらそれに対応
する量子化ＤＣＴ係数の下位から２ビット目を圧縮音声
入力部２０４から入力される部分圧縮音声データの１ビ
ットに変更する。埋め込みフラグＥ２uvの走査が終了す
ると、埋め込み処理部２０７は同様にして埋め込みフラ
グＥ３uvについてもジグザグスキャン順に走査して、セ
ットされている埋め込みフラグに対応する量子化ＤＣＴ
係数の下位から３ビット目を部分圧縮音声データの１ビ
ットに変更する。

【００６５】以上のようにして埋め込み部４７は、各ブ
ロックについて画像の劣化に影響しない量子化ＤＣＴ係
数とそのビット位置とを選択して、部分圧縮音声データ
の埋め込みを行うので、全体で約４３〜４８Ｋバイトの
圧縮音声データが埋め込まれることとなる。抽出部９３
は、エントロピー復号化部８４より量子化ＤＣＴ係数ブ
ロックが出力されると、選択部２０６が行う処理と同様
の方法によって埋め込みフラグＥuv、Ｅ２uv、Ｅ３uvを
復元し、それらのフラグに基づいて量子化ＤＣＴ係数の
最下位ビット、下位から２ビット目、下位から３ビット
目より部分圧縮音声データを抽出し、オーディオメモリ
５４に出力する。

【００６６】このように抽出部９３は、埋め込み部４７
とは逆の操作を行うことによって部分圧縮音声データを
抽出することができる。以上、本発明の実施形態１、２
について説明したが、本発明は実施形態１、２に限ら
ず、以下のようにしても良い。（１）実施形態１において埋め込み部３７はデジタルカ
メラ内部に備えられていたが、デジタルカメラ内部に備
えずに埋め込み部３７単体で構成してもよい。実施形態
２の埋め込み部４７についても同様である。

【００６７】また埋め込み部３７及び４７をパソコン等
の画像処理の可能な装置の内部に構成してもよい。（２）実施形態１において埋め込み部３７は、一度符号
化された圧縮画像をエントロピー復号によって量子化Ｄ
ＣＴ係数ブロックに戻してから部分圧縮音声データを埋
め込むという手順で埋め込みを行っていたが、符号化部
３４による符号化の段階で埋め込みを行うように構成し
ても良い。より詳しくは、埋め込み部３７は、符号化部
３４におけるＤＣＴ部７１、量子化部７２によってＤＣ
Ｔと量子化とが施された後であって、エントロピー符号
化部７４によって符号化される前の量子化ＤＣＴ係数ブ
ロックに対して埋め込みを行う。この場合埋め込み部３
７が有するエントロピー復号化部１０５と出力部１０８
とは不要となる。（３）圧縮画像のデータ量、判定値、埋め込み量、量子
化テーブルＱuv等は、実施形態１及び２に示す値に限ら
ない。

【００６８】例えば判定値Ｊは３や４でもよい。ただし
２ⁿ（ｎは自然数）を用いるのが望ましい。その理由
は、選択部１０６は、量子化ＤＣＴ係数の下位から（ｎ
＋１）番目以上のビット値に１があるか否かを判定する
ことにより、その係数が２ⁿ以上か否かを簡単に判定す
ることができるからである。また異なる量子化テーブル
を複数有するよう構成し、量子化テーブルに応じて判定
値や埋め込み量を変えても良い。

【００６９】画像の劣化と埋め込み量との兼ね合いを考
慮して量子化ＤＣＴ係数の下位から１ビット目、２ビッ
ト目、３ビット目への埋め込み量を実施形態２よりも多
くしても良い。例えば量子化テーブルの値を全体的に小
さくして圧縮率を低くすれば、１ビット目に３０ビッ
ト、２ビット目に１６ビット、３ビット目に８ビットと
いうように埋め込み量を多くすることも可能である。（４）エントロピー符号化部７４と出力部１０８、エン
トロピー復号化部１０５とエントロピー復号化部８４、
撮影画像メモリ３３と表示用画像メモリ６１、オーディ
オメモリ４４とオーディオメモリ５４等、デジタルカメ
ラ内部において同じ機能の２つの構成要素は、一方をな
くして１つだけで共用しても良い。（５）実施形態１においてはデジタルカメラ１は、各量
子化ＤＣＴ係数に部分圧縮音声データを一律に埋め込む
構成であった。この構成によれば、判定値Ｊ以上の量子
化ＤＣＴ係数の数が埋め込み量Ｎより少ないブロックに
ついては、判定値Ｊより小さい値の量子化ＤＣＴ係数に
も埋め込みが行われるので、そのブロックは、他のブロ
ックよりも劣化することになるという問題がある。この
ような問題に対して次のような方法で対処してもよい。
すなわち選択部１０６は、まず量子化ＤＣＴ係数毎に、
ＤＣ係数を除く６３個のＡＣ係数中に、その絶対値が判
定値Ｊ以上の値の係数の数を数え上げる。次に選択部１
０６は、数え上げた係数の数が埋め込み量Ｎの値以上で
あるか否かを判定する。判定の結果、埋め込み量Ｎの値
以上である場合には、その量子化ＤＣＴ係数ブロックに
埋め込みを行う、と決定し、ジグザグスキャン順に判定
値Ｊ以上の量子化ＤＣＴ係数ブロックを埋め込み用とし
て選択して埋め込みフラグをセットする。判定の結果、
埋め込み量Ｎの値よりも少ない場合には、その量子化Ｄ
ＣＴ係数ブロックには埋め込みを行わない、と決定し埋
め込みフラグのセットを行わない。埋め込み処理部１０
７は、選択部１０６によってセットされている埋め込み
フラグのあるブロックについてのみ部分圧縮音声データ
の埋め込みを行う。これによって、実施形態１の構成よ
りも埋め込み可能な圧縮音声データのデータ量は少なく
なるが、実施形態１の構成よりも画質を保護できるとい
う効果がある。（６）埋め込み部３７の各構成要素の機能をプログラム
化してＲＯＭに記録し、ＣＰＵ、ＲＡＭ、ＲＯＭからな
るマイクロコンピュータにより実現してもよい。より具
体的には、ＣＰＵはＲＯＭからプログラムを読み出して
実行することにより、量子化ＤＣＴ係数ブロックＲuvの
中から低周波のＡＣ係数と絶対値が判定値２以上のＡＣ
係数とから１６個のＡＣ係数を選択する選択ステップ
と、選択処理によって選択された１６個のＡＣ係数の最
下位ビットを１６ビットの部分圧縮音声データに置き換
える置き換えステップとを行う。選択ステップは図１０
に示すフローチャートをプログラム化したもので、ＣＰ
Ｕは量子化ＤＣＴ係数ＲuvのＡＣ係数についてジグザグ
スキャンし、判定値２以上の量子化ＤＣＴ係数があれば
それに対応する埋め込みフラグをオンする第1選択ステ
ップを行う。この埋め込みフラグはＲＡＭに記憶されて
いる。ＣＰＵは埋め込みフラグをオンにした個数Ｃが埋
め込み量１６に達したとき、または最後の量子化ＤＣＴ
係数までジグザグスキャンしたとき第1選択ステップを
終了する。ＣＰＵはフラグをオンにした個数Ｃが埋め込
み量１６より少ないか否かを判定し、少ない場合にはジ
グザグスキャン順にオフになっている埋め込みフラグ
（１６−Ｃ）個をオンにする第2選択ステップを行う。
ＣＰＵは、埋め込みフラグがオンになっている量子化Ｄ
ＣＴ係数について上記置き換えステップによる置き換え
を行う。

【００７０】

【発明の効果】本発明の埋め込み装置は、画像に離散コ
サイン（ＤＣＴ）変換と量子化とを施すことにより生成
される量子化ＤＣＴ係数ブロック中、低周波のＡＣ係数
と絶対値が第１しきい値以上のＡＣ係数とから所定個の
ＡＣ係数を選択する選択手段と、前記選択手段により選
択された所定個のＡＣ係数の最下位ビットを音声データ
に置き換える置換え手段とを備える。

【００７１】この構成によれば埋め込み装置は、最下位
ビットの値を変化させた場合に画像の劣化がより少なく
なるようなＡＣ係数を選択して音声データを埋めこむの
で画像の劣化が少なくなるという効果がある。ここで画
像の劣化が少なくなるのは、以下の理由による。まず低
周波のＡＣ係数について説明すると、低周波のＡＣ係数
は、通常、高周波のＡＣ係数に比べて小さい量子化レベ
ルで量子化されるという特徴がある。これは人間の視覚
特性が高周波成分に鈍感で低周波成分に敏感であるた
め、高周波成分を粗く量子化するで圧縮率を高めている
からである。ＡＣ係数は、復号の際、量子化レベルと同
じ値で逆量子化されるので、低周波のＡＣ係数は小さい
レベルで逆量子化され、高周波のＡＣ係数は大きいレベ
ルで逆量子化されることとなる。よって、同じように最
下位ビットを０から１に置き換えたとしても低周波の方
が高周波よりも逆量子化後の誤差が小さく、つまり画質
の劣化が少ない。

【００７２】また絶対値がしきい値以上のＡＣ係数につ
いて説明すると、絶対値の大きいＡＣ係数は、絶対値が
小さいＡＣ係数と比較して、最下位ビットが変化した場
合の変化の割合が小さい。例えば１６のＡＣ係数の最下
位ビットが１７になった場合と、０のＡＣ係数が１にな
った場合とを比べると、１６から１７に変化した方が変
化の割合が小さい。また絶対値が大きいＡＣ係数は、低
周波であることが多く（なぜなら低周波の方が小さい量
子化レベルで量子化されているので値が大きい場合が多
いからである）、その分逆量子化後の誤差が小さい。こ
れらから絶対値がしきい値以上のＡＣ係数は、しきい値
より小さいＡＣ係数に比べて画像の劣化が少ない。

【００７３】また前記選択手段は、絶対値が第１しきい
値以上のＡＣ係数を選択する第１選択部と、前記第１選
択部によって選択されたＡＣ係数の個数が所定個に満た
ない場合には、第１しきい値未満であってより低周波の
ＡＣ係数から順に所定個になるまでＡＣ係数を選択する
第２選択部とを備える。この構成によれば埋め込み装置
は、絶対値が大きいＡＣ係数を低周波のＡＣ係数よりも
優先させて選択することによって置換えを行った場合の
画質の劣化を少なくしている。これは絶対値が大きいＡ
Ｃ係数の方が低周波のＡＣ係数よりも、最下位ビットを
置き換えた場合の画質の劣化が少ないからである。

【００７４】絶対値がしきい値未満の低周波のＡＣ係数
は、逆量子化レベルが小さいという１つの要因によって
最下位ビットを変化させた場合の誤差を小さくしてい
る。一方、絶対値がしきい値以上のＡＣ係数は、比較的
低周波側に分布するので、逆量子化レベルが小さい。こ
れに加えて絶対値がしきい値以上のＡＣ係数は、絶対値
がしきい値より小さいＡＣ係数に比べて最下位ビットが
変化した場合の変化率が小さい。このように絶対値がし
きい値以上のＡＣ係数は逆量子化レベルが小さいことと
最下位ビットが変化した場合の変化率が小さいこととの
２つの要因から誤差を小さくしている。このことから埋
め込み装置は、絶対値が大きいＡＣ係数を低周波のＡＣ
係数より優先的に選択することによって、より画質の劣
化を低減している。

【００７５】前記埋め込み装置は、さらに、量子化ＤＣ
Ｔ係数ブロック中、絶対値が第１しきい値より大きい第
２しきい値以上のＡＣ係数を選択する追加選択手段と、
前記追加選択手段により選択されたＡＣ係数の最下位か
ら２ビット目を音声データに置き換える追加置換え手段
とを備える。この構成によれば埋め込み装置は、最下位
ビットに音声データを埋め込むのに加えて、最下位から
２ビット目にも音声データを埋め込むので、より多くの
音声データを埋め込むことができるという効果がある。
また絶対値が第２しきい値以上のＡＣ係数、つまり最下
位から２ビット目が変化した場合の変化率の小さいＡＣ
係数を埋め込み用として選択するので、本埋め込み装置
は、画像の劣化が少なく、より多くの音声データを埋め
込むことができる。

【００７６】本発明のデジタルカメラは、圧縮画像に数
秒間の音声データに相当する圧縮音声データを埋め込む
デジタルカメラであって、圧縮画像から離散コサイン変
換と量子化とが施された量子化ＤＣＴ係数ブロックを得
る獲得手段と、前記圧縮音声データを分割して所定ビッ
トの部分圧縮音声データにする分割手段と、獲得される
量子化ＤＣＴ係数ブロック中、低周波のＡＣ係数と絶対
値が第１しきい値以上のＡＣ係数とから前記所定個のＡ
Ｃ係数を選択する選択手段と、前記選択手段により選択
された前記所定個のＡＣ係数の最下位ビットを前記部分
圧縮音声データに置き換える置換え手段とを備える。

【００７７】この構成によればデジタルカメラは、画像
の劣化が少なくて済む所定個のＡＣ係数に所定ビットの
部分圧縮音声データを埋め込むという操作を各量子化Ｄ
ＣＴ係数ブロックに対して行うので、全体として所定ビ
ット×総ブロック数という多くの音声データを画像の劣
化少なく埋め込むことができる。

【図面の簡単な説明】

【図１】デジタルカメラ１の正面側の外観図である。

【図２】デジタルカメラ１の背面側の外観図である。

【図３】デジタルカメラ１の概略構成図である。

【図４】図３の詳細構成図である。

【図５】符号化部３４のより詳細な構成図である。

【図６】復号化部６２のより詳細な構成図である。

【図７】１画面分の輝度成分Ｙとブロックとの関係を示
す。

【図８】（ａ）輝度成分Ｙの１ブロック分の画素の具体
例Ｙxy（x,y＝０〜７；x,yはブロック中の画素位置を表
わす）を示す。（ｂ）Ｙxyに対してＤＣＴを行うことにより得られるＤ
ＣＴ係数ブロックSuvを示す。（ｃ）量子化テーブルＱuvの具体例を示す。（ｄ）図８（ｂ）に示したＤＣＴ係数ブロックＳuvを図
８（ｃ）の量子化テーブルＱuvで量子化した場合の量子
化ＤＣＴ係数ブロックＲuvを示す。

【図９】埋め込み部３７の詳細な構成図である。

【図１０】選択部１０６による、選択処理を示すフロー
チャートである。

【図１１】（ａ）図８（ｄ）の量子化ＤＣＴ係数ブロッ
クＲuvの中から埋め込み用として選択される量子化ＤＣ
Ｔ係数を丸印で囲って示す。（ｂ）選択部１０６が同図（ａ）について選択処理を行
った場合の選択結果の埋め込みフラグＥuvを示す。

【図１２】（ａ）選択部１０６が図８（ｄ）とは別の量
子化ＤＣＴ係数ブロックの中から埋め込み用として選択
される量子化ＤＣＴ係数を丸印で囲って示す。（ｂ）（ａ）に対応する埋め込みフラグを示す。（ｃ）選択部１０６の選択処理による最終的な選択結果
の埋め込みフラグを示す。

【図１３】（ａ）部分圧縮音声データの一例を示す。（ｂ）埋め込み処理部１０７が同図（ａ）の部分圧縮音
声データを図１２（ａ）の量子化ＤＣＴ係数ブロックに
埋め込んだ場合の結果を示す。

【図１４】抽出部８３の詳細な構成図である。

【図１５】埋め込み部４７の詳細構成図である。

【図１６】選択部２０６が埋め込みを行う量子化ＤＣＴ
係数の数と埋め込みを行うビット位置とを決定するため
の論理を表わすフローチャートである。

【図１７】この決定結果に従ってセットされた埋め込み
フラグＥ２uvを示す。

【符号の説明】

３画像符号化部３５符号用メモリ３６メモリカード入出力部４音声符号化部３７埋め込み部５音声復号化部６画像復号化部８３抽出部３１撮像部３３撮影画像メモリ３４符号化部７１ＤＣＴ部７２量子化部７４エントロピー符号化部８４エントロピー復号化部８２逆量子化部８１逆ＤＣＴ部１０１圧縮画像入力部１０２判定値入力部１０３埋め込み量入力部１０４圧縮音声入力部１０５エントロピー復号化部１０６選択部１０７埋め込み処理部１０８出力部８３１識別部８３２抽出処理部

───────────────────────────────────────────────────── フロントページの続き (51)Int.Cl.⁷ 識別記号ＦＩＨ０４Ｎ 5/928 Ｈ０４Ｎ 5/92 Ｅ 7/30 7/133 Ｚ (58)調査した分野(Int.Cl.⁷，ＤＢ名) H04N 1/38 - 1/393

Claims

(57)【特許請求の範囲】

【請求項１】画像に離散コサイン変換（ＤＣＴ）と量
子化とを施すことにより生成される量子化ＤＣＴ係数ブ
ロック中、低周波のＡＣ係数と絶対値が第１しきい値以
上のＡＣ係数とから所定個のＡＣ係数を選択する選択手
段と、前記選択手段により選択された所定個のＡＣ係数の最下
位ビットを音声データに置き換える置換え手段とを備え
ることを特徴とする埋め込み装置。
【請求項２】前記選択手段は、絶対値が第１しきい値
以上のＡＣ係数を選択する第１選択部と、前記第１選択部によって選択されたＡＣ係数の個数が所
定個に満たない場合には、第１しきい値未満であってよ
り低周波のＡＣ係数から順に所定個になるまでＡＣ係数
を選択する第２選択部とを備えることを特徴とする請求
項１記載の埋め込み装置。
【請求項３】前記埋め込み装置は、さらに、量子化ＤＣＴ係数ブロック中、絶対値が第１しきい値よ
り大きい第２しきい値以上のＡＣ係数を選択する追加選
択手段と、前記追加選択手段により選択されたＡＣ係数の最下位か
ら２ビット目を音声データに置き換える追加置換え手段
とを備えることを特徴とする請求項１又は２記載の埋め
込み装置。
【請求項４】画像に離散コサイン変換（ＤＣＴ）と量
子化とを施すことにより生成される量子化ＤＣＴ係数ブ
ロック中、低周波のＡＣ係数と絶対値が第１しきい値以
上のＡＣ係数とから所定個のＡＣ係数を選択する選択ス
テップと、前記選択ステップにより選択された所定個のＡＣ係数の
最下位ビットを音声データに置き換える置換えステップ
とを備えることを特徴とする埋め込み方法。
【請求項５】前記選択ステップは、絶対値が第１しきい値以上のＡＣ係数を選択する第１選
択ステップと、前記第１選択ステップによって選択されたＡＣ係数の個
数が所定個に満たない場合には、第１しきい値未満であ
ってより低周波のＡＣ係数から順に所定個になるまでＡ
Ｃ係数を選択する第２選択ステップとを備えることを特
徴とする請求項４記載の埋め込み方法。
【請求項６】圧縮画像に数秒間の音声データに相当す
る圧縮音声データを埋め込むデジタルカメラであって、圧縮画像から離散コサイン変換と量子化とが施された量
子化ＤＣＴ係数ブロックを得る獲得手段と、前記圧縮音声データを分割して所定ビットの部分圧縮音
声データにする分割手段と、獲得される量子化ＤＣＴ係数ブロック中、低周波のＡＣ
係数と絶対値が第１しきい値以上のＡＣ係数とから前記
所定個のＡＣ係数を選択する選択手段と、前記選択手段により選択された前記所定個のＡＣ係数の
最下位ビットを前記部分圧縮音声データに置き換える置
換え手段とを備えることを特徴とするデジタルカメラ。
【請求項７】画像に音声データを埋め込ませる処理を
コンピュータに実行させるためのプログラムを記録した
コンピュータ読み取り可能な記録媒体であって、当該プ
ログラムはコンピュータに、画像に離散コサイン変換（ＤＣＴ）と量子化とを施すこ
とにより生成される量子化ＤＣＴ係数ブロック中、低周
波のＡＣ係数と絶対値が第１しきい値以上のＡＣ係数と
から所定個のＡＣ係数を選択する選択ステップと、前記選択ステップにより選択された所定個のＡＣ係数の
最下位ビットを音声データに置き換える置換えステップ
とを実行させることを特徴とするプログラムを記録した
記録媒体。
【請求項８】前記選択ステップは、絶対値が第１しきい値以上のＡＣ係数を選択する第１選
択ステップと、前記第１選択ステップによって選択されたＡＣ係数の個
数が所定個に満たない場合には、第１しきい値未満であ
ってより低周波のＡＣ係数から順に所定個になるまでＡ
Ｃ係数を選択する第２選択ステップとからなることを特
徴とするプログラムを記載した請求項７記載の記録媒
体。