JP3398343B2 - 埋め込み装置、デジタルカメラ及び記録媒体 - Google Patents

埋め込み装置、デジタルカメラ及び記録媒体

Info

Publication number
JP3398343B2
JP3398343B2 JP23389799A JP23389799A JP3398343B2 JP 3398343 B2 JP3398343 B2 JP 3398343B2 JP 23389799 A JP23389799 A JP 23389799A JP 23389799 A JP23389799 A JP 23389799A JP 3398343 B2 JP3398343 B2 JP 3398343B2
Authority
JP
Japan
Prior art keywords
embedding
coefficients
unit
coefficient
audio data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP23389799A
Other languages
English (en)
Other versions
JP2001060875A (ja
Inventor
博松 青木
政夫 平本
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Panasonic Corp
Panasonic Holdings Corp
Original Assignee
Panasonic Corp
Matsushita Electric Industrial Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Panasonic Corp, Matsushita Electric Industrial Co Ltd filed Critical Panasonic Corp
Priority to JP23389799A priority Critical patent/JP3398343B2/ja
Publication of JP2001060875A publication Critical patent/JP2001060875A/ja
Application granted granted Critical
Publication of JP3398343B2 publication Critical patent/JP3398343B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Landscapes

  • Television Signal Processing For Recording (AREA)
  • Editing Of Facsimile Originals (AREA)
  • Studio Devices (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、画像に音声データ
を埋め込む埋め込み装置及び圧縮画像に圧縮音声データ
を埋め込む埋め込み装置を備えたデジタルカメラに関す
る。
【0002】
【従来の技術】従来より、デジタルカメラ等により撮影
された画像に音声データを付け加えたいという要望があ
った。この要望に応えるものとしてFlashPixという、画
像と音声データとを1つのファイルとして扱うファイル
形式がある。ただしこのFlashPixは、付け加える音声デ
ータのデータ量が多ければ多いほど全体のデータ量は多
くなるという問題がある。データ量が多ければ、保管や
伝送効率が悪くなる。
【0003】そこで全体のデータ量を増やさない手段と
して埋め込み装置の利用が考えられる。埋め込み装置
は、画像の一部分を別情報に置き換えることによって埋
め込みを行うので、別情報が埋め込まれた画像のデータ
量は、埋め込まれる前のデータ量と変わらない。
【0004】
【発明が解決しようとする課題】しかし従来の埋め込み
装置は、別情報として、署名やマーク等のデータ量が少
ないものを埋め込み対象としており、音声データのよう
に多量のものを埋め込み対象とすることは考慮されてい
ない。上記の点に鑑み本発明は、画質の劣化が少なく、
できるだけ多くのデータを埋め込むことのできる埋め込
み装置の提供を目的とする。
【0005】また本発明は、撮影された画像に数秒程度
の音声データを画像の劣化が少なく埋めこむことのでき
るデジタルカメラの提供を目的とする。
【0006】
【課題を解決するための手段】上記問題を解決するた
め、本発明の埋め込み装置は、画像に離散コサイン変換
(DCT:Discrete Cosine Transform)と量子化とを
施すことにより生成される量子化DCT係数ブロック
中、低周波のAC係数と絶対値が第1しきい値以上のA
C係数とから所定個のAC係数を選択する選択手段と、
前記選択手段により選択された所定個のAC係数の最下
位ビットを音声データに置き換える置換え手段とを備え
る。
【0007】また前記選択手段は、絶対値が第1しきい
値以上のAC係数を選択する第1選択部と、前記第1選
によって選択されたAC係数の個数が所定個に満た
ない場合には、第1しきい値未満であってより低周波の
AC係数から順に所定個になるまでAC係数を選択する
第2選択部とを備える。前記埋め込み装置は、さらに、
量子化DCT係数ブロック中、絶対値が第1しきい値よ
り大きい第2しきい値以上のAC係数を選択する追加選
択手段と、前記追加選択手段により選択されたAC係数
の最下位から2ビット目音声データに置き換える追加
置換え手段とを備える
【0008】本発明の埋め込み方法は、画像に離散コサ
イン変換(DCT)と量子化とを施すことにより生成さ
れる量子化DCT係数ブロック中、低周波のAC係数と
絶対値が第1しきい値以上のAC係数とから所定個のA
C係数を選択する選択ステップと、前記選択ステップに
より選択された所定個のAC係数の最下位ビットを音声
データに置き換える置換えステップとを備える。
【0009】前記選択ステップは、絶対値が第1しきい
値以上のAC係数を選択する第1選択ステップと、前記
第1選択ステップによって選択されたAC係数の個数が
所定個に満たない場合には、第1しきい値未満であって
より低周波のAC係数から順に所定個になるまでAC係
数を選択する第2選択ステップとを備える。本発明のデ
ジタルカメラは、圧縮画像に数秒間の音声データに相当
する圧縮音声データを埋め込むデジタルカメラであっ
て、圧縮画像から離散コサイン変換と量子化とが施され
た量子化DCT係数ブロックを得る獲得手段と、前記圧
縮音声データを分割して所定ビットの部分圧縮音声デー
タにする分割手段と、獲得される量子化DCT係数ブロ
ック中、低周波のAC係数と絶対値が第1しきい値以上
のAC係数とから前記所定個のAC係数を選択する選択
手段と、前記選択手段により選択された前記所定個のA
C係数の最下位ビットを前記部分圧縮音声データに置き
換える置換え手段とを備える。
【0010】また本発明の記録媒体は、画像に音声デー
タを埋め込ませる処理をコンピュータに実行させるため
のプログラムを記録したコンピュータ読み取り可能な記
録媒体であって、当該プログラムはコンピュータに、画
像に離散コサイン変換(DCT)と量子化とを施すこと
により生成される量子化DCT係数ブロック中、低周波
のAC係数と絶対値が第1しきい値以上のAC係数とか
ら所定個のAC係数を選択する選択ステップと、前記選
択ステップにより選択された所定個のAC係数の最下位
ビットを音声データに置き換える置換えステップとを実
行させることを特徴とする。
【0011】また前記選択ステップは、絶対値が第1し
きい値以上のAC係数を選択する第1選択ステップと、
前記第1選択ステップによって選択されたAC係数の個
数が所定個に満たない場合には、第1しきい値未満であ
ってより低周波のAC係数から順に所定個になるまでA
C係数を選択する第2選択ステップとからなる。
【0012】
【発明の実施の形態】(実施形態1)以下、本発明の埋
め込み装置の一実施形態であるデジタルカメラ1につい
て図面を用いて説明する。本実施形態において埋め込み
装置はデジタルカメラ1内部に埋め込み部として備えら
れる。 (デジタルカメラ1の外観構成)図1及び図2は、デジ
タルカメラ1の正面側及び背面側の外観図である。
【0013】同図に示すようにデジタルカメラ1は、正
面に音声データ再生用のスピーカ11、音声データ録音
用のマイク12、レンズ18を備え、背面に画像表示部
13、画像及び音声データ再生指示用の再生ボタン21
a、21b、音声データ録音指示用の録音ボタン22、
ファインダー17を備え、上面にシャッターボタン1
4、シャッター速度や絞り値などを表示する状態表示部
15を備え、側面にはフラッシュメモリの一種であるメ
モリカード20が挿入されるメモリカード挿入口19を
備える。
【0014】デジタルカメラ1の操作例を以下に簡単に
説明しておく。利用者がファインダー17又は画像表示
部13により撮像範囲を定めてシャッターボタン14を
押下すると、レンズ18を通して撮影された画像が内部
で符号化されて圧縮画像となり、メモリカード20に記
憶される。このメモリカード20は、圧縮画像を数十枚
記憶することができる。
【0015】また利用者が録音ボタン22を押下する
と、その時点からマイク12より所定時間(本実施形態
においては約10秒間)の音声データが集音され符号化
されて圧縮音声データとなる。圧縮音声データは、メモ
リカード20に記憶されている圧縮画像のうち利用者に
選択された圧縮画像に埋め込まれる。以下、圧縮音声デ
ータが埋め込まれた圧縮画像を音声付き圧縮画像、埋め
込まれていない圧縮画像を音声なし圧縮画像と区別して
呼び、音声データ付きか音声データなしかを特に区別し
ない場合には単に圧縮画像と呼ぶこととする。
【0016】また利用者が再生ボタン21a、21bを押
下する度に、メモリカード20に記憶されている圧縮画
像が一枚ずつ復号されて、その画像が画像表示部13に
表示される。音声付き圧縮画像が復号された場合には、
その 復号された画像の表示と同時に圧縮音声データが
抽出、復号されてスピーカ11より再生される。 (デジタルカメラ1の概略構成)図3は、デジタルカメ
ラ1の概略構成図である。
【0017】同図に示すようにデジタルカメラ1は、画
像符号化部3、符号用メモリ35、メモリカード入出力
部36、音声符号化部4、埋め込み部37、音声復号化
部5、画像復号化部6、抽出部83から構成される。画
像符号化部3は、シャッターボタン14が押下されたと
き、レンズ18を介して撮像される画像をJPEG方式
により符号化して音声なし圧縮画像を生成し、符号用メ
モリ35に出力する。
【0018】符号用メモリ35は、画像符号化部3、メ
モリカード入出力部36、埋め込み部37、画像復号化
部6の間で入出力される圧縮画像を一時的に記憶する。
メモリカード入出力部36は、符号用メモリ35に記憶
されている圧縮画像をメモリカード20へ書きこみ、ま
たメモリカード20に記憶される圧縮画像を符号用メモ
リ35に読み出す。
【0019】音声符号化部4は、録音ボタン22が押下
されたとき、マイク12を介して約10秒間の外部の音
声データを集音し、IMA(Interactive Multimedia As
sociation)方式のADPCM(Adaptive Differential P
CM)により符号化し、その結果の圧縮音声データを音声
符号化部4内部のメモリ(後述のオーディオメモリ4
4)に記憶する。
【0020】埋め込み部37は、符号用メモリ35に記
憶される音声なし圧縮画像に前記圧縮音声データを埋め
込んで音声付き圧縮画像を生成し、符号用メモリ35に
戻す。埋め込み部37は、本発明の主要な構成要素であ
るので後に詳細に説明する。画像復号化部6は、画像符
号化部3による符号化とは逆の操作により符号用メモリ
35に記憶される圧縮画像から画像を復号し、画像表示
部13に表示する。
【0021】抽出部83は、埋め込み部37による音声
データの埋め込みと逆の操作によって、音声付き圧縮画
像から圧縮音声データを抽出して音声復号化部5に出力
する。音声復号化部5は、音声符号化部4による符号化
とは逆の操作により、抽出部83より出力された圧縮音
声データから音声データを復号し、スピーカー11より
再生する。 (画像符号化部3、音声符号化部4、音声復号化部5、
画像復号化部6の詳細構成)図4は、図3の詳細構成図
であり、図5、図6は、図4を部分的に示す詳細構成図
である。同図を用いて以下に画像符号化部3、音声符号
化部4、音声復号化部5、画像復号化部6について説明
する。 (画像符号化部3の詳細構成)図4において画像符号化
部3は、撮像部31、撮影画像メモリ33、符号化部3
4より構成される。 (撮像部31)撮像部31は、レンズ18、CCD(図
外)、色変換器(図外)などから構成され、シャッター
ボタン14が押されたときに、レンズ18、CCDを介
して得られるRGB信号を色変換器によりYCrCb成
分から成る画像に変換して撮影画像メモリ33に書き込
む。
【0022】1つの画像は、1280画素×960ライ
ン、合計1228800画素からなる輝度成分Yと、6
40画素×480ライン(又は水平方向のみを間引いた
640画素×960ライン)、合計307200画素
(又は614400画素)からなる色差成分Cr、Cb
とから構成される。 (撮影画像メモリ33)撮影画像メモリ33は、撮像部
31により書き込まれる画像を一時的に記憶する。 (符号化部34)符号化部34は、撮影画像メモリ33
に記憶されている画像を8画素×8ラインのブロック毎
にJPEG方式により圧縮符号化して、それによって得
られる圧縮符号列を符号用メモリ35に書きこむ。1画
面分の圧縮符号列が音声なし圧縮画像に相当する。
【0023】図7は、1画面分の輝度成分Yとブロック
との関係を示す。輝度成分Yは、横160ブロック、縦
120ブロック、合計19200個のブロックから構成
され、各ブロックは、8画素×8ライン、合計64個の
画素から構成される。例えば同図においてブロック10
2は、1画面分の輝度成分Yに含まれる1つのブロック
である。1画面分の色差成分Cr、Cbも同様に、それ
ぞれ横80ブロック、縦60ブロック、合計4800個
(640画素×960ラインのものについては横80ブ
ロック、縦120ブロック、合計9600個)のブロッ
クから構成される。
【0024】図8(a)は、輝度成分Yの1ブロック分
の画素の具体例Yxy(x,y=0〜7;x,yはブロック中の
画素位置を表わす)を示す。なお、同図のYxyは、元の
信号値から128を引いたものである。これは後の離散
コサイン変換(Discrete Cosine Transform、以下DC
Tと省略する)によって得られるDCT係数の期待値を
0にレベルシフトするためである。 (符号化部34の詳細構成)符号化部34は、図5の構
成図に示すように、DCT部71、量子化部72、エン
トロピー符号化部74から構成される。 (DCT部71)DCT部71は、撮影画像メモリ33
から輝度成分Y、色差成分Cr、Cbをブロック毎に順
次読み出してDCTを行い、8×8要素のDCT係数か
ら成るDCT係数ブロックSuv(u,v=0〜7)を生成
し、量子化部72へ出力する。ここでSuvは、直流成分
を表わすS00をDC係数と呼び、S00以外の交流成分を
表わすDCT係数をAC係数と呼ぶ。またSuvは、u、v
の値が大きくなるほど高周波成分となる。
【0025】図8(b)は、Yxyに対してDCTを行う
ことにより得られるDCT係数ブロックSuvを示す。同
図においてS00=823がDC係数であり、その他はA
C係数である。u、vが大きくなるほど、つまり高周波成
分になるほど値が小さくなっていることがわかる。なお
DCTの具体的な演算式は公知であるので説明を省略す
る。 (量子化部72)量子化部72は、8×8要素の量子化
係数から成る量子化テーブルQuv(u,v=0〜7)を備
え、これを用いてDCT係数ブロックSuvを量子化し、
8×8要素の量子化DCT係数から成る量子化DCT係
数ブロックRuv(u,v=0〜7)を生成し、エントロピ
ー符号化部74へ出力する。
【0026】量子化DCT係数ブロックRuvは以下のよ
うにして算出される。 (式1) Ruv=round(Suv/Quv) ここで、round()は、()内の値をもっとも近い整数
へ整数化することを意味する関数である。
【0027】JPEG方式においては量子化係数の値は
規定されていない。よってアプリケーション毎や画像毎
に自由に値を設定することができる。一般的に、量子化
係数は、u、vの値が大きくなるほど大きな値が設定され
る。このように高周波成分ほど量子化係数の値を大きく
するのは、視覚的に劣化の目立ちにくい高周波成分を粗
く量子化すれば、画質を保護しつつ圧縮効率を良くする
ことができるからである。
【0028】図8(c)に量子化テーブルQuvの具体例
を示す。図8(d)は、図8(b)に示したDCT係数
ブロックSuvを図8(c)の量子化テーブルQuvで量子
化した場合の量子化DCT係数ブロックRuvを示す。こ
の例によればR10=round(S10/Q10)=round(−1
35/4)=−34である。 (エントロピー符号化部74)エントロピー符号化部7
4は、量子化部71から受け取った量子化DCT係数ブ
ロックRuvをエントロピー符号化して圧縮符号列を生成
し、符号用メモリ35へ書き込む。1画面分の圧縮符号
列が圧縮画像に相当する。エントロピー復号については
公知であるので説明を省略する。 (音声符号化部4の詳細構成)音声符号化部4は、集音
部41、オーディオ符号化部43、オーディオメモリ4
4から構成される。 (集音部41)集音部41は、マイク12、増幅器(図
外)、AD変換回路(図外)、量子化回路(図外)など
から構成され、利用者により録音ボタン22が押下され
たときから約10秒間分の外部のアナログ音声データを
集音し、11kHzのサンプリング、AD変換等を施し
てデジタル音声データに変換し、オーディオ符号化部4
3へ出力する。 (オーディオ符号化部43)オーディオ符号化部43
は、IMA方式のADPCMに基づいて前記デジタル音
声データを圧縮音声データに変換してオーディオメモリ
44へ出力する。なお、IMA方式のADPCMについ
ては公知であるので説明を省略する。 (オーディオメモリ44)オーディオメモリ44は、オ
ーディオ符号化部43により出力される圧縮音声データ
を記憶する。 (音声復号化部5の詳細構成)音声復号化部5は、オー
ディオメモリ54、オーディオ復号化部53、音声再生
部51から構成される。 (オーディオメモリ54)オーディオメモリ54は、抽
出部83により圧縮画像から抽出された圧縮音声データ
を一時的に記憶する。 (オーディオ復号化部53)オーディオ復号化部53
は、IMA方式のADPCMに基づいて、オーディオメ
モリ54に記憶されている圧縮音声データからデジタル
音声データを復号し、音声再生部51へ出力する。 (音声再生部51)音声再生部51は、DA変換回路
(図外)、スピーカ11などから構成され、オーディオ
復号化部53により復号されたデジタル音声データをア
ナログ音声データに変換して再生する。 (画像復号化部6の詳細構成)画像復号化部6は、復号
化部62、表示用画像メモリ61、画像表示部13から
構成される。 (復号化部62)復号化部62は、符号用メモリ35に
記憶される音声なし圧縮画像又は音声付き圧縮画像を読
み出してJPEG方式による復号化を行い、結果の画像を表
示用画像メモリ61に出力する。
【0029】図6は、復号化部62のより詳細な構成図
である。同図において復号化部62は、エントロピー復
号化部84、逆量子化部82、逆DCT部81から構成
される。 (エントロピー復号化部84)エントロピー復号化部8
4は、符号用メモリ35に記憶されている圧縮画像をエ
ントロピー復号することにより量子化DCT係数ブロッ
クRuv(又はR’uv)を生成して抽出部83と逆量子化
部82とに出力する。ここにおいて、圧縮音声データを
含まない量子化DCT係数ブロックをRuv、圧縮音声デ
ータを含む量子化DCT係数ブロックをR’uvとして区
別する。 (逆量子化部82)逆量子化部82は、量子化部71と
同一の量子化テーブルQuvを備え、Quvと量子化DCT
係数ブロックRuv(又はR’uv)とから(式2)に示す
逆量子化によりDCT係数ブロックS’uvを生成して逆
DCT部81へ出力する。ここにおいて、量子化DCT
係数ブロックRuv又はR’uvより生成されたDCT係数
ブロックをS’uvとし、量子化前のDCT係数ブロック
をSuvとして区別する。 (式2) S'uv=Ruv(又はR’uv)×Quv (逆DCT部81)逆DCT部81は、逆DCTを施す
ことによりDCT係数ブロックS’uvから輝度成分Y、
色差成分Cr、Cbをブロック単位で復号して表示用画
像メモリ61へ書き込む。逆DCTについては公知であ
るので説明を省略する。 (表示用画像メモリ61)表示用画像メモリ61は、復
号化部62により復号された輝度成分Y、色差成分C
r、Cbからなる画像を一時的に記憶する。 (画像表示部13)画像表示部13は、液晶ディスプレ
イなどから構成され、表示用画像メモリ61に記憶され
ている画像を表示する。 (埋め込み部37の詳細構成)埋め込み部37は、符号
用メモリ35に記憶される音声なし圧縮画像を読み出し
てエントロピー復号し、量子化DCT係数ブロックRuv
に戻す。次に埋め込み部37は、輝度成分Yの量子化D
CT係数ブロックRuv毎に、64個のうちDC係数(R
00)を除く63個の量子化DCT係数(AC係数)の中
から所定数Nの量子化DCT係数を埋め込み用として選
択する。本実施形態ではこの所定数Nを16個としてい
る。さらに埋め込み部37は、圧縮音声データをNビッ
ト(すなわち16ビット)ずつの部分圧縮音声データに
分割する。最後に埋め込み部37は、各ブロックに各部
分圧縮音声データを対応させて、埋め込み用の16個の
量子化DCT係数の最下位ビットに部分圧縮音声データ
を1ビットずつ埋め込む。ここで量子化DCT係数の最
下位ビットに部分圧縮音声データを1ビット埋め込むと
は、すなわち量子化DCT係数の最下位ビットの値を部
分圧縮音声データの1ビットに置き換えることを意味す
る。
【0030】最後に埋め込み部37は、埋め込みの済ん
だ量子化DCT係数ブロックR’uvを再びエントロピー
符号化して符号用メモリ35に戻す。図9は、埋め込み
部37の詳細な構成図である。同図において埋め込み部
37は、圧縮画像入力部101、判定値入力部102、
埋め込み量入力部103、圧縮音声入力部104、エン
トロピー復号化部105、選択部106、埋め込み処理
部107、出力部108から構成される。
【0031】圧縮画像入力部101は、符号用メモリに
記憶される圧縮符号列を読み出してエントロピー復号化
部105に出力する。判定値入力部102は、判定値J
を予め記憶する。判定値Jは、選択部106が量子化D
CT係数ブロックRuvの中から埋め込み用の量子化DC
T係数を決定する際のしきい値となる。本実施形態にお
いて判定値Jは2とする。この判定値2以上の量子化D
CT係数が埋め込み用の候補となる。
【0032】埋め込み量入力部103は、埋め込み量N
を予め記憶する。埋め込み量Nは、約10秒分に相当す
る圧縮音声データのデータ量38400バイトを、輝度
成分の総ブロック数で割って、ビットに換算した値であ
り、本実施形態においてNは38400バイト÷192
00ブロック=16ビットである。圧縮音声入力部10
4は、オーディオメモリ44に記憶される圧縮音声デー
タを、埋め込み量入力部103に記憶される埋め込み量
Nに分割して、埋め込み処理部107に出力する。
【0033】エントロピー復号化部105は、圧縮画像
入力部101より出力される圧縮符号列をエントロピー
復号し、輝度成分の量子化DCT係数ブロックRuvを選
択部106に出力する。 (選択部106)選択部106は、エントロピー復号化
部105より出力される量子化DCT係数ブロックRuv
毎に、DC係数(R00)を除く63個の量子化DCT係
数(AC係数)の中から合計N個(16個)の量子化D
CT係数を埋め込み用として選択し、選択結果を埋め込
み処理部107に出力する。
【0034】選択部106は、量子化DCT係数ブロッ
クRuvに対応する8×8個の埋め込みフラグEuv(u,v
=0〜7)を有し、選択された量子化DCT係数に対応
する埋め込みフラグEuvをセットすることにより前記選
択結果を記録する。より具体的には、埋め込みフラグE
uvは、初期設定では全てオフに設定されており、選択部
106は、埋め込み用として選択した量子化DCT係数
に対応する選択フラグをオンに設定する。埋め込み用と
して選択されなかった量子化DCT係数に対応する選択
フラグについてはオフのままである。
【0035】選択部106は、後に画像が復号された場
合に、符号化前の元の画像と比べて視覚的な劣化が極力
少なくなるように埋め込み用の量子化DCT係数を選択
する。そうするために本実施形態では選択部106は、
量子化DCT係数の絶対値が判定値J以上のもの、
低周波のもの、の中からをより優先させながら、埋
め込み用の量子化DCT係数を選択する。
【0036】の条件を用いる理由は、絶対値が小さい
量子化DCT係数は、絶対値の大きい量子化DCT係数
に比べて、1ビットの値が変化したときの誤差が大き
い。したがって絶対値の大きい量子化DCT係数に埋め
込みを行う方が劣化が少なくなるからである。の条件
を用いる理由は、図8(c)の量子化テーブルQuvを見
ればわかるように、高周波の量子化DCT係数は、低周
波の量子化DCT係数に比べて、より大きな値で逆量子
化される。このため高周波の量子化DCT係数は、低周
波の量子化DCT係数に埋め込みを行った場合と比べ
て、逆量子化した結果のDCT係数は、符号化時のDC
T係数と比較して誤差が大きくなる。したがって高周波
よりも低周波の量子化DCT係数の方が埋め込みを行っ
た場合の劣化が少なくなるからである。
【0037】をより優先させる理由は、よりの
方が値が変化したときの劣化が少ないからである。図1
0は、選択部106による、選択処理を示すフローチャ
ートである。同図において選択部106は、量子化DC
T係数(AC係数)を1つ読み出して、その絶対値が判
定値J(=2)以上であるか否かを判定する(ステップ
11、12)。この判定は、量子化DCT係数の下位か
ら2番目以上のビット値に1があるか否かによって判定
すればよい。すなわち選択部106は、量子化DCT係
数の絶対値の下位から2番目以上のビット値に、1が1
つでもあれば量子化DCT係数の絶対値は2以上の値で
あり、1が1つもなければ量子化DCT係数の絶対値
は、2より小さい値であると判定する。
【0038】判定の結果、絶対値が判定値J以上の場合
には、対応する埋め込みフラグをセットし、変数Cに1
を足しこむ(ステップ13、14)。変数Cは、セット
された埋め込みフラグの数、つまり埋め込み用として選
択された量子化DCT係数の数を示す。このように選択
部106は、量子化DCT係数ブロックをジグザグ順に
走査しながら、63個の量子化DCT係数(AC係数)
についてステップ11〜14の処理を繰り返す。この処
理は、変数Cが埋め込み量N以上の場合、又は、63個
の量子化DCT係数(AC係数)全てについてステップ
11〜14の処理を行った場合に終了して、ステップ1
6に進む。
【0039】ステップ16において選択部106は、変
数Cが埋め込み量Nより小さいか否かを判定する。判定
の結果、変数Cが埋め込み量Nより小さい場合、埋め込
み用として選択された量子化DCT係数の個数が、部分
圧縮音声データのデータ量に達していないということで
あるから、選択部106は、低周波側からジグザグスキ
ャン順に、埋め込みフラグがオフになっているものの中
から(埋め込み量N−変数C)個を埋め込み用と選択し
て埋め込みフラグをセットする(ステップ17)。
【0040】選択部106は、以上の手順によってN個
の埋め込み用の量子化DCT係数を選択する。 (選択処理例1)図11(a)は、選択部106が図8
(d)の量子化DCT係数ブロックRuvについて選択処
理を行った場合に埋め込み用として選択される量子化D
CT係数を丸印で囲って示している。
【0041】選択部106は、量子化DCT係数ブロッ
クRuvをジグザグ順に走査しながら、各量子化DCT係
数(AC係数)について判定値J以上であるか否かを判
定する。同図(a)の例では、選択部106は、−34、
26、−19、30、…の順に埋め込み用として選択し
ていき、最後に−2を選択した時点で選択した量子化D
CT係数の数が埋め込み量Nに達したので選択処理を終
了している。
【0042】同図(b)は、選択部106が同図(a)
について選択処理を行った場合の選択結果の埋め込みフ
ラグEuvを示す。同図(b)において1はフラグがセッ
トされていることを示し、その位置に対応する量子化D
CT係数が埋め込み用として選択されたことを示す。ま
た0はフラグがセットされていないことを示し、その位
置に対応する量子化DCT係数は埋め込み用として選択
されていないことを示す。 (選択処理例2)図12(a)は、選択部106が図8
(d)とは別の量子化DCT係数ブロックについて図1
0のステップ11〜15を繰り返した結果、埋め込み用
として選択された量子化DCT係数を丸印で囲って示
す。同図に示すように選択部106は、ジグザグスキャ
ン順に、10、−11、−12、5、5、12、…の順
に埋め込み用として選択していき、量子化DCT係数ブ
ロックの最後まで走査している。
【0043】図12(a)に対応する埋め込みフラグを
同図(b)に示す。同図(b)に示すようにセットされ
ている埋め込みフラグの数は13個であり、埋め込み量
N(=16)より少ない。そこで選択部106は、ステ
ップ17の処理を行う。具体的には、同図(b)の埋め
込みフラグをジグザグスキャン順に走査して、16−3
=3個のセットされていない埋め込みフラグをセットし
て、全体として16個の埋め込みフラグをセットする。
同図(b)において丸印で囲まれた埋め込みフラグが、
ステップ17の処理により新たにセットされる。
【0044】図12(c)は、選択部106の選択処理
による最終的な選択結果の埋め込みフラグを示す。 (埋め込み処理部107)埋め込み処理部107は、量
子化DCT係数ブロックRuv毎に、選択部106によっ
て埋め込み用として選択された16個の量子化DCT係
数に部分圧縮音声データの埋め込みを行う。
【0045】詳しくは、埋め込み処理部107は、選択
部106より出力される埋め込みフラグをジグザグスキ
ャン順に走査してセットされている埋め込みフラグを探
す。セットされている埋め込みフラグを見つけたら、埋
め込み処理部107は、その埋め込みフラグに対応する
量子化DCT係数の最下位ビットを、圧縮音声入力部1
04から入力される部分圧縮音声データの1ビットに変
更する。埋め込み処理部107は、この操作をセットさ
れている16個のフラグ分繰り返す。このようにして埋
め込み処理部107は、部分圧縮音声データの先頭から
1ビットずつを埋め込み用の量子化DCT係数の最下位
ビットに埋め込み、埋め込みの済んだ量子化DCT係数
ブロックを出力部108に出力する。 (埋め込み処理例)図13(a)は、部分圧縮音声デー
タの一例を示す。埋め込み処理部107は、この部分圧
縮音声データの先頭から1ビットずつを、埋め込み用と
して選択された量子化DCT係数に埋め込む。
【0046】同図(b)は、埋め込み処理部107が同
図(a)の部分圧縮音声データを図12(a)の量子化
DCT係数ブロックに埋め込んだ場合の結果を示す。図
13(b)において丸印で囲まれている量子化DCT係
数は、部分圧縮音声データが埋め込まれていることを示
す。埋め込み処理部107は、図12(c)の埋め込み
フラグをジグザグスキャン順に走査してセットされてい
る埋め込みフラグを探し、見つけたらそのフラグに対応
する量子化DCT係数に部分圧縮音声データを1ビット
埋め込む。 (出力部108)出力部108は、埋め込み処理部10
7によって埋め込みの済んだ量子化DCT係数ブロック
に対してエントロピー符号化部74と同様のエントロピ
ー符号化を行って、結果の圧縮符号列を符号用メモリ3
5に出力する。この圧縮符号列はすなわち音声付き圧縮
画像である。
【0047】以上のようにして埋め込み37は、圧縮符
号列を復号した量子化DCT係数ブロックに、部分圧縮
音声データの埋め込みを行って、再び圧縮符号列に符号
化して符号用メモリに出力するという処理を繰り返すこ
とにより、1枚の音声なし圧縮画像に約10秒の圧縮音
声データを埋め込む。このようにして埋め込み部37
は、各ブロックについて画像の劣化に影響しない16個
の量子化DCT係数の最下位ビットに部分圧縮音声デー
タの埋め込みを行うので、全体として2バイト×192
00ブロック=38400バイト分の埋め込みが行われ
ることとなり、より多くの圧縮音声データを画像の劣化
少なく埋め込むことができる。 (抽出部83の詳細構成)図14は、抽出部83の詳細
な構成図である。
【0048】同図において抽出部83は、識別部83
1、抽出処理部832から構成される。識別部831
は、エントロピー復号化部84より量子化DCT係数ブ
ロックRuv又はR’uvが出力されると、図10のフロー
チャートと同じ処理によって、埋め込みフラグを生成す
る。ここで識別部831は、量子化DCT係数ブロック
がRuvであってもR’uvであっても埋め込みフラグの生
成を行う。つまり圧縮画像が音声なしであるか音声付き
であるかに関係なく埋め込みフラグの生成を行う。これ
により音声付き圧縮画像の量子化DCT係数ブロック
R’uvであれば、識別部831は選択部106によって
作成されたものと同じ埋め込みフラグを復元するし、音
声なし圧縮画像の量子化DCT係数ブロックRuvであれ
ば、識別部831は全てのフラグがオフの埋め込みフラ
グを生成する。
【0049】抽出処理部832は、識別部831により
復元された埋め込みフラグをジグザグスキャン順に参照
して、オンに設定されている埋め込みフラグに対応する
量子化DCT係数の最下位ビットを抽出してオーディオ
メモリ54に出力する。以上のようにして抽出部83
は、選択処理及び埋め込み処理と逆の処理を行うことに
よって、部分圧縮音声データが埋め込まれた量子化DC
T係数ブロックから部分圧縮音声データを抽出し、これ
を全ての量子化DCT係数ブロックについて行うことに
よって約10秒の圧縮音声データを抽出する。 (実施形態2)以下、本発明の実施形態2のデジタルカ
メラ2について説明する。
【0050】デジタルカメラ2は、デジタルカメラ1と
同様の方法により量子化DCT係数の最下位ビットに圧
縮音声データを埋め込むのに加えて、量子化DCT係数
の下位から2ビット目と3ビット目にも圧縮音声データ
を埋め込むことにより、実施形態1よりも1枚の画像に
多くの圧縮音声データを埋め込むことができる。その構
成は、図3に示すデジタルカメラ1の構成と比較して、
埋め込み部37と抽出部83の代わりに埋め込み部47
と抽出部93を備える点が異なっている。
【0051】以下、埋め込み部47と抽出部93につい
て説明する。 (埋め込み部47)図15は埋め込み部47の詳細構成
図を示す。同図において埋め込み部47は、圧縮画像入
力部101、判定値入力部202、埋め込み量入力部1
03、圧縮音声入力部204、エントロピー復号化部1
05、選択部206、埋め込み処理部207、出力部1
08から構成される。
【0052】同図において図9の埋め込み部37と同じ
符号の構成要素は同じ機能であるので説明を省略し、以
下符号の異なる構成要素について説明する。判定値入力
部202は、判定値J、J2、J3を予め記憶する。本
実施形態においてJ、J2、J3はそれぞれ2、4、8
である。圧縮音声入力部204は、オーディオメモリ4
4に記憶される圧縮音声データを埋め込み量単位に区切
って埋め込み処理部207に出力する。埋め込み量は、
量子化DCT係数ブロック毎に異なっており、選択部2
06より指示される。
【0053】選択部206は、実施形態1と同じく図1
0に示す選択処理によって最下位ビットに埋め込むため
の量子化DCT係数を選択する。この処理は実施形態1
と同様であるので説明を省略する。上記選択処理に加え
て選択部206は、2ビット目、3ビット目に埋め込む
ための量子化DCT係数を選択する。
【0054】選択部206は各量子化DCT係数をその
絶対値の大きさに応じてクラス分けし、各クラスに属す
る量子化DCT係数の個数に応じて埋め込みを行う量子
化DCT係数の個数と埋め込みを行うビット位置とを決
定する。図16は、選択部206が埋め込みを行う量子
化DCT係数の数と埋め込みを行うビット位置とを決定
するための論理を表わすフローチャートである。
【0055】同図において選択部206は、まず1つの
量子化DCT係数ブロック中の63個のAC係数におい
て、絶対値が4以上の量子化DCT係数の個数C2と絶
対値が8以上の量子化DCT係数の個数C3とを数える
(ステップ21)。次に選択部206は、C2、C3の
値に応じて以下の決定を行う。C3が8以上の場合、つ
まり量子化DCT係数ブロック中に絶対値が8以上の量
子化DCT係数の個数が8個以上ある場合(ステップ2
2)、選択部206は絶対値が8以上の4個の量子化D
CT係数についてその下位から3ビット目を埋め込み用
と決定し、また絶対値が4以上の8個の量子化DCT係
数についてその下位から2ビット目を埋め込み用と決定
する(ステップ23)。
【0056】C3が8未満であってC2が8以上の場
合、つまり量子化DCT係数ブロック中に絶対値が8以
上の量子化DCT係数の個数が8個未満であって絶対値
が4以上の量子化DCT係数の個数が8個以上ある場合
(ステップ24)、選択部206は絶対値が4以上の8
個の量子化DCT係数についてその下位から2ビット目
を埋め込み用と決定する(ステップ25)。
【0057】C2が4以上8未満の場合、つまり量子化
DCT係数ブロック中に絶対値が4以上の量子化DCT
係数の個数が4個以上8個未満ある場合(ステップ2
6)、選択部206は絶対値が4以上の4個の量子化D
CT係数の下位から2ビット目を埋め込み用と決定する
(ステップ27)。選択部206は、実施形態1と同様
の埋め込みフラグEuvを有する他、下位から2ビット目
用と3ビット目用の埋め込みフラグE2uv(u,v=0〜
7)と埋め込みフラグE3uv(u,v=0〜7)とを有
し、先の決定結果に従って埋め込みフラグE2uv、E3
uvをセットする。
【0058】より具体的には、決定結果がステップ23
である場合、選択部206はDC係数を除く量子化DC
T係数(AC係数)をジグザグスキャン順に走査して、
絶対値が8以上の量子化DCT係数を4個選択してそれ
に対応する埋め込みフラグE3uvをセットし、また同様
にしてDC係数を除く量子化DCT係数(AC係数)を
ジグザグスキャン順に走査して、絶対値が4以上の量子
化DCT係数を8個選択してそれに対応する埋め込みフ
ラグE2uvをセットする。
【0059】また決定結果がステップ25である場合、
選択部206はDC係数を除く量子化DCT係数(AC
係数)をジグザグスキャン順に走査して、絶対値が4以
上の量子化DCT係数を8個選択してそれに対応する埋
め込みフラグE2uvをセットする。埋め込みフラグE3
uvはセットしない。また決定結果がステップ27である
場合、選択部206はDC係数を除く量子化DCT係数
(AC係数)をジグザグスキャン順に走査して、絶対値
が4以上の量子化DCT係数を4個選択してそれに対応
する埋め込みフラグE2uvをセットする。埋め込みフラ
グE3uvはセットしない。
【0060】例えば図12(a)に示す量子化DCT係
数ブロックについて決定処理を行った場合、絶対値が4
以上のAC係数は10、−11、−12、5、5、1
2、−7、−7、4の9個だからC2=9、絶対値が8
以上のAC係数は10、−11、−12、12の4個だ
からC3=4である(ステップ21)。よって決定結果
は、ステップ25に相当するので、図12(a)の量子
化DCT係数ブロックの中から絶対値が4以上の8個の
量子化DCT係数の下位から2ビット目が埋め込み用と
決定される。図17に、この決定結果に従ってセットさ
れた埋め込みフラグE2uvを示す。同図に示すように絶
対値が4以上の8個の量子化DCT係数がジグザグスキャ
ン順に選択され、それに対応する埋め込みフラグE2uv
がセットされる。なおステップ25の決定結果によれ
ば、埋め込みフラグE3uvは1つもセットされない。
【0061】さらに選択部206は最下位ビット、下位
から2ビット目、3ビット目を合わせた埋め込み量を圧
縮音声入力部204に通知する。具体的には、決定結果
がステップ23の場合、下位から2ビット目への埋め込
みが8ビット、下位から3ビット目への埋め込みが4ビ
ット、また最下位ビットへの埋め込みが16ビットであ
るので、選択部206は12と16の合計28を埋め込
み量として通知する。
【0062】また決定結果がステップ25の場合、下位
から2ビット目への埋め込みが8ビット、最下位ビット
への埋め込みが16ビットであるので、選択部206は
8と16の合計24を埋め込み量として通知する。また
決定結果がステップ27の場合、下位から2ビット目へ
の埋め込みは4ビット、最下位ビットへの埋め込みが1
6ビットであるので、選択部206は4と16の合計2
0を埋め込み量として通知する。
【0063】埋め込み処理部207は、埋め込みフラグ
Euv、E2uv、E3uvに基づいて量子化DCT係数の最下
位ビット、下位から2ビット目、下位から3ビット目へ
の部分圧縮音声データの埋め込みを行う。詳しくは、埋
め込み処理部207は実施形態1と同様にして埋め込み
フラグEuvに基づいて最下位ビットへの埋め込みを行
う。これについては実施形態1と同様であるので説明を
省略する。
【0064】次に埋め込み処理部207は、埋め込みフ
ラグE2uvをジグザグスキャン順に走査して、セットさ
れている埋め込みフラグを探し、見つけたらそれに対応
する量子化DCT係数の下位から2ビット目を圧縮音声
入力部204から入力される部分圧縮音声データの1ビ
ットに変更する。埋め込みフラグE2uvの走査が終了す
ると、埋め込み処理部207は同様にして埋め込みフラ
グE3uvについてもジグザグスキャン順に走査して、セ
ットされている埋め込みフラグに対応する量子化DCT
係数の下位から3ビット目を部分圧縮音声データの1ビ
ットに変更する。
【0065】以上のようにして埋め込み部47は、各ブ
ロックについて画像の劣化に影響しない量子化DCT係
数とそのビット位置とを選択して、部分圧縮音声データ
の埋め込みを行うので、全体で約43〜48Kバイトの
圧縮音声データが埋め込まれることとなる。抽出部93
は、エントロピー復号化部84より量子化DCT係数ブ
ロックが出力されると、選択部206が行う処理と同様
の方法によって埋め込みフラグEuv、E2uv、E3uvを
復元し、それらのフラグに基づいて量子化DCT係数の
最下位ビット、下位から2ビット目、下位から3ビット
目より部分圧縮音声データを抽出し、オーディオメモリ
54に出力する。
【0066】このように抽出部93は、埋め込み部47
とは逆の操作を行うことによって部分圧縮音声データを
抽出することができる。以上、本発明の実施形態1、2
について説明したが、本発明は実施形態1、2に限ら
ず、以下のようにしても良い。 (1)実施形態1において埋め込み部37はデジタルカ
メラ内部に備えられていたが、デジタルカメラ内部に備
えずに埋め込み部37単体で構成してもよい。実施形態
2の埋め込み部47についても同様である。
【0067】また埋め込み部37及び47をパソコン等
の画像処理の可能な装置の内部に構成してもよい。 (2)実施形態1において埋め込み部37は、一度符号
化された圧縮画像をエントロピー復号によって量子化D
CT係数ブロックに戻してから部分圧縮音声データを埋
め込むという手順で埋め込みを行っていたが、符号化部
34による符号化の段階で埋め込みを行うように構成し
ても良い。より詳しくは、埋め込み部37は、符号化部
34におけるDCT部71、量子化部72によってDC
Tと量子化とが施された後であって、エントロピー符号
化部74によって符号化される前の量子化DCT係数ブ
ロックに対して埋め込みを行う。この場合埋め込み部3
7が有するエントロピー復号化部105と出力部108
とは不要となる。 (3)圧縮画像のデータ量、判定値、埋め込み量、量子
化テーブルQuv等は、実施形態1及び2に示す値に限ら
ない。
【0068】例えば判定値Jは3や4でもよい。ただし
n(nは自然数)を用いるのが望ましい。その理由
は、選択部106は、量子化DCT係数の下位から(n
+1)番目以上のビット値に1があるか否かを判定する
ことにより、その係数が2n以上か否かを簡単に判定す
ることができるからである。また異なる量子化テーブル
を複数有するよう構成し、量子化テーブルに応じて判定
値や埋め込み量を変えても良い。
【0069】画像の劣化と埋め込み量との兼ね合いを考
慮して量子化DCT係数の下位から1ビット目、2ビッ
ト目、3ビット目への埋め込み量を実施形態2よりも多
くしても良い。例えば量子化テーブルの値を全体的に小
さくして圧縮率を低くすれば、1ビット目に30ビッ
ト、2ビット目に16ビット、3ビット目に8ビットと
いうように埋め込み量を多くすることも可能である。 (4)エントロピー符号化部74と出力部108、エン
トロピー復号化部105とエントロピー復号化部84、
撮影画像メモリ33と表示用画像メモリ61、オーディ
オメモリ44とオーディオメモリ54等、デジタルカメ
ラ内部において同じ機能の2つの構成要素は、一方をな
くして1つだけで共用しても良い。 (5)実施形態1においてはデジタルカメラ1は、各量
子化DCT係数に部分圧縮音声データを一律に埋め込む
構成であった。この構成によれば、判定値J以上の量子
化DCT係数の数が埋め込み量Nより少ないブロックに
ついては、判定値Jより小さい値の量子化DCT係数に
も埋め込みが行われるので、そのブロックは、他のブロ
ックよりも劣化することになるという問題がある。この
ような問題に対して次のような方法で対処してもよい。
すなわち選択部106は、まず量子化DCT係数毎に、
DC係数を除く63個のAC係数中に、その絶対値が判
定値J以上の値の係数の数を数え上げる。次に選択部1
06は、数え上げた係数の数が埋め込み量Nの値以上で
あるか否かを判定する。判定の結果、埋め込み量Nの値
以上である場合には、その量子化DCT係数ブロックに
埋め込みを行う、と決定し、ジグザグスキャン順に判定
値J以上の量子化DCT係数ブロックを埋め込み用とし
て選択して埋め込みフラグをセットする。判定の結果、
埋め込み量Nの値よりも少ない場合には、その量子化D
CT係数ブロックには埋め込みを行わない、と決定し埋
め込みフラグのセットを行わない。埋め込み処理部10
7は、選択部106によってセットされている埋め込み
フラグのあるブロックについてのみ部分圧縮音声データ
の埋め込みを行う。これによって、実施形態1の構成よ
りも埋め込み可能な圧縮音声データのデータ量は少なく
なるが、実施形態1の構成よりも画質を保護できるとい
う効果がある。 (6)埋め込み部37の各構成要素の機能をプログラム
化してROMに記録し、CPU、RAM、ROMからな
るマイクロコンピュータにより実現してもよい。より具
体的には、CPUはROMからプログラムを読み出して
実行することにより、量子化DCT係数ブロックRuvの
中から低周波のAC係数と絶対値が判定値2以上のAC
係数とから16個のAC係数を選択する選択ステップ
と、選択処理によって選択された16個のAC係数の最
下位ビットを16ビットの部分圧縮音声データに置き換
える置き換えステップとを行う。選択ステップは図10
に示すフローチャートをプログラム化したもので、CP
Uは量子化DCT係数RuvのAC係数についてジグザグ
スキャンし、判定値2以上の量子化DCT係数があれば
それに対応する埋め込みフラグをオンする第1選択ステ
ップを行う。この埋め込みフラグはRAMに記憶されて
いる。CPUは埋め込みフラグをオンにした個数Cが埋
め込み量16に達したとき、または最後の量子化DCT
係数までジグザグスキャンしたとき第1選択ステップを
終了する。CPUはフラグをオンにした個数Cが埋め込
み量16より少ないか否かを判定し、少ない場合にはジ
グザグスキャン順にオフになっている埋め込みフラグ
(16−C)個をオンにする第2選択ステップを行う。
CPUは、埋め込みフラグがオンになっている量子化D
CT係数について上記置き換えステップによる置き換え
を行う。
【0070】
【発明の効果】本発明の埋め込み装置は、画像に離散コ
サイン(DCT)変換と量子化とを施すことにより生成
される量子化DCT係数ブロック中、低周波のAC係数
と絶対値が第1しきい値以上のAC係数とから所定個の
AC係数を選択する選択手段と、前記選択手段により選
択された所定個のAC係数の最下位ビットを音声データ
に置き換える置換え手段とを備える。
【0071】この構成によれば埋め込み装置は、最下位
ビットの値を変化させた場合に画像の劣化がより少なく
なるようなAC係数を選択して音声データを埋めこむの
で画像の劣化が少なくなるという効果がある。ここで画
像の劣化が少なくなるのは、以下の理由による。まず低
周波のAC係数について説明すると、低周波のAC係数
は、通常、高周波のAC係数に比べて小さい量子化レベ
ルで量子化されるという特徴がある。これは人間の視覚
特性が高周波成分に鈍感で低周波成分に敏感であるた
め、高周波成分を粗く量子化するで圧縮率を高めている
からである。AC係数は、復号の際、量子化レベルと同
じ値で逆量子化されるので、低周波のAC係数は小さい
レベルで逆量子化され、高周波のAC係数は大きいレベ
ルで逆量子化されることとなる。よって、同じように最
下位ビットを0から1に置き換えたとしても低周波の方
が高周波よりも逆量子化後の誤差が小さく、つまり画質
の劣化が少ない。
【0072】また絶対値がしきい値以上のAC係数につ
いて説明すると、絶対値の大きいAC係数は、絶対値が
小さいAC係数と比較して、最下位ビットが変化した場
合の変化の割合が小さい。例えば16のAC係数の最下
位ビットが17になった場合と、0のAC係数が1にな
った場合とを比べると、16から17に変化した方が変
化の割合が小さい。また絶対値が大きいAC係数は、低
周波であることが多く(なぜなら低周波の方が小さい量
子化レベルで量子化されているので値が大きい場合が多
いからである)、その分逆量子化後の誤差が小さい。こ
れらから絶対値がしきい値以上のAC係数は、しきい値
より小さいAC係数に比べて画像の劣化が少ない。
【0073】また前記選択手段は、絶対値が第1しきい
値以上のAC係数を選択する第1選択部と、前記第1選
によって選択されたAC係数の個数が所定個に満た
ない場合には、第1しきい値未満であってより低周波の
AC係数から順に所定個になるまでAC係数を選択する
第2選択部とを備える。この構成によれば埋め込み装置
は、絶対値が大きいAC係数を低周波のAC係数よりも
優先させて選択することによって置換えを行った場合の
画質の劣化を少なくしている。これは絶対値が大きいA
C係数の方が低周波のAC係数よりも、最下位ビットを
置き換えた場合の画質の劣化が少ないからである。
【0074】絶対値がしきい値未満の低周波のAC係数
は、逆量子化レベルが小さいという1つの要因によって
最下位ビットを変化させた場合の誤差を小さくしてい
る。一方、絶対値がしきい値以上のAC係数は、比較的
低周波側に分布するので、逆量子化レベルが小さい。こ
れに加えて絶対値がしきい値以上のAC係数は、絶対値
がしきい値より小さいAC係数に比べて最下位ビットが
変化した場合の変化率が小さい。このように絶対値がし
きい値以上のAC係数は逆量子化レベルが小さいことと
最下位ビットが変化した場合の変化率が小さいこととの
2つの要因から誤差を小さくしている。このことから埋
め込み装置は、絶対値が大きいAC係数を低周波のAC
係数より優先的に選択することによって、より画質の劣
化を低減している。
【0075】前記埋め込み装置は、さらに、量子化DC
T係数ブロック中、絶対値が第1しきい値より大きい第
2しきい値以上のAC係数を選択する追加選択手段と、
前記追加選択手段により選択されたAC係数の最下位か
ら2ビット目音声データに置き換える追加置換え手段
とを備える。この構成によれば埋め込み装置は、最下位
ビットに音声データを埋め込むのに加えて、最下位から
2ビット目にも音声データを埋め込むので、より多くの
音声データを埋め込むことができるという効果がある。
また絶対値が第2しきい値以上のAC係数、つまり最下
位から2ビット目が変化した場合の変化率の小さいAC
係数を埋め込み用として選択するので、本埋め込み装置
は、画像の劣化が少なく、より多くの音声データを埋め
込むことができる。
【0076】本発明のデジタルカメラは、圧縮画像に数
秒間の音声データに相当する圧縮音声データを埋め込む
デジタルカメラであって、圧縮画像から離散コサイン変
換と量子化とが施された量子化DCT係数ブロックを得
る獲得手段と、前記圧縮音声データを分割して所定ビッ
トの部分圧縮音声データにする分割手段と、獲得される
量子化DCT係数ブロック中、低周波のAC係数と絶対
値が第1しきい値以上のAC係数とから前記所定個のA
C係数を選択する選択手段と、前記選択手段により選択
された前記所定個のAC係数の最下位ビットを前記部分
圧縮音声データに置き換える置換え手段とを備える。
【0077】この構成によればデジタルカメラは、画像
の劣化が少なくて済む所定個のAC係数に所定ビットの
部分圧縮音声データを埋め込むという操作を各量子化D
CT係数ブロックに対して行うので、全体として所定ビ
ット×総ブロック数という多くの音声データを画像の劣
化少なく埋め込むことができる。
【図面の簡単な説明】
【図1】デジタルカメラ1の正面側の外観図である。
【図2】デジタルカメラ1の背面側の外観図である。
【図3】デジタルカメラ1の概略構成図である。
【図4】図3の詳細構成図である。
【図5】符号化部34のより詳細な構成図である。
【図6】復号化部62のより詳細な構成図である。
【図7】1画面分の輝度成分Yとブロックとの関係を示
す。
【図8】(a)輝度成分Yの1ブロック分の画素の具体
例Yxy(x,y=0〜7;x,yはブロック中の画素位置を表
わす)を示す。 (b)Yxyに対してDCTを行うことにより得られるD
CT係数ブロックSuvを示す。 (c)量子化テーブルQuvの具体例を示す。 (d)図8(b)に示したDCT係数ブロックSuvを図
8(c)の量子化テーブルQuvで量子化した場合の量子
化DCT係数ブロックRuvを示す。
【図9】埋め込み部37の詳細な構成図である。
【図10】選択部106による、選択処理を示すフロー
チャートである。
【図11】(a)図8(d)の量子化DCT係数ブロッ
クRuvの中から埋め込み用として選択される量子化DC
T係数を丸印で囲って示す。 (b)選択部106が同図(a)について選択処理を行
った場合の選択結果の埋め込みフラグEuvを示す。
【図12】(a)選択部106が図8(d)とは別の量
子化DCT係数ブロックの中から埋め込み用として選択
される量子化DCT係数を丸印で囲って示す。 (b)(a)に対応する埋め込みフラグを示す。 (c)選択部106の選択処理による最終的な選択結果
の埋め込みフラグを示す。
【図13】(a)部分圧縮音声データの一例を示す。 (b)埋め込み処理部107が同図(a)の部分圧縮音
声データを図12(a)の量子化DCT係数ブロックに
埋め込んだ場合の結果を示す。
【図14】抽出部83の詳細な構成図である。
【図15】埋め込み部47の詳細構成図である。
【図16】選択部206が埋め込みを行う量子化DCT
係数の数と埋め込みを行うビット位置とを決定するため
の論理を表わすフローチャートである。
【図17】この決定結果に従ってセットされた埋め込み
フラグE2uvを示す。
【符号の説明】
3 画像符号化部 35 符号用メモリ 36 メモリカード入出力部 4 音声符号化部 37 埋め込み部 5 音声復号化部 6 画像復号化部 83 抽出部 31 撮像部 33 撮影画像メモリ 34 符号化部 71 DCT部 72 量子化部 74 エントロピー符号化部 84 エントロピー復号化部 82 逆量子化部 81 逆DCT部 101 圧縮画像入力部 102 判定値入力部 103 埋め込み量入力部 104 圧縮音声入力部 105 エントロピー復号化部 106 選択部 107 埋め込み処理部 108 出力部 831 識別部 832 抽出処理部
───────────────────────────────────────────────────── フロントページの続き (51)Int.Cl.7 識別記号 FI H04N 5/928 H04N 5/92 E 7/30 7/133 Z (58)調査した分野(Int.Cl.7,DB名) H04N 1/38 - 1/393

Claims (8)

    (57)【特許請求の範囲】
  1. 【請求項1】 画像に離散コサイン変換(DCT)と量
    子化とを施すことにより生成される量子化DCT係数ブ
    ロック中、低周波のAC係数と絶対値が第1しきい値以
    上のAC係数とから所定個のAC係数を選択する選択手
    段と、 前記選択手段により選択された所定個のAC係数の最下
    位ビットを音声データに置き換える置換え手段とを備え
    ることを特徴とする埋め込み装置。
  2. 【請求項2】 前記選択手段は、絶対値が第1しきい値
    以上のAC係数を選択する第1選択部と、前記 第1選択によって選択されたAC係数の個数が所
    定個に満たない場合には、第1しきい値未満であってよ
    り低周波のAC係数から順に所定個になるまでAC係数
    を選択する第2選択部とを備えることを特徴とする請求
    項1記載の埋め込み装置。
  3. 【請求項3】 前記埋め込み装置は、さらに、量子化DCT係数ブロック中、 絶対値が第1しきい値よ
    り大きい第2しきい値以上のAC係数を選択する追加選
    択手段と、 前記追加選択手段 により選択されたAC係数の最下位か
    ら2ビット目音声データに置き換える追加置換え手段
    を備えることを特徴とする請求項1又は2記載の埋め
    込み装置。
  4. 【請求項4】 画像に離散コサイン変換(DCT)と量
    子化とを施すことにより生成される量子化DCT係数ブ
    ロック中、低周波のAC係数と絶対値が第1しきい値以
    上のAC係数とから所定個のAC係数を選択する選択ス
    テップと、 前記選択ステップにより選択された所定個のAC係数の
    最下位ビットを音声データに置き換える置換えステップ
    とを備えることを特徴とする埋め込み方法。
  5. 【請求項5】 前記選択ステップは、 絶対値が第1しきい値以上のAC係数を選択する第1選
    択ステップと、前記 第1選択ステップによって選択されたAC係数の個
    数が所定個に満たない場合には、第1しきい値未満であ
    ってより低周波のAC係数から順に所定個になるまでA
    C係数を選択する第2選択ステップとを備えることを特
    徴とする請求項4記載の埋め込み方法。
  6. 【請求項6】 圧縮画像に数秒間の音声データに相当す
    る圧縮音声データを埋め込むデジタルカメラであって、 圧縮画像から離散コサイン変換と量子化とが施された量
    子化DCT係数ブロックを得る獲得手段と、 前記圧縮音声データを分割して所定ビットの部分圧縮音
    声データにする分割手段と、 獲得される量子化DCT係数ブロック中、低周波のAC
    係数と絶対値が第1しきい値以上のAC係数とから前記
    所定個のAC係数を選択する選択手段と、 前記選択手段により選択された前記所定個のAC係数の
    最下位ビットを前記部分圧縮音声データに置き換える置
    換え手段とを備えることを特徴とするデジタルカメラ。
  7. 【請求項7】 画像に音声データを埋め込ませる処理を
    コンピュータに実行させるためのプログラムを記録した
    コンピュータ読み取り可能な記録媒体であって、当該プ
    ログラムはコンピュータに、 画像に離散コサイン変換(DCT)と量子化とを施すこ
    とにより生成される量子化DCT係数ブロック中、低周
    波のAC係数と絶対値が第1しきい値以上のAC係数と
    から所定個のAC係数を選択する選択ステップと、 前記選択ステップにより選択された所定個のAC係数の
    最下位ビットを音声データに置き換える置換えステップ
    とを実行させることを特徴とするプログラムを記録した
    記録媒体。
  8. 【請求項8】 前記選択ステップは、 絶対値が第1しきい値以上のAC係数を選択する第1選
    択ステップと、前記 第1選択ステップによって選択されたAC係数の個
    数が所定個に満たない場合には、第1しきい値未満であ
    ってより低周波のAC係数から順に所定個になるまでA
    C係数を選択する第2選択ステップとからなることを特
    徴とするプログラムを記載した請求項7記載の記録媒
    体。
JP23389799A 1999-08-20 1999-08-20 埋め込み装置、デジタルカメラ及び記録媒体 Expired - Fee Related JP3398343B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP23389799A JP3398343B2 (ja) 1999-08-20 1999-08-20 埋め込み装置、デジタルカメラ及び記録媒体

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP23389799A JP3398343B2 (ja) 1999-08-20 1999-08-20 埋め込み装置、デジタルカメラ及び記録媒体

Publications (2)

Publication Number Publication Date
JP2001060875A JP2001060875A (ja) 2001-03-06
JP3398343B2 true JP3398343B2 (ja) 2003-04-21

Family

ID=16962297

Family Applications (1)

Application Number Title Priority Date Filing Date
JP23389799A Expired - Fee Related JP3398343B2 (ja) 1999-08-20 1999-08-20 埋め込み装置、デジタルカメラ及び記録媒体

Country Status (1)

Country Link
JP (1) JP3398343B2 (ja)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3977216B2 (ja) * 2001-09-27 2007-09-19 キヤノン株式会社 情報処理装置及び方法及び情報処理プログラム及び記憶媒体
JP4568732B2 (ja) * 2003-12-19 2010-10-27 クリエイティブ テクノロジー リミテッド デジタル画像を処理するための方法とそのシステム
JP2010288070A (ja) * 2009-06-11 2010-12-24 Hitachi Kokusai Electric Inc 画像符号化装置
WO2016057908A1 (en) * 2014-10-10 2016-04-14 Advanced Micro Devices, Inc. Hybrid block based compression

Also Published As

Publication number Publication date
JP2001060875A (ja) 2001-03-06

Similar Documents

Publication Publication Date Title
US6192138B1 (en) Apparatus and method for embedding/unembedding supplemental information
KR101089489B1 (ko) 디지털 이미지 처리 방법 및 이미지 표현 포맷
US7444031B2 (en) Image processing apparatus
JP4682102B2 (ja) 画像符号化装置及び画像符号化方法
US20090122164A1 (en) Roi setting method and apparatus, electronic camera apparatus, program, and recording medium
US9167198B2 (en) Image processing apparatus and image processing method
US7139020B2 (en) Digital camera including the compression of size-reduced images after picture taking is completed
JP4288398B2 (ja) 画像記録装置、画像再生装置および画像処理プログラムを記録した記録媒体
JP3398343B2 (ja) 埋め込み装置、デジタルカメラ及び記録媒体
US20030235339A1 (en) Method and apparatus for differentially compressing images
JPH02105679A (ja) ディジタル画像記録再生装置
JP3260284B2 (ja) 画像圧縮装置および画像伸張装置
JP3234583B2 (ja) 画像記録装置、その方法及びそのプログラムを記録している媒体並びに画像再生装置、その方法及びそのプログラムを記録している媒体
JP4143535B2 (ja) 画像データ処理装置、画像データ処理方法、画像データ配信装置および画像データ伝送システム
KR100530745B1 (ko) 고해상도 영상신호를 저해상도 디스플레이 장치에 디스플레이하는 디스플레이 방법
JP3870458B2 (ja) 画像データ検索装置および方法
JP3356712B2 (ja) 画像符号化装置、画像復号化装置、画像符号化方法及び画像復号化方法
JP2994437B2 (ja) デジタル電子スチルカメラ及び画像属性判定方法
JP3825871B2 (ja) 画像処理装置及び方法並びに画像処理のプログラムコードが格納されたコンピュータ可読記録媒体
JPH1066004A (ja) 画像ファイルサイズ制御装置
JP2001326939A (ja) 画像符号化装置、画像復号化装置、及びその方法並びに記憶媒体
JPH08307666A (ja) 文書・写真混在多階調画像のデータ処理装置
JPH05167973A (ja) 静止画ファイルシステム
JP4078135B2 (ja) 画像認識方法、画像認識装置及びコンピュータプログラム
JPH1141503A (ja) 画像撮影装置及び画像撮影方法

Legal Events

Date Code Title Description
FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080214

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090214

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100214

Year of fee payment: 7

LAPS Cancellation because of no payment of annual fees