JP4568732B2 - デジタル画像を処理するための方法とそのシステム - Google Patents
デジタル画像を処理するための方法とそのシステム Download PDFInfo
- Publication number
- JP4568732B2 JP4568732B2 JP2006545305A JP2006545305A JP4568732B2 JP 4568732 B2 JP4568732 B2 JP 4568732B2 JP 2006545305 A JP2006545305 A JP 2006545305A JP 2006545305 A JP2006545305 A JP 2006545305A JP 4568732 B2 JP4568732 B2 JP 4568732B2
- Authority
- JP
- Japan
- Prior art keywords
- data
- image
- audio
- audio data
- processing circuit
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims description 134
- 238000012545 processing Methods 0.000 title claims description 77
- 230000005236 sound signal Effects 0.000 claims description 19
- 230000008569 process Effects 0.000 claims description 17
- 238000006243 chemical reaction Methods 0.000 claims description 16
- 230000006978 adaptation Effects 0.000 claims description 8
- 238000004458 analytical method Methods 0.000 description 14
- 238000010586 diagram Methods 0.000 description 12
- 238000000605 extraction Methods 0.000 description 11
- 230000001413 cellular effect Effects 0.000 description 10
- 230000006835 compression Effects 0.000 description 10
- 238000007906 compression Methods 0.000 description 10
- 238000005516 engineering process Methods 0.000 description 8
- 239000000284 extract Substances 0.000 description 8
- 230000006870 function Effects 0.000 description 7
- 230000000873 masking effect Effects 0.000 description 6
- 238000011084 recovery Methods 0.000 description 6
- 230000002829 reductive effect Effects 0.000 description 5
- 230000015556 catabolic process Effects 0.000 description 4
- 238000006731 degradation reaction Methods 0.000 description 4
- 230000003287 optical effect Effects 0.000 description 4
- 235000002566 Capsicum Nutrition 0.000 description 3
- 239000006002 Pepper Substances 0.000 description 3
- 241000722363 Piper Species 0.000 description 3
- 235000016761 Piper aduncum Nutrition 0.000 description 3
- 235000017804 Piper guineense Nutrition 0.000 description 3
- 235000008184 Piper nigrum Nutrition 0.000 description 3
- 230000008901 benefit Effects 0.000 description 3
- 238000013139 quantization Methods 0.000 description 3
- 150000003839 salts Chemical class 0.000 description 3
- 230000003595 spectral effect Effects 0.000 description 3
- 230000000007 visual effect Effects 0.000 description 3
- 206010021403 Illusion Diseases 0.000 description 2
- 230000003044 adaptive effect Effects 0.000 description 2
- 238000012937 correction Methods 0.000 description 2
- 238000001514 detection method Methods 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 238000009499 grossing Methods 0.000 description 2
- 230000010354 integration Effects 0.000 description 2
- 230000004807 localization Effects 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000012805 post-processing Methods 0.000 description 2
- 238000003672 processing method Methods 0.000 description 2
- 230000035945 sensitivity Effects 0.000 description 2
- 238000012546 transfer Methods 0.000 description 2
- 230000002411 adverse Effects 0.000 description 1
- 238000013459 approach Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000005282 brightening Methods 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- OSUHJPCHFDQAIT-UHFFFAOYSA-N ethyl 2-{4-[(6-chloroquinoxalin-2-yl)oxy]phenoxy}propanoate Chemical compound C1=CC(OC(C)C(=O)OCC)=CC=C1OC1=CN=C(C=C(Cl)C=C2)C2=N1 OSUHJPCHFDQAIT-UHFFFAOYSA-N 0.000 description 1
- 238000000802 evaporation-induced self-assembly Methods 0.000 description 1
- 238000001914 filtration Methods 0.000 description 1
- 230000036039 immunity Effects 0.000 description 1
- 230000000670 limiting effect Effects 0.000 description 1
- 238000013507 mapping Methods 0.000 description 1
- 239000003550 marker Substances 0.000 description 1
- 238000005192 partition Methods 0.000 description 1
- 238000007639 printing Methods 0.000 description 1
- 230000001681 protective effect Effects 0.000 description 1
- 238000005070 sampling Methods 0.000 description 1
- 230000011218 segmentation Effects 0.000 description 1
- 230000001953 sensory effect Effects 0.000 description 1
- 238000005496 tempering Methods 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T1/00—General purpose image data processing
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T1/00—General purpose image data processing
- G06T1/0021—Image watermarking
- G06T1/0028—Adaptive watermarking, e.g. Human Visual System [HVS]-based watermarking
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/032—Quantisation or dequantisation of spectral components
- G10L19/038—Vector quantisation, e.g. TwinVQ audio
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N1/00—Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
- H04N1/32—Circuits or arrangements for control or supervision between transmitter and receiver or between image input and image output device, e.g. between a still-image camera and its memory or between a still-image camera and a printer device
- H04N1/32101—Display, printing, storage or transmission of additional information, e.g. ID code, date and time or title
- H04N1/32144—Display, printing, storage or transmission of additional information, e.g. ID code, date and time or title embedded in the image data, i.e. enclosed or integrated in the image, e.g. watermark, super-imposed logo or stamp
- H04N1/32149—Methods relating to embedding, encoding, decoding, detection or retrieval operations
- H04N1/32154—Transform domain methods
- H04N1/3217—Transform domain methods using wavelet transforms
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N1/00—Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
- H04N1/32—Circuits or arrangements for control or supervision between transmitter and receiver or between image input and image output device, e.g. between a still-image camera and its memory or between a still-image camera and a printer device
- H04N1/32101—Display, printing, storage or transmission of additional information, e.g. ID code, date and time or title
- H04N1/32144—Display, printing, storage or transmission of additional information, e.g. ID code, date and time or title embedded in the image data, i.e. enclosed or integrated in the image, e.g. watermark, super-imposed logo or stamp
- H04N1/32149—Methods relating to embedding, encoding, decoding, detection or retrieval operations
- H04N1/32154—Transform domain methods
- H04N1/32187—Transform domain methods with selective or adaptive application of the additional information, e.g. in selected frequency coefficients
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/134—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
- H04N19/154—Measured or subjectively estimated visual quality after decoding, e.g. measurement of distortion
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/134—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
- H04N19/162—User input
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/169—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
- H04N19/17—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/46—Embedding additional information in the video signal during the compression process
- H04N19/467—Embedding additional information in the video signal during the compression process characterised by the embedded information being invisible, e.g. watermarking
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/60—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/60—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
- H04N19/63—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding using sub-band based transform, e.g. wavelets
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N5/00—Details of television systems
- H04N5/76—Television signal recording
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2201/00—General purpose image data processing
- G06T2201/005—Image watermarking
- G06T2201/0052—Embedding of the watermark in the frequency domain
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/018—Audio watermarking, i.e. embedding inaudible data in the audio signal
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N2201/00—Indexing scheme relating to scanning, transmission or reproduction of documents or the like, and to details thereof
- H04N2201/32—Circuits or arrangements for control or supervision between transmitter and receiver or between image input and image output device, e.g. between a still-image camera and its memory or between a still-image camera and a printer device
- H04N2201/3201—Display, printing, storage or transmission of additional information, e.g. ID code, date and time or title
- H04N2201/3261—Display, printing, storage or transmission of additional information, e.g. ID code, date and time or title of multimedia information, e.g. a sound signal
- H04N2201/3264—Display, printing, storage or transmission of additional information, e.g. ID code, date and time or title of multimedia information, e.g. a sound signal of sound signals
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N2201/00—Indexing scheme relating to scanning, transmission or reproduction of documents or the like, and to details thereof
- H04N2201/32—Circuits or arrangements for control or supervision between transmitter and receiver or between image input and image output device, e.g. between a still-image camera and its memory or between a still-image camera and a printer device
- H04N2201/3201—Display, printing, storage or transmission of additional information, e.g. ID code, date and time or title
- H04N2201/328—Processing of the additional information
- H04N2201/3283—Compression
Landscapes
- Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Physics & Mathematics (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Acoustics & Sound (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Theoretical Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Editing Of Facsimile Originals (AREA)
- Image Processing (AREA)
- Compression Or Coding Systems Of Tv Signals (AREA)
Description
画像処理回路により前記ホスト画像を受信すること、
前記画像処理回路により前記ホスト画像の輝度データと色度データとを分離すること、
音声処理回路により音声データを受信すること、
乗算回路により前記輝度データに前記音声データを含ませ、修正輝度データを提供すること、
埋め込みモジュールにより前記修正輝度データと前記色度データとを結合することにより前記音声データを埋め込み、埋め込み画像を提供すること、を含み、
前記音声データの音声信号の振幅データは量子化されると共に位相データは廃棄され、かつ、前記音声データは前記埋め込み画像から自由に回復可能であることからなる。
前記埋め込み画像の輝度成分に離散ウェーブレット変換と離散コサイン変換の何れか1つを行うこと、
前記音声データに関連する量子化された振幅データを識別すること、
前記識別された振幅データに関連する位相データを推定することと、
前記量子化された振幅データと位相データに基づいて、出力信号を生成することからなる。
前記ホスト画像を受信するための画像処理回路、該画像処理回路は、輝度データを、離散ウェーブレット変換と離散コサイン変換とのうちの1つにより処理して、中間輝度データを提供し、そののち、量子化された振幅データが該中間輝度データに含まれる、と、
音声データを受信するための音声処理回路と、
前記音声データを前記ホスト画像内に埋め込み、埋め込み画像を提供する埋め込みモジュールと、を備え、
前記音声データの音声信号の振幅データは量子化されると共に位相データは廃棄され、かつ、前記音声データは埋め込み画像から自由に回復可能であることを特徴とする。
前記ホスト画像を受信し、前記ホスト画像の輝度成分を提供するための画像処理回路と、
前記輝度成分から前記音声データを抽出し、自由に抽出可能な音声データを提供するための音声処理回路
を備える。
Scale=max(|Di|) (1)
このとき
0<=i<=3、及びDiは置換のために選択されたサブバンドの4つの係数である。
S=Scale*Sglobal (2)
S<SminであればP=Smin,S>SmaxであればP=Smax,それ以外のすべての状況であればP=S (3)
Di‘=P*Ci (4)
このときDi‘は新たな係数であり、Ciは格子コードであり、Sglobalは全体のスケール化要素であり、Smin及びSmaxは歪曲を制限する。Sglobalと共に、Diは格子コードSの強度を決定し、知覚分析要素を提供する。Sは高周波数領域に対してより大きければ、歪曲をより良くマスクする。
M0’=round(M0/255*23)(所与の例においては15に等しい)
S=max(|−2.4|,|6.9|,|4.6|,|−0.5|)は6.9となる。
該値はその後(Smin=2、Smax=4)以内になるように切り取られ、よって6.9の値は4に切り取られる。
1.各格子コードCiのために(iが0から23の範囲である場合−テーブル260参照)以下が計算される。
Di=Ciとともに定位(N)を含む4−Dの平面から基点(0,0,0,0)までの距離
定位(N)の選択は任意であるが、しかしある実施形態において、タイを最小限にするために選択されている。単純にするため、N=(1,1,1,1)が選択される。
2.格子コードはその後、Diの降順にソートされる。
3.同じDiの格子コードが、例えばすべての可能な順序を徹底的に検討することで、入れ替えられる。Kを同じDiのコードの数とする。Kは小さい(例えば3)かもしれないことから、組み合わせの数はK!<<24!である。近隣する2つのコードの間のユークリッド距離の和が最短である場所で順序付けが選択される。格子コード(例えば格子コードモジュール46並びにD4格子テーブル260内の)が予め生成されていることが理解されるであろう。符号器と復号器は、対応する格子コードテーブルを有し、ある実施形態において、格子コードテーブルが刊行され、それによりそれらは自由に入手可能となる。ある実施形態において、符号化の間、各量子化されたSTFT振幅は、直接1つの格子コードに貼り付く。ノイズによって破損した正常化された格子コードテーブルが復号器で受信され、格子コード全体が適合入力(例えば最短のユークリッド距離を伴う入力)のために検索される。
φk=φk−1+2πωR、 (5)
このときRはサンプルにおけるホップサイズでωは正規化された周波数である。
w=1−d (6)
であり、この時wは重みで、w=0は信頼の最も低いレベルを示し、そしてdは抽出された雑音格子コードとそれからもっも近い適合の間のユークリッド距離であり、
d=√((C1−M1)2+(C2−M2)2+(C3−M3)2+(C4−M4)2) (7)
のとき、抽出格子コードはC=(C1,C2,C3,C4)で、
最も近い適合する格子コードはM=(M1,M2,M3,M4)である。
Claims (14)
- ホスト画像を処理するための方法であって、該方法は、
画像処理回路により前記ホスト画像を受信すること、
前記画像処理回路により前記ホスト画像の輝度データと色度データとを分離すること、
音声処理回路により音声データを受信すること、
乗算回路により前記輝度データに前記音声データを含ませ、修正輝度データを提供すること、
埋め込みモジュールにより前記修正輝度データと前記色度データとを結合することにより前記音声データを埋め込み、埋め込み画像を提供すること、を含み、
前記音声データの音声信号の振幅データは量子化されると共に位相データは廃棄され、かつ、前記音声データは前記埋め込み画像から自由に回復可能である、
ことを特徴とする方法。 - 請求項1に記載の方法であって、前記音声処理回路が、前記ホスト画像内に前記音声データを埋め込む前に、短時間フーリエ変換(STFT)を用いて前記音声データを処理すること、
よりなることを特徴とする方法。 - 請求項1に記載の方法であって、前記音声処理回路が、前記音声データを処理して、D4格子コードにマッピングすること、
よりなることを特徴とする方法。 - 請求項3に記載の方法であって、前記音声処理回路が、前記D4格子コードの格子コードをスケール化して、前記ホスト画像の歪みを最小限にすること、
よりなることを特徴とする方法。 - 請求項1に記載の方法であって、該方法は、
前記画像処理回路が、前記輝度データを処理して、中間輝度データを提供すること、
前記画像処理回路が、前記中間輝度データの少なくとも1つのサブバンドに知覚適合を行い、知覚適合サブバンドを提供すること、
前記乗算回路が、前記知覚適合サブバンド内に前記音声データを含ませ、前記修正輝度データを提供すること、
よりなることを特徴とする方法。 - 請求項1に記載の方法であって、該方法は、
前記画像処理回路が、前記中間輝度データから前記少なくとも1つのサブバンドを除去して、さらなる中間輝度データを提供すること、
前記画像処理回路が、前記知覚適合サブバンドと前記さらなる中間輝度データとを結合して、前記修正輝度データを提供すること、
よりなることを特徴とする方法。 - 請求項1に記載の方法であって、該方法は、
逆離散ウェーブレット変換モジュールが、前記修正輝度データに逆変換を行うこと、
前記埋め込みモジュールが、前記逆変換された輝度データを前記色度データと結合して、前記デジタル画像を定義する埋め込みホストを提供すること、
よりなることを特徴とする方法。 - 請求項7に記載の方法において、前記輝度データが、離散ウェーブレット変換モジュールと離散コサイン変換モジュールのうちの1つによって、前記輝度データが離散ウェーブレット変換と離散コサイン変換のうちの1つにより処理される、
ことを特徴とする方法。 - 請求項1に記載の方法であって、該方法は、
前記画像処理回路が、前記ホスト画像のRGB成分を、色差成分と輝度成分に変換すること、
前記画像処理回路が、前記ホスト画像の前記輝度成分を処理すること、
RGB変換モジュールが、前記ホスト画像をRGB成分へと変換すること、
よりなることを特徴とする方法。 - 請求項1に記載の方法であって、該方法は、
前記画像処理回路が、前記ホスト画像の一部をマスクすること、
前記画像処理回路が、前記ホスト画像の前記マスクされた部分を保持すること、
よりなることを特徴とする方法。 - 請求項1に記載の方法であって、該方法は、
前記画像処理回路が、前記ホスト画像の一部をマスクして、マスクされた部分とマスクされていない部分とを提供すること、
前記埋め込みモジュールが、前記マスクされた部分と前記マスクされていない部分の両方内に前記音声データを埋め込むこと、
よりなり、
前記マスクされた部分よりも、前記マスクされていない部分内に、1ピクセルあたりより多くの音声データが記憶される、
ことを特徴とする方法。 - ホスト画像を処理するためのシステムであって、該システムは、
前記ホスト画像を受信するための画像処理回路、該画像処理回路は、輝度データを、離散ウェーブレット変換と離散コサイン変換とのうちの1つにより処理して、中間輝度データを提供し、そののち、量子化された振幅データが該中間輝度データに含まれる、と、
音声データを受信するための音声処理回路と、
前記音声データを前記ホスト画像内に埋め込み、埋め込み画像を提供する埋め込みモジュールと、を備え、
前記音声データの音声信号の振幅データは量子化されると共に位相データは廃棄され、かつ、前記音声データは埋め込み画像から自由に回復可能である、
ことを特徴とするシステム。 - 請求項12に記載のシステムにおいて、前記音声処理回路は、前記ホスト画像内に前記音声データを埋め込む前に、短時間フーリエ変換を用いて前記音声データを処理する短時間フーリエ変換(STFT)モジュールを備える、
ことを特徴とするシステム。 - 請求項12に記載のシステムにおいて、前記量子化された音声は、前記ホスト画像のサブバンドの係数に基づいてスケール化される、
ことを特徴とするシステム。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US53102903P | 2003-12-19 | 2003-12-19 | |
PCT/SG2004/000419 WO2005059830A1 (en) | 2003-12-19 | 2004-12-17 | Method and system to process a digital image |
Publications (3)
Publication Number | Publication Date |
---|---|
JP2007515126A JP2007515126A (ja) | 2007-06-07 |
JP2007515126A5 JP2007515126A5 (ja) | 2008-02-14 |
JP4568732B2 true JP4568732B2 (ja) | 2010-10-27 |
Family
ID=34700177
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2006545305A Active JP4568732B2 (ja) | 2003-12-19 | 2004-12-17 | デジタル画像を処理するための方法とそのシステム |
Country Status (8)
Country | Link |
---|---|
US (1) | US8442262B2 (ja) |
EP (1) | EP1700266A4 (ja) |
JP (1) | JP4568732B2 (ja) |
KR (1) | KR101125351B1 (ja) |
CN (1) | CN100504922C (ja) |
AU (1) | AU2004300115B2 (ja) |
TW (1) | TWI463806B (ja) |
WO (1) | WO2005059830A1 (ja) |
Families Citing this family (31)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7248934B1 (en) | 2000-10-31 | 2007-07-24 | Creative Technology Ltd | Method of transmitting a one-dimensional signal using a two-dimensional analog medium |
EP1713063B1 (en) * | 2003-12-19 | 2011-03-16 | Creative Technology Ltd. | A printable audio format |
JP4882390B2 (ja) * | 2006-01-25 | 2012-02-22 | 富士ゼロックス株式会社 | 画像処理装置 |
US8712915B2 (en) * | 2006-11-01 | 2014-04-29 | Palo Alto Research Center, Inc. | System and method for providing private demand-driven pricing |
US8725651B2 (en) * | 2006-11-01 | 2014-05-13 | Palo Alto Research Center Incorporated | System and method for providing private demand-driven pricing |
WO2008076897A2 (en) * | 2006-12-14 | 2008-06-26 | Veoh Networks, Inc. | System for use of complexity of audio, image and video as perceived by a human observer |
JP4962783B2 (ja) * | 2007-08-31 | 2012-06-27 | ソニー株式会社 | 情報処理装置および情報処理方法、並びにプログラム |
TWI425372B (zh) * | 2009-01-15 | 2014-02-01 | Hon Hai Prec Ind Co Ltd | 圖片搜索系統及方法 |
KR101268934B1 (ko) * | 2009-02-13 | 2013-05-30 | 고려대학교 산학협력단 | 데이터 압축/해제장치 및 방법 |
US8229868B2 (en) * | 2009-04-13 | 2012-07-24 | Tokyo Institute Of Technology | Data converting apparatus and medium having data converting program |
KR101657522B1 (ko) * | 2010-11-02 | 2016-09-19 | 한화테크윈 주식회사 | 네트워크 카메라 및 그의 저장장치 운영 방법 |
CN102034478B (zh) * | 2010-11-17 | 2013-10-30 | 南京邮电大学 | 基于压缩感知和信息隐藏的语音保密通信系统设计方法 |
KR101739942B1 (ko) * | 2010-11-24 | 2017-05-25 | 삼성전자주식회사 | 오디오 노이즈 제거 방법 및 이를 적용한 영상 촬영 장치 |
US9443324B2 (en) | 2010-12-22 | 2016-09-13 | Tata Consultancy Services Limited | Method and system for construction and rendering of annotations associated with an electronic image |
US8737677B2 (en) * | 2011-07-19 | 2014-05-27 | Toytalk, Inc. | Customized audio content relating to an object of interest |
US10497381B2 (en) | 2012-05-04 | 2019-12-03 | Xmos Inc. | Methods and systems for improved measurement, entity and parameter estimation, and path propagation effect measurement and mitigation in source signal separation |
US8694306B1 (en) * | 2012-05-04 | 2014-04-08 | Kaonyx Labs LLC | Systems and methods for source signal separation |
US9167160B2 (en) * | 2012-11-14 | 2015-10-20 | Karl Storz Imaging, Inc. | Image capture stabilization |
US9728182B2 (en) | 2013-03-15 | 2017-08-08 | Setem Technologies, Inc. | Method and system for generating advanced feature discrimination vectors for use in speech recognition |
US20150254261A1 (en) * | 2014-03-08 | 2015-09-10 | Guerby Rene | News Application |
US9990928B2 (en) * | 2014-05-01 | 2018-06-05 | Digital Voice Systems, Inc. | Audio watermarking via phase modification |
US9648295B2 (en) * | 2014-07-18 | 2017-05-09 | Pankaj Sharma | System and methods for simultaneously capturing audio and image data for digital playback |
WO2016115483A2 (en) * | 2015-01-15 | 2016-07-21 | Hardwick John C | Audio watermarking via phase modification |
CN106022011A (zh) * | 2016-05-30 | 2016-10-12 | 合欢森林网络科技(北京)有限公司 | 基于图像的保密信息传播方法、装置和系统 |
JP6792360B2 (ja) * | 2016-07-12 | 2020-11-25 | キヤノン株式会社 | 画像符号化装置及び画像復号装置及びそれらの制御方法及びプログラム |
EP3270378A1 (en) | 2016-07-14 | 2018-01-17 | Steinberg Media Technologies GmbH | Method for projected regularization of audio data |
CN107864398B (zh) * | 2017-11-08 | 2020-03-20 | 司马大大(北京)智能系统有限公司 | 音频与视频的合并方法及装置 |
KR102473447B1 (ko) * | 2018-03-22 | 2022-12-05 | 삼성전자주식회사 | 인공지능 모델을 이용하여 사용자 음성을 변조하기 위한 전자 장치 및 이의 제어 방법 |
US10937438B2 (en) * | 2018-03-29 | 2021-03-02 | Ford Global Technologies, Llc | Neural network generative modeling to transform speech utterances and augment training data |
US11244692B2 (en) | 2018-10-04 | 2022-02-08 | Digital Voice Systems, Inc. | Audio watermarking via correlation modification using an amplitude and a magnitude modification based on watermark data and to reduce distortion |
KR102162711B1 (ko) * | 2018-12-26 | 2020-10-07 | 주식회사 무하유 | 비텍스트 영역의 표절 검사 방법 및 장치 |
Family Cites Families (54)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US217214A (en) * | 1879-07-08 | Improvement in wooden floor-matting | ||
US3439598A (en) * | 1966-05-25 | 1969-04-22 | Weitzner D | Camera and sound recording device |
JPH0236825U (ja) * | 1988-09-02 | 1990-03-09 | ||
US5128700A (en) * | 1989-05-12 | 1992-07-07 | Minolta Camera Kabushiki Kaisha | Camera capable of recording sounds relevant to the photographing |
JPH032738A (ja) * | 1989-05-30 | 1991-01-09 | Minolta Camera Co Ltd | オートトリミングカメラ |
US5313564A (en) * | 1990-07-11 | 1994-05-17 | Fontech Ltd. | Graphic matter and process and apparatus for producing, transmitting and reading the same |
US5247330A (en) * | 1990-08-02 | 1993-09-21 | Canon Kabushiki Kaisha | Image input device |
US6631842B1 (en) * | 2000-06-07 | 2003-10-14 | Metrologic Instruments, Inc. | Method of and system for producing images of objects using planar laser illumination beams and image detection arrays |
JP3060578B2 (ja) * | 1991-03-29 | 2000-07-10 | ソニー株式会社 | ディジタル信号符号化方法 |
US5276472A (en) * | 1991-11-19 | 1994-01-04 | Eastman Kodak Company | Photographic film still camera system with audio recording |
US5369261A (en) * | 1992-02-12 | 1994-11-29 | Shamir; Harry | Multi-color information encoding system |
JP3218680B2 (ja) * | 1992-04-15 | 2001-10-15 | ソニー株式会社 | 有声音合成方法 |
DE4330265B4 (de) * | 1992-09-07 | 2004-07-29 | Canon K.K. | Vorrichtung zum Erfassen der Sehachse eines Auges einer ein optisches Gerät bedienenden Person |
DE69329120T2 (de) * | 1992-09-28 | 2001-03-22 | Olympus Optical Co | Aufzeichnungsmedium für punktcode und informations-aufzeichnungssystem |
US5521663A (en) * | 1992-10-28 | 1996-05-28 | Norris, Iii; Wyamn J. | Sound system for still film photography |
JPH0775339B2 (ja) * | 1992-11-16 | 1995-08-09 | 株式会社小電力高速通信研究所 | 音声符号化方法及び装置 |
US5801848A (en) * | 1993-01-06 | 1998-09-01 | Fontech Ltd. | Process for transmitting and/or storing information |
US5363157A (en) | 1993-08-19 | 1994-11-08 | Eastman Kodak Company | Camera utilizing variable audio film frame for optical encoding of audio information |
JP3373008B2 (ja) * | 1993-10-20 | 2003-02-04 | オリンパス光学工業株式会社 | 画像像域分離装置 |
US5389989A (en) * | 1993-10-29 | 1995-02-14 | Eastman Kodak Company | Camera for recording digital and pictorial images on photographic film |
JP3244371B2 (ja) * | 1993-12-22 | 2002-01-07 | オリンパス光学工業株式会社 | オーディオ情報処理システム及びオーディオ情報処理方法 |
JP3528258B2 (ja) * | 1994-08-23 | 2004-05-17 | ソニー株式会社 | 符号化音声信号の復号化方法及び装置 |
JPH0981711A (ja) * | 1995-09-20 | 1997-03-28 | Olympus Optical Co Ltd | 情報記録媒体、情報再生システム、及び情報記録システム |
US6226387B1 (en) * | 1996-08-30 | 2001-05-01 | Regents Of The University Of Minnesota | Method and apparatus for scene-based video watermarking |
JP2942736B2 (ja) * | 1996-09-03 | 1999-08-30 | オリンパス光学工業株式会社 | コード記録装置 |
US5863209A (en) * | 1997-05-08 | 1999-01-26 | L&K International Patent & Law Office | Educational image display device |
JPH114398A (ja) * | 1997-06-11 | 1999-01-06 | Hitachi Ltd | デジタルワイドカメラ |
JPH117487A (ja) * | 1997-06-18 | 1999-01-12 | Olympus Optical Co Ltd | コードリーダー装置 |
GB2326572A (en) * | 1997-06-19 | 1998-12-23 | Softsound Limited | Low bit rate audio coder and decoder |
KR100805811B1 (ko) * | 1997-06-30 | 2008-02-21 | 노리츠 고키 가부시키가이샤 | 영상 처리 장치 및 음성 코드화 기록 매체 |
AUPO939597A0 (en) * | 1997-09-23 | 1997-10-16 | Silverbrook Research Pty Ltd | Data processing method and apparatus (ART4) |
JPH11122401A (ja) * | 1997-10-17 | 1999-04-30 | Noritsu Koki Co Ltd | 音声コード付き写真作成装置 |
US5996893A (en) * | 1997-10-28 | 1999-12-07 | Eastman Kodak Company | Method and apparatus for visually identifying an area on a photograph or image where digital data is stored |
JPH11164128A (ja) * | 1997-11-28 | 1999-06-18 | Olympus Optical Co Ltd | 音声コードイメージ付静止画像形成装置 |
US6332030B1 (en) * | 1998-01-15 | 2001-12-18 | The Regents Of The University Of California | Method for embedding and extracting digital data in images and video |
US6229964B1 (en) * | 1998-02-26 | 2001-05-08 | Eastman Kodak Company | Image with sound playback apparatus |
AU3343599A (en) | 1998-04-21 | 1999-11-08 | Intacta Labs Ltd | Process for transmitting, receiving and/or storing information |
AU7683398A (en) * | 1998-06-01 | 1999-12-20 | Datamark Technologies Pte Ltd | Methods for embedding image, audio and video watermarks in digital data |
JPH11353420A (ja) * | 1998-06-08 | 1999-12-24 | Olympus Optical Co Ltd | コードイメージ読取装置 |
JP3398343B2 (ja) * | 1999-08-20 | 2003-04-21 | 松下電器産業株式会社 | 埋め込み装置、デジタルカメラ及び記録媒体 |
US6618511B1 (en) * | 1999-12-31 | 2003-09-09 | Stmicroelectronics, Inc. | Perspective correction for panoramic digital camera with remote processing |
ES2269112T3 (es) * | 2000-02-29 | 2007-04-01 | Qualcomm Incorporated | Codificador de voz multimodal en bucle cerrado de dominio mixto. |
WO2001080561A1 (en) * | 2000-04-18 | 2001-10-25 | Rtimage Inc. | System and method for the lossless progressive streaming of images over a communication network |
WO2002017214A2 (en) * | 2000-08-24 | 2002-02-28 | Digimarc Corporation | Watermarking recursive hashes into frequency domain regions and wavelet based feature modulation watermarks |
US7248934B1 (en) * | 2000-10-31 | 2007-07-24 | Creative Technology Ltd | Method of transmitting a one-dimensional signal using a two-dimensional analog medium |
US6915009B2 (en) * | 2001-09-07 | 2005-07-05 | Fuji Xerox Co., Ltd. | Systems and methods for the automatic segmentation and clustering of ordered information |
JP2003348327A (ja) | 2002-03-20 | 2003-12-05 | Fuji Photo Film Co Ltd | 情報検出方法および装置並びにプログラム |
EP1577877B1 (en) * | 2002-10-24 | 2012-05-02 | National Institute of Advanced Industrial Science and Technology | Musical composition reproduction method and device, and method for detecting a representative motif section in musical composition data |
JP2004153737A (ja) | 2002-11-01 | 2004-05-27 | Fuji Photo Film Co Ltd | 音声記録方法および音声再生方法並びに電子カメラ |
JP2004163485A (ja) | 2002-11-11 | 2004-06-10 | Fuji Photo Film Co Ltd | 音声再生システムおよび音声データコード並びに電子カメラ |
JP2004173172A (ja) | 2002-11-22 | 2004-06-17 | Fuji Photo Film Co Ltd | 音声再生システムおよび電子カメラ |
JP3891111B2 (ja) * | 2002-12-12 | 2007-03-14 | ソニー株式会社 | 音響信号処理装置及び方法、信号記録装置及び方法、並びにプログラム |
US20050041120A1 (en) * | 2003-08-18 | 2005-02-24 | Miller Casey Lee | System and method for retrieving audio information from a captured image |
EP1713063B1 (en) * | 2003-12-19 | 2011-03-16 | Creative Technology Ltd. | A printable audio format |
-
2004
- 2004-12-17 JP JP2006545305A patent/JP4568732B2/ja active Active
- 2004-12-17 WO PCT/SG2004/000419 patent/WO2005059830A1/en active Application Filing
- 2004-12-17 CN CNB2004800380310A patent/CN100504922C/zh active Active
- 2004-12-17 KR KR1020067012119A patent/KR101125351B1/ko active IP Right Grant
- 2004-12-17 TW TW093139327A patent/TWI463806B/zh active
- 2004-12-17 AU AU2004300115A patent/AU2004300115B2/en not_active Ceased
- 2004-12-17 EP EP20040809239 patent/EP1700266A4/en not_active Ceased
- 2004-12-17 US US11/016,366 patent/US8442262B2/en active Active
Also Published As
Publication number | Publication date |
---|---|
WO2005059830A1 (en) | 2005-06-30 |
AU2004300115B2 (en) | 2010-11-25 |
AU2004300115A1 (en) | 2005-06-30 |
CN1898695A (zh) | 2007-01-17 |
JP2007515126A (ja) | 2007-06-07 |
KR101125351B1 (ko) | 2012-03-28 |
KR20060112668A (ko) | 2006-11-01 |
TW200527825A (en) | 2005-08-16 |
EP1700266A1 (en) | 2006-09-13 |
EP1700266A4 (en) | 2010-01-20 |
CN100504922C (zh) | 2009-06-24 |
US20050212930A1 (en) | 2005-09-29 |
US8442262B2 (en) | 2013-05-14 |
TWI463806B (zh) | 2014-12-01 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP4568732B2 (ja) | デジタル画像を処理するための方法とそのシステム | |
Swanson et al. | Multimedia data-embedding and watermarking technologies | |
US8355525B2 (en) | Parallel processing of digital watermarking operations | |
Subburam et al. | High performance reversible data hiding scheme through multilevel histogram modification in lifting integer wavelet transform | |
Hou et al. | Reversible data hiding in color image with grayscale invariance | |
Barni et al. | Watermark embedding: Hiding a signal within a cover image | |
Weng et al. | Integer transform based reversible watermarking incorporating block selection | |
Weng et al. | Pairwise IPVO-based reversible data hiding | |
Cheddad et al. | Enhancing steganography in digital images | |
Das et al. | An improved video key-frame extraction algorithm leads to video watermarking | |
Lakshmi et al. | Difference expansion based reversible watermarking algorithms for copyright protection of images: state-of-the-art and challenges | |
Paruchuri et al. | Video data hiding for managing privacy information in surveillance systems | |
Zamani et al. | Knots of substitution techniques of audio steganography | |
Kothari et al. | Watermarking techniques for copyright protection of videos | |
Maiorana et al. | Multi‐bit watermarking of high dynamic range images based on perceptual models | |
CN111491171B (zh) | 水印嵌入、水印提取、数据处理及视频帧检测方法 | |
Kapre et al. | Key-frame extraction based video watermarking using speeded up robust features and discrete cosine transform | |
D’Angelo et al. | Watermark-based authentication | |
Huang et al. | Copyright protection with EXIF metadata and error control codes | |
US7356159B2 (en) | Recording and reproduction apparatus, recording and reproduction method, recording and reproduction program for imperceptible information to be embedded in digital image data | |
Gosavi et al. | Video authentication and copyright protection using unique watermark generation technique and singular value decomposition | |
Su | Information hiding in digital images: watermarking and steganography | |
El Salam et al. | Reversible data-hiding exploiting huffman encoding in dual image using weighted matrix and generalized exploiting modification direction (GEMD) | |
Alkanhel et al. | Securing Color Video When Transmitting through Communication Channels Using DT-CWT-Based Watermarking. Electronics 2022, 11, 1849 | |
Ahmed | Digital watermarking of still images |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20071217 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20071217 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20090811 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20090929 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20091228 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20100713 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20100809 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 4568732 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130813 Year of fee payment: 3 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |