JP5056348B2 - 情報処理装置および方法、並びにプログラム - Google Patents

情報処理装置および方法、並びにプログラム Download PDF

Info

Publication number
JP5056348B2
JP5056348B2 JP2007281029A JP2007281029A JP5056348B2 JP 5056348 B2 JP5056348 B2 JP 5056348B2 JP 2007281029 A JP2007281029 A JP 2007281029A JP 2007281029 A JP2007281029 A JP 2007281029A JP 5056348 B2 JP5056348 B2 JP 5056348B2
Authority
JP
Japan
Prior art keywords
information
average value
unit
comparison
block
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2007281029A
Other languages
English (en)
Other versions
JP2009111649A (ja
JP2009111649A5 (ja
Inventor
継彦 芳賀
秀雄 中屋
賢 堀士
亮輔 荒木
誠一 猪俣
拓郎 川合
俊之 樋野
哲二郎 近藤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sony Corp
Original Assignee
Sony Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sony Corp filed Critical Sony Corp
Priority to JP2007281029A priority Critical patent/JP5056348B2/ja
Priority to US12/255,108 priority patent/US8284843B2/en
Publication of JP2009111649A publication Critical patent/JP2009111649A/ja
Publication of JP2009111649A5 publication Critical patent/JP2009111649A5/ja
Application granted granted Critical
Publication of JP5056348B2 publication Critical patent/JP5056348B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/90Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using coding techniques not provided for in groups H04N19/10-H04N19/85, e.g. fractals
    • H04N19/94Vector quantisation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/136Incoming video signal characteristics or properties
    • H04N19/14Coding unit complexity, e.g. amount of activity or edge presence estimation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/593Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving spatial prediction techniques
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/90Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using coding techniques not provided for in groups H04N19/10-H04N19/85, e.g. fractals
    • H04N19/98Adaptive-dynamic-range coding [ADRC]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/30Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using hierarchical techniques, e.g. scalability

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Compression Of Band Width Or Redundancy In Fax (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)
  • Processing Or Creating Images (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Description

本発明は情報処理装置および方法並びにプログラムに関し、特に、演算量を削減し、迅速に検索ができるようにした情報処理装置および方法並びにプログラムに関する。
複数の解像度の画像を予め用意しておくことが、例えば特許文献1に開示されている。このようにすれば、必要な所定の解像度の画像を迅速に表示することができる。
特開弊11−312173号公報
ところでネットワークの広帯域化やストレージ容量の増大に伴い、情報、特に画像情報を効率的に整理する手法が求められている。
しかしながら、複数の解像度の画像をデータベースに保持すると、データ量がそれだけ多くなり、所望の画像を検索する場合の演算量も多くなり、画像の迅速な検索が困難となる。
本発明は、このような状況に鑑みてなされたものであり、検索時における演算量を軽減し、迅速に検索ができるようにするものである。
本発明の一側面の情報処理装置は、保持する情報を入力する入力部と、入力された情報をマクロブロックに分割し、前記マクロブロックを所定のサイズのサブブロックに分割する分割部と、前記サブブロックの平均値を演算する平均値演算部と、前記マクロブロックから前記平均値を減算して平均値分離ブロックを演算する平均値分離ブロック演算部と、前記マクロブロック内において前記サブブロックの大きさがより小さくなるように分割を繰り返して演算された、各階層の前記平均値分離ブロックを、階層ごとに異なる方式で符号化する符号化部と、前記階層ごとに異なる方式で符号化された情報を保持するデータベースとを備える。
前記情報は画像情報であり、前記符号化部は、最上位階層の前記画像情報をサムネイル画像とするようにすることができる。
前記平均値演算部は、さらに前記マクロブロック自体の平均値を演算し、前記符号化部は、前記マクロブロック自体の平均値の情報を符号化せずに、最上位の階層の情報とするようにすることができる。
前記データベースに保持されている前記情報を、より上位の階層から順番に取得する取得部と、取得された検索対象と比較対象の符号化されている情報を階層ごとに比較する比較部と、比較結果に基づいて、前記検索対象に類似する前記比較対象の情報を復号する復号部と、復号された前記検索対象に類似する前記比較対象の情報を出力する出力部とをさらに備えるようにすることができる。
前記比較部は、前記検索対象と前記比較対象の符号化されている情報の距離を比較するようにすることができる
前記比較部は、上位の階層で距離が短いと判断された前記比較対象の情報の下位の階層の情報を、順次前記検索対象の情報と比較するようにすることができる
前記比較部は、前記検索対象のアクティビティがより大きい階層から順番に比較するようにすることができる
前記比較部は、各階層の前記比較対象の情報の距離に応じて付加した点数に基づいて、前記検索対象に類似する前記比較対象の情報を検索するようにすることができる
本発明の一側面の情報処理方法は、入力部が、保持する情報を入力し、分割部が、入力された情報をマクロブロックに分割し、前記マクロブロックを所定のサイズのサブブロックに分割し、平均値演算部が、前記サブブロックの平均値を演算し、平均値分離ブロック演算部が、前記マクロブロックから前記平均値を減算して平均値分離ブロックを演算し、符号化部が、前記マクロブロック内において前記サブブロックの大きさがより小さくなるように分割を繰り返して演算された、各階層の前記平均値分離ブロックを、階層ごとに異なる方式で符号化する
本発明の一側面のプログラムは、保持する情報を入力し、入力された情報をマクロブロックに分割し、前記マクロブロックを所定のサイズのサブブロックに分割し、前記サブブロックの平均値を演算し、前記マクロブロックから前記平均値を減算して平均値分離ブロックを演算し、前記マクロブロック内において前記サブブロックの大きさがより小さくなるように分割を繰り返して演算された、各階層の前記平均値分離ブロックを、階層ごとに異なる方式で符号化する処理をコンピュータに実行させる
本発明の一側面の情報処理装置および方法、並びにプログラムにおいては、保持されている情報がマクロブロックに分割され、マクロブロックが所定のサイズのサブブロックに分割され、サブブロックの平均値が演算され、マクロブロックから平均値が減算されて平均値分離ブロックが演算され、マクロブロック内においてサブブロックの大きさがより小さくなるように分割が繰り返えされて演算された、各階層の平均値分離ブロックが、階層ごとに異なる方式で符号化される
以上のように、本発明の側面によれば、検索時における演算量を軽減し、迅速に検索を行うことが可能となる。
以下、図を参照して本発明の実施の形態について説明する。
図1は本発明を適用した情報検索システムの一実施の形態の構成を表している。この情報検索システム1は、情報符号化装置11と情報検索装置12とにより構成されている。
情報符号化装置11は、入力部21、符号化部22、およびデータベース23により構成されている。情報検索装置12は、データベース23と検索部24により構成されている。
入力部21は、図示せぬ記録媒体、インターネットに代表される各種のネットワークなどを介して、データベース23に保持する情報を入力する。この実施の形態の場合、画像情報が入力される。符号化部22は、入力された情報を階層的に符号化する。データベース23は、各階層ごとに符号化された情報を保持する。検索部24は、データベース23に保持されている比較対象の情報から検索対象の情報に類似する(同一である場合を含む)情報を検索する。
図2は、情報検索装置12の検索部24の一実施の形態の構成を表している。検索部24は、読み出し部41、比較部42、復号部43、および出力部44により構成されている。
読み出し部41は、データベース23に保持されている検索対象と比較対象の情報を読み出す。比較部42は、読み出された検索対象と比較対象の情報とを比較する。復号部43は、検索対象の情報と、比較の結果、検索対象の情報に類似すると判断された比較対象の情報を、符号化部22の符号化方式に対応する復号方式で復号する。例えばLCD(Liquid Crystal Display)、スピーカなどにより構成される出力部44は、検索され、復号された情報を出力する。
次に、図4のフローチャートを参照して、情報符号化装置11の符号化処理について説明するが、この処理を行うため、符号化部22は、図3に示されるような機能的構成を有している。
すなわち、符号化部22は、画像分割部61、平均値演算部62、平均値分離ブロック演算部63、ブロック符号化部64、判定部65、およびブマクロブロック分割部66を有している。
画像分割部61は、1枚の画像を複数個のマクロブロックに分割する。平均値演算部62は、マクロブロックおよびマクロブロックを構成するサブロックの平均値を演算する。平均値分離ブロック演算部63は、マクロブロックからサブブロックの平均値を減算した平均値分離ブロックを演算する。ブロック符号化部64は、各階層の平均値分離ブロックを符号化する。判定部65は、各種の判定を行う。ブマクロブロック分割部66は、マクロブロックを順次所定のサイズのサブブロックに分割する。
次に、図4のフローチャートを参照して、情報符号化装置11の符号化処理について説明する。
ステップS1において、入力部21はデータベース23に保持する画像信号を入力する。ステップS2において、符号化部22の画像分割部61は、入力された画像信号の画像をマクロブロックに分割する。例えば、図5に示されるように、1枚の画像が複数個のマクロブロックに分割される。各マクロブロックはN×N画素で構成されている。
ステップS3において、平均値演算部62はマクロブロックの平均値を演算する。図6の階層0に示されるように、マクロブロックのN×N画素の平均値が演算される。そして、マクロブロックのN×N個の各画素をその平均値で表した画像が、最上位の階層(階層0)の画像とされる。この画像はサムネイル画像とするため符号化されない。
ステップS4において、平均値分離ブロック演算部63は、平均値分離ブロックを演算する。すなわち、図6の階層1に示されるように、マクロブロックの各画素値からそのマクロブロックの各画素の平均値が減算され、それがその階層(階層1)の平均値分離ブロックとされる。
ステップS5において、ブロック符号化部64は、平均値分離ブロックを符号化する。図6の例においては、階層1の平均値分離ブロックが符号化される。このときの符号化方式は、例えばADRC(Adaptive Dynamic Range Coding)符号化方式とされる。ステップS6において、データベース23は、ステップS5で符号化された平均値分離ブロックを登録する。図6の例では、階層1の平均値分離ブロックが登録される。
ステップS7において、判定部65はブロック分割が可能かを判定する。この実施の形態の場合、図7A乃至図7Dに示されるように、N×N画素のマクロブロックは、M×M画素のサブブロック((N/M)×(N/M)個のサブブロック)、K×K画素のサブブロック((N/K)×(N/K)個のサブブロック)、R×R画素のサブブロック((N/R)×(N/R)個のサブブロック)と順次分割される。図7の実施の形態の場合、N=16,M=8,K=4,R=2とされている。すなわち、サブブロックのサイズが1/2倍ずつ順次小さくなるように分割される。この場合、2×2画素のサイズのサブブロックまで分割されたとき、または奇数画素のサイズのサブブロックまで分割されたとき、それ以上は分割できないと判定される。
勿論サブブロックは、1/3倍、1/4倍、1/5倍、・・・ずつ順次小さくなるように分割することも可能である。
ブロック分割が可能である場合、ステップS8において、ブマクロブロック分割部66は、平均値分離ブロックを分割する。図6の例においては、階層1の平均値分離ブロックが、M×M画素のサブブロックに分割される。ステップS9において、平均値演算部62は、サブブロックの平均値を演算する。図6の例においては、M×M画素のサブブロックの平均値が演算される。
その後、処理はステップS4に戻り、平均値分離ブロック演算部63は、平均値分離ブロックを演算する。図6の例においては、階層2に示されるように、すぐ上の階層である階層1の平均値分離ブロックの各画素値から、ステップS9で演算された平均値が減算され、階層2の平均値分離ブロックとされる。
ステップS5において、ブロック符号化部64は、平均値分離ブロックを符号化する。図6の例においては、階層2の平均値分離ブロックが符号化される。このときの符号化方式は、例えば階層1における場合と異なるエッジ方向符号化方式とされる。ステップS6において、データベース23は、ステップS5で符号化された平均値分離ブロックを登録する。図6の例では、階層2の平均値分離ブロックが登録される。
ステップS7でまだブロック分割が可能であると判定された場合、ステップS8において、ブマクロブロック分割部66は、平均値分離ブロックを分割する。図6の例においては、階層2の平均値分離ブロックが、K×K画素のサブブロックに分割される。ステップS9において、平均値演算部62は、サブブロックの平均値を演算する。図6の例においては、K×K画素のサブブロックの平均値が演算される。
その後、処理はステップS4に戻り、平均値分離ブロック演算部63は、平均値分離ブロックを演算する。図6の例においては、階層3に示されるように、すぐ上の階層である階層2の平均値分離ブロックの各画素値から、ステップS9で演算された平均値が減算され、階層3の平均値分離ブロックとされる。
ステップS5において、ブロック符号化部64は、平均値分離ブロックを符号化する。図6の例においては、階層3の平均値分離ブロックが符号化される。このときの符号化方式は、例えば階層1,2における場合と異なるベクトル量子化符号化方式とされる。ステップS6において、データベース23は、ステップS5で符号化された平均値分離ブロックを登録する。図6の例では、階層3の平均値分離ブロックが登録される。
以上の処理が、ステップS7において、ブロック分割が可能ではないと判定されるまで繰り返される。ブロック分割が可能ではないと判定された場合、処理は終了される。
以上説明したように、この実施の形態においては、元の画像が階層的に符号化され、各階層の符号化データが登録される。
図8A乃至図8Dは、階層0乃至階層3の各階層の画像の具体的例を表している。最上位の階層(階層0)の画像は、マクロブロックの平均値の画像となっており、画像全体についての特徴を表している。この画像のサイズはマクロブロックのサイズに反比例し、マクロブロックのサイズがN×N画素であるとすると、元の画像の1/(N×N)となる。
中間階層の画像は、スケーリングされたエッジの特徴を表す。階層が下がるごとに、より詳細なエッジの特長を多く含む画像となる。マクロブロックの分割方法によって、サムネイル画像より大きい複数のサイズの階層の画像を得ることができる。
最下位の階層の画像は、元の画像から平均値およびエッジの特徴を取り除いた、テクスチャの特徴を表す、元の画像と同じサイズの画像となる。
なお図8においては、各階層の画像が、元の画像と同じスケールの画像として示されている。
図9は、本実施の形態の符号化の原理を表している。すなわち、この実施の形態においては、元の画像が階層的に、各階層の画像が、それぞれの階層に適した符号化方式で符号化される。元の画像から得られた最上位の階層の画像は、画像の特徴を最もよく表す階層であるから符号化は行わず、サムネイル画像とされる。
中間の階層においては、エッジを効率的に表現する符号が用いられる。例えば、ADRC符号化方式、エッジ方向符号化方式などが用いられる。上位に近い階層ほど、復号時に1画素あたりの面積が大きくなることを考慮して情報量の割り当てを行う。
最下位の階層においては、テクスチャの特徴を表現する符号化方式が用いられる。例えば、ベクトル量子化方式や濃度共起行列符号化方式が用いられる。
なお、高い圧縮率が必要な場合には、上記符号に対して適当なエントロピー符号をかけて、より冗長度を削減することもできる。
このように、階層ごとの画像に応じた方式で符号化することで、より符号化効率を上げることができる。また、検索に適した符号化方式を採用することができ、迅速な検索が可能となる。
次に図11と図12のフローチャートを参照して検索処理を説明するが、この処理を行うため、比較部42は図10に示されるような機能的構成を有している。
すなわち、比較部42は、距離演算部91、記憶部92、判定部93、選択部94、および設定部95を有している。
距離演算部91は、検索対象の画像と比較対象の画像の距離を演算する。記憶部92は、演算された距離を記憶する。判定部93は、各種の判定を行う。選択部94は、所定の比較対象の画像を選択する。設定部95は、変数を設定したり、比較対象の設定を行う。
次に図11と図12のフローチャートを参照して、情報検索装置12が行う検索処理について説明する。データベース24には、上述したようにして画像が各階層ごとに符号化され、保持されている。この検索処理は、ユーザにより指定されたデータベース24に保持されている検索対象としての画像に類似する画像を、やはりデータベース24に保持されている比較対象としての画像から検索する処理である。あるいは、まだ符号化されていない画像が検索のために入力された場合には、上述した場合と同様にして、符号化部22でその画像を符号化した画像が検索対象とされる。
ステップS51において、読み出し部41はユーザの指示に基づいて、より上位の階層から順番に1つの検索対象を取得する。すなわち、検索対象としての画像が階層的に符号化され、保持されているので、そのうちの、いまの場合、最上位の階層の検索対象がデータベース23から読み出される。この最上位の階層の画像は符号化されていない。
ステップS52において、読み出し部41は、ステップS51で取得された階層と同じ階層の比較対象を1つ取得する。いまの場合、1つの比較対象の最上位の階層の画像が読み出される。比較対象とされる画像は、ユーザにより指定されたジャンル、登録日時などに基づき決定される範囲の画像としてもよいし、データベース23に登録されている全ての範囲の画像とすることもできる。
ステップS53において、比較部42の距離演算部91は、2つの対象の距離を演算する。すなわちステップS51で取得された検索対象の画像と、ステップS52で取得された比較対象の画像の距離が演算される。ステップS54において、記憶部92は演算された距離を記憶する。これは、後のステップS56で、距離が最短の比較対象の画像を選択するためである。
ステップS55において判定部93は、同じ階層の全ての比較対象との距離を演算したかを判定する。いまの場合、全ての比較対象の階層0の画像と、検索対象の階層0の画像との距離が演算されたかが判定される。まだ演算していない比較対象が存在する場合、処理はステップS52に戻り、同じ階層の他の1つの比較対象が取得される。
ステップS53においてその新たな比較対象と検索対象の画像との距離が演算され、その距離がステップS54で記憶される。同様の処理が、同じ階層の全ての比較対象との距離が演算されるまで繰り返される。
階層0の全ての比較対象との距離が演算された場合、ステップS56において選択部94は、距離の短い比較対象をN個選択する。Nの値は、ユーザが事前に設定した任意の値であり、ステップS54の処理で記憶された距離の中から、短いほうから順番に、N個の画像が選択される。距離が短いとは、その画像が、それだけ検索対象の画像に類似する画像であること意味する。
ステップS57において判定部93は、選択対象の数は基準値以下かを判定する。この基準値はユーザが予め設定した値であり、ステップS56の処理で選択された類似する画像の数がまだ大きい場合には、さらなる検索が実行される。
そのため、ステップS58において設定部95は、Nの値をそれまでの値の1/2に設定する。ステップS59において設定部95は、選択された対象を比較対象とする。すなわち、ステップS56の処理で選択されたN個の画像が、以後の検索における比較対象の画像とされる。そして以後、ステップS59乃至S65において、その絞られた比較対象に対して、上述したステップS51乃至S56における場合と同様の処理が実行される。
すなわち、ステップS60において読み出し部41は、次に上位の階層から順番に1つの検索対象を取得する。すなわち、いまの場合、絞られた比較対象のうちの、階層0の次に上位の階層である階層1が選択され、階層1の検索対象がデータベース23から読み出される。この階層の画像は符号化されている。
ステップS61において、読み出し部41は、ステップS60で取得された階層と同じ階層1の比較対象を取得する。ステップS62において、距離演算部91は、2つの対象の距離を演算する。すなわちステップS60で取得された検索対象の画像と、ステップS61で取得された比較対象の画像の距離が演算される。ステップS63において、記憶部92は演算された距離を記憶する。
ステップS64において判定部93は、同じ階層の全ての比較対象との距離を演算したかを判定する。いまの場合、絞られた比較対象に関して、比較対象の階層1の全ての画像と、検索対象の同じ階層1の画像との距離が演算されたかが判定される。まだ演算していない比較対象が存在する場合、処理はステップS61に戻り、絞られた比較対象のうちの同じ階層1の他の1つの比較対象が取得される。
ステップS62において、ステップS60で選択された検索対象の画像と、ステップS61で選択された比較対象の画像との距離が演算され、その距離がステップS63で記憶される。同様の処理が、同じ階層1の絞られた全ての比較対象との距離が演算されるまで繰り返される。
同じ階層1の絞られた全ての比較対象との距離が演算された場合、ステップS65において選択部94は、距離の短い比較対象をN個選択する。このNの値は、ステップS58において、ステップS56における場合の1/2の値に設定されている。
ステップS66において判定部93は、選択対象の数は基準値以下かを判定する。ステップS65の処理で選択された類似する画像の数がまだ大きい場合には、処理はステップS58に戻り、Nの値がさらにそれまでの1/2の値に設定される。
以下、ステップS66において、選択された比較対象の画像の数が基準値以下になったと判定されるまで、上述した場合と同様の処理が、階層2、階層3、・・・と順次下の階層に関して実行される。
その結果、図13に示されるように、より上位の階層から下位の階層に向かって順番に、検索が行われ、選択される比較対象の画像の数は、N,N/2,N/4,N/8,・・・と、順次絞られていく。図13の例では、最終的に最下位の階層のM個の比較対象の画像が検索対象の画像に類似する画像の候補として検索されている。しかし、その数が早く基準値以下になった場合には、中間の階層で絞込みの処理が完了することになる。
ステップS57またはステップS66において、選択対象の数が基準値以下になったと判定された場合、ステップS67において、復号部43は検索対象と比較対象を復号する。すなわち、検索対象の画像と、それに類似すると判断された基準値以下の数の比較対象の画像が復号される。もちろん階層0の画像は符号化されていないので、復号処理は不要である。元の画像は、復号した各階層の画像を元の画像と同じサイズに拡大し、全ての画素値を加算することで得ることができる。
ステップS68において、出力部44は検索対象と検索された比較対象を出力する。すなわち、ステップS67で復号された検索対象と比較対象の画像が表示される。ユーザは、この表示を見て、最終的に検索対象に類似する画像を特定することができる。
ステップS53,S62において行われる画像の距離の演算についてさらに説明する。例えば、図14に示されるように、最上位の階層0の画像はサムネイル画像とされ、符号化が行われておらず、次の階層1の画像はエッジ方向符号化が行われており、最下位の階層2の画像はベクトル量子化が行われているとする。画像間の距離は、符号のまま演算される。
階層0では画像は符号化されていないので、画像の距離は画素値の差分自乗和で表すことができる。
階層1では、エッジ方向符号化が行われている。例えば図15に示されるように、画像のエッジがない場合を0、画像のエッジの方向が水平方向である場合に符号1を割り当て、22.5度ずつ増加するごとに、2,3,4,5,6,7,8の各符号を割り当てるとする。この場合、エッジ方向符号化は、図16に示されるように行われる。
図16の画像101は、図8Cの階層2の画像を表している。この画像の符号化対象のブロック102は、画像101の右側に拡大して示されているように、水平右方向に伸びるエッジ、その右端から略階段状に右下45度の方向に下がるエッジ、そしてその右端からほぼ垂直方向に下がるエッジを有している。このブロック102からエッジ検出フィルタにより支配的なエッジを抽出すると、ブロック103に示されるようにエッジが検出される。
すなわち、ブロック103を2×2個の小ブロックに区分すると、左上の小ブロックのエッジは水平方向のエッジであり、右上の小ブロックのエッジは右下45度方向のエッジであり、右下の小ブロックのエッジは、垂直方向のエッジである。そして、左下の小ブロックにはエッジが存在しない。したがって、図15に従ってブロック103を符号化すると、ブロック104に示されるように、左上の小ブロックは符号1、右上の小ブロックは符号3、左下の小ブロックの符号は0、右下の小ブロックは符号5で、それぞれ表されることになる。
エッジ符号の距離は、次のように演算される。図17Aに示されるように、エッジ方向によって1乃至8の符号が存在するので、基本的には、符号の差で距離を表す。しかし、符号の差が0乃至4までの場合、その値が大きいほど角度も大きくなるものの、差が5以上になると、その値が大きくなっても角度の差は小さくなる。例えば、符号7と符号1の差は6であるが、そのエッジ方向の角度は、差が2である符号3と符号1のエッジ方向の角度と同じとなる。
そこで、2つのエッジ方向の符号の差が、4以下である場合、その差の値によって距離を表すものとする。例えば図17Bに示されるように、符号4と符号1のエッジ方向の距離は、3(=4−1)となる。
しかし、差が5以上(5乃至7)になった場合、エッジ符号の距離は、次式で表すものとする。
not(D1−D2)+1=〜(b’D1−b’D2)+3b’001 (1)
なお、式(1)において、D1,D2は、エッジ符号の値を表す。〜は、Verilog-AMSのビット単位の否定の演算子であり、2ビット表現された値の論理1を論理0に、論理0を論理1に反転する演算を意味する。すなわち、式(1)は、値(D1−D2)の2の補数表現である。例えば、図17Cに示されるように、符号7と符号1の距離は、次のように2となる。
not(7−1)+1=(3b’110)+3b’001
=3b’001+3b’001=3b’010=1’d2 (2)
階層2においては、ベクトル量子化により求められた各画像のコードブック間の距離を用いることができる。コードブック間の距離は、代表ベクトルに対応するコードワードの距離の総和、あるいはコードワード間の距離の最小値の和で表すことができる。この場合、パターンの位置はまったく考慮されないため、全画面の印象や質感といった量を表していると考えることができる。
なお、距離を演算する場合には、画像の位置をシフトさせながら、各位置における距離を演算し、最小となる値を画像間の距離とすることができる。
画像を階層に分解して、階層ごとに符号化を行うことで、圧縮だけでなく、圧縮と検索の両方のための符号化をより効率的に行うことができる。また、圧縮時に階層ごとに行った符号をそのまま利用して検索を行うため、検索時に部分的に復号する処理が不要となり、迅速な検索が可能となる。
各階層は画像の特性を表しているから、比較の際に階層を選択する順序によって検索の結果が変化する。ユーザは検索の順番を指定して、構図を重視した検索やテクスチャを重視した検索を行うことができる。ユーザは、例えばアクティビティの高い順番に検索を行うように指示することができる。
この場合、比較部42は図18に示される機能的構成を有する。同図に示されるように、比較部42は、図10における場合の距離演算部91乃至設定部95以外に、アクティビティ演算部131を有している。このアクティビティ演算部131は、各階層の画像のアクティビティを演算する。
アクティビティの高い順番に検索を行う場合の処理は、図19と図20のフローチャートに示されるようになる。ステップS101において、アクティビティ演算部131は、各階層の検索対象のアクティビティを演算する。
サムネイル画像のアクティビティは、例えば次式により表されるように、全画面に対する隣接画素の差分値の自乗和で演算される。次式において、Iは位置(x,y)の画素位置の集合を表し、P(x,y)は、位置(x,y)の画素値を表す。
Figure 0005056348
エッジ方向符号のアクティビティも、上記式(3)で表されるように、全画面に対する隣接画素の差分値の自乗和で演算することができる。隣接画素の差分値が小さければ連続したエッジを意味し、大きければ不連続なエッジを意味することになる。
ベクトル量子化画像においては、簡易的に、コードワードのアクティビティを画像のアクティビティとすることができる。N次のベクトルについて量子化を行い、コードブックの総数をNとし、i番目のコードワードベクトルをCWi、コードワードの次数をM、コードワードのj番目の要素をCW(j)で表すとすると、コードワードのアクティビティは次式で表される。
Figure 0005056348
ステップS102において読み出し部41は、より大きいアクティビティの階層から1つの検索対象を取得する。これにより、データベース23に保持されている検索対象の画像の各階層の中から、ステップS101において演算されたアクティビティの値が最も大きい階層の画像が読み出される。
ステップS103において読み出し部41は、同じ階層の比較対象を1つ取得する。すなわち、ステップS102において読み出された検索対象の階層と同じ階層の比較対象の画像がデータベース23から読み出される。ステップS104において距離演算部91は、2つの対象の距離を演算する。
以下、ステップS105乃至S110において、図11のステップS54乃至図12のステップS59における場合と同様の処理が行われる。すなわち、その階層の距離が短いN個の比較対象の画像が選択され、そのN個の対象が比較対象とされる。そして、次に選択する比較対象の数としての変数Nは、1/2に設定される。
ステップS111において読み出し部41は、より大きいアクティビティの階層の検索対象を取得する。いまの場合、ステップS102で読み出された階層の次に大きいアクティビティの階層の検索対象がデータベース23から読み出される。
ステップS112において読み出し部41は、同じ階層の比較対象を1つ取得する。すなわち、ステップS110において読み出された検索対象の階層と同じ階層の比較対象の画像がデータベース23から読み出される。ステップS113において距離演算部91は、2つの対象の距離を演算する。
以下、ステップS114乃至S117において、図12のステップS63乃至S66における場合と同様の処理が行われる。すなわち、その階層の距離が短いN個の比較対象の画像が選択され、そのN個の対象が比較対象とされる。この場合の数Nは、前の階層の場合の数の1/2に設定されている。従って、階層が下位に移行するに伴って、比較対象の数は少なくなっていく。
ステップS108またはステップS117において、選択対象の数が基準値以下になったと判定された場合、ステップS118において、復号部43は検索対象と比較対象を復号する。すなわち、検索対象の画像と、それに類似すると判断された基準値以下の数の比較対象の画像が復号される。もちろん階層0の画像は符号化されていないので、復号処理は不要である。
ステップS119において、出力部44は検索対象と検索された比較対象を出力する。すなわち、ステップS118で復号された検索対象と比較対象の画像が表示される。ユーザは、この表示を見て、最終的に検索対象に類似する画像を特定することができる。
このようにアクティビティの高い階層の画像から順番に検索を行うことで、例えば複雑な所望の画像をより迅速かつ確実に検索することができる。
以上の図11と図12、並びに図19と図20の実施の形態においては、階層ごとに類似する画像の候補を絞り込むようにしたが、全階層の距離を総合的に判断して候補を決定することもできる。
この場合、比較部42は図21に示されるように、図10の距離演算部91、記憶部92、判定部93、および選択部94以外に、順位付け部151と点数計算部152を有している。設定部95は省略されている。
次に、図22のフローチャートを参照して、この場合の検索処理について説明する。
ステップS151において、読み出し部41はユーザの指示に基づいて、より上位の階層から順番に1つの検索対象を取得する。いまの場合、最上位の階層の検索対象がデータベース23から読み出される。
ステップS152において、読み出し部41は、ステップS151で取得された階層と同じ階層の比較対象を取得する。いまの場合、1つの比較対象の最上位の画像が読み出される。
ステップS153において、比較部42の距離演算部91は、2つの対象の距離を演算する。すなわちステップS151で取得された検索対象の画像と、ステップS152で取得された比較対象の画像の距離が演算される。ステップS154において、記憶部92は演算された距離を記憶する。
ステップS155において判定部93は、同じ階層の全ての比較対象との距離を演算したかを判定する。いまの場合、全ての比較対象の階層0の画像と、検索対象の階層0の画像との距離が演算されたかが判定される。まだ演算していない比較対象が存在する場合、処理はステップS152に戻り、同じ階層の他の1つの比較対象が取得される。
ステップS153においてその新たな比較対象と検索対象の画像との距離が演算され、その距離がステップS154で記憶される。同様の処理が、同じ階層の全ての比較対象との距離が演算されるまで繰り返される。
ステップS155において、同じ階層の全ての比較対象との距離が演算されたと判定された場合、ステップS156において順位付け部151は、距離の短い順番に比較対象に順位を付ける。ステップS157において点数計算部152は、N位までの比較対象に順位に応じて、例えば次のように点数を付ける。
1位 100
2位 90
3位 80
4位 70


ステップS158において判定部93は、全ての階層の比較対象の点数を演算したかを判定する。まだ点数を演算していない階層の比較対象が存在する場合、処理はステップS151に戻り、それ以降の処理が繰り返される。このようにして全ての階層の比較対象の画像に点数が付けられる。
ステップS158において全ての階層の比較対象の点数が演算されたと判定された場合、ステップS159において点数計算部152は、各比較対象の各階層の点数を加算する。これにより、各比較対象に対して点数が対応付けられることになる。
ステップS160において選択部94は、ステップS159で演算された点数の大きい順番に必要な数の対象を選択する。点数が大きい比較画像は、それだけ検索対象の画像に類似する画像である。
ステップS161において、復号部43は検索対象と比較対象を復号する。すなわち、検索対象の画像と、ステップS160で選択された比較対象の画像が復号される。もちろん階層0の画像は符号化されていないので、復号処理は不要である。
ステップS162において、出力部44は検索対象と検索された比較対象を出力する。すなわち、ステップS161で復号された検索対象と比較対象の画像が表示される。ユーザは、この表示を見て、最終的に検索対象に類似する画像を特定することができる。
図22の処理によれば、このように、全ての階層の点数が演算されるので、検索漏れが発生するおそれが少なく、確実な検索が可能となる。
階層の選択方法や候補の選択方法を組み合わせることができる。これにより、ユーザの使用目的に沿った検索が可能となる。
以上においては、画像を検索するようにしたが、本発明は音声情報その他の情報を検索する場合にも適用することができる。
上述した一連の処理は、ハードウエアにより実行させることもできるし、ソフトウエアにより実行させることもできる。一連の処理をソフトウエアにより実行させる場合には、そのソフトウエアを構成するプログラムが、専用のハードウエアに組み込まれているコンピュータ、または、各種のプログラムをインストールすることで、各種の機能を実行することが可能な、例えば汎用のパーソナルコンピュータなどに、プログラム記録媒体からインストールされる。
コンピュータにインストールされ、コンピュータによって実行可能な状態とされるプログラムを格納するプログラム記録媒体は、磁気ディスク(フレキシブルディスクを含む)、光ディスク(CD−ROM(Compact Disc-Read Only Memory),DVD(Digital Versatile Disc)を含む)、光磁気ディスクを含む)、もしくは半導体メモリなどよりなるパッケージメディアであるリムーバブルメディア、または、プログラムが一時的もしくは永続的に格納されるROMやハードディスクなどにより構成される。プログラム記録媒体へのプログラムの格納は、必要に応じてルータ、モデムなどのインタフェースを介して、ローカルエリアネットワーク、インターネット、デジタル衛星放送といった、有線または無線の通信媒体を利用して行われる。
なお、本明細書において、プログラムを記述するステップは、記載された順序に沿って時系列的に行われる処理はもちろん、必ずしも時系列的に処理されなくとも、並列的あるいは個別に実行される処理をも含むものである。
また、本明細書において、システムとは、複数の装置により構成される装置全体を表すものである。
なお、本発明の実施の形態は、上述した実施の形態に限定されるものではなく、本発明の要旨を逸脱しない範囲において種々の変更が可能である。
本発明の情報検索システムの構成を示すブロック図である。 情報検索装置の構成を示すブロック図である。 符号化部の機能的構成を示すブロック図である。 符号化処理を説明するフローチャートである。 マクロブロックを説明する図である。 階層化を説明する図である。 マクロブロックの分割を説明する図である。 階層化した画像を説明する図である。 階層ごとの符号化を説明する図である。 比較部の機能的構成を示すブロック図である。 検索処理を説明するフローチャートである。 検索処理を説明するフローチャートである。 階層ごとの絞込みを説明する図である。 階層ごとの符号を説明する図である。 エッジ方向符号を説明する図である。 エッジ方向符号による符号化を説明する図である。 エッジ方向符号による距離を説明する図である。 比較部の機能的構成を示すブロック図である。 検索処理を説明するフローチャートである。 検索処理を説明するフローチャートである。 比較部の機能的構成を示すブロック図である。 検索処理を説明するフローチャートである。
符号の説明
1 情報検索システム, 11 情報符号化装置, 12 情報検索装置, 21 入力部, 22 符号化部, 23 データベース, 24 検索部, 41 読み出し部, 42 比較部, 43 復号部, 44 出力部, 61 画像分割部, 62 平均値演算部, 63 平均値分離ブロック演算部, 64 ブロック符号化部, 65 判定部, 66マクロブロック分割部, 91 距離演算部, 92 記憶部, 93 判定部, 94 選択部, 95 設定部, 131 アクティビティ演算部, 151 順位付け部, 152 点数計算部

Claims (10)

  1. 保持する情報を入力する入力部と、
    入力された情報をマクロブロックに分割し、前記マクロブロックを所定のサイズのサブブロックに分割する分割部と、
    前記サブブロックの平均値を演算する平均値演算部と、
    前記マクロブロックから前記平均値を減算して平均値分離ブロックを演算する平均値分離ブロック演算部と、
    前記マクロブロック内において前記サブブロックの大きさがより小さくなるように分割を繰り返して演算された、各階層の前記平均値分離ブロックを、階層ごとに異なる方式で符号化する符号化部と、
    前記階層ごとに異なる方式で符号化された情報を保持するデータベースと
    を備える情報処理装置。
  2. 前記情報は画像情報であり、
    前記符号化部は、最上位階層の前記画像情報をサムネイル画像とする
    請求項1に記載の情報処理装置。
  3. 前記平均値演算部は、さらに前記マクロブロック自体の平均値を演算し、
    前記符号化部は、前記マクロブロック自体の平均値の情報を符号化せずに、最上位の階層の情報とする
    請求項に記載の情報処理装置。
  4. 前記データベースに保持されている前記情報を、より上位の階層から順番に取得する取得部と、
    取得された検索対象と比較対象の符号化されている情報を階層ごとに比較する比較部と、
    比較結果に基づいて、前記検索対象に類似する前記比較対象の情報を復号する復号部と、
    復号された前記検索対象に類似する前記比較対象の情報を出力する出力部と
    さらに備える請求項1に記載の情報処理装置
  5. 前記比較部は、前記検索対象と前記比較対象の符号化されている情報の距離を比較する
    請求項に記載の情報処理装置。
  6. 前記比較部は、上位の階層で距離が短いと判断された前記比較対象の情報の下位の階層の情報を、順次前記検索対象の情報と比較する
    請求項に記載の情報処理装置。
  7. 前記比較部は、前記検索対象のアクティビティがより大きい階層から順番に比較する
    請求項に記載の情報処理装置。
  8. 前記比較部は、各階層の前記比較対象の情報の距離に応じて付加した点数に基づいて、前記検索対象に類似する前記比較対象の情報を検索する
    請求項に記載の情報処理装置。
  9. 入力部が、保持する情報を入力し、
    分割部が、入力された情報をマクロブロックに分割し、前記マクロブロックを所定のサイズのサブブロックに分割し、
    平均値演算部が、前記サブブロックの平均値を演算し、
    平均値分離ブロック演算部が、前記マクロブロックから前記平均値を減算して平均値分離ブロックを演算し、
    符号化部が、前記マクロブロック内において前記サブブロックの大きさがより小さくなるように分割を繰り返して演算された、各階層の前記平均値分離ブロックを、階層ごとに異なる方式で符号化する
    情報処理方法。
  10. 保持する情報を入力し、
    入力された情報をマクロブロックに分割し、前記マクロブロックを所定のサイズのサブブロックに分割し、
    前記サブブロックの平均値を演算し、
    前記マクロブロックから前記平均値を減算して平均値分離ブロックを演算し、
    前記マクロブロック内において前記サブブロックの大きさがより小さくなるように分割を繰り返して演算された、各階層の前記平均値分離ブロックを、階層ごとに異なる方式で符号化する
    処理をコンピュータに実行させるプログラム。
JP2007281029A 2007-10-29 2007-10-29 情報処理装置および方法、並びにプログラム Expired - Fee Related JP5056348B2 (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2007281029A JP5056348B2 (ja) 2007-10-29 2007-10-29 情報処理装置および方法、並びにプログラム
US12/255,108 US8284843B2 (en) 2007-10-29 2008-10-21 Information encoding apparatus and method, information searching apparatus and method, information searching system and method, and program therefor

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2007281029A JP5056348B2 (ja) 2007-10-29 2007-10-29 情報処理装置および方法、並びにプログラム

Publications (3)

Publication Number Publication Date
JP2009111649A JP2009111649A (ja) 2009-05-21
JP2009111649A5 JP2009111649A5 (ja) 2010-05-06
JP5056348B2 true JP5056348B2 (ja) 2012-10-24

Family

ID=40582813

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2007281029A Expired - Fee Related JP5056348B2 (ja) 2007-10-29 2007-10-29 情報処理装置および方法、並びにプログラム

Country Status (2)

Country Link
US (1) US8284843B2 (ja)
JP (1) JP5056348B2 (ja)

Families Citing this family (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102918840B (zh) 2009-10-01 2016-05-25 Sk电信有限公司 使用分割层进行图像编码/解码的方法和装置
WO2012114386A1 (ja) * 2011-02-25 2012-08-30 三菱電機株式会社 画像ベクトル化装置、画像ベクトル化方法及び画像ベクトル化プログラム
GB2509055B (en) * 2012-12-11 2016-03-23 Gurulogic Microsystems Oy Encoder and method
US10255315B2 (en) 2012-12-11 2019-04-09 Gurulogic Microsystems Oy Encoder, decoder and method
JP2019049990A (ja) * 2013-11-15 2019-03-28 コリスタ・エルエルシーCorista Llc 連続画像処理
US10057577B2 (en) * 2015-06-11 2018-08-21 Sony Corporation Pre-charge phase data compression
CN113760954A (zh) * 2021-09-07 2021-12-07 中国铁塔股份有限公司 一种编码查询方法、装置及设备

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3315241B2 (ja) * 1994-03-30 2002-08-19 株式会社東芝 画像ファイル装置
JP3048033B2 (ja) * 1994-09-07 2000-06-05 富士ゼロックス株式会社 画像情報符号化処理装置及び画像情報通信装置
JPH11312173A (ja) 1998-04-30 1999-11-09 Pfu Ltd 高精細画像処理装置及びそのプログラム記憶媒体
JP2001052010A (ja) * 1999-08-06 2001-02-23 Canon Inc 画像検索装置およびその方法
JP3715283B2 (ja) * 2003-02-04 2005-11-09 株式会社半導体理工学研究センター 動画像の画像圧縮符号化方法及び装置
KR100716998B1 (ko) * 2005-05-24 2007-05-10 삼성전자주식회사 블록화 현상을 감소시키기 위한 부호화 및 복호화 장치 및그 방법과, 이를 구현하기 위한 프로그램이 기록된 기록매체
US8023569B2 (en) * 2005-12-15 2011-09-20 Sharp Laboratories Of America, Inc. Methods and systems for block-based residual upsampling

Also Published As

Publication number Publication date
JP2009111649A (ja) 2009-05-21
US20090110079A1 (en) 2009-04-30
US8284843B2 (en) 2012-10-09

Similar Documents

Publication Publication Date Title
JP5056348B2 (ja) 情報処理装置および方法、並びにプログラム
KR101152576B1 (ko) 비디오 데이터의 인코딩을 위한 인코딩 유형 및 예측 모드 선택
JP6073405B2 (ja) 映像復号化方法及び装置
JP5836625B2 (ja) 画像の符号化および復号化
EP3139607A1 (en) Template matching-based intra-prediction coding and decoding and array scanning method and device
JP2007189276A (ja) 画像圧縮装置及び画像圧縮プログラム
JP2005260588A5 (ja)
JP7401822B2 (ja) 画像符号化方法、画像符号化装置及びプログラム
JP7411785B2 (ja) イントラ予測のための補間フィルタリング方法と装置、コンピュータプログラム及び電子装置
JP2007527126A (ja) 画像部分の圧縮方法および装置
JP2023523272A (ja) 最近傍検索方法、エンコーダ、デコーダ、及び記憶媒体
JP2012129791A (ja) 画像符号化装置
US20220094951A1 (en) Palette mode video encoding utilizing hierarchical palette table generation
JP4032049B2 (ja) 動きベクトル検出方法及びその装置
JP2017050744A (ja) 画像符号化装置、画像符号化方法、及びプログラム
JP2007049594A (ja) 画像データの処理方法
JP2009110211A (ja) 情報符号化装置および方法、情報検索装置および方法、情報検索システムおよび方法、並びにプログラム
CN109618162B (zh) 带宽压缩中的后选择预测方法
CN109451305B (zh) 带宽压缩中的预测方法
JP2012120108A (ja) 補間画像生成装置及びプログラム、並びに、動画像復号装置及びプログラム
US20240333923A1 (en) Image encoding/decoding method using neural network-based in-loop filter, device, and recording medium storing bitstream
WO2021171360A1 (ja) 符号化方法、符号化装置及びプログラム
JP4767908B2 (ja) 画像復号装置及び画像符号化装置
JP2014027371A (ja) イントラ予測処理装置及びプログラム
JP5298082B2 (ja) 適応的に直交変換係数の走査順序を決定する符号化装置及び復号装置

Legal Events

Date Code Title Description
A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20100319

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20100319

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20110823

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20110830

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20111021

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20120703

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20120716

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20150810

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20150810

Year of fee payment: 3

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

LAPS Cancellation because of no payment of annual fees