JP3709158B2 - 部分選択変換装置、部分選択変換方法及び部分選択変換プログラム - Google Patents

部分選択変換装置、部分選択変換方法及び部分選択変換プログラム Download PDF

Info

Publication number
JP3709158B2
JP3709158B2 JP2001317371A JP2001317371A JP3709158B2 JP 3709158 B2 JP3709158 B2 JP 3709158B2 JP 2001317371 A JP2001317371 A JP 2001317371A JP 2001317371 A JP2001317371 A JP 2001317371A JP 3709158 B2 JP3709158 B2 JP 3709158B2
Authority
JP
Japan
Prior art keywords
signal
conversion
partial
compressed
compression
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2001317371A
Other languages
English (en)
Other versions
JP2003124815A (ja
Inventor
優年 関根
雅 仁木
俊暁 木塲
光 伊藤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Japan Science and Technology Agency
National Institute of Japan Science and Technology Agency
Original Assignee
Japan Science and Technology Agency
National Institute of Japan Science and Technology Agency
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Japan Science and Technology Agency, National Institute of Japan Science and Technology Agency filed Critical Japan Science and Technology Agency
Priority to JP2001317371A priority Critical patent/JP3709158B2/ja
Publication of JP2003124815A publication Critical patent/JP2003124815A/ja
Application granted granted Critical
Publication of JP3709158B2 publication Critical patent/JP3709158B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Landscapes

  • Image Analysis (AREA)
  • Complex Calculations (AREA)
  • Image Processing (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)
  • Compression Of Band Width Or Redundancy In Fax (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Description

【0001】
【発明の属する技術分野】
本発明は、部分選択変換装置、部分選択変換方法及び部分選択変換プログラムに係り、特に、画像認識の前処理手法のひとつであるウェーブレット変換等の変換による信号処理及び解析を行う部分選択変換装置、部分選択変換方法及び部分選択変換プログラムに関する。さらに、本発明は、画像認識が2次元の信号処理であるのと同様に、1次元の信号処理である音声認識にも関する。
【0002】
【従来の技術】
ウェーブレット理論に基づく信号処理技術は、短時間フーリエ変換とマッチド・フィルター技術とが融合して発展したものであり、数学的な変換式が定義され多くの利用分野で使用されている。実現の仕方はプログラムにより変換式を記述し、DSP(digital signal processor)やマイクロ・プロセッサで実行する方法がもっとも安易である。従来の信号処理は、全画面領域や信号領域を一括して圧縮し、かつ、一括して伸張するものであり、信号伝播の負荷を減らす目的で利用されていた。しかし、これらの方式では、特徴抽出を行い即座に判断処理などの高度な信号処理と制御を組み合わせた複雑な処理を実時間で行うには不十分である場合が想定される。
【0003】
また、ウェーブレット変換をプロセッサやDSP上のプログラムにより実行する方法では、命令を逐次的に実行することでウェーブレット変換を実現していた。このため、処理時間が膨大にかかるために実時間での処理が困難である場合が想定される。また、特定の変換だけにではなく、変換した信号を用いて複雑な信号処理も同時に行うため、プロセッサに大きな負荷がかかっていた。
【0004】
【発明が解決しようとする課題】
一般に、画像認識、画像処理等の信号処理などでは、情報量が多いと処理の負担が多くなり実時間での精密な信号処理が困難である場合が想定される。他方、信号圧縮すれば、画像認識等の信号処理時の負担が軽減されるが、反面、情報量が減るために不十分な信号処理しか出来なくなる場合が想定される。
ソフトウェアによる様々な画像認識システムでは、coarse-to-fineテンプレート・マッチングにより、場所決めをコーステンプレートで行う方法が一般的である(Mohammad Gharavi-Alkhansari,”A Fast Globally Optimal Al-gorithm for Template Maching Using Low-Resolution Pruning,”in IEEE TRANSACTIONS ON IMAGE PROCESSING,Vol.10,No.4,April,2001.)(高野茂,新島耕一,“Haarウェーブレットを用いた高速カラー画像検索システム,”九州大学大学院システム情報科学研究科報告,Vol2,No2,pp.229-234,September 1997.)。しかしながら、この方法では、コーステンプレートで得た場所がファインテンプレートで得られる場所と必ずしも一致しない場合が想定される。そのため、順次精度を上げていく必要があり、計算量が大きくなる。
【0005】
また、不要な対象を精度を高めていく途中で削除する方法も提案されている(Mohammad Gharavi-Alkhansari,"A Fast Globally Optimal Al-gorithm for Template Maching Using Low-Resolution Pruning," in IEEE TRANSACTIONS ON IMAGE PROCESSING, Vol.10, No.4, April, 2001.)。しかしながら、この方法では、マッチングの計算量が24〜1200倍も減らすことが出来るが、データ圧縮のオーバーヘッドがあると報告されている。
【0006】
さらに、画像認識の前処理方法としては、フーリエ変換、離散コサイン変換、ウェーブレット変換などの各種変換処理が挙げられる。ウェーブレット変換を使って画像データマイニングを行うソフトウェアでは、全てのデータをウェーブレット係数とし、大きい順に上位60個の係数を比較する事で、良好な結果を得たと報告されている(Charles E. Jacobs, Adam Finkelstein, David H. Salesin, "Fast Multiresolution Image Querying," in Proceedings of SIGGRA-PH 95, August, 1995.)。しかしながら、この方法では、ウェーブレット変換を使用するため計算量が多くなってしまう。
【0007】
本発明の目的のひとつは、以上の点に鑑み、情報量の削減と信号処理の高精密度化とを同時に達成する部分選択変換装置、部分選択変換方法及び部分選択変換プログラムを提供することにある。また、本発明の他の目的は、画像認識、画像処理、音声認識、音声処理等の高度な処理を実時間で高速に処理できる部分選択変換装置、部分選択変換方法及び部分選択変換プログラムを提供することにある。
【0008】
【課題を解決するための手段】
ここで、本発明に関連する技術について説明する。また、本発明に関する説明は画像認識を例にして説明するが、時間軸に沿った1次元データである音声認識に対しても同様の説明であるので省略する。
本発明では、主に圧縮・伸張を行うのが目的であった従来型のウェーブレット変換チップを、入力画像の部分選択的な圧縮を行い画像認識システムの前処理に使用することにした。このウェーブレット変換チップにより大量のデータ圧縮を行い、認識ソフトにより複雑なデータ解析を行う。この際、どのような入力画像に対しても同様の圧縮を行う手法では、それぞれの画像の特徴を抽出するのに負荷が大きくなる。そこで、1つの入力画像に対して多段階でウェーブレット変換を行い、領域ごとに圧縮レベルを変えて、個々の領域に適したデータを出力することで、認識ソフトにおける適切な特徴抽出と負荷の軽減を同時に行う。また、このウェーブレット変換チップを画像認識システムに組み込むことで、ハ−ドウェアの高速性とソフトウェアの柔軟性とを兼ね備え、負荷分散と同時に機能を分散したソフトウェア及びハードウェア混載画像認識システムの実現を可能とした。
【0009】
また、本発明では、信号圧縮を専用の回路で行う上で、不要な領域は大きく圧縮し、解析が必要な部分領域は圧縮を制限することにより、信号解析を行うデータ量を圧縮すると同時に信号の劣化を防止し、さらに、画像認識等の高度な処理を実時間で高速に処理できるようにした。
【0010】
本発明の第1の解決手段によると、
部分領域毎に指定された圧縮レベルに変換するための変換命令に従い、解析対象領域の入力信号を部分領域毎に圧縮して圧縮信号を生成する信号変換部と、
前記信号変換部から圧縮信号を入力し、前記信号変換部に該変換命令を与えるための信号処理解析部と
を備え、
前記信号変換部は、前記信号処理解析部からの変換命令に従い、入力された全領域又は所定領域の信号を最大限又は予め定められた第1の圧縮レベルに圧縮し、対象領域の部分領域毎の第1の圧縮信号を前記信号処理解析部に出力し、
前記信号処理解析部は、前記信号変換部からの部分領域毎の第1の圧縮信号に基づき、第1の圧縮レベルと異なる第2の圧縮レベルで圧縮すべき再変換の対象となる再変換部分領域及び第2の圧縮レベルを求め、再変換命令を出力し、
前記信号変換部は、前記信号処理解析部からの再変換命令に従い、指定された再変換部分領域を第2の圧縮レベルで再変換して、第2の圧縮信号を出力することにより、
それぞれ所望の第1又は第2の圧縮レベルで圧縮された部分領域の第1又は第2の圧縮信号を含む対象領域の圧縮信号を出力するようにした部分選択変換装置を提供する。
【0011】
本発明の第2の解決手段によると、
部分領域毎に指定された圧縮レベルに変換するための変換命令に従い、解析対象領域の入力信号を部分領域毎に圧縮して圧縮信号を生成する信号変換部を用いた部分選択変換方法であって、
前記信号変換部に変換命令を与えるステップと、
前記信号変換部により、該変換命令に従い、入力された全領域又は所定領域の信号を最大限又は予め定められた第1の圧縮レベルに圧縮された、対象領域の部分領域毎の第1の圧縮信号を入力するステップと、
前記信号変換部からの部分領域毎の第1の圧縮信号に基づき、第1の圧縮レベルと異なる第2の圧縮レベルで圧縮すべき再変換の対象となる再変換部分領域及びその第2の圧縮レベルを求め、再変換命令を出力するステップと、
前記信号変換部により、該再変換命令に従い、指定された再変換部分領域を第2の圧縮レベルで再変換された第2の圧縮信号を入力するステップと、
所望の第1又は第2の圧縮レベルでそれぞれ圧縮された部分領域の第1又は第2の圧縮信号を含む対象領域の圧縮信号を出力するステップと
を含む部分選択変換方法及びプログラムを提供する。
【0012】
本発明の特徴のひとつとしては、画像圧縮等の信号圧縮を行う部分と、画像認識等の信号処理・解析を行う部分とを繋ぎ、画像認識等の信号処理・解析部分の処理結果を信号圧縮部分に命令やパラメータなどにして戻して部分領域と圧縮レベルを指定する事で、情報量の削減と信号処理の精密度とを同時に達成することができる。
【0013】
本発明の他の特徴としては、例えば、画像認識システムの前処理での画像圧縮として、Haar関数による離散Wavelet変換チップを備え、さらに、テンプレート・マッチングのソフトウェアにより領域と圧縮率の程度を指定することで、部分領域毎に異なる圧縮率を持った画像を得ることができる。この変換チップにより大量のデータ圧縮を行い、認識ソフトによるデータ処理量を削減することで、特徴抽出の計算量が減少し、認識作業が容易となる。また、ここでは画像認識システムについてのみ説明したが、音声認識システムに於いても同様である。
【0014】
【発明の実施の形態】
1.概要
まず、Haarのウェーブレット変換を用いた画像処理手法についての概要を説明する。本実施の形態では、Haar関数を用いた離散ウェーブレット変換を使用してハードウェアによる多重解像度での圧縮処理を行う。Haarのスケーリング関数Φ(x)とHaarのウェーブレット関数Ψ(x)は次式(1)(2)のように定義される(xは、座標値)。
Figure 0003709158
【0015】
図1は、Haar−Wavelet変換による平滑化とエッジ抽出の説明図である。
ここで、二つの変換されたイメージは、異なる画像成分を取り出して得ることが出来る。平滑化によるスケーリングイメージは、空間周波数の低周波成分、すなわち、2次元画像の上下左右方向に隣り合った領域での画像変化が少ない画像成分を優先的に取り出すフィルター(これをローパス・フィルターという)より得られる。反対に、エッジ抽出によるウェーブレットイメージは、画像の変化が大きい図形成分を優先的に取り出すフィルター(これをハイパス・フィルターという)より得られる。例えば、スケーリング関数Φ(x)をローパス・フィルター、ウェーブレット関数Ψ(x)をハイパス・フィルターとして入力画像(オリジナルイメージ)の水平方向・垂直方向の順に1次元変換を行うことで、圧縮された平滑化画像(スケーリングイメージ)とエッジ抽出画像(ウェーブレットイメージ)が得られる。この例では、図示のように1/4に圧縮されている。
【0016】
図2は、多重解像度についての説明図である。
ここでは、一例として、ウェーブレット変換を1回行うことを1レベル変換とし、ここで得られる元画像を1/4に圧縮したスケーリングイメージとウェーブレットイメージをレベル1とする。レベル1のスケーリングイメージをさらに1レベル変換することで、元画像を1/16に圧縮したレベル2のスケーリングイメージとウェーブレットイメージが得られる。レベル2のスケーリングイメージをさらに1レベル変換することで、元画像を1/64に圧縮したレベル3のスケーリングイメージとウェーブレットイメージが得られる。このように、ウェーブレット変換してできた低周波成分をさらに変換するという作業(多重解像度)を繰り返すことにより、様々な圧縮レベルのデータを得ることができる。
【0017】
つぎに、入力画像(オリジナルイメージ)に対するシミュレーション結果を示す。
図3は、シミュレーション結果を示す図(1)である。なお、このシミュレーションは、図3(a)に示す入力画像(元画像)に対する本実施の形態における部分選択変換装置の動作を確認するためのものである。ここでは、ソフトウェアから出力された画像データにコマンド及びパラメータを付加し、入力とした(コマンド及びパラメータについては後述する)。また、出力されたデータを、わかりやすいようにソフトウェアにより画素の大きさを変えて表示させた。ここで、図3(c)に示す画像は、コマンドによりスケーリングイメージを指定し、パラメータにより各部分領域の圧縮レベルを図3(b)のように割り当てた場合の出力画像である。
【0018】
図4は、シミュレーション結果を示す図(2)である。なお、図3と同様に、このシミュレーションは、図4(a)に示す入力画像(元画像)に対する本実施の形態における部分選択変換装置の動作を確認するものである。
【0019】
2.ハードウェア及びソフトウェア
図5は、本実施の形態に関する部分選択変換装置の構成図である。
部分選択変換装置100は、例えば、信号変換回路10と、信号処理解析装置30とを備える。信号変換回路10は、入力処理回路20、ウェーブレット変換チップ50を備える。信号処理解析装置30は、判定回路40を備える。なお、信号処理解析装置30は、後述するテンプレートを記憶した記憶部を含む。
【0020】
図6は、部分選択変換装置100の動作の説明図である。なお、ここでは、信号変換回路10と信号処理解析装置30との間の動作を概略的に説明するため、特に、信号変換回路10に含まれるウェーブレット変換チップ50と、判定回路40の機能のひとつであるテンプレート・マッチングとを示す。
【0021】
信号変換回路10は、部分選択変換装置(画像認識システム)100上で使用する。まず、信号変換回路10は、解析対象となる全ての入力データ(▲1▼)に対して圧縮処理を行う。次に、信号処理解析装置30の判定回路40は、信号変換回路10より出力された圧縮率の高いデータ(▲2▼)に対して、テンプレート・マッチング、マニュアルによる指定等により重要性の高い領域又は圧縮率を低くすべき領域の抽出を行う。さらに、信号処理解析装置30は、領域の抽出結果をコマンド(▲3▼)として信号変換回路10に出力する。さらに、信号変換回路10は、再度読み込んだ画像データに対し、信号処理解析装置30で抽出された領域について、コマンド(▲3▼)により、部分的に圧縮率の低いデータ(▲4▼)を出力する。最後に、信号処理解析装置30は、出力されたデータ(▲4▼)を用いてテンプレート・マッチングによる認識作業を行い、所望の抽出された領域が所望の圧縮率となっていると認識すると、その結果(▲5▼)を出力する。なお、判定回路40はウェーブレット変換チップ50により出力されたデータ(▲4▼)をそのまま出力してもよいし、出力データ(▲4▼)をウェーブレット変換チップ50から直接出力するようにしてもよい。
【0022】
図7は、部分選択変換装置100の動作についてのフローチャートである。
まず、信号変換回路10に解析対象となる全領域の画像についての入力信号列が入力される(S101)。なお、入力信号列は、適宜のメモリに記憶され、そこから読み出すようにしてもよいし、CCDカメラ等の入力装置から処理の際に入力されるようにしてもよい。信号変換回路10は、全領域又は所定領域の信号を最大限又は予め定められたレベルに圧縮する(S102)。入力処理回路20は、解析対象の全領域を部分領域毎の処理に分け、部分領域の位置を識別する部分領域信号とその入力信号の変換出力とを部分領域毎に信号処理解析装置30に出力する。信号処理解析装置30は、重要性の高い又は圧縮率を低くすべき解析対象領域の切り出しを行う(S103)。すなわち、信号処理解析装置30は、判定回路40により部分領域毎に変換された変換出力を解析し、詳細な画像を再入力させる部分領域を選別する。ここで、部分領域を選別するための手段は、判定回路40が自動的に選別する方法と、操作者がマニュアルで適宜の入力装置により指定する方法等がある。前者の方法では、解析手法により異なるが、たとえば、記憶してあるテンプレートなどの記憶情報との一致度を計算して順序つける手段、部分領域の全ウェーブレット係数の絶対値の和により部分領域を順序つける手段等がある。また、後者による方法は、例えば、操作者がディスプレイを見ながら図示されない適宜の入力装置(キーボード、ポインティングデバイス等)により、所定の領域を指定するようにすればよい。なお、これらの選別の手段は処理の負担度に応じて適時選択すればよい。
【0023】
信号処理解析装置30は、判定回路40又は入力装置からの指令による抽出(選択)結果に基づき、各部分領域に対して再度、圧縮レベルを指定する。このとき、信号処理解析装置30は、全部分領域に対して再度圧縮レベルを指定してもよいし、抽出された部分領域のみに再度圧縮レベルを決定してもよい(S105)。信号変換回路10は、ステップS105で決定された圧縮レベルと部分領域の位置に応じて、再変換が必要な領域を再変換する(S107)。その際、信号処理解析装置30は、再変換を必要としない部分領域の圧縮データを適宜の記憶部に保持するようにしてもよい。なお、信号処理解析装置30は、全領域について各圧縮レベルに従い再変換してもよい。信号変換回路10は、入力信号列を再度メモリから読み出し又は入力装置から入力して、それを再変換して、信号処理解析装置30に再度送出する。こうして、詳細な画像領域に指定された部分領域は前より圧縮レベルが下がり、元入力に近い画像が求められる。信号処理解析装置30は、領域毎に異なる又は所望の変換レベル(圧縮レベル)を持った部分領域からなる解析対象となる全領域の出力データを全画像領域の圧縮・変換結果として出力する(S109)。
【0024】
以下に判定回路40について説明する。判定回路40は、信号処理解析装置30の中に、一つの機能ブロックとしてあり、解析結果に基づいて命令を発生させる。
まず、テンプレートによる部分領域の選別について説明する。テンプレートによる場合、判定回路40は、例えば、比較回路や一致回路を有し、所望の画像に関する信号値をベクトル化してテンプレートとして予め記憶部に記憶して用意しておく。例えば、顔に関しては、目、鼻等の圧縮率を低くする(重要性の高い)領域として定めた場合、その画像と所望レベルを表すテンプレートを所定数予め用意して記憶部に記憶する。すなわち、同一の対象、例えば、顔に関しても、異なる圧縮レベルに対応した顔テンプレートを作り用意しておく。例えば、ブロック形状の画像領域として顔画像をテンプレートとして用意する。
【0025】
判定回路40では、記憶部からテンプレートを読み出し、マッチングをとることで、領域の抽出を行うことができる。さらに、詳しくは、判定回路40は、例えば、2次元の画像ブロックでは、画素が2次元に並んでおり、その画素を一次元に並べてベクトル化する。ベクトル化する前に、2次元の画像ブロックをいくつかの圧縮レベルにまで圧縮しておく。すると、圧縮する毎に隣り合った画素の平均がとられ、画像が荒くなり、異なる粗さのテンプレートが得られる。また、部分領域毎に信号解析が不要か必要かは、判定回路40の適宜のデータベースに記憶されたテンプレートと部分領域の信号と一致するかどうかを計算することで、判定する。そのために、部分領域の信号もベクトル化する。この一致するかどうかの計算は、例えば、1)二つのベクトルの内積を取る。2)ベクトルの差をとる。3)ベクトルの成分を1、0に量子化してからEXOR(排他的論理和)をとる、等がある。
【0026】
また、判定回路40は、次のように圧縮レベルを求めることができる。圧縮レベルを求めるには、異なる圧縮レベルのテンプレートと比較して、どのテンプレートのどの圧縮レベルと最も一致するかを計算をして検出し、所望の圧縮レベル(パラメータ)を得る。判定回路40は、部分領域毎にパラメータで定めた圧縮レベルについての命令を信号変換回路10に出力する。
【0027】
つぎに、部分領域の全ウェーブレット係数の絶対値の和により部分領域を順序つける手段について説明する。
まず、入力画像I(X,Y)を、上述の数式(1)(2)で定義されたHaarのスケーリング関数Φ(x)とHaarのウェーブレット関数Ψ(x)とで展開すると、
I(X,Y)=Σx,y{WΦ X,YΦ(X)Φ(Y)+WΨ X,YΨ(X)Ψ(Y)}
となる。このWΦ X,Y、WΨ X,Yをスケーリング係数、ウェーブレット係数と言う。ここで、あるレベルL−1のΦ L−1(x)とΨ L−1(x)とに関して、次式によりレベル変換(圧縮操作)を行う。
Φ(X)=1/2(ΦL−1(XM−1)+ΦL−1(XM+1)) (3)
Ψ(X)=1/2(ΨL−1(XM−1)−ΨL−1(XM+1)) (4)
【0028】
すると、次式のように、WΦ X,Y、WΨ X,Yにも同様な変換が得られ、WΦ X,Y 、WΨ X,Y となる。この係数は座標(X,Y)の各画素毎に定まる。
Φ X,Y (X)=1/2(WΦ X,Y L−1(XM−1)+WΦ X,Y L−1(XM+1)) (5)
Ψ X,Y (X)=1/2(WΦ X,Y L−1(XM−1)−WΦ X,Y L−1(XM+1)) (6)
【0029】
入力画像Iと同様にテンプレートに対しても事前に展開を行う。例えば、顔画像テンプレートTでは、顔画像が含まれているブロック形状の画像領域I中をレベルLのHaarのスケーリング関数Φ L(x)とHaarのウェーブレット関数Ψ L(x)とで展開しその展開係数WΦ X,Y、WΨ X,Yを求める。一致処理を高速化する場合には、この係数を係数値順に並べて、値、あるいは、絶対値の大きい順に必要な数だけ取り出して、テンプレートベクトルW(I)を作成する。
【0030】
つぎに、部分領域I内の全画素に対してこの係数の絶対値を求めて和をとり、部分領域の和W(I)とする。W(I)を大きい順に並べて、テンプレートと比較するのに意味がある比較候補として部分領域Iを選択する。こうすることで、画像の空間変化が少ない背景に関係する部分領域Iは取り除くことが出来る。W(I)が大きい領域はどれかのテンプレートとマッチングする可能性が大きいので、全テンプレートとの一致計算を行う。
【0031】
一致計算としてベクトルの内積を使用する場合には、一致度Dは、
D(W(I),W(I))=ΣW(I)W(I
で与えられる。この一致計算結果の値Dに従ってテンプレートを並べる。これにより、該当するテンプレートを求めることができる。
【0032】
図8は、信号変換回路10の構成図である。
信号変換回路10は、例えば、入力処理回路20とウェーブレット変換チップ50と出力選択部19を備える。ウェーブレット変換チップ50は、水平方向の2レベル変換を行うウェーブレット変換部(WT Row L2)11と、垂直方向の2レベル変換を行うウェーブレット変換部(WT Column L2)13と、水平方向の1レベル変換を行うウェーブレット変換部(WT Row L1)15と、垂直方向の1レベル変換を行うウェーブレット変換部(WT Column L1)17とを備える。ウェーブレット変換部11、13、15、17は、逐次的に圧縮が可能である。なお、ウェーブレット変換部11、13、15、17は、加算器と減算器を含み、上式(3)〜(6)により逐次的にスケーリングを行うことができる。
【0033】
また、入力処理回路20は、例えば、コマンド部21と、データセット部23とを備える。この入力処理回路20のコマンド部21は、信号処理解析装置30から入力された命令(部分領域信号と、その部分領域に対応するコマンド及びパラメータ)コマンド及びパラメータのデコードを行い、データセット部23及び出力選択部19に指示を出力する。コマンド部21の出力信号により、例えば、全解析対象領域中の各部分領域を指定し、各領域毎に変換の種類(スケーリングデータ又はウェーブレットデータ等)と、変換の度合いである圧縮レベル(レベル1、2、3等)とが指定される。データセット部23は、例えば、データセット部23への入力データ(オリジナルデータ)もしくは出力選択部19よりフィードバックしてきたデータを、コマンド部21からの部分領域信号、コマンド及びパラメータ等の指示に従い、それぞれのウェーブレット変換部11、13、15、17に転送する。データセット部23は、例えば、出力選択部19により戻された圧縮データをコマンド部21より出力されたコマンドに従い所定の圧縮レベルまで圧縮するために、この圧縮データを適切なウェーブレット変換部11、13、15、17に再度出力することができる。
【0034】
出力選択部19は、例えば、コマンド及びパラメータによる領域ごとに、ウェーブレット変換部11、13、15、17でそれぞれ変換された圧縮データの中からいずれかを出力データとして選択し、また、必要に応じてそれをさらに圧縮・変換するためにデータセット部23に戻す。こうして、出力選択部19は、全てのウェーブレット変換結果のデータを、コマンド部21からの指示により、部分領域ごとにスケーリングデータ又はウェーブレットデータを選択的に出力し、また、領域ごとに異なる圧縮率のデータを出力することが可能となる。
【0035】
また、ウェーブレット変換部11、13、15、17において、1レベル変換ブロックであるウェーブレット変換部15、17の他に2レベル変換ブロックであるウェーブレット変換部11、13を設けることにより、1回の処理でデータを大量に圧縮することができるため、処理速度の向上につながる。なお、信号変換回路10は、適宜構成することが可能であって、例えば、コマンド部21からウェーブレット変換部11、13、15、17及び出力選択部19を指定してもよく、また、出力選択部19で選択してもよい。また、本実施の形態では、特にウェーブレット変換について説明しているが、これに限らず、各種圧縮処理、変換処理を採用してそれに応じた変換チップを設けるようにしてもよい。
【0036】
3.画像圧縮例と有効性
図9は、部分選択的な画像圧縮についての説明図(1)である。ここで、部分領域毎に指定された圧縮レベル命令について説明すると、コマンドによりスケーリングデータの出力かウェーブレットデータの出力かを選択し、パラメータにより領域ごとに変換レベルを指定する。コマンドは、例えば、次の通りである。
0:スケーリングデータの出力、
1:ウェーブレットデータの出力
パラメータは、例えば、次の通りである。
1:レベル1データの出力、
2:レベル2データの出力、
3:レベル3データの出力
このようなコマンド「0」又は「1」に対して、例えば、256×256画素の入力画像を図9(a)のように64ブロックに分割し、各々のブロックにパラメータを割り当てる。図9(b)は、コマンド「0」で、全ての領域でパラメータ「1」とした場合の画像である。
【0037】
図10は、部分選択的な画像圧縮についての説明図(2)である。図10(a)は、コマンド「0」で、全ての領域でパラメータ「2」とした場合の画像である。図10(b)は、コマンド「0」で、全ての領域でパラメータ「3」とした場合の画像である。
【0038】
図11は、部分選択的な画像圧縮についての説明図(3)である。図11(b)は、コマンドを「0」で、パラメータを図11(a)のように割り当てた場合の出力画像の例である。
【0039】
図12は、部分選択的な画像圧縮についての説明図(4)である。図12(b)は、コマンドを「0」で、パラメータを図12(a)のように割り当てた場合の出力画像の例である。
【0040】
図13は、部分選択機能の有効性を示す説明図である。具体的には、図9(a)のような256×256画素の画像を入力とした場合の1レベル変換・2レベル変換・3レベル変換と、図11(b)、図12(b)で示したような多重解像度による部分選択的な変換を行った場合のデータ量の比較を示す。
レベル3での認識が困難な領域が存在する場合に、画像全体のデータ量をレベル2に上げるとピクセル数は4096画素、さらにレベル1にデータ量を上げると16384画素となるため、レベルを1つ下げる毎にデータ量は4倍になってしまい、ソフトウェアにかかる負荷の増加量が大きい。そこで、3−2で示したように多重解像度による部分選択的な変換を行うことで、画像の一部分のデータ量のみをレベル2及びレベル1に上げる事が可能となる。レベル2とレベル3が混在した出力データ数は1168画素となり、画像全体をレベル2とした場合に比べて2928画素のデータ削減が行える。また、レベル1とレベル3が混在した出力データ数は1744画素となり、画像全体をレベル1とした場合と比べると、14640画素のデータ削減が行える事になる。
【0041】
このように領域ごとに適した画像圧縮を行うことで細かくデータ量を上げることが出来るため、ソフトウェアにかかる負荷の増加量を大幅に軽減出来る。また、入力画像ごとに適した圧縮表現が可能であるために、少量のデータでの特徴抽出が行える。そのため、ソフトウェアによる的確な認識作業が容易に行える。
【0042】
4.実験例及び比較
4−1.設計例
以下に設計例を示すが、この回路設計例は一例に過ぎず、本発明はこれに限定されない。
まず、回路の仕様について説明すると、8ビットグレイスケール256×256画素の画像データとコマンド及びパラメータを1ワード32ビットメモリから読み出し、2レベル変換・1レベル変換の順にウェーブレット変換し、コマンド及びパラメータによる出力データの選択を行い1ワード32ビットメモリに格納する回路を設計した。なお、パラメータにより変換レベルを指定できる最小ブロックは32×32画素とした。コマンド及びパラメータはメモリの0〜4アドレスに格納しておく。出力データは最小ブロックごとに格納する。
【0043】
つぎに、部分選択変換装置100とホストコンピュータとのデータ転送について説明する。
図14は、ホストコンピュータとのデータの転送を行うメモリへのアクセスを示す図である。
ホストコンピュータ12とのデータの転送を行うメモリ(メモリ1)14、メモリ(メモリ2)16へのアクセスを図示のようなメモリ構造で設計した。ここでは、メモリ1とメモリ2の2つを用いて、コマンド・元画像データの部分選択変換装置100への転送をメモリ1で、部分選択変換装置100からの変換データの受け渡しをメモリ2でそれぞれ行えるように設計した。また、メモリは全て524,288ワード×32ビットSRAMを使用する事を想定して設計した。
【0044】
図15は、メモリアクセスのタイミングチャートを示す図である。なお、このタイミングチャートは、上述のように2つのメモリにアクセスする場合を示している。
具体的には、read(write)がHIGHの時、read_addr(write_addr)をmem_addr_rd(mem_addr_wr)として出力する。mem_rdがLOWの時、メモリ1のmem_addr_rdの領域からread_dataを読み出す。また、mem_wrがLOWの時、メモリ2のmem_addr_wrの領域へwrite_dataを書き込む。また、メモリを2つに分割する事でデータの読み出しと書き込みが同時に行えるため、readの立ち上がりから次のreadの立ち上がりまでのクロック数を6サイクルとして設計した。なお、処理に要するクロック数は、102442cycles/画面となった。一方、入力データ・出力データを全て1メモリアクセスで行うと、データの読み出しと書き込みが同時に行えないために、処理に要するクロック数は、253943cycles/画面となってしまう。したがって、上述のように2メモリアクセスで設計することで約2.5倍のスピードでデータのアクセスが行える。
【0045】
図16は、論理合成を行った場合の回路規模・動作速度及びHDL記述量を示す図である。
以上のような構造で設計したウェーブレット変換チップ10の論理合成を、ザイリンクス社製の論理合成ソフトFOUNDATION Ver.3.3iを用いて行った。なお、ここでは、FPGA「spartanII2s150−5FG456」を選択して論理合成を行った場合の回路規模・動作速度及びHDL記述量を示した。
【0046】
4−2.ソフトウェアとの比較
256×256画素の画像においてウェーブレット変換を行うソフトウェアを比較のために作成した。ソフトウェアでのウェーブレット変換は標準的な2次元2ウェーブレット変換であり、1次元1ウェーブレット変換でX方向とY方向の変換を行うものである。また、ウェーブレット変換部分は、2重forループ6つ、約70行で構成されている。なお、96×96画素を12×12画素と変換するのに2.0ms、256×256画素を32×32画素では18ms、512×512画素を64×64画素では76msとなる。
【0047】
また、256×256画素においてウェーブレット変換チップと同様に部分選択的な変換を行うために、32×32画素を1ブロックとして、64ブロック読み込むと40msとなる(ここでは、600MHzCPU+128kキャッシュ)。ウェーブレット変換チップ10は、図16で示した通り1.92msで動作するので、変換部分においては20倍のスピードで動作することがわかる。
【0048】
4−3.データ転送における部分選択機能の有効性
図17は、データ転送を含んだ処理時間を示す図である。
ところで、部分選択変換装置100による変換が高速であっても、認識処理プログラムは、ホストコンピュータ12上で実行されるために、部分選択変換装置100とホストコンピュータ12とのデータ転送速度を考慮する必要がある。そこで、データ転送時間を測定するために、市販のFPGAを搭載したPCIボード(FPGA「spartanII2s150−5FG456」)を使用し、33MHzのPCIバスで測定した結果、データ転送速度は112ns(read)/byte、86ns(write)/byteであった。
【0049】
そこで、コマンド及びパラメータを20byte(コマンド:4byte、パラメータ:16byte)とし、256×256画素を3レベル変換した場合のデータ転送時間は86×((256×256)+20)+112×(32×32)=5.75msとなる。これとウェーブレット変換チップの変換時間を足して処理時間は1.92+5.75=7.67msとなる。図17には、図13のように変換した場合のデータ転送時間を含んだ処理速度を示している。例えば、レベル3からレベル1に解像度を上げると1.72msの処理時間が増加してしまうのに対し、レベル1とレベル3が混載したデータにすることにより、0.09msだけの増加量に抑えることができる。
【0050】
このように、部分選択変換装置100自体の処理時間は少ないが、解像度が上がるとデータ量が増えるために、データ転送時間が大きくなる。したがって、部分選択的に解像度を上げることで部分的なデータ量の増加でとどめ、全体のデータ量を大きく減らせる。その結果、データ転送時間の増加を極力抑えることが可能となる。
【0051】
4−4.ウェーブレット変換チップの評価
図18は、2048×2048、256×256画素の画像の領域指定を示す図である。
まず、具体例として、2048×2048画素の入力画像を場合では、4チップを並列動作させる事で全ての領域においてレベル3まで圧縮し、画素数を256×256画素にする。これに要する時間は2×4×4=32msである。さらに、この出力データを次段の1チップにフォワード入力することで32×32画素までデータを圧縮することができる(2ms)。ここまでに要する時間は32+2=34msである。この圧縮率の高い画像において図18(a)のように元画像に対して256×256画素の重要性の高い4領域をソフトウェアが抽出する(Xms)。
【0052】
次に、ここで抽出した4領域を並列動作させている4チップが読み込み、レベル3のデータを出力する(2ms)。このデータの中から図18(b)のようにさらに元画像に対して32×32画素の重要性の高いいくつかの領域をソフトウェアが抽出し、コマンド及びパラメータを入力する(Xms)。
【0053】
最後に、指定された領域をレベル2またはレベル1として出力する(2ms)。そのデータにより認識作業を行う(Xms)。ここまでに要する時間はX+2+X+2+X=(4+3X)msである。全ての処理でかかった時間は、データ転送の時間を除くと34+(4+3X)=(38+3X)msである。入力データの転送時間は86×(2048×2048)=360.71msである。
【0054】
このようなデータ量の多い画像をソフトウェアにより扱う場合には、処理速度は非常に遅くなってしまう。そこで、ここで示したようにチップによる並列処理を行うことで処理速度を飛躍的に向上することができる。
【0055】
5.出力データの応用
つぎに、部分選択変換装置100から出力されたデータの使用方法を示す。一般的に画像の中には木・自動車・人物などのいくつかの対象物が存在している。それらの対象物を解像度の低い画像データの中から抽出する。さらに、部分的に解像度を上げることができるので、それらの対象物の解像度を少し上げて、その中から人物のみを抽出する。人物であることが認識できれば、目・鼻・口などの領域の解像度をさらに上げ、それ以外の領域を高圧縮のままにして再度出力することで個人の特定が可能である。このようにして、画像の解析を順次行っていくことで少ないデータ量で高い精度の認識が行える。また、周辺のデータを高圧縮データとして出力しておくことにより、動画像における周辺の監視が常時行える。
【0056】
また、本実施の形態では、画像認識システムの前処理をHaar離散ウェーブレット変換を使用し、ハードウェアで行うことの設計方法と有効性について述べた。256×256画素の入力画像において、ソフトウェアに比べて約20倍のスピードで動作するという性能比が得られた。今後、ASIC化することによる動作速度の向上、データ転送速度の向上ならびに、このチップに特化した認識アルゴリズムの開発によりさらなる高速化が期待できる。
【0057】
このように、本実施の形態における部分選択変換装置100によれば、解析に不要な部分の領域は高圧縮されて、情報量が減り、詳細な解析が必要な部分は低圧縮されて、信号に含まれる情報が保存される。従って、後段での信号処理解析装置30へ送る情報量が大幅に減るため、信号や信号に含まれる情報の解析が容易である。また、同時に、情報量が減ったために高速な処理が可能になり、実時間画像認識や音声認識が可能となる。さらに、信号変換回路10により実時間での圧縮が可能であり、高速で動く被写体を注視し、その部分だけを切り出して動くものが何かを判定する事が可能になる。
【0058】
また、部分選択変換装置100では、逐次的に部分領域毎に圧縮レベルを変更する事が可能なため、解析結果により、再変換を行い詳細かつ複雑な解析アルゴリズムを作る事が可能である。具体的には、まず、人全体の領域を選別して圧縮レベルを下げて、再入力し、人の顔領域をさらに選別し、顔部分の領域の圧縮レベルをさらに下げて人物を特定するなどのアルゴリズムが可能になる。なお、このアルゴリズムでは何度も圧縮操作を続けるが、これを従来のソフトウェアだけで行うと圧縮処理に多くの時間が必要になり非現実的な計算時間がかかる。しかしながら、ウェーブレット変換チップを備えた信号変換回路10を使用すれば、全体の処理時間の増加は無視できる程度である。このように、部分選択変換装置100では、従来では考えられなかったアルゴリズムが容易に実現できるものとなる。なお、上述の部分選択変換装置100では、ウェーブレット変換を用いて画像処理を行ったが、これに限られず、例えば、短時間フーリエ変換等のその他の変換処理を用いて画像処理を行ってもよい。
【0059】
【発明の効果】
本発明によると、以上説明した通り、情報量の削減と信号処理の高精密度化とを同時に達成することができる。また、本発明によると、画像認識、画像処理等の高度な処理を実時間で高速に処理できる。
【図面の簡単な説明】
【図1】Haar−Wavelet変換による平滑化とエッジ抽出の説明図。
【図2】多重解像度についての説明図。
【図3】シミュレーション結果を示す図(1)。
【図4】シミュレーション結果を示す図(2)。
【図5】本実施の形態に関する部分選択変換装置の構成図。
【図6】部分選択変換装置100の動作の説明図。
【図7】部分選択変換装置100の動作についてのフローチャート。
【図8】信号変換回路10の構成図。
【図9】部分選択的な画像圧縮についての説明図(1)。
【図10】部分選択的な画像圧縮についての説明図(2)。
【図11】部分選択的な画像圧縮についての説明図(3)。
【図12】部分選択的な画像圧縮についての説明図(4)。
【図13】部分選択機能の有効性を示す説明図。
【図14】ホストコンピュータとのデータの転送を行うメモリへのアクセスを示す図。
【図15】メモリアクセスのタイミングチャートを示す図。
【図16】論理合成を行った場合の回路規模・動作速度及びHDL記述量を示す図。
【図17】データ転送を含んだ処理時間を示す図。
【図18】2048×2048、256×256画素の画像の領域指定を示す図。
【符号の説明】
10 信号変換回路
11、13、15、17 ウェーブレット変換部
19 出力選択部
20 入力処理回路
21 コマンド部
23 データセット部
30 信号処理解析装置
40 判定回路
100 部分選択変換装置

Claims (10)

  1. 部分領域毎に指定された圧縮レベルに変換するための変換命令に従い、解析対象領域の入力信号を部分領域毎に圧縮して圧縮信号を生成する信号変換部と、
    重要性の高い又は圧縮率を低くすべき予め定められた領域についての画像と所望の圧縮レベルを表す、異なる圧縮レベルのテンプレートを所定数記憶する記憶部を有し、前記信号変換部から圧縮信号を入力して、前記信号変換部に該変換命令を与えるための信号処理解析部と
    を備え、
    前記信号変換部は、前記信号処理解析部からの変換命令に従い、入力された全領域又は所定領域の信号を最大限又は予め定められた第1の圧縮レベルに圧縮し、解析対象領域の部分領域毎の第1の圧縮信号を前記信号処理解析部に出力し、
    前記信号処理解析部は、前記記憶部からテンプレートを読み出し、
    前記信号処理解析部は、前記信号変換部からの部分領域毎の第1の圧縮信号と、読み出された異なる圧縮レベルのテンプレートとをそれぞれ比較して、テンプレートマッチングにより重要性の高い又は圧縮率を低くすべき再変換部分領域を抽出し、及び、マッチングしたテンプレートの、第1の圧縮レベルよりも圧縮率の低い前記所望の圧縮レベルを得て、パラメータにより再変換部分領域毎に圧縮レベルを指定した再変換命令を出力し、
    前記信号変換部は、前記信号処理解析部からの再変換命令に従い、入力信号を再度メモリから読み出し又は入力装置から入力して、指定された再変換部分領域を、パラメータで定められた、前記所望の圧縮レベルで再変換して、第2の圧縮信号を出力することにより、
    それぞれ第1又は前記所望の圧縮レベルで圧縮された部分領域の第1又は第2の圧縮信号を含む解析対象領域の圧縮信号を出力するようにした部分選択変換装置。
  2. 前記信号処理解析部は、さらに、所望の部分領域が前記所望の圧縮レベルに圧縮されているか否かに応じて、再変換又は圧縮信号の出力を行なうことを特徴する請求項1に記載の部分選択変換装置。
  3. 前記信号処理解析部は、第1の圧縮レベルで圧縮された圧縮信号を記憶部に記憶し、
    前記信号変換部は、再変換命令に従い再変換部分領域のみ再変換し、第2の圧縮信号を出力し、
    前記信号処理解析部は、第1の圧縮信号を記憶部から読み出し、第1の圧縮信号と前記信号変換部からの第2の圧縮信号とを統合して出力することを特徴する請求項1に記載の部分選択変換装置。
  4. 前記信号処理解析部は、
    部分領域内の全画素に対して、スケーリング係数及び/又はウェーブレット係数について係数の絶対値を求めて和をとり、その和の大きさに基づいて、部分領域のテンプレートの候補についての順序付け及び一致計算を行ってマッチングするテンプレートを求めることを特徴とする請求項1乃至3のいずれかに記載の部分選択変換装置。
  5. 前記信号処理解析部は、全部分領域に対して再度圧縮レベルを指定し、
    前記信号変換部は、再変換命令に従い、前記解析対象領域全体を圧縮レベルで変換して、圧縮信号を出力することを特徴する請求項1乃至のいずれかに記載の部分選択変換装置。
  6. 前記信号変換は、短時間フーリエ変換又はウェーブレット変換による信号変換を行い圧縮信号を得ることを特徴とする請求項1乃至のいずれかに記載の部分選択変換装置。
  7. 前記信号変換は、
    漸次的に複数の圧縮レベルに変換するための複数の変換部と、
    前記信号処理解析部からの命令に従い、いずれかの前記変換部からの圧縮信号を選択して出力する出力選択部と、
    前記信号処理解析部からの命令に従い、入力信号又は出力選択部から戻された圧縮信号をいずれかの前記変換部に振り分ける入力処理回路と
    を備えた請求項1乃至のいずれかに記載の部分選択変換装置。
  8. 前記信号変換は、前記信号解析部の入力部と接続され、パイプライン処理を行うことを特徴とする請求項1乃至のいずれかに記載の部分選択変換装置。
  9. 部分領域毎に指定された圧縮レベルに変換するための変換命令に従い、解析対象領域の入力信号を部分領域毎に圧縮して圧縮信号を生成する信号変換部を用いた部分選択変換方法であって、
    前記信号変換部に変換命令を与えるステップと、
    前記信号変換部により、該変換命令に従い、入力された全領域又は所定領域の信号を最大限又は予め定められた第1の圧縮レベルに圧縮された、解析対象領域の部分領域毎の第1の圧縮信号を入力するステップと、
    重要性の高い又は圧縮率を低くすべき予め定められた領域についての画像と所望の圧縮レベルを表す、異なる圧縮レベルのテンプレートを所定数記憶する記憶部から、テンプレートを読み出すステップと、
    前記信号変換部からの部分領域毎の第1の圧縮信号と、読み出された異なる圧縮レベルのテンプレートとをそれぞれ比較して、テンプレートマッチングにより重要性の高い又は圧縮率を低くすべき再変換部分領域を抽出し、及び、マッチングしたテンプレートの、第1の圧縮レベルよりも圧縮率の低い前記所望の圧縮レベルを得て、パラメータにより再変換部分領域毎に圧縮レベルを指定した再変換命令を出力するステップと、
    前記信号変換部により、該再変換命令に従い、入力信号を再度メモリから読み出し又は入力装置から入力して、指定された再変換部分領域が、パラメータで定められた前記所望の圧縮レベルで再変換された第2の圧縮信号を入力するステップと、
    第1又は前記所望の圧縮レベルでそれぞれ圧縮された部分領域の第1又は第2の圧縮信号を含む解析対象領域の圧縮信号を出力するステップと
    を含む部分選択変換方法。
  10. 部分領域毎に指定された圧縮レベルに変換するための変換命令に従い、解析対象領域の入力信号を部分領域毎に圧縮して圧縮信号を生成する信号変換部に変換命令を与えるステップと、
    前記信号変換部により、該変換命令に従い、入力された全領域又は所定領域の信号を最大限又は予め定められた第1の圧縮レベルに圧縮された、解析対象領域の部分領域毎の第1の圧縮信号を入力するステップと、
    重要性の高い又は圧縮率を低くすべき予め定められた領域についての画像と所望の圧縮レベルを表す、異なる圧縮レベルのテンプレートを所定数記憶する記憶部からテンプレートを読み出すステップと、
    前記信号変換部からの部分領域毎の第1の圧縮信号と、読み出された異なる圧縮レベルのテンプレートとをそれぞれ比較して、テンプレートマッチングにより重要性の高い又は圧縮率を低くすべき再変換部分領域を抽出し、及び、マッチングしたテンプレートの、第1の圧縮レベルよりも圧縮率の低い前記所望の圧縮レベルを得て、パラメータにより再変換部分領域毎に圧縮レベルを指定した再変換命令を出力するステップと、
    前記信号変換部により、該再変換命令に従い、入力信号を再度メモリから読み出し又は入力装置から入力して、指定された再変換部分領域を、パラメータで定められた前記所望の圧縮レベルで再変換された第2の圧縮信号を入力するステップと、
    第1又は前記所望の圧縮レベルでそれぞれ圧縮された部分領域の第1又は第2の圧縮信号を含む解析対象領域の圧縮信号を出力するステップと
    コンピュータに実行させるための部分選択変換プログラム。
JP2001317371A 2001-10-15 2001-10-15 部分選択変換装置、部分選択変換方法及び部分選択変換プログラム Expired - Fee Related JP3709158B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2001317371A JP3709158B2 (ja) 2001-10-15 2001-10-15 部分選択変換装置、部分選択変換方法及び部分選択変換プログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2001317371A JP3709158B2 (ja) 2001-10-15 2001-10-15 部分選択変換装置、部分選択変換方法及び部分選択変換プログラム

Publications (2)

Publication Number Publication Date
JP2003124815A JP2003124815A (ja) 2003-04-25
JP3709158B2 true JP3709158B2 (ja) 2005-10-19

Family

ID=19135253

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2001317371A Expired - Fee Related JP3709158B2 (ja) 2001-10-15 2001-10-15 部分選択変換装置、部分選択変換方法及び部分選択変換プログラム

Country Status (1)

Country Link
JP (1) JP3709158B2 (ja)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4652698B2 (ja) * 2004-02-23 2011-03-16 独立行政法人科学技術振興機構 画像認識装置、画像認識方法及びプログラム
JP6192804B2 (ja) * 2014-03-05 2017-09-06 三菱電機株式会社 データ圧縮装置およびデータ圧縮方法
JP7409400B2 (ja) * 2020-01-31 2024-01-09 富士通株式会社 データ処理装置及びデータ処理プログラム
JP7533622B2 (ja) * 2020-12-15 2024-08-14 富士通株式会社 解析装置、解析方法及び解析プログラム

Also Published As

Publication number Publication date
JP2003124815A (ja) 2003-04-25

Similar Documents

Publication Publication Date Title
CN107292256B (zh) 基于辅任务的深度卷积小波神经网络表情识别方法
CN108710830A (zh) 一种结合密集连接注意力金字塔残差网络和等距限制的人体3d姿势估计方法
WO2020038205A1 (zh) 目标检测方法、装置、计算机可读存储介质及计算机设备
US7233700B2 (en) System and method for signal matching and characterization
KR100804282B1 (ko) 2차원 영상으로부터 3차원 표현을 생성시키기 위한 장치와 방법
JP5388835B2 (ja) 情報処理装置及び情報処理方法
JP5937661B2 (ja) 情報予測システム、情報予測方法及び情報予測プログラム
JPH10214267A (ja) 手書き文字記号処理装置および手書き文字記号処理装置の制御プログラムを記録した媒体
CN110414516B (zh) 一种基于深度学习的单个汉字识别方法
JP3709158B2 (ja) 部分選択変換装置、部分選択変換方法及び部分選択変換プログラム
CN111881789A (zh) 肤色识别方法、装置、计算设备及计算机存储介质
JPH0676117A (ja) 情報処理方法及び装置
Tsiktsiris et al. Accelerated seven segment optical character recognition algorithm
CN111081372B (zh) 疾病诊断装置、终端设备及计算机可读存储介质
JP4652698B2 (ja) 画像認識装置、画像認識方法及びプログラム
CN108876711B (zh) 一种基于图像特征点的草图生成方法、服务器及系统
CN114792370A (zh) 一种全肺图像分割方法、装置、电子设备及存储介质
CN114708145A (zh) Goci水色图像洋流流场的确定方法和装置
JP2000215315A (ja) 図形分類方法、図形検索方法、図形分類検索システム及び記録媒体
JP2016177829A (ja) 情報予測システム、情報予測方法及び情報予測プログラム
CN110991229A (zh) 基于dsp芯片与量化模型的三维物体识别方法
CN110334667B (zh) 基于ircnn和mtcnn的具有尺度旋转不变性的静脉识别方法及系统
CN117911240A (zh) 一种面部遮挡图像的生成方法、装置、设备及介质
JPS6128180A (ja) オンライン手書き図形認識装置
JPH01116892A (ja) 非線形正規化方法

Legal Events

Date Code Title Description
A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20050502

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20050517

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20050705

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20050726

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20050805

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090812

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100812

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110812

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110812

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120812

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130812

Year of fee payment: 8

LAPS Cancellation because of no payment of annual fees