JP2004334338A - 情報処理装置及び情報処理方法ならびに記憶媒体、プログラム - Google Patents
情報処理装置及び情報処理方法ならびに記憶媒体、プログラム Download PDFInfo
- Publication number
- JP2004334338A JP2004334338A JP2003125817A JP2003125817A JP2004334338A JP 2004334338 A JP2004334338 A JP 2004334338A JP 2003125817 A JP2003125817 A JP 2003125817A JP 2003125817 A JP2003125817 A JP 2003125817A JP 2004334338 A JP2004334338 A JP 2004334338A
- Authority
- JP
- Japan
- Prior art keywords
- image data
- character area
- input image
- character
- information processing
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/40—Document-oriented image-based pattern recognition
- G06V30/41—Analysis of document content
- G06V30/413—Classification of content, e.g. text, photographs or tables
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/50—Information retrieval; Database structures therefor; File system structures therefor of still image data
- G06F16/58—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
- G06F16/583—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y10—TECHNICAL SUBJECTS COVERED BY FORMER USPC
- Y10S—TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y10S707/00—Data processing: database and file management or data structures
- Y10S707/99931—Database or file accessing
- Y10S707/99933—Query processing, i.e. searching
- Y10S707/99936—Pattern matching access
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Library & Information Science (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Physics & Mathematics (AREA)
- Artificial Intelligence (AREA)
- General Engineering & Computer Science (AREA)
- Databases & Information Systems (AREA)
- Data Mining & Analysis (AREA)
- Multimedia (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Processing Or Creating Images (AREA)
- Storing Facsimile Image Data (AREA)
- Image Analysis (AREA)
- Character Input (AREA)
Abstract
【解決手段】登録画像データの中から、入力画像データとの類似度が高い画像データを検索する情報処理方法であって、前記入力画像データの文字領域と非文字領域とを識別する領域識別工程(ステップS402)と、前記識別された文字領域内の文字を認識し、該認識された文字の向きに基づいて前記入力画像データの向きを識別する方向識別工程(ステップS404)と、前記識別された入力画像データを前記識別された向きに基づいて所定の向きに回転させる回転工程(ステップS406)と、前記回転後の入力画像データとの類似度が高い画像データを、前記登録された画像データの中から検索する検索工程(ステップS409)とを備える。
【選択図】 図4
Description
【発明の属する技術分野】
本発明は、スキャナなどの入力装置で読み取られた画像と類似する画像データを、データベースより検索する画像検索技術に関するものである。
【0002】
【従来の技術】
近年、オフィスでのペーパーレス化は急速に進み、PC上で作成された書類はもちろん、旧来よりバインダー等で蓄積されていた過去の紙文書もスキャナにより画像データなどの電子文書に変換することで、データベース上に蓄積するようになってきている。
【0003】
一方で、会議での配付資料等には依然として紙文書が好まれ、データベースに蓄積された電子文書が、紙文書へとプリントアウトされてユーザの手に渡る機会も多い。
【0004】
ここで、紙文書を受けとったユーザが、それを電子的に保管・送信したり、あるいは内容を抽出して再利用したいと考えた場合、その紙文書を再電子化したデータを用いる代りに、データベースよりオリジナルのデータを取得して利用することができれば、紙文書を経たことによる情報損失がなくなる分、利便性が向上する。
【0005】
このような要求に答えるため、下記特許文献1のように、紙文書をスキャナで読み取り、その内容と類似するデータをデータベースより検索することが可能なシステムが考案されている。
【0006】
【特許文献1】
特許第3017851号公報
【0007】
【発明が解決しようとする課題】
本出願人は、さらに検索精度を向上させるべく、読み取った文書(入力画像)を、領域識別技術(領域識別技術は公知のものを用いることが可能。例えば
米国特許第5680478号明細書に記載の技術など)を用いて文字情報と非文字情報(写真や図画など)にわけ、それぞれの特性に応じた類似度算出処理を用いることを考えている。
【0008】
具体的には領域識別処理により、読み取った文書のページ画像と、登録文書のページ画像とからそれぞれ文字領域および写真領域を抽出し、文字領域については文字認識処理を行った文字列の特徴により求めた類似度を、写真領域については色、エッジ等の画像特徴量を用いた類似度をそれぞれ得るものである。
【0009】
特に、文書ページ中に含まれる写真や図画などは、そのページの特徴を大きく表わしているため、このように写真や図画の類似度を高精度に求めることは、検索システムの性能向上に大きく貢献するものと期待される。
【0010】
一方、このような検索システムにおいては、画像特徴量を用いて入力画像と登録画像との類似度を求めるにあたり、両方の画像が同じ向きであることが不可欠であり、向きが異なると高い検索精度が望めない。
【0011】
しかしながら、スキャナなどを用いて紙文書を読み取った場合、取得された入力画像の向きは、原稿台への紙の置き方によって4方向に変化する可能性がある。かかる問題を回避すべく、ユーザに正しい紙の置き方を強制することは、システムの利便性を損わせるおそれがある。また紙サイズによっては、原稿台や自動原稿送り装置の構造的都合により、所望の方向でスキャンすることが不可能な場合もある。
【0012】
これに対して、画像特徴量の類似度を算出する際に、画像の向きの違いを考慮し、入力側の画像に対し0度、90度、180度、270度の回転を加えた4種類の画像を用意したり、もしくは特徴量の係数変換を行って4種類の特徴量を作成した上で類似度を求め、最も類似度の高いものを採用したりすることで画像の向きの問題を回避する方法もあるが、いずれの方法を用いても類似度を求める処理は常に4回行わなければならず、常に処理時間が4倍かかることとなり、処理時間が増加してしまうという問題がある。
【0013】
本発明は、上記課題に鑑みてなされたものであり、入力画像と登録画像との類似度を求め、入力画像に類似する登録画像を検索するにあたり、入力画像の向きに関わらず、短時間で精度よく登録画像を検索することが可能な技術を提供することを目的とする。
【0014】
【課題を解決するための手段】
上記の目的を達成するために本発明に係る情報処理装置は以下のような構成を備える。即ち、
登録された画像データの中から、入力される入力画像データとの類似度が高い画像データを検索する情報処理装置であって、
前記入力画像データの文字領域と非文字領域とを識別する領域識別手段と、
前記識別された文字領域内の文字を認識し、該認識された文字の向きに基づいて前記入力画像データの向きを識別する方向識別手段と、
前記識別された入力画像データを前記識別された向きに基づいて所定の向きに回転させる回転手段と、
前記回転後の入力画像データとの類似度が高い画像データを、前記登録された画像データの中から検索する検索手段とを備える。
【0015】
【発明の実施の形態】
本発明の実施形態について説明する。図1は本発明にかかる情報処理方法を実現する画像処理システムの構成を示す図である。同図に示すように、本実施形態では、オフィス10とオフィス20とがインターネット104で接続された環境において本発明にかかる情報処理方法を実現する画像処理システムが構築されているものとする。
【0016】
オフィス10内に構築されたLAN11には、MFP100、MFP100を制御するマネージメントPC101、文書管理サーバ106及びそのデータベース105、プロキシサーバ12がそれぞれ接続されている。同様にオフィス20内に構築されたLAN21には、ユーザPC107がおよびプロキスサーバ22が接続されている。また、オフィス10内のLAN11とオフィス20内のLAN21とはプロキシサーバ12、22を介してインターネット104に接続されている。
【0017】
かかる構成を備える画像処理システムにおいて、検索対象となる登録画像の格納場所は特に限定されないものとする。MFP100内の記憶装置(後述)に格納されていても、マネージメントPC101内のハードディスク(不図示)に格納されていても、また、文書管理サーバ106のデータベース(105)に格納されていてもよい。ただし、当該格納された登録画像を検索できるように格納場所はLAN11または22を介して外部からアクセス可能な状態になっているものとする。
【0018】
また、本発明にかかる情報処理方法(検索機能)は、図1に示す画像処理システム内の任意の装置上で実現可能であるものとする。例えば、MFP100内のデータ処理装置(後述)が当該検索機能を備えていても、マネージメントPC101が検索機能を備えていても、また、文書管理サーバ106が検索機能を備えていてもよい。
【0019】
MFP100は、紙文書の画像読み取り処理と読み取った画像信号に対する画像処理の一部を担当し、画像信号はLAN13を用いてマネージメントPC101に入力される。マネージメントPCは通常のPCであり、内部に画像記憶手段、画像処理手段、表示手段、入力手段を有するが、その一部がMFP100に一体化して構成されている。
【0020】
図2はMFP100の構成図である。図2においてオートドキュメントフィーダー(以降、ADFと記す)を含む画像読み取り部210により束状の或いは1枚の紙文書(原稿)を図示しない光源で照射し、原稿反射像をレンズで固体撮像素子上に結像し、固体撮像素子からラスター状の画像信号を600DPIの密度のイメージ情報として得る。
【0021】
通常の複写処理の場合は、この画像信号をデータ処理装置215で記録信号に変換し、複数毎の複写の場合には、記憶装置211に一ページ分の記録データを一旦記憶保持した後、記録装置212により順次出力して紙上に画像を形成する。さらに送信処理を行う場合には、前記イメージ情報をTIFFやJPEGなどの圧縮画像ファイル形式、あるいはPDFなどのネットワークファイル形式へと変換し、ネットワークIF214から出力する。出力されたファイルは図1中のLAN11を通じて文書管理サーバ106へ送信されたり、更にインターネット104経由で別のユーザPC107に転送されたりする。また、プリンタ処理を行う場合には、ユーザPC107から送信されたプリントデータ等とネットワークIF214経由で受信し、データ処理装置215で記録可能なラスターデータに変換した後、記録装置212により紙上に記録画像として形成する。MFP100への操作者の指示はMFP100に装備されたキー操作部とマネージメントPCに入力されるキーボード及びマウスを備える入力装置213を介して行われ、これら一連の動作はデータ処理装置215内の図示しない制御部で制御される。一方、操作入力の状態表示及び処理中の画像の表示が表示装置216において行われる。なお、記憶装置211はマネージメントPC101からも制御され、これらMFP100とマネージメントPC101とのデータの授受及び制御はネットワークIF217および直結したLAN13を用いて行われる。
【0022】
次に、図1に示す画像処理システムにおける、本発明にかかる情報処理方法による処理を含む全体処理について説明する。なお、説明を簡単にするために、以降では、登録画像を備えるデータベースはマネージメントPC内のハードディスク(不図示)において構築されているものとし、また、本発明にかかる情報処理方法はマネージメントPC101およびMFP100が一体となって動作することで実現されるものとする。
【0023】
本実施形態で行われる処理は登録処理と検索処理の2つに分けられる。登録処理では、登録画像に対して検索に必要となる特徴量の抽出処理と、それらとデータとを関係づけてデータベース105に保存する処理とが行われる。以下、図3を用いて順に説明する。
【0024】
まず、登録対象が紙文書であるか、PCソフトなどで作成された電子文書であるかによって処理を分岐する(ステップS301)。
【0025】
登録対象が紙文書の場合、ステップS302にすすみ、MFP100の画像読み取り部を用いて、紙文書をページ画像に変換する。
【0026】
次に、ステップS303では、ページ画像に対して領域分割処理を行い、文字領域と、写真・図画を備える非文字領域とを抽出する。具体的には各領域の外接矩形座標を得る。ここで、領域分割処理とは、文書のページ画像を文書的な特性を持つオブジェクトに分割する処理であり、図5にその様子を示す(同図(A)に示す画像のうち、領域分割処理により文字領域と識別された領域を同図(B)の「TEXT」に示す。また、非文字領域と識別された領域を同図(B)の「TABLE」、「PHOTO」、「PICTURE」に示す)。なお、領域分割処理に関する処理手法は米国特許第5680478号明細書を始めとする各種公知文献に開示されているため、ここでは説明は省略する。
【0027】
次に、ステップS304においてページ画像より文字領域が抽出されたと判断された場合、ステップS305に進む。文字領域が抽出されなかった場合は、そのままステップS308に進む。ステップS305では、ページ画像の本来の天地方向を識別する処理を行う。
【0028】
ステップS305における、天地方向を識別する処理について簡単に説明する。まず、文字領域内から数文字分の文字を選んで切り出すことで文字画像を得て、さらにそれぞれの文字画像を0、90、180、270度方向に回転した画像を用意して、それぞれの方向で文字認識処理を行う。なお、この文字認識処理は公知の処理であり、一例としては文字画像からエッジ成分などを取り出して特徴ベクトル化し、あらかじめ字種分登録された辞書内の特徴ベクトルとの類似度を求め、最も類似度の高い字を認識結果とする処理が挙げられる。更にこの類似度を、4方向それぞれ字数分累積させたものを方向毎のスコアとし、最終的に最もスコアの高い方向を本来の方向と判定する。
【0029】
ステップS306では、ステップS305求められた方向が0度以外の場合、ステップS307へ進んで、ページ画像に対し正置方向へと直す回転処理を加える。同時にステップS303で抽出された領域の矩形座標にも回転変換を加える。なお、領域分割をより高精度とするために、領域の矩形座標を回転する代りに、その領域を破棄し、回転されたページ画像に対して再び領域分割を行って新たな領域を得るようにしてもよい。
【0030】
ステップS308では、ページ画像中の非文字領域をそれぞれひとつの非文字画像情報とし、後で検索に用いるための特徴量抽出を行う。画像に対する特徴量抽出は公知の処理方法を用いるとして、ここでは詳しく説明しないが、一例としては、画像をメッシュ分割し、各領域の平均色を要素としてベクトル化する方式が挙げられる。
【0031】
ステップS309では、ページ画像中のすべての文字領域内を文字認識して文字コード列とし、これを登録画像の文字特徴量とする。文字認識については前述同様の公知技術を用いる。
【0032】
一方、ステップS301にて入力が紙文書以外であると判断された場合、ステップS311にて、電子文書から非文字部分の画像オブジェクトやテキスト部分の文字列オブジェクトが直接抽出可能か否かを判定する。抽出可能な例としては、HTMLで記述されたデータから、内部テキストを解釈して画像やテキストを抽出する場合が挙げられる。一方、ワープロソフトなどのアプリケーションデータからオブジェクト抽出が可能かどうかは、個々のアプリケーションに大きく依存する問題なので、ここで具体化はできないが、オブジェクト抽出用のプログラムなどが存在する場合には、抽出可能とみなされる。
【0033】
オブジェクトが抽出可能であると判定された場合、ステップS312に進み、オブジェクトの抽出を行う。その後ステップS308に進み文字オブジェクトから文字特徴量を抽出し、ステップS309にて、画像オブジェクトを非文字領域として画像特徴量を抽出する。
【0034】
オブジェクトが抽出不可能であると判定された場合は、ステップS313に進み、電子文書からページ画像への変換を行う。この処理は例えば、MFP100のプリント機能として、データ処理装置215内で行われる処理の一部、すなわち電子文書から紙面記録可能なラスターデータへ変換する処理を利用することで行うことができる。もしくは、電子文書が特定アプリケーションにより生成される場合であって、アプリケーション自身あるいは付加ソフトウェアが電子文書のラスターデータ化機能を持つ場合には、それらを利用してもよい。以降、この電子文書から変換されたページ画像に対しては、スキャン画像と同様にステップS303〜ステップS310の処理が行われる。
【0035】
最後に、ステップS310では登録データに関する情報として、登録画像、文字特徴量、画像特徴量の3つを組としたデータをデータベース105に登録する。ここで元データとは、紙文書をスキャンした場合はそのページ画像、あるいは登録対象が元々電子文書である場合は当該データそのものを指す。
【0036】
検索処理では、検索キーとしての紙文書をスキャンしたページ画像から、検索キーとしての特徴量を抽出し、データベース105内の特徴群と比較して最も類似度の高いデータを結果として出力したり、ユーザの所望処理、例えば送信、印刷、保存などの処理の対象とする。以下、図4を用いて順に説明する。
【0037】
まず、ステップS401では、MFP100の画像読み取り部を用いて、検索キーとなる紙文書をページ画像に変換する。
【0038】
次に、ステップS402では、ページ画像に対して領域分割処理を行い、文字領域と写真・図画を備える非文字領域とを抽出する。この処理の内容は図3中のステップS303と同等である。
【0039】
ステップS403ではページ画像より得られた文字・非文字領域の数により処理を分岐する。
【0040】
文字領域と非文字領域とが両方見つかった場合には、ステップS404に進む。また、非文字領域が見つかったが、文字領域が見つからなかった場合には、ステップS410に進む。さらに、文字領域だけ見つかって、非文字領域が見つからなかった場合、ステップS412に進む。なお、どちらの領域も見つからなかった場合には、検索不能として処理を終了する。
【0041】
文字領域と非文字領域が両方見つかった場合において、ステップS404では見つかった文字領域を用いて、ページ画像の本来の天地方向を識別する。
【0042】
ステップS405にて、天地方向が0度以外であると識別された場合には、ステップS406へ進み、ページ画像と矩形座標とを正置方向へ直す回転処理が加えられる。ページ画像全体ではなく、各領域毎に矩形座標内部の画像のみを回転してもよい。
【0043】
ステップS407では、非文字領域画像の特徴量を求め、検索キーデータの画像特徴量とする。ステップS408では、文字領域内を文字認識して得た文字列を、検索キーデータの文字特徴量とする。
【0044】
ステップS409では、検索キーデータの各特徴量と、データベース105に登録された複数のデータの特徴量との間で一つ一つマッチングをとり、類似度の高いデータを検索候補とする。
【0045】
個々の特徴量に関する類似度の算出には、種々の公知方法を用いればよい。一例として、画像特徴量の場合は、特徴ベクトル間での距離の近さ、およびページ内の画像個数の相関を数値化した類似度を用いる方法などがある。文字特徴量の場合は、検索キーデータ内の文字列全体からその品詞解析や頻度によりキーワードとなる単語をいくつか選び、登録データ側でそれらが出現する数をもって類似度とする方法などがある。
【0046】
さらに、二つの特徴量から総合的な類似度を定めるためには、画像特徴量を用いた類似度をN、文字の特徴量を用いた類似度をMとして、適当な係数(a,b)を定めてa×N+b×Mを算出すればよい。係数(a,b)の値については、固定の値を用いたり、原稿内の文字と画像の配分によって変化させたり、あるいはユーザが配分を任意に決定できるようにしてもよい。
【0047】
分岐ステップS403において、非文字領域だけが見つかった場合にはステップS410に進み、非文字領域の画像特徴量を、0、90、180、270度の4方向に回転した状態の画像からそれぞれ抽出する。あるいは、画像からの特徴量抽出は1度だけで、その特徴量に適当な変換を施して、90、180、270度回転の画像から得るのと同等の特徴量を計算で求めてもよい。
【0048】
ステップS411では、検索キーデータの画像特徴量と、データベース105に登録された複数のデータの画像特徴量との間で一つ一つマッチングをとる。この際、前記4方向の特徴量との間で4つの類似度を求め、もっとも類似度の高い値を採用する。画像特徴量の類似度算出方法については、ステップS409と同様である。そしてマッチングを行ったデータのうち最も類似度の高いデータを検索候補とする。
【0049】
分岐ステップS403において、文字領域だけが見つかった場合にはステップS412に進み、ページ画像の本来の天地方向を識別する。ステップS413にて、前記天地方向が0度以外であると識別された場合ステップS414へ進み、ページ画像と矩形座標とを正置方向へ直す回転処理が加えられる。ページ画像全体ではなく、文字領域毎に矩形座標内部の画像のみを回転してもよい。
【0050】
ステップS415では、検索キーデータの文字特徴量と、データベース105に登録された複数のデータの文字特徴量との間で一つ一つマッチングをとり、類似度の高いデータを検索候補として出力する。文字特徴量の類似度算出方法については、ステップS409と同様である。
【0051】
ステップS417では、検索結果を表示する。類似度の最も高いデータのみを表示してもよいし、所定の閾値以上の類似度を持つデータを候補として表示し、最終的な選択をユーザに委ねてもよい。
【0052】
ステップS418では、検索結果、すなわち元データに対して、送信、印刷などのユーザ所望の動作を行う。
【0053】
以上の説明から明らかなように、本実施形態によれば、紙文書や電子文書を登録したデータベース105の中から、印刷した文書をスキャンして得られた入力画像に類似するデータを検索するにあたり、ユーザは紙文書をスキャンするときの原稿の置き方に配慮せずとも、自動的に方向を考慮した類似度算出が行われ、少なくとも文字を含む文書であれば、画像特徴量の類似度算出に関する処理時間の増加を防ぐことが可能となり、検索システムとしての利便性が向上する。
【0054】
【他の実施形態】
なお、本発明は、複数の機器(例えばホストコンピュータ、インタフェイス機器、リーダ、プリンタなど)から構成されるシステムに適用しても、一つの機器からなる装置(例えば、複写機、ファクシミリ装置など)に適用してもよい。
【0055】
また、本発明の目的は、前述した実施形態の機能を実現するソフトウェアのプログラムコードを記録した記憶媒体を、システムあるいは装置に供給し、そのシステムあるいは装置のコンピュータ(またはCPUやMPU)が記憶媒体に格納されたプログラムコードを読出し実行することによっても、達成されることは言うまでもない。
【0056】
この場合、記憶媒体から読出されたプログラムコード自体が前述した実施形態の機能を実現することになり、そのプログラムコードを記憶した記憶媒体は本発明を構成することになる。
【0057】
プログラムコードを供給するための記憶媒体としては、例えば、フロッピ(登録商標)ディスク、ハードディスク、光ディスク、光磁気ディスク、CD−ROM、CD−R、磁気テープ、不揮発性のメモリカード、ROMなどを用いることができる。
【0058】
また、コンピュータが読出したプログラムコードを実行することにより、前述した実施形態の機能が実現されるだけでなく、そのプログラムコードの指示に基づき、コンピュータ上で稼働しているOS(オペレーティングシステム)などが実際の処理の一部または全部を行い、その処理によって前述した実施形態の機能が実現される場合も含まれることは言うまでもない。
【0059】
さらに、記憶媒体から読出されたプログラムコードが、コンピュータに挿入された機能拡張ボードやコンピュータに接続された機能拡張ユニットに備わるメモリに書込まれた後、そのプログラムコードの指示に基づき、その機能拡張ボードや機能拡張ユニットに備わるCPUなどが実際の処理の一部または全部を行い、その処理によって前述した実施形態の機能が実現される場合も含まれることは言うまでもない。
【0060】
【発明の効果】
以上説明したように本発明によれば、入力画像と登録画像との類似度を求め、入力画像に類似する登録画像を検索するにあたり、入力画像の向きに関わらず、短時間で精度よく登録画像を検索することが可能となる。
【図面の簡単な説明】
【図1】本発明にかかる情報処理方法を実現する画像処理システムの構成を示す図である。
【図2】MFPの詳細を示す図である。
【図3】本発明にかかる情報処理方法を実現する画像処理システムにおける処理(登録処理)の流れを示すフローチャートである。
【図4】本発明にかかる情報処理方法を実現する画像処理システムの構成における処理(検索処理)の流れを示すフローチャートである。
【図5】ページ画像に対する領域分割処理の一例を示す図である。
Claims (14)
- 登録された画像データの中から、入力される入力画像データとの類似度が高い画像データを検索する情報処理装置であって、
前記入力画像データの文字領域と非文字領域とを識別する領域識別手段と、
前記識別された文字領域内の文字を認識し、該認識された文字の向きに基づいて前記入力画像データの向きを識別する方向識別手段と、
前記識別された入力画像データを前記識別された向きに基づいて所定の向きに回転させる回転手段と、
前記回転後の入力画像データとの類似度が高い画像データを、前記登録された画像データの中から検索する検索手段と
を備えることを特徴とする情報処理装置。 - 前記領域識別手段により、前記入力画像データが文字領域と非文字領域との両方を含むと識別された場合には、前記検索手段は、該文字領域と該非文字領域との両方の特徴量に基づいて、類似度を算出することを特徴とする請求項1に記載の情報処理装置。
- 前記領域識別手段により、前記入力画像データが非文字領域を含まないと識別された場合には、前記検索手段は、文字領域の特徴量に基づいて、類似度を算出することを特徴とする請求項1に記載の情報処理装置。
- 前記領域識別手段により、前記入力画像データが文字領域を含まないと識別された場合には、前記検索手段は、非文字領域の特徴量を複数の方向について求め、該複数の方向の特徴量に基づいて、類似度を算出することを特徴とする請求項1に記載の情報処理装置。
- 前記複数の方向とは、前記入力画像データの向きを0度とした場合の、0度、90度、180度、270度の回転方向を指すことを特徴とする請求項4に記載の情報処理装置。
- 前記登録された画像データは、前記領域識別手段により文字領域と非文字領域とが識別され、前記方向識別手段により、該文字領域内の文字に基づいて向きが識別され、前記回転手段により、所定の向きに回転された状態で登録されていることを特徴とする請求項1に記載の情報処理装置。
- 登録された画像データの中から、入力される入力画像データとの類似度が高い画像データを検索する情報処理方法であって、
前記入力画像データの文字領域と非文字領域とを識別する領域識別工程と、
前記識別された文字領域内の文字を認識し、該認識された文字の向きに基づいて前記入力画像データの向きを識別する方向識別工程と、
前記識別された入力画像データを前記識別された向きに基づいて所定の向きに回転させる回転工程と、
前記回転後の入力画像データとの類似度が高い画像データを、前記登録された画像データの中から検索する検索工程と
を備えることを特徴とする情報処理方法。 - 前記領域識別工程により、前記入力画像データが文字領域と非文字領域との両方を含むと識別された場合には、前記検索工程は、該文字領域と該非文字領域との両方の特徴量に基づいて、類似度を算出することを特徴とする請求項7に記載の情報処理方法。
- 前記領域識別工程により、前記入力画像データが非文字領域を含まないと識別された場合には、前記検索工程は、文字領域の特徴量に基づいて、類似度を算出することを特徴とする請求項7に記載の情報処理方法。
- 前記領域識別工程により、前記入力画像データが文字領域を含まないと識別された場合には、前記検索工程は、非文字領域の特徴量を複数の方向について求め、該複数の方向の特徴量に基づいて、類似度を算出することを特徴とする請求項7に記載の情報処理方法。
- 前記複数の方向とは、前記入力画像データの向きを0度とした場合の、0度、90度、180度、270度の回転方向を指すことを特徴とする請求項10に記載の情報処理方法。
- 前記登録された画像データは、前記領域識別工程により文字領域と非文字領域とが識別され、前記方向識別工程により、該文字領域内の文字に基づいて向きが識別され、前記回転工程により、所定の向きに回転された状態で登録されていることを特徴とする請求項7に記載の情報処理方法。
- 請求項7乃至12のいずれか1つに記載の情報処理方法をコンピュータによって実現させるための制御プログラムを格納した記憶媒体。
- 請求項7乃至12のいずれか1つに記載の情報処理方法をコンピュータによって実現させるための制御プログラム。
Priority Applications (5)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2003125817A JP4350414B2 (ja) | 2003-04-30 | 2003-04-30 | 情報処理装置及び情報処理方法ならびに記憶媒体、プログラム |
EP04252206A EP1473641B1 (en) | 2003-04-30 | 2004-04-15 | Information processing apparatus, method, storage medium and program |
DE602004025646T DE602004025646D1 (de) | 2003-04-30 | 2004-04-15 | Datenverarbeitungsgerät, -verfahren, -speichermedium und -programm |
US10/828,165 US7382939B2 (en) | 2003-04-30 | 2004-04-21 | Information processing apparatus, method, storage medium and program |
CNB2004100386906A CN1332341C (zh) | 2003-04-30 | 2004-04-27 | 信息处理装置和信息处理方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2003125817A JP4350414B2 (ja) | 2003-04-30 | 2003-04-30 | 情報処理装置及び情報処理方法ならびに記憶媒体、プログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2004334338A true JP2004334338A (ja) | 2004-11-25 |
JP4350414B2 JP4350414B2 (ja) | 2009-10-21 |
Family
ID=32985591
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2003125817A Expired - Fee Related JP4350414B2 (ja) | 2003-04-30 | 2003-04-30 | 情報処理装置及び情報処理方法ならびに記憶媒体、プログラム |
Country Status (5)
Country | Link |
---|---|
US (1) | US7382939B2 (ja) |
EP (1) | EP1473641B1 (ja) |
JP (1) | JP4350414B2 (ja) |
CN (1) | CN1332341C (ja) |
DE (1) | DE602004025646D1 (ja) |
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2006331111A (ja) * | 2005-05-26 | 2006-12-07 | Ricoh Co Ltd | 画像処理装置、プログラム及び記録媒体 |
JP2007026386A (ja) * | 2005-07-21 | 2007-02-01 | Fuji Xerox Co Ltd | 画像検索システム及び方法 |
JP2009026077A (ja) * | 2007-07-19 | 2009-02-05 | Canon Inc | 画像処理サーバ、画像処理方法、コンピュータプログラム、および記憶媒体 |
US8005300B2 (en) | 2005-07-21 | 2011-08-23 | Fuji Xerox Co., Ltd. | Image search system, image search method, and storage medium |
JP2013089085A (ja) * | 2011-10-19 | 2013-05-13 | Toshiba Tec Corp | 情報処理装置、情報処理方法及びプログラム |
JP2016143142A (ja) * | 2015-01-30 | 2016-08-08 | 富士ゼロックス株式会社 | 画像管理システム、画像管理装置、及びプログラム |
Families Citing this family (58)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP4181892B2 (ja) * | 2003-02-21 | 2008-11-19 | キヤノン株式会社 | 画像処理方法 |
JP4646797B2 (ja) * | 2005-02-01 | 2011-03-09 | キヤノン株式会社 | 画像処理装置及びその制御方法、プログラム |
JP4470769B2 (ja) * | 2005-03-15 | 2010-06-02 | カシオ計算機株式会社 | 画像出力装置、画像出力方法および画像出力プログラム |
US20070271250A1 (en) * | 2005-10-19 | 2007-11-22 | Monro Donald M | Basis selection for coding and decoding of data |
US8674855B2 (en) * | 2006-01-13 | 2014-03-18 | Essex Pa, L.L.C. | Identification of text |
JP4921202B2 (ja) * | 2006-03-15 | 2012-04-25 | キヤノン株式会社 | ジョブ履歴管理システム、その制御方法、プログラム及び記憶媒体 |
US7783079B2 (en) * | 2006-04-07 | 2010-08-24 | Monro Donald M | Motion assisted data enhancement |
US7586424B2 (en) * | 2006-06-05 | 2009-09-08 | Donald Martin Monro | Data coding using an exponent and a residual |
US20070290899A1 (en) * | 2006-06-19 | 2007-12-20 | Donald Martin Monro | Data coding |
US7770091B2 (en) * | 2006-06-19 | 2010-08-03 | Monro Donald M | Data compression for use in communication systems |
US7845571B2 (en) * | 2006-06-19 | 2010-12-07 | Monro Donald M | Data compression |
JP4817994B2 (ja) * | 2006-07-03 | 2011-11-16 | キヤノン株式会社 | データ管理システム |
US7689049B2 (en) * | 2006-08-31 | 2010-03-30 | Donald Martin Monro | Matching pursuits coding of data |
US7508325B2 (en) * | 2006-09-06 | 2009-03-24 | Intellectual Ventures Holding 35 Llc | Matching pursuits subband coding of data |
US7974488B2 (en) * | 2006-10-05 | 2011-07-05 | Intellectual Ventures Holding 35 Llc | Matching pursuits basis selection |
US20080084924A1 (en) * | 2006-10-05 | 2008-04-10 | Donald Martin Monro | Matching pursuits basis selection design |
JP4873554B2 (ja) * | 2006-12-25 | 2012-02-08 | 株式会社リコー | 画像配信装置および画像配信方法 |
US7707213B2 (en) * | 2007-02-21 | 2010-04-27 | Donald Martin Monro | Hierarchical update scheme for extremum location |
US7707214B2 (en) * | 2007-02-21 | 2010-04-27 | Donald Martin Monro | Hierarchical update scheme for extremum location with indirect addressing |
US20080205505A1 (en) * | 2007-02-22 | 2008-08-28 | Donald Martin Monro | Video coding with motion vectors determined by decoder |
US10194175B2 (en) | 2007-02-23 | 2019-01-29 | Xylon Llc | Video coding with embedded motion |
US8208725B2 (en) * | 2007-06-21 | 2012-06-26 | Sharp Laboratories Of America, Inc. | Methods and systems for identifying text orientation in a digital image |
US8144989B2 (en) * | 2007-06-21 | 2012-03-27 | Sharp Laboratories Of America, Inc. | Methods and systems for identifying text orientation in a digital image |
US8340430B2 (en) * | 2007-07-10 | 2012-12-25 | Sharp Laboratories Of America, Inc. | Methods and systems for identifying digital image characteristics |
JP2009093627A (ja) * | 2007-09-18 | 2009-04-30 | Ricoh Co Ltd | 文書画像データ提供システム、文書画像データ提供装置、情報処理装置、文書画像データ提供方法、情報処理方法、文書画像データ提供プログラム、情報処理プログラム |
US8194982B2 (en) * | 2007-09-18 | 2012-06-05 | Ricoh Company, Ltd. | Document-image-data providing system, document-image-data providing device, information processing device, document-image-data providing method, information processing method, document-image-data providing program, and information processing program |
JP5098559B2 (ja) * | 2007-10-11 | 2012-12-12 | 富士ゼロックス株式会社 | 類似画像検索装置、及び類似画像検索プログラム |
US20110300831A1 (en) * | 2008-05-17 | 2011-12-08 | Chin David H | Authentication of a mobile device by a patterned security gesture applied to dotted input area |
US8023770B2 (en) * | 2008-05-23 | 2011-09-20 | Sharp Laboratories Of America, Inc. | Methods and systems for identifying the orientation of a digital image |
US8023741B2 (en) | 2008-05-23 | 2011-09-20 | Sharp Laboratories Of America, Inc. | Methods and systems for detecting numerals in a digital image |
JP2010015554A (ja) * | 2008-06-03 | 2010-01-21 | Just Syst Corp | 表構造解析装置、表構造解析方法および表構造解析プログラム |
JP4572248B2 (ja) * | 2008-06-23 | 2010-11-04 | シャープ株式会社 | 画像処理装置、画像形成装置、画像処理方法、制御プログラム、記録媒体 |
US8160365B2 (en) * | 2008-06-30 | 2012-04-17 | Sharp Laboratories Of America, Inc. | Methods and systems for identifying digital image characteristics |
JP5121599B2 (ja) * | 2008-06-30 | 2013-01-16 | キヤノン株式会社 | 画像処理装置、画像処理方法およびそのプログラムならびに記憶媒体 |
US20090327272A1 (en) * | 2008-06-30 | 2009-12-31 | Rami Koivunen | Method and System for Searching Multiple Data Types |
JP5142858B2 (ja) * | 2008-07-03 | 2013-02-13 | キヤノン株式会社 | 画像処理装置および画像処理方法 |
US7864086B2 (en) | 2008-10-06 | 2011-01-04 | Donald Martin Monro | Mode switched adaptive combinatorial coding/decoding for electrical computers and digital data processing systems |
US7791513B2 (en) * | 2008-10-06 | 2010-09-07 | Donald Martin Monro | Adaptive combinatorial coding/decoding with specified occurrences for electrical computers and digital data processing systems |
US7786903B2 (en) | 2008-10-06 | 2010-08-31 | Donald Martin Monro | Combinatorial coding/decoding with specified occurrences for electrical computers and digital data processing systems |
US7786907B2 (en) | 2008-10-06 | 2010-08-31 | Donald Martin Monro | Combinatorial coding/decoding with specified occurrences for electrical computers and digital data processing systems |
US8339680B2 (en) * | 2009-04-02 | 2012-12-25 | Xerox Corporation | Printer image log system for document gathering and retention |
US8386437B2 (en) * | 2009-04-02 | 2013-02-26 | Xerox Corporation | Apparatus and method for document collection and filtering |
CN101931731B (zh) * | 2009-06-26 | 2012-09-26 | 北京大学 | 一种文稿方向的检测方法和装置 |
JP5511450B2 (ja) * | 2010-03-16 | 2014-06-04 | キヤノン株式会社 | 画像処理装置、画像処理方法及びプログラム |
JP5733907B2 (ja) | 2010-04-07 | 2015-06-10 | キヤノン株式会社 | 画像処理装置、画像処理方法、コンピュータプログラム |
CN102591852A (zh) * | 2011-01-14 | 2012-07-18 | 鸿富锦精密工业(深圳)有限公司 | 专利图像自动排版方法及系统 |
CN102831418B (zh) * | 2011-06-17 | 2015-11-25 | 汉王科技股份有限公司 | 手写体汉字倾斜矫正方法及装置 |
US9076058B2 (en) | 2013-01-29 | 2015-07-07 | Sharp Laboratories Of America, Inc. | Methods, systems and apparatus for determining orientation in a document image |
CN104298994B (zh) * | 2014-02-28 | 2017-12-05 | 郑州金惠计算机系统工程有限公司 | 一种指针式仪表读数识别方法及装置 |
JP6481957B2 (ja) * | 2014-08-20 | 2019-03-13 | 富士ゼロックス株式会社 | 画像処理装置およびプログラム |
KR101713197B1 (ko) * | 2015-04-01 | 2017-03-09 | 주식회사 씨케이앤비 | 서버 컴퓨팅 장치 및 이를 이용한 콘텐츠 인식 기반의 영상 검색 시스템 |
CN106485193A (zh) * | 2015-09-02 | 2017-03-08 | 富士通株式会社 | 文档图像的方向检测装置及方法 |
CN105894526A (zh) * | 2016-04-29 | 2016-08-24 | 广东小天才科技有限公司 | 图片的校正方法及装置 |
CN106203131A (zh) * | 2016-06-24 | 2016-12-07 | 维沃移动通信有限公司 | 一种图像加密方法及移动终端 |
CN107357819A (zh) * | 2017-06-14 | 2017-11-17 | 广东艾檬电子科技有限公司 | 一种搜索内容的输入方法、装置、移动终端及存储介质 |
CN110443239B (zh) * | 2019-06-28 | 2024-10-15 | 平安科技(深圳)有限公司 | 文字图像的识别方法及其装置 |
CN111353494B (zh) * | 2020-04-09 | 2023-06-23 | 成都睿琪科技有限责任公司 | 钢材编码识别系统及方法 |
CN112163559B (zh) * | 2020-10-21 | 2024-06-21 | 珠海格力电器股份有限公司 | 一种图纸信息共享方法、设备及手机 |
Family Cites Families (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5991466A (en) | 1991-07-31 | 1999-11-23 | Canon Kabushiki Kaisha | Image retrieving apparatus |
JP3017851B2 (ja) | 1991-07-31 | 2000-03-13 | キヤノン株式会社 | 画像記憶装置 |
US5680479A (en) | 1992-04-24 | 1997-10-21 | Canon Kabushiki Kaisha | Method and apparatus for character recognition |
KR100247970B1 (ko) | 1997-07-15 | 2000-03-15 | 윤종용 | 문서 영상의 방향 교정방법 |
JP3324735B2 (ja) * | 1997-07-15 | 2002-09-17 | コナミ株式会社 | ゲームシステム及びゲーム用プログラムが記録されたコンピュータ読取可能な記録媒体 |
JPH11341229A (ja) * | 1998-05-29 | 1999-12-10 | Canon Inc | 画像処理装置及び画像処理方法 |
US6397213B1 (en) * | 1999-05-12 | 2002-05-28 | Ricoh Company Ltd. | Search and retrieval using document decomposition |
JP2001043310A (ja) * | 1999-07-30 | 2001-02-16 | Fujitsu Ltd | 文書画像補正装置および補正方法 |
-
2003
- 2003-04-30 JP JP2003125817A patent/JP4350414B2/ja not_active Expired - Fee Related
-
2004
- 2004-04-15 EP EP04252206A patent/EP1473641B1/en not_active Expired - Lifetime
- 2004-04-15 DE DE602004025646T patent/DE602004025646D1/de not_active Expired - Fee Related
- 2004-04-21 US US10/828,165 patent/US7382939B2/en not_active Expired - Fee Related
- 2004-04-27 CN CNB2004100386906A patent/CN1332341C/zh not_active Expired - Fee Related
Cited By (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2006331111A (ja) * | 2005-05-26 | 2006-12-07 | Ricoh Co Ltd | 画像処理装置、プログラム及び記録媒体 |
JP4741290B2 (ja) * | 2005-05-26 | 2011-08-03 | 株式会社リコー | 画像処理装置、画像処理方法、プログラム及び記録媒体 |
JP2007026386A (ja) * | 2005-07-21 | 2007-02-01 | Fuji Xerox Co Ltd | 画像検索システム及び方法 |
US8005300B2 (en) | 2005-07-21 | 2011-08-23 | Fuji Xerox Co., Ltd. | Image search system, image search method, and storage medium |
JP2009026077A (ja) * | 2007-07-19 | 2009-02-05 | Canon Inc | 画像処理サーバ、画像処理方法、コンピュータプログラム、および記憶媒体 |
JP2013089085A (ja) * | 2011-10-19 | 2013-05-13 | Toshiba Tec Corp | 情報処理装置、情報処理方法及びプログラム |
CN103116949A (zh) * | 2011-10-19 | 2013-05-22 | 东芝泰格有限公司 | 信息处理装置及信息处理方法 |
US9042660B2 (en) | 2011-10-19 | 2015-05-26 | Toshiba Tec Kabushiki Kaisha | Information processing apparatus and information processing method |
JP2016143142A (ja) * | 2015-01-30 | 2016-08-08 | 富士ゼロックス株式会社 | 画像管理システム、画像管理装置、及びプログラム |
Also Published As
Publication number | Publication date |
---|---|
EP1473641B1 (en) | 2010-02-24 |
CN1542656A (zh) | 2004-11-03 |
CN1332341C (zh) | 2007-08-15 |
US20040218836A1 (en) | 2004-11-04 |
EP1473641A2 (en) | 2004-11-03 |
DE602004025646D1 (de) | 2010-04-08 |
US7382939B2 (en) | 2008-06-03 |
EP1473641A3 (en) | 2005-10-19 |
JP4350414B2 (ja) | 2009-10-21 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP4350414B2 (ja) | 情報処理装置及び情報処理方法ならびに記憶媒体、プログラム | |
JP4181892B2 (ja) | 画像処理方法 | |
US7593961B2 (en) | Information processing apparatus for retrieving image data similar to an entered image | |
US7787712B2 (en) | Electronic document creating apparatus | |
JP4533187B2 (ja) | 画像処理装置およびその制御方法 | |
JP4533273B2 (ja) | 画像処理装置及び画像処理方法、プログラム | |
JP4854491B2 (ja) | 画像処理装置及びその制御方法 | |
JP4502385B2 (ja) | 画像処理装置およびその制御方法 | |
JP2004265384A (ja) | 画像処理システム及び情報処理装置、並びに制御方法及びコンピュータプログラム及びコンピュータ可読記憶媒体 | |
JP2004334339A (ja) | 情報処理装置及び情報処理方法ならびに記憶媒体、プログラム | |
CN100430957C (zh) | 图像处理装置、方法 | |
JP2008022159A (ja) | 文書処理装置及び文書処理方法 | |
JP4338189B2 (ja) | 画像処理システム及び画像処理方法 | |
JP4261988B2 (ja) | 画像処理装置及び方法 | |
JP2006025129A (ja) | 画像処理システム及び画像処理方法 | |
JP2004348467A (ja) | 画像検索装置及びその制御方法、プログラム | |
JP2005149323A (ja) | 画像処理システム及び画像処理装置並びに画像処理方法 | |
JP2004334340A (ja) | 画像処理方法及び装置 | |
JP2007048061A (ja) | 文字処理装置、文字処理方法及び記録媒体 | |
JP2007323415A (ja) | 情報検索装置、情報検索システム、情報検索装置の制御方法、及び制御プログラムを提供する媒体 | |
JP2007048057A (ja) | 画像処理装置 | |
JP2005208872A (ja) | 画像処理システム | |
JP2008159049A (ja) | 画像記録システム | |
JP2007034923A (ja) | 画像処理システム | |
JP2007323414A (ja) | 情報検索装置、情報検索システム、情報検索装置の制御方法、及び制御プログラムを提供する媒体 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20060501 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20090402 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20090420 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20090618 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20090721 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20090722 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120731 Year of fee payment: 3 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120731 Year of fee payment: 3 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130731 Year of fee payment: 4 |
|
LAPS | Cancellation because of no payment of annual fees |