JP6651675B1 - 画像情報処理装置、画像情報処理方法、及び画像情報処理プログラム - Google Patents

画像情報処理装置、画像情報処理方法、及び画像情報処理プログラム Download PDF

Info

Publication number
JP6651675B1
JP6651675B1 JP2019505270A JP2019505270A JP6651675B1 JP 6651675 B1 JP6651675 B1 JP 6651675B1 JP 2019505270 A JP2019505270 A JP 2019505270A JP 2019505270 A JP2019505270 A JP 2019505270A JP 6651675 B1 JP6651675 B1 JP 6651675B1
Authority
JP
Japan
Prior art keywords
image
graphic
image elements
integration
image element
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2019505270A
Other languages
English (en)
Other versions
JPWO2020054067A1 (ja
Inventor
裕介 伊谷
裕介 伊谷
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Mitsubishi Electric Corp
Original Assignee
Mitsubishi Electric Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Mitsubishi Electric Corp filed Critical Mitsubishi Electric Corp
Application granted granted Critical
Publication of JP6651675B1 publication Critical patent/JP6651675B1/ja
Publication of JPWO2020054067A1 publication Critical patent/JPWO2020054067A1/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/10Image acquisition

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Theoretical Computer Science (AREA)
  • Character Input (AREA)
  • Image Analysis (AREA)

Abstract

画像情報処理装置(1)は、入力された画像データの中から複数の領域である複数の画像要素を認識する認識処理部(10)と、複数の画像要素から処理対象の画像要素を抽出し、抽出された画像要素を互いに関連付ける処理である統合処理を行う統合処理部(20)とを備える。統合処理部(20)は、抽出された画像要素の間に配置された又は抽出された画像要素に重なる部分を有するように配置された、抽出された画像要素の関係を示す第1の情報が存在する場合には、抽出された画像要素に対し第1の情報に基づく種類の統合処理を行う。

Description

本発明は、画像データの中から複数の領域である複数の画像要素を認識し、認識された画像要素を互いに関連付ける処理である統合処理を行うための画像情報処理装置、画像情報処理方法、及び画像情報処理プログラムに関する。
従来、画像データの中から図形領域、線分領域、文字領域などのような画像要素を認識し、認識された画像要素を互いにリンクさせる処理を行う種々の方法が提案されている。画像要素は、図形データの中の認識可能な領域である。画像要素は、画像領域ともいう。図形領域は、図形を含む画像領域である。線分領域は、線分を含む画像領域である。文字領域は、文字を含む画像領域である。画像要素を互いにリンクさせる処理は、画像要素を統合する処理、画像要素を互いに関連付ける処理、又は統合処理ともいう。
例えば、特許文献1は、画像データの中から、オブジェクトを含む領域とオブジェクトに関する文字列を含む領域とを抽出し、オブジェクトを含む領域と文字列を含む領域との対応を示すリンク情報を生成し、リンク情報と入力された画像データとを表示するためのデータを生成する方法を提案している。
また、特許文献2は、文書データから図表領域とその図表領域の構成要素である個々の図表との関係をレイアウト解析により推定し、図表領域のキャプションと個々の図表のサブキャプションとの関係を解析し、この関係を示す検索用メタデータを図表領域又は個々の図表と関連付けたデータを生成する方法を提案している。
特開2012−018489号公報(例えば、段落0020) 特開2007−310503号公報(例えば、要約)
しかしながら、特許文献1の方法は、近傍にある領域同士の対応を示すリンク情報を生成しているので、領域同士の関連付けが適切に行われない場合があるという問題がある。特許文献2の方法は、図表領域のキャプション及び図表のサブキャプションに記述されている情報に基づいて関連付けを行っているので、関連付けが適切に行われない場合があるという問題がある。
本発明は、上記従来技術の課題を解決するためになされたものであり、画像データの中の領域である画像要素を互いに関連付ける処理である統合処理を適切に行うことができる画像情報処理装置、画像情報処理方法、及び画像情報処理プログラムを提供することを目的とする。
本発明の一態様に係る画像情報処理装置は、入力された画像データの中から複数の領域である複数の画像要素の位置、大きさ及び形状を認識する認識処理部と、前記複数の画像要素から第1、第2、及び第3の画像要素を抽出し、前記第1及び第2の画像要素を前記第3の画像要素に基づいて互いに関連付ける処理である統合処理を行う統合処理部と、を備え、前記統合処理部は、前記第3の画像要素が、前記第1及び第2の画像要素の間に配置され、前記第1の画像要素から前記第2の画像要素を指し示す図形の領域若しくは前記第2の画像要素から前記第1の画像要素を指し示す図形の領域である場合には、前記図形の領域によって指し示し及び指し示される前記第1及び第2の画像要素を統合する統合処理を行い、前記第3の画像要素が、前記第1及び第2の画像要素の両方に重なる部分を有するように配置された図形若しくは線分の領域である場合には、前記図形若しくは線分の領域と重なる部分を有する前記第1及び第2の画像要素を統合する統合処理を行い、前記第3の画像要素が前記第1及び第2の画像要素を互いに関連付ける文字の領域である場合には、前記文字によって関連付けられた前記第1及び第2の画像要素を統合する統合処理を行うことを特徴とする。
本発明の他の態様に係る画像情報処理方法は、入力された画像データの中から複数の領域である複数の画像要素の位置、大きさ及び形状を認識するステップと、前記複数の画像要素から第1、第2、及び第3の画像要素を抽出し、前記第1及び第2の画像要素を前記第3の画像要素に基づいて互いに関連付ける処理である統合処理を行うステップと、を有し、前記統合処理を行うステップでは、前記第3の画像要素が、前記第1及び第2の画像要素の間に配置され、前記第1の画像要素から前記第2の画像要素を指し示す図形の領域若しくは前記第2の画像要素から前記第1の画像要素を指し示す図形の領域である場合には、前記図形の領域によって指し示し及び指し示される前記第1及び第2の画像要素を統合する統合処理を行い、前記第3の画像要素が、前記第1及び第2の画像要素の両方に重なる部分を有するように配置された図形若しくは線分の領域である場合には、前記図形若しくは線分の領域と重なる部分を有する前記第1及び第2の画像要素を統合する統合処理を行い、前記第3の画像要素が前記第1及び第2の画像要素を互いに関連付ける文字の領域である場合には、前記文字によって関連付けられた前記第1及び第2の画像要素を統合する統合処理を行うことを特徴とする。
本発明によれば、画像データの中の領域である画像要素を互いに関連付ける処理である統合処理を適切に行うことができる。
本発明の実施の形態1に係る画像情報処理装置の構成を概略的に示すブロック図である。 実施の形態1に係る画像情報処理装置のハードウェア構成の例を示す図である。 実施の形態1に係る画像情報処理装置のハードウェア構成の他の例を示す図である。 実施の形態1に係る画像情報処理装置に入力される画像データの例を表示画像として示す図である。 実施の形態1に係る画像情報処理装置の認識処理部によって認識された画像要素を示す情報の例、すなわち、認識結果の例を表形式で示す図である。 実施の形態1に係る画像情報処理装置の統合処理部が行う統合処理の例(すなわち、図形同士を結合する例)を示す図である。 実施の形態1に係る画像情報処理装置の統合処理部が行う統合処理の他の例(すなわち、図形が文字列を包含する例)を示す図である。 実施の形態1に係る画像情報処理装置の統合処理部が行う統合処理の他の例(すなわち、図形が他の図形を包含する例)を示す図である。 実施の形態1に係る画像情報処理装置の統合処理部が行う統合処理の他の例(すなわち、図形と文字領域とを結合する例)を示す図である。 (a)及び(b)は、画像情報処理装置の認識処理部によって認識された認識結果の例と、実施の形態1に係る画像情報処理装置の統合処理部が行う統合処理によって生成される統合データの例、すなわち、統合結果の例とを表形式で示す図である。 実施の形態1に係る画像情報処理装置の統合処理部の動作を示すフローチャートである。 本発明の実施の形態2に係る画像情報処理装置の構成を概略的に示すブロック図である。 実施の形態2に係る画像情報処理装置の統合処理部が行う統合処理の例を示す図である。 実施の形態2に係る画像情報処理装置の統合処理部が行う統合処理の他の例を示す図である。 (a)及び(b)は、画像情報処理装置の認識処理部によって認識された認識結果の例と、実施の形態2に係る画像情報処理装置の統合処理部が行う統合処理によって生成される統合データの例、すなわち、統合結果の例とを表形式で示す図である。 実施の形態2に係る画像情報処理装置の統合処理部の動作を示すフローチャートである。 本発明の実施の形態3に係る画像情報処理装置の構成を概略的に示すブロック図である。 実施の形態3に係る画像情報処理装置の統合処理部が行う統合処理の例を示す図である。 実施の形態3に係る画像情報処理装置の統合処理部が行う統合処理の他の例を示す図である。
実施の形態1.
以下に、本発明の実施の形態に係る画像情報処理装置、画像情報処理方法、及び画像情報処理プログラムを、図面を参照しながら説明する。以下の実施の形態は、例にすぎず、本発明の範囲内で種々の変更が可能である。
実施の形態1.
図1は、本発明の実施の形態1に係る画像情報処理装置1の構成を概略的に示すブロック図である。画像情報処理装置1は、実施の形態1に係る画像処理方法を実施することができる装置である。図1に示されるように、実施の形態1に係る画像情報処理装置1は、認識処理部10と、統合処理部20とを備えている。画像情報処理装置1は、統合データを記憶する記憶部30を備えてもよい。
認識処理部10は、入力された画像データの中から複数の領域である複数の画像要素を認識する。画像要素は、例えば、図形を含む図形領域、線分を含む線分領域、及び文字を含む文字領域である。認識処理部10は、図形又は図形領域を認識する図形認識部11と、線分又は線分領域を認識する線分認識部12と、文字又は文字領域を認識する文字認識部13とを有することができる。文字は、複数の文字を含む文字列を含む。
統合処理部20は、認識処理部10によって認識された複数の画像要素から処理対象の画像要素を抽出し、抽出された画像要素を互いに関連付ける処理である統合処理を行う。統合処理は、画像要素を互いにリンクさせる処理、又は画像要素を互いに紐付ける処理ともいう。統合処理部20は、例えば、領域統合部21と、文字図形統合部22とを有する。
統合処理部20は、抽出された画像要素の間に配置された又は抽出された画像要素に重なる部分を有するように配置された、抽出された画像要素の関係を示す情報が存在する場合には、抽出された画像要素に対し画像要素の関係を示す情報に基づく種類の統合処理を行う。画像要素の関係を示す情報は、第1の情報ともいう。この統合処理は、領域統合部21によって行われる。
画像要素の関係を示す情報の例は、抽出された画像要素に重なる部分を有するように配置された線分である。この例は、図6を用いて後述される。
画像要素の関係を示す情報の他の例は、抽出された画像要素の間に配置された記号である。この例は、図9を用いて後述される。
また、統合処理部20は、抽出された画像要素の内の一方の画像要素が他方の画像要素を包含する場合には、抽出された画像要素に対し統合処理を行ってもよい。この例は、図7及び図8を用いて後述される。
図2は、実施の形態1に係る画像情報処理装置1のハードウェア構成の例を示す図である。図2は、画像情報処理装置1が、処理回路91、記憶装置92、画像取り込み装置93、及びディスプレイ94を備える例を示している。処理回路91は、例えば、電子回路である。処理回路91は、図1に示される認識処理部10及び統合処理部20を構成することができる。記憶装置92は、例えば、ハードディスクドライブ、半導体記憶装置、又は他の情報記憶装置である。記憶装置92は、図1に示される記憶部30を構成することができる。画像取り込み装置93は、例えば、画像を読み取る画像読取装置であるスキャナ、画像を撮影する撮像装置であるカメラ、などである。画像取り込み装置93は、図1に示される認識処理部10に画像データを提供することができる。ディスプレイ94は、画像を表示する装置である。ディスプレイ94は、認識処理部10で認識された認識結果、統合処理部20で生成された統合結果、などを表示することができる。
図3は、実施の形態1に係る画像情報処理装置1のハードウェア構成の他の例を示す図である。図3において、図2に示される構成要素と同一又は対応する構成要素には、図2に示される符号と同じ符号が付される。図3は、画像情報処理装置1が、CPU(Central Processing Unit)からなるプロセッサ95、RAM(Randam Access Memory)及びROM(Read Only Memory)などのメモリ96、大容量の記憶装置92、画像取り込み装置93、及びディスプレイ94を備える例を示している。図3に示される画像情報処理装置1のプロセッサ95及びメモリ96は、例えば、コンピュータの一部である。プロセッサ95は、メモリ96に記憶されている画像情報処理プログラムを実行することにより、図1に示される認識処理部10及び統合処理部20の機能の全部又は一部を実現することができる。
図4は、実施の形態1に係る画像情報処理装置1に入力される画像データ70の例を表示画像として示す図である。図4は、例えば、画像取り込み装置93によって取り込まれた画像データ70の例を示す。図4には、図形P1、図形P2、図形P3、文字領域R2、及び線分Q1が示されている。
画像データ70の中の図形を認識する処理、すなわち、図形領域を認識する処理は、例えば、特許文献3に記載されている方法又は非特許文献1に記載されている方法により行うことができる。
特許第6076128号公報
米山昇吾、外2名、「図面画像内シンボル抽出方式の検討」、電子情報通信学会総合大会、2006年3月
画像データ70の中の線分を認識する処理、すなわち、線分領域を認識する処理は、例えば、非特許文献2に記載されている方法により行うことができる。
平野敬、外2名、「文書画像からの罫線抽出方式」、電子情報通信学会総合大会、1998年3月
画像データ70の中の文字(文字列を含む)を認識する処理、すなわち、文字領域(文字列領域を含む)を認識する処理は、例えば、非特許文献3に記載されている方法により行うことができる。
T.Hirano、外2名、"Structural Character Recognition Using Simulated Annealing"、ICDAR(International Conference on Document Analysis and Recognition)1997、1997年8月.
図5は、実施の形態1に係る画像情報処理装置1の認識処理部10によって認識された画像要素の例、すなわち、認識結果の例を表形式で示す図である。図5に示されるように、認識処理部10によって認識された認識結果は、例えば、「図形」、「線分」及び「文字領域」、すなわち、画像要素が占有する領域の種類を示す情報であるラベルと、画像データにおける画像要素の位置、サイズ、及び形状を示す情報とを含むデータである。
図6から図9は、実施の形態1における統合処理部20が行う統合処理の例を示す図である。
図6は、画像データが、「図形A」、「図形B」、及び「線分C」を含む例を示す。「図形A」、「図形B」、及び「線分C」は、画像要素である。図6の例では、「図形A」と「図形B」とは、「線分C」により互いに結ばれている。図6の例では、「図形A」、「図形B」、及び「線分C」は、以下の条件(1)及び(2)を満たしている。
条件(1)は、『「図形A」は「線分C」の始点を包含する。』である。すなわち、条件(1)は、『「線分C」の始点は「図形A」の要素である。』である。条件(1)は、以下のように表現できる。
(線分Cの始点)∈(図形A) (1)
条件(2)は、『「図形B」は「線分C」の終点を包含する。』である。すなわち、条件(2)は、『「線分C」の終点は「図形B」の要素である。』である。条件(2)は、以下のように表現できる。
(線分Cの終点)∈(図形B) (2)
統合処理部20は、「図形A」、「図形B」、及び「線分C」が、条件(1)及び(2)の両方を満たすときに、画像要素である「図形A」と「図形B」とを統合する処理を行う。「図形A」と「図形B」とを統合する処理は、例えば、「図形A」と「図形B」とを関連付けて、「図形A」と「図形B」と関連付け情報とを、統合データとして記憶部30に記憶させる処理である。この場合、関連付け情報は、例えば、「結合」である。「結合」は、例えば、「図形A」と「図形B」とが「線分C」によって結合されていることを示す情報である。
図7は、画像データが、「図形D」と「文字列E」とを含む例を示す。「図形D」及び「文字列E」は、画像要素である。図7の例では、「図形D」及び「文字列E」は、以下の条件(3)を満たしている。
条件(3)は、『「図形D」は「文字列E」を包含する。』である。すなわち、条件(3)は、『「文字列E」は「図形D」の要素である。』である。条件(3)は、以下のように表現できる。
(文字列E)∈(図形D) (3)
統合処理部20は、「図形D」と「文字列E」が、条件(3)を満たすときに、画像要素である「図形D」と「文字列E」とを統合する処理を行う。「図形D」と「文字列E」とを統合する処理は、例えば、「図形D」と「文字列E」とを関連付けて、「図形D」と「文字列E」と関連付け情報とを、統合データとして記憶部30に記憶させる処理である。この場合、関連付け情報は、例えば、「包含」である。「包含」は、例えば、「図形D」が「文字列E」を包含することを示す情報である。
図8は、画像データが、「図形F」と「図形G」とを含む例を示す。「図形F」及び「図形G」は、画像要素である。図8の例では、「図形F」及び「図形G」は、以下の条件(4)を満たしている。
条件(4)は、『「図形F」は「図形G」を包含する。』である。すなわち、条件(4)は、『「図形G」は「図形F」の要素である。』である。条件(4)は、以下のように表現できる。
(図形G)∈(図形F) (4)
統合処理部20は、「図形F」と「図形G」が、条件(4)を満たすときに、画像要素である「図形F」と「図形G」とを統合する処理を行う。「図形F」と「図形G」とを統合する処理は、例えば、「図形F」と「図形G」とを関連付けて、「図形F」と「図形G」と関連付け情報とを、統合データとして記憶部30に記憶させる処理である。この場合、関連付け情報は、例えば、「包含」である。「包含」は、例えば、「図形F」が「図形G」を包含することを示す情報である。
図9は、画像データが、「図形K」と「文字列I」と「記号J」を含む例を示す。「図形K」、「文字列I」、及び「記号J」は、画像要素である。
図9の例では、「図形K」の右側に「文字列I」が配置され、「図形K」と「文字列I」との間に「記号J」が存在する。図9の例では、「記号J」は、人差し指が「図形K」から「文字列I」を指している手の図形である。図9の例では、「図形K」及び「文字列I」は、「記号J」によって以下の条件(5)を満たしている。
「記号J」が包含を示す記号として定義されている場合、条件(5)は、『「図形K」は「文字列I」を包含する。』である。すなわち、条件(5)は、『「文字列I」は「図形K」の要素である。』である。条件(5)は、以下のように表現できる。
(文字列I)∈(図形K) (5)
統合処理部20は、「図形K」、「文字列I」及び「記号J」の意味を解釈して、以下の統合処理を行う。統合処理部20は、「図形K」と「文字列I」が、条件(5)を満たすときに、画像要素である「図形K」と「文字列I」とを統合する処理を行う。「図形K」と「文字列I」とを統合する処理は、例えば、「図形K」と「文字列I」とを関連付けて、「図形K」と「文字列I」と関連付け情報とを記憶部30に記憶させる処理である。この場合、関連付け情報は、例えば、「包含」である。「包含」は、「図形K」が「文字列I」を包含することを示す情報である。
図6から図9に示されるように、統合処理部20は、画像データの中の画像要素を解析して、解析の結果に基づいて画像要素と他の画像要素とを統合する統合処理を行う。統合処理に使用される解析の結果を示す情報は、例えば、以下のものである。
・画像要素と他の画像要素との間にある情報(例えば、「記号J」、「線分C」)
・画像要素と他の画像要素とを結ぶ情報(例えば、「線分C」)
・画像要素と他の画像要素との包含関係を示す情報(例えば、「図形F」と「図形G」)
・画像要素の外部又は内部にある他の画像要素に関する情報
・画像要素と他の画像要素との関係を指し示す情報(例えば、「記号J」)
図10(a)及び(b)は、実施の形態1に係る画像情報処理装置1の認識処理部10によって認識された認識結果の例と、実施の形態1に係る画像情報処理装置1の統合処理部20が行う統合処理によって生成される統合データの例、すなわち、統合結果の例とを表形式で示す図である。記憶部30は、図10(a)に示されるように、認識処理部10によって取得された認識結果を示すデータを認識結果テーブルとして記憶してもよい。また、記憶部30は、図10(b)に示されるように、統合処理部20によって生成された統合処理の結果を示すデータを統合結果テーブルとして記憶してもよい。
図11は、実施の形態1に係る画像情報処理装置1の統合処理部20の動作を示すフローチャートである。
まず、統合処理部20は、認識処理部10によって認識された複数の画像要素の内の、任意の画像要素の対を抽出する(ステップST11)。任意の画像要素の対は、例えば、互いに近い位置にある画像要素の対である。互いに近い位置とは、画像要素間の距離が予め決められた閾値以内であること、画像要素が互いに重複する部分を有すること、一方の画像要素が他方の画像要素を包含すること、などである。任意の画像要素の対は、位置関係ではなく、図7に示されるような線分で結ばれている画像要素の対、図9に示されるように記号で関連が示されている画像情報の対、などであってもよい。
次に、統合処理部20は、抽出された画像要素の対が予め決められた条件を満たすか否かを判定する(ステップST12)。予め決められた条件は、例えば、上記条件(1)〜(5)のいずれかである。ただし、予め決められた条件は、上記条件(1)〜(5)に限定されない。
統合処理部20は、抽出された画像要素の対が予め決められた条件を満たす場合には、画像要素を統合する(ステップST13)。
統合処理部20は、ステップST11〜ST13の後に、抽出された画像要素に文字領域があるか否かを判定する(ステップST14)。統合処理部20は、文字領域がある場合には、統合データに、文字認識の結果、又は、文字認識の結果を示すテキスト情報であるラベルを付与する(ステップST15)。ステップST14、ST15の処理は、例えば、文字図形統合部22によって行われる。
統合処理部20は、統合処理を行う画像要素が他にもある場合には、処理をステップST11に戻す。
以上に説明したように、実施の形態1に係る画像情報処理装置1によれば、画像要素である領域同士の位置関係だけでなく、画像要素の間の情報に基づいて領域を統合している。このため、統合処理によって得られる統合データをより適切なものにすることができる。
また、実施の形態1に係る画像情報処理装置1によれば、画像要素としての文字領域が存在する場合には、文字認識の結果、又は、文字認識の結果を示すテキスト情報をラベルとして認識結果データ又は統合データに付与して、記憶部30に記憶させることができる。この場合には、ラベルを用いた画像解析が可能になるので、統合処理によって得られる統合データをより適切なものにすることができる。
実施の形態2.
図12は、本発明の実施の形態2に係る画像情報処理装置2の構成を概略的に示すブロック図である。図12において、図1に示される構成要素と同一又は対応する構成要素には、図1に示される符号と同じ符号が付される。画像情報処理装置2は、統合処理部40の構成が、実施の形態1における統合処理部20のものと相違する。図12に示されるように、実施の形態2における統合処理部40は、領域統合部21、知識取得部41、及び知識統合部42を備えている。
知識取得部41は、領域統合部21によって連結された文字領域に記載されている内容に関連のある文字領域を調べ、関連する知識を取得する。関連知識の取得方法としては、例えば、特許文献4に記載されているテキストマイニング法を用いることができる。
特許第4595590号公報
図13及び図14は、実施の形態2に係る画像情報処理装置2の統合処理部40が行う統合処理の例を示す図である。
図13は、画像データが、「図形P1」、「文字領域R1」、及び「線分L」を含む例を示す。「図形P1」、「文字領域R1」、及び「線分L」は、画像要素である。図13の例では、「図形P1」と「文字領域R1」とは、「線分L」により互いに結ばれている。図13の例では、「図形P1」、「文字領域R1」、及び「線分L」は、以下の条件(6)及び(7)を満たしている。
条件(6)は、『「図形P1」は「線分L」の始点を包含する。』である。すなわち、条件(6)は、『「線分L」の始点は「図形P1」の要素である。』である。条件(6)は、以下のように表現できる。
(線分Lの始点)∈(図形P1) (6)
条件(7)は、『「文字領域R1」は「線分L」の終点を包含する。』である。すなわち、条件(7)は、『「線分L」の終点は「文字領域R1」の要素である。』である。条件(7)は、以下のように表現できる。
(線分Lの終点)∈(文字領域R1) (7)
統合処理部40の領域統合部21は、「図形P1」、「文字領域R1」、及び「線分L」が、条件(6)及び(7)の両方を満たすときに、画像要素である「図形P1」と「文字領域R1」とを統合する処理を行う。「図形P1」と「文字領域R1」とを統合する処理は、例えば、「図形P1」と「文字領域R1」とを関連付けて、「図形P1」と「文字領域R1」と関連付け情報とを、統合データとして記憶部30に記憶させる処理である。この場合、関連付け情報は、例えば、「結合」である。
図14は、画像データが、「図形P1」、「文字領域M」、及び「注釈N」を含む例を示す。「図形P1」、「文字領域M」、及び「注釈N」は、画像要素である。図14の例では、「図形P1」と「文字領域M」とは、共に「注釈N」、すなわち、「*1」を有しており、「注釈N」により互いに関連付けられている。知識取得部41は、例えば、「図形P1」と「文字領域M」とが「注釈N」によって関連付けられている情報であること、すなわち、関連知識を取得する。
図14の例では、統合処理部40の知識統合部42は、「図形P1」と「文字領域M」とを、「注釈N」に基づいて統合することができる。
図15(a)及び(b)は、実施の形態2に係る画像情報処理装置2の認識処理部10によって認識された認識結果の例と、実施の形態2に係る画像情報処理装置2の統合処理部40が行う統合処理によって生成される統合データの例、すなわち、統合結果の例とを表形式で示す図である。
知識統合部42は、領域統合部21で連結した領域と、知識取得部41で取得した関連知識とを統合する。知識統合部42は、統合結果を、例えば、図15(b)に示されるようにリストとして出力する。
図13に示されるように、「文字領域R1」にページ番号が含まれている場合には、「図形P1」は、このページ番号の情報にリンクを張る。図14に示されるように、「注釈N」が文字情報を含む場合には、「図形P1」は、注釈の示す情報を取得する。
図16は、実施の形態2に係る画像情報処理装置2の統合処理部40の動作を示すフローチャートである。図16において、ステップST11〜ST13は、図11のものと同じである。
統合処理部40は、文字領域からテキストデータを取得し、リンク情報の有無を確認する(ステップST24)。統合処理部40は、リンク情報がある場合、リンク先から関連知識を取得する(ステップST25)。統合処理部40は、取得した知識を、ステップST13で生成した結果と統合する(ステップST26)。
この場合、統合処理部40が生成する統合データは、図15(b)に示されるように、知識取得部41が取得した情報を含むことができる。つまり、実施の形態2においては、統合処理部40は、認識処理部10によって認識された画像要素が文字を含む場合に、文字から関連する知識を取得し、取得された知識と抽出された画像要素とを統合する統合処理を行うことができる。よって、適切な統合データを生成することができる。
上記以外の点について、実施の形態2は、実施の形態1と同じである。また、実施の形態2の構成を、実施の形態1に適用することも可能である。
実施の形態3.
図17は、本発明の実施の形態3に係る画像情報処理装置3の構成を概略的に示すブロック図である。図17において、図1に示される構成要素と同一又は対応する構成要素には、図1に示される符号と同じ符号が付される。画像情報処理装置3は、予め取得された事前データ51に基づいて認識処理を行う点が、実施の形態1に係る画像情報処理装置1と相違する。また、画像情報処理装置3は、予め取得された事前データ51に基づいて統合処理を行ってもよい。
実施の形態3においては、認識処理部10aは、図形認識、線分認識、及び文字認識を行い、認識された画像要素、すなわち、認識結果を出力する。認識処理部10aは、図形認識、線分認識、及び文字認識を実施する際に、事前データ51を用いる。事前データ51は、例えば、製品説明書における製品に関するデータを含む。認識処理部10aは、事前データ51を用いることで、製品に固有の用語、製品の構造に関する情報を利用することができる。
認識処理部10aは、文字認識に際し、製品に固有の用語を参照することで、文字認識の精度を向上させることができる。例えば、認識処理部10aは、文字認識に際し、製品に固有の用語を含む文字列だけを認識することによって、不必要な文字を認識させないことができる。つまり、認識処理部10aは、文字の認識を適切に行うことができる。
認識処理部10aは、図形認識に際し、製品の構造に関する情報を参照することで、図形認識の精度を向上させることができる。例えば、認識処理部10aは、図形認識に際し、製品の構造に対応又は類似する形状だけを認識することによって、不必要な図形を認識させないことができる。つまり、認識処理部10aは、図形の認識を適切に行うことができる。
統合処理部50は、実施の形態1における統合処理部20と同様の動作をする。統合処理部50は、事前データ51を用いることで、製品の構造情報を利用することができ、製品に合わせた統合結果を得ることができる。
例えば、統合処理部50は、統合処理に際し、製品に固有の用語を含む文字列に関する統合データだけを生成すること、又は、統合データに製品に固有の用語を含むことを示す情報を付加することができる。つまり、統合処理部50は、適切な統合データを生成することができる。
また、統合処理部50は、統合処理に際し、製品の構造に対応又は類似する形状の図形を含む統合データだけを生成すること、又は、統合データに対応又は類似する形状の図形を含む統合データを含むことを示す情報を付加することができる。つまり、統合処理部50は、適切な統合データを生成することができる。
図18及び図19は、実施の形態3に係る画像情報処理装置3の統合処理部50が行う統合処理の例を説明するための図である。
事前データ51を使用しない場合には、図18に示されるように、認識処理部10aは、三角形の図形領域と四角形の図形領域とを画像要素として認識する。この場合、統合処理部50が生成する統合データも、図18に示されるものとなる。
事前データ51として「不動産の文書」という情報を使用する場合には、図19に示されるように、認識処理部10aは、不動産である家に関する画像要素を認識することができる。例えば、認識処理部10aは、三角形の図形領域と四角形の図形領域である家の正面図(すなわち、全体図)と、四角形の他の図形領域である家の平面図(すなわち、間取り図)とを画像要素として認識することができる。この場合、統合処理部50が生成する統合データも、図19に示されるように、2つの画像要素を線分で結合するものとすることができる。
つまり、実施の形態3においては、認識処理部10aは、文書に関し事前に得られる事前知識を受け取り、事前知識に関連する画像要素を認識することができる。また、統合処理部50は、事前知識を受け取り、事前知識に関連する画像要素を統合することができる。このようにすることで、適切な統合データを生成することができる。
上記以外の点について、実施の形態3は、実施の形態1又は2と同じである。また、実施の形態3の構成を、実施の形態2に適用することも可能である。
変形例.
本願発明は、その発明の範囲内において、実施の形態の任意の構成要素の変形、もしくは、実施の形態の任意の構成要素の省略が可能である。
1,2,3 画像情報処理装置、 10,10a 認識処理部、 11 図形認識部、 12 線分認識部、 13 文字認識部、 20,40,50 統合処理部、 21 領域統合部、 22 文字図形統合部、 30 記憶部、 41 知識取得部、 42 知識統合部、 51 事前データ。

Claims (5)

  1. 入力された画像データの中から複数の領域である複数の画像要素の位置、大きさ及び形状を認識する認識処理部と、
    前記複数の画像要素から第1、第2、及び第3の画像要素を抽出し、前記第1及び第2の画像要素を前記第3の画像要素に基づいて互いに関連付ける処理である統合処理を行う統合処理部と、
    を備え、
    前記統合処理部は、
    前記第3の画像要素が、前記第1及び第2の画像要素の間に配置され、前記第1の画像要素から前記第2の画像要素を指し示す図形の領域若しくは前記第2の画像要素から前記第1の画像要素を指し示す図形の領域である場合には、前記図形の領域によって指し示し及び指し示される前記第1及び第2の画像要素を統合する統合処理を行い、
    前記第3の画像要素が、前記第1及び第2の画像要素の両方に重なる部分を有するように配置された図形若しくは線分の領域である場合には、前記図形若しくは線分の領域と重なる部分を有する前記第1及び第2の画像要素を統合する統合処理を行い、
    前記第3の画像要素が前記第1及び第2の画像要素を互いに関連付ける文字の領域である場合には、前記文字によって関連付けられた前記第1及び第2の画像要素を統合する統合処理を行う
    ことを特徴とする画像情報処理装置。
  2. 前記統合処理部は、
    前記第3の画像要素が前記第1及び第2の画像要素を互いに関連付ける文字の領域である場合に、前記文字から関連する知識を取得する知識取得部と、
    前記知識取得部によって取得された知識と前記文字によって関連付けられた前記第1及び第2の画像要素を統合する統合処理によって得られた領域とを統合する知識統合部と
    を有することを特徴とする請求項に記載の画像情報処理装置。
  3. 前記統合処理部は、前記第1の画像要素が前記第2の画像要素を包含する場合には、前記第1の画像要素と前記第2の画像要素とを統合する統合処理を行うことを特徴とする請求項1又は2に記載の画像情報処理装置。
  4. 入力された画像データの中から複数の領域である複数の画像要素の位置、大きさ及び形状を認識するステップと、
    前記複数の画像要素から第1、第2、及び第3の画像要素を抽出し、前記第1及び第2の画像要素を前記第3の画像要素に基づいて互いに関連付ける処理である統合処理を行うステップと、
    を有し、
    前記統合処理を行うステップでは、
    前記第3の画像要素が、前記第1及び第2の画像要素の間に配置され、前記第1の画像要素から前記第2の画像要素を指し示す図形の領域若しくは前記第2の画像要素から前記第1の画像要素を指し示す図形の領域である場合には、前記図形の領域によって指し示し及び指し示される前記第1及び第2の画像要素を統合する統合処理を行い、
    前記第3の画像要素が、前記第1及び第2の画像要素の両方に重なる部分を有するように配置された図形若しくは線分の領域である場合には、前記図形若しくは線分の領域と重なる部分を有する前記第1及び第2の画像要素を統合する統合処理を行い、
    前記第3の画像要素が前記第1及び第2の画像要素を互いに関連付ける文字の領域である場合には、前記文字によって関連付けられた前記第1及び第2の画像要素を統合する統合処理を行う
    ことを特徴とする画像情報処理方法。
  5. 入力された画像データの中から複数の領域である複数の画像要素の位置、大きさ及び形状を認識するステップと、
    前記複数の画像要素から第1、第2、及び第3の画像要素を抽出し、前記第1及び第2の画像要素を前記第3の画像要素に基づいて互いに関連付ける処理である統合処理を行うステップと、
    をコンピュータに実行させるための画像情報処理プログラムであって、
    前記統合処理を行うステップでは、
    前記第3の画像要素が、前記第1及び第2の画像要素の間に配置され、前記第1の画像要素から前記第2の画像要素を指し示す図形の領域若しくは前記第2の画像要素から前記第1の画像要素を指し示す図形の領域である場合には、前記図形の領域によって指し示し及び指し示される前記第1及び第2の画像要素を統合する統合処理を行い、
    前記第3の画像要素が、前記第1及び第2の画像要素の両方に重なる部分を有するように配置された図形若しくは線分の領域である場合には、前記図形若しくは線分の領域と重なる部分を有する前記第1及び第2の画像要素を統合する統合処理を行い、
    前記第3の画像要素が前記第1及び第2の画像要素を互いに関連付ける文字の領域である場合には、前記文字によって関連付けられた前記第1及び第2の画像要素を統合する統合処理を行う
    ことを特徴とする画像情報処理プログラム。
JP2019505270A 2018-09-14 2018-09-14 画像情報処理装置、画像情報処理方法、及び画像情報処理プログラム Active JP6651675B1 (ja)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
PCT/JP2018/034248 WO2020054067A1 (ja) 2018-09-14 2018-09-14 画像情報処理装置、画像情報処理方法、及び画像情報処理プログラム

Publications (2)

Publication Number Publication Date
JP6651675B1 true JP6651675B1 (ja) 2020-02-19
JPWO2020054067A1 JPWO2020054067A1 (ja) 2020-12-17

Family

ID=69568407

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2019505270A Active JP6651675B1 (ja) 2018-09-14 2018-09-14 画像情報処理装置、画像情報処理方法、及び画像情報処理プログラム

Country Status (4)

Country Link
JP (1) JP6651675B1 (ja)
CN (1) CN112639816A (ja)
TW (1) TWI726268B (ja)
WO (1) WO2020054067A1 (ja)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP7450840B1 (ja) 2022-04-12 2024-03-15 三菱電機株式会社 情報処理装置、処理方法、及び処理プログラム

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2000099735A (ja) * 1998-09-25 2000-04-07 Toshiba Corp パターン認識方法および記憶媒体
JP2004234424A (ja) * 2003-01-31 2004-08-19 Hitachi Ltd 図面認識方法及びその装置
JP2006018509A (ja) * 2004-06-30 2006-01-19 Fuji Xerox Co Ltd 文書管理支援装置

Family Cites Families (19)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3006973B2 (ja) * 1993-05-07 2000-02-07 キヤノン株式会社 画像処理装置及び方法
JP3406942B2 (ja) * 1994-10-18 2003-05-19 キヤノン株式会社 画像処理装置及び方法
JP3881439B2 (ja) * 1998-01-23 2007-02-14 シャープ株式会社 画像処理装置
JP2004259076A (ja) * 2003-02-27 2004-09-16 Hitachi Ltd 画像認識方法及び装置
JP4750802B2 (ja) * 2006-01-13 2011-08-17 富士通株式会社 帳票処理プログラムおよび帳票処理装置
JP4362537B2 (ja) * 2007-06-06 2009-11-11 シャープ株式会社 画像処理装置、画像形成装置、画像送信装置、画像読取装置、画像処理システム、画像処理方法、画像処理プログラムおよびその記録媒体
JP5104528B2 (ja) * 2008-05-07 2012-12-19 富士ゼロックス株式会社 画像処理装置および画像処理プログラム
JP4577419B2 (ja) * 2008-07-10 2010-11-10 富士ゼロックス株式会社 画像処理装置及び画像処理プログラム
JP5434621B2 (ja) * 2010-01-19 2014-03-05 ソニー株式会社 情報処理装置、情報処理方法、及びそのプログラム
JP4904426B1 (ja) * 2010-09-21 2012-03-28 株式会社キングジム 画像処理システムとそれに用いる撮像対象物
JP5153857B2 (ja) * 2010-11-25 2013-02-27 シャープ株式会社 画像処理装置、画像形成装置、画像処理方法、コンピュータプログラム及び記録媒体
JP5699623B2 (ja) * 2011-01-20 2015-04-15 村田機械株式会社 画像処理装置、画像処理システム、画像処理方法、および、プログラム
JP2012194879A (ja) * 2011-03-17 2012-10-11 Pfu Ltd 情報処理装置、情報処理方法及びプログラム
JP5830784B2 (ja) * 2011-06-23 2015-12-09 サイバーアイ・エンタテインメント株式会社 画像認識システムを組込んだ関連性検索によるインタレスト・グラフ収集システム
JP6264965B2 (ja) * 2014-03-14 2018-01-24 オムロン株式会社 画像処理装置、画像処理方法、画像処理プログラム
US10229543B2 (en) * 2014-06-13 2019-03-12 Mitsubishi Electric Corporation Information processing device, information superimposed image display device, non-transitory computer readable medium recorded with marker display program, non-transitory computer readable medium recorded with information superimposed image display program, marker display method, and information-superimposed image display method
JP5955491B2 (ja) * 2014-06-13 2016-07-20 三菱電機株式会社 情報重畳画像表示装置および情報重畳画像表示プログラム
JP2017049911A (ja) * 2015-09-04 2017-03-09 株式会社東芝 文字認識装置、文字認識方法およびプログラム
JP2018097707A (ja) * 2016-12-15 2018-06-21 キヤノン株式会社 情報処理装置、文字認識方法、コンピュータプログラム、及び記憶媒体

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2000099735A (ja) * 1998-09-25 2000-04-07 Toshiba Corp パターン認識方法および記憶媒体
JP2004234424A (ja) * 2003-01-31 2004-08-19 Hitachi Ltd 図面認識方法及びその装置
JP2006018509A (ja) * 2004-06-30 2006-01-19 Fuji Xerox Co Ltd 文書管理支援装置

Also Published As

Publication number Publication date
TW202011230A (zh) 2020-03-16
CN112639816A (zh) 2021-04-09
TWI726268B (zh) 2021-05-01
WO2020054067A1 (ja) 2020-03-19
JPWO2020054067A1 (ja) 2020-12-17

Similar Documents

Publication Publication Date Title
US9007405B1 (en) Column zoom
JP6025522B2 (ja) 画像処理装置、画像処理方法、画像処理システム及びプログラム
CN110210480B (zh) 文字识别方法、装置、电子设备和计算机可读存储介质
CN112100979A (zh) 基于电子书的排版处理方法、电子设备及存储介质
US20130322758A1 (en) Image processing apparatus, image processing method, and program
JP6055065B1 (ja) 文字認識プログラム、文字認識装置
JP6529254B2 (ja) 情報処理装置、情報処理方法、プログラムおよび記憶媒体
JP6651675B1 (ja) 画像情報処理装置、画像情報処理方法、及び画像情報処理プログラム
US20150139547A1 (en) Feature calculation device and method and computer program product
JP2018055256A (ja) 情報処理装置、情報処理方法及びプログラム
JP4867401B2 (ja) 画像処理装置及びプログラム
JP3993025B2 (ja) 文書画像変換方法、文書画像変換プログラム及び文書画像変換装置
JP6364182B2 (ja) 文字列認識装置および文字列認識方法
JP2012022413A (ja) 画像処理装置、画像処理方法、およびプログラム
JP2015176522A (ja) 情報処理装置及び情報処理プログラム
JP2007241370A (ja) 携帯装置及び撮像装置
JP4391157B2 (ja) 文書処理装置、文書処理方法、文書処理プログラム、および記録媒体
JP6950436B2 (ja) 画像キャプチャ用コンピュータプログラム、画像キャプチャ装置及び画像キャプチャ方法
JP2010061449A (ja) 原画像探索装置及び原画像探索プログラム
JP2006106931A (ja) 文字列探索装置、探索方法およびこの方法のプログラム
JP2018159978A (ja) 情報処理装置、方法及びプログラム
JP2005311729A (ja) ファイル名作成装置及びファイル名作成プログラム
JP5277750B2 (ja) 画像処理プログラム、画像処理装置及び画像処理システム
JPWO2017010351A1 (ja) 画像処理装置、画像処理方法、及びプログラム
JP4431335B2 (ja) 文字列読み取りプログラム

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20190131

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20190131

A871 Explanation of circumstances concerning accelerated examination

Free format text: JAPANESE INTERMEDIATE CODE: A871

Effective date: 20190131

A975 Report on accelerated examination

Free format text: JAPANESE INTERMEDIATE CODE: A971005

Effective date: 20190301

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20190312

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20190426

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20190702

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20191008

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20191118

C60 Trial request (containing other claim documents, opposition documents)

Free format text: JAPANESE INTERMEDIATE CODE: C60

Effective date: 20191118

A911 Transfer to examiner for re-examination before appeal (zenchi)

Free format text: JAPANESE INTERMEDIATE CODE: A911

Effective date: 20191126

C21 Notice of transfer of a case for reconsideration by examiners before appeal proceedings

Free format text: JAPANESE INTERMEDIATE CODE: C21

Effective date: 20191203

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20200121

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20200122

R150 Certificate of patent or registration of utility model

Ref document number: 6651675

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250