JP5249387B2 - 画像処理装置、画像処理方法、及びプログラム - Google Patents
画像処理装置、画像処理方法、及びプログラム Download PDFInfo
- Publication number
- JP5249387B2 JP5249387B2 JP2011129548A JP2011129548A JP5249387B2 JP 5249387 B2 JP5249387 B2 JP 5249387B2 JP 2011129548 A JP2011129548 A JP 2011129548A JP 2011129548 A JP2011129548 A JP 2011129548A JP 5249387 B2 JP5249387 B2 JP 5249387B2
- Authority
- JP
- Japan
- Prior art keywords
- area
- unit
- information
- link
- character information
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/40—Document-oriented image-based pattern recognition
- G06V30/41—Analysis of document content
- G06V30/416—Extracting the logical structure, e.g. chapters, sections or page numbers; Identifying elements of the document, e.g. authors
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/40—Document-oriented image-based pattern recognition
- G06V30/42—Document-oriented image-based pattern recognition based on the type of document
- G06V30/422—Technical drawings; Geographical maps
Description
[システム構成]
以下、本発明を実施するための形態について図面を用いて説明する。図2は本実施形態の画像処理システムの構成を示すブロック図である。図2において、オフィスA内に構築されたLAN202には、複数種類の機能(複写機能、印刷機能、送信機能等)を実現する複合機であるMFP(Multi Function Peripheral)200が接続されている。LAN202は、プロキシサーバ203を介して外部のネットワーク204にも接続されている。情報処理装置であるクライアントPC201はLAN202を介してMFP200からの送信データを受信したり、MFP200が有する機能を利用したりする。例えば、クライアントPC201は、印刷データをMFP200へ送信することで、その印刷データに基づく印刷物をMFP200で印刷することもできる。尚、図2の構成は一例であり、オフィスAと同様の構成要素を有する、複数のオフィスがネットワーク204上に接続されていても良い。
図3は本実施形態の画像処理装置であるMFP200の詳細構成を示す図である。図3において、MFP200は、画像入力デバイスであるスキャナ部301と、画像出力デバイスであるプリンタ部302と、CPU305等で構成される制御ユニット304と、ユーザインタフェースである操作部303等を有する。制御ユニット304は、スキャナ部301、プリンタ部302、操作部303と接続し、一方では、LAN319や一般の電話回線網である公衆回線(WAN)320と接続することで、画像情報やデバイス情報の入出力を行うコントローラである。
次に、図4を用いて、図3のデータ処理部318の詳細説明を行う。データ処理部318は、領域分割部401、属性情報付加部402、文字認識部403、リンク処理部404、フォーマット変換部405から構成される。データ処理部318は、スキャナ部301でスキャンしたイメージデータ400が入力されてくると、各処理部401〜405で処理を行うことにより、電子文書データ410を生成して出力する。
ここで生成される電子文書データ410の例を図7に示す。図7の例では、図6(a)のイメージデータ600の例を処理した場合に、図3の記憶部311に保存された図6(b)のようなデータ(領域情報)に基づいて、SVG(Scalable Vector Graphics)フォーマットで記述を行った場合の例を示す。図7の記述701〜706は、それぞれ図6(a)の領域601〜606に対するグラフィックス記述である。ここで、記述701、704、705、および706は文字コードによる文字描画記述の例である。記述702は、領域602に対するベクトル変換された表の枠のベクトルパス記述(本説明では重要でないので省略表現になっている)、記述703は切り出し処理された写真画像を貼り付ける記述の例である。記述701〜707は1ページ内の記述であり、記述711と記述712で、個々のページに分けて記述を行う。また、この電子文書全体に対する記述が記述713から記述717まで続くが、こちらは、グラフィックスの記述ではない。
図5はリンク処理部404の構成例を示すブロック図である。以下、リンク処理部404に含まれる各構成要素の処理内容について説明する。リンク情報付与対象選択部501は入力されたイメージデータに対して、リンク情報生成を行う対象として、キャプション付随オブジェクト(図や写真などの領域)と、当該キャプション付随オブジェクトに対応付けされた『キャプション』領域の文字情報とを選択する。
次に、本実施形態の画像処理システムで実行する処理全体の概要を、図8のフローチャートを用いて説明する。図8及び図10に示すフローチャートは、図3のデータ処理部318(図4の各処理部401〜405)によって実行される。なお、本実施形態では、図3のCPU305が記憶部311(コンピュータ読取可能な記憶媒体)に格納されたコンピュータプログラムを読み取り実行することにより、データ処理部318(図4の各処理部401〜405)として機能するものとする。しかし、これに限るものではない。例えば、図3のデータ処理部318(図4の各処理部401〜405)を、電子回路等のハードウェアで実現するように構成してもよい。
次に、図8におけるS805の処理の詳細について、図10(a)を用いて説明する。本処理は、リンク処理部404内の各部分において行われる処理であり、リンクの生成のために必要なアンカー表現と当該アンカー表現に対応するオブジェクトとの対応関係の情報を抽出できるように、蓄積する。この処理の中で、図8のS802からS804処理で得られた解析結果を、記憶容量を節約しながら蓄積を行っている。これが、本発明の特徴(ポイント)の1つとなっている。
次に、図8におけるS808の処理の詳細について、図10(b)を用いて説明する。ここでの処理は、リンク処理部404内の各部分において行われる処理である。リンクの生成に必要となるリンク情報を抽出して、リンクを生成するためのプログラム・モジュールの作成と、プログラム・モジュールにて利用される情報の作成とを行う。この処理の中で、図8のS805における記憶容量を削減しながら蓄積された情報は、ここでの処理が容易な構成になっている。この蓄積された情報を利用しながら全ページに対する処理を一括して効率よく行う点が、本発明の特徴(ポイント)の1つである。電子文書データの利用時にコンピュータが実行するプログラム・モジュールにおける処理効率を考慮し、文字認識の曖昧検索などの、比較的処理負担の大きな処理を、S808にて行う点が特徴である。
次に、図14(a)に示された処理フローを、図13に示した具体的なプログラム・モジュールと併せて説明する。図13は、図10(b)で示した処理の中で生成されて電子文書データに格納されるプログラム・モジュールの例である。また、図12(c)に示すリンク生成用情報をリンク情報テーブルとして、電子文書データに格納してあることを前提とする。なお、図14(a)の処理は、生成された電子文書データを読み込み、表示させる際の動作であり、電子文書表示装置のCPU305が該プログラム・モジュールを読み出し、実行することにより実現される。S1401(記述1301が該当)において、図12(c)のリンク情報テーブルを読み込み、これを利用可能とする。S1402において、そのリンク情報テーブル内の行数を数えて(記述1302が該当)、S1403の条件分岐とループ処理構造で、その全行に対して以下の処理を行うようにしている(記述1303が該当)。全行に対して処理が完了した場合(S1403にてNO)、この図14(a)の処理は終了となる。
図15は、図13及び図14(a)を用いて説明した処理を適用することにより生成されたデータの一部である。図15(a)は、イメージデータ902に対して作成されたリンクの記述例であり、図15(b)は、イメージデータ901に対して作成されたリンクの記述例である。また、図15(c)、(d)は上記処理により新たにページ描画データの記述に追加される関数である。
第一の実施形態における動作説明は、ページ単位における処理時の文字の位置情報に対し、所定の集合単位として段落単位とした。これにより、情報を削減し記憶容量の削減を行っていた。また、段落以外に、行や文単位での削減が示されていた。
また、本発明は、以下の処理を実行することによっても実現される。即ち、上述した実施形態の機能を実現するソフトウェア(プログラム)を、ネットワーク又は各種記憶媒体を介してシステム或いは装置に供給し、そのシステム或いは装置のコンピュータ(またはCPUやMPU等)がプログラムを読み出して実行する処理である。
Claims (6)
- 複数ページからなる文書画像のうちの処理対象ページの文書画像を、本文領域と、キャプション領域と、該キャプション領域が付随するオブジェクト領域とに分割する領域分割手段と、
前記領域分割手段により分割された前記本文領域と前記キャプション領域とのそれぞれに含まれる文字情報を取得する文字情報取得手段と、
前記本文領域から取得した文字情報を、所定の集合単位で分割し、当該分割した集合単位の文字情報と位置情報とをメモリに蓄積する蓄積手段と、
前記処理対象ページの文書画像のページ描画データを生成して出力するページ描画データ生成手段と、
前記複数ページからなる文書画像をページ毎に順番に前記処理対象ページとして、前記領域分割手段と前記文字情報取得手段と前記蓄積手段と前記ページ描画データ生成手段とによる処理を繰り返し実行する繰り返し手段と、
前記繰り返し手段によって前記領域分割手段と前記文字情報取得手段と前記蓄積手段と前記ページ描画データ生成手段とによる処理が前記複数ページからなる文書画像全てに対して繰り返し実行された後、前記キャプション領域から取得した文字情報からアンカー表現を抽出するアンカー表現抽出手段と、
前記メモリに前記集合単位で蓄積されている文字情報に基づいて、前記アンカー表現抽出手段で抽出されたアンカー表現を含む集合単位を検索するアンカー表現検索手段と、
前記アンカー表現検索手段で検索された集合単位と、当該アンカー表現を含むキャプション領域が付随するオブジェクト領域とを関連づけたリンク生成用情報を生成するリンク情報生成手段と、
前記リンク生成用情報に基づいて、前記オブジェクト領域と前記集合単位に含まれるアンカー表現との間のリンク機能を表現する記述を生成させるためのプログラムコードと、前記ページ描画データ生成手段で出力されたページ描画データとを含む電子文書データを生成する電子文書データ生成手段と
を有し、
前記電子文書データに含まれるプログラムコードは、該電子文書データが利用される際に動作することにより、前記オブジェクト領域と前記集合単位に含まれるアンカー表現との間のリンク機能を表現する記述を動的に生成することを特徴とする画像処理装置。 - 前記アンカー表現検索手段は、更に、前記アンカー表現抽出手段で抽出されたアンカー表現の曖昧パターンを含む集合単位も検索することを特徴とする請求項1に記載の画像処理装置。
- 前記オブジェクト領域は、図、写真、表の少なくともいずれかの属性を有する領域であることを特徴とする請求項1または2に記載の画像処理装置。
- 前記蓄積手段は、前記本文領域から取得した文字情報を、前記文書画像に含まれる文字の量に応じた集合単位で分割し、当該分割した集合単位の文字情報と位置情報とをメモリに蓄積することを特徴とする請求項1乃至3のいずれか一項に記載の画像処理装置。
- 領域分割手段が、複数ページからなる文書画像のうちの処理対象ページの文書画像を、本文領域と、キャプション領域と、該キャプション領域が付随するオブジェクト領域とに分割する領域分割工程と、
文字情報取得手段が、前記領域分割工程にて分割された前記本文領域と前記キャプション領域とのそれぞれに含まれる文字情報を取得する文字情報取得工程と、
蓄積手段が、前記本文領域から取得した文字情報を、所定の集合単位で分割し、当該分割した集合単位の文字情報と位置情報とをメモリに蓄積する蓄積工程と、
ページ描画データ生成手段が、前記処理対象ページの文書画像のページ描画データを生成して出力するページ描画データ生成工程と、
繰り返し手段が、前記複数ページからなる文書画像をページ毎に順番に前記処理対象ページとして、前記領域分割工程と前記文字情報取得工程と前記蓄積工程と前記ページ描画データ生成工程とによる処理を繰り返し実行する繰り返し工程と、
アンカー表現抽出手段が、前記繰り返し工程にて前記領域分割工程と前記文字情報取得工程と前記蓄積工程と前記ページ描画データ生成工程とによる処理が前記複数ページからなる文書画像全てに対して繰り返し実行された後、前記キャプション領域から取得した文字情報からアンカー表現を抽出するアンカー表現抽出工程と、
アンカー表現検索手段が、前記メモリに前記集合単位で蓄積されている文字情報に基づいて、前記アンカー表現抽出工程にて抽出されたアンカー表現を含む集合単位を検索するアンカー表現検索工程と、
リンク情報生成手段が、前記アンカー表現検索工程にて検索された集合単位と、当該アンカー表現を含むキャプション領域が付随するオブジェクト領域とを関連づけたリンク生成用情報を生成するリンク情報生成工程と、
電子文書データ生成手段が、前記リンク生成用情報に基づいて、前記オブジェクト領域と前記集合単位に含まれるアンカー表現との間のリンク機能を表現する記述を生成させるためのプログラムコードと、前記ページ描画データ生成工程にて出力されたページ描画データと、を含む電子文書データを生成する電子文書データ生成工程と、
を有し、
前記電子文書データに含まれるプログラムコードは、該電子文書データが利用される際に動作することにより、前記オブジェクト領域と前記集合単位に含まれるアンカー表現との間のリンク機能を表現する記述を動的に生成することを特徴とする画像処理方法。 - コンピュータを、
複数ページからなる文書画像のうちの処理対象ページの文書画像を、本文領域と、キャプション領域と、該キャプション領域が付随するオブジェクト領域とに分割する領域分割手段、
前記領域分割手段により分割された前記本文領域と前記キャプション領域とのそれぞれに含まれる文字情報を取得する文字情報取得手段、
前記本文領域から取得した文字情報を、所定の集合単位で分割し、当該分割した集合単位の文字情報と位置情報とをメモリに蓄積する蓄積手段、
前記処理対象ページの文書画像のページ描画データを生成して出力するページ描画データ生成手段、
前記複数ページからなる文書画像をページ毎に順番に前記処理対象ページとして、前記領域分割手段と前記文字情報取得手段と前記蓄積手段と前記ページ描画データ生成手段とによる処理を繰り返し実行する繰り返し手段、
前記繰り返し手段によって前記領域分割手段と前記文字情報取得手段と前記蓄積手段と前記ページ描画データ生成手段とによる処理が前記複数ページからなる文書画像全てに対して繰り返し実行された後、前記キャプション領域から取得した文字情報からアンカー表現を抽出するアンカー表現抽出手段、
前記メモリに前記集合単位で蓄積されている文字情報に基づいて、前記アンカー表現抽出手段で抽出されたアンカー表現を含む集合単位を検索するアンカー表現検索手段、
前記アンカー表現検索手段により検索された集合単位と、当該アンカー表現を含むキャプション領域が付随するオブジェクト領域とを関連づけたリンク生成用情報を生成するリンク情報生成手段、
前記リンク生成用情報に基づいて、前記オブジェクト領域と前記集合単位に含まれるアンカー表現との間のリンク機能を表現する記述を生成させるためのプログラムコードと、前記ページ描画データ生成手段で出力されたページ描画データとを含む電子文書データを生成する電子文書データ生成手段
として機能させ、
前記電子文書データに含まれるプログラムコードは、該電子文書データが利用される際に動作することにより、前記オブジェクト領域と前記集合単位に含まれるアンカー表現との間のリンク機能を表現する記述を動的に生成することを特徴とするプログラム。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2011129548A JP5249387B2 (ja) | 2010-07-06 | 2011-06-09 | 画像処理装置、画像処理方法、及びプログラム |
US13/172,125 US8514462B2 (en) | 2010-07-06 | 2011-06-29 | Processing document image including caption region |
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2010154360 | 2010-07-06 | ||
JP2010154360 | 2010-07-06 | ||
JP2011129548A JP5249387B2 (ja) | 2010-07-06 | 2011-06-09 | 画像処理装置、画像処理方法、及びプログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2012033151A JP2012033151A (ja) | 2012-02-16 |
JP5249387B2 true JP5249387B2 (ja) | 2013-07-31 |
Family
ID=45438376
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2011129548A Active JP5249387B2 (ja) | 2010-07-06 | 2011-06-09 | 画像処理装置、画像処理方法、及びプログラム |
Country Status (2)
Country | Link |
---|---|
US (1) | US8514462B2 (ja) |
JP (1) | JP5249387B2 (ja) |
Families Citing this family (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP5676942B2 (ja) * | 2010-07-06 | 2015-02-25 | キヤノン株式会社 | 画像処理装置、画像処理方法、及びプログラム |
JP5285727B2 (ja) * | 2011-02-22 | 2013-09-11 | シャープ株式会社 | 画像形成装置、および、画像形成方法 |
JP5578188B2 (ja) * | 2012-02-17 | 2014-08-27 | コニカミノルタ株式会社 | 画像処理装置、画像処理装置の制御方法、および、プログラム |
JP6379813B2 (ja) * | 2013-08-23 | 2018-08-29 | 株式会社リコー | 情報処理システム、方法、情報処理装置およびプログラム |
JP5875637B2 (ja) * | 2013-12-19 | 2016-03-02 | キヤノン株式会社 | 画像処理装置、画像処理方法 |
US9965695B1 (en) * | 2016-12-30 | 2018-05-08 | Konica Minolta Laboratory U.S.A., Inc. | Document image binarization method based on content type separation |
US10356318B1 (en) * | 2017-04-27 | 2019-07-16 | Intuit, Inc. | Long document capture on mobile devices |
CN110321470A (zh) * | 2019-05-23 | 2019-10-11 | 平安科技(深圳)有限公司 | 文档处理方法、装置、计算机设备和存储介质 |
Family Cites Families (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH10228473A (ja) | 1997-02-13 | 1998-08-25 | Ricoh Co Ltd | 文書画像処理方法、文書画像処理装置および記憶媒体 |
JP3694149B2 (ja) | 1997-07-07 | 2005-09-14 | 株式会社リコー | 画像検索装置、画像検索用キーテキストの生成方法、並びにその装置としてコンピュータを機能させるためのプログラムおよびその方法をコンピュータに実行させるためのプログラムを記録したコンピュータ読み取り可能な記録媒体 |
EP0908848B1 (en) * | 1997-10-13 | 2006-07-19 | Matsushita Electric Industrial Co., Ltd. | A fuzzy inference method and machine |
JP4235286B2 (ja) | 1998-09-11 | 2009-03-11 | キヤノン株式会社 | 表認識方法及び装置 |
EP1052593B1 (en) | 1999-05-13 | 2015-07-15 | Canon Kabushiki Kaisha | Form search apparatus and method |
JP4266784B2 (ja) | 2003-11-14 | 2009-05-20 | キヤノン株式会社 | 画像処理システム及び画像処理方法 |
JP2006085234A (ja) * | 2004-09-14 | 2006-03-30 | Fuji Xerox Co Ltd | 電子文書作成装置、電子文書作成方法及び電子文書作成プログラム |
JP4590433B2 (ja) | 2007-06-29 | 2010-12-01 | キヤノン株式会社 | 画像処理装置、画像処理方法、コンピュータプログラム |
JP5376795B2 (ja) | 2007-12-12 | 2013-12-25 | キヤノン株式会社 | 画像処理装置、画像処理方法、そのプログラム及び記憶媒体 |
JP5111268B2 (ja) | 2008-07-09 | 2013-01-09 | キヤノン株式会社 | 画像処理装置、画像処理方法、そのプログラムおよび記憶媒体 |
JP5230525B2 (ja) | 2009-05-25 | 2013-07-10 | キヤノン株式会社 | 画像検索装置およびその方法 |
JP5290867B2 (ja) | 2009-05-25 | 2013-09-18 | キヤノン株式会社 | 画像検索装置およびその方法 |
-
2011
- 2011-06-09 JP JP2011129548A patent/JP5249387B2/ja active Active
- 2011-06-29 US US13/172,125 patent/US8514462B2/en not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
US20120008174A1 (en) | 2012-01-12 |
JP2012033151A (ja) | 2012-02-16 |
US8514462B2 (en) | 2013-08-20 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5733907B2 (ja) | 画像処理装置、画像処理方法、コンピュータプログラム | |
JP5249387B2 (ja) | 画像処理装置、画像処理方法、及びプログラム | |
JP5274305B2 (ja) | 画像処理装置、画像処理方法、コンピュータプログラム | |
JP5528121B2 (ja) | 画像処理装置、画像処理方法、及びプログラム | |
JP5743443B2 (ja) | 画像処理装置、画像処理方法、コンピュータプログラム | |
JP5511450B2 (ja) | 画像処理装置、画像処理方法及びプログラム | |
US8548240B2 (en) | Image processing apparatus, image processing method, and computer readable medium | |
US8965125B2 (en) | Image processing device, method and storage medium for storing and displaying an electronic document | |
US20120082388A1 (en) | Image processing apparatus, image processing method, and computer program | |
JP4785655B2 (ja) | 文書処理装置及び文書処理方法 | |
JP2010020468A (ja) | 画像処理装置、画像処理方法、そのプログラムおよび記憶媒体 | |
US20070116363A1 (en) | Image processing device, image processing method, and storage medium storing image processing program | |
US11146705B2 (en) | Character recognition device, method of generating document file, and storage medium | |
US8181108B2 (en) | Device for editing metadata of divided object | |
JP2013152564A (ja) | 文書処理装置及び文書処理方法 | |
CN112114803A (zh) | 基于深度学习的ui界面的前端代码生成方法、设备及介质 | |
JP5500994B2 (ja) | 画像処理装置、画像処理方法、プログラム | |
JP2009140478A (ja) | 画像処理装置及び画像処理方法 | |
JP2021056796A (ja) | 構造認識システム、構造認識装置、構造認識方法、及びプログラム | |
JP2017156982A (ja) | 画像変換プログラム及び画像変換装置並びに画像変換方法 | |
JP2013131942A (ja) | 画像処理装置 | |
JP2007299321A (ja) | 情報処理装置、情報処理方法、情報処理プログラム、及び、情報記憶媒体 | |
JP2007087197A (ja) | 文書処理装置、文書処理方法およびプログラム | |
CN115131794A (zh) | 信息处理装置、记录介质及信息处理方法 | |
JP2004287992A (ja) | 文書情報処理装置並びにプログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20121225 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20130225 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20130315 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20130411 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20160419 Year of fee payment: 3 |