JP2008022159A5 - - Google Patents

Download PDF

Info

Publication number
JP2008022159A5
JP2008022159A5 JP2006190826A JP2006190826A JP2008022159A5 JP 2008022159 A5 JP2008022159 A5 JP 2008022159A5 JP 2006190826 A JP2006190826 A JP 2006190826A JP 2006190826 A JP2006190826 A JP 2006190826A JP 2008022159 A5 JP2008022159 A5 JP 2008022159A5
Authority
JP
Japan
Prior art keywords
physical pages
document processing
processing apparatus
extraction
extracted
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2006190826A
Other languages
English (en)
Other versions
JP2008022159A (ja
JP4785655B2 (ja
Filing date
Publication date
Application filed filed Critical
Priority to JP2006190826A priority Critical patent/JP4785655B2/ja
Priority claimed from JP2006190826A external-priority patent/JP4785655B2/ja
Publication of JP2008022159A publication Critical patent/JP2008022159A/ja
Publication of JP2008022159A5 publication Critical patent/JP2008022159A5/ja
Application granted granted Critical
Publication of JP4785655B2 publication Critical patent/JP4785655B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Claims (14)

  1. 文書処理装置であって、
    文書画像から複数の物理ページを抽出する第1抽出手段と、
    前記第1抽出手段によって抽出された前記複数の物理ページの夫々からオブジェクトを抽出する第2抽出手段と、
    前記第2抽出手段によって抽出された少なくとも1つのオブジェクトが前記複数の物理ページにまたがっているか否かを判定する判定手段と、
    前記判定手段によって前記複数の物理ページにまたがっていると判定されたオブジェクト同士を結合する結合手段と、
    を有することを特徴とする文書処理装置。
  2. 前記判定手段は、前記複数の物理ページの夫々のレイアウトを解析し、解析した結果に基づいて少なくとも1つのオブジェクトが前記複数の物理ページにまたがっているか否かを判定することを特徴とする請求項1に記載の文書処理装置。
  3. 前記判定手段は、前記第2抽出手段によって抽出された夫々のオブジェクトの特徴を解析し、当該特徴に基づいて少なくとも1つのオブジェクトが前記複数の物理ページにまたがっているか否かを判定することを特徴とする請求項に記載の文書処理装置。
  4. 前記判定手段は、前記第2抽出手段によって抽出された夫々のオブジェクトの有するテキストの特徴を解析し、当該特徴に基づいて少なくとも1つのオブジェクトが前記複数の物理ページにまたがっているか否かを判定することを特徴とする請求項に記載の文書処理装置。
  5. 前記判定手段は、前記第2抽出手段によって抽出された夫々のオブジェクトの有する表の特徴を解析し、当該特徴に基づいて少なくとも1つのオブジェクトが前記複数の物理ページにまたがっているか否かを判定することを特徴とする請求項に記載の文書処理装置。
  6. 前記判定手段は、前記第2抽出手段によって抽出された夫々のオブジェクトの色や形状の特徴を解析し、当該特徴に基づいて少なくとも1つのオブジェクトが前記複数の物理ページにまたがっているか否かを判定することを特徴とする請求項に記載の文書処理装置。
  7. 前記判定手段は、前記第2抽出手段によって抽出された夫々のオブジェクトの位置関係を解析し、当該位置関係に基づいて少なくとも1つのオブジェクトが前記複数の物理ページにまたがっているか否かを判定することを特徴とする請求項に記載の文書処理装置。
  8. 前記結合手段は、前記複数の物理ページの位置又は倍率に基づいて、前記判定手段によって前記複数の物理ページにまたがっていると判定されたオブジェクト同士を結合することを特徴とする請求項1乃至7の何れか1項に記載の文書処理装置。
  9. 前記結合手段は、前記オブジェクトの有するテキストのサイズと位置座標とに応じて、前記判定手段によって前記複数の物理ページにまたがっていると判定されたオブジェクト同士を結合することを特徴とする請求項に記載の文書処理装置。
  10. 前記第2抽出手段は夫々のオブジェクトに関するメタデータを抽出し、
    前記オブジェクトと前記抽出されたメタデータとを関連付けて格納する格納手段を更に有することを特徴とする請求項1乃至9の何れか一項に記載の文書処理装置。
  11. 前記第1抽出手段によって抽出された前記複数の物理ページの夫々のレイアウトを解析するレイアウト解析手段と、
    前記レイアウト解析手段によって解析されたレイアウトに基づいて前記文書画像の論理構造を解析する論理構造解析手段とを更に有し、
    前記第2抽出手段は、前記論理構造解析手段によって解析された論理構造とページ構成に基づいてメタデータを抽出することを特徴とする請求項10に記載の文書処理装置。
  12. オブジェクトを検索するための検索条件を入力するための検索条件入力手段と、
    前記検索条件入力手段によって入力された検索条件に基づいてオブジェクトに関連付けられたメタデータを検索する検索手段とを更に有することを特徴とする請求項11に記載の文書処理装置。
  13. 文書処理装置の文書処理方法であって、
    文書画像から複数の物理ページを抽出する第1抽出工程と、
    前記第1抽出工程において抽出された前記複数の物理ページの夫々からオブジェクトを抽出する第2抽出工程と、
    前記第2抽出工程において抽出された少なくとも1つのオブジェクトが前記複数の物理ページにまたがっているか否かを判定する判定工程と、
    前記判定工程において前記複数の物理ページにまたがっていると判定されたオブジェクト同士を結合する結合工程と、
    を有することを特徴とする文書処理方法。
  14. コンピュータを、請求項1乃至12の何れか1項に記載の文書処理装置の各手段として機能させるためのプログラム。
JP2006190826A 2006-07-11 2006-07-11 文書処理装置及び文書処理方法 Expired - Fee Related JP4785655B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2006190826A JP4785655B2 (ja) 2006-07-11 2006-07-11 文書処理装置及び文書処理方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2006190826A JP4785655B2 (ja) 2006-07-11 2006-07-11 文書処理装置及び文書処理方法

Publications (3)

Publication Number Publication Date
JP2008022159A JP2008022159A (ja) 2008-01-31
JP2008022159A5 true JP2008022159A5 (ja) 2009-08-27
JP4785655B2 JP4785655B2 (ja) 2011-10-05

Family

ID=39077810

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2006190826A Expired - Fee Related JP4785655B2 (ja) 2006-07-11 2006-07-11 文書処理装置及び文書処理方法

Country Status (1)

Country Link
JP (1) JP4785655B2 (ja)

Families Citing this family (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP5479049B2 (ja) * 2009-02-17 2014-04-23 キヤノン株式会社 文書処理装置
JP2011065295A (ja) * 2009-09-15 2011-03-31 Ricoh Co Ltd 画像処理装置、画像処理システムおよび画像処理プログラム
JP4954316B2 (ja) * 2010-06-17 2012-06-13 シャープ株式会社 ドキュメント作成装置、ドキュメント作成方法、ドキュメント作成プログラム及び記録媒体
JP5720147B2 (ja) * 2010-09-02 2015-05-20 富士ゼロックス株式会社 図形領域取得装置及びプログラム
JP2012194837A (ja) * 2011-03-17 2012-10-11 Ricoh Co Ltd 画像処理装置、方法、プログラムおよび記録媒体
JP2014011789A (ja) * 2012-07-03 2014-01-20 Fuji Xerox Co Ltd 画像形成装置及びプログラム
JP6318591B2 (ja) * 2013-12-05 2018-05-09 コニカミノルタ株式会社 画像処理装置、画像処理方法および画像処理プログラム
JP6790712B2 (ja) * 2016-10-19 2020-11-25 富士通株式会社 形状抽出プログラム、形状抽出方法及び形状抽出装置
JP6635057B2 (ja) * 2017-01-18 2020-01-22 京セラドキュメントソリューションズ株式会社 画像読取装置、画像読取方法、画像形成装置及び画像読取プログラム
JP2019197345A (ja) * 2018-05-09 2019-11-14 Concore’S株式会社 画像処理装置および画像処理用プログラム
JP7318319B2 (ja) * 2019-05-31 2023-08-01 京セラドキュメントソリューションズ株式会社 情報処理装置及び画像形成装置

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2000293671A (ja) * 1999-04-09 2000-10-20 Canon Inc 画像処理方法、装置及び記憶媒体

Similar Documents

Publication Publication Date Title
JP2008022159A5 (ja)
CN105580384B (zh) 触摸屏上显示的可操作内容
CN104685501B (zh) 响应于可视化查询标识文本词汇
JP2007047943A5 (ja)
JP2007310432A5 (ja)
JP2008287438A5 (ja)
Viitaniemi et al. S-pot–a benchmark in spotting signs within continuous signing
DE112011102383T5 (de) Berührungsbasierte Gestenerfassung für eine berührungsempfindliche Vorrichtung
JP2019507915A5 (ja)
JP2006209542A5 (ja)
JP2012089132A5 (ja)
EP2444920A3 (en) Detection of duplicate document content using two-dimensional visual fingerprinting
JP2007058605A5 (ja)
JP2012230649A5 (ja)
JP2009506394A5 (ja)
JP2019067235A5 (ja)
CN106919593B (zh) 一种搜索的方法和装置
JP2010286902A5 (ja) 情報処理装置、情報処理方法、およびプログラム
JP2009037558A5 (ja)
CN101673347A (zh) 一种电子图档拆分方法
JP2016085547A5 (ja)
Suchomel et al. Diverse queries and feature type selection for plagiarism discovery: Notebook for PAN at CLEF 2013
JP2010073165A5 (ja)
JP2006229874A5 (ja)
JP5826148B2 (ja) 図面管理サーバ及びこれを用いた図面管理システム