JP2008022159A5 - - Google Patents
Download PDFInfo
- Publication number
- JP2008022159A5 JP2008022159A5 JP2006190826A JP2006190826A JP2008022159A5 JP 2008022159 A5 JP2008022159 A5 JP 2008022159A5 JP 2006190826 A JP2006190826 A JP 2006190826A JP 2006190826 A JP2006190826 A JP 2006190826A JP 2008022159 A5 JP2008022159 A5 JP 2008022159A5
- Authority
- JP
- Japan
- Prior art keywords
- physical pages
- document processing
- processing apparatus
- extraction
- extracted
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000605 extraction Methods 0.000 claims 16
- 238000004458 analytical method Methods 0.000 claims 5
- 230000001808 coupling Effects 0.000 claims 4
- 238000010168 coupling process Methods 0.000 claims 4
- 238000005859 coupling reaction Methods 0.000 claims 4
- 239000000284 extract Substances 0.000 claims 2
- 238000003672 processing method Methods 0.000 claims 2
- 241001125840 Coryphaenidae Species 0.000 claims 1
Claims (14)
- 文書処理装置であって、
文書画像から複数の物理ページを抽出する第1抽出手段と、
前記第1抽出手段によって抽出された前記複数の物理ページの夫々からオブジェクトを抽出する第2抽出手段と、
前記第2抽出手段によって抽出された少なくとも1つのオブジェクトが前記複数の物理ページにまたがっているか否かを判定する判定手段と、
前記判定手段によって前記複数の物理ページにまたがっていると判定されたオブジェクト同士を結合する結合手段と、
を有することを特徴とする文書処理装置。 - 前記判定手段は、前記複数の物理ページの夫々のレイアウトを解析し、解析した結果に基づいて少なくとも1つのオブジェクトが前記複数の物理ページにまたがっているか否かを判定することを特徴とする請求項1に記載の文書処理装置。
- 前記判定手段は、前記第2抽出手段によって抽出された夫々のオブジェクトの特徴を解析し、当該特徴に基づいて少なくとも1つのオブジェクトが前記複数の物理ページにまたがっているか否かを判定することを特徴とする請求項1に記載の文書処理装置。
- 前記判定手段は、前記第2抽出手段によって抽出された夫々のオブジェクトの有するテキストの特徴を解析し、当該特徴に基づいて少なくとも1つのオブジェクトが前記複数の物理ページにまたがっているか否かを判定することを特徴とする請求項3に記載の文書処理装置。
- 前記判定手段は、前記第2抽出手段によって抽出された夫々のオブジェクトの有する表の特徴を解析し、当該特徴に基づいて少なくとも1つのオブジェクトが前記複数の物理ページにまたがっているか否かを判定することを特徴とする請求項3に記載の文書処理装置。
- 前記判定手段は、前記第2抽出手段によって抽出された夫々のオブジェクトの色や形状の特徴を解析し、当該特徴に基づいて少なくとも1つのオブジェクトが前記複数の物理ページにまたがっているか否かを判定することを特徴とする請求項3に記載の文書処理装置。
- 前記判定手段は、前記第2抽出手段によって抽出された夫々のオブジェクトの位置関係を解析し、当該位置関係に基づいて少なくとも1つのオブジェクトが前記複数の物理ページにまたがっているか否かを判定することを特徴とする請求項2に記載の文書処理装置。
- 前記結合手段は、前記複数の物理ページの位置又は倍率に基づいて、前記判定手段によって前記複数の物理ページにまたがっていると判定されたオブジェクト同士を結合することを特徴とする請求項1乃至7の何れか1項に記載の文書処理装置。
- 前記結合手段は、前記オブジェクトの有するテキストのサイズと位置座標とに応じて、前記判定手段によって前記複数の物理ページにまたがっていると判定されたオブジェクト同士を結合することを特徴とする請求項4に記載の文書処理装置。
- 前記第2抽出手段は夫々のオブジェクトに関するメタデータを抽出し、
前記オブジェクトと前記抽出されたメタデータとを関連付けて格納する格納手段を更に有することを特徴とする請求項1乃至9の何れか一項に記載の文書処理装置。 - 前記第1抽出手段によって抽出された前記複数の物理ページの夫々のレイアウトを解析するレイアウト解析手段と、
前記レイアウト解析手段によって解析されたレイアウトに基づいて前記文書画像の論理構造を解析する論理構造解析手段とを更に有し、
前記第2抽出手段は、前記論理構造解析手段によって解析された論理構造とページ構成に基づいてメタデータを抽出することを特徴とする請求項10に記載の文書処理装置。 - オブジェクトを検索するための検索条件を入力するための検索条件入力手段と、
前記検索条件入力手段によって入力された検索条件に基づいてオブジェクトに関連付けられたメタデータを検索する検索手段とを更に有することを特徴とする請求項11に記載の文書処理装置。 - 文書処理装置の文書処理方法であって、
文書画像から複数の物理ページを抽出する第1抽出工程と、
前記第1抽出工程において抽出された前記複数の物理ページの夫々からオブジェクトを抽出する第2抽出工程と、
前記第2抽出工程において抽出された少なくとも1つのオブジェクトが前記複数の物理ページにまたがっているか否かを判定する判定工程と、
前記判定工程において前記複数の物理ページにまたがっていると判定されたオブジェクト同士を結合する結合工程と、
を有することを特徴とする文書処理方法。 - コンピュータを、請求項1乃至12の何れか1項に記載の文書処理装置の各手段として機能させるためのプログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2006190826A JP4785655B2 (ja) | 2006-07-11 | 2006-07-11 | 文書処理装置及び文書処理方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2006190826A JP4785655B2 (ja) | 2006-07-11 | 2006-07-11 | 文書処理装置及び文書処理方法 |
Publications (3)
Publication Number | Publication Date |
---|---|
JP2008022159A JP2008022159A (ja) | 2008-01-31 |
JP2008022159A5 true JP2008022159A5 (ja) | 2009-08-27 |
JP4785655B2 JP4785655B2 (ja) | 2011-10-05 |
Family
ID=39077810
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2006190826A Expired - Fee Related JP4785655B2 (ja) | 2006-07-11 | 2006-07-11 | 文書処理装置及び文書処理方法 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP4785655B2 (ja) |
Families Citing this family (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP5479049B2 (ja) * | 2009-02-17 | 2014-04-23 | キヤノン株式会社 | 文書処理装置 |
JP2011065295A (ja) * | 2009-09-15 | 2011-03-31 | Ricoh Co Ltd | 画像処理装置、画像処理システムおよび画像処理プログラム |
JP4954316B2 (ja) * | 2010-06-17 | 2012-06-13 | シャープ株式会社 | ドキュメント作成装置、ドキュメント作成方法、ドキュメント作成プログラム及び記録媒体 |
JP5720147B2 (ja) * | 2010-09-02 | 2015-05-20 | 富士ゼロックス株式会社 | 図形領域取得装置及びプログラム |
JP2012194837A (ja) * | 2011-03-17 | 2012-10-11 | Ricoh Co Ltd | 画像処理装置、方法、プログラムおよび記録媒体 |
JP2014011789A (ja) * | 2012-07-03 | 2014-01-20 | Fuji Xerox Co Ltd | 画像形成装置及びプログラム |
JP6318591B2 (ja) * | 2013-12-05 | 2018-05-09 | コニカミノルタ株式会社 | 画像処理装置、画像処理方法および画像処理プログラム |
JP6790712B2 (ja) * | 2016-10-19 | 2020-11-25 | 富士通株式会社 | 形状抽出プログラム、形状抽出方法及び形状抽出装置 |
JP6635057B2 (ja) * | 2017-01-18 | 2020-01-22 | 京セラドキュメントソリューションズ株式会社 | 画像読取装置、画像読取方法、画像形成装置及び画像読取プログラム |
JP2019197345A (ja) * | 2018-05-09 | 2019-11-14 | Concore’S株式会社 | 画像処理装置および画像処理用プログラム |
JP7318319B2 (ja) * | 2019-05-31 | 2023-08-01 | 京セラドキュメントソリューションズ株式会社 | 情報処理装置及び画像形成装置 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2000293671A (ja) * | 1999-04-09 | 2000-10-20 | Canon Inc | 画像処理方法、装置及び記憶媒体 |
-
2006
- 2006-07-11 JP JP2006190826A patent/JP4785655B2/ja not_active Expired - Fee Related
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP2008022159A5 (ja) | ||
CN105580384B (zh) | 触摸屏上显示的可操作内容 | |
CN104685501B (zh) | 响应于可视化查询标识文本词汇 | |
JP2007047943A5 (ja) | ||
JP2007310432A5 (ja) | ||
JP2008287438A5 (ja) | ||
Viitaniemi et al. | S-pot–a benchmark in spotting signs within continuous signing | |
DE112011102383T5 (de) | Berührungsbasierte Gestenerfassung für eine berührungsempfindliche Vorrichtung | |
JP2019507915A5 (ja) | ||
JP2006209542A5 (ja) | ||
JP2012089132A5 (ja) | ||
EP2444920A3 (en) | Detection of duplicate document content using two-dimensional visual fingerprinting | |
JP2007058605A5 (ja) | ||
JP2012230649A5 (ja) | ||
JP2009506394A5 (ja) | ||
JP2019067235A5 (ja) | ||
CN106919593B (zh) | 一种搜索的方法和装置 | |
JP2010286902A5 (ja) | 情報処理装置、情報処理方法、およびプログラム | |
JP2009037558A5 (ja) | ||
CN101673347A (zh) | 一种电子图档拆分方法 | |
JP2016085547A5 (ja) | ||
Suchomel et al. | Diverse queries and feature type selection for plagiarism discovery: Notebook for PAN at CLEF 2013 | |
JP2010073165A5 (ja) | ||
JP2006229874A5 (ja) | ||
JP5826148B2 (ja) | 図面管理サーバ及びこれを用いた図面管理システム |