JP4391157B2 - 文書処理装置、文書処理方法、文書処理プログラム、および記録媒体 - Google Patents
文書処理装置、文書処理方法、文書処理プログラム、および記録媒体 Download PDFInfo
- Publication number
- JP4391157B2 JP4391157B2 JP2003293767A JP2003293767A JP4391157B2 JP 4391157 B2 JP4391157 B2 JP 4391157B2 JP 2003293767 A JP2003293767 A JP 2003293767A JP 2003293767 A JP2003293767 A JP 2003293767A JP 4391157 B2 JP4391157 B2 JP 4391157B2
- Authority
- JP
- Japan
- Prior art keywords
- document
- reference document
- dissimilar
- layout
- documents
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Image Analysis (AREA)
Description
この場合、1つのフォルダに蓄積された画像を表示する際に、類似画像であるために、縮小表示したのでは、各書類相互間で、区別がつかないという問題がある。
本発明の目的は、小さな表示スペースしかなくてもユーザが書類を明確に区別できるようにすることにある。
上記表示手段は、上記基準文書の解像度に比べて、上記非類似個所抽出手段が抽出した、上記基準文書のうちレイアウトが上記参照文書と類似していない個所及び上記参照文書のうち該類似していない個所と対応する個所の解像度を高くするとよい。
上記表示ステップは、上記基準文書の解像度に比べて、上記非類似個所抽出ステップに抽出させた、前記基準文書のうちレイアウトが上記参照文書と類似していない個所及び上記参照文書のうち該類似していない個所と対応する個所の解像度を高くするとよい。
また、コンピュータに、上述の文書処理方法の各ステップを実行させるためのプログラムを記録したコンピュータ読取可能な記録媒体も提供する。
文書分類手段101は、文書保存手段105に保存された複数の文書を呼び出し、全体の類似度に応じて各文書を分類することができる。
基準文書BDは、文字領域a1,a2,a3と線画領域a4とからなる。参照文書RD1は、文字領域b1,b2,b3とからなる。これらの領域は、文書区分手段102が区分することができる。
参照文書RD1を基準文書BDと比較した場合、文字領域b1,b2は文字領域a1,a2と同一位置(または実質同一位置)に配置され、文字領域b3は文字領域a3と線画領域a4の位置に配置されているので、参照文書RD1と基準文書BDとの類似度は高い。
なお、図2では、文書分類手段101は、文字領域と線画領域の2属性に分類したが、文書画像を、文字領域、写真領域、表領域などの属性に分類することもできる。文字領域は、さらにタイトル領域、本文領域、脚注領域などに分類してもよい。たとえば、文字領域a1,b1,c1がタイトル領域、文字領域a2,a3,b2,b3,c2を文書領域として認識することができる。
3A,3B サーバ
4A,4B クライアント
101 文書分類手段
102 文書区分手段
103 非類似個所抽出手段
104,121 非類似個所表示手段
105,123 文書保存手段
106 類似個所抽出手段
107,122 類似個所表示手段
108,124 通信手段
500 ネットワーク
Claims (6)
- 複数の文書のデータを記憶する記憶手段と、
前記記憶手段に記憶されている複数の文書のそれぞれのレイアウトを抽出し当該レイアウトに基づき文書を区分する文書区分手段と、
前記記憶手段に記憶されている前記複数の文書の1つを基準文書とし、該基準文書以外の文書を参照文書とし、前記文書区分手段によって区分された前記基準文書のレイアウトと前記参照文書のレイアウトとを比較して類似していない個所を抽出する非類似個所抽出手段と、
前記非類似個所抽出手段が抽出した、前記基準文書のうちレイアウトが前記参照文書と類似していない個所及び前記参照文書のうち該類似していない個所と対応する個所と、前記基準文書とを同時に表示する表示手段とを備えたことを特徴とする文書処理装置。 - 前記表示手段は、前記基準文書の解像度に比べて、前記非類似個所抽出手段が抽出した、前記基準文書のうちレイアウトが前記参照文書と類似していない個所及び前記参照文書のうち該類似していない個所と対応する個所の解像度を高くしたことを特徴とする請求項1記載の文書処理装置。
- 文書処理装置に、
該文書処理装置が備えた記憶手段に複数の文書のデータを記憶させる記憶ステップと、
前記記憶ステップでデータを記憶させた複数の文書のそれぞれのレイアウトを抽出させ当該レイアウトに基づき文書を区分させる文書区分ステップと、
前記記憶ステップでデータを記憶させた前記複数の文書の1つを基準文書とし、該基準文書以外の文書を参照文書とし、前記文書区分ステップによって区分された前記基準文書のレイアウトと前記参照文書のレイアウトとを比較させて類似していない個所を抽出させる非類似個所抽出ステップと、
前記非類似個所抽出ステップに抽出させた、前記基準文書のうちレイアウトが前記参照文書と類似していない個所及び前記参照文書のうち該類似していない個所と対応する個所と、前記基準文書とを同時に表示させる表示ステップとを実行させることを特徴とする文書処理方法。 - 前記表示ステップは、前記基準文書の解像度に比べて、前記非類似個所抽出ステップに抽出させた、前記基準文書のうちレイアウトが前記参照文書と類似していない個所及び前記参照文書のうち該類似していない個所と対応する個所の解像度を高くしたことを特徴とする請求項3記載の文書処理方法。
- コンピュータに、請求項3または4に記載の文書処理方法の各ステップを実行させるための文書処理プログラム。
- コンピュータに、請求項3または4に記載の文書処理方法の各ステップを実行させるためのプログラムを記録したコンピュータ読取可能な記録媒体。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2003293767A JP4391157B2 (ja) | 2003-08-15 | 2003-08-15 | 文書処理装置、文書処理方法、文書処理プログラム、および記録媒体 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2003293767A JP4391157B2 (ja) | 2003-08-15 | 2003-08-15 | 文書処理装置、文書処理方法、文書処理プログラム、および記録媒体 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2005063220A JP2005063220A (ja) | 2005-03-10 |
JP4391157B2 true JP4391157B2 (ja) | 2009-12-24 |
Family
ID=34370564
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2003293767A Expired - Fee Related JP4391157B2 (ja) | 2003-08-15 | 2003-08-15 | 文書処理装置、文書処理方法、文書処理プログラム、および記録媒体 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP4391157B2 (ja) |
Families Citing this family (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP4951373B2 (ja) | 2007-03-13 | 2012-06-13 | 株式会社リコー | 画像検索装置、画像検索方法、及びコンピュータプログラム |
JP5565130B2 (ja) * | 2010-06-22 | 2014-08-06 | 富士ゼロックス株式会社 | 縮小画像生成装置及びプログラム |
CN108170684B (zh) * | 2018-01-22 | 2020-06-05 | 京东方科技集团股份有限公司 | 文本相似度计算方法及系统、数据查询系统和计算机产品 |
-
2003
- 2003-08-15 JP JP2003293767A patent/JP4391157B2/ja not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
JP2005063220A (ja) | 2005-03-10 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US8244037B2 (en) | Image-based data management method and system | |
US8892990B2 (en) | Automatic creation of a table and query tools | |
US8508756B2 (en) | Image forming apparatus having capability for recognition and extraction of annotations and additionally written portions | |
US20070046982A1 (en) | Triggering actions with captured input in a mixed media environment | |
US20070050341A1 (en) | Triggering applications for distributed action execution and use of mixed media recognition as a control input | |
US20060085442A1 (en) | Document image information management apparatus and document image information management program | |
US9552377B2 (en) | Method for naming image file | |
KR20160060499A (ko) | 화상독취장치 및 그의 제어 방법 | |
JP2006350867A (ja) | 文書処理装置、文書処理方法、プログラム及び情報記録媒体 | |
US8456688B2 (en) | Data generating device, scanner and non-transitory computer readable medium | |
JP2010072842A (ja) | 画像処理装置および画像処理方法 | |
JP2007317034A (ja) | 画像処理装置、画像処理方法、プログラムおよび記録媒体 | |
JP4859054B2 (ja) | 画像処理装置、画像処理方法、プログラムおよび記録媒体 | |
US8023735B2 (en) | Image processing apparatus for extracting representative characteristic from image data and storing image data to be associated with representative characteristic | |
JP2008052496A (ja) | 画像表示装置、画像表示方法、プログラムおよび記録媒体 | |
JP4391157B2 (ja) | 文書処理装置、文書処理方法、文書処理プログラム、および記録媒体 | |
JP4983464B2 (ja) | 帳票画像処理装置及び帳票画像処理プログラム | |
JP4136282B2 (ja) | 画像処理装置及び画像処理方法並びに記憶媒体 | |
WO2018061174A1 (ja) | 電子書籍作成システム、電子書籍作成法及びプログラム | |
JP4278134B2 (ja) | 情報検索装置及びプログラム並びに記録媒体 | |
US8923625B2 (en) | Original image searching device, original image searching method, and computer readable medium | |
JP2004280514A (ja) | Pdfファイル及びpdfファイル作成システム | |
US10896220B2 (en) | Method of searching an image file in a computer system, related image file searching device, and related computer system | |
JP2019192959A (ja) | 情報処理装置及びプログラム | |
US20210289078A1 (en) | Information processing apparatus, method, and non-transitory computer readable medium |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20060419 |
|
RD03 | Notification of appointment of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7423 Effective date: 20090131 |
|
RD04 | Notification of resignation of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7424 Effective date: 20090217 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20090303 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20090424 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20090623 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20090818 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20091006 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20091007 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20121016 Year of fee payment: 3 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20121016 Year of fee payment: 3 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20131016 Year of fee payment: 4 |
|
LAPS | Cancellation because of no payment of annual fees |