JP2003141447A5 - - Google Patents
Download PDFInfo
- Publication number
- JP2003141447A5 JP2003141447A5 JP2001340606A JP2001340606A JP2003141447A5 JP 2003141447 A5 JP2003141447 A5 JP 2003141447A5 JP 2001340606 A JP2001340606 A JP 2001340606A JP 2001340606 A JP2001340606 A JP 2001340606A JP 2003141447 A5 JP2003141447 A5 JP 2003141447A5
- Authority
- JP
- Japan
- Prior art keywords
- similarity
- format data
- page format
- search
- unit
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Claims (4)
- 帳票を画像データとして読み取る画像入力手段と、該画像入力手段手段で読み取った画像の特徴量に基づいて当該画像をテキスト部分とテーブル部分とを含む複数の部分に分割する分割手段と、該分割手段で分割されたテキスト部分の文字を認識する文字認識手段と、前記分割手段で分割されたテーブル部分のテーブル構造を識別する識別手段と、該識別手段で識別されたテーブル構造と、前記文字認識手段により認識された文字とを含む情報をページ書式データとして階層化データ構造に整形ページ書式データ作成手段と、該ページ書式データ作成手段によりテンプレート帳票から作成されたページ書式データを保存する保存手段と、ページ書式データ間の類似度を計算する類似度計算手段とを備え、前記ページ書式データ作成手段により検索帳票から作成されたページ書式データと、前記保存手段に保存されたテンプレート帳票のページ書式データとの類似度を前記類似度計算手段により計算し、類似度が閾値以上となるテンプレート帳票を検索する検索手段と、新規の登録帳票のページ書式データを前記保存手段に登録しようとする際に、前記ページ書式データ作成手段により当該登録帳票から作成されたページ書式データと、前記保存手段に保存されたページ書式データとの類似度を前記類似度計算手段により計算し、当該類似度により一致する帳票が既に保存されている場合に当該登録帳票の登録を禁止する重複登録防止手段とを有することを特徴とする帳票検索システム。
- 前記新規の登録帳票のページ書式データを登録する際に、計算した類似度を使用して類似度の高い帳票と関係づけるインデックスを作成するインデックス作成手段を有することを特徴とする請求項1記載の帳票検索システム。
- 前記インデックス作成手段により作成したインデックスを使用して、検索帳票と比較対象となるテンプレート帳票を絞り込む絞り込み手段を備え、前記検索手段は、当該絞り込み手段で絞り込まれたテンプレート帳票を対象として、前記類似度計算手段による類似度の計算を実行することを特徴とする請求項2記載の帳票検索システム。
- 前記重複登録防止手段は、登録帳票とテーブル数又はセル数の類似するテンプレート帳票を対象として、前記類似度計算手段による類似度の計算を実行することを特徴とする請求項1記載の帳票検索システム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2001340606A JP4065484B2 (ja) | 2001-11-06 | 2001-11-06 | 帳票検索システム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2001340606A JP4065484B2 (ja) | 2001-11-06 | 2001-11-06 | 帳票検索システム |
Publications (3)
Publication Number | Publication Date |
---|---|
JP2003141447A JP2003141447A (ja) | 2003-05-16 |
JP2003141447A5 true JP2003141447A5 (ja) | 2005-08-18 |
JP4065484B2 JP4065484B2 (ja) | 2008-03-26 |
Family
ID=19154780
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2001340606A Expired - Fee Related JP4065484B2 (ja) | 2001-11-06 | 2001-11-06 | 帳票検索システム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP4065484B2 (ja) |
Families Citing this family (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102831127B (zh) * | 2011-06-17 | 2015-04-22 | 阿里巴巴集团控股有限公司 | 重复数据处理方法、装置及系统 |
CN105095842B (zh) * | 2014-05-22 | 2018-12-11 | 口碑控股有限公司 | 一种单据的信息识别的方法和装置 |
CN105608452A (zh) * | 2014-11-11 | 2016-05-25 | 金蝶软件(中国)有限公司 | 单据录入的方法和系统 |
JP6317280B2 (ja) * | 2015-02-20 | 2018-04-25 | 日本電信電話株式会社 | 同種帳票ファイル選定装置、同種帳票ファイル選定方法、および、同種帳票ファイル選定プログラム |
JP7069759B2 (ja) * | 2018-01-31 | 2022-05-18 | 日本電気株式会社 | 帳票作成支援装置、帳票作成支援方法、及び、帳票作成支援プログラム |
CN109829143B (zh) * | 2018-12-28 | 2023-06-20 | 陈德芹 | 一种在线表格汇总方法及装置 |
Family Cites Families (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH0728935A (ja) * | 1993-07-07 | 1995-01-31 | Oki Electric Ind Co Ltd | 文書画像処理装置 |
JP3484446B2 (ja) * | 1996-11-15 | 2004-01-06 | シャープ株式会社 | 光学文字認識装置 |
EP1052593B1 (en) * | 1999-05-13 | 2015-07-15 | Canon Kabushiki Kaisha | Form search apparatus and method |
-
2001
- 2001-11-06 JP JP2001340606A patent/JP4065484B2/ja not_active Expired - Fee Related
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Almazán et al. | Word spotting and recognition with embedded attributes | |
Fischer et al. | Lexicon-free handwritten word spotting using character HMMs | |
EP2015228B1 (en) | Retrieving electronic documents by converting them to synthetic text | |
Qian et al. | Enhancing sketch-based image retrieval by re-ranking and relevance feedback | |
Jain et al. | Logo retrieval in document images | |
Ahmed et al. | A survey on handwritten documents word spotting | |
KR870011552A (ko) | 문서 등록 방식 | |
Liu et al. | An image-based near-duplicate video retrieval and localization using improved edit distance | |
Marinai et al. | Font adaptive word indexing of modern printed documents | |
Ghosh et al. | Query by string word spotting based on character bi-gram indexing | |
CN102937994A (zh) | 一种基于停用词的相似文档查询方法 | |
Halder et al. | Offline writer identification and verification—A state-of-the-art | |
Sfikas et al. | Using attributes for word spotting and recognition in polytonic greek documents | |
JP2009506394A5 (ja) | ||
Bhunia et al. | Zone-based keyword spotting in Bangla and Devanagari documents | |
Cheddad et al. | SHIBR—The Swedish historical birth records: A semi-annotated dataset | |
Davila et al. | Tangent-V: Math formula image search using line-of-sight graphs | |
JP2003141447A5 (ja) | ||
Rusinol et al. | Word and symbol spotting using spatial organization of local descriptors | |
Pinchak et al. | A probabilistic answer type model | |
Rusiñol et al. | Symbol Spotting in Digital Libraries | |
Aouadi et al. | Word spotting for arabic handwritten historical document retrieval using generalized hough transform | |
JP4065484B2 (ja) | 帳票検索システム | |
Diem et al. | Semi-automated document image clustering and retrieval | |
Marinai | A survey of document image retrieval in digital libraries |