JP2003141447A5 - - Google Patents

Download PDF

Info

Publication number
JP2003141447A5
JP2003141447A5 JP2001340606A JP2001340606A JP2003141447A5 JP 2003141447 A5 JP2003141447 A5 JP 2003141447A5 JP 2001340606 A JP2001340606 A JP 2001340606A JP 2001340606 A JP2001340606 A JP 2001340606A JP 2003141447 A5 JP2003141447 A5 JP 2003141447A5
Authority
JP
Japan
Prior art keywords
similarity
format data
page format
search
unit
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2001340606A
Other languages
English (en)
Other versions
JP2003141447A (ja
JP4065484B2 (ja
Filing date
Publication date
Application filed filed Critical
Priority to JP2001340606A priority Critical patent/JP4065484B2/ja
Priority claimed from JP2001340606A external-priority patent/JP4065484B2/ja
Publication of JP2003141447A publication Critical patent/JP2003141447A/ja
Publication of JP2003141447A5 publication Critical patent/JP2003141447A5/ja
Application granted granted Critical
Publication of JP4065484B2 publication Critical patent/JP4065484B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Claims (4)

  1. 票を画像データとして読み取る画像入力手段と、該画像入力手段手段で読み取った画像の特徴量に基づいて当該画像をテキスト部分とテーブル部分とを含む複数の部分に分割する分割手段と、該分割手段で分割されたテキスト部分の文字を認識する文字認識手段と、前記分割手段で分割されたテーブル部分のテーブル構造を識別する識別手段と、該識別手段で識別されたテーブル構造と、前記文字認識手段により認識された文字とを含む情報をページ書式データとして階層化データ構造に整形ページ書式データ作成手段と、該ページ書式データ作成手段によりテンプレート帳票から作成されたページ書式データを保存する保存手段と、ページ書式データ間の類似度を計算する類似度計算手段とを備え、前記ページ書式データ作成手段により検索帳票から作成されたページ書式データと、前記保存手段に保存されたテンプレート帳票のページ書式データとの類似度を前記類似度計算手段により計算し、類似度が閾値以上となるテンプレート帳票を検索する検索手段と、新規の登録帳票のページ書式データを前記保存手段に登録しようとする際に、前記ページ書式データ作成手段により当該登録帳票から作成されたページ書式データと、前記保存手段に保存されたページ書式データとの類似度を前記類似度計算手段により計算し、当該類似度により一致する帳票が既に保存されている場合に当該登録帳票の登録を禁止する重複登録防止手段とを有することを特徴とする帳票検索システム。
  2. 前記新規の登録帳票のページ書式データを登録する際に、計算した類似度を使用して類似度の高い帳票と関係づけるインデックスを作成するインデックス作成手段を有することを特徴とする請求項1記載の帳票検索システム。
  3. 前記インデックス作成手段により作成したインデックスを使用して、検索帳票と比較対象となるテンプレート帳票を絞り込む絞り込み手段を備え、前記検索手段は、当該絞り込み手段で絞り込まれたテンプレート帳票を対象として、前記類似度計算手段による類似度の計算を実行することを特徴とする請求項2記載の帳票検索システム。
  4. 前記重複登録防止手段は、登録帳票とテーブル数又はセル数の類似するテンプレート帳票を対象として、前記類似度計算手段による類似度の計算を実行することを特徴とする請求項記載の帳票検索システム。
JP2001340606A 2001-11-06 2001-11-06 帳票検索システム Expired - Fee Related JP4065484B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2001340606A JP4065484B2 (ja) 2001-11-06 2001-11-06 帳票検索システム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2001340606A JP4065484B2 (ja) 2001-11-06 2001-11-06 帳票検索システム

Publications (3)

Publication Number Publication Date
JP2003141447A JP2003141447A (ja) 2003-05-16
JP2003141447A5 true JP2003141447A5 (ja) 2005-08-18
JP4065484B2 JP4065484B2 (ja) 2008-03-26

Family

ID=19154780

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2001340606A Expired - Fee Related JP4065484B2 (ja) 2001-11-06 2001-11-06 帳票検索システム

Country Status (1)

Country Link
JP (1) JP4065484B2 (ja)

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102831127B (zh) * 2011-06-17 2015-04-22 阿里巴巴集团控股有限公司 重复数据处理方法、装置及系统
CN105095842B (zh) * 2014-05-22 2018-12-11 口碑控股有限公司 一种单据的信息识别的方法和装置
CN105608452A (zh) * 2014-11-11 2016-05-25 金蝶软件(中国)有限公司 单据录入的方法和系统
JP6317280B2 (ja) * 2015-02-20 2018-04-25 日本電信電話株式会社 同種帳票ファイル選定装置、同種帳票ファイル選定方法、および、同種帳票ファイル選定プログラム
JP7069759B2 (ja) * 2018-01-31 2022-05-18 日本電気株式会社 帳票作成支援装置、帳票作成支援方法、及び、帳票作成支援プログラム
CN109829143B (zh) * 2018-12-28 2023-06-20 陈德芹 一种在线表格汇总方法及装置

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0728935A (ja) * 1993-07-07 1995-01-31 Oki Electric Ind Co Ltd 文書画像処理装置
JP3484446B2 (ja) * 1996-11-15 2004-01-06 シャープ株式会社 光学文字認識装置
EP1052593B1 (en) * 1999-05-13 2015-07-15 Canon Kabushiki Kaisha Form search apparatus and method

Similar Documents

Publication Publication Date Title
Almazán et al. Word spotting and recognition with embedded attributes
Fischer et al. Lexicon-free handwritten word spotting using character HMMs
EP2015228B1 (en) Retrieving electronic documents by converting them to synthetic text
Qian et al. Enhancing sketch-based image retrieval by re-ranking and relevance feedback
Jain et al. Logo retrieval in document images
Ahmed et al. A survey on handwritten documents word spotting
KR870011552A (ko) 문서 등록 방식
Liu et al. An image-based near-duplicate video retrieval and localization using improved edit distance
Marinai et al. Font adaptive word indexing of modern printed documents
Ghosh et al. Query by string word spotting based on character bi-gram indexing
CN102937994A (zh) 一种基于停用词的相似文档查询方法
Halder et al. Offline writer identification and verification—A state-of-the-art
Sfikas et al. Using attributes for word spotting and recognition in polytonic greek documents
JP2009506394A5 (ja)
Bhunia et al. Zone-based keyword spotting in Bangla and Devanagari documents
Cheddad et al. SHIBR—The Swedish historical birth records: A semi-annotated dataset
Davila et al. Tangent-V: Math formula image search using line-of-sight graphs
JP2003141447A5 (ja)
Rusinol et al. Word and symbol spotting using spatial organization of local descriptors
Pinchak et al. A probabilistic answer type model
Rusiñol et al. Symbol Spotting in Digital Libraries
Aouadi et al. Word spotting for arabic handwritten historical document retrieval using generalized hough transform
JP4065484B2 (ja) 帳票検索システム
Diem et al. Semi-automated document image clustering and retrieval
Marinai A survey of document image retrieval in digital libraries