JP2014235619A - 画像情報処理装置及び画像情報処理方法 - Google Patents
画像情報処理装置及び画像情報処理方法 Download PDFInfo
- Publication number
- JP2014235619A JP2014235619A JP2013117396A JP2013117396A JP2014235619A JP 2014235619 A JP2014235619 A JP 2014235619A JP 2013117396 A JP2013117396 A JP 2013117396A JP 2013117396 A JP2013117396 A JP 2013117396A JP 2014235619 A JP2014235619 A JP 2014235619A
- Authority
- JP
- Japan
- Prior art keywords
- image
- document
- index
- information processing
- type
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 230000010365 information processing Effects 0.000 title claims abstract description 38
- 238000003672 processing method Methods 0.000 title claims abstract description 14
- 238000012545 processing Methods 0.000 claims description 46
- 238000000034 method Methods 0.000 abstract description 18
- 238000012546 transfer Methods 0.000 description 15
- 238000000605 extraction Methods 0.000 description 4
- 238000004519 manufacturing process Methods 0.000 description 4
- 241001492658 Cyanea koolauensis Species 0.000 description 2
- 238000013461 design Methods 0.000 description 2
- 238000010586 diagram Methods 0.000 description 2
- 238000009825 accumulation Methods 0.000 description 1
- 239000000284 extract Substances 0.000 description 1
- 238000003384 imaging method Methods 0.000 description 1
- 230000007774 longterm Effects 0.000 description 1
- 238000012795 verification Methods 0.000 description 1
Images
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
【解決手段】多種業務に係る多種の書類イメージを読み出し可能に記憶するイメージファイル230と、イメージファイル230に登録される書類イメージに表示されている文字情報の単語毎の文字列を書類イメージに対応するインデックスとする文字情報インデックス手段260と、書類イメージに書類種別IDを付与し、インデックスと対応付ける書類種別インデックス手段と、インデックス及び書類種別IDをイメージファイル230に登録されている書類イメージの読み出しキーワードとして記憶するインデックスファイル300とを備え、検索エンジン250は、インデックスファイル300を参照してイメージファイル230に記憶されている書類イメージを読み出すイメージ読み出し手段とを備える。
【選択図】図1
Description
例えば、「今日は良い天気です。」という文字列をバイグラムのインデックスを作成する場合、まず対象となる文書のIDを割り振り、例えば1番とする。続いて次のような索引情報を生成する。
「日は 1」
「は良 1」
「良い 1」
「い天 1」
「天気 1」
「気で 1」
「です 1」
「す。 1」
「。 1」
「今日 2」
「日は 2」
「は大 2」
「大雨 2」
「雨で 2」
「です 2」
「す。 2」
「。 2」
「今日 1,2」
「日は 1,2」
「は良 1」
「良い 1」
「い天 1」
「天気 1」
「気で 1」
「です 1,2」
「す。 1,2」
「。 1,2」
「は大 2」
「大雨 2」
「雨で 2」
例えば、コードデータとして、納付書に表されている銀行収納日付、収納店、収納市町村・企業名、金額等が得られる。
銀行収納日付、例えば「2013/01/15」、
収納店。例えば、「102」、
収納市町村名「○○市」、
金額、例えば「4万円」、
上記のそれぞれを一単語とし、全文検索インデックスを生成する。なお、このときの文書ID部はそれぞれイメージ格納先のパスを関連付ける(紐づける)。
文書IDとしては、口座振替依頼書に表示されている以下の情報等である。
口座番号例えば「47192202050264」、
委託会社コード例えば「0264」、
委託会社名「□□株式会社」
をそれぞれ一単語として全文検索インデックスを生成する。なお、このときの文書ID部はそれぞれイメージ格納先のパスを関連付けている(紐づける)。
本実施の形態例では、論理的な単語とイメージの関係を示しただけというシンプルな構成であり、物理的なインデックステーブルの構造は、図3に示す様に、イメージのインデックスと、該インデックスに対応するイメージへのポインタ情報が得うイメージへのポインタごく簡単な構成としている。
イメージ情報を検索(参照)する場合には、帳票名(例えば納付済通知書あるいは口座振替依頼書等)とデータ項目名を論理和(AND)条件をかけて検索処理を行う。例えば、インデックスファイル300に帳票IDを指示すれば、イメージファイル230から帳票IDに対応するイメージファイルが特定され、続いて帳票を特定するためのインデックスを指定することになる。
Claims (7)
- 多種業務に係る多種の書類イメージを記憶する画像情報処理装置であって、
前記書類イメージを読み出し可能に記憶するイメージ記憶手段と、
前記イメージ記憶手段に登録される書類イメージに表示されている文字情報に対応するデジタル情報において、文字情報の単語毎の文字列を前記書類イメージに対応するインデックスとする文字情報インデックス手段と、
前記書類イメージの種別毎に固有の書類種別IDを付与し、前記インデックス特定手段によるインデックスと対応付ける書類種別インデックス手段と、
前記インデックス及び前記書類種別IDを前記イメージ記憶手段に登録されている書類イメージの読み出しキーワードとして記憶するインデックス記憶手段とを備えることを特徴とする画像情報処理装置。 - 前記インデックス記憶手段に記憶されている前記インデックス及び前記書類種別IDを受け取り、該受け取ったインデックス及び書類識別IDの全てで特定される前記イメージ記憶手段に記憶されている書類イメージを読み出すイメージ読み出し手段とを備えることを特徴とする請求項1記載の画像情報処理装置。
- 前記書類イメージは帳票イメージであり、処理対象書類種別の追加時には、前記書類種別インデックス手段は新たに追加される書類種別に固有の書類種別IDを付与し、前記文字情報インデックス手段は、追加された処理対象書類に表示されている文字情報に対応する文字列をインデックスとして前記インデックス記憶手段に追加登録することで対応可能であることを特徴とする請求項1又は請求項2記載の画像情報処理装置。
- 前記文字情報インデックス手段は前記処理対象書類に表示されている全文をインデックス対象とすることを特徴とする請求項1乃至請求項3のいずれかに記載の画像情報処理装置。
- 多種業務に係る多種の書類イメージを記憶する書類イメージ記憶手段と該書類イメージ記憶手段に記憶されている書類イメージに対するインデックス情報を記憶するインデックス記憶手段を備える画像情報処理装置における画像情報処理方法であって、
前記書類イメージ記憶手段に記憶される前記書類イメージに表示されている文字情報を認識して単語毎の文字列の全てを前記書類イメージに対応するインデックスとして抽出し、
前記書類イメージの種別毎に固有の書類種別IDを付与し、前記抽出したインデックスと対応付け、書類イメージに対するインデックス情報として前記インデックス記憶手段に記憶させることを特徴とする画像情報処理方法。 - 前記インデックス記憶手段に記憶されている前記インデックス及び前記書類種別IDを受け取り、該受け取ったインデックス及び書類識別IDの全てで特定される前記イメージ記憶手段に記憶されている書類イメージを読み出すことを特徴とする請求項5記載の画像情報処理方法。
- 前記書類イメージは帳票イメージであり、処理対象書類種別の追加時には、新たに追加される書類種別に固有の書類種別IDを付与し、追加された処理対象書類に表示されている文字情報に対応する文字列をインデックスとして前記インデックス記憶手段に追加登録することで対応可能であることを特徴とする請求項5又は請求項6記載の画像情報処理方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2013117396A JP6250307B2 (ja) | 2013-06-03 | 2013-06-03 | 画像情報処理装置及び画像情報処理方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2013117396A JP6250307B2 (ja) | 2013-06-03 | 2013-06-03 | 画像情報処理装置及び画像情報処理方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2014235619A true JP2014235619A (ja) | 2014-12-15 |
JP6250307B2 JP6250307B2 (ja) | 2017-12-20 |
Family
ID=52138263
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2013117396A Active JP6250307B2 (ja) | 2013-06-03 | 2013-06-03 | 画像情報処理装置及び画像情報処理方法 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP6250307B2 (ja) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2020119057A (ja) * | 2019-01-21 | 2020-08-06 | 株式会社プリマジェスト | 画像処理装置 |
JP6905724B1 (ja) * | 2021-01-27 | 2021-07-21 | 株式会社 情報システムエンジニアリング | 情報提供システム及び情報提供方法 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2004302683A (ja) * | 2003-03-28 | 2004-10-28 | Toshiba Corp | 文書管理システム、文書生成方法、登録方法およびプログラム |
JP2010102668A (ja) * | 2008-10-27 | 2010-05-06 | Hitachi Software Eng Co Ltd | メタデータ抽出装置およびその方法 |
JP2010515167A (ja) * | 2006-12-28 | 2010-05-06 | グーグル インコーポレイテッド | 文書保存システム |
-
2013
- 2013-06-03 JP JP2013117396A patent/JP6250307B2/ja active Active
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2004302683A (ja) * | 2003-03-28 | 2004-10-28 | Toshiba Corp | 文書管理システム、文書生成方法、登録方法およびプログラム |
JP2010515167A (ja) * | 2006-12-28 | 2010-05-06 | グーグル インコーポレイテッド | 文書保存システム |
JP2010102668A (ja) * | 2008-10-27 | 2010-05-06 | Hitachi Software Eng Co Ltd | メタデータ抽出装置およびその方法 |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2020119057A (ja) * | 2019-01-21 | 2020-08-06 | 株式会社プリマジェスト | 画像処理装置 |
JP7291488B2 (ja) | 2019-01-21 | 2023-06-15 | 株式会社プリマジェスト | 画像処理装置 |
JP6905724B1 (ja) * | 2021-01-27 | 2021-07-21 | 株式会社 情報システムエンジニアリング | 情報提供システム及び情報提供方法 |
JP2022114721A (ja) * | 2021-01-27 | 2022-08-08 | 株式会社 情報システムエンジニアリング | 情報提供システム及び情報提供方法 |
Also Published As
Publication number | Publication date |
---|---|
JP6250307B2 (ja) | 2017-12-20 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11868717B2 (en) | Multi-page document recognition in document capture | |
US10614527B2 (en) | System and method for automatic generation of reports based on electronic documents | |
US10366123B1 (en) | Template-free extraction of data from documents | |
CA3074633C (en) | Systems and methods for data indexing and processing | |
US9213893B2 (en) | Extracting data from semi-structured electronic documents | |
US9378205B1 (en) | System and method for managing and sharing pharmaceutical clinical trial regulatory documents | |
US20080235227A1 (en) | Systems and methods to extract data automatically from a composite electronic document | |
US20130275451A1 (en) | Systems And Methods For Contract Assurance | |
US10614125B1 (en) | Modeling and extracting elements in semi-structured documents | |
RU2768233C1 (ru) | Нечеткий поиск с использованием форм слов для работы с большими данными | |
CN105630924A (zh) | 异步数据处理方法和异步数据处理系统 | |
US20180024983A1 (en) | System and method for reporting based on electronic documents | |
JP6250307B2 (ja) | 画像情報処理装置及び画像情報処理方法 | |
US20220121881A1 (en) | Systems and methods for enabling relevant data to be extracted from a plurality of documents | |
US20170185832A1 (en) | System and method for verifying extraction of multiple document images from an electronic document | |
US20130300562A1 (en) | Generating delivery notification | |
US20170323106A1 (en) | System and method for encrypting data in electronic documents | |
JP7260380B2 (ja) | 情報処理装置及び顧客情報解析方法 | |
WO2022254560A1 (ja) | 光学文字認識により生成されるテキストデータを用いたデータマッチング | |
JP7377565B2 (ja) | 図面検索装置、図面データベース構築装置、図面検索システム、図面検索方法、及びプログラム | |
US20220327502A1 (en) | Enhanced image transaction processing solution and architecture | |
US20230342558A1 (en) | Systems and methods for generalized entity matching | |
JP7120981B2 (ja) | 情報処理装置、情報処理方法、および、情報処理プログラム | |
EP3494496A1 (en) | System and method for reporting based on electronic documents | |
JP2009134375A (ja) | 融資審査支援システムおよびその方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20160526 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20170222 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20170418 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20170619 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20171024 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20171122 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6250307 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |