JP5272664B2 - 情報処理装置、画像検索方法、及びプログラム - Google Patents
情報処理装置、画像検索方法、及びプログラム Download PDFInfo
- Publication number
- JP5272664B2 JP5272664B2 JP2008283478A JP2008283478A JP5272664B2 JP 5272664 B2 JP5272664 B2 JP 5272664B2 JP 2008283478 A JP2008283478 A JP 2008283478A JP 2008283478 A JP2008283478 A JP 2008283478A JP 5272664 B2 JP5272664 B2 JP 5272664B2
- Authority
- JP
- Japan
- Prior art keywords
- image
- numeric
- information
- image data
- digits
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Landscapes
- Processing Or Creating Images (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Description
また、上記課題を解決するため、本発明に係る情報処理装置において、所定の数字番号情報の上位所定桁を前記数字番号画像と同一フォーマットで画像化したテンプレート画像と、前記数字番号画像とを比較して、画像の一致判定処理を行う画像マッチング処理手段を有し、前記数字情報取得手段は、前記所定の数字番号情報の上位所定桁を1以上ずつ繰り上げながら不一致判定となるまで、一の前記画像データの画像内に含まれる前記数字番号画像に対して前記画像マッチング処理手段による一致判定処理を行い、一の前記画像データの画像内に含まれる前記数字番号画像の上位所定桁の数字情報を取得するようにすることができる。
(ネットワーク)
はじめに、具体的な発明の内容を説明する前に、本発明を実施するにあたってシステム構成について説明する。図1は、本発明による情報処理装置1を含む画像検索システム100のネットワーク構成図である。情報処理装置1及び端末2がネットワーク3を介して接続されている。
次いで、本発明による情報処理装置1のハードウェア及び機能構成について説明する。図2は、本発明による情報処理装置1の一実施形態の主要構成を示すハードウェア構成図である。情報処理装置1は、主要な構成として、CPU101、ROM(Read Only Memory)102、RAM(Random Access Memory)103、補助記憶装置104、記憶媒体読取装置105、入力装置106、表示装置107、及び通信装置108を含む構成である。
次に、情報処理装置1の有する機能の説明に先立って、本発明に係る情報処理の対象となる画像データについて説明しておく。図3は、本発明に係る画像データの一例を示す図である。マイクロフィルム等の記録媒体に記録されている場合はスキャンされて画像データ化される。本発明に係る画像データは以下の特徴を有している
(1)画像には、固定桁数・固定フォント、共通フォーマットで数字番号画像が記載されている
(2)画像データは、複数枚あり、画像データ毎に固有の通し番号が振られている
(3)画像の通し番号が大きいものほど、画像内の数字番号(の値)も大きい(或いは小さい)
再び図3を参照して、通し番号00001画像内には、固定8桁の数字番号画像が固定フォントにより昇順で記載されている。また通し番号00002画像内には、通し番号00001画像からの数字番号画像に続くようにして順に数字番号画像が記載されている(飛び番号含む)。また、画像データは、通し番号からして59130枚の画像データがあることがわかる。
(4)画像に(ある程度の)雑音が乗っている(ゆえに処理過程においてテンプレートマッチング技術を利用する)
(5)数字番号画像の上位数桁は余り大きく変動しない(一枚の画像中に同じ数字の上位所定桁が複数回記載されている)
ここでいう雑音は、紙台帳や紙帳票上にある汚れやインクむら、しわなどで、スキャンされた画像データ上にもこれら雑音が乗ってしまっており、OCRなどで文字情報を認識する場合にはエラーや誤認識を生じさせる原因となるものである。また、画像の上位数桁は余り大きく変動しないとは、例えば、一画像内に複数の数字番号画像が記載されている場合、その複数の数字番号画像における上位桁(例えば、5桁や6桁等)は同一である数字番号が多いことを意味する。
図6は、本発明の実施形態による情報処理装置1の一実施形態の主要機能を示す機能ブロック図である。情報処理装置1は、主要な機能として、記憶部601、数字情報取得部602、索引作成部603、抽出部604、及び検索部605を有する。以下、各機能部について説明する。
次に、本発明による情報処理装置1の処理動作についてフローチャートを参照しつつ説明を行う。以下では前半処理と後半処理のパートにわけて説明する。前半処理は、前述の数字情報取得部602が画像データの画像内に含まれる数字番号画像から、数字番号の上位所定桁の数字情報を取得し、索引作成部603がその数字情報を画像データに対応付けて索引を作成するまでの処理である。そして、後半処理は、索引を利用して抽出部604がユーザにより入力された数字番号と上位所定桁と一致する数字情報に対応する画像データを抽出し、検索部605がその抽出された画像データの中から、入力された数字番号を画像中に含む画像データを検索するまでの処理である。
図7は、情報処理装置1の行う前半処理について説明するフローチャートである。平行して図3を参照し具体的に説明する。
再びステップS704に進むと、この場合は、同一画像について数字列Bに1(以上)加算した値が当該同一画像に含まれるかどうかを再度判定する。含まれる場合は、数字情報としてさらに索引に追加するようにする処理である。
図13は、情報処理装置1の行う後半処理について説明するフローチャートである。再度確認すれば、後半処理は、索引を利用して抽出部604がユーザにより入力された数字番号と上位所定桁と一致する数字情報に対応する画像データを抽出し、検索部605がその抽出された画像データの中から、入力された数字番号を画像中に含む画像データを検索するまでの処理である。同様に図3を参照し具体的に説明する。
次いで、情報処理装置1の行う前半処理における変形例について説明する。図14は、情報処理装置1の行う前半処理(変形例)について説明するフローチャートである。具体的には、前述の図7のフローチャートと比較して、S701−S707までの処理は同様であり、S708−S711の処理順序が異なっている。即ち、数字情報取得処理が異なる。以下、S706から言及して説明を行う。
2 端末
3 ネットワーク
100 画像検索システム
101 CPU
102 ROM
103 RAM
104 補助記憶装置
105 記憶媒体読取装置
106 入力装置
107 表示装置
108 通信装置
601 記憶部
602 数字情報取得部
603 索引作成部
604 抽出部
605 検索部
Claims (15)
- 通し番号が付され、前記通し番号につれて数字番号が大きく又は小さくなる所定桁数の数字番号画像を昇順又は降順で画像内に含み、一定のフォーマットを有する画像データを記憶する記憶手段と接続され、前記画像データの中から、入力された数字番号を画像内に含む画像データを検索する情報処理装置であって、
前記画像データの画像内から、前記数字番号画像の上位所定桁の数字情報を取得する数字情報取得手段と、
前記数字情報取得手段により取得された前記数字情報を前記画像データに対応付けて索引を作成する索引作成手段と、
前記入力された数字番号と前記索引作成手段により作成された索引とに基づいて、前記入力された数字番号の上位所定桁と一致する前記数字情報に対応する画像データを抽出する抽出手段と、
前記抽出手段により抽出された画像データの中から、前記入力された数字番号に対応する前記数字番号画像を画像内に含む画像データを検索する検索手段と、
を有すること特徴とする情報処理装置。 - 所定の数字番号情報の上位所定桁を前記数字番号画像と同一フォーマットで画像化したテンプレート画像と、前記数字番号画像とを比較して、画像の一致判定処理を行う画像マッチング処理手段を有し、
前記数字情報取得手段は、前記所定の数字番号情報に1以上ずつ加算しながら不一致判定となるまで、一の前記画像データの画像内に含まれる前記数字番号画像に対して前記画像マッチング処理手段による一致判定処理を行い、一の前記画像データの画像内に含まれる前記数字番号画像の上位所定桁の数字情報を取得すること、
を特徴とする請求項1に記載の情報処理装置。 - 所定の数字番号情報の上位所定桁を前記数字番号画像と同一フォーマットで画像化したテンプレート画像と、前記数字番号画像とを比較して、画像の一致判定処理を行う画像マッチング処理手段を有し、
前記数字情報取得手段は、一の前記画像データの画像内に含まれる前記数字番号画像に対して前記画像マッチング処理手段による一致判定処理を行い、一致判定となったとき、次以降の通し番号が付された一の前記画像データを対象とする前記一致判定処理に移行し、一の前記画像データ内の画像内に含まれる一の前記数字番号画像の上位所定桁の数字情報を取得すること、
を特徴とする請求項1に記載の情報処理装置。 - 前記画像マッチング処理手段は、複数行の前記所定の数字番号情報の上位所定桁を画像化したテンプレート画像と、複数の前記数字番号画像とを一度に比較して、画像の一致判定処理を行うこと、
を特徴とする請求項2又は3に記載の情報処理装置。 - 前記所定の数字番号情報は、前記通し番号が最小である前記画像データの画像内に含まれる全ての前記数字番号画像の数字情報を取得して、全ての当該数字番号の上位所定桁で多数決をとり最も多数の上位所定桁を有する数字番号のうち、最小の数字番号であること、
を特徴とする請求項2ないし4何れか一項に記載の情報処理装置。 - 前記数字番号画像の数字情報は、OCR処理、又は数字画像0から9までのテンプレート画像を前記数字番号画像と同一フォーマットで作成し、当該画像から画像内で黒画素が連続している領域のうち一定の大きさの数字画像部分を抜き出し、前記数字画像0から9までのテンプレート画像と1つずつと比較照合し一致度を判定することにより取得されること、
を特徴とする請求項5に記載の情報処理装置。 - 前記上位所定桁は、前記所定桁数から、一画像データの画像内に含まれる数字番号画像の最大個数の桁数を減算した桁数であること、
を特徴とする請求項1ないし6何れか一項に記載の情報処理装置。 - 通し番号が付され、前記通し番号につれて数字番号が大きく又は小さくなる所定桁数の数字番号画像を昇順又は降順で画像内に含み、一定のフォーマットを有する画像データを記憶する記憶手段と接続され、前記画像データの中から、入力された数字番号を画像内に含む画像データを検索する情報処理装置における画像検索方法であって、
コンピュータが、
前記画像データの画像内から、前記数字番号画像の上位所定桁の数字情報を取得する数字情報取得手順と、
前記数字情報取得手順により取得された前記数字情報を前記画像データに対応付けて索引を作成する索引作成手順と、
前記入力された数字番号と前記索引作成手順により作成された索引とに基づいて、前記入力された数字番号の上位所定桁と一致する前記数字情報に対応する画像データを抽出する抽出手順と、
前記抽出手順により抽出された画像データの中から、前記入力された数字番号に対応する前記数字番号画像を画像内に含む画像データを検索する検索手順と、
を実行すること特徴とする画像検索方法。 - コンピュータが、
所定の数字番号情報の上位所定桁を前記数字番号画像と同一フォーマットで画像化したテンプレート画像と、前記数字番号画像とを比較して、画像の一致判定処理を行う画像マッチング処理手順を実行し、
前記数字情報取得手順は、前記所定の数字番号情報に1以上ずつ加算しながら不一致判定となるまで、一の前記画像データの画像内に含まれる前記数字番号画像に対して前記画像マッチング処理手順による一致判定処理を行い、一の前記画像データの画像内に含まれる前記数字番号画像の上位所定桁の数字情報を取得すること、
を特徴とする請求項8に記載の画像検索方法。 - コンピュータが、
所定の数字番号情報の上位所定桁を前記数字番号画像と同一フォーマットで画像化したテンプレート画像と、前記数字番号画像とを比較して、画像の一致判定処理を行う画像マッチング処理手順を実行し、
前記数字情報取得手順は、一の前記画像データの画像内に含まれる前記数字番号画像に対して前記画像マッチング処理手順による一致判定処理を行い、一致判定となったとき、次以降の通し番号が付された一の前記画像データを対象とする前記一致判定処理に移行し、一の前記画像データ内の画像内に含まれる一の前記数字番号画像の上位所定桁の数字情報を取得すること、
を特徴とする請求項8に記載の画像検索方法。 - 前記画像マッチング処理手順は、複数行の前記所定の数字番号情報の上位所定桁を画像化したテンプレート画像と、複数の前記数字番号画像とを一度に比較して、画像の一致判定処理を行うこと、
を特徴とする請求項9又は10に記載の画像検索方法。 - 前記所定の数字番号情報は、前記通し番号が最小である前記画像データの画像内に含まれる全ての前記数字番号画像の数字情報を取得して、全ての当該数字番号の上位所定桁で多数決をとり最も多数の上位所定桁を有する数字番号のうち、最小の数字番号であること、
を特徴とする請求項9ないし11何れか一項に記載の画像検索方法。 - 前記数字番号画像の数字情報は、OCR処理、又は数字画像0から9までのテンプレート画像を前記数字番号画像と同一フォーマットで作成し、当該画像から画像内で黒画素が連続している領域のうち一定の大きさの数字画像部分を抜き出し、前記数字画像0から9までのテンプレート画像と1つずつと比較照合し一致度を判定することにより取得されること、
を特徴とする請求項12に記載の画像検索方法。 - 前記上位所定桁は、前記所定桁数から、一画像データの画像内に含まれる数字番号画像の最大個数の桁数を減算した桁数であること、
を特徴とする請求項9ないし13何れか一項に記載の画像検索方法。 - 請求項8ないし14何れか一項に記載の画像検索方法をコンピュータに実行させるためのプログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2008283478A JP5272664B2 (ja) | 2008-11-04 | 2008-11-04 | 情報処理装置、画像検索方法、及びプログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2008283478A JP5272664B2 (ja) | 2008-11-04 | 2008-11-04 | 情報処理装置、画像検索方法、及びプログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2010113415A JP2010113415A (ja) | 2010-05-20 |
JP5272664B2 true JP5272664B2 (ja) | 2013-08-28 |
Family
ID=42301948
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2008283478A Expired - Fee Related JP5272664B2 (ja) | 2008-11-04 | 2008-11-04 | 情報処理装置、画像検索方法、及びプログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP5272664B2 (ja) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP6838278B2 (ja) * | 2016-03-28 | 2021-03-03 | セイコーエプソン株式会社 | ロボット |
Family Cites Families (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH08305713A (ja) * | 1995-04-28 | 1996-11-22 | Fuji Xerox Co Ltd | 電子ファイリング装置 |
JP2002197101A (ja) * | 2000-12-25 | 2002-07-12 | Sharp Corp | 文書管理システム |
JP2003058822A (ja) * | 2001-08-15 | 2003-02-28 | Konica Corp | 文字情報抽出装置、文字情報抽出方法、プログラムおよび記憶媒体 |
-
2008
- 2008-11-04 JP JP2008283478A patent/JP5272664B2/ja not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
JP2010113415A (ja) | 2010-05-20 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
USRE49576E1 (en) | Standard exact clause detection | |
US10984233B2 (en) | Image processing apparatus, control method, and non-transitory storage medium that obtain text data for an image | |
JP6938228B2 (ja) | 計算機、文書識別方法、及びシステム | |
KR102403964B1 (ko) | 화상 처리 장치, 화상 처리 방법, 및 저장 매체 | |
US9268768B2 (en) | Non-standard and standard clause detection | |
US20160371246A1 (en) | System and method of template creation for a data extraction tool | |
JP2010055142A (ja) | 文書処理装置およびプログラム | |
JP2021043775A (ja) | 情報処理装置及びプログラム | |
Yang et al. | Automatic single page-based algorithms for medieval manuscript analysis | |
JP5272664B2 (ja) | 情報処理装置、画像検索方法、及びプログラム | |
US10706581B2 (en) | Image processing apparatus for clipping and sorting images from read image according to cards and control method therefor | |
JP2007041709A (ja) | 文書処理システム、文書処理システムの制御方法、文書処理装置、並びに、コンピュータプログラム及びコンピュータ可読記憶媒体 | |
JP2020095374A (ja) | 文字認識システム、文字認識装置、プログラム及び文字認識方法 | |
US20210019554A1 (en) | Information processing device and information processing method | |
US20210042555A1 (en) | Information Processing Apparatus and Table Recognition Method | |
JP5752073B2 (ja) | データ修正装置 | |
WO2020044537A1 (ja) | 画像照合装置、画像照合方法、及びプログラム | |
US8923625B2 (en) | Original image searching device, original image searching method, and computer readable medium | |
JP4823049B2 (ja) | 文書画像検索装置及びプログラム | |
JP2020047031A (ja) | 文書検索装置、文書検索システム及びプログラム | |
US11574490B2 (en) | Information processing apparatus and non-transitory computer readable medium storing information processing program | |
JP7421384B2 (ja) | 情報処理装置、修正候補表示方法、及びプログラム | |
JP2018142074A (ja) | 特徴量算出装置、画像類似度判定装置、画像検索装置、特徴量算出方法及びプログラム | |
JP7268316B2 (ja) | 情報処理装置及びプログラム | |
JP2008186256A (ja) | 文書処理装置、文書処理方法、コンピュータプログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20110913 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20130130 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20130205 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20130322 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20130416 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20130429 |
|
LAPS | Cancellation because of no payment of annual fees |