JP5511554B2 - 画像処理方法、画像処理装置、およびプログラム - Google Patents
画像処理方法、画像処理装置、およびプログラム Download PDFInfo
- Publication number
- JP5511554B2 JP5511554B2 JP2010154362A JP2010154362A JP5511554B2 JP 5511554 B2 JP5511554 B2 JP 5511554B2 JP 2010154362 A JP2010154362 A JP 2010154362A JP 2010154362 A JP2010154362 A JP 2010154362A JP 5511554 B2 JP5511554 B2 JP 5511554B2
- Authority
- JP
- Japan
- Prior art keywords
- character string
- representative character
- region
- string region
- area
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000003672 processing method Methods 0.000 title claims description 10
- 238000000034 method Methods 0.000 claims description 62
- 238000000605 extraction Methods 0.000 claims description 12
- 239000000284 extract Substances 0.000 claims 1
- 238000004364 calculation method Methods 0.000 description 10
- 238000010586 diagram Methods 0.000 description 5
- 230000002093 peripheral effect Effects 0.000 description 3
- 238000003703 image analysis method Methods 0.000 description 2
- 230000009466 transformation Effects 0.000 description 2
- 238000004458 analytical method Methods 0.000 description 1
- 238000007796 conventional method Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000010191 image analysis Methods 0.000 description 1
- 238000003702 image correction Methods 0.000 description 1
- 238000003384 imaging method Methods 0.000 description 1
- 230000000877 morphologic effect Effects 0.000 description 1
Images
Description
図1は、本発明を適用可能なシステムのブロック図である。CPU101は、ROM102に格納されている制御プログラムを実行することにより本装置全体の制御を行う。ROM102は、CPU101が実行するプログラムや各種パラメータを格納する。プログラムは、ROM102から読み出され、CPU101で実行されることにより、後述するフローチャートに示す各処理を実行するための各種手段として、当該装置を機能させる。
図2〜図5を参照して、本発明の文字列領域関連付け方法について説明する。図2は、本発明の文字列領域関連付け方法の一実施例の全体系を示す処理フローチャートである。本処理フローも特に記載している場合を除き、CPU101が実行しているものとする。S201では、撮像装置で撮影された画像が入力され、記憶部に読み込まれる。S202では、S201で入力された画像が文字を含む文書画像であるか、文字を含まない自然画であるかを判定する。文書画像であるか否かを判定する際に、用いられる画像データから文字を抽出する方法に関しては、例えば特開2002−042055号公報「カラー文書からの文字認識方法」などを用いることができる。S203では、S202で判定した画像が文書画像であるか自然画であるかによって分岐する。文書画像であれば(S203にてYES)、S204へ進む。文書画像でなければ(S203にてNO)、S207へ進む。
図3は、図2のS204文書領域抽出処理の詳細フローチャートである。本処理フローも特に記載している場合を除き、CPU101が実行しているものとする。ここでは、まず入力画像中に存在する複数の文字列を抽出し、抽出した文字列が、画像の主被写体である代表文字列領域か、それ以外の非代表文字列領域かを判定する。
図4は、S205における歪み補正画像の生成を説明するための図である。図4(a)は、入力した画像に対し、図2のS204で抽出した文書領域境界線の4つの頂点、p1(x1,y1)、p2(x2,y2)、p3(x3,y3)、p4(x4,y4)で囲まれた部分画像を切り出し、図4(b)の画像を生成する。次に、切り出した文字領域枠401から水平方向の辺を延長した線402、403から水平方向の消失点404を求める。同様に、文字領域枠401の垂直方向の辺を延長した線405、406から垂直方向の消失点407を求める。
図5は、図2のS206を詳細化した処理のフローチャートである。本処理フローも特に記載している場合を除き、CPU101が実行しているものとする。S501では、図2のS205で歪み補正された代表文字列領域を含む文書画像を入力する。S502では、S501で入力された文書画像に対してOCR処理を行い、文字を抽出する。S503では、S501で入力された文書画像に対して非代表文字列領域をメタデータとして付与する。S503の詳細は図6を用いて詳細に説明する。S504では、文書画像を出力する。ここで文書画像は、ビットマップ画像として出力される。
図7は、図6のS602における代表文字列領域との関連度算出処理の詳細を表すフローチャートである。本処理フローも特に記載している場合を除き、CPU101が実行しているものとする。ここで非代表文字列領域の代表文字列領域に対する関連度は、例えば次のような基準により決定される。
S_d=1−β/d(b,a) (βは定数)
S704で、S701〜S703で算出した消失点スコアSv、相対位置スコアS_l、距離スコアS_dを統合して代表文字列領域と非代表文字列領域の関連度Rを求める。関連度Rは、以下のように消失点スコア、相対位置スコア、距離スコアの積で表す。
R=Sv×S_l×S_d
関連度は、非代表文字列領域と代表文字列領域の消失点が近く距離が近いほど大きくなる。また、関連度は0から1の値をとり、1が最大となるように設定される。
図12は、本発明に係る検索処理の流れを説明するフローチャートである。ここでの検索処理とは、ここまでの処理により生成された各文字領域に対するデータベースを検索するための工程である。また、本処理はCPU101が記憶装置104等の記憶部に格納されたプログラムを実行することにより実現される。
また、本発明は、以下の処理を実行することによっても実現される。即ち、上述した実施形態の機能を実現するソフトウェア(プログラム)を、ネットワーク又は各種記憶媒体を介してシステム或いは装置に供給し、そのシステム或いは装置のコンピュータ(またはCPUやMPU等)がプログラムを読み出して実行する処理である。
Claims (7)
- 文字を含む画像中の文字領域の歪みを検出し、検出した歪みを補正した文字列領域に含まれる情報を保持する画像処理方法であって、
代表文字列領域抽出手段が、入力された画像から当該画像の中央に位置し、所定の大きさを有する文字領域である代表文字列領域を抽出する代表文字列領域抽出工程と、
非代表文字列領域抽出手段が、入力された前記画像において、前記代表文字列領域の外にある文字領域である非代表文字列領域を抽出する非代表文字列領域抽出工程と、
関連付け手段が、前記非代表文字列領域抽出工程において抽出された前記非代表文字列領域それぞれを、前記非代表文字列領域と前記代表文字列領域のそれぞれの消失点の位置関係に基づいて、前記代表文字列領域に関連付ける関連付け工程と、
保持手段が、前記関連付け工程において関連付けられた前記代表文字列領域と前記非代表文字列領域の情報を保持する保持工程と
を有することを特徴とする画像処理方法。 - 前記関連付け工程において更に、前記代表文字列領域と前記非代表文字列領域とを関連付ける際に、前記代表文字列領域と前記非代表文字列領域の関連度を算出し、
前記保持工程において、前記関連付け工程において関連付けられた前記代表文字列領域と前記非代表文字列領域と併せて前記関連度を保持する
ことを特徴とする請求項1に記載の画像処理方法。 - 前記関連付け工程において更に、前記関連度を、前記非代表文字列領域と前記代表文字列領域との距離、相対的位置関係のうち、少なくとも一つを用いて推定することを特徴とする請求項2に記載の画像処理方法。
- 前記関連付け工程において更に、前記関連度を、前記非代表文字列領域に含まれる単語が前記代表文字列領域に含まれているか否かを基準として推定することを特徴とする請求項2または3に記載の画像処理方法。
- 検索手段が、検索キーワードを用いて文書を検索し、検索ランキングを決定する検索工程を更に有し、
前記検索工程において、前記検索キーワードが含まれる前記非代表文字列領域と、前記代表文字列領域との前記関連度が高い前記文書が上位となるように前記検索ランキングを決定することを特徴とする請求項2乃至4のいずれか一項に記載の画像処理方法。 - 文字を含む画像中の文字領域の歪みを検出し、検出した歪みを補正した文字領域に含まれる情報を保持する画像処理装置であって、
入力された画像から当該画像の中央に位置し、所定の大きさを有する文字領域である代表文字列領域を抽出する代表文字列領域抽出手段と、
入力された前記画像において、前記代表文字列領域の外にある文字領域である非代表文字列領域を抽出する非代表文字列領域抽出手段と、
前記非代表文字列領域抽出手段により抽出された前記非代表文字列領域それぞれを、前記非代表文字列領域と前記代表文字列領域のそれぞれの消失点の位置関係に基づいて、前記代表文字列領域に関連付ける関連付け手段と、
前記関連付け手段により関連付けられた前記代表文字列領域と前記非代表文字列領域の情報を保持する保持手段と
を有することを特徴とする画像処理装置。 - コンピュータを、
入力された画像から当該画像の中央に位置し、所定の大きさを有する文字領域である代表文字列領域を抽出する代表文字列領域抽出手段、
入力された前記画像において、前記代表文字列領域の外にある文字領域である非代表文字列領域を抽出する非代表文字列領域抽出手段、
前記非代表文字列領域抽出手段により抽出された前記非代表文字列領域それぞれを、前記非代表文字列領域と前記代表文字列領域のそれぞれの消失点の位置関係に基づいて、前記代表文字列領域に関連付ける関連付け手段、
前記関連付け手段により関連付けられた前記代表文字列領域と前記非代表文字列領域の情報を保持する保持手段
として機能させるためのプログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2010154362A JP5511554B2 (ja) | 2010-07-06 | 2010-07-06 | 画像処理方法、画像処理装置、およびプログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2010154362A JP5511554B2 (ja) | 2010-07-06 | 2010-07-06 | 画像処理方法、画像処理装置、およびプログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2012018490A JP2012018490A (ja) | 2012-01-26 |
JP5511554B2 true JP5511554B2 (ja) | 2014-06-04 |
Family
ID=45603707
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2010154362A Active JP5511554B2 (ja) | 2010-07-06 | 2010-07-06 | 画像処理方法、画像処理装置、およびプログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP5511554B2 (ja) |
Family Cites Families (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP4010754B2 (ja) * | 2000-08-10 | 2007-11-21 | 株式会社リコー | 画像処理装置と画像処理方法及びコンピュータ読み取り可能な記録媒体 |
JP2003263607A (ja) * | 2003-03-05 | 2003-09-19 | Hitachi Ltd | 帳票処理方法およびシステム |
-
2010
- 2010-07-06 JP JP2010154362A patent/JP5511554B2/ja active Active
Also Published As
Publication number | Publication date |
---|---|
JP2012018490A (ja) | 2012-01-26 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US20210192202A1 (en) | Recognizing text in image data | |
KR102403964B1 (ko) | 화상 처리 장치, 화상 처리 방법, 및 저장 매체 | |
US20110222775A1 (en) | Image attribute discrimination apparatus, attribute discrimination support apparatus, image attribute discrimination method, attribute discrimination support apparatus controlling method, and control program | |
KR102399508B1 (ko) | 레이아웃 분석 방법, 판독 보조 장치, 회로, 및 매체 | |
JPWO2007004519A1 (ja) | 検索システム及び検索方法 | |
JP2008287438A (ja) | 画像処理装置及び画像検索方法 | |
KR101549792B1 (ko) | 문서 자동 작성 장치 및 방법 | |
JP4859054B2 (ja) | 画像処理装置、画像処理方法、プログラムおよび記録媒体 | |
US10452943B2 (en) | Information processing apparatus, control method of information processing apparatus, and storage medium | |
US9224069B2 (en) | Program, method and apparatus for accumulating images that have associated text information | |
US10509986B2 (en) | Image similarity determination apparatus and image similarity determination method | |
Jain et al. | Visualdiff: Document image verification and change detection | |
US10706581B2 (en) | Image processing apparatus for clipping and sorting images from read image according to cards and control method therefor | |
JP5511554B2 (ja) | 画像処理方法、画像処理装置、およびプログラム | |
JP4518212B2 (ja) | 画像処理装置及びプログラム | |
JP4517822B2 (ja) | 画像処理装置及びプログラム | |
JP2007011762A (ja) | 領域抽出装置及び領域抽出方法 | |
CN113806472A (zh) | 一种对文字图片和图像型扫描件实现全文检索的方法及设备 | |
JP2001043316A (ja) | 文書画像処理方法、文書画像処理装置及び記録媒体 | |
JP2006072839A (ja) | 画像処理方法、画像処理装置、画像処理プログラム及び記録媒体 | |
JP4391157B2 (ja) | 文書処理装置、文書処理方法、文書処理プログラム、および記録媒体 | |
JP2004280514A (ja) | Pdfファイル及びpdfファイル作成システム | |
US20100054610A1 (en) | Original image searching device, original image searching method, and computer readable medium | |
JP2012113433A (ja) | 文字認識装置、文字認識方法及びプログラム | |
JP7231529B2 (ja) | 情報端末装置、サーバ及びプログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20130701 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20140213 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20140224 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20140325 |
|
R151 | Written notification of patent or utility model registration |
Ref document number: 5511554 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R151 |