JP6452329B2 - 情報処理装置、情報処理方法、プログラム - Google Patents
情報処理装置、情報処理方法、プログラム Download PDFInfo
- Publication number
- JP6452329B2 JP6452329B2 JP2014139866A JP2014139866A JP6452329B2 JP 6452329 B2 JP6452329 B2 JP 6452329B2 JP 2014139866 A JP2014139866 A JP 2014139866A JP 2014139866 A JP2014139866 A JP 2014139866A JP 6452329 B2 JP6452329 B2 JP 6452329B2
- Authority
- JP
- Japan
- Prior art keywords
- cell
- character
- recognition
- information processing
- recognition cell
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
- 230000010365 information processing Effects 0.000 title claims description 29
- 238000003672 processing method Methods 0.000 title claims description 7
- 230000008859 change Effects 0.000 claims description 43
- 238000000034 method Methods 0.000 claims description 43
- 230000008569 process Effects 0.000 claims description 30
- 230000009467 reduction Effects 0.000 claims description 27
- 230000004044 response Effects 0.000 claims description 4
- 238000011946 reduction process Methods 0.000 claims 1
- 238000001514 detection method Methods 0.000 description 34
- 238000010586 diagram Methods 0.000 description 7
- 238000005192 partition Methods 0.000 description 6
- 230000005540 biological transmission Effects 0.000 description 5
- 238000012217 deletion Methods 0.000 description 3
- 230000037430 deletion Effects 0.000 description 3
- 238000003708 edge detection Methods 0.000 description 3
- 239000003086 colorant Substances 0.000 description 2
- 230000011218 segmentation Effects 0.000 description 2
- 230000009471 action Effects 0.000 description 1
- 238000004458 analytical method Methods 0.000 description 1
- 230000032823 cell division Effects 0.000 description 1
- 230000005859 cell recognition Effects 0.000 description 1
- 230000010354 integration Effects 0.000 description 1
Images
Landscapes
- Character Input (AREA)
- Editing Of Facsimile Originals (AREA)
Description
前記表示された前記複数のセルの中から、ユーザの指示に基づいて1つのセルを選択する選択手段と、前記選択手段によって選択された1つのセルを縮小するためのハンドルを更に表示するように制御する第2表示制御手段と、前記ユーザによる前記ハンドルの操作に応じて、前記選択手段によって選択された1つのセルを縮小する縮小手段と、前記縮小手段によって縮小される前の前記1つのセルに含まれ且つ前記縮小手段によって縮小された後のセルに含まれない文字領域があるか否かを判定する判定手段と、前記判定手段によって前記文字領域があると判定されたことに従って、当該文字を含む新たなセルを作成する作成手段とを有することを特徴とする。
<複写機の構成と情報処理装置の構成>
図1に本実施形態における複写機100の構成を示す。複写機100は、スキャナ101、送受信部102、プリンタ103より構成される。
複写機100のスキャナが文書をスキャンすると、スキャン画像(スキャン画像データとも言う)が生成される。生成されたスキャン画像を送受信部102が情報処理装置200に送信する。すると、情報処理装置200の送受信部201がこれを受信し、保存部202にそのスキャン画像を保存する。
(1)二値化
制御部203は、スキャン画像に対して2値化を行うことにより、2値画像を得る。この2値化により、スキャン画像における閾値より濃い色の画素は黒画素、その閾値より薄い色の画素は白画素となる。なお、以下では、スキャン画像が100DPIであるものとして説明を行うが、スキャン画像がこの解像度に限られないのは言うまでもない。
制御部203は、2値画像に対して8連結で繋がる黒画素の輪郭を追跡することにより、8方向の何れかの方向で連続して存在する黒画素の塊(黒画素塊)を検出する。8連結とは、左上、左、左下、下、右下、右、右上、上の8つの方向の何れかで、同じ色(今回のケースでは黒)の画素が連続しているという意味である。一方、4連結とは、左、下、右、上の4つの方向の何れかで同じ色の画素が連続しているという意味である。この(2)では、8方向に存在する8つの隣接画素の何れもが黒画素ではない単独の黒画素は検出されない。一方、8方向に存在する8つの隣接画素の何れか1つにでも黒画素が存在する黒画素は、その隣接する黒画素と共に、黒画素塊として検出されることになる。図23の2301は制御部203が検出した黒画素塊の一例である。また制御部203は、検出した黒画素塊の外接矩形の位置情報(四頂点のX、Y座標情報のこと)を算出する。なお、X軸は右方向に伸び、Y軸は下方向に伸びているものとする。幅は、X軸方向の長さ、高さは、Y軸方向の長さを指す。図23の2302は黒画素塊2301の外接矩形である。なお、本明細書で矩形と表現した時には、斜め向きの矩形は含まれず、四辺の全てがX座標軸、Y座標軸の何れかと平行な矩形を表す。
制御部203は検出した黒画素塊が以下の全ての条件に該当するか判定し、全てに該当する黒画素塊を表の枠線を構成する黒画素塊であると判定する。
制御部203は、表領域内部の認識セルを特定する。認識セルを特定するためには、表領域内部の白画素の輪郭を追跡することにより、白画素塊を検出する必要がある。その上で、その白画素塊が所定の条件に合致する場合に、その白画素塊の外接矩形は、認識セルとして特定される。図23の2303、2304は、制御部203が特定した認識セルである。制御部203は、特定された認識セルの位置情報を保存部202に保存する。
制御部203は、各認識セルの内部に、その各認識セルに内接する白画素塊によって囲まれた黒画素塊があるか判定する。そして、黒画素塊があると判定した場合、あると判定された全ての黒画素塊に外接矩形を設定する。
制御部203は、各文字領域に対して文字認識を行うことによって、各文字領域に対応する認識文字を得る。認識文字は、対応する文字領域に関連付けて保存部202に保存する。そうすることによって、認識文字は、文字領域と予め関連付けられている認識セルとも関連付けられることになる。文字認識を行わない場合、もしくは文字認識に失敗した場合は、文字領域に関連付けられる認識文字はない。
制御部203は、各認識セルの四辺(即ち、外接矩形の四辺)に太線枠を付けてスキャン画像を表示部204に表示する。表示された画面は図5となっている。なお、枠の形態は、太線でなくても実線でなくても良く、黒でなくても良いのは言うまでも無いが、これ以降は、太線であるものとして説明を続ける。また、この(7)で太線枠と共に表示されるスキャン画像は、(1)−(6)の処理が行われる前のスキャン画像であり、即ち、2値化前のスキャン画像である。
ユーザが受付部205を介して、表示部204に表示されている図5における任意の箇所をクリックする。なお、本明細書においてクリックとは、マウスの左ボタンを押して、すぐに(押してから一定時間内に)離す行為のことである。クリックされた箇所が認識セルの外接矩形の内側の場合に、制御部203は、その認識セルが選択されたと判定する(S801)。図6に、認識セル602が選択された際に表示される表示画面を示す。ここでは、認識セル602が選択されたものとして以下説明を続ける。なお、601は、受付部205を介してユーザが指し示している場所を示すマウスポインタである。
S901では、制御部203は、認識セル位置変更ハンドル603を非表示にする。
上述の通り、ユーザが受付部205に対して行った操作が認識セル位置変更ハンドル603に対する操作であれば、制御部203は、S804(図10のS1001)に処理を進める。
図11を用いて、S905.1の処理の詳細を説明する。
左側の余白 x1−X1
右側の余白 X2−x2
(左側の余白)≧(右側の余白)ならば、基準線は文字領域の右辺、すなわち、(x2,y2),(x2,y2)を結ぶ直線に設定される。
(左側の余白)<(右側の余白)ならば、基準線は文字領域の左辺、すなわち、(x1,y1),(x1,y2)を結ぶ直線に設定される。
左上座標(x2−W,y2−H)
右下座標(x2,y2)
となる。
左上座標(x1,y2−H)
右下座標(x1+W,y2)
となる。
図4において、認識セル406と認識セル407は、本来は単一のセルであるにも関わらず、ノイズの関係で別々の認識セルとして特定されている。認識セル406と認識セル407を結合して、単一の認識セルとする手段について、図15を用いて説明する。なお図15は、図10のS1001の認識セル位置変更の処理の詳細を示す。
図20−23を用いて、S904の詳細を説明する。
ρ=Xb1cosθ+Yb1sinθ・・・式1
この式1が表す直線を図19に図示する。
第1の実施形態では、認識セルを縮小することで認識セルを分割する方法について述べた。それに対して本実施例では、別の手段で認識セルを分割する方法について述べる。
図24と図25を用いて本実施例を説明する。図24は本実施例のフローチャートであり、図25は図24を補足説明するための図である。
本実施形態では、認識セルを分割する位置をユーザが決定する際に、分割する位置をスキャン画像の内容に合わせて自動的に調整する方法について述べる。
図29は図5の認識セルの枠を表示する表示画面のうち、表領域の部分を記載したものであり、認識セル403が選択された状態である。
図30は認識セル403の右側付近を拡大して表示したものである。3002はスキャン画像内の「A」というオリジナル文字を示す。3003はオリジナル文字「A」の外接矩形である。3004〜3012も同様である。
図26、図27、図28を用いて、分割位置を自動的に調整する方法について記載する。図26、図27の処理では、分割位置を自動的に調整するために必要な情報を保存部202に保存する。その情報を使用して図28の処理で分割位置を自動的に調整する。
図27は、<第1の実施形態>の「(5)認識セル内の文字領域の特定」で説明した処理に対して、必要な情報を保存する処理を追加したフローチャートである。
S1502で認識セルの縮小と判定された場合に、制御部203が、選択されている認識セルが、表領域内にあるかどうかを判定する(S2801)。具体的にはS2602で保存した表領域の座標と、認識セルの座標を元に判定する。
x1−w<x<x1+w
x2−w<x<x2+w
x3−w<x<x3+w
のいずれかを満たすかどうかを判定する。wは任意の数値であるが、例えば0.1などの小さい値がのぞましい。
x2−w<x<x2+w
を満たす場合は、制御部203は、認識セルのx座標をx2に変更する。本処理により、図26で説明した問題が解決する。
X1<Xb<X2
とする。つまり位置変更後の認識セルの座標が、外接矩形に含まれているとする。このとき、制御部203は、
Xb−X1>X2−Xb
を満たすかどうかを判定する。満たす場合は、制御部203は、Xbの値をX2に変更する。満たさない場合はXbの値をX1に変更する。すなわち、外接矩形の左右の近い方に、認識セルの位置を変更する。本処理により、図27で説明した問題が解決する。
本発明は、上述の実施形態の1以上の機能を実現するプログラムを、ネットワーク又は記憶媒体を介してシステム又は装置に供給し、そのシステム又は装置のコンピュータにおける1つ以上のプロセッサーがプログラムを読出し実行する処理でも実現可能である。また、1以上の機能を実現する回路(例えば、ASIC)によっても実現可能である。
Claims (13)
- 画像に含まれるテーブル内の複数のセルを表示するように制御する第1表示制御手段と、
前記表示された前記複数のセルの中から、ユーザの指示に基づいて1つのセルを選択する選択手段と、
前記選択手段によって選択された1つのセルの大きさを変更するためのハンドルを更に表示するように制御する第2表示制御手段と、
前記ユーザによる前記ハンドルの操作に応じて、前記選択手段によって選択された1つのセルを縮小する縮小手段と、
前記縮小手段によって縮小される前の前記1つのセルに含まれ且つ前記縮小手段によって縮小された後のセルに含まれない文字領域があるか否かを判定する判定手段と、
前記判定手段によって前記文字領域があると判定されたことに従って、当該文字領域を含む新たなセルを作成する作成手段と
を有することを特徴とする情報処理装置。 - 前記作成手段は、前記縮小手段によって縮小される前の前記1つのセルを、前記縮小手段によって縮小された後の領域と、それ以外の領域に分割することによって、前記新たなセルを作成することを特徴とする請求項1に記載の情報処理装置。
- 前記第1表示制御手段により表示される前記複数のセルは、それぞれ、4つの辺に囲まれる矩形の領域であることを特徴とする請求項1または2に記載の情報処理装置。
- 前記縮小手段は、前記ユーザによる前記ハンドルの操作で指示された位置が前記テーブルの罫線の座標位置におおよそ等しいと判断した場合、当該おおよそ等しいと判断した前記テーブルの罫線の座標位置に合うように、前記第1のセルの大きさを変更することを特徴とする請求項1乃至3の何れか1項に記載の情報処理装置。
- 原稿の画像を読み取る読取手段をさらに有し、
前記第1の表示制御手段は、前記読取手段によって読み取られた前記画像に含まれるテーブル内の複数のセルを表示するように制御することを特徴とする請求項1乃至4のいずれか1項に記載の情報処理装置。 - 前記ユーザによる前記ハンドルの操作に応じて、前記選択手段によって選択された1つのセルを拡大する拡大手段をさらに有することを特徴とする請求項1乃至5のいずれか1項に記載の情報処理装置。
- コンピュータを、請求項1乃至6の何れか1項に記載の情報処理装置の各手段として機能させるためのプログラム。
- 情報処理装置の第1表示制御手段が、画像に含まれるテーブル内の複数のセルを表示するように制御する第1表示制御工程と、
前記情報処理装置の選択手段が、前記表示された前記複数のセルの中から、ユーザの指示に基づいて1つのセルを選択する選択工程と、
前記選択工程で選択された1つのセルの大きさを変更するためのハンドルを更に表示するように制御する第2表示制御工程と、
前記情報処理装置の縮小手段が、前記ユーザによる前記ハンドルの操作に応じて、前記選択工程で選択された1つのセルを縮小する縮小工程と、
前記情報処理装置の作成手段が、前記縮小工程で縮小される前の前記1つのセルに含まれ且つ前記縮小工程で縮小された後のセルに含まれない文字領域があるか否かを判定する判定工程と、
前記判定工程で前記文字があると判定されたことに従って、当該文字領域を含む新たなセルを作成する作成工程と
を有することを特徴とする情報処理方法。 - 前記作成工程では、前記縮小手段によって縮小される前の前記1つのセルを、前記縮小手段によって縮小された後の領域と、それ以外の領域に分割することによって、前記新たなセルを作成することを特徴とする請求項8に記載の情報処理方法。
- 前記第1表示制御工程で表示される前記複数のセルは、それぞれ、4つの辺に囲まれる矩形の領域であることを特徴とする請求項8または9の何れか1項に記載の情報処理方法。
- 前記縮小工程では、前記ユーザによる前記ハンドルの操作で指示された位置が前記テーブルの罫線の座標位置におおよそ等しいと判断した場合、当該おおよそ等しいと判断した前記テーブルの罫線の座標位置に合うように、前記第1のセルの大きさを変更することを特徴とする請求項8乃至10の何れか1項に記載の情報処理方法。
- 原稿の画像を読み取る読取工程をさらに有し、
前記第1の表示制御工程では、前記読取工程で読み取られた前記画像に含まれるテーブル内の複数のセルを表示するように制御することを特徴とする請求項8乃至11のいずれか1項に記載の情報処理方法。 - 前記ユーザによる前記ハンドルの操作に応じて、前記選択工程で選択された1つのセルを拡大する拡大手段をさらに有することを特徴とする請求項8乃至12のいずれか1項に記載の情報処理方法。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2014139866A JP6452329B2 (ja) | 2014-07-07 | 2014-07-07 | 情報処理装置、情報処理方法、プログラム |
US14/789,205 US10607381B2 (en) | 2014-07-07 | 2015-07-01 | Information processing apparatus |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2014139866A JP6452329B2 (ja) | 2014-07-07 | 2014-07-07 | 情報処理装置、情報処理方法、プログラム |
Publications (3)
Publication Number | Publication Date |
---|---|
JP2016018327A JP2016018327A (ja) | 2016-02-01 |
JP2016018327A5 JP2016018327A5 (ja) | 2017-08-17 |
JP6452329B2 true JP6452329B2 (ja) | 2019-01-16 |
Family
ID=55233523
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2014139866A Expired - Fee Related JP6452329B2 (ja) | 2014-07-07 | 2014-07-07 | 情報処理装置、情報処理方法、プログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP6452329B2 (ja) |
Family Cites Families (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH0916566A (ja) * | 1995-06-29 | 1997-01-17 | Canon Inc | 文書処理装置及び方法 |
JPH11110479A (ja) * | 1997-10-02 | 1999-04-23 | Canon Inc | 文字処理方法及び装置及び記憶媒体 |
JP4235286B2 (ja) * | 1998-09-11 | 2009-03-11 | キヤノン株式会社 | 表認識方法及び装置 |
JP4208520B2 (ja) * | 2002-08-26 | 2009-01-14 | キヤノン株式会社 | 画像処理装置および画像処理方法、プログラムおよび記憶媒体 |
JP5541202B2 (ja) * | 2011-03-16 | 2014-07-09 | コニカミノルタ株式会社 | スプレッドシートデータ生成装置およびプログラム |
-
2014
- 2014-07-07 JP JP2014139866A patent/JP6452329B2/ja not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
JP2016018327A (ja) | 2016-02-01 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6463066B2 (ja) | 情報処理装置、情報処理方法、プログラム | |
EP2966578B1 (en) | Information processing apparatus, information processing method, program, and storage medium | |
JP5984439B2 (ja) | 画像表示装置、画像表示方法 | |
US10607381B2 (en) | Information processing apparatus | |
US10222971B2 (en) | Display apparatus, method, and storage medium | |
CN107133615B (zh) | 信息处理设备和信息处理方法 | |
US10296559B2 (en) | Display apparatus, control method therefor, and storage medium | |
JP2003298837A (ja) | 電子画像を作成し操作するための図形入力及び表示システム、表示装置に入力されたソース電子画像を意味のある画像オブジェクトに編成するための方法、及びコンピュータ読取り可能プログラムコードが組み込まれたコンピュータ使用可能媒体を含む製品 | |
EP3671539B1 (en) | Method for image processing, and image-processing system | |
JP4655335B2 (ja) | 画像認識装置、画像認識方法および画像認識プログラムを記録したコンピュータ読取可能な記録媒体 | |
US8970860B2 (en) | Image processing device that displays process sequence, display device and non-transitory computer readable recording medium | |
US9678642B2 (en) | Methods of content-based image area selection | |
US8355577B2 (en) | Image processing apparatus and method | |
JP5590960B2 (ja) | 画像形成装置、画像形成方法およびプログラム | |
JP6452329B2 (ja) | 情報処理装置、情報処理方法、プログラム | |
JP6489768B2 (ja) | 情報処理装置、情報処理方法、プログラム | |
US11588945B2 (en) | Data input support apparatus that displays a window with an item value display area, an overview image display area, and an enlarged image display area | |
US10404872B2 (en) | Multi-function device with selective redaction | |
JP6370162B2 (ja) | 情報処理装置、情報処理方法、プログラム | |
JP7329957B2 (ja) | 仮想オブジェクト表示装置、及びプログラム | |
JP2014211747A (ja) | 画像処理装置、端末装置、情報処理方法及びプログラム | |
JP2015049656A (ja) | 情報処理装置、方法及びプログラム | |
JP2019195117A (ja) | 情報処理装置、情報処理方法、及びプログラム | |
JP6680203B2 (ja) | 編集支援装置及び編集支援方法 | |
JP2023040886A (ja) | 画像処理装置、方法及びプログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20170706 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20170706 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20180612 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20180731 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20180928 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20181113 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20181211 |
|
R151 | Written notification of patent or utility model registration |
Ref document number: 6452329 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R151 |
|
LAPS | Cancellation because of no payment of annual fees |