JP6489768B2 - 情報処理装置、情報処理方法、プログラム - Google Patents
情報処理装置、情報処理方法、プログラム Download PDFInfo
- Publication number
- JP6489768B2 JP6489768B2 JP2014139867A JP2014139867A JP6489768B2 JP 6489768 B2 JP6489768 B2 JP 6489768B2 JP 2014139867 A JP2014139867 A JP 2014139867A JP 2014139867 A JP2014139867 A JP 2014139867A JP 6489768 B2 JP6489768 B2 JP 6489768B2
- Authority
- JP
- Japan
- Prior art keywords
- area
- character
- recognition
- cell
- region
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Landscapes
- Character Input (AREA)
- Editing Of Facsimile Originals (AREA)
Description
<複写機の構成と情報処理装置の構成>
図1に本実施形態における複写機100の構成を示す。複写機100は、スキャナ101、送受信部102、プリンタ103より構成される。
複写機100のスキャナが文書をスキャンすると、スキャン画像(スキャン画像データとも言う)が生成される。生成されたスキャン画像を送受信部102が情報処理装置200に送信する。すると、情報処理装置200の送受信部201がこれを受信し、保存部202にそのスキャン画像を保存する。
(1)二値化
制御部203は、スキャン画像に対して2値化を行うことにより、2値画像を得る。この2値化により、スキャン画像における閾値より濃い色の画素は黒画素、その閾値より薄い色の画素は白画素となる。なお、以下では、スキャン画像が100DPIであるものとして説明を行うが、スキャン画像がこの解像度に限られないのは言うまでもない。
制御部203は、2値画像に対して8連結で繋がる黒画素の輪郭を追跡することにより、8方向の何れかの方向で連続して存在する黒画素の塊(黒画素塊)を検出する。8連結とは、左上、左、左下、下、右下、右、右上、上の8つの方向の何れかで、同じ色(今回のケースでは黒)の画素が連続しているという意味である。一方、4連結とは、左、下、右、上の4つの方向の何れかで同じ色の画素が連続しているという意味である。この(2)では、8方向に存在する8つの隣接画素の何れもが黒画素ではない単独の黒画素は検出されない。一方、8方向に存在する8つの隣接画素の何れか1つにでも黒画素が存在する黒画素は、その隣接する黒画素と共に、黒画素塊として検出されることになる。図23の2301は制御部203が検出した黒画素塊の一例である。また制御部203は、検出した黒画素塊の外接矩形の位置情報(四頂点のX、Y座標情報のこと)を算出する。なお、X軸は右方向に伸び、Y軸は下方向に伸びているものとする。幅は、X軸方向の長さ、高さは、Y軸方向の長さを指す。図23の2302は黒画素塊2301の外接矩形である。なお、本明細書で矩形と表現した時には、斜め向きの矩形は含まれず、四辺の全てがX座標軸、Y座標軸の何れかと平行な矩形を表す。
制御部203は検出した黒画素塊が以下の全ての条件に該当するか判定し、全てに該当する黒画素塊を表の枠線を構成する黒画素塊であると判定する。
制御部203は、表領域内部の認識セルを特定する。認識セルを特定するためには、表領域内部の白画素の輪郭を追跡することにより、白画素塊を検出する必要がある。その上で、その白画素塊が所定の条件に合致する場合に、その白画素塊の外接矩形は、認識セルとして特定される。図23の2303、2304は、制御部203が特定した認識セルである。制御部203は、特定された認識セルの位置情報を保存部202に保存する。
制御部203は、各認識セルの内部に、その各認識セルに内接する白画素塊によって囲まれた黒画素塊があるか判定する。そして、黒画素塊があると判定した場合、あると判定された全ての黒画素塊に外接矩形を設定する。
制御部203は、各文字領域に対して文字認識を行うことによって、各文字領域に対応する認識文字を得る。認識文字は、対応する文字領域に関連付けて保存部202に保存する。そうすることによって、認識文字は、文字領域と予め関連付けられている認識セルとも関連付けられることになる。文字認識を行わない場合、もしくは文字認識に失敗した場合は、文字領域に関連付けられる認識文字はない。
制御部203は、各認識セルの四辺(即ち、外接矩形の四辺)に太線枠を付けてスキャン画像を表示部204に表示する。表示された画面は図5となっている。なお、枠の形態は、太線でなくても実線でなくても良く、黒でなくても良いのは言うまでも無いが、これ以降は、太線であるものとして説明を続ける。また、この(7)で太線枠と共に表示されるスキャン画像は、(1)−(6)の処理が行われる前のスキャン画像であり、即ち、2値化前のスキャン画像である。
ユーザが受付部205を介して、表示部204に表示されている図5における任意の箇所をクリックする。なお、本明細書においてクリックとは、マウスの左ボタンを押して、すぐに(押してから一定時間内に)離す行為のことである。クリックされた箇所が認識セルの外接矩形の内側の場合に、制御部203は、その認識セルが選択されたと判定する(S801)。図6に、認識セル602が選択された際に表示される表示画面を示す。ここでは、認識セル602が選択されたものとして以下説明を続ける。なお、601は、受付部205を介してユーザが指し示している場所を示すマウスポインタである。
S901では、制御部203は、認識セル位置変更ハンドル603を非表示にする。
上述の通り、ユーザが受付部205に対して行った操作が認識セル位置変更ハンドル603に対する操作であれば、制御部203は、S804(図10のS1001)に処理を進める。
図11を用いて、S905.1の処理の詳細を説明する。
左側の余白 x1−X1
右側の余白 X2−x2
(左側の余白)≧(右側の余白)ならば、基準線は文字領域の右辺、すなわち、(x2,y2)、(x2,y2)を結ぶ直線に設定される。
(左側の余白)<(右側の余白)ならば、基準線は文字領域の左辺、すなわち、(x1,y1)、(x1,y2)を結ぶ直線に設定される。
左上座標(x2−W,y2−H)
右下座標(x2,y2)
となる。
左上座標(x1,y2−H)
右下座標(x1+W,y2)
となる。
図4において、認識セル406と認識セル407は、本来は単一のセルであるにも関わらず、ノイズの関係で別々の認識セルとして特定されている。認識セル406と認識セル407を結合して、単一の認識セルとする手段について、図15を用いて説明する。なお図15は、図10のS1001の認識セル位置変更の処理の詳細を示す。
図20−23を用いて、S904の詳細を説明する。
ρ=Xb1cosθ+Yb1sinθ・・・式1
この式1が表す直線を図19に図示する。
前記第1の実施形態では、認識セルを拡大することで認識セルを結合する方法について述べた。これに対して本実施例では、認識セルをドラッグして認識セルを結合する方法について述べる。
まず、ユーザは認識セルをドラッグして、認識セルの位置を変更する(S2401)。
S1×(N÷100)<S
S2×(N÷100)<S
のいずれかを満たすかどうかを制御部203は判定する。例えば、N=80の場合、面積Sの大きさが、各認識セルのいずれかの面積の80%よりも大きいことを示す。つまり、位置変更後の認識セルと、他の認識セルの両方を含む領域がある程度大きければ、2つの認識セルは重なっていると判定する。
図25は、図12の認識セル406が選択状態にある表示画面から、認識セル406の位置を変更している表示画面を示す図である。ユーザは認識セル407の認識セル位置変更ハンドル2501をマウス601でドラッグし、認識セル407に重ねている。図24の処理に従い、制御部203は認識セル406と認識セル407を結合する。認識セルを結合したあとは、図14で示した表示画面になる。
本実施形態では、前記第1、第2の実施形態とは別の手段で認識セルを結合する方法について述べる。本実施例は受付部205と表示部204がタッチパネルであることを想定している。
まず、ユーザは、表示部204に対してピンチインの操作をおこなう(S2601)。ピンチインとは、ユーザが2本の指で表示部204の任意の場所をつまむように動かす操作のことであり、一般的には表示画面を縮小させるための操作である。
図27は、図12の認識セル406が選択状態にある表示画面から、ユーザが表示部204をピンチインしているところを示す図である。図27では、認識セル406が選択された状態である。ユーザは2本の指2701で認識セル406と認識セル407をタッチして、ピンチインの操作を行う。この操作により、制御部203は認識セル406と認識セル407を結合する。認識セルを結合したあとは、図14で示した表示画面になる。
第1の実施形態では、認識セルを拡大して、別の認識セルを包含する場合に認識セルを結合することについて述べた。それに対して本実施例では、認識セルを拡大して、別の認識セルを包含しなくても、ある程度認識セルが重なっていれば認識セルを結合する手段について述べる。
図28、図29は本実施例で解決する課題を説明するための図である。
図30では、図28、図29で説明した本実施例の課題を解決する。
S1×(N÷100)<S
S2×(N÷100)<S
のいずれかを満たすかどうかを判定する。例えば、N=80の場合、面積Sの大きさが、各認識セルのいずれかの面積の80%よりも大きいことを示す。
本発明は、上述の実施形態の1以上の機能を実現するプログラムを、ネットワーク又は記憶媒体を介してシステム又は装置に供給し、そのシステム又は装置のコンピュータにおける1つ以上のプロセッサーがプログラムを読出し実行する処理でも実現可能である。また、1以上の機能を実現する回路(例えば、ASIC)によっても実現可能である。
Claims (9)
- 画像と、前記画像を解析することにより特定された複数の領域とを表示するように制御する第1表示制御手段と、
前記表示された複数の領域の中から、ユーザの指示に基づいて第1の領域を選択する選択手段と、
前記選択手段で選択された前記第1の領域の頂点の位置を変更するための指示を前記ユーザから受付ける受付手段と、
前記指示に応じて頂点の位置が変更された前記第1の領域が、前記表示された複数の領域の中の第2の領域を含んでいるか否かを判定し、前記指示に応じて頂点の位置が変更された前記第1の領域が、前記表示された複数の領域の中の第2の領域を含んでいると判定したことに従って、前記第1の領域と前記第2の領域とを結合する結合手段と
を有することを特徴とする情報処理装置。 - 前記第1の領域と前記第2の領域はそれぞれ文字領域を含み、
前記指示に応じて頂点の位置が変更された前記第1の領域が前記第2の領域を含む場合、前記結合手段は、前記第1の領域と前記第2の領域とを結合し、さらに、前記第1の領域に含まれる文字領域と前記第2の領域に含まれる文字領域とを結合することを特徴とする請求項1に記載の情報処理装置。 - 前記第1の領域と前記第2の領域それぞれに含まれる文字領域に対して文字認識処理を行うことによって、各文字領域に対応する文字認識結果の認識文字を得る文字認識手段を、さらに有し、
前記指示に応じて頂点の位置が変更された前記第1の領域が前記第2の領域を含む場合、前記結合手段は、前記第1の領域と前記第2の領域とを結合し、さらに、前記第1の領域に含まれる文字領域と前記第2の領域に含まれる文字領域とを結合し、さらに、前記第1の領域に含まれる文字領域に対応する文字認識結果の認識文字と前記第2の領域に含まれる文字領域に対応する文字認識結果の認識文字とを結合することを特徴とする請求項2に記載の情報処理装置。 - 前記選択手段で第1の領域が選択された場合、前記第1の領域の頂点の位置を変更するためのハンドルを前記第1の領域の各頂点に対応付けて更に表示するように制御する第2表示制御手段を、さらに有し、
前記受付手段は、前記ユーザによる前記ハンドルの操作に基づいて、前記選択手段で選択された前記第1の領域の頂点の位置を変更するための指示を受付けることを特徴とする請求項1乃至3の何れか1項に記載の情報処理装置。 - 前記第1表示制御手段により表示される前記複数の領域は、表領域を構成する複数のセルそれぞれに含まれる白画素塊の外接矩形であることを特徴とする請求項1乃至4の何れか1項に記載の情報処理装置。
- 前記指示に応じて頂点の位置が変更された前記第1の領域が、前記第2の領域を含まない場合、前記結合手段は、前記第1の領域と前記第2の領域とを結合しないことを特徴とする請求項1乃至5の何れか1項に記載の情報処理装置。
- 前記指示に応じた頂点の位置の変更により前記第1の領域が縮小される場合、前記位置の変更が為される前の前記第1の領域に含まれ且つ前記位置の変更が為された後の当該縮小された前記第1の領域に含まれない新たな第3の領域を作成する作成手段を、さらに有することを特徴とする請求項1乃至6の何れか1項に記載の情報処理装置。
- コンピュータを、請求項1乃至7の何れか1項に記載の情報処理装置の各手段として機能させるためのプログラム。
- 情報処理装置の表示制御手段が、画像と、前記画像を解析することにより特定された複数の領域とを表示するように制御する表示制御工程と、
前記情報処理装置の選択手段が、前記表示された複数の領域の中から、ユーザの指示に基づいて第1の領域を選択する選択工程と、
前記情報処理装置の受付手段が、前記選択工程で選択された前記第1の領域の頂点の位置を変更するための指示を前記ユーザから受付ける受付工程と、
前記指示に応じて頂点の位置が変更された前記第1の領域が、前記表示された複数の領域の中の第2の領域を含んでいるか否かを判定し、前記指示に応じて頂点の位置が変更された前記第1の領域が、前記表示された複数の領域の中の第2の領域を含んでいると判定したことに従って、前記情報処理装置の結合手段が、前記第1の領域と前記第2の領域とを結合する結合工程とを有することを特徴とする情報処理方法。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2014139867A JP6489768B2 (ja) | 2014-07-07 | 2014-07-07 | 情報処理装置、情報処理方法、プログラム |
US14/789,205 US10607381B2 (en) | 2014-07-07 | 2015-07-01 | Information processing apparatus |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2014139867A JP6489768B2 (ja) | 2014-07-07 | 2014-07-07 | 情報処理装置、情報処理方法、プログラム |
Publications (3)
Publication Number | Publication Date |
---|---|
JP2016019099A JP2016019099A (ja) | 2016-02-01 |
JP2016019099A5 JP2016019099A5 (ja) | 2017-08-17 |
JP6489768B2 true JP6489768B2 (ja) | 2019-03-27 |
Family
ID=55234036
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2014139867A Active JP6489768B2 (ja) | 2014-07-07 | 2014-07-07 | 情報処理装置、情報処理方法、プログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP6489768B2 (ja) |
Family Cites Families (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH08161306A (ja) * | 1994-12-05 | 1996-06-21 | Sharp Corp | 表編集装置 |
JPH0916566A (ja) * | 1995-06-29 | 1997-01-17 | Canon Inc | 文書処理装置及び方法 |
JP4235286B2 (ja) * | 1998-09-11 | 2009-03-11 | キヤノン株式会社 | 表認識方法及び装置 |
JP2001067425A (ja) * | 1999-08-25 | 2001-03-16 | Casio Comput Co Ltd | 表データ処理装置、及び記憶媒体 |
JP4973063B2 (ja) * | 2006-08-14 | 2012-07-11 | 富士通株式会社 | 表データ処理方法及び装置 |
JP2014115894A (ja) * | 2012-12-11 | 2014-06-26 | Canon Inc | 表示装置 |
-
2014
- 2014-07-07 JP JP2014139867A patent/JP6489768B2/ja active Active
Also Published As
Publication number | Publication date |
---|---|
JP2016019099A (ja) | 2016-02-01 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
EP2966578B1 (en) | Information processing apparatus, information processing method, program, and storage medium | |
JP6463066B2 (ja) | 情報処理装置、情報処理方法、プログラム | |
US10607381B2 (en) | Information processing apparatus | |
US10222971B2 (en) | Display apparatus, method, and storage medium | |
US20030179235A1 (en) | Method and system for overloading loop selection commands in a system for selecting and arranging visible material in document images | |
JP5882779B2 (ja) | 画像処理装置、画像処理装置の制御方法及びプログラム | |
US9843691B2 (en) | Image display device, image display system, image display method, and computer-readable storage medium for computer program | |
CN107133615B (zh) | 信息处理设备和信息处理方法 | |
US20160349968A1 (en) | Methods of Content-Based Image Area Selection | |
JP5981175B2 (ja) | 図面表示装置、及び図面表示プログラム | |
US11132122B2 (en) | Handwriting input apparatus, handwriting input method, and non-transitory recording medium | |
JP6053291B2 (ja) | 画像処理装置、画像処理装置の制御方法、及びプログラム | |
JP6241320B2 (ja) | 画像処理装置、画像処理方法、画像処理システムおよびプログラム | |
US9195915B2 (en) | Printing apparatus, method of changing layout, and storage medium | |
JP6489768B2 (ja) | 情報処理装置、情報処理方法、プログラム | |
RU2458396C1 (ru) | Способ редактирования статических цифровых комбинированных изображений, включающих в себя изображения нескольких объектов | |
JP6452329B2 (ja) | 情報処理装置、情報処理方法、プログラム | |
JP6370162B2 (ja) | 情報処理装置、情報処理方法、プログラム | |
US11588945B2 (en) | Data input support apparatus that displays a window with an item value display area, an overview image display area, and an enlarged image display area | |
US20130208313A1 (en) | Image processing apparatus, method for controlling image processing apparatus, and program | |
JP7329957B2 (ja) | 仮想オブジェクト表示装置、及びプログラム | |
KR100769677B1 (ko) | 화상형성장치 및 시스템의 제어방법 | |
JP6242427B2 (ja) | 印刷装置、レイアウト変更方法、及びプログラム | |
JP2001282405A (ja) | 座標入力装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20170706 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20170706 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20180427 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20180515 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20180713 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20180904 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20181203 |
|
A911 | Transfer to examiner for re-examination before appeal (zenchi) |
Free format text: JAPANESE INTERMEDIATE CODE: A911 Effective date: 20181211 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20190129 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20190226 |
|
R151 | Written notification of patent or utility model registration |
Ref document number: 6489768 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R151 |