JP2018124918A - 画像処理装置、画像処理方法及びプログラム - Google Patents
画像処理装置、画像処理方法及びプログラム Download PDFInfo
- Publication number
- JP2018124918A JP2018124918A JP2017018788A JP2017018788A JP2018124918A JP 2018124918 A JP2018124918 A JP 2018124918A JP 2017018788 A JP2017018788 A JP 2017018788A JP 2017018788 A JP2017018788 A JP 2017018788A JP 2018124918 A JP2018124918 A JP 2018124918A
- Authority
- JP
- Japan
- Prior art keywords
- character string
- image
- input information
- detection range
- unit
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/14—Image acquisition
- G06V30/1444—Selective acquisition, locating or processing of specific regions, e.g. highlighted text, fiducial marks or predetermined fields
- G06V30/1456—Selective acquisition, locating or processing of specific regions, e.g. highlighted text, fiducial marks or predetermined fields based on user interactions
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/94—Hardware or software architectures specially adapted for image or video understanding
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/14—Image acquisition
- G06V30/146—Aligning or centring of the image pick-up or image-field
- G06V30/147—Determination of region of interest
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/14—Image acquisition
- G06V30/146—Aligning or centring of the image pick-up or image-field
- G06V30/1475—Inclination or skew detection or correction of characters or of image to be recognised
- G06V30/1478—Inclination or skew detection or correction of characters or of image to be recognised of characters or characters lines
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/14—Image acquisition
- G06V30/148—Segmentation of character regions
- G06V30/153—Segmentation of character regions using recognition of characters or words
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
Abstract
Description
図1は実施形態の画像処理装置100の機能構成の例を示す図である。実施形態の画像処理装置100は、取得部1、表示部2、入力部3、受付部4、特定部5及び検出部6を備える。画像処理装置100は任意の装置でよい。画像処理装置100は、例えばスマートデバイス、パーソナルコンピュータ及びカメラ等である。
図2Aは実施形態の入力情報201aの例を示す図である。図2Aの例では、入力情報201aは点を示す。図2Aの例の場合、特定部5は、入力情報201aを(x,y)により特定する。
4つの頂点(X1,Y1)〜(X4,Y4)により文字列領域204が特定される場合を例にして、入力情報201b(図3参照)の位置と文字列領域204との距離を算出する方法について説明する。
次に実施形態の変形例1について説明する。実施形態の変形例1の説明では、実施形態と同様の説明については省略し、実施形態と異なる箇所について説明する。実施形態の変形例1の説明では、文字列の検出範囲を限定する場合について説明する。
図5は実施形態の変形例1の検出範囲の例を示す図である。はじめに、特定部5が、ユーザの操作入力によって入力された入力情報201bを特定する。次に、検出部6が、入力情報201bに外接する四角形領域202を検出する。次に、検出部6が、四角形領域202を、所定の倍率で上下左右に拡大することにより、検出範囲203を設定する。そして検出部6は、入力情報201を含む領域として限定された検出範囲203から、文字列領域204を検出する。
次に実施形態の変形例2について説明する。実施形態の変形例2の説明では、実施形態と同様の説明については省略し、実施形態と異なる箇所について説明する。実施形態の変形例2の説明では、入力情報201bの方向、及び、文字列の方向を考慮して、文字列を検出する場合について説明する。
特定部5は、入力情報201bの方向を特定する。具体的には、特定部5は、入力情報201bの点列p(k)=(xk,yk)(k=1,2,…,K)から、下記式(4)により平均ベクトルを算出する。
次に実施形態の変形例3について説明する。実施形態の変形例3の説明では、実施形態の変形例2と同様の説明については省略し、実施形態の変形例2と異なる箇所について説明する。実施形態の変形例3の説明では、入力情報201bの方向、及び、文字列の方向を考慮して、検出範囲203を設定する場合について説明する。
次に実施形態の変形例4について説明する。実施形態の変形例4の説明では、実施形態の変形例2と同様の説明については省略し、実施形態の変形例2と異なる箇所について説明する。実施形態の変形例4の説明では、画像が撮像されたときの撮像部(カメラ等)の仰角に基づいて、文字列の検出範囲203を変更する場合について説明する。
検出部6は、第2検出範囲に含まれる文字列の方向が、水平又は垂直になるように第2検出範囲の画像を変換し、変換された第2検出範囲の画像から文字列を検出する。例えば、検出部6は、検出範囲203cの4頂点(X1,Y1),(X2,Y2),(X3,Y3),(X4,Y4)を、4頂点(0,0),(W,0),(W,H),(0,H)を有する幅W、高さHの長方形となるように変換する。具体的には、検出部6は、例えばホモグラフィ変換をすることにより、検出範囲203cを変換する。
次に実施形態の変形例5について説明する。実施形態の変形例5の説明では、実施形態の変形例1と同様の説明については省略し、実施形態の変形例1と異なる箇所について説明する。実施形態の変形例5の説明では、入力情報201の形状が、入力情報201b(図2B参照)のような線分でない場合について説明する。具体的には、入力情報201の形状が、入力情報201c(図2C参照)である場合を例にして説明する。
以上、説明したように、実施形態及び変形例1乃至5の画像処理装置100では、ユーザは、注目する文字列の位置を簡易な操作入力で指示することができる。例えば液晶タッチパネルを備えるスマートフォン及びタブレット等では、ユーザは、画像が表示された画面上で、文字列が表示された領域付近を、文字列方向に指で沿ってなぞる等の操作入力でよい。上述の実施形態及び変形例1乃至5の画像処理装置100によれば、ユーザの入力操作がなぞり操作のような簡易な操作入力であっても、ユーザにより注目された文字列の位置と行方向とを高精度に特定することができる。
図11は実施形態の画像処理装置100のハードウェア構成の例を示す図である。実施形態の画像処理装置100は、制御装置301、主記憶装置302、補助記憶装置303、表示装置304、入力装置305、通信装置306及び撮像装置307を備える。制御装置301、主記憶装置302、補助記憶装置303、表示装置304、入力装置305、通信装置306及び撮像装置307は、バス310を介して接続されている。
2 表示部
3 入力部
4 受付部
5 特定部
6 検出部
100 画像処理装置
301 制御装置
302 主記憶装置
303 補助記憶装置
304 表示装置
305 入力装置
306 通信装置
307 撮像装置
310 バス
Claims (9)
- 画像に対して入力された入力情報を受け付ける受付部と、
前記入力情報の位置を特定する特定部と、
前記位置との距離が他の文字列よりも小さい文字列を、前記画像から検出する検出部と、
を備える画像処理装置。 - 前記検出部は、前記文字列の検出範囲を、前記入力情報を含む領域に限定し、前記位置との距離が他の文字列よりも小さい文字列を、前記検出範囲から検出する、
請求項1に記載の画像処理装置。 - 前記特定部は、前記入力情報から、前記入力情報の方向を特定し、
前記検出部は、前記位置との距離が第1閾値以下であり、かつ、前記入力情報の方向との差が第2閾値以下の方向を有する文字列を、前記画像から検出する、
請求項1に記載の画像処理装置。 - 前記検出部は、前記入力情報の方向と平行な辺を有する検出範囲を設定し、前記位置との距離が前記第1閾値以下であり、かつ、前記入力情報の方向との差が前記第2閾値以下の方向を有する文字列を、前記検出範囲から検出する、
請求項3に記載の画像処理装置。 - 前記検出部は、前記画像が撮像されたときの撮像部の仰角が第3閾値未満の場合、前記文字列の方向と方向が一致する辺と、前記文字列の方向と方向が直行する辺と、により形成される第1検出範囲から、前記文字列を検出し、前記画像が撮像されたときの撮像部の仰角が第3閾値以上の場合、前記画像の垂直方向又は水平方向に方向が一致する辺と、前記文字列の方向と方向が一致する辺と、により形成される第2検出範囲から、前記文字列を検出する、
請求項3に記載の画像処理装置。 - 前記検出部は、前記第2検出範囲に含まれる文字列の方向が、水平又は垂直になるように前記第2検出範囲の画像を変換し、変換された前記第2検出範囲の画像から前記文字列を検出する、
請求項5に記載の画像処理装置。 - 前記検出部は、前記第1検出範囲に含まれる文字列の方向が、水平又は垂直になるように前記第1検出範囲の画像を変換し、変換された前記第1検出範囲の画像から前記文字列を検出する、
請求項5に記載の画像処理装置。 - 画像に対して入力された入力情報を受け付けるステップと、
前記入力情報の位置を特定するステップと、
前記位置との距離が他の文字列よりも小さい文字列を、前記画像から検出するステップと、
を含む画像処理方法。 - コンピュータを、
画像に対して入力された入力情報を受け付ける受付部と、
前記入力情報の位置を特定する特定部と、
前記位置との距離が他の文字列よりも小さい文字列を、前記画像から検出する検出部、
として機能させるためのプログラム。
Priority Applications (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2017018788A JP6530432B2 (ja) | 2017-02-03 | 2017-02-03 | 画像処理装置、画像処理方法及びプログラム |
US15/680,293 US10296802B2 (en) | 2017-02-03 | 2017-08-18 | Image processing device, image processing method, and computer program product |
EP17187732.7A EP3358502A1 (en) | 2017-02-03 | 2017-08-24 | Image processing device, image processing method and computer-readable medium |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2017018788A JP6530432B2 (ja) | 2017-02-03 | 2017-02-03 | 画像処理装置、画像処理方法及びプログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2018124918A true JP2018124918A (ja) | 2018-08-09 |
JP6530432B2 JP6530432B2 (ja) | 2019-06-12 |
Family
ID=59886994
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2017018788A Active JP6530432B2 (ja) | 2017-02-03 | 2017-02-03 | 画像処理装置、画像処理方法及びプログラム |
Country Status (3)
Country | Link |
---|---|
US (1) | US10296802B2 (ja) |
EP (1) | EP3358502A1 (ja) |
JP (1) | JP6530432B2 (ja) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US10528852B2 (en) | 2017-03-22 | 2020-01-07 | Kabushiki Kaisha Toshiba | Information processing apparatus, method and computer program product |
US10832100B2 (en) | 2017-03-22 | 2020-11-10 | Kabushiki Kaisha Toshiba | Target recognition device |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2018125926A1 (en) * | 2016-12-27 | 2018-07-05 | Datalogic Usa, Inc | Robust string text detection for industrial optical character recognition |
EP3644281A4 (en) * | 2017-06-20 | 2021-04-28 | Sony Interactive Entertainment Inc. | CALIBRATION DEVICE, CALIBRATION CHART, CHART PATTERN GENERATING DEVICE, AND CALIBRATION PROCEDURE |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2006119942A (ja) * | 2004-10-22 | 2006-05-11 | Hitachi Ltd | 文字列領域切り出し装置 |
WO2015163118A1 (ja) * | 2014-04-22 | 2015-10-29 | シャープ株式会社 | 文字特定装置、および制御プログラム |
Family Cites Families (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP4613397B2 (ja) * | 2000-06-28 | 2011-01-19 | コニカミノルタビジネステクノロジーズ株式会社 | 画像認識装置、画像認識方法および画像認識プログラムを記録したコンピュータ読取可能な記録媒体 |
JP3962891B2 (ja) * | 2000-08-09 | 2007-08-22 | 富士ゼロックス株式会社 | 文書画像処理装置、文書画像処理方法、及び記憶媒体 |
US7031553B2 (en) | 2000-09-22 | 2006-04-18 | Sri International | Method and apparatus for recognizing text in an image sequence of scene imagery |
US20110090253A1 (en) | 2009-10-19 | 2011-04-21 | Quest Visual, Inc. | Augmented reality language translation system and method |
JP6352695B2 (ja) | 2014-06-19 | 2018-07-04 | 株式会社東芝 | 文字検出装置、方法およびプログラム |
JP6208094B2 (ja) | 2014-08-26 | 2017-10-04 | 株式会社東芝 | 情報処理装置、情報処理システム、情報処理方法及びそのプログラム |
US10049268B2 (en) * | 2015-03-06 | 2018-08-14 | Kofax, Inc. | Selective, user-mediated content recognition using mobile devices |
-
2017
- 2017-02-03 JP JP2017018788A patent/JP6530432B2/ja active Active
- 2017-08-18 US US15/680,293 patent/US10296802B2/en active Active
- 2017-08-24 EP EP17187732.7A patent/EP3358502A1/en active Pending
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2006119942A (ja) * | 2004-10-22 | 2006-05-11 | Hitachi Ltd | 文字列領域切り出し装置 |
WO2015163118A1 (ja) * | 2014-04-22 | 2015-10-29 | シャープ株式会社 | 文字特定装置、および制御プログラム |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US10528852B2 (en) | 2017-03-22 | 2020-01-07 | Kabushiki Kaisha Toshiba | Information processing apparatus, method and computer program product |
US10832100B2 (en) | 2017-03-22 | 2020-11-10 | Kabushiki Kaisha Toshiba | Target recognition device |
Also Published As
Publication number | Publication date |
---|---|
US20180225536A1 (en) | 2018-08-09 |
JP6530432B2 (ja) | 2019-06-12 |
US10296802B2 (en) | 2019-05-21 |
EP3358502A1 (en) | 2018-08-08 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US10310675B2 (en) | User interface apparatus and control method | |
JP6530432B2 (ja) | 画像処理装置、画像処理方法及びプログラム | |
JP2007129709A (ja) | イメージングデバイスをキャリブレートするための方法、イメージングデバイスの配列を含むイメージングシステムをキャリブレートするための方法およびイメージングシステム | |
JP6208094B2 (ja) | 情報処理装置、情報処理システム、情報処理方法及びそのプログラム | |
US10291843B2 (en) | Information processing apparatus having camera function and producing guide display to capture character recognizable image, control method thereof, and storage medium | |
EP3093822B1 (en) | Displaying a target object imaged in a moving picture | |
KR20160027862A (ko) | 이미지 데이터를 처리하는 방법과 이를 지원하는 전자 장치 | |
EP2639743A2 (en) | Image processing device, image processing program, and image processing method | |
JP2017084117A (ja) | 表示制御方法、表示制御プログラムおよび情報処理装置 | |
JP2016103137A (ja) | ユーザインタフェース装置、画像処理装置及び制御用プログラム | |
JP2014186520A (ja) | 画像処理装置、画像処理方法およびプログラム | |
JP2013037539A (ja) | 画像特徴量抽出装置およびそのプログラム | |
JP6564136B2 (ja) | 画像処理装置、画像処理方法、および、プログラム | |
CN110827301A (zh) | 用于处理图像的方法和装置 | |
JP6229554B2 (ja) | 検出装置および検出方法 | |
WO2018167971A1 (ja) | 画像処理装置、制御方法及び制御プログラム | |
KR20120086223A (ko) | 사용자의 손 동작을 이용하여 제어 기능을 제공하기 위한 프리젠테이션 시스템 및 그 방법 | |
JP2011175347A (ja) | 情報処理装置および情報処理方法 | |
US10373324B2 (en) | Measurement apparatus that scans original, method of controlling the same, and storage medium | |
JP2016162234A (ja) | 注目領域検出装置、注目領域検出方法及びプログラム | |
JP5636966B2 (ja) | 誤差検出装置及び誤差検出プログラム | |
US9384415B2 (en) | Image processing apparatus and method, and computer program product | |
JP2019144704A (ja) | 読取システム、読取方法、プログラム、及び記憶媒体 | |
JP2014194685A (ja) | 画像処理装置、画像処理方法および画像処理プログラム | |
US20150234517A1 (en) | Display apparatus and method and computer program product |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20180912 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20181106 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20190104 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20190416 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20190516 |
|
R151 | Written notification of patent or utility model registration |
Ref document number: 6530432 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R151 |