JP2016057796A - 携帯端末装置用のスキューロジック文字認識方法、プログラム及び携帯端末装置 - Google Patents
携帯端末装置用のスキューロジック文字認識方法、プログラム及び携帯端末装置 Download PDFInfo
- Publication number
- JP2016057796A JP2016057796A JP2014182913A JP2014182913A JP2016057796A JP 2016057796 A JP2016057796 A JP 2016057796A JP 2014182913 A JP2014182913 A JP 2014182913A JP 2014182913 A JP2014182913 A JP 2014182913A JP 2016057796 A JP2016057796 A JP 2016057796A
- Authority
- JP
- Japan
- Prior art keywords
- image
- pixel
- angle
- degrees
- rotated
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 35
- 238000003384 imaging method Methods 0.000 claims description 11
- 238000012015 optical character recognition Methods 0.000 description 38
- 238000010586 diagram Methods 0.000 description 22
- 238000004364 calculation method Methods 0.000 description 5
- 230000006870 function Effects 0.000 description 4
- 239000000463 material Substances 0.000 description 4
- 230000002093 peripheral effect Effects 0.000 description 4
- QNRATNLHPGXHMA-XZHTYLCXSA-N (r)-(6-ethoxyquinolin-4-yl)-[(2s,4s,5r)-5-ethyl-1-azabicyclo[2.2.2]octan-2-yl]methanol;hydrochloride Chemical compound Cl.C([C@H]([C@H](C1)CC)C2)CN1[C@@H]2[C@H](O)C1=CC=NC2=CC=C(OCC)C=C21 QNRATNLHPGXHMA-XZHTYLCXSA-N 0.000 description 3
- 230000007423 decrease Effects 0.000 description 3
- 230000008569 process Effects 0.000 description 3
- 238000006243 chemical reaction Methods 0.000 description 2
- 229910003460 diamond Inorganic materials 0.000 description 2
- 239000010432 diamond Substances 0.000 description 2
- 239000000284 extract Substances 0.000 description 2
- 230000010365 information processing Effects 0.000 description 2
- 230000004044 response Effects 0.000 description 2
- 230000008859 change Effects 0.000 description 1
- 230000000593 degrading effect Effects 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000010606 normalization Methods 0.000 description 1
- 229920001690 polydopamine Polymers 0.000 description 1
Landscapes
- Character Input (AREA)
Abstract
Description
標準的なCPU、メモリ等を備えたスマートフォンに本発明に係るスキューロジックアプリケーションプログラムをインストールした実施例1において、処理速度及び文字認識精度が測定された。スマートフォンのカメラで撮像されたプレビュー画像(VGA(640×480)サイズ、グレースケール)が取り込まれ、対象画像(320×320画素)に含まれる文字列が認識された。スキュー角度を決定するために、−90度から90度まで1度間隔で、対象画像に含まれる184の150×150画素の矩形の領域がスキャンされた。(線分補間テーブルにおいて、θ=45°の矩形のスキャン領域は角度ブロックP2及びP1の両方に含まれ、θ=0°の矩形のスキャン領域は角度ブロックP1及びP3の両方に含まれ、θ=−45°の矩形のスキャン領域は、角度ブロックP3及びP4の両方に含まれた。)対象画像の184の矩形の画素領域を決定し、スキャン、ヒストグラム生成、及びスキュー角度を決定するためにかかった時間は平均しておよそ40ミリ秒であった。決定されたスキュー角度に基づいて、対象画像の第1及び第2の回転画像を生成するためにかかった時間はおよそ3ミリ秒であり、直ちに正しい文字認識結果が得られた。
11 撮像手段
12 表示手段
13 入力手段
14 画素(線分補間テーブル)作成手段
15 対象画像特定手段
16 スキャン・ヒストグラム生成及びスキュー角度決定手段
17 第1回転画像生成手段
18 第2回転画像生成手段
19 文字認識手段
20 DB手段
21 認識文字決定手段
Claims (9)
- 撮像手段と表示手段とを有する携帯端末装置を使用して多数の画素から成る画像に含まれる文字を認識するための方法であって、
文字列と行間または空白部分とを含む対象画像に含まれる複数の矩形のスキャン画素領域をスキャンして前記行間または空白部分の前記基準方向からの角度に関する−90度ないし90度の範囲のスキュー角度を決定するステップであって、前記複数の矩形のスキャン画素領域各々が共通する原点画素と該原点画素をとおり前記矩形の各辺に平行または垂直である領域の基線を有し、各々の領域の基線が前記基準方向から−90度ないし90度の範囲にある角度を有する複数の矩形のスキャン画素領域をスキャンし各々の複数の矩形のスキャン画素領域の行間または空白部分を判定するためのヒストグラムを作成することを含む、スキュー角度決定ステップと、
前記スキュー角度に応じた形で前記対象画像を横断するように処理することにより前記対象画像の回転画像を生成するステップであって、該回転画像に含まれる文字列の方向が前記基準方向に一致する、回転画像生成ステップと、
前記回転画像に含まれる文字列を認識する文字認識ステップと、を含む文字認識方法。 - さらに、前記回転画像を、90度または270度回転させて追加の回転画像を生成するステップと、を含み、
前記文字認識ステップが、さらに、前記追加の回転画像に含まれる文字列を認識することを含む、文字認識方法。 - 前記追加の回転画像を生成するステップが、前記スキュー角度が−90度以上、0度未満であるときは前記回転画像をさらに90度回転させ、または前記スキュー角度が0度以上、90度以下であるときは前記回転画像をさらに270度回転させることを特徴とする請求項1に記載された文字認識方法。
- 前記スキュー角度決定ステップにおいて、前記各々の領域の基線の角度の間隔が1度以下であることを特徴とする請求項1または2に記載された文字認識方法。
- 前記複数の矩形の画素領域が、多数の画素から成る画像に含まれ得る、中心画素oを有し一対の対辺の画素数がL、他の一対の対辺の画素数がBである矩形の画素領域であって、前記中心画素oの周りに−90度ないし90度の範囲で所定角度ずつ回転させた矩形の画素領域を線分補間により求めて予め作成された線分補間テーブルを使用して決定されることを特徴とする請求項1に記載された文字認識方法。
- 前記スキュー角度決定ステップにおいて、前記ヒストグラムは、縦軸を角度、横軸をヒストグラムデータとし、前記ヒストグラムにおいて行間を表す特徴を判定することにより前記スキュー角度が決定されることを特徴とする請求項1に記載された文字認識方法。
- 請求項1ないし6のいずれかに記載の文字認識方法を前記携帯端末装置のコンピュータに実行させるプログラム。
- 撮像手段と表示手段とを有し、多数の画素から成る画像に含まれる文字を認識するように構成される携帯端末装置であって、
多数の画素から成る画像に含まれ得る複数の矩形のスキャン画素領域を線分補間により決定する画素テーブル作成手段と、
多数の画素から成り、文字列と行間または空白部分とを含む対象画像を特定する対象画像特定手段と、
前記画素テーブルに基づいて、前記対象画像に含まれる複数の矩形のスキャン画素領域をスキャンして行間または空白部分判定するためのヒストグラムを生成し、前記行間または空白部分の基準方向からの角度に関する−90度ないし90度の範囲のスキュー角度を決定するスキュー角度決定手段と、
前記スキュー角度に応じた形で前記対象画像を横断するように処理することにより前記対象画像の回転画像を生成する回転画像生成手段と、
前記回転画像に含まれる文字を認識する文字認識手段と、を含み、
前記対象画像に含まれる複数の矩形のスキャン画像領域が共通する原点画素を有し、
前記複数の矩形のスキャン画素領域の各々が、前記原点画素を通り前記矩形の各辺に平行または垂直である領域の基線を有し、
前記基準方向に対する各々の領域の基線の角度が各々のスキャン画素領域に対応する各々のスキャン角度を表すことを特徴とする携帯端末装置。 - 前記ヒストグラムが縦軸を角度、横軸をヒストグラムデータとして生成され、
前記スキュー角度決定手段が、前記ヒストグラムにおいて行間を表す特徴を判定することにより前記スキュー角度を決定することを特徴とする請求項8に記載された携帯端末装置。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2014182913A JP5940615B2 (ja) | 2014-09-09 | 2014-09-09 | 携帯端末装置用のスキューロジック文字認識方法、プログラム及び携帯端末装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2014182913A JP5940615B2 (ja) | 2014-09-09 | 2014-09-09 | 携帯端末装置用のスキューロジック文字認識方法、プログラム及び携帯端末装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2016057796A true JP2016057796A (ja) | 2016-04-21 |
JP5940615B2 JP5940615B2 (ja) | 2016-06-29 |
Family
ID=55758433
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2014182913A Expired - Fee Related JP5940615B2 (ja) | 2014-09-09 | 2014-09-09 | 携帯端末装置用のスキューロジック文字認識方法、プログラム及び携帯端末装置 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP5940615B2 (ja) |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107782305A (zh) * | 2017-09-22 | 2018-03-09 | 郑州郑大智能科技股份有限公司 | 一种基于数字字母识别的移动机器人定位方法 |
CN111353494A (zh) * | 2020-04-09 | 2020-06-30 | 成都睿琪科技有限责任公司 | 钢材编码识别系统及方法 |
JP2021149136A (ja) * | 2020-03-16 | 2021-09-27 | 株式会社アイエスピー | シリアルナンバー等文字列抽出サーバ、方法及びプログラム |
CN114166849A (zh) * | 2021-11-29 | 2022-03-11 | 广州海谷电子科技有限公司 | 一种湿度传感器印刷碳线缺陷和感湿膜缺陷的检测方法 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH09251511A (ja) * | 1996-03-15 | 1997-09-22 | Sanyo Electric Co Ltd | 文字認識方法及び文字認識装置 |
JP2005141603A (ja) * | 2003-11-10 | 2005-06-02 | Hitachi Ltd | 携帯端末の文字認識における処理対象選択方法および携帯端末 |
JP2012008791A (ja) * | 2010-06-24 | 2012-01-12 | Hitachi Computer Peripherals Co Ltd | 帳票認識装置及び帳票認識方法 |
JP2013206258A (ja) * | 2012-03-29 | 2013-10-07 | Dainippon Printing Co Ltd | 文書認識装置、文書認識方法、プログラム |
-
2014
- 2014-09-09 JP JP2014182913A patent/JP5940615B2/ja not_active Expired - Fee Related
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH09251511A (ja) * | 1996-03-15 | 1997-09-22 | Sanyo Electric Co Ltd | 文字認識方法及び文字認識装置 |
JP2005141603A (ja) * | 2003-11-10 | 2005-06-02 | Hitachi Ltd | 携帯端末の文字認識における処理対象選択方法および携帯端末 |
JP2012008791A (ja) * | 2010-06-24 | 2012-01-12 | Hitachi Computer Peripherals Co Ltd | 帳票認識装置及び帳票認識方法 |
JP2013206258A (ja) * | 2012-03-29 | 2013-10-07 | Dainippon Printing Co Ltd | 文書認識装置、文書認識方法、プログラム |
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107782305A (zh) * | 2017-09-22 | 2018-03-09 | 郑州郑大智能科技股份有限公司 | 一种基于数字字母识别的移动机器人定位方法 |
CN107782305B (zh) * | 2017-09-22 | 2021-05-14 | 郑州郑大智能科技股份有限公司 | 一种基于数字字母识别的移动机器人定位方法 |
JP2021149136A (ja) * | 2020-03-16 | 2021-09-27 | 株式会社アイエスピー | シリアルナンバー等文字列抽出サーバ、方法及びプログラム |
CN111353494A (zh) * | 2020-04-09 | 2020-06-30 | 成都睿琪科技有限责任公司 | 钢材编码识别系统及方法 |
CN111353494B (zh) * | 2020-04-09 | 2023-06-23 | 成都睿琪科技有限责任公司 | 钢材编码识别系统及方法 |
CN114166849A (zh) * | 2021-11-29 | 2022-03-11 | 广州海谷电子科技有限公司 | 一种湿度传感器印刷碳线缺陷和感湿膜缺陷的检测方法 |
Also Published As
Publication number | Publication date |
---|---|
JP5940615B2 (ja) | 2016-06-29 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11481878B2 (en) | Content-based detection and three dimensional geometric reconstruction of objects in image and video data | |
US11275961B2 (en) | Character image processing method and apparatus, device, and storage medium | |
US9779296B1 (en) | Content-based detection and three dimensional geometric reconstruction of objects in image and video data | |
US20200394763A1 (en) | Content-based object detection, 3d reconstruction, and data extraction from digital images | |
US9652690B2 (en) | Automatically capturing and cropping image of check from video sequence for banking or other computing application | |
Tian et al. | Rectification and 3D reconstruction of curved document images | |
US9959475B2 (en) | Table data recovering in case of image distortion | |
RU2631765C1 (ru) | Способ и система исправления перспективных искажений в изображениях, занимающих двухстраничный разворот | |
JP6208094B2 (ja) | 情報処理装置、情報処理システム、情報処理方法及びそのプログラム | |
JP5940615B2 (ja) | 携帯端末装置用のスキューロジック文字認識方法、プログラム及び携帯端末装置 | |
CN110136069B (zh) | 文本图像矫正方法、装置与电子设备 | |
JP2002334327A (ja) | ドキュメントのキャプチャに関する改善 | |
JP2008234291A (ja) | 文字認識装置及び文字認識方法 | |
EP3436865A1 (en) | Content-based detection and three dimensional geometric reconstruction of objects in image and video data | |
US20160253569A1 (en) | Automatically Capturing and Cropping Image of Check from Video Sequence for Banking or other Computing Application | |
CN115983304A (zh) | 一种二维码动态调整方法、装置、电子设备及存储介质 | |
CN113870190A (zh) | 竖直线条检测方法、装置、设备及存储介质 | |
JP5844698B2 (ja) | 文字認識装置 | |
JP2017120455A (ja) | 情報処理装置、プログラム及び制御方法 | |
JP6815712B1 (ja) | 画像処理システム、画像処理方法、画像処理プログラム、画像処理サーバ、及び学習モデル | |
JP7405528B2 (ja) | 媒体判別装置、媒体判別システム及び媒体判別方法 | |
CN115797938A (zh) | 文件图片的自动校正方法、电子设备及存储介质 | |
JP6348038B2 (ja) | プログラム | |
JP2021117609A (ja) | 画像処理装置、及びプログラム | |
JP4869364B2 (ja) | 画像処理装置および画像処理方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20160229 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20160414 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20160509 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20160518 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5940615 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
LAPS | Cancellation because of no payment of annual fees |