JP6669390B2 - 情報処理装置、情報処理方法、及びプログラム - Google Patents
情報処理装置、情報処理方法、及びプログラム Download PDFInfo
- Publication number
- JP6669390B2 JP6669390B2 JP2016045918A JP2016045918A JP6669390B2 JP 6669390 B2 JP6669390 B2 JP 6669390B2 JP 2016045918 A JP2016045918 A JP 2016045918A JP 2016045918 A JP2016045918 A JP 2016045918A JP 6669390 B2 JP6669390 B2 JP 6669390B2
- Authority
- JP
- Japan
- Prior art keywords
- image
- unit
- edge
- character recognition
- area
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
- 230000010365 information processing Effects 0.000 title claims description 11
- 238000003672 processing method Methods 0.000 title 1
- 238000000034 method Methods 0.000 claims description 81
- 238000004364 calculation method Methods 0.000 claims description 2
- 238000012015 optical character recognition Methods 0.000 description 81
- 230000006870 function Effects 0.000 description 15
- 238000010586 diagram Methods 0.000 description 11
- 238000010191 image analysis Methods 0.000 description 10
- 238000000605 extraction Methods 0.000 description 8
- 238000013523 data management Methods 0.000 description 7
- KNMAVSAGTYIFJF-UHFFFAOYSA-N 1-[2-[(2-hydroxy-3-phenoxypropyl)amino]ethylamino]-3-phenoxypropan-2-ol;dihydrochloride Chemical compound Cl.Cl.C=1C=CC=CC=1OCC(O)CNCCNCC(O)COC1=CC=CC=C1 KNMAVSAGTYIFJF-UHFFFAOYSA-N 0.000 description 4
- 230000007704 transition Effects 0.000 description 3
- 238000004891 communication Methods 0.000 description 2
- 238000001514 detection method Methods 0.000 description 2
- 230000004931 aggregating effect Effects 0.000 description 1
- 238000004458 analytical method Methods 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 230000004397 blinking Effects 0.000 description 1
- 230000015556 catabolic process Effects 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 238000006731 degradation reaction Methods 0.000 description 1
- 239000000284 extract Substances 0.000 description 1
- 230000002349 favourable effect Effects 0.000 description 1
- 238000009434 installation Methods 0.000 description 1
- 238000007726 management method Methods 0.000 description 1
- 239000003550 marker Substances 0.000 description 1
- 238000010295 mobile communication Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000035945 sensitivity Effects 0.000 description 1
- 238000004904 shortening Methods 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/40—Document-oriented image-based pattern recognition
- G06V30/41—Analysis of document content
- G06V30/412—Layout analysis of documents structured with printed lines or input boxes, e.g. business forms or tables
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/60—Analysis of geometric attributes
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N23/00—Cameras or camera modules comprising electronic image sensors; Control thereof
- H04N23/60—Control of cameras or camera modules
- H04N23/66—Remote control of cameras or camera parts, e.g. by remote control devices
- H04N23/661—Transmitting camera control signals through networks, e.g. control via the Internet
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
Landscapes
- Engineering & Computer Science (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Physics & Mathematics (AREA)
- Multimedia (AREA)
- General Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Artificial Intelligence (AREA)
- Signal Processing (AREA)
- Geometry (AREA)
- Character Input (AREA)
- Studio Devices (AREA)
Description
[外観]
本実施形態に係る情報処理装置の一例として、モバイル端末を例に説明する。モバイル端末は、携帯通信端末の一例であり、無線通信機能などを実装しており自由な場所で利用できる端末である。
図2は、モバイル端末100のハードウェアの構成の一例を示す図である。モバイル端末100は、CPU201、RAM202、ROM203、Input/Outputインターフェース204、NIC205、カメラユニット206を有する。CPU(Central Processing Unit)201は、各種のプログラムを実行し、様々な機能を実現するユニットである。RAM(Random Access Memory)202は、各種の情報を記憶するユニットである。また、RAM202は、CPU201の一時的な作業記憶領域としても利用されるユニットである。ROM(Read Only Memory)203は、各種のプログラム等を記憶するユニットである。例えば、CPU201は、ROM203に記憶されているプログラムをRAM202にロードしてプログラムを実行する。また、CPU201はフラッシュメモリ、HDD(Hard Disk Drive)又はSSD(Solid State Disk)といった外部記憶装置に記憶されているプログラムに基づき処理を実行する。これにより、図3に示されるようなモバイル端末100を構成するソフトウェア構成及び後述するシーケンスの各ステップの処理が実現される。なお、モバイル端末100の機能及び後述するシーケンスに係る処理の全部又は一部については専用のハードウェアを用いて実現してもよい。
次に、モバイル端末100におけるソフトウェアの構成について説明する。図3は、モバイル端末100のソフトウェア構成の一例を示す図である。図3に示される各ソフトウェア(アプリケーション)における機能(モジュール部)を実現するプログラムは、モバイル端末100のROM203等に記憶されている。
次に、全体画像と局所画像について図5を用いて説明する。局所画像とは、被写体全体のうちの一部分の範囲の画像である。カメラユニット206は、被写体105の文書全体の画像を、カメラ104を介して取得する。その取得した入力画像に対して、画像解析部306が被写体以外の領域を除外する紙面検出処理及び歪み部分を補正する歪み補正処理を施し整形する。この整形した画像を全体画像と呼ぶ。図5は全体画像500の一例を示している。このように、全体画像とは、被写体105の全体の画像のことである。
次に、モバイル端末100における基本的な処理フローについて図6を用いて説明する。すなわち、モバイルアプリ302を用いて被写体を撮影して得られた画像から文字認識処理の結果を得る処理を説明する。前述のように、図6に示すフローチャートは、モバイル端末100のモバイルアプリ302が実行する処理である。すなわち、ROM203に格納されたモバイルアプリ302のプログラムをCPU201がRAM202に展開して実行することで実現される処理である。
図7は、図6のフローのステップS601の画像選択処理の詳細を示す図である。まず、本フローで用いられる用語「エッジ強度」、「エッジ量」、「エッジ画像」について説明する。
上記の実施例では、撮影画像にぶれが生じる例としてカメラの手ぶれを例に挙げて説明したが、被写体(例えば紙)を固定したカメラに近づける場合に被写体のぶれによって撮影画像にぶれが生じる場合でもよい。
Claims (12)
- 被写体の一部を撮影して得られた画像を取得する取得手段と、
前記得られた画像と被写体全体との間の相対位置を指定する指定手段と、
前記指定された相対位置に基づき、前記画像に含まれる特定領域を決定する決定手段と、
前記決定された特定領域のエッジ量を算出する算出手段と、
前記算出された前記特定領域におけるエッジ量が第1の閾値よりも大きい場合、前記特定領域に対して文字認識処理を実行する文字認識手段と
を有することを特徴とする情報処理装置。 - 前記第1の閾値は、前記文字認識手段によって文字認識処理が既に行なわれた画像の前記特定領域に対応する領域のエッジ量に基づいて決定されることを特徴とする請求項1に記載の情報処理装置。
- 前記取得手段は、一定の時間、前記被写体の一部を撮影して得られた複数の画像を取得し、
前記算出手段は、前記複数の画像の前記特定領域のエッジ量をそれぞれ算出し、
前記文字認識手段は、前記算出手段で算出された前記特定領域のエッジ量が最も多い画像の前記特定領域におけるエッジ量が前記第1の閾値よりも大きい場合、前記エッジ量が最も多い前記画像に含まれる前記特定領域に対して文字認識処理を実行することを特徴とする請求項1または2に記載の情報処理装置。 - 前記算出された前記特定領域におけるエッジ量が前記第1の閾値よりも大きくない場合、前記取得手段は、撮影条件を変更して前記被写体の一部を撮影して得られた画像を取得し、
前記算出手段は、変更された撮影条件において撮影することにより得られた画像に含まれる前記特定領域のエッジ量を算出することを特徴とする請求項1から3のいずれか一項に記載の情報処理装置。 - 前記文字認識手段によって文字認識処理が実行された画像に対応する、各画素がエッジ強度を有するエッジ画像を管理する管理手段をさらに有し、
前記文字認識手段は、前記管理手段で管理されている前記エッジ画像を用いて得られた前記第1の閾値を用いることを特徴とする請求項1から4のいずれか一項に記載の情報処理装置。 - 前記管理手段は、前記文字認識手段によって文字認識処理が実行された結果の確信度が第2の閾値以上の場合における、前記文字認識処理が実行された画像に対応するエッジ画像を管理することを特徴とする請求項5に記載の情報処理装置。
- 前記管理手段は、前記エッジ画像を、前記被写体における位置と関連付けて管理し、
前記文字認識手段は、前記特定領域の位置に対応する位置を含むエッジ画像から求まる前記対応する位置の閾値を、前記第1の閾値として用いることを特徴とする請求項5または6に記載の情報処理装置。 - 前記特定領域の位置は、前記取得手段で取得した画像の特徴量から決定されることを特徴とする請求項7に記載の情報処理装置。
- 前記文字認識処理の結果が反映されたテキスト領域を含む前記取得手段で取得した画像を表示する表示手段と、
前記表示手段で表示された画像から前記テキスト領域の選択を受け付ける受け付け手段と
をさらに有することを特徴とする請求項1から8のいずれか一項に記載の情報処理装置。 - 前記取得手段で取得した画像と、前記受け付け手段で選択を受け付けたテキスト領域の位置情報と、前記テキスト領域に含まれるテキストとを出力する出力手段をさらに有することを特徴とする請求項9に記載の情報処理装置。
- 被写体の一部を撮影して得られた画像を取得する取得ステップと、
前記得られた画像と被写体全体との間の相対位置を指定する指定ステップと、
前記指定された相対位置に基づき、前記画像に含まれる特定領域を決定する決定ステップと、
前記決定された特定領域のエッジ量を算出する算出ステップと、
前記算出された前記特定領域におけるエッジ量が第1の閾値よりも大きい場合、前記画像に含まれる前記特定領域に対して文字認識処理を実行する文字認識ステップと
を有することを特徴とする情報処理方法。 - コンピュータを、請求項1から10のいずれか一項に記載の各手段として機能させるためのプログラム。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2016045918A JP6669390B2 (ja) | 2016-03-09 | 2016-03-09 | 情報処理装置、情報処理方法、及びプログラム |
US15/446,404 US10373329B2 (en) | 2016-03-09 | 2017-03-01 | Information processing apparatus, information processing method and storage medium for determining an image to be subjected to a character recognition processing |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2016045918A JP6669390B2 (ja) | 2016-03-09 | 2016-03-09 | 情報処理装置、情報処理方法、及びプログラム |
Publications (3)
Publication Number | Publication Date |
---|---|
JP2017162179A JP2017162179A (ja) | 2017-09-14 |
JP2017162179A5 JP2017162179A5 (ja) | 2019-04-18 |
JP6669390B2 true JP6669390B2 (ja) | 2020-03-18 |
Family
ID=59786801
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2016045918A Expired - Fee Related JP6669390B2 (ja) | 2016-03-09 | 2016-03-09 | 情報処理装置、情報処理方法、及びプログラム |
Country Status (2)
Country | Link |
---|---|
US (1) | US10373329B2 (ja) |
JP (1) | JP6669390B2 (ja) |
Families Citing this family (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR102402148B1 (ko) * | 2017-08-22 | 2022-05-26 | 삼성전자주식회사 | 전자 장치 및 그의 문자 인식 방법 |
JP7378939B2 (ja) * | 2019-02-22 | 2023-11-14 | 株式会社Pfu | 情報処理装置、情報処理方法、及びプログラム |
US20230094651A1 (en) | 2021-09-30 | 2023-03-30 | Konica Minolta Business Solutions U.S.A., Inc. | Extracting text from an image |
Family Cites Families (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP3240899B2 (ja) * | 1995-12-11 | 2001-12-25 | 日本電気株式会社 | 文書画像入力装置 |
US7680324B2 (en) * | 2000-11-06 | 2010-03-16 | Evryx Technologies, Inc. | Use of image-derived information as search criteria for internet and other search engines |
US20080313172A1 (en) * | 2004-12-03 | 2008-12-18 | King Martin T | Determining actions involving captured information and electronic content associated with rendered documents |
JP2005341229A (ja) | 2004-05-27 | 2005-12-08 | Sony Corp | 撮影装置 |
JP2010277442A (ja) | 2009-05-29 | 2010-12-09 | Fujifilm Corp | 建設検査システム、携帯端末、建設検査方法およびプログラム |
JP4772894B2 (ja) | 2009-08-03 | 2011-09-14 | シャープ株式会社 | 画像出力装置、携帯端末装置、撮像画像処理システム、画像出力方法、プログラムおよび記録媒体 |
US20130129142A1 (en) * | 2011-11-17 | 2013-05-23 | Microsoft Corporation | Automatic tag generation based on image content |
JP5826081B2 (ja) * | 2012-03-19 | 2015-12-02 | 株式会社Pfu | 画像処理装置、文字認識方法及びコンピュータプログラム |
JP5561331B2 (ja) * | 2012-09-12 | 2014-07-30 | オムロン株式会社 | 携帯端末装置用のプログラムおよび携帯端末装置 |
JP5800248B2 (ja) * | 2013-03-08 | 2015-10-28 | 富士ゼロックス株式会社 | 画像処理装置及び案件処理装置 |
US9179061B1 (en) * | 2013-12-11 | 2015-11-03 | A9.Com, Inc. | Assisted text input for computing devices |
-
2016
- 2016-03-09 JP JP2016045918A patent/JP6669390B2/ja not_active Expired - Fee Related
-
2017
- 2017-03-01 US US15/446,404 patent/US10373329B2/en not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
US10373329B2 (en) | 2019-08-06 |
JP2017162179A (ja) | 2017-09-14 |
US20170263013A1 (en) | 2017-09-14 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
WO2017080237A1 (zh) | 相机成像方法及相机装置 | |
JP2016538783A (ja) | モバイル映像データを用いて長尺文書の合成画像を生成するためのシステムおよび方法 | |
RU2631765C1 (ru) | Способ и система исправления перспективных искажений в изображениях, занимающих двухстраничный разворот | |
JP7102103B2 (ja) | 携帯型の情報処理装置及び当該情報処理装置を用いた方法及びプログラム | |
JP6971789B2 (ja) | 情報処理装置、プログラム及び情報処理方法 | |
EP3518522B1 (en) | Image capturing method and device | |
US20190191078A1 (en) | Information processing apparatus, a non-transitory computer readable storage medium and information processing method | |
US10586099B2 (en) | Information processing apparatus for tracking processing | |
JP2018107593A (ja) | 画像処理装置、画像処理方法およびプログラム | |
WO2014184372A1 (en) | Image capture using client device | |
JP2019012361A (ja) | 情報処理装置、プログラム及び情報処理方法 | |
CN114298902A (zh) | 一种图像对齐方法、装置、电子设备和存储介质 | |
JP6669390B2 (ja) | 情報処理装置、情報処理方法、及びプログラム | |
JP2018046337A (ja) | 情報処理装置、プログラム及び制御方法 | |
US10452943B2 (en) | Information processing apparatus, control method of information processing apparatus, and storage medium | |
US10999513B2 (en) | Information processing apparatus having camera function, display control method thereof, and storage medium | |
JP6542230B2 (ja) | 投影ひずみを補正するための方法及びシステム | |
US20210281742A1 (en) | Document detections from video images | |
JP2017162148A (ja) | 情報処理装置、プログラム、情報処理方法 | |
CN111145153A (zh) | 图像处理方法、电路、视障辅助设备、电子设备及介质 | |
JP2017120455A (ja) | 情報処理装置、プログラム及び制御方法 | |
JP2020149184A (ja) | 情報処理装置、その制御方法及びプログラム | |
JP2022055011A (ja) | 情報処理装置、情報処理方法、及びプログラム | |
JP6833324B2 (ja) | 情報処理装置、プログラム及び情報処理方法 | |
JP6779798B2 (ja) | 情報処理装置、情報処理方法及びプログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20190308 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20190308 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20200120 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20200128 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20200225 |
|
R151 | Written notification of patent or utility model registration |
Ref document number: 6669390 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R151 |
|
LAPS | Cancellation because of no payment of annual fees |