JP2015064781A - 情報機器および制御プログラム - Google Patents
情報機器および制御プログラム Download PDFInfo
- Publication number
- JP2015064781A JP2015064781A JP2013198796A JP2013198796A JP2015064781A JP 2015064781 A JP2015064781 A JP 2015064781A JP 2013198796 A JP2013198796 A JP 2013198796A JP 2013198796 A JP2013198796 A JP 2013198796A JP 2015064781 A JP2015064781 A JP 2015064781A
- Authority
- JP
- Japan
- Prior art keywords
- image
- rotation
- unit
- target image
- user
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000012545 processing Methods 0.000 claims abstract description 79
- 238000013519 translation Methods 0.000 claims abstract description 77
- 238000012937 correction Methods 0.000 abstract description 46
- 238000012015 optical character recognition Methods 0.000 description 46
- 238000000034 method Methods 0.000 description 42
- 230000008569 process Effects 0.000 description 40
- 230000006870 function Effects 0.000 description 15
- 238000010586 diagram Methods 0.000 description 10
- 238000001514 detection method Methods 0.000 description 8
- 230000000694 effects Effects 0.000 description 5
- 238000004364 calculation method Methods 0.000 description 4
- 230000008859 change Effects 0.000 description 4
- 238000003384 imaging method Methods 0.000 description 4
- 238000010079 rubber tapping Methods 0.000 description 3
- 230000005540 biological transmission Effects 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 230000002123 temporal effect Effects 0.000 description 2
- 238000004891 communication Methods 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/40—Processing or translation of natural language
- G06F40/58—Use of machine translation, e.g. for multi-lingual retrieval, for server-side translation for client devices or for real-time translation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/20—Image preprocessing
- G06V10/24—Aligning, centring, orientation detection or correction of the image
- G06V10/243—Aligning, centring, orientation detection or correction of the image by compensating for image skew or non-uniform image deformations
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Computational Linguistics (AREA)
- General Health & Medical Sciences (AREA)
- Health & Medical Sciences (AREA)
- General Engineering & Computer Science (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Artificial Intelligence (AREA)
- Multimedia (AREA)
- Character Input (AREA)
- Position Input By Displaying (AREA)
- Machine Translation (AREA)
- Document Processing Apparatus (AREA)
- User Interface Of Digital Computer (AREA)
- Image Processing (AREA)
Abstract
【課題】OCR処理および翻訳処理の精度向上が可能な情報機器を提供する。
【解決手段】スマートフォン(1)は、翻訳対象となる文字を含む第1対象画像をユーザの入力操作に応じて回転させて第2対象画像を生成する角度補正部(23)と、第2対象画像を文字認識処理の対象として、第2対象画像に含まれる文字を認識するOCR処理部(24)と、OCR処理部(24)において認識に成功した文字を翻訳対象として翻訳結果を生成し、第2対象画像に翻訳結果を翻訳対象に重畳させた表示用画像を生成する翻訳処理部(25)と、を備える。
【選択図】図1
【解決手段】スマートフォン(1)は、翻訳対象となる文字を含む第1対象画像をユーザの入力操作に応じて回転させて第2対象画像を生成する角度補正部(23)と、第2対象画像を文字認識処理の対象として、第2対象画像に含まれる文字を認識するOCR処理部(24)と、OCR処理部(24)において認識に成功した文字を翻訳対象として翻訳結果を生成し、第2対象画像に翻訳結果を翻訳対象に重畳させた表示用画像を生成する翻訳処理部(25)と、を備える。
【選択図】図1
Description
本発明は、情報機器に関する。
現在、OCR(Optical Character Recognition,光学文字認識)処理の技術は、イメージスキャナ、PC(Personal Computer)、およびスマートフォン等の様々な情報機器に適用されている。
特に、近年では、米国Quest Visual社のWord Lensというスマートフォン向けのアプリケーションに、OCR処理の技術が適用されている。Word Lensは、スマートフォンのカメラが被写体を撮影することによって生成された画像に対してOCR処理を行うことにより、OCR処理によって得られた文字を翻訳した結果を、カメラアプリケーションのプレビュー画像に表示させるという機能を有している。
ところで、OCR処理を行う対象となる画像が傾いている場合(すなわち、画像が正立していない場合)には、OCR処理の精度が低下し、画像に含まれている文字が、正しく認識されないという問題がある。特許文献1には、画像の回転角度(傾き角)を自動的に補正することによって、OCR処理の精度を向上する方法が開示されている。
特許文献1の方法では、画像の回転角度の算出に先立ち、画像内の文字を含む矩形を自動的に抽出している。ゆえに、画像の回転角度がある程度以上の値である場合には、矩形の抽出が適切に行われず、OCR処理の精度を向上するための画像の回転角度の補正が自動的に行うことができないという問題があった。
また、上述のWord Lensは、カメラによって撮影された画像の回転角度を補正する機能を有していない。それゆえ、撮影時に水平に安定した足場がない場合、または、被写体を撮影することが可能な位置が限られている場合等には、ユーザが正立した画像を撮影することが困難であるため、Word LensによるOCR処理および翻訳処理が適切に行われないという問題があった。
本発明は、上記の問題を解決するためになされたものであり、その目的は、OCR処理および翻訳処理の精度を向上させることが可能な情報機器を提供することにある。
上記の課題を解決するために、本発明の一態様に係る情報機器は、翻訳対象となる文字を含む第1対象画像を取得し、当該第1対象画像に含まれる文字を翻訳する情報機器であって、ユーザの入力操作に応じて上記第1対象画像を回転させた第2対象画像を生成する画像回転手段と、上記第2対象画像を文字認識処理の対象として、上記第2対象画像に含まれる文字を認識する文字認識手段と、上記文字認識手段において認識に成功した文字を翻訳対象として翻訳結果を生成し、上記第2対象画像に上記翻訳結果を上記翻訳対象に重畳させた表示用画像を生成する翻訳処理手段と、を備えている。
本発明の一態様に係る情報機器によれば、OCR処理および翻訳処理の精度を向上させることが可能な情報機器を提供できるという効果を奏する。
〔実施形態1〕
本発明の実施形態1について図1〜図3に基づいて説明すれば、以下の通りである。
本発明の実施形態1について図1〜図3に基づいて説明すれば、以下の通りである。
(スマートフォン1の構成)
図1は、本実施形態のスマートフォン1(情報機器)の構成を概略的に示す機能ブロック図である。スマートフォン1は、タッチパネル10、主制御部20、撮影部30、および記憶部40を備える。
図1は、本実施形態のスマートフォン1(情報機器)の構成を概略的に示す機能ブロック図である。スマートフォン1は、タッチパネル10、主制御部20、撮影部30、および記憶部40を備える。
タッチパネル10は、例えば、静電容量方式のタッチパネルであり、表示部11および入力部12(入力面)を備えている。表示部11は、例えば液晶ディスプレイである。入力部12は、ユーザによる入力操作を受け付けるユーザインターフェースであり、表示部11の表示画面と重畳する位置に配置されている。そのため、入力部12は、表示部11の表示画面に対する入力操作を検出することができる。
入力部12は、指(またはタッチペン等)によるタッチ入力が行われたことを示す入力信号(例えば、静電容量の変化が生じた位置、および静電容量の変化量を示す信号)を、主制御部20が備える入力位置検出部22へ与える。
撮影部30は、例えば、表示部11が配設されている面とは反対の面(すなわち、スマートフォン1の背面)に設けられたメインカメラである。撮影部30は、被写体を撮影することによって生成した画像を、主制御部20が備える画像取得部21へ与える。記憶部40は、スマートフォン1において使用される各種データを格納する記憶装置である。
主制御部20は、スマートフォン1が備える各種ハードウェア(例えば、タッチパネル10および撮影部30)の動作、およびスマートフォン1の機能を統括的に制御する。また、主制御部20は、以下に述べる画像取得部21、入力位置検出部22、角度補正部23(画像回転手段、回転ボタン表示手段)、OCR処理部24(文字認識手段)、および翻訳処理部25(翻訳処理手段)として機能する。
画像取得部21は、撮影部30からの画像を表示部11に表示させる。なお、画像取得部21は、撮影部30が現在撮影している画像を、カメラアプリケーションのプレビュー画像として、表示部11に表示させることもできる(後述の図3の(a)を参照)。
入力位置検出部22は、入力部12からの入力信号に基づき、入力部12に対するユーザからの入力が与えられた位置である入力位置を検出する。表示部11には、ユーザによる入力操作の対象として各種のボタン(またはアイコン)が表示されており、ユーザは、各ボタンをタップすることにより、入力位置検出部22を介して、当該ボタンに対応付けられた動作をスマートフォン1に行わせることができる。また、ユーザは、ボタンのタップに限らず、入力部12におけるドラッグ操作等によっても、入力位置検出部22を介して、所定の各種の動作をスマートフォン1に行わせることができる。
角度補正部23(画像回転手段)は、表示部11に表示されている画像を回転させ、画像の回転角度を調整(補正)する機能を有している。角度補正部23(回転ボタン表示手段)は、「左回転」または「右回転」のボタン(回転ボタン)を表示部11に表示させる。ユーザが、表示部11に表示されている回転ボタンをタップすることによって、角度補正部23における処理が行われる。
なお、本実施形態では、角度補正部23が、画像回転手段としての機能に加えて、回転ボタン表示手段としての機能を備えるように構成している場合を例示しているが、画像回転手段と回転ボタン表示手段とは、個別に設けられてもよい。例えば、角度補正部23に画像回転手段としての機能のみを備えさせ、回転ボタン表示手段としての機能を有する機能ブロックを、主制御部20内に別途に設けてもよい。
ユーザが「左回転」のボタンを1回タップするごとに、角度補正部23は、画像を反時計方向に1°回転させる。また、ユーザが「右回転」のボタンを1回タップするごとに、角度補正部23は、画像を時計方向に1°回転させる(後述の図3の(c)を参照)。
なお、回転ボタンを1回タップするごとの画像の回転角度は、1°に限定されず、スマートフォン1の仕様に応じた他の適当な値(例えば5°)でもよい。また、画像の回転の中心位置(回転中心位置)は、例えば、表示部11の中心位置である。なお、画像の回転の中心位置は、表示部11の中心位置以外の所定の位置であってもよく、角度補正部23に、画像の回転の中心位置を示す座標があらかじめ与えられていればよい。
そして、角度補正部23は、回転後の画像を、表示部11に表示させる。また、角度補正部23は、回転後の画像を、OCR処理部24に与える。なお、角度補正部23において、画像の回転が行われない場合には、画像取得部21が撮影部30から取得した画像が、そのまま角度補正部23からOCR処理部24に与えられる。
OCR処理部24は、表示部11に表示されている画像に対して、OCR処理(文字認識処理)を行う。すなわち、OCR処理部24は、画像に含まれる文字を、計算機による処理が可能な文字コードに変換する。そして、OCR処理部24は、OCR処理の結果として得られた文字コードと当該文字コードに対応する画像中の文字の座標とを、翻訳処理部25に与える。
なお、OCR処理部24において、OCR処理の対象となる画像は、角度補正部23における回転が行われた後の画像(第2対象画像)であってもよいし、または、角度補正部23における回転が行われる前の画像(第1対象画像)であってもよい。
翻訳処理部25は、ソース言語(例えば、英語)の文字コードを、所定のターゲット言語(例えば、日本語)に翻訳する機能を有する。翻訳処理部25は、記憶部40にあらかじめ記録されている辞書データ(ソース言語の各語の語義が、ターゲット言語により示された2言語辞書のデータ)を参照することによって、上述の翻訳を行う。
翻訳処理部25は、OCR処理部24から与えられた文字コードに対して翻訳を行い、翻訳結果を生成する。そして、翻訳処理部25は、翻訳が行われた文字コードに対応する画像中の文字の座標を参照し、画像内の翻訳対象の文字に翻訳結果を重畳させた表示用画像を生成し、当該表示用画像を表示部11に表示させる。翻訳結果を重畳させる対象となる画像は、上述の第1対象画像または第2対象画像のいずれでもよい(後述の図3の(b)および(d)を参照)。
(スマートフォン1における翻訳の処理の流れ)
図2は、スマートフォン1における翻訳の処理の流れを例示するフローチャートである。ユーザは、スマートフォン1に入力操作を行うことにより、撮影部30を起動させ、撮影部30による被写体の撮影を開始する(S1)。画像取得部21は、撮影部30が被写体を撮影することによって生成した画像を取得し(S2)、当該画像を表示部11に表示させる。
図2は、スマートフォン1における翻訳の処理の流れを例示するフローチャートである。ユーザは、スマートフォン1に入力操作を行うことにより、撮影部30を起動させ、撮影部30による被写体の撮影を開始する(S1)。画像取得部21は、撮影部30が被写体を撮影することによって生成した画像を取得し(S2)、当該画像を表示部11に表示させる。
OCR処理部24は、表示部11に表示されている画像に対して、OCR処理を行い(S3)、画像に含まれる文字を、計算機による処理が可能な文字コードに変換する。翻訳処理部25は、文字コードに対して翻訳を行い、翻訳結果を生成する(S4)。
そして、翻訳処理部25は、画像内の翻訳対象の文字に翻訳結果を重畳させて、表示部11に表示させる。すなわち、翻訳処理部25は、生成した表示用画像を表示部11に表示させる(S5)。角度補正部23は、ユーザが表示部11に表示されている回転ボタン(「左回転」または「右回転」のボタン)をタップしたか否かを確認する(処理S6)。
ユーザが表示部11に表示されている回転ボタンをタップした場合(S6においてYES)、角度補正部23は、ユーザがタップした回転ボタン(「左回転」または「右回転」のボタン)の方向に応じて、ユーザが回転ボタンを1回タップするごとに、所定の方向(反時計方向または時計方向)に、所定の角度(例えば1°)だけ画像を回転させる(S7)。そして、処理S3に戻り、処理S3〜S6が反復される。
他方、ユーザが表示部11に表示されている回転ボタンをタップしない場合(S6においてNO)には、画像の回転が行われず、表示部11には、処理S5において表示された翻訳結果が、継続して表示されている。
(スマートフォン1の効果)
スマートフォン1の効果について、図3を用いて説明する。図3の(a)〜(d)は、スマートフォン1において、被写体が撮影された画像に含まれる英語の文字「Chapter 1 This is a pen. How are you?」に対して、OCR処理および翻訳が行われた場合を例示する図である。図3の(a)は、撮影部30が現在撮影している被写体の画像を、カメラアプリケーションのプレビュー画像として、表示部11に表示されている時点を例示する図である。
スマートフォン1の効果について、図3を用いて説明する。図3の(a)〜(d)は、スマートフォン1において、被写体が撮影された画像に含まれる英語の文字「Chapter 1 This is a pen. How are you?」に対して、OCR処理および翻訳が行われた場合を例示する図である。図3の(a)は、撮影部30が現在撮影している被写体の画像を、カメラアプリケーションのプレビュー画像として、表示部11に表示されている時点を例示する図である。
図3の(b)は、撮影部30が被写体を撮影することによって生成された画像に、OCR処理および翻訳が行われた場合を例示する図である。図6の(b)では、OCR処理を行う対象となる画像が傾いているために、OCR処理部24におけるOCR処理の精度が低下し、画像に含まれている文字の全ては、正しく認識されていない。
図6の(b)の場合、OCR処理部24は、英語の文字の一部である「is」のOCR処理にのみ成功している。このため、翻訳処理部25は、OCR処理部24におけるOCR処理が成功した英語の文字「is」に対してのみ翻訳処理を行い、日本語の文字「です」を翻訳結果として生成する。そして、翻訳処理部25による翻訳結果としての日本語の文字「です」が、英語の文字「is」に重畳され、表示部11に表示されている。
図3の(c)は、ユーザが表示部11に表示されている「右回転」のボタンをタップすることによって、画像の回転角度を調整している時点を例示する図である。ユーザが、「右回転」のボタンを1回タップするごとに、画像が時計方向に1°回転する。ユーザが画像を適当な回数だけ回転させる操作を行うことにより、ユーザは、画像が概ね正立するように、画像の回転角度を手動で調整することができる。
図3の(d)は、回転角度が調整された画像に、OCR処理および翻訳が行われた場合を例示する図である。図3の(d)では、OCR処理を行う対象となる画像が概ね正立しているために、OCR処理の精度が低下せず、画像に含まれている文字の全てが、正しく認識されている。このため、上述の英語の文字の全てがOCR処理され、日本語の文字「1章 これはペンです ごきげんいかが?」が、翻訳結果として上述の英語の文字に重畳され、表示部11に表示されている。
従って、ユーザは、正立した画像を撮影することができなかった場合でも、表示部11に表示された翻訳結果を確認しながら、適切な翻訳結果が得られるまで、回転ボタンをタップし所定の角度(例えば1°)ずつ画像の回転角度を調整することができる。それゆえ、スマートフォン1によれば、画像の回転角度を調整するためのユーザによる操作の利便性が向上する。
〔実施形態2〕
本発明の他の実施形態について、図4〜図7に基づいて説明すれば、以下のとおりである。なお、説明の便宜上、前記実施形態にて説明した部材と同じ機能を有する部材については、同じ符号を付記し、その説明を省略する。
本発明の他の実施形態について、図4〜図7に基づいて説明すれば、以下のとおりである。なお、説明の便宜上、前記実施形態にて説明した部材と同じ機能を有する部材については、同じ符号を付記し、その説明を省略する。
(スマートフォン2の構成)
図4は、本実施形態のスマートフォン2(情報機器)の構成を概略的に示す機能ブロック図である。スマートフォン2は、実施形態1のスマートフォン1が備える主制御部20を、主制御部26によって置き換えたものである。本実施形態の主制御部26は、実施形態1の主制御部20において、(i)回転中心設定部27(回転中心算出手段)をさらに付加し、かつ、(ii)角度補正部23を、角度補正部28(画像回転手段)によって置き換えたものである。
図4は、本実施形態のスマートフォン2(情報機器)の構成を概略的に示す機能ブロック図である。スマートフォン2は、実施形態1のスマートフォン1が備える主制御部20を、主制御部26によって置き換えたものである。本実施形態の主制御部26は、実施形態1の主制御部20において、(i)回転中心設定部27(回転中心算出手段)をさらに付加し、かつ、(ii)角度補正部23を、角度補正部28(画像回転手段)によって置き換えたものである。
回転中心設定部27は、後述の角度補正部28における画像の回転処理に先立ち、回転の中心位置を設定する機能を有している。回転中心設定部27は、入力位置検出部22から2つの入力位置を取得し、ユーザが、入力部12上に2本の指を置いていることを検知する。
回転中心設定部27は、ユーザが入力部12上に2本の指を置いた時点における、2本の指の位置にそれぞれ対応する2つの入力位置の中点を、画像の回転の中心位置(回転中心位置)として設定してもよい。また。回転中心設定部27は、表示部11の中心位置等の所定の位置(すなわち、実施形態1の角度補正部23と同様の画像の回転の中心位置)を、画像の回転の中心位置として設定してもよい。
回転中心設定部27は、画像の回転の中心位置を示す座標を、角度補正部28に与える。なお、回転中心設定部27において、2つの入力位置の中点、または表示部11の中心位置のいずれを、画像の回転の中心位置として設定するかについては、回転中心設定部27の処理に先立ち、ユーザが任意に設定することができる。
本実施形態の角度補正部28は、実施形態1の角度補正部23と同様に、表示部11に表示されている画像を回転させ、画像の回転角度を調整する機能を有している。但し、本実施形態の角度補正部28は、ユーザの入力操作を受け付けるためのインターフェースが、実施形態1の角度補正部23とは異なる。本実施形態では、ユーザが、入力部12上に2本の指を置いた後に、入力部12上において2本の指を回転させることによって、角度補正部28における処理が行われる。
角度補正部28は、入力位置検出部22から取得した2つの入力位置の時間的な変化を参照し、2つの入力位置が回転していることを検出することにより、ユーザが2本の指を反時計方向または時計方向に回転させる操作を行っていることを認識する。
ユーザが2本の指を反時計方向に回転させた場合、角度補正部28は、画像を反時計方向に回転させる。また、ユーザが2本の指を時計方向に回転させた場合、角度補正部28は、画像を時計方向に回転させる(後述の図7の(a)を参照)。
ここで、画像の回転の中心位置は、回転中心設定部27において設定された位置である。なお、角度補正部28における画像の回転角度は、ユーザが2本の指を回転させた角度(すなわち、2つの入力位置の回転角度)に比例した量として決定される。例えば、ユーザが2本の指を60°回転させた場合には、角度補正部28は、画像を30°回転させる。なお、ユーザの2本の指の回転角度と、角度補正部28における画像の回転角度との間の比例定数は、スマートフォン2の仕様に応じて、適宜設定されてよい。
そして、角度補正部28は、実施形態1の角度補正部23と同様に、回転後の画像を、表示部11に表示させ、また、OCR処理部24に与える。なお、「左回転」または「右回転」の回転ボタンを表示部11に表示させ、本実施形態の角度補正部28に、実施形態1の角度補正部23と同様の機能をさらに備えさせてもよい。
また、表示部11の中心位置等の所定の位置を、画像の回転の中心位置として設定するようにスマートフォン2を構成する場合には、回転中心設定部27を除外し、角度補正部28に画像の回転の中心位置の座標をあらかじめ与えればよい。
(スマートフォン2における翻訳の処理の流れ:その1)
図5は、スマートフォン2における翻訳の処理の流れを例示するフローチャートである。図5の処理S11〜S18は、表示部11の中心位置を、画像の回転の中心位置とする場合の処理の流れを例示している。なお、図5の処理S11〜S15は、上述の図4の処理S1〜S5と同様である。従って、図5の処理S16〜S18ならびにその前後の処理についてのみ説明する。
図5は、スマートフォン2における翻訳の処理の流れを例示するフローチャートである。図5の処理S11〜S18は、表示部11の中心位置を、画像の回転の中心位置とする場合の処理の流れを例示している。なお、図5の処理S11〜S15は、上述の図4の処理S1〜S5と同様である。従って、図5の処理S16〜S18ならびにその前後の処理についてのみ説明する。
処理S15の後に、回転中心設定部27は、入力位置検出部22から入力位置を取得し、2つの入力位置が入力部12上にあるか否かを判定する(処理S16)。そして、回転中心設定部27が、2つの入力位置が入力部12上にあると判定した場合(S16においてYES)、回転中心設定部27は、さらに、2つの入力位置の時間的な変化を参照し、2つの入力位置が回転しているか否かを判定する(処理S17)。
回転中心設定部27は、2つの入力位置が回転していると判定した場合(S17においてYES)、表示部11の中心位置を、画像の回転の中心位置として設定する。そして、角度補正部28は、表示部11の中心位置を画像の回転の中心位置として、2つの入力位置の回転方向に応じて、2つの入力位置の回転角度に比例する角度だけ画像を回転させる(処理S18)。そして、処理S13に戻り、処理S13〜S16が反復される。
他方、回転中心設定部27が、2つの入力位置が入力部12上にないと判定した場合(S16においてNO)、および、回転中心設定部27が、2つの入力位置が回転していないと判定した場合(S17においてNO)には、画像の回転が行われず、表示部11には、処理S15において表示された翻訳結果が、継続して表示されている。
(スマートフォン2における翻訳の処理の流れ:その2)
図6は、スマートフォン2における翻訳の処理の流れを例示するフローチャートである。図6の処理S21〜S28は、2つの入力位置の中点を、画像の回転の中心位置とする場合の処理の流れを例示している。なお、図6の処理S21〜S27は、上述の図5の処理S11〜S17と同様である。従って、図6の処理S28ならびにその前後の処理についてのみ説明する。
図6は、スマートフォン2における翻訳の処理の流れを例示するフローチャートである。図6の処理S21〜S28は、2つの入力位置の中点を、画像の回転の中心位置とする場合の処理の流れを例示している。なお、図6の処理S21〜S27は、上述の図5の処理S11〜S17と同様である。従って、図6の処理S28ならびにその前後の処理についてのみ説明する。
回転中心設定部27は、2つの入力位置が回転していると判定した場合(S27においてYES)、2つの入力位置の中点を、画像の回転の中心位置として設定する。そして、角度補正部28は、2つの入力位置の中点を画像の回転の中心位置として、2つの入力位置の回転方向に応じて、2つの入力位置の回転角度に比例する角度だけ画像を回転させる(処理S28)。そして、処理S23に戻り、処理S23〜S26が反復される。
(スマートフォン2の効果)
スマートフォン2の効果について、図7を用いて説明する。図7の(a)および(b)は、スマートフォン2において、上述の図3と同様に、被写体が撮影された画像に含まれる英語の文字に対して、OCR処理および翻訳が行われた場合を例示する図である。
スマートフォン2の効果について、図7を用いて説明する。図7の(a)および(b)は、スマートフォン2において、上述の図3と同様に、被写体が撮影された画像に含まれる英語の文字に対して、OCR処理および翻訳が行われた場合を例示する図である。
図7の(a)は、図3の(c)に相当する図であり、ユーザは入力部12上において、2本の指を時計方向に回転させる操作を行うことによって、画像の回転角度を調整している時点を例示する図である。ユーザが時計方向に2本の指を回転した角度に比例して、画像の時計方向の回転角度が決定される。ユーザが2本の指を適当な方向に、かつ適当な角度だけ回転させる操作を行うことにより、ユーザは画像が概ね正立するように、画像の回転角度を手動で調整することができる。
図7の(b)は、図3の(d)と同様の図であり、回転角度が調整された画像に、OCR処理および翻訳が行われた場合を例示する図である。なお、図7の(b)は、実施形態1と同様に、表示部11の中心位置が、画像の回転の中心位置として設定されている場合を例示している。図7の(b)においても、図3の(d)と同様に、画像に含まれている英語の文字の全てがOCR処理され、かつ、翻訳結果が当該英語の文字に重畳され、表示部11に表示されている。
従って、ユーザは、正立した画像を撮影することができなかった場合でも、表示部11に表示された翻訳結果を確認しながら、画像の回転角度を手動で調整することによって、適切な翻訳結果を得ることができる。スマートフォン2では、1回の操作当たりの画像の回転角度をユーザが容易に調整できるので、ユーザの操作の利便性が向上する。
また、画像の回転の中心位置として、表示部11の中心位置が設定される場合には、ユーザが入力部12のどの位置において2本の指を回転させても、表示部11の中央付近の位置に翻訳結果を表示させることができるので、翻訳結果の視認性が向上する。
また、画像の回転の中心位置として、2つの入力位置の中点が設定される場合には、ユーザが表示部11の所望の位置に、翻訳結果を表示させることができるので、表示部11の画面レイアウトの自由度が向上する。
なお、上述の実施形態1および2では、情報機器の一例として、タッチパネル10を内蔵したスマートフォン1および2を例示しているが、本発明は、タッチパネル10を入力装置として動作する他の情報機器(例えばPC)についても適用可能である。従って、タッチパネル10は情報機器に外付けされた外部の入力装置であってもよい。撮影部30もまた、情報機器に内蔵されている必要はなく、情報機器に外付けされていてもよい。
〔実施形態3〕
スマートフォン1および2の制御ブロック(特に主制御部20および26)は、集積回路(ICチップ)等に形成された論理回路(ハードウェア)によって実現してもよいし、CPU(Central Processing Unit)を用いてソフトウェアによって実現してもよい。
スマートフォン1および2の制御ブロック(特に主制御部20および26)は、集積回路(ICチップ)等に形成された論理回路(ハードウェア)によって実現してもよいし、CPU(Central Processing Unit)を用いてソフトウェアによって実現してもよい。
後者の場合、スマートフォン1および2は、各機能を実現するソフトウェアであるプログラムの命令を実行するCPU、上記プログラムおよび各種データがコンピュータ(またはCPU)で読み取り可能に記録されたROM(Read Only Memory)または記憶装置(これらを「記録媒体」と称する)、上記プログラムを展開するRAM(Random Access Memory)等を備える。そして、コンピュータ(またはCPU)が上記プログラムを上記記録媒体から読み取って実行することにより、本発明の目的が達成される。上記記録媒体としては、「一時的でない有形の媒体」、例えば、テープ、ディスク、カード、半導体メモリ、プログラマブルな論理回路等を用いることができる。また、上記プログラムは、該プログラムを伝送可能な任意の伝送媒体(通信ネットワークや放送波等)を介して上記コンピュータに供給されてもよい。なお、本発明は、上記プログラムが電子的な伝送によって具現化された、搬送波に埋め込まれたデータ信号の形態でも実現され得る。
〔まとめ〕
本発明の態様1に係る情報機器(スマートフォン1)は、翻訳対象となる文字を含む第1対象画像を取得し、上記第1対象画像に含まれる文字を翻訳する情報機器であって、ユーザの入力操作に応じて上記第1対象画像を回転させた第2対象画像を生成する画像回転手段(角度補正部23)と、上記第2対象画像を文字認識処理の対象として、上記第2対象画像に含まれる文字を認識する文字認識手段(OCR処理部24)と、上記文字認識手段において認識に成功した文字を翻訳対象として翻訳結果を生成し、上記第2対象画像に上記翻訳結果を上記翻訳対象に重畳させた表示用画像を生成する翻訳処理手段(翻訳処理部25)と、を備えている。
本発明の態様1に係る情報機器(スマートフォン1)は、翻訳対象となる文字を含む第1対象画像を取得し、上記第1対象画像に含まれる文字を翻訳する情報機器であって、ユーザの入力操作に応じて上記第1対象画像を回転させた第2対象画像を生成する画像回転手段(角度補正部23)と、上記第2対象画像を文字認識処理の対象として、上記第2対象画像に含まれる文字を認識する文字認識手段(OCR処理部24)と、上記文字認識手段において認識に成功した文字を翻訳対象として翻訳結果を生成し、上記第2対象画像に上記翻訳結果を上記翻訳対象に重畳させた表示用画像を生成する翻訳処理手段(翻訳処理部25)と、を備えている。
上記の構成によれば、ユーザは、被写体の撮影条件が限られている等の理由により、高精度な文字認識処理が行われない画像(すなわち、正立しておらず傾いている画像)が第1対象画像として得られた場合でも、自身の入力操作によって対象画像の回転角度を手動で調整することにより、文字認識処理、および後続の翻訳処理が適切に行われる第2対象画像(すなわち、概ね正立している画像)を得ることができる。
従って、ユーザは、翻訳処理手段において生成された表示用画像を表示装置(例えばスマートフォンのタッチパネル)によって確認しながら上述の調整操作を行うことができ、文字認識処理、および後続の翻訳処理に好適な第2対象画像を得ることができる。
また、本発明の態様2に係る情報機器は、上記態様1において、ユーザの入力操作を受け付けるタッチパネル(10)と、ユーザが上記第1対象画像を回転させるための入力操作を行う対象である回転ボタンを、上記タッチパネルに表示させる回転ボタン表示手段(角度補正部23)をさらに備え、上記画像回転手段は、ユーザが上記回転ボタンを1回タップするごとに、上記タッチパネルの所定の位置を回転中心位置として、所定の角度だけ、上記第1対象画像を所定の方向に回転させて上記第2対象画像を生成してもよい。
上記の構成によれば、ユーザは、タッチパネルに表示された回転ボタンをタップし、所定の角度(例えば1°)ずつ第1対象画像を回転させながら第2対象画像を得ることができるので、画像の回転角度を調整するためのユーザによる操作の利便性を向上させることができる。
また、本発明の態様3に係る情報機器は、上記態様2において、上記画像回転手段は、ユーザが上記タッチパネル上において、2本の指を所定の方向に回転させたとき、上記タッチパネルの所定の位置を回転中心位置として、上記2本の指の回転角度に比例した角度だけ、上記第1対象画像を所定の方向に回転させて上記第2対象画像を生成してもよい。
上記の構成によれば、ユーザが1回の操作当たりの画像の回転角度を容易に調整できるので、ユーザによる操作の利便性を向上させることができる。また、ユーザがタッチパネル上のどの位置において2本の指を回転させても、タッチパネルの所定の位置(例えば、中央付近の位置)に翻訳結果が含まれた表示用画像を表示させることができるので、翻訳結果の視認性を向上させることができる。
また、本発明の態様4に係る情報機器は、上記態様2において、ユーザが上記タッチパネル上に2本の指を置いた時点における、上記2本の指の位置にそれぞれ対応する2つの入力位置の中点を算出する回転中心算出手段(回転中心設定部27)をさらに備え、上記画像回転手段は、ユーザが上記タッチパネル上において、上記2本の指を所定の方向に回転させたとき、上記中点を回転中心位置として、上記2本の指の回転角度に比例した角度だけ、上記第1対象画像を所定の方向に回転させて上記第2対象画像を生成してもよい。
上記の構成によれば、上述の態様3と同様に、ユーザが1回の操作当たりの画像の回転角度を容易に調整できるので、ユーザによる操作の利便性を向上させることができる。また、2つの入力位置の中点を画像の回転の中心位置とすることにより、ユーザが表示部11の所望の位置に、翻訳結果が含まれた表示用画像を表示させることができるので、タッチパネルの画面レイアウトの自由度を向上させることができる。
また、本発明の各態様に係る情報機器は、コンピュータによって実現してもよく、この場合には、コンピュータを上記情報機器が備える各手段として動作させることにより上記情報機器をコンピュータにて実現させる情報機器の制御プログラム、およびそれを記録したコンピュータ読み取り可能な記録媒体も、本発明の範疇に入る。
なお、本発明は上述した各実施形態に限定されるものではなく、請求項に示した範囲で種々の変更が可能であり、異なる実施形態にそれぞれ開示された技術的手段を適宜組み合わせて得られる実施形態も本発明の技術的範囲に含まれる。さらに、各実施形態にそれぞれ開示された技術的手段を組み合わせることにより、新しい技術的特徴を形成できる。
本発明は、情報機器に利用することができる。
1,2 スマートフォン(情報機器)、10 タッチパネル
23 角度補正部(画像回転手段、回転ボタン表示手段)
24 OCR処理部(文字認識手段)
25 翻訳処理部(翻訳処理手段)、27 回転中心設定部(回転中心算出手段)
28 角度補正部(画像回転手段)
23 角度補正部(画像回転手段、回転ボタン表示手段)
24 OCR処理部(文字認識手段)
25 翻訳処理部(翻訳処理手段)、27 回転中心設定部(回転中心算出手段)
28 角度補正部(画像回転手段)
Claims (5)
- 翻訳対象となる文字を含む第1対象画像を取得し、上記第1対象画像に含まれる文字を翻訳する情報機器であって、
ユーザの入力操作に応じて上記第1対象画像を回転させた第2対象画像を生成する画像回転手段と、
上記第2対象画像を文字認識処理の対象として、上記第2対象画像に含まれる文字を認識する文字認識手段と、
上記文字認識手段において認識に成功した文字を翻訳対象として翻訳結果を生成し、上記第2対象画像に上記翻訳結果を上記翻訳対象に重畳させた表示用画像を生成する翻訳処理手段と、を備えていることを特徴とする情報機器。 - ユーザの入力操作を受け付けるタッチパネルと、
ユーザが上記第1対象画像を回転させるための入力操作を行う対象である回転ボタンを、上記タッチパネルに表示させる回転ボタン表示手段をさらに備え、
上記画像回転手段は、ユーザが上記回転ボタンを1回タップするごとに、上記タッチパネルの所定の位置を回転中心位置として、所定の角度だけ、上記第1対象画像を所定の方向に回転させて上記第2対象画像を生成することを特徴とする請求項1に記載の情報機器。 - 上記画像回転手段は、ユーザが上記タッチパネル上において、2本の指を所定の方向に回転させたとき、上記タッチパネルの所定の位置を回転中心位置として、上記2本の指の回転角度に比例した角度だけ、上記第1対象画像を所定の方向に回転させて上記第2対象画像を生成することを特徴とする請求項2に記載の情報機器。
- ユーザが上記タッチパネル上に2本の指を置いた時点における、上記2本の指の位置にそれぞれ対応する2つの入力位置の中点を算出する回転中心算出手段をさらに備え、
上記画像回転手段は、ユーザが上記タッチパネル上において、上記2本の指を所定の方向に回転させたとき、上記中点を回転中心位置として、上記2本の指の回転角度に比例した角度だけ、上記第1対象画像を所定の方向に回転させて上記第2対象画像を生成することを特徴とする請求項2に記載の情報機器。 - 請求項1から4のいずれか1項に記載の情報機器としてコンピュータを機能させるための制御プログラムであって、コンピュータを上記各手段として機能させるための制御プログラム。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2013198796A JP2015064781A (ja) | 2013-09-25 | 2013-09-25 | 情報機器および制御プログラム |
PCT/JP2014/071715 WO2015045679A1 (ja) | 2013-09-25 | 2014-08-20 | 情報機器および制御プログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2013198796A JP2015064781A (ja) | 2013-09-25 | 2013-09-25 | 情報機器および制御プログラム |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2015064781A true JP2015064781A (ja) | 2015-04-09 |
Family
ID=52742833
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2013198796A Pending JP2015064781A (ja) | 2013-09-25 | 2013-09-25 | 情報機器および制御プログラム |
Country Status (2)
Country | Link |
---|---|
JP (1) | JP2015064781A (ja) |
WO (1) | WO2015045679A1 (ja) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2019118462A (ja) * | 2017-12-28 | 2019-07-22 | コニカミノルタ株式会社 | 放射線画像表示装置および画像表示方法 |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111491057A (zh) * | 2019-01-25 | 2020-08-04 | 上海爱优威软件开发有限公司 | 一种通话辅助方法及系统 |
CN110991445B (zh) * | 2019-11-21 | 2023-09-29 | 北京达佳互联信息技术有限公司 | 竖排文字识别方法、装置、设备及介质 |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2006146454A (ja) * | 2004-11-18 | 2006-06-08 | Sony Corp | 情報変換装置および情報変換方法 |
JP2010286917A (ja) * | 2009-06-09 | 2010-12-24 | Sharp Corp | 画像処理装置、画像読取装置、複合機、画像処理方法、プログラムおよび記録媒体 |
-
2013
- 2013-09-25 JP JP2013198796A patent/JP2015064781A/ja active Pending
-
2014
- 2014-08-20 WO PCT/JP2014/071715 patent/WO2015045679A1/ja active Application Filing
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2006146454A (ja) * | 2004-11-18 | 2006-06-08 | Sony Corp | 情報変換装置および情報変換方法 |
JP2010286917A (ja) * | 2009-06-09 | 2010-12-24 | Sharp Corp | 画像処理装置、画像読取装置、複合機、画像処理方法、プログラムおよび記録媒体 |
Non-Patent Citations (2)
Title |
---|
"ウィンドウズの常識が変わった! すべてわかる!ウィンドウズ8 Part3 タッチ操作編 8流タッチ操", 日経PC21, vol. 第17巻第18号, JPN6017017133, 24 October 2012 (2012-10-24), JP, pages 58 - 59, ISSN: 0003726883 * |
松田 崇宏 外3名: "第19回画像センシングシンポジウム(SSII2013) インタラクティブ&ショートオーラルセッション", SSII2013 第19回画像センシングシンポジウム 講演論文集 [CD−ROM], JPN6018002365, 12 June 2013 (2013-06-12), JP, pages 1 - 28, ISSN: 0003726884 * |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2019118462A (ja) * | 2017-12-28 | 2019-07-22 | コニカミノルタ株式会社 | 放射線画像表示装置および画像表示方法 |
Also Published As
Publication number | Publication date |
---|---|
WO2015045679A1 (ja) | 2015-04-02 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR102529120B1 (ko) | 영상을 획득하는 방법, 디바이스 및 기록매체 | |
US10922862B2 (en) | Presentation of content on headset display based on one or more condition(s) | |
US10291843B2 (en) | Information processing apparatus having camera function and producing guide display to capture character recognizable image, control method thereof, and storage medium | |
US10317777B2 (en) | Automatic zooming method and apparatus | |
CN112488914B (zh) | 图像拼接方法、装置、终端及计算机可读存储介质 | |
US10552946B2 (en) | Display control apparatus and method for controlling the same based on orientation | |
KR20160027862A (ko) | 이미지 데이터를 처리하는 방법과 이를 지원하는 전자 장치 | |
US20150010236A1 (en) | Automatic image refocusing method | |
JP6206581B2 (ja) | 端末装置、表示制御方法及びプログラム | |
KR102450236B1 (ko) | 전자 장치, 그 제어 방법 및 컴퓨터 판독가능 기록 매체 | |
JP6170241B2 (ja) | 文字特定装置、および制御プログラム | |
CN110706283A (zh) | 用于视线追踪的标定方法、装置、移动终端及存储介质 | |
US20150347364A1 (en) | Highlighting input area based on user input | |
CN113873148A (zh) | 录像方法、装置、电子设备和可读存储介质 | |
WO2015045679A1 (ja) | 情報機器および制御プログラム | |
US20160350622A1 (en) | Augmented reality and object recognition device | |
US11770603B2 (en) | Image display method having visual effect of increasing size of target image, mobile terminal, and computer-readable storage medium | |
JP6164361B2 (ja) | 端末装置、表示制御方法及びプログラム | |
JP6206580B2 (ja) | 端末装置、表示制御方法及びプログラム | |
JP2018124918A (ja) | 画像処理装置、画像処理方法及びプログラム | |
CN108604128B (zh) | 一种处理方法及移动设备 | |
JP6686319B2 (ja) | 画像投影装置及び画像表示システム | |
KR102605451B1 (ko) | 이미지 내에 포함된 복수의 외부 객체들 각각에 대응하는 복수의 서비스들을 제공하는 전자 장치 및 방법 | |
JP2015032261A (ja) | 表示装置および制御方法 | |
JP6251075B2 (ja) | 翻訳装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20160331 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20170516 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20170707 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20180130 |