JP6448696B2 - 情報処理装置、方法及びプログラム - Google Patents
情報処理装置、方法及びプログラム Download PDFInfo
- Publication number
- JP6448696B2 JP6448696B2 JP2017055352A JP2017055352A JP6448696B2 JP 6448696 B2 JP6448696 B2 JP 6448696B2 JP 2017055352 A JP2017055352 A JP 2017055352A JP 2017055352 A JP2017055352 A JP 2017055352A JP 6448696 B2 JP6448696 B2 JP 6448696B2
- Authority
- JP
- Japan
- Prior art keywords
- size
- recognition
- character
- image
- area
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V20/00—Scenes; Scene-specific elements
- G06V20/20—Scenes; Scene-specific elements in augmented reality scenes
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V20/00—Scenes; Scene-specific elements
- G06V20/60—Type of objects
- G06V20/62—Text, e.g. of license plates, overlay texts or captions on TV images
- G06V20/63—Scene text, e.g. street names
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V20/00—Scenes; Scene-specific elements
- G06V20/60—Type of objects
- G06V20/62—Text, e.g. of license plates, overlay texts or captions on TV images
- G06V20/635—Overlay text, e.g. embedded captions in a TV program
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/24—Character recognition characterised by the processing or recognition method
- G06V30/242—Division of the character sequences into groups prior to recognition; Selection of dictionaries
- G06V30/244—Division of the character sequences into groups prior to recognition; Selection of dictionaries using graphical properties, e.g. alphabet type or font
- G06V30/2445—Alphabet recognition, e.g. Latin, Kanji or Katakana
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/28—Character recognition specially adapted to the type of the alphabet, e.g. Latin alphabet
- G06V30/287—Character recognition specially adapted to the type of the alphabet, e.g. Latin alphabet of Kanji, Hiragana or Katakana characters
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/28—Character recognition specially adapted to the type of the alphabet, e.g. Latin alphabet
- G06V30/293—Character recognition specially adapted to the type of the alphabet, e.g. Latin alphabet of characters other than Kanji, Hiragana or Katakana
Description
本発明の実施形態は、情報処理装置、方法及びプログラムに関する。
近年では、例えば画像から特定の認識対象を認識することが可能な情報処理装置が開発されている。このような情報処理装置の一例としては、例えば文字が記載されている被写体の画像を撮像することによって当該画像から文字を認識する文字認識装置がある。
ところで、上記した画像には様々な文字(認識対象)が含まれている場合があり、当該文字の全てを認識しようとすると多くの処理時間が必要となる場合がある。
ところで、上記した画像には様々な文字(認識対象)が含まれている場合があり、当該文字の全てを認識しようとすると多くの処理時間が必要となる場合がある。
これに対して、例えば文字認識装置において認識する文字のサイズ等を制限することにより、処理時間を短縮することが可能となる。
しかしながら、文字認識装置において認識される文字(のサイズ)をユーザが把握していなければ、画像から当該ユーザの希望する文字が認識されないような事態が生じ、当該文字認識装置に対する利便性が低下する。
そこで、本発明が解決しようとする課題は、画像から認識される対象をユーザが容易に把握することが可能な情報処理装置、方法及びプログラムを提供することにある。
実施形態に係る情報処理装置は、表示処理手段と、認識手段とを備える。前記表示処理手段は、画像及び認識対象のサイズに関する情報の表示処理を実行する。前記認識手段は、前記画像から認識対象を認識する。前記認識対象のサイズに関する情報は、第1サイズ及び前記第1サイズより大きな第2サイズに関する情報を含む。前記第1サイズ及び前記第2サイズの何れか一つは変更可能である。
以下、図面を参照して、各実施形態について説明する。
(第1の実施形態)
図1は、第1の実施形態に係る情報処理装置の構成の一例を示すブロック図である。本実施形態に係る情報処理装置は、画像から認識対象を認識することが可能な機能を有し、例えばスマートフォン及びタブレットコンピュータ等の携帯型の電子機器として実現され得る。以下の説明においては、上記した認識対象として文字を認識する情報処理装置(以下、文字認識装置と表記)について主に説明する。なお、本実施形態において、例えば、文字を「認識」するとは、単に文字を「検出」すること等を含むものとする。
(第1の実施形態)
図1は、第1の実施形態に係る情報処理装置の構成の一例を示すブロック図である。本実施形態に係る情報処理装置は、画像から認識対象を認識することが可能な機能を有し、例えばスマートフォン及びタブレットコンピュータ等の携帯型の電子機器として実現され得る。以下の説明においては、上記した認識対象として文字を認識する情報処理装置(以下、文字認識装置と表記)について主に説明する。なお、本実施形態において、例えば、文字を「認識」するとは、単に文字を「検出」すること等を含むものとする。
図1に示すように、文字認識装置10は、カメラ11、格納部12、処理部13及び表示部14を含む。
カメラ11は、上記したスマートフォンのような文字認識装置10の背面等に搭載されており、当該文字認識装置10を把持するユーザの周辺に配置されている被写体の画像を撮像する。なお、被写体は、例えば文字(から構成される文字列)が記載されている街中の看板等を含む。すなわち、本実施形態において、カメラ11は、複数の文字を含む画像を撮像する。
格納部12は、文字認識装置10に備えられる例えばHDD(Hard Disk Drive)、SSD(Solid State Drive)、ROM(Read Only Memory)またはRAM(Random Access Memory)等の記憶装置を用いて実現される。
格納部12には、カメラ11によって撮像された画像から文字を認識するために用いられるパラメータが設定された設定ファイルが格納されている。設定ファイルにおいて設定されているパラメータには、文字のサイズに関する情報であるサイズパラメータ(第1のパラメータ)及び認識対象とする画像の領域(認識対象領域)に関する情報であるエリアパラメータ(第2のパラメータ)が含まれる。サイズパラメータには、例えば画像から認識される文字のサイズ(以下、認識サイズと表記)が規定されている。一方、エリアパラメータには、文字が認識される画像中の領域(以下、認識エリアと表記)が規定されている。
処理部13は、記憶装置に格納されたプログラムを実行する文字認識装置10に備えられるコンピュータ(例えば、プロセッサ等)によって実現される。なお、コンピュータによって実行されるプログラムには、オペレーティングシステム及び画像から文字を認識するためのアプリケーションプログラム(以下、文字認識アプリケーションと表記)等が含まれる。
処理部13は、主として画像及び文字(認識対象)のサイズに関する情報を表示するための処理を実行する機能部である。処理部13は、画像表示処理部(第1の表示処理部)131、サイズ表示処理部(第2の表示処理部)132、エリア表示処理部(第3の表示処理部)133及び文字認識処理部134を含む。処理部13に含まれる各部131〜134の一部または全ては、例えばコンピュータに上記した文字認識アプリケーションを実行させること、すなわち、ソフトウェアによって実現されるものとする。なお、これらの各部131〜134の一部または全ては、例えばIC(Integrated Circuit)等のハードウェアによって実現されてもよいし、ソフトウェア及びハードウェアの組み合わせ構成として実現されてもよい。コンピュータに実行させる文字認識アプリケーションは、コンピュータ読み取り可能な記憶媒体に格納して頒布されてもよいし、またはネットワークを通じて文字認識装置10にダウンロードされてもよい。
画像表示処理部131は、カメラ11によって撮像された画像を取得する。なお、カメラ11によって撮像された画像は、格納部11に格納されていても構わない。この場合、画像表示処理部131は、格納部11から画像を取得することができる。また、画像表示処理部131は、例えば文字認識装置10の外部のサーバ装置等から画像を取得してもよい。画像表示処理部131は、取得された画像を表示部14に表示する。
サイズ表示処理部132は、画像表示処理部131によって表示された画像上に、上記したサイズパラメータに規定されている認識サイズを視覚的に把握することが可能な情報(認識対象の視覚情報)を表示する。この場合、サイズ表示処理部132は、認識サイズの文字(当該認識サイズと同程度のサイズの文字)を表示する。すなわち、本実施形態において、サイズパラメータ(文字に関する情報)は、文字の形状に関する情報(つまり、表示する文字の視覚情報)を含む。また、サイズ表示処理部132は、文字認識装置10に対するユーザの操作に応じて、認識サイズの変更に関する情報を取得し、サイズパラメータを変更する。
エリア表示処理部133は、画像表示処理部131によって表示された画像上に、上記したエリアパラメータに規定されている認識エリアを表示する。また、エリア表示処理部133は、文字認識装置10に対するユーザの操作に応じて、認識エリアの変更に関する情報を取得し、エリアパラメータを変更する。
文字認識処理部134は、設定ファイルにおいて設定されているパラメータ(サイズパラメータ及びエリアパラメータ)に従って、画像表示処理部131によって表示された画像(カメラ11によって撮像された画像)から文字を認識する。なお、文字認識処理部134は、サイズパラメータまたはエリアパラメータが変更された場合には、当該変更されたサイズパラメータまたはエリアパラメータに従って(つまり、認識サイズまたは認識エリアの変更に関する情報に基づいて)文字を認識する。
表示部14は、文字認識装置10に備えられる例えばタッチパネルディスプレイ等を用いて実現される。
なお、上記したタッチパネルディスプレイには、当該タッチパネルディスプレイの画面上の指(またはペン)の接触位置を検出することが可能な例えば静電容量方式のタッチパネル等が組み込まれている。これによれば、ユーザは、タッチパネルディスプレイの画面に指を接触させる(タッチする)ことにより文字認識装置10に対する操作を行うことが可能である。
次に、図2のフローチャートを参照して、本実施形態に係る文字認識装置10の処理手順の一例について説明する。
なお、図2に示す処理は、例えば文字認識装置10において上記した文字認識アプリケーションが起動された際に処理部13によって実行されるものとする。
まず、文字認識装置10において文字認識アプリケーションが起動されると、画像表示処理部131は、カメラ11によって撮像された画像を取得する。ここで、上記したように文字認識装置10がスマートフォン等であるものとすると、当該文字認識装置10には、ユーザがカメラ11に対して画像の撮像を指示するためのボタン(例えば、シャッターボタン)が設けられているものとする。この場合、画像表示処理部131は、例えばユーザがシャッターボタンを押下することによってカメラ11によって撮像された静止画像を取得する。画像表示処理部131は、取得された画像を表示部14に表示する(ステップS1)。
次に、サイズ表示処理部132は、格納部12に格納されている設定ファイルを参照して、当該設定ファイルに設定されているパラメータのうちサイズパラメータを取得する。なお、サイズ表示処理部132によって取得されるサイズパラメータにおいては、上記した認識サイズの最小値(第1のサイズ)及び最大値(第2のサイズ)が規定(定義)されている。すなわち、サイズパラメータには、認識サイズの範囲(最小値から最大値までの範囲)が規定されている。このようなサイズパラメータによれば、最小値から最大値までの範囲に該当するサイズの文字が画像から認識されることが示されている。
サイズ表示処理部132は、取得されたサイズパラメータに規定されている認識サイズの文字を、ステップS1において表示部14に表示された画像上に表示する(ステップS2)。
次に、エリア表示処理部133は、格納部12に格納されている設定ファイルを参照して、当該設定ファイルに設定されているパラメータのうちエリアパラメータを取得する。なお、エリア表示処理部133によって取得されるエリアパラメータにおいては、上記した認識エリアの位置及び大きさが例えば画像上の座標値等により規定(定義)されている。具体的には、エリアパラメータには、例えば画像上のx座標の最大値及び最小値とy座標の最大値及び最小値が規定されているものとする。なお、エリアパラメータとしては、例えば画像中の多角形(認識エリア)の内側の画素数をNとした場合における当該N点の座標値が規定されていてもよい。また、例えば画素値が0以外の領域を認識エリアとするようにエリアパラメータが規定されていてもよい。
エリア表示処理部133は、取得されたエリアパラメータに規定されている認識エリアを、ステップS1において表示部14に表示された画像上に表示する(ステップS3)。
ここで、図3を参照して、表示部14に表示された画像の一例について説明する。図3に示す例では、表示部14には、例えば街中等に配置されている「○○美術館」の文字(列)が記載された看板を含む画像301が表示されている。
また、この画像301上には、サイズ表示領域302が設けられている。サイズ表示領域302は、サイズパラメータに規定されている認識サイズ(画像から認識される文字のサイズ)を表示するための領域である。具体的には、サイズ表示領域302には、小さいサイズの文字302a及び大きいサイズの文字302bが表示されている。
ここで、サイズパラメータにおいては、上記したように認識サイズの最小値及び最大値が規定されている。すなわち、サイズ表示領域302に表示されている文字302aは、サイズパラメータに規定されている最小値に対応するサイズの文字(つまり、認識可能な最小の文字)を表している。一方、サイズ表示領域302に表示されている文字302bは、サイズパラメータに規定されている最大値に対応するサイズの文字(つまり、認識可能な最大の文字)を表している。
ユーザは、このようなサイズ表示領域302(に表示されている文字302a及び文字302b)を確認することによって、サイズパラメータに従って文字302aのサイズから文字302bのサイズまでの範囲の文字を認識可能であることを把握することができる。
なお、図3に示す例では、サイズ表示領域302には文字302a及び文字302bの2つの文字が表示されているが、当該サイズ表示領域302には、3つ以上の文字が表示されても構わない。この場合、文字302a及び文字302b以外には、例えばサイズパラメータに規定されている認識サイズの最小値と最大値との中間の値に対応するサイズの文字等が表示されても構わない。
また、画像301上には、エリアパラメータに規定されている認識エリア(文字が認識される画像中の領域)が表示される。図3に示す例では、エリアパラメータに規定されている認識エリアは、矩形の枠303で表されている。これによれば、ユーザは、矩形の枠303によって表される領域(以下、認識エリア303と表記)内の文字(列)が認識可能であることを把握することができる。なお、エリアパラメータにおいて、認識エリア303は、例えば画像101の中央に位置するように規定されているものとする。同様に、エリアパラメータにおいては、例えば認識エリア303の各辺の長さ等が規定されているものとする。
ここで、図3に示す例において、画像301に含まれる看板に記載されている「○○美術館」の文字列を構成する各文字は、文字302aのサイズよりも大きく、文字302bのサイズよりも小さい。また、「○○美術館」の文字列は、認識エリア303内に含まれている。この場合、画像301に含まれる「○○美術館」の文字列(を構成する文字)は、後述する文字認識処理によって画像301から認識可能である。
ここでは文字が認識可能な例について説明したが、例えば図4に示すように画像311に含まれる文字のサイズが文字302bのサイズよりも大きい場合には、「○○美術館」の文字列(を構成する文字)は画像311から認識されない。
この場合、ユーザは、図4に示す画像311に含まれる文字列「○○美術館」を文字認識装置10において認識させるために、文字認識装置10を操作することによってサイズパラメータに規定されている認識サイズ(の範囲)を変更することができる。
ここで、サイズパラメータに規定されている認識サイズの範囲を変更する際のユーザの操作(以下、サイズ変更操作と表記)の例について説明する。なお、文字認識装置10はタッチパネルディスプレイを備え、サイズ変更操作は、当該タッチパネルディスプレイに対する操作であるものとする。
ここでは、第1〜第3のサイズ変更操作について説明する。第1のサイズ変更操作は、例えばサイズ表示領域302に表示されている文字302aまたは文字302bをタッチする操作である。このような第1のサイズ変更操作によれば、当該第1のサイズ変更操作が行われる度に、サイズパラメータに規定されている認識サイズの最小値または最大値が段階的に変更されるものとする。
具体的には、サイズ表示領域302に表示されている文字302aが1回タッチされた場合には、認証サイズの最小値を1段階大きくすることができる。この場合、サイズ表示領域302に表示されている文字302aのサイズは、変更された後の最小値に対応するサイズに変更される。
また、サイズ表示領域302に表示されている文字302bが1回タッチされた場合には、認証サイズの最大値を1段階大きくすることができる。この場合、サイズ表示領域302に表示されている文字302bのサイズは、変更された後の最大値に対応するサイズに変更される。
ここでは、認識サイズの最小値または最大値を大きくする場合について説明したが、当該最小値または最大値を小さくする場合には、ユーザは、当該最小値または最大値を大きくする場合の操作とは異なる第1のサイズ変更操作を行うものとする。この認識サイズの最小値または最大値を小さくする場合の第1のサイズ変更操作には、例えばサイズ表示領域302に表示されている文字302aまたは文字302bを連続で2回タッチするまたは長くタッチするといった操作が含まれる。
次に、第2のサイズ変更操作は、例えばサイズ表示領域302に表示されている文字302aまたは文字302bをスライドさせる操作である。このような第2のサイズ変更操作によれば、当該第2のサイズ変更操作によって文字がスライドさせられた距離に応じてサイズパラメータに規定されている認識サイズの最小値または最大値が変更されるものとする。
具体的には、図5に示すように、サイズ表示領域302に表示されている文字302aをタッチした状態で左方向にスライドさせた場合には、認識サイズの最小値を小さくすることができる。一方、図示しないが、サイズ表示領域302に表示されている文字302aをタッチした状態で右方向にスライドさせた場合には、認識サイズの最小値を大きくすることができる。なお、認識サイズの最小値が変更された場合、サイズ表示領域302に表示されている文字302aのサイズは、当該変更された後の最小値に対応するサイズに変更される。
同様に、サイズ表示領域302に表示されている文字302bをタッチした状態で左方向にスライドさせた場合には、認識サイズの最大値を小さくすることができる。一方、サイズ表示領域302に表示されている文字302bをタッチした状態で右方向にスライドさせた場合には、認識サイズの最大値を大きくすることができる。なお、認識サイズの最大値が変更された場合、サイズ表示領域302に表示されている文字302bのサイズは、当該変更された後の最大値に対応するサイズに変更される。
第3のサイズ変更操作は、例えばサイズパラメータに規定されている認識サイズの最小値及び最大値を直接指定(選択)する操作である。
具体的には、例えばサイズ表示領域302(に表示されている文字302aまたは文字302b)がタッチされた場合に、図6に示すようなサイズ指定領域304が表示部14に表示されるものとする。ユーザは、このようなサイズ指定領域304において、認識サイズの最小値(に対応するサイズの文字)及び最大値(に対応するサイズの文字)のそれぞれをタッチする操作を行うことができる。
図6に示す例においては、ユーザは、例えば認識サイズの最小値に対応するサイズの文字として文字304aをタッチし、当該サイズパラメータにおいて規定する認識サイズの最大値に対応するサイズの文字として文字304bをタッチすることができる。これによれば、認識サイズの最小値(文字302aに対応するサイズ)及び最大値(文字302bに対応するサイズ)を、ユーザによってタッチされた文字304a及び文字304bの各々のサイズに対応する最小値及び最大値に変更することができる。なお、このように認識サイズの最小値及び最大値が変更された場合、サイズ表示領域302には、文字304a及び文字304bが表示されることになる。
上記したような第1〜第3のサイズ変更操作によれば、例えば図4に示す画像311が表示されている場合において、サイズ表示領域302に表示されている文字302bのサイズが「○○美術館」の文字よりも大きくなるように認識サイズの最大値を変更することができる。これにより、画像311に含まれる「○○美術館」の文字を当該画像311から認識されるようにすることができる。
なお、ここでは第1〜第3のサイズ変更操作について説明したが、サイズパラメータに規定されている認識サイズは、例えば画像上に表示されるスライドバー等に対する操作のような他の操作によって変更されても構わない。
ここで、図7を参照して、スライドバーに対する操作によってサイズパラメータに規定されている認識サイズが変更される場合について説明する。上記したように例えばサイズ表示領域302がタッチされた場合、表示部14にはサイズ指定領域304が表示される。この場合、サイズ指定領域304には、それぞれ異なるサイズの文字が当該サイズの順に並べて配置されており、当該文字の配置に沿うようにスライドバー304cが設けられている。また、スライドバー304c上には、認識サイズの最小値に対応するスライダー304d及び認識サイズの最大値に対応するスライダー304eが配置されている。ユーザは、このようなスライダー304d及び304eを左右方向にスライドさせることにより、認識サイズの最小値及び最大値を変更することができる。
なお、ここでは認識サイズの最小値から最大値までの範囲を変更する場合について説明したが、例えば図8に示すようにサイズ指定領域304においてカーソル304fを移動させることによって1つのサイズ(の文字)を選択するようにしてもよい。この場合には、例えば選択されたサイズと一致するサイズの文字のみが認識されるように認識サイズが変更されてもよいし、当該選択されたサイズを含む予め定められた範囲内のサイズの文字が認識されるように認識サイズが変更されてもよい。なお、図8に示すように1つのサイズが選択された場合には、例えばサイズ表示領域302には当該サイズの1つの文字が表示されるようにしてもよい。
再び図2に戻ると、サイズ表示処理部132は、上記したサイズ変更操作がユーザによって行われたか否かを判定する(ステップS4)。
サイズ変更操作がユーザによって行われたと判定された場合(ステップS4のYES)、サイズ表示処理部132は、上記したようにサイズパラメータに規定されている認識サイズの範囲(最小値または最大値)を変更する処理を実行する(ステップS5)。なお、ステップS5において認識サイズの範囲が変更された場合、サイズ表示処理部132は、当該変更された認識サイズの範囲に基づいてサイズ表示領域302(に表示される文字)の表示を更新する。
一方、サイズ変更操作がユーザによって行われていないと判定された場合(ステップS4のNO)、ステップS5の処理は実行されない。
なお、上記したようにユーザはサイズ変更操作を行うことによってサイズパラメータに規定されている認識サイズ(の範囲)を変更することができるものとして説明したが、当該ユーザは、文字認識装置10を操作することによってエリアパラメータに規定されている認識エリア(の範囲)を変更することも可能である。
具体的には、ユーザは、例えば表示部14に表示されている認識エリアの内部をタッチした状態で、当該認識エリアを上下または左右方向にスライドさせる操作を行うことによって、当該認識エリアの位置を移動させる(つまり、変更する)ことができる。
また、ユーザは、例えば表示部14に表示されている認識エリアを表す枠上の2点を2本の指でタッチした状態で、当該指を広げるまたは狭くする等の操作を行うことによって、当該認識エリアの大きさを変更することができる。
上記したように認識エリアの位置または大きさが変更された場合、当該認識エリアは、当該変更された後の位置または大きさに基づいて表示部14に表示される。
なお、以下の説明において、上記したエリアパラメータに規定されている認識エリアの位置または大きさを変更する際のユーザの操作を、便宜的にエリア変更操作と称する。
この場合、エリア表示処理部133は、上記したエリア変更操作がユーザによって行われたか否かを判定する(ステップS6)。
エリア変更操作がユーザによって行われたと判定された場合(ステップS6のYES)、エリア表示処理部133は、上記したようにエリアパラメータに規定されている認識エリアの位置及び大きさを変更する処理を実行する(ステップS7)。なお、ステップS7において認識エリアの位置及び大きさが変更された場合、エリア表示処理部133は、当該変更された認識エリアの位置及び大きさに基づいて認識エリア303の表示を更新する。
一方、エリア変更操作がユーザによって行われていないと判定された場合(ステップS6のNO)、ステップS7の処理は実行されない。
次に、文字認識処理部134は、サイズパラメータに規定されている認識サイズ及びエリアパラメータに規定されている認識エリアに基づいて、ステップS1において表示された画像に含まれる文字(列)を認識する処理(以下、文字認識処理と表記)を実行する(ステップS8)。なお、文字認識の手法については公知の技術を利用することが可能であり、例えば特開2016−045877号公報に開示された技術等を利用することが可能である。
ここで、文字認識処理においては、ステップS1において表示された画像から文字を含む領域を検出する処理が実行される。この場合、画像に含まれる複数の文字のうち、サイズパラメータに規定されている認識サイズの範囲(最小値から最大値までの範囲)内に該当する文字であって、かつ、エリアパラメータに規定されている認識エリア内に存在する文字を含む領域(以下、文字領域と表記)が検出される。
次に、文字認識処理部134は、検出された文字領域に対して文字認識を行う。文字認識処理部134は、文字認識結果として、文字領域に含まれる文字から構成される文字列を表すテキストを取得する。
上記したように文字認識処理部134によって取得されたテキストは、例えば言語解析処理等により予め設定された言語に翻訳されて、表示部14に表示されることができる。
ここで、上記したように文字認識処理部134によって取得されるテキストが日本語であり、当該テキストを英語に翻訳して表示部14に表示する場合を想定する。この場合、画像から検出される文字(つまり、翻訳前の文字)は日本語で使用される文字である。このため、上記した画像上に表示される認識サイズの文字(図3及び図4に示す文字302a及び文字302b)としては、日本語で使用される文字を利用する。これによれば、画像から検出される文字(画像に含まれる文字)が当該画像上に表示された認識サイズの範囲に該当する(つまり、認識可能である)か否かについてのユーザの判断を容易にすることできる。なお、翻訳前の言語及び翻訳語の言語は文字認識装置10の動作モード(例えば、日英モード等)としてユーザによって予め設定されており、認識サイズの文字の言語は、当該動作モードに従って決定されるものとする。すなわち、例えば翻訳前の言語が英語であり、翻訳後の言語が日本語である(つまり、動作モードが英日モードである)場合には、認識サイズの文字として英字(例えば、「A」等)を利用することができる。
また、画像から検出される文字の種別(例えば、フォント等)が定められているような場合には、当該種別に従った文字が画像上に表示されるようにしてもよい。また、画像から検出される文字が手書きの文字である場合には、認識サイズの文字として手書きの文字が画像上に表示されても構わない。
すなわち、本実施形態において、文字のサイズに関する情報には当該文字の形状に関する情報(画像上に表示される認識サイズの文字の種別等)が含まれるものとし、当該文字の形状に関する情報は上記した動作モードに応じて決定される構成とすることができる。
ここでは文字認識処理部134によって取得されたテキストが翻訳される場合について説明したが、例えばユーザにとって有用な情報として提示されるのであれば、当該テキストに対して他の処理が実行されても構わない。
なお、本実施形態においては、ステップS1において取得される画像が静止画であるものとして説明したが、当該画像は動画像であってもよいし、当該動画像を構成する複数の画像のうちの1つであっても構わない。
また、図2においては、認識サイズ(の範囲)が変更された後に認識エリア(の位置及び大きさ)が変更されるものとして説明したが、認識エリアが変更された後に認識サイズが変更されるような構成であっても構わない。
上記したように本実施形態においては、画像上にサイズパラメータ(第1のパラメータ)に規定されている認識サイズ(画像から認識される文字のサイズ)の文字を表示し、当該画像に含まれている複数の文字のうち、当該サイズパラメータに規定されているサイズの文字を当該画像から認識する。
本実施形態においては、このような構成により、画像から認識される文字をサイズパラメータに規定されている認識サイズに該当する文字に制限することによって文字認識処理の処理速度を向上させることができるとともに、当該認識サイズ(の範囲)をユーザに提示することが可能であるため、ユーザは、画像から認識される文字のサイズを容易に把握することができる。
また、本実施形態においては、サイズパラメータに規定されている認識サイズの文字が表示されることにより、ユーザは、当該認識サイズを直感的に把握することができる。
更に、本実施形態においては、画像に含まれる文字のサイズが認識サイズに該当していないことによりユーザの希望する文字が認識されないような場合には、当該ユーザの操作に応じて認識サイズの範囲を変更することも可能である。
なお、本実施形態においては上記したようにサイズパラメータに規定されている認識サイズの最小値または最大値を変更することによって、画像から認識される文字のサイズの範囲を変更するものとして説明したが、例えば当該画像に含まれる文字(表示部14に表示されている文字)をユーザが指定することによって、当該ユーザによって指定された文字と同程度のサイズの文字を検出するようにサイズパラメータが変更されてもよい。一方、画像に含まれる文字をユーザが指定することによって、当該ユーザによって指定された文字と同程度のサイズの文字が検出されないようにサイズパラメータが変更されてもよい。
また、本実施形態においては、画像上にエリアパラメータ(第2のパラメータ)に規定されている認識エリア(文字が認識される画像中の領域)を表示し、当該認識エリア内の文字を認識する。本実施形態においては、このような構成により、文字が認識される領域を画像の一部に制限することによって文字認識処理の処理速度を向上させることができるとともに、ユーザは、文字が認識される画像中の領域を容易に把握することができる。
なお、本実施形態においては、エリアパラメータに規定されている認識エリア以外の画像中の領域に含まれる文字は認識されないものとして説明したが、当該認識エリアに含まれる文字を優先的に認識するような構成とすることも可能である。この場合、認識エリアに文字が含まれている(つまり、認識エリアに含まれている文字が認識された)場合には当該認識エリア以外の領域に含まれる文字を認識する処理は実行されないが、当該認識エリアに文字が含まれていない場合には当該認識エリア以外の領域に含まれる文字を認識する処理が実行されるような構成であってもよい。このような構成であっても、認識エリアから文字が認識された場合には当該認識エリア以外の領域から文字を認識する処理は実行されないため、文字認識処理の処理速度を向上させることは可能である。
更に、エリアパラメータに規定されている認識エリアは、画像中の全ての領域であってもよい。また、画像中の全ての領域から文字を認識する場合であって、当該文字を認識する領域(認識エリア)を変更する必要がないような場合には、設定ファイルにおいてエリアパラメータは設定されない構成であってもよい。
また、本実施形態において、サイズ表示領域(サイズパラメータに規定されている認識サイズの文字)が表示される画像上の位置は、例えば図3及び図4に示すように認識エリアの近傍に設定することができる。これによれば、認識エリア内に含まれる文字と認識サイズの文字(範囲)とを適切に比較することが可能となる。
なお、上記したように認識エリアの位置及び大きさが変更された場合には、当該変更後の認識エリアの位置及び大きさに応じてサイズ表示領域の位置が変更されても構わない。
また、サイズ表示領域は、例えば画像処理等によって文字が存在しないと推定される領域に表示されてもよい。更に、サイズ表示領域は、ユーザによって指示された場合に当該ユーザによって指定された位置に表示されるようにしてもよい。また、サイズ表示領域は、画像に含まれる文字が認識された場合には非表示となるようにしてもよい。
なお、本実施形態においては、例えば街中に配置されている看板等を含む画像がカメラ11によって撮像されるものとして説明したが、カメラ11によって撮像される被写体は、文字が記載されているものであれば、例えば案内板、メニュー、商品のタグ及び書籍等であってもよいし、例えば文字が表示されたディスプレイ等であっても構わない。
また、本実施形態においては画像から文字を認識する文字認識装置について説明したが、本実施形態は、画像から文字以外の認識対象を認識する場合に適用されても構わない。具体的には、本実施形態は、画像から顔、人物、記号、標識または他の物体等を認識する情報処理装置(認識装置)に適用されても構わない。認識する物体が自動車等の移動体であってもよい。これら物体の認識には、統計学習等を用いた公知の技術を用いることができる。例えば、顔を検出する場合、顔の視覚情報として、大小異なる大きさの顔の写真・イラストなどをディスプレイ等に表示してもよい。
(第2の実施形態)
次に、第2の実施形態について説明する。図9は、本実施形態に係る文字認識装置(情報処理装置)の構成の一例を示すブロック図である。なお、図9においては、前述した図1と同様の部分には同一参照符号を付してその詳しい説明を省略する。ここでは、図1と異なる部分について主に述べる。
次に、第2の実施形態について説明する。図9は、本実施形態に係る文字認識装置(情報処理装置)の構成の一例を示すブロック図である。なお、図9においては、前述した図1と同様の部分には同一参照符号を付してその詳しい説明を省略する。ここでは、図1と異なる部分について主に述べる。
なお、本実施形態に係る文字認識装置は、設定ファイルに設定されているパラメータを自動的に調整する点で、前述した第1の実施形態とは異なる。
図9に示すように、文字認識装置20は、処理部21を含む。処理部21は、記憶装置に格納されたプログラムを実行する文字認識装置20に備えられるコンピュータ(例えば、プロセッサ等)によって実現される。なお、コンピュータによって実行されるプログラムには、オペレーティングシステム及び文字認識アプリケーション等が含まれる
処理部21は、パラメータ変更部211を含む。パラメータ変更部211は、例えばコンピュータに文字認識アプリケーションを実行させること、すなわち、ソフトウェアによって実現されるものとする。なお、パラメータ変更部211は、例えばIC等のハードウェアによって実現されてもよいし、ソフトウェア及びハードウェアの組み合わせ構成として実現されていてもよい。
処理部21は、パラメータ変更部211を含む。パラメータ変更部211は、例えばコンピュータに文字認識アプリケーションを実行させること、すなわち、ソフトウェアによって実現されるものとする。なお、パラメータ変更部211は、例えばIC等のハードウェアによって実現されてもよいし、ソフトウェア及びハードウェアの組み合わせ構成として実現されていてもよい。
パラメータ変更部211は、例えば文字認識処理部134による文字認識処理の結果に基づいて、認識サイズまたは認識エリアの変更に関する情報を取得し、設定ファイルに設定されているパラメータ(サイズパラメータ及びエリアパラメータ)を変更する。なお、パラメータ変更部211によるパラメータの変更処理の詳細については後述する。
次に、図10のフローチャートを参照して、本実施形態に係る文字認識装置10の処理手順の一例について説明する。
なお、図10に示す処理は、例えば文字認識装置10において文字認識アプリケーションが起動された際に処理部21によって実行されるものとする。
まず、前述した図2に示すステップS1〜S3の処理に相当するステップS11〜S13の処理が実行される。
次に、前述した図2に示すステップS8の処理に相当するステップS14の処理が実行される。なお、図10においては図2に示すステップS4〜S7の処理は省略されているが、本実施形態において、当該ステップS4〜S7の処理に相当する処理が実行されても構わない。
ステップS14の処理が実行されると、パラメータ変更部211は、ステップS14における文字認識処理の結果に基づいて設定ファイルに設定されているパラメータを変更する必要があるか否かを判定する(ステップS15)。
パラメータを変更する必要があると判定された場合(ステップS15のYES)、パラメータ変更部211は、当該パラメータを変更する処理を実行する(ステップS16)。なお、ステップS16においてパラメータが変更された場合、ステップS14に戻って処理が繰り返される。
一方、パラメータを変更する必要がないと判定された場合(ステップS16のNO)、図10に示す処理は終了される。
以下、上記した図10に示すステップS16の処理(以下、パラメータ変更処理と表記)について具体的に説明する。ここでは、第1〜第3のパラメータ変更処理について説明する。
まず、第1のパラメータ変更処理について説明する。ここで、上記したようにステップS11において取得された画像が例えばユーザがシャッターボタンを押下することによってカメラ11によって撮像された静止画像である場合、当該画像にはユーザが認識されることを希望する文字(列)が含まれていると推測される。このため、文字認識処理において画像から文字が認識されていない場合には、当該画像から文字が認識されるようにパラメータを調整する必要がある。
すなわち、第1のパラメータ変更処理は、例えばステップS14の処理(文字認識処理)において文字が認識されない場合(つまり、サイズパラメータに規定されている認識サイズの範囲に該当する文字がエリアパラメータに規定されている認識エリア内に存在しない場合)に実行される。具体的には、ステップS14の処理において文字が認識されない場合にステップS15においてパラメータを変更する必要があると判定され、ステップS16において第1のパラメータ変更処理が実行される。
この場合、例えばサイズパラメータに規定されている認識サイズの最小値から最大値までの範囲が狭いことにより、ユーザが希望する文字が認識されていない可能性がある。このため、第1のパラメータ変更処理において、パラメータ変更部211は、例えばサイズパラメータに規定されている認識サイズの範囲が広くなるように当該サイズパラメータを変更する。具体的には、パラメータ変更部211は、例えばサイズパラメータに規定されている認識サイズの最小値を小さくし、当該認識サイズの最大値を大きくする。
例えば上述した図4において説明したように「○○美術館」の文字列(を構成する文字)が画像311から認識されない場合には、図11に示すサイズ表示領域302(に表示されている文字305a及び文字305b)のように認識サイズの範囲を広くする。これによれば、「○○美術館」の文字列は画像311から認識可能となる。
なお、サイズパラメータに規定されている認識サイズの最小値及び最大値の一方のみが変更される構成であっても構わない。
ここでは認識サイズの範囲を変更する場合について説明したが、エリアパラメータに規定されている認識エリアの大きさが小さいことにより、ユーザが希望する文字が認識されていない可能性もある。このため、第1のパラメータ変更処理において、パラメータ変更部211は、例えばエリアパラメータに規定されている認識エリアの大きさを拡大するように当該エリアパラメータを変更する構成であっても構わない。
上記したような第1のパラメータ変更処理によれば、当該第1のパラメータ変更処理後に実行される文字認識処理において、画像から文字が認識される範囲を広くすることによって、ユーザが希望する文字が認識されるようにすることができる。
次に、第2のパラメータ変更処理について説明する。第2のパラメータ変更処理は、上記した第1のパラメータ変更処理とは異なり、例えばステップS14の処理(文字認識処理)において文字が認識された場合に実行される処理である。
ここで、街中等に多数の看板が配置されているような状況においては、ユーザが様々な看板に記載されている文字を認識させるようなことが想定される。このような場合、ユーザは、看板に記載されている文字が同程度の大きさとなるように当該看板を撮影する場合が多いと推測される。このような場合において広い範囲のサイズの文字を認識する処理が実行されると、撮像された画像によってはユーザが意図しない文字を認識してしまう場合があり、処理速度が低下する。
このため、例えばステップS14の処理において文字が認識された場合であっても、例えばサイズパラメータに規定されている認識サイズの範囲が比較的広い場合にはステップS15においてパラメータを変更する必要があると判定され、ステップS16において第2のパラメータ変更処理が実行される。
この第2のパラメータ変更処理においては、例えばステップS14の処理において認識された文字を認識することができる程度に認識サイズの範囲を狭くするようにサイズパラメータが変更される。
具体的には、例えば図12に示すように、サイズ表示領域302には、文字306a及び文字306bが表示されている場合を想定する。これによれば、文字306aのサイズから文字306bのサイズまでの広い範囲の文字を認識可能である。ここで、図12に示す「○○美術館」の文字が認識されている場合、例えば図13に示すサイズ表示領域302に表示されている文字307a及び文字307bのように、当該「○○美術館」の文字を認識可能な程度に認識サイズの範囲を狭くする。これによれば、図12に示す認識サイズの範囲(文字306a及び文字306b)と比較して、「○○美術館」以外の不必要な文字が画像111に含まれていたとしても、当該不必要な文字については認識されないようにすることができる。
なお、認識サイズの範囲が比較的広いか否かについては、例えば当該認識サイズの範囲(認識サイズの最小値と最大値との差)が予め定められている値よりも広いか否かに基づいて判定されてもよいし、画像から認識された文字のサイズと認識サイズ(の最小値または最大値)との差が予め定められている値よりも大きいか否かに基づいて判定されてもよい。
同様に、第2のパラメータ変更処理においては、例えばエリアパラメータに規定されている認識エリアが比較的広い場合に、ステップS14において認識された文字を包含する程度に認識エリアのサイズを小さくするように当該エリアパラメータが変更されても構わない。
このような第2のパラメータ変更処理によれば、文字認識処理において必要な文字を認識することができるとともに、認識される文字のサイズまたは文字が認識される領域を制限することにより処理速度を向上させることが可能となる。
なお、上記した第2のパラメータ変更処理の後に実行される文字認識処理において文字が認識されないような場合には、第2のパラメータ変更処理によって変更された認識サイズ及び認識エリアを当該変更前の状態に戻す、当該認識サイズの範囲を広くする、または当該認識エリアの大きさを拡大するようにしてもよい。
次に、第3のパラメータ変更処理について説明する。本実施形態においてはカメラ11によって撮像された静止画像が表示部14に表示される場合について主に説明したが、文字認識装置10においては、当該カメラ11によって撮像された動画像がリアルタイムに表示部14に表示され、当該動画像(を構成する画像)に含まれる文字が認識される構成であっても構わない。このような構成の場合、ユーザが文字認識装置20(例えば、スマートフォン)を把持することによって調整されたカメラ11の向きに応じた動画像がリアルタイムに表示部14に表示される。
ここで、第3のパラメータ変更処理は、動画像が表示されている間にユーザによってカメラ11の向きが調整(変更)された場合に実行される処理である。具体的には、動画像が表示されている間にユーザによってカメラ11の向きが調整された場合にステップS15においてパラメータを変更する必要があると判定され、ステップS16において第3のパラメータ変更処理が実行される。
ここで、図14に示すように、表示部14にカメラ11によって撮像された画像321(を含む複数の画像から構成される動画像)が表示されている場合を想定する。なお、画像321上には、文字308a及び文字308bが表示されたサイズ表示領域302が設けられている。この場合において、ユーザがカメラ11の向きを左方向に調整したものとすると、ユーザは、カメラ11から見た場合における左方向に存在する文字を認識させることを意図しているものと推測される。このため、第3のパラメータ変更処理においては、図15に示すように、図14におけるカメラ11の向きが左方向に調整された場合にエリアパラメータに規定されている認識エリア303が左方向に移動するように当該エリアパラメータを変更する。
このような第3のパラメータ変更処理によれば、例えば「○○美術館」の文字が画像の中央付近に表示されるまでカメラ11の向きを変更させることなく当該文字を認識エリア303内に包含させることができるため、文字を認識させるまでに必要なカメラ11の向きの調整量を低減させることができる。ここでは、カメラ11の向きが左方向に調整される場合について説明したが、当該カメラ11の向きが他の方向に調整される場合についても同様である。
なお、カメラ11の向き(の調整方向)は、例えば文字認識装置10(例えば、スマートフォン)に備えられる加速度センサ等によって判別(検出)することが可能である。
すなわち、第3のパラメータ変更処理においては、例えばパラメータ変更部211内に備えられる文字認識装置10(自装置)の動きに関する情報(カメラ11の向き等)を検出する検出部の検出結果に基づいて、認識エリアの位置を制御(決定)することが可能である。なお、検出部を、パラメータ変更部211以外の構成部に含めてもよい。また、文字認識装置が加速度センサ等のセンサを備えてもよい。
また、ここではカメラ11の向きが調整された方向に認識エリアを移動させる(つまり、当該方向に認識エリアの位置を変更する)ものとして説明したが、当該方向に認識エリアの範囲が拡大されるような構成であってもよい。
また、文字認識装置10を使用するユーザは、上記したように動画像が撮像されている場合に、当該動画像に含まれる被写体(看板等)を拡大または縮小する操作を行うことができるものとする。
ここで、ユーザが被写体を拡大する操作を行う場合には、例えば動画像に含まれる看板等に記載されている文字が認識サイズと比較して小さいことが想定される。この場合には、サイズパラメータに規定されている認識サイズの最小値が小さくなるように当該サイズパラメータを変更する。これによれば、文字が認識可能となるまでに必要な被写体(文字)の拡大量を低減させることができる。
一方、ユーザが被写体を縮小する操作を行う場合には、例えば動画像に含まれる看板等に記載されている文字が認識サイズと比較して大きいことが想定される。この場合には、サイズパラメータに規定されている認識サイズの最大値が大きくなるように当該サイズパラメータを変更する。これによれば、文字が認識可能となるまでに必要な被写体(文字)の縮小量を低減させることができる。なお、ユーザが被写体を縮小する場合には、エリアパラメータに規定されている認識エリアのサイズが拡大されるように当該エリアパラメータが変更されても構わない。
すなわち、本実施形態においては、画像の拡大表示及び縮小表示のいずれかの処理に基づいて、認識サイズの変更に関する情報が決定される構成としても構わない。
ここでは動画像に含まれる被写体を拡大または縮小する操作が行われる場合について説明したが、例えばカメラ11を被写体に近づけるまたはカメラ11を被写体から遠ざける場合に上記したようにパラメータが変更されても構わない。なお、カメラ11の被写体に近づける方向への移動または被写体から遠ざける方向への移動は、上記した加速度センサ等によって判別することが可能である。
ここで説明したパラメータ変更処理は一例であり、他の処理が実行されることによってパラメータが変更されても構わない。
上記したように本実施形態においては、例えばサイズパラメータ(第1のパラメータ)に規定されている認識サイズの最小値(第1のサイズ)から最大値(第2のサイズ)までの範囲に該当するサイズの文字が画像に含まれていない場合に、当該範囲を拡大する(広くする)ようにサイズパラメータを変更する。本実施形態においては、このような構成により、画像から文字が認識されない場合に当該画像から文字が認識される範囲を広くすることで、ユーザが手動でパラメータを変更することなく当該ユーザが希望する文字が認識されるようにすることが可能となる。
また、本実施形態においては、画像(に含まれる文字)が拡大して表示された場合には認識サイズ(の最小値)を小さくし、当該画像(に含まれる文字)が縮小して表示された場合には認識サイズ(の最大値)を大きくすることにより、文字認識装置20において文字を認識可能とするためのユーザの拡大または縮小操作の手間を低減することができ、ユーザの利便性を向上させることができる。
更に、本実施形態においては、カメラ11によって撮像された動画像がリアルタイムに表示されている間にユーザによって当該カメラ11の向きが調整された場合、例えばエリアパラメータに規定されている認識エリアの位置を当該カメラ11の向きが調整された方向に変更する。本実施形態においては、このような構成により、文字認識装置20において文字を認識可能とするためのユーザのカメラ11の向きを調整する操作の手間を低減することができ、ユーザの利便性を向上させることができる。また、この場合には、エリアパラメータに規定されている認識エリアをカメラ11の向きが調整された方向に拡大するような構成であっても、同様にユーザの利便性を向上させることができる。
なお、本実施形態においては、主に文字認識処理の結果に基づいて設定ファイルに設定されているパラメータ(サイズパラメータ及びエリアパラメータ)が変更されるものとして説明したが、当該パラメータは、例えば文字認識処理が実行される前に変更されてもよい。
具体的には、一般的に漢字のような複雑な文字は、英字(アルファベット)と比較して、文字認識処理のために大きく表示する必要がある場合が多い。このため、例えば文字認識処理において漢字を含む文字が認識される場合にはサイズパラメータに規定されている認識サイズの最大値が大きくなるようにサイズパラメータが変更されてもよい。一方、例えば文字認識処理において英字が認識される場合にはサイズパラメータに規定されている認識サイズの最小値が小さくなるようにサイズパラメータが変更されてもよい。なお、文字認識処理において認識される文字の言語は、上述した文字認識装置20の動作モード等により判別可能である。
以上述べた少なくとも1つの実施形態によれば、画像から認識される対象をユーザが容易に把握することが可能な情報処理装置、方法及びプログラムを提供することができる。
本発明のいくつかの実施形態を説明したが、これらの実施形態は、例として提示したものであり、発明の範囲を限定することは意図していない。これら実施形態は、その他の様々な形態で実施されることが可能であり、発明の要旨を逸脱しない範囲で、種々の省略、置き換え、変更を行うことができる。これら実施形態やその変形は、発明の範囲や要旨に含まれると同様に、特許請求の範囲に記載された発明とその均等の範囲に含まれるものである。
10,20…文字認識装置、11…カメラ、12…格納部、13,21…処理部、14…表示部、131…画像表示処理部、132…サイズ表示処理部、133…エリア表示処理部、134…文字認識処理部、211…パラメータ変更部。
Claims (9)
- 画像及び認識対象のサイズに関する情報の表示処理を実行する表示処理手段と、
前記画像から認識対象を認識する認識手段と、を備え、
前記認識対象のサイズに関する情報は、第1サイズ及び前記第1サイズより大きな第2サイズに関する情報を含み、
前記第1サイズ及び前記第2サイズの何れか一つは変更可能である
情報処理装置。 - 前記第1サイズから前記第2サイズの範囲に該当するサイズの認識対象が前記画像に含まれていない場合、前記範囲を拡大する情報を取得する変更手段を更に備える請求項1に記載の情報処理装置。
- 前記画像の拡大表示及び縮小表示の何れかの処理に基づいて、サイズの変更に関する情報を取得する変更手段を更に備える請求項1に記載の情報処理装置。
- 前記表示処理手段は、前記認識手段が認識する領域に関する情報の表示処理を実行し、
前記認識手段は、前記領域から認識対象を認識する請求項1乃至3の何れか一項に記載の情報処理装置。 - 前記表示処理手段は、前記領域に認識対象が含まれていない場合、前記領域を拡大する処理を実行する請求項4に記載の情報処理装置。
- 自装置の動きに関する情報を検出する検出手段を更に備え、
前記表示処理手段は、前記動きに関する情報に基づいて、前記画像における前記領域の位置を制御する請求項4または5に記載の情報処理装置。 - 前記画像及び前記認識対象のサイズに関する情報を表示する表示手段を更に備える請求項1乃至6の何れか一項に記載の情報処理装置。
- 情報処理装置のコンピュータによって実行されるプログラムであって、
前記コンピュータに、
画像及び認識対象のサイズに関する情報の表示処理を実行するステップと、
前記画像から認識対象を認識するステップと
を実行させ、
前記認識対象のサイズに関する情報は、第1サイズ及び前記第1サイズより大きな第2サイズに関する情報を含み、
前記第1サイズ及び前記第2サイズの何れか一つは変更可能である
プログラム。 - 情報処理装置が実行する方法であって、
画像及び認識対象のサイズに関する情報の表示処理を実行するステップと、
前記画像から認識対象を認識するステップと
を備え、
前記認識対象のサイズに関する情報は、第1サイズ及び前記第1サイズより大きな第2サイズに関する情報を含み、
前記第1サイズ及び前記第2サイズの何れか一つは変更可能である
方法。
Priority Applications (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2017055352A JP6448696B2 (ja) | 2017-03-22 | 2017-03-22 | 情報処理装置、方法及びプログラム |
EP17188887.8A EP3379451B1 (en) | 2017-03-22 | 2017-08-31 | Information processing device |
US15/691,919 US10832100B2 (en) | 2017-03-22 | 2017-08-31 | Target recognition device |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2017055352A JP6448696B2 (ja) | 2017-03-22 | 2017-03-22 | 情報処理装置、方法及びプログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2018159972A JP2018159972A (ja) | 2018-10-11 |
JP6448696B2 true JP6448696B2 (ja) | 2019-01-09 |
Family
ID=59761803
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2017055352A Active JP6448696B2 (ja) | 2017-03-22 | 2017-03-22 | 情報処理装置、方法及びプログラム |
Country Status (3)
Country | Link |
---|---|
US (1) | US10832100B2 (ja) |
EP (1) | EP3379451B1 (ja) |
JP (1) | JP6448696B2 (ja) |
Families Citing this family (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPWO2020158955A1 (ja) * | 2019-02-01 | 2021-12-02 | エックスリープ株式会社 | 情報処理装置 |
US11288766B2 (en) * | 2019-07-01 | 2022-03-29 | Embarcadero Technologies, Inc. | System and method for displaying high quality images on controls based on display scaling |
JP2022092837A (ja) * | 2020-12-11 | 2022-06-23 | 株式会社東海理化電機製作所 | 制御装置およびプログラム |
Family Cites Families (41)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH05282091A (ja) | 1992-04-02 | 1993-10-29 | Mitsubishi Electric Corp | 任意サイズ文字の入力装置 |
JPH07288722A (ja) | 1994-04-15 | 1995-10-31 | Canon Inc | 撮像装置 |
US7216116B1 (en) * | 1996-05-06 | 2007-05-08 | Spotfire Ab | Data analysis system with automated query and visualization environment setup |
JP3563911B2 (ja) * | 1997-03-04 | 2004-09-08 | シャープ株式会社 | 文字認識装置 |
US6532302B2 (en) * | 1998-04-08 | 2003-03-11 | Canon Kabushiki Kaisha | Multiple size reductions for image segmentation |
JP4128275B2 (ja) | 1998-07-06 | 2008-07-30 | オリンパス株式会社 | 翻訳機能付カメラ |
JP2000207487A (ja) | 1999-01-20 | 2000-07-28 | Sony Corp | 情報処理装置および方法、並びに提供媒体 |
JP2001357355A (ja) | 2000-06-13 | 2001-12-26 | Fujitsu Ltd | 手書き文字入力装置と方法及びそれを実現するためのプログラムを記録した記録媒体 |
US6741745B2 (en) * | 2000-12-18 | 2004-05-25 | Xerox Corporation | Method and apparatus for formatting OCR text |
JP4240859B2 (ja) | 2001-09-05 | 2009-03-18 | 株式会社日立製作所 | 携帯端末装置及び通信システム |
JP3990253B2 (ja) | 2002-10-17 | 2007-10-10 | 埼玉日本電気株式会社 | 携帯電話装置 |
JP2004341977A (ja) | 2003-05-19 | 2004-12-02 | Mitsubishi Electric Corp | 文字認識装置及び携帯情報端末 |
JP2005018507A (ja) | 2003-06-27 | 2005-01-20 | Hitachi Ltd | 携帯情報端末及びそれを用いた文字認識方法 |
US8873890B2 (en) * | 2004-04-02 | 2014-10-28 | K-Nfb Reading Technology, Inc. | Image resizing for optical character recognition in portable reading machine |
JP4574235B2 (ja) * | 2004-06-04 | 2010-11-04 | キヤノン株式会社 | 画像処理装置、及びその制御方法、プログラム |
JP4502385B2 (ja) * | 2004-11-30 | 2010-07-14 | キヤノン株式会社 | 画像処理装置およびその制御方法 |
JP2006331216A (ja) * | 2005-05-27 | 2006-12-07 | Sharp Corp | 画像処理装置、画像処理装置における処理対象範囲指定方法、画像処理範囲指定プログラム、および画像処理範囲指定プログラムを記録する記録媒体 |
JP2007266873A (ja) | 2006-03-28 | 2007-10-11 | Toshiba Corp | 撮影装置および撮影方法 |
WO2009057721A1 (ja) * | 2007-10-30 | 2009-05-07 | Kyocera Corporation | 携帯表示機器 |
JP4492718B2 (ja) * | 2008-03-05 | 2010-06-30 | カシオ計算機株式会社 | 情報出力装置および情報出力処理プログラム |
JP2009296533A (ja) | 2008-06-09 | 2009-12-17 | Kyocera Mita Corp | スキャナ装置及び画像形成装置 |
JP5271667B2 (ja) * | 2008-10-27 | 2013-08-21 | 株式会社日立ソリューションズ | メタデータ抽出装置およびその方法 |
JP5282528B2 (ja) * | 2008-11-04 | 2013-09-04 | 富士通株式会社 | 翻訳支援プログラム、翻訳支援装置、および翻訳支援方法 |
KR20100064533A (ko) * | 2008-12-05 | 2010-06-15 | 삼성전자주식회사 | 카메라를 이용한 문자 크기 자동 조절 장치 및 방법 |
US20110090253A1 (en) | 2009-10-19 | 2011-04-21 | Quest Visual, Inc. | Augmented reality language translation system and method |
US8683377B2 (en) * | 2010-05-12 | 2014-03-25 | Adobe Systems Incorporated | Method for dynamically modifying zoom level to facilitate navigation on a graphical user interface |
JP2012222581A (ja) | 2011-04-08 | 2012-11-12 | Canon Inc | 画像処理装置、画像処理方法、プログラム、及び記憶媒体 |
JP5631362B2 (ja) | 2011-08-08 | 2014-11-26 | キヤノン株式会社 | 画像処理装置、画像処理方法およびプログラム |
WO2013147022A1 (ja) * | 2012-03-28 | 2013-10-03 | Inoue Katsumi | 集合演算機能を備えたメモリ及びこれを用いた集合演算処理方法 |
US20150243060A1 (en) * | 2012-09-26 | 2015-08-27 | Nec Casio Mobile Communications, Ltd. | Information processing device, display control method and recording medium |
JP6102156B2 (ja) | 2012-09-28 | 2017-03-29 | オムロン株式会社 | 画像処理システムおよび画像処理方法 |
US9317764B2 (en) * | 2012-12-13 | 2016-04-19 | Qualcomm Incorporated | Text image quality based feedback for improving OCR |
US8965129B2 (en) | 2013-03-15 | 2015-02-24 | Translate Abroad, Inc. | Systems and methods for determining and displaying multi-line foreign language translations in real time on mobile devices |
CA2906399A1 (en) | 2013-03-15 | 2014-10-09 | Translate Abroad, Inc. | Systems and methods for displaying foreign character sets and their translations in real time on resource-constrained mobile devices |
US9531992B2 (en) * | 2013-03-26 | 2016-12-27 | Sharp Kabushiki Kaisha | Display apparatus, portable terminal, television receiver, display method, program, and recording medium |
JP6286866B2 (ja) * | 2013-05-20 | 2018-03-07 | オムロン株式会社 | 画像処理装置および画像処理方法 |
JP6261237B2 (ja) * | 2013-08-28 | 2018-01-17 | キヤノン株式会社 | 画像表示装置、画像表示装置の制御方法およびコンピュータプログラム |
JP2015142181A (ja) * | 2014-01-27 | 2015-08-03 | キヤノン株式会社 | 制御装置、制御方法 |
JP6208094B2 (ja) | 2014-08-26 | 2017-10-04 | 株式会社東芝 | 情報処理装置、情報処理システム、情報処理方法及びそのプログラム |
JP6371662B2 (ja) | 2014-10-07 | 2018-08-08 | 富士通フロンテック株式会社 | 文字認識支援装置、文字認識支援プログラム及び文字認識支援方法 |
JP6530432B2 (ja) | 2017-02-03 | 2019-06-12 | 株式会社東芝 | 画像処理装置、画像処理方法及びプログラム |
-
2017
- 2017-03-22 JP JP2017055352A patent/JP6448696B2/ja active Active
- 2017-08-31 US US15/691,919 patent/US10832100B2/en active Active
- 2017-08-31 EP EP17188887.8A patent/EP3379451B1/en active Active
Also Published As
Publication number | Publication date |
---|---|
US10832100B2 (en) | 2020-11-10 |
EP3379451B1 (en) | 2023-09-27 |
JP2018159972A (ja) | 2018-10-11 |
US20180276505A1 (en) | 2018-09-27 |
EP3379451A1 (en) | 2018-09-26 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110362245B (zh) | 触摸输入光标操控 | |
KR101934664B1 (ko) | 터치 입력 커서 조작 | |
JP6240619B2 (ja) | 画面に表示された客体のサイズ調整方法及び装置 | |
JP6180888B2 (ja) | 電子機器、方法およびプログラム | |
US9390341B2 (en) | Electronic device and method for manufacturing the same | |
US20110122078A1 (en) | Information Processing Device and Information Processing Method | |
US20140015778A1 (en) | Tablet device, and operation receiving method | |
US9286279B2 (en) | Bookmark setting method of e-book, and apparatus thereof | |
US9880721B2 (en) | Information processing device, non-transitory computer-readable recording medium storing an information processing program, and information processing method | |
US20140009395A1 (en) | Method and system for controlling eye tracking | |
JP5395927B2 (ja) | 電子機器および手書き文書検索方法 | |
JP6448696B2 (ja) | 情報処理装置、方法及びプログラム | |
JP5925957B2 (ja) | 電子機器および手書きデータ処理方法 | |
CN110574000B (zh) | 显示装置 | |
JP5567097B2 (ja) | 電子機器、手書き文書表示方法、及び表示プログラム | |
KR20150106330A (ko) | 화상 표시 장치 및 화상 표시 방법 | |
KR20160064925A (ko) | 필기 입력 장치 및 그 제어 방법 | |
JP2015138360A (ja) | オブジェクト操作システム及びオブジェクト操作制御プログラム並びにオブジェクト操作制御方法 | |
US20130097543A1 (en) | Capture-and-paste method for electronic device | |
JP2013120485A (ja) | 電子書籍装置および電子書籍ページ送り設定方法 | |
US20210373714A1 (en) | Display Method and Electronic Device Using the same | |
WO2017029737A1 (ja) | 文字列選択方法、プログラム及び情報処理装置 | |
JP2014119994A (ja) | 情報処理端末、情報処理端末の制御方法、及びプログラム | |
JP5310038B2 (ja) | 画像処理装置及び画像処理プログラム | |
JP2017011584A (ja) | 情報処理装置、情報処理方法及びプログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20181106 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20181204 |
|
R151 | Written notification of patent or utility model registration |
Ref document number: 6448696 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R151 |