JP2012103749A - 文字認識装置、文字認識システム、文字認識方法及びプログラム - Google Patents
文字認識装置、文字認識システム、文字認識方法及びプログラム Download PDFInfo
- Publication number
- JP2012103749A JP2012103749A JP2010248917A JP2010248917A JP2012103749A JP 2012103749 A JP2012103749 A JP 2012103749A JP 2010248917 A JP2010248917 A JP 2010248917A JP 2010248917 A JP2010248917 A JP 2010248917A JP 2012103749 A JP2012103749 A JP 2012103749A
- Authority
- JP
- Japan
- Prior art keywords
- character recognition
- captured image
- degrees
- unit
- mobile terminal
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Landscapes
- Character Input (AREA)
- Character Discrimination (AREA)
Abstract
【解決手段】撮影画像取得部111は、携帯端末で撮影された撮影画像を取得する。文字認識部112は、撮影画像取得部111が取得した撮影画像を、回転角を0度、90度及び270度とした計3方向に回転させて、各撮影画像に対して文字認識を行う。認識結果出力部113は、文字認識部112により行われた文字認識の結果を出力する。文字認識部112は、互いに直交する4方向のうち回転角を180度に回転させての文字認識を行わない。撮影対象の原稿等を撮影時にユーザが視認できるような携帯端末での撮影において、天地逆となった文字を撮影する可能性は低いと考えられるし、180度回転しても形状が変わらない文字が多数含まれる原稿等について文字認識しないことで、最終的な認識精度に悪影響を及ぼすことを防ぐことができる。
【選択図】図4
Description
これに対し、本発明の目的は、携帯端末の撮影画像を対象とした文字認識において、文字認識の回数の増大を防ぎつつその認識精度を確保することである。
本発明の別の好ましい態様において、前記撮影画像取得部は、回転処理が施されていない撮影画像を前記携帯端末から取得する。
また、本発明のプログラムは、コンピュータに、携帯端末での撮影により得られる撮影画像を取得する撮影画像取得ステップと、前記撮影画像取得ステップで取得した撮影画像を、回転角を0度、90度及び270度とした計3方向に回転させて、各撮影画像に対して文字認識を行う文字認識ステップと、前記文字認識ステップで行われた文字認識の結果を出力する結果出力ステップとを実行させるためのものである。
[実施形態の構成]
図1は、文字認識システム1の構成を示す図である。
図1に示すように、文字認識システム1は、文字認識装置10と携帯端末20とを備える。文字認識装置10と携帯端末20とは、通信網NWを介して互いに通信可能に接続されている。通信網NWは、移動通信網やインターネット、ゲートウェイ等を含む通信網である。文字認識装置10は、例えば通信会社よって管理されるサーバであり、携帯端末20から受信した撮影画像に基づいて文字認識を行い、その結果に応じた情報を携帯端末20に対して提供するサービスを行うものである。携帯端末20は、撮影機能を有し、ユーザが携帯可能な端末装置であり、ここでは携帯電話端末である。携帯端末20は、文字認識装置10により提供されるサービスを受けるユーザによって所有されるものである。
なお、図1には携帯端末20を1つだけ記載しているが、実際には更に多数の携帯端末20が文字認識システム1に含まれる。また、携帯端末20は、携帯電話端末のほか、スマートフォンやPDA(Personal Digital Assistant)、携帯ゲーム機等でもよく、撮影機能を有している携帯可能な端末装置であればよい。
制御部11は、CPU(Central Processing Unit)を含む演算装置やメモリを備え、記憶部13に記憶されたプログラムを読み出して実行することにより、文字認識装置10の各部を制御する。通信部12は、通信網NWに接続するためのインタフェースである。記憶部13は、例えばハードディスク装置を備え、OCRプログラム131や、OCRプログラム131を用いて実行可能な光学文字認識処理(以下、「OCR処理」という。)に必要となる文字パターンファイルや辞書ファイル等の情報を記憶する。
制御部21は、CPUを含む演算装置やメモリを備え、記憶部26に記憶されたプログラムを読み出して実行することにより携帯端末20の各部の動作を制御する。操作部22は、テンキー等の複数の操作子を備え、ユーザによる操作子の操作を受け付けて、その操作に応じた操作信号を制御部21に出力する。無線通信部23は、無線通信回路やアンテナを備え、通信網NWに接続するためのインタフェースである。撮影部24は、CCD(Charge Coupled Device)等の撮像素子を備え、撮影し、その撮影により得られる二次元の撮影画像を生成する。表示部25は、例えば液晶駆動回路や液晶ディスプレイを備え、画像の表示により情報に応じた内容を報知する。記憶部26は、例えばEEPROM(Electronically Erasable and Programmable ROM)を備え、文字認識装置10が提供されるサービスを受けるために必要なアプリケーションプログラム等を記憶する。加速度センサ27は、いわゆる3軸加速度センサであり、携帯端末20に作用する加速度を検出し、その検出結果を制御部21に出力する。
なお、携帯端末20は、上記構成以外にも、受話音声を収音するマイクや送話音声を放音するスピーカ等、携帯電話端末が通常有している構成を備える。また、加速度センサ27は後述する変形例1に係る構成で用いられるものであるから、この実施形態では省略してもよい。
制御部11はOCRプログラム131を実行することにより、撮影画像取得部111、文字認識部112及び認識結果出力部113に相当する機能を実現する。
撮影画像取得部111は、携帯端末20での撮影により得られる撮影画像を取得する。詳しくは後述するが、携帯端末20は撮影部24により撮影して得た撮影画像を、文字認識装置10宛てに送信する。撮影画像取得部111は、このようにして携帯端末20により送信された撮影画像が通信部12により受信されると、受信された撮影画像を取得する。
なお、本実施形態では、回転角が0度の撮影画像は、携帯端末20により生成された当初のものと同一であり、特に、回転処理が施されていないものである。
なお、撮影画像を或る回転角で回転することは、撮影画像に含まれる文字列(又は、文字)もこれと同じ回転角で回転することと同義である。また、文字認識部112が回転処理後の撮影画像から文字コードを生成する処理は、周知の方法を用いることができる。具体的には、文字認識部112は、例えば撮影画像に対して二値化処理を施し、文字列を含む矩形領域を切り出すことで文字列を抽出し、記憶部13に記憶された文字パターンファイルや辞書ファイル等を用いて、この矩形領域に対して文字認識を行う。
なお、認識結果出力部113が出力する文字認識の結果は、文字コードに限定されるものでなく、例えば、文字コードにより表される文字列を検索語として所定の検索エンジンを用いての検索結果であってもよい。また、この文字列に関連付けて外部サーバ等にあらかじめ蓄積しておいたコンテンツであってもよく、本発明における文字認識の結果は特定のものに限定されない。
携帯端末20は、記憶部26に記憶されたプログラムを実行することにより、撮影画像生成部201と、撮影画像送信部202と、認識結果受信部203と、提示部204とに相当する機能を実現する。このうち、撮影画像生成部201は、制御部21及び撮影部24の協働により実現され、撮影画像送信部202及び認識結果受信部203は、それぞれ制御部21及び無線通信部23の協働により実現され、提示部204は、制御部21及び表示部25の協働により実現される。
撮影画像生成部201は、撮影部24による撮影結果に基づいて撮影画像を生成する。撮影画像生成部201は、必要であれば、撮影画像とともに文字認識装置10に送信する各種の付加情報(例えば、メタ情報)を撮影画像に含める処理も併せて行う。
撮影画像送信部202は、撮影画像生成部201により生成された撮影画像を、文字認識装置10宛てに送信する。本実施形態においては、文字を含む(つまり、文字が記述された)媒体が携帯端末20の撮影対象になることを想定する。文字を含む媒体は、いかなるものでもよいが、例えば、手書き文字が記述された原稿のほか、雑誌やポスター、看板、商店の陳列棚に配置された各商品を説明する札等が挙げられる。以下では、これらを、「原稿等」と総称する。
提示部204は、認識結果受信部203により受信された文字認識の結果をユーザに対して提示する。
図7は、携帯端末20による原稿等Pの撮影時の様子を、携帯端末20の側面(ただし、携帯端末20の図1に現れている面を正面とする。)の方向からみたものを表す。携帯端末20は、一般的な携帯電話端末と同様、携帯端末20の背面に撮影部24の撮影レンズが設けられている。図7に示すように、原稿等Pの撮影時には、ユーザは原稿等Pを直接又は表示部25により視認したまま、携帯端末20の図中a部分を把持して、撮影を行う。このとき、通常は、図7の右側に原稿等の上部があり、左側に原稿等の下部がある。
このような携帯端末20の姿勢で撮影が行われた場合、図6(a)に示す撮影画像IMG(0)が得られ、文字の天地方向と撮影画像の天地方向とがほぼ一致する。また、携帯端末20の取り扱いにおいては、ユーザから見て左右方向の撮影範囲を広げるために、表示部25の表示面の向きを、同一平面内で左右のいずれかにおよそ90度回転させて撮影することがある。この場合、図6(b)に示す撮影画像IMG(90)や図6(c)に示す撮影画像IMG(270)が撮影により得られる。一方で、図7に示す携帯端末20の姿勢から、表示部25の表示面の向きを同一平面内で180度回転させるようにその姿勢が変化させられることは、ユーザが図中a部分を把持しづらいことや、ユーザが原稿等Pの天地方向を逆にした状態で視認することが不自然であることから、稀であると考えられる。
このような理由から、携帯端末20の撮影画像に対してOCR処理を行う場合、従来のように、180度を含めた互いに直交する4方向の回転角を採用しなくとも実用上差し支えない、という知見を発明者らは得た。OCR処理に際して、従来技術に比べて、1つの回転角の撮影画像に対するOCR処理を行わないようにすることで、OCR処理に関して文字認識装置10に強いられる処理負荷を軽減することができる。既に説明したが、文字認識装置10は、複数の携帯端末20からの撮影画像に基づいてOCR処理を行うサーバとして機能するものであることからも、この処理負荷の軽減による効果は大きい。特に、180度という回転角が除外されるので、この除外が文字の認識精度に与える影響はその他の回転角に比べてかなり小さくなるはずである。
なお、いわゆるスキャナや原稿自動送り装置(ADF:Auto Document Feeder)等を用いてOCR処理の対象とする原稿等を読み取る(撮影する)場合、原稿等があらかじめ決められた姿勢から天地方向が逆となった状態で、ユーザによりセットされることが考えられる。よって、固定タイプの装置や、撮影時に原稿等をユーザが視認できないような装置で撮影画像を得る場合には、回転角を180度とした撮影画像に対するOCR処理を省略することの不都合が、本発明のように携帯端末で撮影した場合に比べて大きいと考えられる。このことからも、文字認識システム1によれば、携帯端末で撮影した撮影画像に基づいてOCR処理を行うという前提が存在することで、文字認識の結果に悪影響を与えることを防いで、OCR処理で採用される回転角を減らすことができる。
以上の2点を主な理由として、文字認識装置10では、回転角を180度とした撮影画像に対するOCR処理を除外している。なお、以上説明した2点の理由は、折り畳み可能なタイプの携帯電話端末や、スライドタイプの携帯電話端末、スマートフォンやデジタルカメラ等、撮影機能を有している様々な携帯端末で共通する内容と言える。
次に、本実施形態の動作について説明する。図9は、文字認識システム1において実行される処理の手順を示すシーケンス図である。
まず、携帯端末20のユーザが、文字認識装置10により提供されるサービスを受けようと考えると、操作部22を操作して、それに必要なアプリケーションプログラムの起動を携帯端末20に対して指示する。制御部21は、この指示に応じた操作信号を操作部22から受け取ると、このアプリケーションプログラムを記憶部26から読み出して実行する。次に、制御部21は、撮影部24の撮影機能を起動させる。ユーザは表示部25に表示される撮影内容を見ながら、図7に示したように原稿等に撮影部24の撮影レンズを向け、やがて撮影指示を意味する操作部22の操作を行う。制御部21は、操作部22により撮影指示の操作が受け付けられると、撮影部24によって原稿等を撮影し、撮影画像を生成する(ステップS1)。制御部21は、生成した撮影画像を無線通信部23によって文字認識装置10宛てに送信する(ステップS2)。このとき、制御部21は、携帯端末20の電子メールアドレス等、OCR処理の認識結果を受け取るために必要な情報も併せて送信する。また、ここでは、制御部21は、生成した撮影画像に対して回転処理等の加工を施さないものとする。
次に、制御部11は、回転角が0度の撮影画像について、この撮影画像に含まれる文字列を抽出し、抽出した文字列のそれぞれに対してOCR処理を行う(ステップS3)。制御部11は、文字列ごとにOCR処理を行って文字コードを生成する。これにより、制御部11は、回転角が0度である撮影画像に対するOCR処理が完了する。
次に、制御部11は、回転角を90度とした撮影画像について、この撮影画像に含まれる文字列を抽出し、抽出した文字列のそれぞれに対してOCR処理を行う(ステップS4)。具体的には、制御部11は、ステップS2の処理に応じて受信した撮影画像に回転処理を施し、回転角が90度である撮影画像を生成する。そして、制御部11は、ステップS3と同じ手順でOCR処理を行う。これにより、制御部11は、回転角を90度とした撮影画像に対するOCR処理が完了する。
次に、制御部11は、回転角が270度である撮影画像について、この撮影画像に含まれる文字列を抽出し、抽出した文字列のそれぞれに対してOCR処理を行う(ステップS5)。具体的には、制御部11は、ステップS2の処理に応じて受信した撮影画像に回転処理を施し、回転角が270度である撮影画像を生成する。そして、制御部11は、ステップS3,4と同じ手順でOCR処理を行う。これにより、制御部11は、回転角が270度である撮影画像に対するOCR処理が完了する。
これ以外にも、文字認識システム1によれば、文字認識装置10は、OCR処理の結果に基づいて、コンテンツを検索したりする等の、更に別のサービスを提供することができる。
本発明は、上述した実施形態と異なる形態で実施することが可能である。本発明は、例えば、以下のような形態で実施することも可能である。また、以下に示す変形例は、各々を適宜に組み合わせてもよい。
[変形例1]
上述した実施形態では、文字認識装置10はいかなる場合であっても、0度,90度及び270度という計3方向の回転角で回転させた撮影画像に対してOCR処理を行い、回転角を180度として回転させた撮影画像に対するOCR処理を行わなかった。これに対し、文字認識装置10が回転角を180度とした撮影画像に対するOCR処理の要否を判断し、必要と判断した場合に、このOCR処理を例外的に行うようにしてもよい。
続いて、この変形例の文字認識装置10及び携帯端末20の構成について説明する。
携帯端末20の制御部21は、加速度センサ27により検出された加速度に基づいて、撮影時における携帯端末20の姿勢を検知する。具体的には、制御部21は、加速度センサ27により検出された加速度に基づいて、例えば重力方向を特定し、図7に示される姿勢でユーザにより携帯端末20が把持されているか否かといった姿勢を特定する。例えば、制御部21が図7に示されるような携帯端末20の姿勢を特定した場合、上記実施形態と同様、回転角を180度とした撮影画像に対するOCR処理は不要である。一方、携帯端末20の姿勢が、原稿等の文字の天地方向を逆にして撮りうるようなものであれば、回転角を180度とした撮影画像に対するOCR処理が必要と考えられる。この姿勢は、例えば、図7に示す携帯端末20の姿勢から表示面を同一平面内でおよそ180度回転させたものである。
制御部21は、加速度センサ27により検出された加速度に基づいて、携帯端末20の姿勢を示す姿勢情報を生成し、これを撮影画像とともに文字認識装置10に送信する。例えば、制御部21は、撮影画像のメタ情報として撮影画像に姿勢情報を記述し、Exif(Exchangeable Image File Format)形式の撮影画像の付加情報として姿勢情報を加えてもよい。この付加情報は、少なくとも姿勢情報を含む。
図10に示すように、制御部11はOCRプログラム131を実行することにより、撮影画像取得部111と、文字認識部112と、認識結果出力部113と、姿勢特定部114とに相当する機能を実現する。撮影画像取得部111及び認識結果出力部113の機能は、上述した実施形態と同じであるから、ここではその説明を省略する。
姿勢特定部114は、撮影画像取得部111により取得された撮影画像から姿勢情報を抽出し、この姿勢情報が示す姿勢を特定する。この姿勢情報は、携帯端末20の制御部21が加速度センサ27の検出結果に基づいて生成したものである。
文字認識部112は、姿勢特定部114で特定された姿勢が決められた条件(以下、「姿勢条件」という。)を満たす場合には、回転角を180度とした撮影画像に対するOCR処理を行わないようにし、姿勢条件を満たさない場合には、回転角を180度とした撮影画像に対するOCR処理を行う。例えば、携帯端末20の姿勢と、回転角を180度とした撮影画像に対するOCR処理の要否とを対応付けたテーブルが予め記憶部13に記憶される構成とし、文字認識部112は、このテーブルにおいて姿勢特定部114が特定した姿勢に対応付けられた内容を参照して、姿勢条件を満たすか否かを判断する。なお、この姿勢条件は、例えば、姿勢情報が示す姿勢が、文字を天地方向が逆の状態である可能性があるか否かを判別するためにあらかじめ決められたものである。
まず、携帯端末20の制御部21は、撮影部24により撮影した撮影画像を生成する(ステップS11)。次に、制御部21は、加速度センサ27で検出された加速度に基づいて、撮影時における携帯端末20の姿勢を特定して、その姿勢を示す姿勢情報を生成する(ステップS12)。そして、制御部21は、撮影画像及び姿勢情報を文字認識装置10宛てに送信する(ステップS13)。
そして、制御部11は、3方向又は4方向の回転角のOCR処理に基づいて、文字認識の結果を生成し(ステップS19)、通信部12により携帯端末20宛てに送信する(ステップS20)。携帯端末20の制御部21は、文字認識装置10により送信された文字認識の結果を通信部12により受信すると、その内容を表示部25に表示させてユーザに対して提示する(ステップS21)。
以上説明したこの変形例の構成によれば、撮影時の携帯端末20の姿勢から、回転角を180度としたOCR処理が必要と推測される場合に限り、文字認識装置10はそのOCR処理を行う。これにより、従来技術よりもOCR処理の回数を減らすことができるし、また、最終的な文字認識の精度を更に向上させることができると考えられる。
変形例1の構成から、回転角を180度としたOCR処理の要否の判断に用いる条件を変更してもよい。具体的には、文字認識装置10は、携帯端末20の種別に応じてこのOCR処理を必要と判断した場合にのみ、このOCR処理を行う。
続いて、この変形例の文字認識装置10及び携帯端末20の構成について説明する。
まず、携帯端末20は、撮影画像を送信する際に、自身の携帯端末の種別を示す種別情報を文字認識装置10に送信する。例えば、携帯端末20は、撮影機器メーカ名や撮影機器モデル名等の種別を示す種別情報を送信する。Exif形式の撮影画像にあっては、このような種別情報がメタ情報に含められるので、これと同様の手法を用いて携帯端末20は種別情報を送信してもよい。
なお、種別情報は、携帯端末20が携帯電話端末であるのか、スマートフォンであるか等のあらかじめ区分されたどの種別なのかを識別できるものであればよい。
種別特定部115は、撮影画像取得部111により取得された撮影画像から種別情報を抽出し、この種別情報が示す種別を特定する。
文字認識部112は、種別特定部115が特定した種別が決められた条件(以下、「種別条件」という。)を満たすか否かを判断する。文字認識部112は、種別条件を満たす場合には、回転角を180度とした撮影画像に対するOCR処理を行わないようにし、種別条件を満たさない場合には、回転角を180度とした撮影画像に対するOCR処理を行う。例えば、携帯端末20の種別と、回転角を180度とした撮影画像に対するOCR処理の要否とを対応付けたテーブルが予め記憶部13に記憶される構成とし、文字認識部112は、このテーブルにおいて種別特定部115が特定した種別に対応付けられた要否を参照して、種別条件を満たすか否かを判断する。なお、この種別条件は、種別情報が示す種別の携帯端末が、回転角を180度とした撮影画像に対するOCR処理を要するタイプのものであることを示すものであればよい。
制御部21は、ステップS12に相当する処理を実行しないで、ステップS13aの処理で、撮影画像とともに種別情報を文字認識装置10に送信する。
ステップS17aの処理では、制御部11は、携帯端末20から取得した種別情報に基づいて携帯端末20の種別を特定し、特定した種別が種別条件を満たすか否かを判断する。そして、制御部11は、種別条件を満たし,ステップS17aの処理で「YES」と判断した場合には、回転角を180度とした撮影画像に対するOCR処理を行わないようにし、種別条件を満たさず、ステップS17aの処理で「NO」と判断した場合には、回転角を180度とした撮影画像に対するOCR処理を行う。
以上の文字認識装置10によれば、携帯端末20の種別から、回転角を180度としたOCR処理が必要と推測される場合に限り、そのOCR処理を行う。これにより、従来技術よりもOCR処理の回数を減らすことができるし、また、最終的な文字認識の精度を更に向上させることができると考えられる。
なお、文字認識装置10の管理者等によりあらかじめ3方向の回転角とするか、又は4方向の回転角とするかが決められ、文字認識装置10がこの条件に従ってもよい。
上述した実施形態では、文字認識装置10は、0度,90度及び270度という3方向の回転角についてOCR処理を行っていたが、文字認識システム1が例えば特定の動作モードで動作する場合には、これを2方向としてもよい。例えば、ユーザの利き腕が「右」である場合、0度及び270度という2つの回転角とし、ユーザの利き腕が「左」である場合、0度及び90度という2つの回転角とするという具合である。このようにできる理由は、ユーザの腕が延びる方向の回転軸を中心とした腕の可動範囲に応じて、携帯端末20の姿勢が傾けられる方向がある程度限られるからである。
この場合、ユーザが予め自身の利き腕を携帯端末20に登録しておき、携帯端末20が撮影画像の送信指示にこの利き腕を示す情報を送信する。一方、文字認識装置10は、この情報に基づいて利き腕を特定し、90度又は270度のどちらかを選択して、OCR処理を行う。
また、上述した実施形態において、文字認識装置10は、撮影部24で撮影した当初の撮影画像を、回転角が0度である撮影画像として扱っていた。これに対し、例えば、文字認識装置10又は携帯端末20が、撮影により得られた撮影画像を解析して、文字列が延びている方向(つまり、文字列の文字が連なる方向)を、矩形の画像領域である撮影画像のいずれかの辺(長辺又は短辺)に一致させるように補正し、この補正後の撮影画像を、回転角が0度である撮影画像と扱ってもよい。このように、撮影画像に微小な回転処理を加える補正後の撮影画像を回転角が0度である撮影画像と見做しても、本発明において差し支えない。
本発明において、携帯端末の撮影により得られる撮影画像は、携帯端末が内蔵する撮影部により得たものであってもよいし、携帯端末に装着された外部の撮影装置により得たものであってもよい。これらのいずれであっても、携帯端末での撮影により撮影画像が得られることに変わりないからである。
また、本発明の文字認識装置は、携帯端末で撮影された撮影画像を取得すればよいから、携帯端末と通信接続される態様のほか、例えば、携帯端末に内蔵されたものとすることも可能である。また、本発明の文字認識システムは、撮影部での撮影から文字認識の結果までの提示の一連の処理を行う、携帯端末によって実現されてもよい。また、本発明は、上述したように画像を回転させながら文字認識を行う文字認識方法として特定することもできる。
また、上述した文字認識装置10及び携帯端末20が実現する各機能は、複数のプログラムの組み合わせによって実現され、又は、複数のハードウェア資源の協働によって実現されうる。
Claims (8)
- 携帯端末での撮影により得られる撮影画像を取得する撮影画像取得部と、
前記撮影画像取得部が取得した撮影画像を、回転角を0度、90度及び270度とした計3方向に回転させて、各撮影画像に対して文字認識を行う文字認識部と、
前記文字認識部により行われた文字認識の結果を出力する認識結果出力部と
を備えることを特徴とする文字認識装置。 - 前記文字認識部は、
前記撮影画像に含まれる一の文字列を含む矩形領域を切り出して、切り出した矩形領域を、前記回転角を0度、90度及び270度として回転させて当該矩形領域に対する文字認識を行い、前記取得した撮影画像に含まれるすべての文字列について当該文字認識を行う
ことを特徴とする請求項1に記載の文字認識装置。 - 前記撮影画像取得部は、回転処理が施されていない撮影画像を前記携帯端末から取得する
ことを特徴とする請求項1又は2に記載の文字認識装置。 - 携帯端末での撮影により得られる撮影画像を取得する撮影画像取得部と、
撮影時における前記携帯端末の姿勢を特定する姿勢特定部と、
前記姿勢特定部が特定した姿勢が決められた条件を満たす場合には、前記撮影画像取得部が取得した撮影画像を、回転角を0度、90度及び270度とした計3方向に回転させて、各撮影画像に対して文字認識を行い、
前記特定した姿勢が前記条件を満たさない場合には、前記取得した撮影画像を、回転角を0度、90度、180度及び270度とした計4方向に回転させて、各撮影画像に対して文字認識を行う文字認識部と、
前記文字認識部により行われた文字認識の結果を出力する認識結果出力部と
を備えることを特徴とする文字認識装置。 - 携帯端末で撮影された撮影画像を取得する撮影画像取得部と、
前記携帯端末の種別を特定する種別特定部と、
前記種別特定部が特定した種別が決められた条件を満たす場合には、前記撮影画像取得部が取得した撮影画像を、回転角を0度、90度及び270度とした計3方向に回転させて、各撮影画像に対して文字認識を行い、
前記特定した種別が前記条件を満たさない場合には、前記取得した撮影画像を、回転角を0度、90度、180度及び270度とした計4方向に回転させて、各撮影画像に対して文字認識を行う文字認識部と、
前記文字認識部により行われた文字認識の結果を出力する認識結果出力部と
を備えることを特徴とする文字認識装置。 - 携帯端末が有する撮影部と、
前記撮影部の撮影により得られる撮影画像を取得する撮影画像取得部と、
前記撮影画像取得部が取得した撮影画像を、回転角を0度、90度及び270度とした計3方向に回転させて、各撮影画像に対して文字認識を行う文字認識部と、
前記文字認識部により行われた文字認識の結果を出力する認識結果出力部と、
前記認識結果出力部により出力された文字認識の結果を提示する提示部と
を備えることを特徴とする文字認識システム。 - 文字認識装置の制御部が、携帯端末での撮影により得られる撮影画像を取得する撮影画像取得ステップと、
前記制御部が、前記撮影画像取得ステップで取得した撮影画像を、回転角を0度、90度及び270度とした計3方向に回転させて、各撮影画像に対して文字認識を行う文字認識ステップと、
前記制御部が、前記文字認識ステップで行った文字認識の結果を出力する結果出力ステップと
を有することを特徴とする文字認識方法。 - コンピュータに、
携帯端末での撮影により得られる撮影画像を取得する撮影画像取得ステップと、
前記撮影画像取得ステップで取得した撮影画像を、回転角を0度、90度及び270度とした計3方向に回転させて、各撮影画像に対して文字認識を行う文字認識ステップと、
前記文字認識ステップで行われた文字認識の結果を出力する結果出力ステップと
を実行させるためのプログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2010248917A JP5279799B2 (ja) | 2010-11-05 | 2010-11-05 | 文字認識装置、文字認識システム、文字認識方法及びプログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2010248917A JP5279799B2 (ja) | 2010-11-05 | 2010-11-05 | 文字認識装置、文字認識システム、文字認識方法及びプログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2012103749A true JP2012103749A (ja) | 2012-05-31 |
JP5279799B2 JP5279799B2 (ja) | 2013-09-04 |
Family
ID=46394108
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2010248917A Active JP5279799B2 (ja) | 2010-11-05 | 2010-11-05 | 文字認識装置、文字認識システム、文字認識方法及びプログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP5279799B2 (ja) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2019039760A1 (ko) * | 2017-08-22 | 2019-02-28 | 삼성전자주식회사 | 전자 장치 및 그의 문자 인식 방법 |
JP2019192142A (ja) * | 2018-04-27 | 2019-10-31 | レノボ・シンガポール・プライベート・リミテッド | 情報処理装置、入力制御方法、及び入力制御プログラム |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2004088439A (ja) * | 2002-08-27 | 2004-03-18 | Canon Inc | 電子カメラ |
JP2004272658A (ja) * | 2003-03-10 | 2004-09-30 | Geomic Co Ltd | 携帯情報端末のテキストデータ入力支援方法及び装置 |
JP2006186930A (ja) * | 2004-12-28 | 2006-07-13 | Casio Comput Co Ltd | 撮像装置、画像処理方法及びプログラム |
-
2010
- 2010-11-05 JP JP2010248917A patent/JP5279799B2/ja active Active
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2004088439A (ja) * | 2002-08-27 | 2004-03-18 | Canon Inc | 電子カメラ |
JP2004272658A (ja) * | 2003-03-10 | 2004-09-30 | Geomic Co Ltd | 携帯情報端末のテキストデータ入力支援方法及び装置 |
JP2006186930A (ja) * | 2004-12-28 | 2006-07-13 | Casio Comput Co Ltd | 撮像装置、画像処理方法及びプログラム |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2019039760A1 (ko) * | 2017-08-22 | 2019-02-28 | 삼성전자주식회사 | 전자 장치 및 그의 문자 인식 방법 |
US11250287B2 (en) | 2017-08-22 | 2022-02-15 | Samsung Electronics Co., Ltd. | Electronic device and character recognition method thereof |
JP2019192142A (ja) * | 2018-04-27 | 2019-10-31 | レノボ・シンガポール・プライベート・リミテッド | 情報処理装置、入力制御方法、及び入力制御プログラム |
Also Published As
Publication number | Publication date |
---|---|
JP5279799B2 (ja) | 2013-09-04 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6123119B2 (ja) | 情報を関連付ける方法および端末 | |
US11368615B2 (en) | Modifying image parameters using wearable device input | |
JP6186521B2 (ja) | 合焦制御装置、撮像装置、合焦制御方法、及び合焦制御プログラム | |
US8432455B2 (en) | Method, apparatus and computer program product for automatically taking photos of oneself | |
US20080152199A1 (en) | Image orientation for display | |
US20150269782A1 (en) | Augmented reality display system, augmented reality information generating apparatus, augmented reality display apparatus, and server | |
JP2008288882A (ja) | 撮影システム及び撮影装置 | |
JP5279799B2 (ja) | 文字認識装置、文字認識システム、文字認識方法及びプログラム | |
JP4930433B2 (ja) | 画像処理装置、画像処理方法、および画像処理プログラム | |
JP6582153B2 (ja) | 撮像装置、撮像方法、及び撮像プログラム | |
CN105100616B (zh) | 一种图像处理方法及电子设备 | |
JP2008288881A (ja) | 撮影システム及び撮影装置 | |
US9113012B2 (en) | Image forming system including image forming apparatus remotely operated by portable information device, and cooperation method | |
JP2012070222A (ja) | 撮像装置、撮像方法、及び撮像プログラム | |
JP2014239367A (ja) | 画像処理装置、方法およびプログラム | |
JP2005339000A (ja) | 画像認識装置およびプログラム | |
US20160227050A1 (en) | Data input system, data input apparatus, data input method, and non-transitory computer-readable recording medium encoded with data input program | |
JP2016081313A (ja) | 画像処理システム、および仮想現実表示方法 | |
US20150156345A1 (en) | Communication apparatus and electronic mail creation method | |
US20160224854A1 (en) | Information processing apparatus, information processing method, and storage medium | |
JP5253595B2 (ja) | 撮影システム及び撮影装置 | |
JP6953948B2 (ja) | 情報処理装置、プログラム及び情報送信システム | |
JP2017092706A (ja) | 画像形成装置、画像形成システム、及びプログラム | |
JP6248732B2 (ja) | 拡張現実表示装置、拡張現実表示システム、拡張現実表示方法および拡張現実表示プログラム | |
US20190191040A1 (en) | Document scanning apparatus composed of an automatic document feeding device and an image capturing device and scanning method thereof |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20121122 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20121204 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20130204 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20130507 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20130521 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 Ref document number: 5279799 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
S533 | Written request for registration of change of name |
Free format text: JAPANESE INTERMEDIATE CODE: R313533 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
S111 | Request for change of ownership or part of ownership |
Free format text: JAPANESE INTERMEDIATE CODE: R313117 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |