JP2003216893A - カメラ付携帯情報端末 - Google Patents

カメラ付携帯情報端末

Info

Publication number
JP2003216893A
JP2003216893A JP2002014365A JP2002014365A JP2003216893A JP 2003216893 A JP2003216893 A JP 2003216893A JP 2002014365 A JP2002014365 A JP 2002014365A JP 2002014365 A JP2002014365 A JP 2002014365A JP 2003216893 A JP2003216893 A JP 2003216893A
Authority
JP
Japan
Prior art keywords
camera
character
information terminal
unit
portable information
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2002014365A
Other languages
English (en)
Inventor
Takuya Okamoto
卓也 岡本
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sharp Corp
Original Assignee
Sharp Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sharp Corp filed Critical Sharp Corp
Priority to JP2002014365A priority Critical patent/JP2003216893A/ja
Publication of JP2003216893A publication Critical patent/JP2003216893A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Character Input (AREA)
  • Character Discrimination (AREA)
  • Telephone Function (AREA)

Abstract

(57)【要約】 【課題】 静止画像を操作者が撮影するのではなく、操
作者が文字情報を含む映像を映すだけで文字認識しやす
い静止画像を自動的に取り込んで、正確な文字認識が容
易にできるカメラ付携帯情報端末を提供する。 【解決手段】 カメラを用いて撮影部1により撮影され
た動画像から文字認識を行うための静止画像を画像抽出
部2により抽出する。上記画像抽出部2により抽出され
た静止画像について文字認識部3により文字認識を行
う。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】この発明は、カメラ機能を付
加したカメラ付携帯情報端末に関する。
【0002】
【従来の技術】従来、一般的な携帯情報端末としては、
入力方法にタブレットを利用した手書き入力やキーボー
ドを用いたものがある。上記タブレットを利用した手書
き入力では、一文字一文字を手書き入力しながら文字認
識を行う一方、キーボードを用いた入力では、各キーに
文字を割り当てておき、一つのキーを操作することによ
り一文字入力する。
【0003】また、カメラ等の光学系機器を用いた文字
入力もすでに提案されている。例えば、特開平9−83
789号公報では、静止画像を取り込み文字認識を行
い、その結果、文字認識できない領域に関しては、拡大
化や高解像度化を行った後に文字認識を行う方法が記載
されている。
【0004】
【発明が解決しようとする課題】しかしながら、上記携
帯情報端末では、タブレットやキーボードを使用する場
合、一文字一文字入力を行う必要があり、それらの機器
に不慣れな人にとっては煩わしい操作を行うことにな
り、文字入力に時間がとられるという問題がある。
【0005】また、カメラ等を用いた文字入力の場合
は、操作者のカメラ撮影技術により文字認識が行いにく
い静止画像を撮影してしまい、文字認識を行えないとい
う場合もある。さらに、スキャナ等を利用して文字認識
を行う場合があるが、スキャナの大きさ等により制限が
かかり、自由に文字認識を行って、文字入力を行うこと
ができない。
【0006】そこで、この発明の目的は、静止画像を操
作者が撮影するのではなく、操作者が文字情報を含む映
像を映すだけで文字認識しやすい静止画像を自動的に取
り込んで、正確な文字認識が容易にできるカメラ付携帯
情報端末を提供することにある。
【0007】
【課題を解決するための手段】上記目的を達成するた
め、この発明のカメラ付携帯情報端末は、カメラを用い
て動画像を撮影する撮影部と、上記撮影部により撮影さ
れた動画像から文字認識を行うための静止画像を抽出す
る画像抽出部と、上記画像抽出部により抽出された静止
画像について文字認識を行う文字認識部と、上記画像抽
出部により抽出された静止画像について上記文字認識部
により文字認識を行うことによって文字入力を行う文字
入力モードとを備えたことを特徴としている。
【0008】上記構成のカメラ付携帯情報端末によれ
ば、操作者が動画像を上記撮影部により撮影すると、上
記画像抽出部により自動的に文字認識しやすい静止画像
を抽出するので、静止画像を操作者が撮影することな
く、操作者が映像を映すだけで文字認識しやすい静止画
像を自動的に取り込んで、その抽出された静止画像につ
いて文字認識部により正確な文字認識が容易にできる。
【0009】また、一実施形態のカメラ付携帯情報端末
は、上記撮影部が撮影している動画像と上記文字認識部
の文字認識結果を2つの画面に分割して表示する表示部
を備えたことを特徴としている。
【0010】上記実施形態のカメラ付携帯情報端末によ
れば、上記表示部の表示画面を分割し、カメラ画像と文
字認識結果をリアルタイムに表示するので、撮影してい
る画像に対して、携帯情報端末が正確に文字認識を行え
ているかどうかを操作者がすぐに確認できる。
【0011】また、一実施形態のカメラ付携帯情報端末
は、入力すべき文字情報全てを1つの画面で撮影できな
いとき、カメラ付携帯情報端末本体を動かして上記入力
すべき文字情報の範囲を撮影すると、上記画像抽出部に
より抽出された静止画像の走査位置を検出する位置検出
部を備えたことを特徴としている。
【0012】上記実施形態のカメラ付携帯情報端末によ
れば、撮影画像の幾つかの点に注目し、それらの点が時
系列にどのように移動しているかを測定し、現在の静止
画像と過去の静止画像との位置関係を把握することによ
って、上記位置検出部は、撮影した画像の走査位置を検
出するので、入力したい文字情報全てをカメラを動かし
ながら撮影しても、現在撮影している文字情報が全体の
どの部分を表しているのか的確に把握でき、各静止画像
の文字情報の関連づけが容易にできる。したがって、各
静止画像の文字情報を結合して、文字情報の全てを認識
することができる。
【0013】また、一実施形態のカメラ付携帯情報端末
は、上記位置検出部は、本体の動きを検出する動きセン
サーを有し、上記動きセンサーにより検出された本体の
動きに基づいて、上記画像抽出部により抽出された静止
画像の走査位置を検出することを特徴としている。
【0014】上記実施形態のカメラ付携帯情報端末によ
れば、上記動きセンサーにより本体の動きを検出し、現
在の静止画像と過去の静止画像との位置関係を把握する
ことによって、カメラを動かしながら文字情報を撮影し
ても、現在撮影している文字情報が全体のどの部分を表
しているのか的確に把握でき、各静止画像の文字情報の
関連づけが容易にできる。
【0015】また、一実施形態のカメラ付携帯情報端末
は、動画撮影時に文字認識ができない操作を行ったと
き、上記操作の命令を拒否し、上記表示部の表示画面
に、文字認識ができない操作であることを表示すること
を特徴としている。
【0016】上記実施形態のカメラ付携帯情報端末によ
れば、動画撮影時の操作により文字認識が困難な画像が
撮影されると、その時点で行った操作を拒否し、上記表
示部の表示画面にその旨を表示するので、例えば拡大さ
れた大き過ぎる文字情報のように認識が困難な文字情報
であることを操作者に知らせることができる。
【0017】また、一実施形態のカメラ付携帯情報端末
は、上記画像抽出部により抽出された静止画像について
上記文字認識部により文字認識を行うことによって文字
入力を行う文字入力モードと、上記撮影部により動画像
の撮影を行う撮影モードのいずれか一方の動作モードに
設定するモード設定部を備えたことを特徴としている。
【0018】上記実施形態のカメラ付携帯情報端末によ
れば、文字入力を行う場合は、上記モード設定部によっ
て文字入力モードに動作モードを設定して、上記画像抽
出部により抽出された静止画像について上記文字認識部
により文字認識を行う一方、動画像の撮影を行う場合
は、上記モード設定部によって撮影モードに動作モード
を設定するので、操作者の選択により文字入力と動画撮
影の両方が行える。
【0019】また、一実施形態のカメラ付携帯情報端末
は、動画撮影時に文字認識ができない操作を行うとき、
上記表示部の表示画面に、文字認識ができない操作であ
ることを表示し、上記モード設定部により上記文字入力
モードから上記撮影モードに切り替えることを特徴とし
ている。
【0020】上記実施形態のカメラ付携帯情報端末によ
れば、文字認識が困難な画像を撮影すると、その時点で
行った操作を拒否し、上記表示部の表示画面にその旨を
表示し、文字入力モードから撮影モードに切り替えるの
で、例えば拡大されて大き過ぎる文字情報のように認識
が困難な文字情報であることを操作者に知らせ、そのま
ま撮影モードで動画像の撮影を続けることができる。
【0021】
【発明の実施の形態】以下、この発明のカメラ付携帯情
報端末を図示の実施の形態により詳細に説明する。 (第1実施形態)図1はこの発明の第1実施形態のカメ
ラ付携帯情報端末のカメラ入力部の構成を示すブロック
図であり、1はカメラを用いて動画像の撮影を行う撮影
部、2は上記撮影部1により撮影された動画像から静止
画像を抽出する画像抽出部、3はパターンマッチング等
の文字認識手法を用いて文字認識を行う文字認識部、4
は携帯情報端末機能等の制御を行うCPU(中央処理装
置)、5は上記CPU4からの表示データを表示する表
示部、6はROM(リード・オンリー・メモリー)、7は
RAM(ランダム・アクセス・メモリー)、8は文字入力
モード・撮影モード(ズームイン/アウト)などの操作指
令を操作者が直接入力する入力部、13は文字入力モー
ドや撮影モード等の動作モードの設定を行うモード設定
部、14はカメラ制御部である。
【0022】上記ROM6は、文字認識プログラムやカ
メラ制御プログラム・文字コード変換プログラム等を格
納するのに使用される。また、上記RAM7は、カメラ
付携帯情報端末の各ユーザープログラム,単語辞書デー
タ,動画像の一時記憶メモリと静止画像記憶メモリと静
止画像の文字コード記憶メモリおよび移動経路記憶メモ
リ等として使用される。
【0023】また、図2は上記CPU4の動作を説明す
るフローチャートであり、以下、図1および図2に基づ
いてカメラ付携帯情報端末の文字入力について説明を行
う。
【0024】まず、ステップS1で文字入力モードの設
定か否かを判定し、操作者により入力部8が操作されて
文字入力モードが設定されると、ステップS2に進み、
モード設定部13により文字入力モードを設定する。 次に、ステップS3に進み、カメラ制御部14により撮
影部1を制御し、動画像を撮影して、撮影された動画像
を画像抽出部2に入力する。 次に、ステップS4に進み、撮影された動画像から画像
抽出部2により静止画像を抽出する。 そして、ステップS5で、抽出された静止画像で文字認
識できるかどうかを判定し、その結果、文字認識できれ
ば、ステップS6に進む一方、文字認識ができなければ
ステップS3に戻り、静止画像抽出を繰り返す。この場
合、撮影部1の動画像の撮影は連続的に行われているの
で、順次新たな静止画像を抽出する。 そして、ステップS6で、抽出された静止画像は文字認
識部3に入力され、パターンマッチング等の文字認識を
行い、ステップS7に進み、携帯情報端末用の文字コー
ド化を行う。そうして、変換された文字コードを表示部
5により表示する。
【0025】例えば、携帯情報端末を電子辞書とする
と、英語の資料等を読んでいるときに分からない英単語
が出てきたときに、電子辞書の文字入力モードのボタン
を操作者が押すと、電子辞書はモード設定部13を使用
して文字入力モードに切り替え、カメラ制御部14を使
用してカメラを起動し、動画像の撮影を始める。操作者
は、目的の英単語をカメラで映すと、電子辞書が自動的
に静止画像を抽出する。電子辞書が自動的に静止画像を
抽出するプロセスとしては、動画像が入力されたときに
まず一度静止画像として抽出し、その静止画像に対して
エッジの検出を行う。その結果、エッジの検出が全領域
に対して良好に行えた場合は、その静止画像に対して文
字認識を行う。また、静止画像に対してエッジの検出が
行えない場合は、ある一定時間待機し、その後、動画像
から静止画像を抽出し、前記のエッジ検出を行う。この
プロセスを繰り返すことにより、操作者による手ぶれな
どによって発生する文字認識率の低下を抑えることが可
能である。抽出された静止画像に対して文字認識部3を
使用して文字領域の切り出しを行い、その文字領域に対
して従来からあるパターンマッチング等の文字認識手法
を用いて英単語の文字コードを獲得する。そうして獲得
された英単語を表示部5により表示し、同時に辞書機能
を使用して英単語の語彙を表示部5により表示する。
【0026】このように、上記撮影部1により文字情報
を含む動画像を撮影すると、画像抽出部2により自動的
に文字認識しやすい静止画像を抽出するので、静止画像
を操作者が撮影することなく、操作者が映像を映すだけ
で文字認識しやすい静止画像を取り込んで、その抽出さ
れた静止画像について文字認識部3により正確な文字認
識が容易にできる。
【0027】(第2実施形態)次に、この発明の第2実
施形態のカメラ付携帯情報端末について説明する。な
お、この第2実施形態のカメラ付携帯情報端末は、CP
U4の動作を除いて第1実施形態のカメラ付携帯情報端
末と同一の構成をしており、図1については説明を省略
し、図1を援用する。
【0028】また、図3は上記カメラ付携帯情報端末の
CPU4の動作を説明するフローチャートであり、以
下、図1および図3に基づいてカメラ付携帯情報端末の
文字入力について説明を行う。
【0029】まず、ステップS11で文字入力モードの
設定か否かを判定し、操作者により入力部8が操作され
て文字入力モードが設定されると、ステップS12に進
み、モード設定部13により文字入力モードを設定す
る。 次に、ステップS13に進み、カメラ制御部14により
撮影部1を制御して、動画像を撮影して、撮影された動
画像を画像抽出部2に入力する。 次に、ステップS15に進み、撮影された動画像から画
像抽出部2により静止画像を抽出する。 次に、ステップS14に進み、入力された動画像を表示
部5の上半分に表示する。 次に、ステップS16に進み、抽出された静止画像が文
字認識できるかどうかを判定し、その結果、文字認識で
きれば、ステップS17に進み、静止画像は文字認識部
3に入力され、パターンマッチング等の文字認識を行
う。一方、ステップS16で文字認識ができなければス
テップS15に戻り、静止画像抽出を繰り返す。 次に、ステップS18に進み、携帯情報端末用の文字コ
ード化を行う。 そして、ステップS19に進み、変換された文字コード
を表示部5に送り、表示部5の下半分に表示する。
【0030】このように、上記第2実施形態のカメラ付
携帯情報端末は、第1実施形態のカメラ付携帯情報端末
と同様の効果を有すると共に、上記表示部5の表示画面
を分割して、カメラ画像と文字認識結果をリアルタイム
に表示するので、操作者は、文字認識結果を動画像と比
較しながら確認することができる。
【0031】(第3実施形態)次に、この発明の第3実
施形態のカメラ付携帯情報端末おいて、一度にカメラに
撮影できないような多量の文字情報を図4や図5のよう
に携帯情報端末を動かしながら撮影(動画像)し、携帯情
報端末に文字入力する処理について図6を用いて説明を
行う。なお、この第2実施形態のカメラ付携帯情報端末
は、CPU4の動作を除いて第1実施形態のカメラ付携
帯情報端末と同一の構成をしており、図1については説
明を省略し、図1を援用する。上記CPU4とROM6
およびRAM7で位置検出部を構成している。
【0032】また、図6は上記カメラ付携帯情報端末の
CPU4の動作を説明するフローチャートであり、以
下、図1および図6に基づいてカメラ付携帯情報端末の
文字入力について説明を行う。
【0033】また、ステップS21で文字入力モードの
設定か否かを判定し、操作者により入力部8が操作され
て文字入力モードが設定されると、ステップS22に進
み、モード設定部13により文字入力モードを設定す
る。 次に、ステップS23に進み、カメラ制御部14により
撮影部1を制御し、動画像を撮影して、撮影された動画
像を画像抽出部2に入力する。 次に、ステップS24に進み、撮影された動画像から画
像抽出部2により静止画像を抽出する。 次に、ステップS25で機器が移動したか否かを判定
し、機器が移動したと判定すると、ステップS26に進
み、抽出された複数の静止画像情報から、特徴のあるパ
ターン(文字や図形など)を抽出して、そのパターンが時
系列でどのように移動したかを表す動きベクトルを検出
する。 次に、ステップS27に進み、動きベクトルで表される
機器移動経路を記録して、ステップS28に進む。 一方、ステップS25で機器が移動しないと判定する
と、ステップS28に進む。 そして、ステップS28に進み、ステップS24で抽出
された静止画像から文字認識できるか否かを判別し、文
字認識できるならば、ステップS29に進む一方、文字
認識ができないならば、ステップS24に戻る。 また、ステップS29に進み、静止画像に対して文字認
識部3を用いて文字認識を行い、ステップS30に進
み、静止画像毎に文字コード化を行う。 次に、ステップS31に進み、動き検出か否かを判別す
る。すなわち、得られた文字コードに対して移動経路が
記録されているか否かを判別して、移動経路が記録され
ているときは、ステップS32に進む一方、移動経路が
記録されていないときは、処理を終了する。 そして、ステップS32では、認識した結果(静止画像
毎に文字コード)を元の情報と同じになるように結合す
る。
【0034】上記ステップS24における動画像から静
止画像を抽出する作業は、抽出済みの静止画像のあるパ
ターンが無くなる前に新たに静止画像を抽出するように
する。
【0035】例えば、図7の画像1のような情報があ
り、操作者が携帯情報端末を文字入力モードに切り替え
て、画像1をからのように携帯情報端末を移動しな
がら撮影した場合、からに移動したと判明する材料
として、の特徴である雪の情報がある一定分現画像か
ら無くなった場合にの静止画像の抽出を行う。この作
業をからへの移動やからへの移動に関しても同
様に繰り返しながら静止画像を抽出していく。また、移
動経路の記憶においては、静止画像からへの雪の動
きベクトルを計算し、携帯情報端末がどのように移動し
たかをメモリに逐次記録しておく。記録形式としては、
最初の静止画像の点をXY座標(0,0)として記録して
おき、この点からどの方向にどれだけ移動したかをXY
座標で記録しておく。この作業を繰り返すことにより、
携帯情報端末の移動経路を記憶できるようになる。ま
た、静止画像の文字が認識できた場合は、文字をコード
化しておき、情報を入力終了した後で移動経路より文字
コードの結合を行い、重複している文字コードの削除な
どを行う。
【0036】このように、上記第3実施形態のカメラ付
携帯情報端末は、第1実施形態のカメラ付携帯情報端末
と同様の効果を有すると共に、入力すべき文字情報全て
を1つの画面で撮影できないとき、カメラ付携帯情報端
末本体を動かしながら文字情報を撮影し、現在撮影して
いる文字情報が全体のどの部分を表しているのか的確に
把握することにより、各静止画像の文字情報の関連づけ
が容易にでき、各静止画像の文字情報を結合して、文字
情報の全てを認識することができる。
【0037】(第4実施形態)次に、この発明の第4実
施形態のカメラ付携帯情報端末おいて、一度にカメラに
撮影できないような多量の文字情報を図4や図5のよう
に携帯情報端末を動かしながら撮影(動画像)し、携帯情
報端末に文字入力する処理について図8を用いて説明を
行う。なお、この第2実施形態のカメラ付携帯情報端末
は、CPU4の動作および第1〜第4センサー9〜12
を除いて第1実施形態のカメラ付携帯情報端末と同一の
構成をしており、図1については説明を省略し、図1を
援用する。
【0038】上記第1〜第4センサー9〜12は、加速
度センサー等を用いた本体の動きを検出する動きセンサ
ーであり、各第1〜第4センサー9〜12が3方向(前
後,左右および上下)の動きをそれぞれ検出し、各第1〜
第4センサー9〜12の検出結果を例えば平均化するこ
とにより、検出精度が向上するようにしている。なお、
前後方向の1方向の動きを検出するセンサーと、左右方
向の1方向の動きを検出するセンサーと、上下方向の1
方向の動きを検出するセンサーをそれぞれ1つ用いて、
本体の動きを検出する動きセンサーとしてもよい。上記
CPU4とROM6とRAM7および第1〜第4センサ
ー9〜12で位置検出部を構成している。
【0039】また、図8は上記カメラ付携帯情報端末の
CPU4の動作を説明するフローチャートであり、以
下、図1および図8に基づいてカメラ付携帯情報端末の
カメラ入力について説明を行う。
【0040】一度にカメラに撮影できないような多量の
文字情報を図4や図5のように携帯情報端末を動かしな
がら動画像を撮影して、携帯情報端末に文字入力する場
合について図8を用いて説明を行う。
【0041】まず、ステップS41で文字入力モードの
設定か否かを判定し、操作者により入力部8が操作され
て文字入力モードが設定されると、ステップS42に進
み、モード設定部13は文字入力モードを設定する。 次に、ステップS43に進み、カメラ制御部14により
撮影部1を制御し、動画像を撮影して、撮影された動画
像を画像抽出部2に入力する。 次に、ステップS44に進み、撮影している動画像から
画像抽出部2により複数の静止画像を抽出する。 次に、ステップS45で機器が移動したか否かを判定す
る。すなわち、ステップS43の動画像の撮影時に動き
センサーとしての第1〜第4センサー9〜12(加速度
センサー等)を使用して、本体の動きを検出しておき、
その検出結果に基づいて移動の有無を判定する。そし
て、ステップS45で機器が移動したと判定すると、ス
テップS46に進み、携帯情報端末の現時点からの移動
方向および移動距離を検出する。 次に、ステップS47に進み、機器移動経路を記録す
る。すなわち、静止画像毎に検出された移動方向および
移動距離を移動経路としてRAM7に保存して、ステッ
プS48に進む。 一方、ステップS45で機器が移動していないと判定す
ると、ステップS48に進む。 次に、ステップS48で、ステップS44において抽出
された複数の静止画像から文字認識できるか否かを判別
し、文字認識できるならば、ステップS49に進む一
方、文字認識ができないならば、ステップS44に戻
る。 次に、ステップS49に進み、複数の静止画像に対して
文字認識部3を用いて文字認識を行い、ステップS50
に進み、静止画像毎の文字コード化を行う。 次に、ステップS51に進み、動き検出か否かを判別す
る。すなわち、得られた文字コードに対して移動経路が
記録されているか否かを判別して、移動経路が記録され
ているときは、ステップS52に進む一方、移動経路が
記録されていないときは、処理を終了する。 そして、ステップS52で、認識した結果(静止画像毎
の文字コード)を元の文字情報と同じになるように結合
する。
【0042】また、動画像から静止画像を抽出する作業
も、携帯情報端末がある一定距離を動く前に新たに静止
画像を抽出するようにする。
【0043】このように、上記第4実施形態のカメラ付
携帯情報端末は、第1実施形態のカメラ付携帯情報端末
と同様の効果を有すると共に、動きセンサー9〜12に
より本体の動きを検出し、現在の静止画像と過去の静止
画像との位置関係を把握することによって、カメラを動
かしながら文字情報を撮影しても、現在撮影している文
字情報が全体のどの部分を表しているのか的確に把握で
き、各静止画像の文字情報の関連づけが容易にでき、各
静止画像の文字情報を結合して、文字情報の全てを認識
することができる。
【0044】(第5実施形態)図9はこの発明の第5実
施形態のカメラ付携帯情報端末の動作を示すフローチャ
ートである。この第5実施形態では、上記第1実施形態
や第2実施形態のように文字認識を行っているときに、
操作者によりズームインやズームアウト等の操作が行わ
れ、その結果、文字認識を行うことができない場合の処
理について図9を用いて説明を行う。
【0045】まず、ステップS61で文字入力モードの
設定か否かを判定し、操作者により入力部8が操作され
て文字入力モードが設定されると、ステップS62に進
み、モード設定部13により文字入力モードを設定す
る。 次に、ステップS63に進み、カメラ制御部14により
撮影部1を制御し、動画像を撮影して、撮影された動画
像を画像抽出部2に入力する。 次に、ステップS64に進み、撮影された動画像から画
像抽出部2により静止画像を抽出する。 そして、ステップS65で上記抽出された静止画像につ
いて文字認識ができるか否かを判別して、抽出された静
止画像について文字認識が不可能な場合、ステップS6
8に進み、その静止画像を得るために操作者がズームイ
ンまたはズームアウト等のカメラ操作を行ったか否かを
判定する。その結果、カメラ操作が行われていれば、ス
テップS69に進み、文字認識ができないとの旨を表示
部5により表示する一方、カメラ操作が行われていない
ときは、ステップS64に戻る。 次に、ステップS70に進み、直前のカメラ操作を拒否
する。その後、ステップS64に戻り、動画像から静止
画像を抽出して文字認識を行う。 一方、ステップS65で文字認識ができる場合、ステッ
プS66に進み、静止画像に対して文字認識部3を用い
て文字認識を行い、ステップS77に進み、文字コード
への変換を行い、この処理を終了する。
【0046】このように、上記第5実施形態のカメラ付
携帯情報端末は、第1実施形態のカメラ付携帯情報端末
と同様の効果を有すると共に、動画撮影時の操作により
文字認識が困難な画像を撮影すると、その時点で行った
操作を拒否し、表示部5の表示画面にその旨を表示する
ので、認識が困難な文字情報であることを操作者に知ら
せることができる。
【0047】(第6実施形態)図10はこの発明の第6
実施形態のカメラ付携帯情報端末の動作を示すフローチ
ャートである。この第6実施形態では、上記第1実施形
態や第2実施形態のように文字認識を行っているとき
に、操作者によりズームインやズームアウトが行われ、
その結果、文字認識を行うことができない場合の処理に
ついて図10を用いて説明を行う。
【0048】まず、ステップS71で文字入力モードの
設定か否かを判定し、操作者により入力部8が操作され
て文字入力モードが設定されると、ステップS72に進
み、モード設定部13により文字入力モードを設定す
る。 次に、ステップS73に進み、カメラ制御部14は撮影
部1を制御して、動画像を撮影して、撮影された動画像
を画像抽出部2に入力する。 次に、ステップS74に進み、撮影された動画像から画
像抽出部2により静止画像を抽出する。 そして、ステップS75で文字認識ができるか否かを判
別して、抽出された静止画像について文字認識が不可能
な場合、ステップS78に進み、その静止画像を得るた
めに操作者がズームインまたはズームアウト等のカメラ
操作を行ったか否かを判定する。その結果、カメラ操作
が行われていれば、ステップS79に進み、文字認識が
できないとの旨を表示部5により表示して、ステップS
80に進む。一方、カメラ操作が行われていなければ、
ステップS73に戻り、動画像から静止画像を抽出して
文字認識を行う。 次に、ステップS80で、文字入力モードから通常のカ
メラ撮影モードに移行して、ステップS71に戻る。 一方、ステップS75で文字認識ができる場合、ステッ
プS76に進み、静止画像に対して文字認識部3を用い
て文字認識を行い、ステップS77に進み、文字コード
化を行う。
【0049】このように、上記第6実施形態のカメラ付
携帯情報端末は、第1実施形態のカメラ付携帯情報端末
と同様の効果を有すると共に、文字認識が困難な画像を
撮影すると、その時点で行った操作を拒否し、表示部5
の表示画面にその旨を表示すると共に、文字入力モード
から撮影モードに切り替えるので、認識が困難な文字情
報であることを操作者に知らせ、そのまま撮影モードで
動画像の撮影を続けることができる。
【0050】上記第1実施形態では、カメラ付携帯情報
端末として電子辞書について説明したが、PDA(Perso
nal Digital Assistance)や携帯電話等のカメラ付携帯
情報端末にこの発明を適用してもよい。
【0051】
【発明の効果】以上より明らかなように、この発明のカ
メラ付携帯情報端末によれば、携帯情報端末が動画像か
ら自動的に静止画像の抽出を行うことにより、文字認識
が容易にかつ正確にできる。
【0052】また、文字認識結果を表示部に表示するこ
とで操作者が文字認識結果を把握しやすい。
【0053】また、多量の文字情報を一度に動画像で撮
影することにより文字認識するので、一度に多くの文字
情報を入力することができる。
【0054】また、動かした携帯情報端末の走査位置を
把握することにより、文字情報の撮影を自由に行うこと
ができる。
【0055】また、文字入力モード中に誤ってズームイ
ン・ズームアウトを行っても、携帯情報端末が自動的に
拒否することにより、文字認識を行いやすい。
【0056】また、文字入力を行う場合は、モード設定
部によって文字入力モードに動作モードを設定して、抽
出された静止画像について文字認識を行う一方、動画像
の撮影を行う場合は、モード設定部によって撮影モード
に動作モードを設定するので、操作者が必要な機能(文
字入力機能と動画撮影機能)を選択することができる。
【0057】また、文字認識が困難な操作(例えば大き
過ぎる文字情報に拡大する操作)を行う場合は、モード
設定部により文字入力ではなく普通の撮影を行う撮影モ
ードに自動的に移行できる。
【図面の簡単な説明】
【図1】 図1はこの発明の第1実施形態のカメラ付携
帯情報端末のカメラ入力部のブロック図である。
【図2】 図2は上記カメラ付携帯情報端末の動作を説
明するフローチャートである。
【図3】 図3はこの発明の第2実施形態のカメラ付携
帯情報端末の動作を説明するフローチャートである。
【図4】 図4は上記カメラ付携帯情報端末の多量の情
報撮影方法を説明するための図である。
【図5】 図5は上記カメラ付携帯情報端末の多量の情
報撮影方法を説明するための図である。
【図6】 図6はこの発明の第3実施形態のカメラ付携
帯情報端末の動作を説明するフローチャートである。
【図7】 図7は上記カメラ付携帯情報端末の多量の情
報撮影方法を説明するための図である。
【図8】 図8はこの発明の第4実施形態のカメラ付携
帯情報端末の動作を説明するフローチャートである。
【図9】 図9はこの発明の第5実施形態のカメラ付携
帯情報端末の動作を説明するフローチャートである。
【図10】 図10はこの発明の第6実施形態のカメラ
付携帯情報端末の動作を説明するフローチャートであ
る。
【符号の説明】
1…撮影部、 2…画像抽出部、 3…文字認識部、 4…CPU、 5…表示部、 6…ROM、 7…RAM、 8…入力部、 9…第1センサー、 10…第2センサー、 11…第3センサー、 12…第4センサー、 13…モード設定部、 14…カメラ制御部。
フロントページの続き (51)Int.Cl.7 識別記号 FI テーマコート゛(参考) H04M 11/00 302 H04M 11/00 302 11/10 11/10 Fターム(参考) 5B029 BB02 CC27 5B064 AA07 BA01 CA08 5K027 AA11 FF01 FF22 HH29 MM00 5K036 AA07 DD22 DD48 JJ01 JJ13 KK00 5K101 LL12 NN06 NN18

Claims (7)

    【特許請求の範囲】
  1. 【請求項1】 カメラを用いて動画像を撮影する撮影部
    と、 上記撮影部により撮影された動画像から文字認識を行う
    ための静止画像を抽出する画像抽出部と、 上記画像抽出部により抽出された静止画像について文字
    認識を行う文字認識部とを備えたことを特徴とするカメ
    ラ付携帯情報端末。
  2. 【請求項2】 請求項1に記載のカメラ付携帯情報端末
    において、 上記撮影部が撮影している動画像と上記文字認識部の文
    字認識結果を2つの画面に分割して表示する表示部を備
    えたことを特徴とするカメラ付携帯情報端末。
  3. 【請求項3】 請求項1または2に記載のカメラ付携帯
    情報端末において、 入力すべき文字情報全てを1つの画面で撮影できないと
    き、カメラ付携帯情報端末本体を動かして上記入力すべ
    き文字情報の範囲を撮影すると、上記画像抽出部により
    抽出された静止画像の走査位置を検出する位置検出部を
    備えたことを特徴とするカメラ付携帯情報端末。
  4. 【請求項4】 請求項3に記載のカメラ付携帯情報端末
    において、 上記位置検出部は、本体の動きを検出する動きセンサー
    を有し、上記動きセンサーにより検出された本体の動き
    に基づいて、上記画像抽出部により抽出された静止画像
    の走査位置を検出することを特徴とするカメラ付携帯情
    報端末。
  5. 【請求項5】 請求項1乃至4のいずれか1つに記載の
    カメラ付携帯情報端末において、 動画撮影時に文字認識ができない操作を行ったとき、上
    記操作の命令を拒否し、上記表示部の表示画面に、文字
    認識ができない操作であることを表示することを特徴と
    するカメラ付携帯情報端末。
  6. 【請求項6】 請求項1乃至4のいずれか1つに記載の
    カメラ付携帯情報端末において、 上記画像抽出部により抽出された静止画像について上記
    文字認識部により文字認識を行うことによって文字入力
    を行う文字入力モードと、上記撮影部により動画像の撮
    影を行う撮影モードのいずれか一方の動作モードに設定
    するモード設定部を備えたことを特徴とするカメラ付携
    帯情報端末。
  7. 【請求項7】 請求項6に記載のカメラ付携帯情報端末
    において、 動画撮影時に文字認識ができない操作を行うとき、上記
    表示部の表示画面に、文字認識ができない操作であるこ
    とを表示し、上記モード設定部により上記文字入力モー
    ドから上記撮影モードに切り替えることを特徴とするカ
    メラ付携帯情報端末。
JP2002014365A 2002-01-23 2002-01-23 カメラ付携帯情報端末 Pending JP2003216893A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2002014365A JP2003216893A (ja) 2002-01-23 2002-01-23 カメラ付携帯情報端末

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2002014365A JP2003216893A (ja) 2002-01-23 2002-01-23 カメラ付携帯情報端末

Publications (1)

Publication Number Publication Date
JP2003216893A true JP2003216893A (ja) 2003-07-31

Family

ID=27651066

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2002014365A Pending JP2003216893A (ja) 2002-01-23 2002-01-23 カメラ付携帯情報端末

Country Status (1)

Country Link
JP (1) JP2003216893A (ja)

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005301914A (ja) * 2004-04-15 2005-10-27 Sharp Corp 携帯情報機器
WO2006070476A1 (ja) * 2004-12-28 2006-07-06 Fujitsu Limited 画像内の処理対象の位置を特定する画像処理装置
JP2010217997A (ja) * 2009-03-13 2010-09-30 Omron Corp 文字認識装置、文字認識プログラム、および文字認識方法
JP2010218061A (ja) * 2009-03-13 2010-09-30 Toshiba Corp 画像処理装置
JP2015515054A (ja) * 2012-03-12 2015-05-21 トップ イメージ システムズ リミテッド 金融書類トランザクションのための携帯デバイス
JP2017139789A (ja) * 2011-12-16 2017-08-10 日本電気株式会社 情報処理装置
JP2019207735A (ja) * 2019-08-29 2019-12-05 株式会社Pfu モバイル端末、画像処理方法、および、プログラム
US10885375B2 (en) 2016-03-17 2021-01-05 Pfu Limited Mobile terminal, image processing method, and computer-readable recording medium

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005301914A (ja) * 2004-04-15 2005-10-27 Sharp Corp 携帯情報機器
WO2006070476A1 (ja) * 2004-12-28 2006-07-06 Fujitsu Limited 画像内の処理対象の位置を特定する画像処理装置
JP2010217997A (ja) * 2009-03-13 2010-09-30 Omron Corp 文字認識装置、文字認識プログラム、および文字認識方法
JP2010218061A (ja) * 2009-03-13 2010-09-30 Toshiba Corp 画像処理装置
JP2017139789A (ja) * 2011-12-16 2017-08-10 日本電気株式会社 情報処理装置
JP2015515054A (ja) * 2012-03-12 2015-05-21 トップ イメージ システムズ リミテッド 金融書類トランザクションのための携帯デバイス
US10803431B2 (en) 2012-03-12 2020-10-13 Top Image Systems Ltd. Portable device for financial document transactions
US10885375B2 (en) 2016-03-17 2021-01-05 Pfu Limited Mobile terminal, image processing method, and computer-readable recording medium
JP2019207735A (ja) * 2019-08-29 2019-12-05 株式会社Pfu モバイル端末、画像処理方法、および、プログラム

Similar Documents

Publication Publication Date Title
JP4832518B2 (ja) 画像処理装置、その画像処理方法及び画像処理プログラム
EP2339536B1 (en) Image processing system, image processing apparatus, image processing method, and program
US7880792B2 (en) Image capturing apparatus with through image display function
KR100811796B1 (ko) 휴대 단말기 및 그의 초점 정보를 이용한 영상 표시 방법
JP4104605B2 (ja) 画像処理装置
US20090322906A1 (en) Imaging apparatus, imaged picture recording method, and storage medium storing computer program
EP2547089A1 (en) Electronic zoom device, electronic zoom method, and program
JP4443194B2 (ja) 携帯端末の文字認識における処理対象選択方法および携帯端末
JPH11196362A (ja) 撮像装置および撮像画像加工方法
US9007508B2 (en) Portable device, photographing method, and program for setting a target region and performing an image capturing operation when a target is detected in the target region
CN112527176A (zh) 截屏方法及截屏装置
JP2003216893A (ja) カメラ付携帯情報端末
CN112822394B (zh) 显示控制方法、装置、电子设备及可读存储介质
JP2010217997A (ja) 文字認識装置、文字認識プログラム、および文字認識方法
JP2000032111A (ja) 携帯型情報読取処理装置及び制御方法
JP4702015B2 (ja) 画像表示装置及びプログラム
KR101247780B1 (ko) 안구 감지 기능이 구비된 이동 통신 단말기 및 그 화면처리 방법
JP2005055973A (ja) 携帯情報端末
KR100751093B1 (ko) 디지털 처리 장치의 입력 장치 및 방법
JP2002049455A (ja) 入力インタフェース装置、及び該装置を具備する携帯情報装置
JP2004173300A (ja) 撮像装置および撮像画像加工方法
JP6120541B2 (ja) 表示制御装置及びその制御方法
JP5380833B2 (ja) 撮像装置、被写体検出方法及びプログラム
JP2002298078A (ja) 文字表示装置、その制御方法、記録媒体およびプログラム
JP4199535B2 (ja) 画像情報処理装置、画像情報処理プログラム、および、プログラム記録媒体