JP2000207487A - 情報処理装置および方法、並びに提供媒体 - Google Patents

情報処理装置および方法、並びに提供媒体

Info

Publication number
JP2000207487A
JP2000207487A JP1195399A JP1195399A JP2000207487A JP 2000207487 A JP2000207487 A JP 2000207487A JP 1195399 A JP1195399 A JP 1195399A JP 1195399 A JP1195399 A JP 1195399A JP 2000207487 A JP2000207487 A JP 2000207487A
Authority
JP
Japan
Prior art keywords
image
processing step
recognition
character recognition
character
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP1195399A
Other languages
English (en)
Inventor
Shinji Nakajima
信二 中嶋
Tomoki Shiono
智樹 塩野
Takahiko Sueyoshi
隆彦 末吉
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sony Corp
Original Assignee
Sony Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sony Corp filed Critical Sony Corp
Priority to JP1195399A priority Critical patent/JP2000207487A/ja
Publication of JP2000207487A publication Critical patent/JP2000207487A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Character Discrimination (AREA)
  • User Interface Of Digital Computer (AREA)

Abstract

(57)【要約】 【課題】 パーソナルコンピュータに対して、簡単かつ
確実に、所定の指令を入力させる。 【解決手段】 CCDビデオカメラにより所定のオブジェ
クトに表示されている文字を撮像させ、その撮像された
画像を文字認識した結果得られた認識結果252を、対
象画像表示部241に重ねて表示させる。認識結果25
2の近傍には、その認識に利用した画像データの範囲を
示す抽出枠251が表示される。これにより、ユーザ
は、認識対象となる画像全体から、どの部分が抽出され
て、認識結果が得られたのかを、直感的に把握すること
ができる。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、情報処理装置およ
び方法、並びに提供媒体に関し、特に、撮像された画像
のデータから文字を認識し、所定の処理を行うことがで
きるようにした情報処理装置および方法、並びに提供媒
体に関する。
【0002】
【従来の技術】物品の種類や状態などを示す英数文字を
コード化し、例えば、物品に貼付しておき、それを、後
で読み取って情報(物品の種類や状態など)を取得する
システム、いわゆる、バーコードシステムが、現在、多
くの産業分野に普及している。
【0003】図1は、バーコードの例を表している。こ
の例において、バーコードラベル500には、コード部
501の下側の文字表示部502に表示されている英数
文字が、コード部501に配置されるバー(黒色の部
分)の幅と、各バーの間(白色の部分)の幅に基づいて
コード化されている。このように、情報を1つのパラメ
ータ(バーまたはバー間の幅)によりコード化するバー
コードは、1次元バーコードと称される。
【0004】ところで、バーコードラベルから、バーコ
ードを読み取る1つの方法として、ビデオカメラにより
読み取る方法が上げられるが、例えば、コード化される
情報に伴って、バーの配列が多くなると、ビデオカメラ
によるバーコードの読み取りが困難になる。
【0005】そこで、コード化される情報が多くなった
場合においても、ビデオカメラによる読み取りを可能に
するために、1次元バーコードのバーに代わる、図2に
示すようなセル(黒色の方形)が、2次元的に配列され
た2次元バーコードが、提案されている。これによれ
ば、情報が2次元的にコード化されることより、より多
くの情報量をコード化することができ、1次元バーコー
ドのバーに比べ、多くの情報がコード化されていても、
ビデオカメラによる読み取りが容易となる。
【0006】
【発明が解決しようとする課題】しかしながら、1次元
バーコードおよび2次元バーコードのいずれも、そのよ
うなコードパターンを予め用意しておかなければなら
ず、一般ユーザが、例えばパーソナルコンピュータの各
種の処理を制御するために利用することができない課題
があった。
【0007】また、特開平9−289624号公報に
は、デジタルカメラにOCR(Optical Character Reade
r)を組み合わせ、カメラで取り込んだ画像を文字認識
することが提案されている。
【0008】しかしながら、文字認識は必ずしも常に正
しく行われるものではないので、認識された結果に基づ
いて、各種の処理を正確かつ確実に制御することが困難
である課題があった。
【0009】本発明はこのような状況に鑑みてなされた
ものであり、一般ユーザが、簡単かつ確実に、パーソナ
ルコンピュータなどの情報処理装置の処理を制御するこ
とができるようにするものである。
【0010】
【課題を解決するための手段】請求項1に記載の情報処
理装置は、被写体を撮像する撮像手段と、撮像手段によ
り撮像された画像を表示する対象画像表示手段と、撮像
手段により撮像された画像のデータに基づいて、文字認
識処理を行う文字認識手段と、文字認識手段による認識
結果を表示する認識結果表示手段と、撮像手段により撮
像された画像のうち、文字認識手段による認識結果が得
られた領域を表示する抽出領域表示手段とを備えること
を特徴とする。
【0011】請求項5に記載の情報処理方法は、被写体
を撮像する撮像処理ステップと、撮像処理ステップで撮
像された画像を表示する対象画像表示処理ステップと、
撮像処理ステップで撮像された画像のデータに基づい
て、文字認識処理を行う文字認識処理ステップと、文字
認識処理ステップによる認識結果を表示する認識結果表
示処理ステップと、撮像処理ステップで撮像された画像
のうち、文字認識処理ステップによる認識結果が得られ
た領域を表示する抽出領域表示処理ステップとを備える
ことを特徴とする。
【0012】請求項6に記載の提供媒体は、被写体を撮
像する撮像処理ステップと、撮像処理ステップで撮像さ
れた画像を表示する対象画像表示処理ステップと、撮像
処理ステップで撮像された画像のデータに基づいて、文
字認識処理を行う文字認識処理ステップと、文字認識処
理ステップによる認識結果を表示する認識結果表示処理
ステップと、撮像処理ステップで撮像された画像のう
ち、文字認識処理ステップによる認識結果が得られた領
域を表示する抽出領域表示処理ステップとを含む処理を
情報処理装置に実行させるコンピュータが読み取り可能
なプログラムを提供することを特徴とする。
【0013】請求項1に記載の情報処理装置、請求項5
に記載の情報処理方法、および請求項6に記載の提供媒
体においては、撮像された画像から、文字認識が行わ
れ、認識結果が表示されるとともに、認識結果が得られ
た領域が表示される。
【0014】
【発明の実施の形態】図3乃至図8は、本発明を適用し
た携帯型パーソナルコンピュータの構成例を表してい
る。このパーソナルコンピュータ1は、ミニノート型の
パーソナルコンピュータとされ、基本的に、本体2と、
本体2に対して開閉自在とされている表示部3により構
成されている。図3は、表示部3を本体2に対して開い
た状態を示す外観斜視図、図4は、表示部3を本体2に
対して開いた状態の平面図、図5は、表示部3を本体2
に対して閉塞した状態を示す左側側面図、図6は、表示
部3を本体2に対して180度開いた状態を示す右側側
面図、図7は、表示部3を本体2に対して閉塞した状態
の正面図、図8は、表示部3を本体2に対して開いた状
態の底面図である。
【0015】本体2には、各種の文字や記号などを入力
するとき操作されるキーボード4、マウスカーソルを移
動させるときなどに操作されるトラックポイント(商
標)5が、その上面に設けられている。また、本体2の
上面には、音を出力するスピーカ8と、表示部3に設け
られているCCDビデオカメラ23で撮像するとき操作さ
れるシャッタボタン10がさらに設けられている。
【0016】表示部3の上端部には、ツメ13が設けら
れており、図5に示すように、表示部3を本体2に対し
て閉塞した状態において、ツメ13に対向する位置にお
ける本体2には、ツメ13が嵌合する孔部6が設けられ
ている。本体2の前面には、スライドレバー7が前面に
平行に移動可能に設けられており、スライドレバー7は
孔部6に嵌合したツメ13と係合してロックし、またロ
ック解除することができるようになっている。ロックを
解除することにより、表示部3を本体2に対して回動す
ることができる。ツメ13の隣りには、マイクロホン2
4が取り付けられている。このマイクロホン24は、図
8にも示すように、背面からの音も収音できるようにな
されている。
【0017】本体2の正面にはまた、プログラマブルパ
ワーキー(PPK)9が設けられている。本体2の右側面
には、図6に示すように、排気孔11が設けられてお
り、本体2の前面下部には、図7に示すように、吸気孔
14が設けられている。さらに、排気孔11の右側に
は、PCMCIA(Personal Comuputer Memory Card Interna
tional Association)カード(PCカード)を挿入する
ためのスロット12が設けられている。
【0018】表示部3の正面には、画像を表示するLCD
(Liquid Crystal Display)21が設けられており、そ
の上端部には、撮像部22が、表示部3に対して回動自
在に設けられている。すなわち、この撮像部22は、LC
D21と同一の方向と、その逆の方向(背面の方向)と
の間の180度の範囲の任意の位置に回動することがで
きるようになされている。撮像部22には、CCDビデオ
カメラ23が取り付けられている。
【0019】表示部3の下側の本体側には、電源ランプ
PL、電池ランプBL、メッセージランプML、その他のLED
よりなるランプが設けられている。なお、図5に示す符
号40は、本体2の左側面に設けられた電源スイッチで
あり、図7に示す符号25は、CCDビデオカメラ23の
フォーカスを調整する調整リングである。さらに、図8
に示す符号26は、本体2内に増設メモリを取り付ける
ための開口部を被覆する蓋であり、符号41は、蓋26
のロックツメを外すためのピンを挿入する小孔である。
【0020】図9は、パーソナルコンピュータ1の内部
の構成例を表している。内部バス51には、CPU(Centr
al Processing Unit)52、必要に応じて挿入されるPC
カード53、RAM(Random Access Memory)54、およ
びグラフィックチップ81が接続されている。この内部
バス51は、外部バス55に接続されており、外部バス
55には、ハードディスクドライブ(HDD)56、I/O
(入出力)コントローラ57、キーボードコントローラ
58、トラックポイントコントローラ59、サウンドチ
ップ60、LCDコントローラ83、モデム50等が接続
されている。
【0021】CPU52は、各機能を統括するコントロー
ラであり、PCカード53は、オプションの機能を付加す
るとき適宜装着される。
【0022】グラフィックチップ81には、CCDビデオ
カメラ23で取り込んだ画像データが、処理部82で処
理された後、入力されるようになされている。グラフィ
ックチップ81は、処理部82を介してCCDビデオカメ
ラ23より入力されたビデオデータを、内蔵するVRAM8
1Aに記憶し、適宜、これを読み出して、LCDコントロ
ーラ83に出力する。LCDコントローラ83は、グラフ
ィックチップ81より供給された画像データをLCD21
に出力し、表示させる。バックライト84は、LCD21
を後方から照明するようになされている。
【0023】RAM54の中には、起動が完了した時点に
おいて、例えば、OS(Operating System)(基本プログ
ラム)54A、オートパイロットプログラム(アプリケ
ーションプログラム)54B、そしてファインダアプリ
ケーション(アプリケーションプログラム)54Cな
ど、所定のものが、HDD56から転送され、記憶され
る。
【0024】OS(基本プログラムソフトウェア)54A
は、Windows98(商標)に代表される、コンピュータの
基本的な動作を制御するものである。
【0025】オートパイロットプログラム54Bは、予
め設定された複数の処理(またはプログラム)等を、予
め設定された順序で順次起動して、処理するプログラム
である。
【0026】ファインダアプリケーション54Cは、CC
Dビデオカメラ23がとらえた画像をリアルタイムで受
け取り、逐次その画像の2値化処理と文字領域抽出処理
を行って、文字認識エンジン89に、その文字領域抽出
処理された2値化画像を送ったり、CCDビデオカメラ2
3がとらえた画像、文字抽出領域、文字認識結果などを
GUIを使って効果的に表示したり、認識結果に応じて、
その他のアプリケーションプログラムへの連動処理など
を行う。
【0027】一方、外部バス55側のハードディスクド
ライブ(HDD)56には、OS(基本プログラムソフトウ
ェア)56A、オートパイロットプログラム56B、お
よびファインダアプリケーション56Cが記憶されてい
る。
【0028】ハードディスクドライブ56には、この
他、電子メールプログラム56D、インターネットブラ
ウザプログラム56E、ワードプロセッサプログラム5
6F、翻訳プログラム56Gなどのアプリケーションプ
ログラムが記憶されている。
【0029】電子メールプログラム56Dは、電話回線
のような通信回線等からネットワーク経由で通信文を授
受するプログラムである。電子メールプログラム56D
は、特定機能としての着信メール取得機能を有してい
る。この着信メール取得機能は、メールサーバ93に対
してそのメールボックス93A内に自分(利用者)宛の
メールが着信しているかどうかを確認して、自分宛のメ
ールがあれば取得する処理を実行する。
【0030】インターネットブラウザプログラム56E
は、例えば、ネットスケープ社(商号)のネットスケー
プ(商標)のように、インターネット92を介して、他
の情報処理装置と通信する機能を実行する。
【0031】ワードプロセッサプログラム56Fは、例
えば、一太郎(商標)、ワード(商標)などのように、
日本語あるいは英語などのワードプロセス処理を実行す
る。翻訳プログラム56Gは、日本語を英語に、あるい
はその逆に、英語を日本語に翻訳する処理を実行する。
【0032】I/Oコントローラ57は、マイクロコント
ローラ61を有し、このマイクロコントローラ61には
I/Oインタフェース62が設けられている。このマイク
ロコントローラ61はI/Oインタフェース62、CPU6
3、RAM64、ROM69が相互に接続されて構成されてい
る。このRAM64は、キー入力ステイタスレジスタ6
5、LED(発光ダイオード)制御レジスタ66、設定時
刻レジスタ67、レジスタ68を有している。設定時刻
レジスタ67は、ユーザが予め設定した時刻(起動条
件)になると起動シーケンス制御部76の動作を開始さ
せる際に利用される。レジスタ68は、予め設定された
操作キーの組み合わせ(起動条件)と、起動すべきアプ
リケーションプログラムの対応を記憶するもので、その
記憶された操作キーの組み合わせがユーザにより入力さ
れると、その記憶されたアプリケーションプログラム
(例えば電子メールプログラム56D)が起動されるこ
とになる。
【0033】キー入力ステイタスレジスタ65は、ワン
タッチ操作用のプログラマブルパワーキー(PPK)9が
押されると、操作キーフラグが格納されるようになって
いる。LED制御レジスタ66は、レジスタ68に記憶さ
れたアプリケーションプログラム(電子メールプログラ
ム56D)の立上げ状態を表示するメッセージランプML
の点灯を制御するものである。設定時刻レジスタ67
は、所定の時刻を任意に設定することができるものであ
る。
【0034】なお、このマイクロコントローラ61には
バックアップ用のバッテリ74が接続されており、各レ
ジスタ65,66,67の値は、本体2の電源がオフと
されている状態においても保持されるようになってい
る。
【0035】マイクロコントローラ61内のROM69の
中には、ウェイクアッププログラム70、キー入力監視
プログラム71、LED制御プログラム72が予め格納さ
れている。このROM69は、例えばEEPROM(electricall
y erasable and programmable read only memory)で構
成されている。このEEPROMはフラッシュメモリとも呼ば
れている。さらにマイクロコントローラ61には、常時
現在時刻をカウントするRTC(Real-Time Clock)75が
接続されている。
【0036】ROM69の中のウェイクアッププログラム
70は、RTC75から供給される現在時刻データに基づ
いて、設定時刻レジスタ67に予め設定された時刻にな
ったかどうかをチェックして、設定された時刻になる
と、所定の処理(またはプログラム)等の起動をするプ
ログラムである。キー入力監視プログラム71は、PPK
9が利用者により押されたかどうかを常時監視するプロ
グラムである。LED制御プログラム72は、メッセージ
ランプMLの点灯を制御するプログラムである。
【0037】ROM69には、さらにBIOS(Basic Input/O
utput System)73が書き込まれている。このBIOSと
は、基本入出力システムのことをいい、OSやアプリケー
ションソフトウェアと周辺機器(ディスプレイ、キーボ
ード、ハードディスクドライブ等)の間でのデータの受
け渡し(入出力)を制御するソフトウェアプログラムで
ある。
【0038】外部バス55に接続されているキーボード
コントローラ58は、キーボード4からの入力をコント
ロールする。トラックポイントコントローラ59はトラ
ックポイント5の入力を制御する。
【0039】サウンドチップ60は、マイクロホン24
からの入力を取り込み、あるいは内蔵スピーカ8に対し
て音声信号を供給する。
【0040】モデム50は、公衆電話回線90、インタ
ーネットサービスプロバイダ91を介して、インターネ
ット等の通信ネットワーク92やメールサーバ93等に
接続することができる。
【0041】電源スイッチ40は、電源をオンまたはオ
フするとき操作される。半押しスイッチ85は、シャッ
タボタン10が半押し状態にされたときオンされ、全押
しスイッチ86は、シャッタボタン10が全押し状態に
されたときオンされる。反転スイッチ87は、撮像部2
2が180度回転されたとき(CCDビデオカメラ23がL
CD21の反対側を撮像する方向に回転されたとき)、オ
ンされるようになされている。
【0042】次に、本発明のパーソナルコンピュータ1
において、ファインダアプリケーション54Cが実行さ
れた場合の処理について説明する。このファインダアプ
リケーション54Cが起動されている場合、ユーザは、
図10に示すように、所定の文字が印刷された厚紙など
で構成されるカード状のオブジェクト111を、CCDビ
デオカメラ23で撮像することで、パーソナルコンピュ
ータ1の動作を制御することができる。ファインダアプ
リケーション54Cの処理について、図11および図1
2のフローチャートを参照して説明する。
【0043】最初にステップS1において、ファインダ
アプリケーション54Cは、グラフィックチップ81を
制御し、GUI(Graphical User Interface)を作成し、
表示させる。グラフィックチップ81は、ファインダア
プリケーション54Cからの指令に対応して、GUIの画
像データを作成し、VRAM81Aに描画する。VRAM81A
の画像データはそこから読み出され、LCDコントローラ
83を介して、LCD21に出力され、表示される。これ
により、例えば図13に示すようなファインダアプリケ
ーションのGUIがLCD21に表示される。このGUIにおい
ては、CCDビデオカメラ23が撮像した画像を表示する
対象画像表示部241と、後述するようにして文字認識
エンジン89により文字認識がなされた結果の履歴を表
示する認識履歴表示部242が設けられている。
【0044】次にステップS2において、ファインダア
プリケーション54Cは、CCDビデオカメラ23(より
具体的には、そのドライバ)から画像データを受信した
か否かを判定し、受信していない場合には、受信するま
で待機する。画像データを受信した場合、ステップS3
に進み、ファインダアプリケーション54Cは、その画
像をGUI上に表示させる。即ち、CCDビデオカメラ23に
より撮像されたオブジェクト111の画像は、処理部8
2により、所定の処理が施された後、グラフィックチッ
プ81に供給される。グラフィックチップ81は、この
画像データをVRAM81AのGUIの対象画像表示部241
に対応する部分に描画する。このVRAM81Aに描画され
ている画像データが読み出され、LCDコントローラ83
を介して、LCD21に表示されるので、図13に示すよ
うに、対象画像表示部241にCCDビデオカメラ23で
撮像した画像が動画像として表示される。また、CCDビ
デオカメラ23で撮像した画像のデータは、文字認識の
ための領域(文字領域)を抽出するために、RAM54に
も記憶される。
【0045】ステップS4において、ファインダアプリ
ケーション54Cは、ユーザにより文字領域が指定され
たか否かを判定する。文字領域が指定されていない場合
には、ステップS5に進み、ファインダアプリケーショ
ン54Cは、RAM54に記憶されている1フレーム分の
画像のうちの所定の範囲を文字領域として抽出する。そ
して、ステップS6において、ファインダアプリケーシ
ョン54Cは、抽出された文字領域の画素データを文字
認識エンジン89に転送し、文字認識させる。文字認識
エンジン89は、各種の文字のパターンを予め記憶して
おり、そのパターンと転送されてきた文字領域の範囲の
画素データとを比較し、文字が含まれているか否かを認
識する。そして、文字認識エンジン89は、認識した結
果(文字)をファインダアプリケーション54Cに出力
する。
【0046】このように、通常、ファインダアプリケー
ション54Cは、各フレームの画像に対する文字認識処
理を、連続的に実行するが、ユーザが、トラックポイン
ト5などを操作することで、文字領域を指定することも
可能である。ユーザにより、文字領域が指定された場合
には、ステップS5の処理はスキップされ、その指定さ
れた文字領域の範囲において、文字認識エンジン89に
より文字認識処理が実行される。
【0047】ステップS7において、ファインダアプリ
ケーション54Cは、文字認識エンジン89の出力に基
づいて、文字が認識されたか否かを判定し、認識されて
いない場合には、ステップS2に戻り、それ以降の処理
を繰り返し実行する。
【0048】ステップS7において、文字が認識された
と判定された場合、ステップS8に進み、ファインダア
プリケーション54Cは、文字が検出されたその文字領
域の範囲を示す枠をGUIに表示させる。即ち、このと
き、ファインダアプリケーション54Cは、グラフィッ
クチップ81を制御し、GUIの対象画像表示部241内
の文字が認識された文字領域を抽出枠251で表示させ
る。これにより、ユーザは、どこの領域の画像から文字
が認識されたのかを知ることができる。さらに、ステッ
プS9において、ファインダアプリケーション54C
は、文字認識エンジン82より供給された文字認識結果
(文字)252を、抽出枠251の下に表示させる。な
お、このとき、文字の認識結果として、複数の候補が存
在する場合には、その候補も同時に表示される。ユーザ
は、トラックポイント5などを操作することで、文字認
識結果252の中から正しい文字を選択したり、既に正
しい文字が1つ表示されている場合には、その認識結果
を確定させるための入力操作を行う。文字認識結果25
2の近傍に、それが認識された範囲を示す抽出枠251
が表示されるので、ユーザは、その認識結果が正しいも
のであるか否かを、迅速かつ確実に判断することができ
る。
【0049】そこで、ステップS10において、ファイ
ンダアプリケーション54Cは、認識結果が正しいとの
確定入力がなされたか否かを判定し、確定入力がなされ
ない場合には、ステップS2に戻り、それ以降の処理を
繰り返し、実行する。
【0050】正しい認識結果の確定入力がなされた場合
には、ステップS11において、ファインダアプリケー
ション54Cは、RAM54またはハードディスクドライ
ブ56内のエディットボックスとヒストリボックスに、
確定された文字認識結果をコピーさせる。エディットボ
ックスに登録された文字認識結果は、後に適宜これを読
み出して利用することができる。
【0051】次に、ステップS12において、ファイン
ダアプリケーション54Cは、ヒストリボックス内の内
容を読み出し、GUIの認識履歴表示部242に表示させ
る。その結果、認識履歴表示部242には、図13に示
すように、文字認識結果の履歴が表示される(認識され
た文字が順番に表示される)。
【0052】ファインダアプリケーション54Cは、さ
らに、ステップS13において、認識履歴表示部242
に表示されている文字認識結果の中から、所定のものが
選択されたか否かを判定する。すなわち、ユーザは、認
識履歴表示部242に表示されている文字の中から所定
のものを、トラックポイント5などを操作することで選
択することができる。所定の文字が選択されたとき、ス
テップS14において、ファインダアプリケーション5
4Cは、選択された文字に対応する処理を実行する。
【0053】例えば、ファインダアプリケーション54
Cは、選択された文字列が「http://」で始まる文字列
であれば、それをURL(Uniform Resource Locator)と
判断し、インターネットブラウザプログラム56Eを起
動し、そのURLにアクセスさせる。選択された文字列
が、「@」と「.」とで区切られた文字列である場合に
は、電子メールアドレスであると判断し、ファインダア
プリケーション54Cは、電子メールプログラム56D
を起動し、その電子メールアドレスを設定し、メール送
信の準備を行う。
【0054】その文字列がハードディスクドライブ56
に予め登録されている各種のアプリケーションプログラ
ムの名称である場合には、ファインダアプリケーション
54Cは、その名称のアプリケーションプログラムを起
動させる。アプリケーションプログラムの名称の後に、
さらに文字列がある場合には、その文字列をオプション
あるいは引き数として、アプリケーションプログラムが
起動される。例えば、その文字列にワードプロセッサプ
ログラム56Fの名称が含まれている場合には、ファイ
ンダアプリケーション54Cは、ワードプロセッサプロ
グラム56Fを起動する。そして、アプリケーションプ
ログラムの名称の後に、ファイル名を示す文字列が認識
された場合は、起動したワードプロセッサプログラム5
6Fに対して、そのファイルを開く処理を指示する。
【0055】選択された文字列が一般的な単語である場
合には、ファインダアプリケーション54Cは、翻訳プ
ログラム56Gを起動し、その文字列を翻訳させる。
【0056】従って、ユーザは、所定の文字が表示され
ているオブジェクト111をCCDビデオカメラ23によ
り撮像させることで、パーソナルコンピュータ1に所定
の動作を実行させることができる。
【0057】ステップS13において、文字認識結果の
選択が行われていないと判定された場合、ステップS1
4の処理はスキップされる。その後、ステップS2に戻
り、それ以降の処理が繰り返し実行される。
【0058】以上においては、本発明を携帯型パーソナ
ルコンピュータに応用した場合を例として説明したが、
本発明は、デスクトップ型のパーソナルコンピュータ、
その他の情報処理装置にも応用することが可能である。
【0059】なお、上記したような処理を行うコンピュ
ータプログラムをユーザに提供する提供媒体としては、
磁気ディスク、CD-ROM、固体メモリなどの記録媒体の
他、ネットワーク、衛星などの通信媒体を利用すること
ができる。
【0060】
【発明の効果】以上の如く、請求項1に記載の情報処理
装置、請求項5に記載の情報処理方法、および請求項6
に記載の提供媒体によれば、認識対象となる画像と、文
字認識された認識結果と、この認識結果が得られた抽出
領域を同時に表示するようにしたので、ユーザは、認識
対象となる画像全体から、どの部分が抽出されて認識結
果が得られたのかを直感的に把握することができ、さら
に、情報処理装置に対して所定の指令を入力し、所定の
処理を実行させることが可能となる。
【図面の簡単な説明】
【図1】1次元バーコードの例を示す図である。
【図2】2次元バーコードの例を示す図である。
【図3】本発明を適用した携帯型パーソナルコンピュー
タの構成例を示す斜視図である。
【図4】図3の携帯型パーソナルコンピュータの表示部
を開いた状態の平面図である。
【図5】図3の携帯型パーソナルコンピュータの表示部
を閉じた状態の左側面図である。
【図6】図3の携帯型パーソナルコンピュータの表示部
を開いた状態の右側面図である。
【図7】図3の携帯型パーソナルコンピュータの表示部
を閉じた状態の正面図である。
【図8】図3の携帯型パーソナルコンピュータの表示部
を開いた状態の底面図である。
【図9】図3の携帯型パーソナルコンピュータの内部の
構成例を示すブロック図である。
【図10】図3の携帯型パーソナルコンピュータの使用
状態を示す斜視図である。
【図11】図3の携帯型パーソナルコンピュータの動作
を説明するフローチャートである。
【図12】図3の携帯型パーソナルコンピュータの動作
を説明するフローチャートである。
【図13】GUIの表示例を示す図である。
【符号の説明】
1 携帯型パーソナルコンピュータ, 2 本体, 3
表示部, 21 LCD, 23 CCDビデオカメラ,
52 CPU, 54 RAM, 54C ファインダアプリ
ケーション, 56D 電子メールプログラム, 56
E インターネットブラウザプログラム, 56F ワ
ードプロセッサプログラム, 56G翻訳プログラム,
89 文字認識エンジン
フロントページの続き (72)発明者 末吉 隆彦 東京都品川区北品川6丁目7番35号 ソニ ー株式会社内 Fターム(参考) 5B064 BA01 EA11 EA12 FA04 FA06 FA13 5E501 AA03 AA14 AC16 BA05 CA04 CB08 CB14 DA17 EA13 EA34 EB01 EB05 EB06 EB19 FA15 FB46

Claims (6)

    【特許請求の範囲】
  1. 【請求項1】 被写体を撮像する撮像手段と、 前記撮像手段により撮像された画像を表示する対象画像
    表示手段と、 前記撮像手段により撮像された画像のデータに基づい
    て、文字認識処理を行う文字認識手段と、 前記文字認識手段による認識結果を表示する認識結果表
    示手段と、 前記撮像手段により撮像された画像のうち、前記文字認
    識手段による認識結果が得られた領域を表示する抽出領
    域表示手段とを備えることを特徴とする情報処理装置。
  2. 【請求項2】 前記認識結果表示手段は、前記対象画像
    表示手段によって表示された画像上に、前記文字認識手
    段による認識結果を表示させることを特徴とする請求項
    1に記載の情報処理装置。
  3. 【請求項3】 前記文字認識手段によって認識された認
    識結果の履歴を順次表示する認識履歴表示手段をさらに
    備えることを特徴とする請求項1に記載の情報処理装
    置。
  4. 【請求項4】 前記第3の表示制御手段は、前記文字認
    識手段による認識結果が得られた領域を、前記第1の表
    示制御手段によって表示された画像上に、抽出枠として
    表示させることを特徴とする請求項1に記載の情報処理
    装置。
  5. 【請求項5】 被写体を撮像する撮像処理ステップと、 前記撮像処理ステップで撮像された画像を表示する対象
    画像表示処理ステップと、 前記撮像処理ステップで撮像された画像のデータに基づ
    いて、文字認識処理を行う文字認識処理ステップと、 前記文字認識処理ステップによる認識結果を表示する認
    識結果表示処理ステップと、 前記撮像処理ステップで撮像された画像のうち、前記文
    字認識処理ステップによる認識結果が得られた領域を表
    示する抽出領域表示処理ステップとを備えることを特徴
    とする情報処理方法。
  6. 【請求項6】 被写体を撮像する撮像処理ステップと、 前記撮像処理ステップで撮像された画像を表示する対象
    画像表示処理ステップと、 前記撮像処理ステップで撮像された画像のデータに基づ
    いて、文字認識処理を行う文字認識処理ステップと、 前記文字認識処理ステップによる認識結果を表示する認
    識結果表示処理ステップと、 前記撮像処理ステップで撮像された画像のうち、前記文
    字認識処理ステップによる認識結果が得られた領域を表
    示する抽出領域表示処理ステップとを含む処理を情報処
    理装置に実行させるコンピュータが読み取り可能なプロ
    グラムを提供することを特徴とする提供媒体。
JP1195399A 1999-01-20 1999-01-20 情報処理装置および方法、並びに提供媒体 Pending JP2000207487A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP1195399A JP2000207487A (ja) 1999-01-20 1999-01-20 情報処理装置および方法、並びに提供媒体

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP1195399A JP2000207487A (ja) 1999-01-20 1999-01-20 情報処理装置および方法、並びに提供媒体

Publications (1)

Publication Number Publication Date
JP2000207487A true JP2000207487A (ja) 2000-07-28

Family

ID=11792001

Family Applications (1)

Application Number Title Priority Date Filing Date
JP1195399A Pending JP2000207487A (ja) 1999-01-20 1999-01-20 情報処理装置および方法、並びに提供媒体

Country Status (1)

Country Link
JP (1) JP2000207487A (ja)

Cited By (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPWO2004015619A1 (ja) * 2002-08-07 2005-12-02 松下電器産業株式会社 文字認識処理装置及び文字認識処理方法、並びに携帯端末装置
US7697722B2 (en) 2005-01-31 2010-04-13 Casio Hitachi Mobile Communications Co., Ltd. Portable terminal and character reading method using a portable terminal
JP2011034284A (ja) * 2009-07-31 2011-02-17 Casio Computer Co Ltd 文字読取装置、その制御方法及びプログラム
JP2011138473A (ja) * 2010-06-08 2011-07-14 Square Enix Co Ltd リアルタイムなカメラ辞書
JP2014081933A (ja) * 2012-10-12 2014-05-08 Sony Corp ビデオストリーミングのための方法及び装置
JP2015011494A (ja) * 2013-06-28 2015-01-19 オリンパス株式会社 情報提示システム及び情報提示システムの制御方法
JP2016519797A (ja) * 2013-03-15 2016-07-07 トランスレート アブロード,インコーポレイテッド 外国語の文字セットおよびそれらの翻訳を資源に制約のあるモバイル機器上にリアルタイムで表示するためのシステムおよび方法
US10528852B2 (en) 2017-03-22 2020-01-07 Kabushiki Kaisha Toshiba Information processing apparatus, method and computer program product
US10832100B2 (en) 2017-03-22 2020-11-10 Kabushiki Kaisha Toshiba Target recognition device
WO2024053411A1 (ja) * 2022-09-05 2024-03-14 ダイキン工業株式会社 情報端末、文字認識方法及び文字認識プログラム

Cited By (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPWO2004015619A1 (ja) * 2002-08-07 2005-12-02 松下電器産業株式会社 文字認識処理装置及び文字認識処理方法、並びに携帯端末装置
JP4566740B2 (ja) * 2002-08-07 2010-10-20 パナソニック株式会社 携帯端末装置
US7903875B2 (en) 2002-08-07 2011-03-08 Panasonic Corporation Character recognition processing device, character recognition processing method, and mobile terminal device
US7697722B2 (en) 2005-01-31 2010-04-13 Casio Hitachi Mobile Communications Co., Ltd. Portable terminal and character reading method using a portable terminal
JP2011034284A (ja) * 2009-07-31 2011-02-17 Casio Computer Co Ltd 文字読取装置、その制御方法及びプログラム
JP2011138473A (ja) * 2010-06-08 2011-07-14 Square Enix Co Ltd リアルタイムなカメラ辞書
JP2014081933A (ja) * 2012-10-12 2014-05-08 Sony Corp ビデオストリーミングのための方法及び装置
US9001216B2 (en) 2012-10-12 2015-04-07 Sony Corporation Method and apparatus for video streaming
JP2016519797A (ja) * 2013-03-15 2016-07-07 トランスレート アブロード,インコーポレイテッド 外国語の文字セットおよびそれらの翻訳を資源に制約のあるモバイル機器上にリアルタイムで表示するためのシステムおよび方法
JP2015011494A (ja) * 2013-06-28 2015-01-19 オリンパス株式会社 情報提示システム及び情報提示システムの制御方法
US9779549B2 (en) 2013-06-28 2017-10-03 Olympus Corporation Information presentation system and method for controlling information presentation system
US10528852B2 (en) 2017-03-22 2020-01-07 Kabushiki Kaisha Toshiba Information processing apparatus, method and computer program product
US10832100B2 (en) 2017-03-22 2020-11-10 Kabushiki Kaisha Toshiba Target recognition device
WO2024053411A1 (ja) * 2022-09-05 2024-03-14 ダイキン工業株式会社 情報端末、文字認識方法及び文字認識プログラム

Similar Documents

Publication Publication Date Title
JP3786166B2 (ja) 画像処理装置、画像処理方法、および画像処理プログラム
JP4674644B2 (ja) 画像処理装置、画像処理方法、および画像処理プログラム媒体
KR100715879B1 (ko) 정보 처리 장치, 정보 처리 방법 및 매체
KR100674402B1 (ko) 화상 처리 장치, 화상 처리 방법 및 저장 매체
EP1388118B1 (en) Method for operating an optical reader having a plurality of imaging modes
US8286083B2 (en) Copying documents from electronic displays
JP3794463B2 (ja) 多次元コード認識処理方法、多次元コード認識処理装置、および多次元コード認識処理プログラム
JP4366746B2 (ja) 情報処理装置および方法、並びに記録媒体
JP2000207487A (ja) 情報処理装置および方法、並びに提供媒体
JP2000207338A (ja) 情報処理装置および方法、並びに提供媒体
JP2005149061A (ja) 情報処理システム、プログラム、及び記憶媒体
JP2000148904A (ja) 2次元コ―ド認識処理方法、2次元コ―ド認識処理装置、および2次元コ―ド認識処理プログラム格納媒体
JP4518581B2 (ja) 情報処理装置および方法、並びに記録媒体
JP4352287B2 (ja) 画像処理装置、画像処理方法、および画像処理プログラム媒体
JP2000148797A (ja) 画像処理装置、画像処理方法、および画像処理プログラム格納媒体
JP2000207401A (ja) 情報処理装置および方法、並びに提供媒体
JP2000207301A (ja) 情報処理装置および方法、並びに提供媒体
JP2000207485A (ja) 情報処理装置および方法、並びに提供媒体
JP2000047967A (ja) 情報処理装置および方法、情報処理システム、並びに提供媒体
US20010042788A1 (en) Image processing apparatus, image processing method and image processing program storage medium
JP4019510B2 (ja) 情報処理装置および方法、情報処理システム、並びに記録媒体
JP2000207086A (ja) 情報処理装置および画像処理方法、並びに提供媒体
JP4314502B2 (ja) 情報処理装置及び情報処理方法
JP2001052015A (ja) 情報処理装置、情報処理方法及びプログラム格納媒体
JP2000066757A (ja) 画像処理装置および方法、並びに提供媒体

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20060111

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20081023

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20081205

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20090129

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20090323

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20090514