JP2004173289A - 携帯端末装置またはホスト装置 - Google Patents

携帯端末装置またはホスト装置 Download PDF

Info

Publication number
JP2004173289A
JP2004173289A JP2003396840A JP2003396840A JP2004173289A JP 2004173289 A JP2004173289 A JP 2004173289A JP 2003396840 A JP2003396840 A JP 2003396840A JP 2003396840 A JP2003396840 A JP 2003396840A JP 2004173289 A JP2004173289 A JP 2004173289A
Authority
JP
Japan
Prior art keywords
image data
service
mobile terminal
processing
data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2003396840A
Other languages
English (en)
Inventor
Toru Yamakita
徹 山北
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Casio Computer Co Ltd
Original Assignee
Casio Computer Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Casio Computer Co Ltd filed Critical Casio Computer Co Ltd
Priority to JP2003396840A priority Critical patent/JP2004173289A/ja
Publication of JP2004173289A publication Critical patent/JP2004173289A/ja
Pending legal-status Critical Current

Links

Images

Abstract

【課題】情報処理装置を用いた検索や翻訳などにおけるユーザインタフェイスの向上を計る。
【解決手段】携帯端末1に内蔵されたカメラを用いて文字を含んだ画像データを読み取る。サービスを指定し、画像データをホスト端末3へ転送する(ステップS1〜S3)。ホスト端末3は、受信した画像データに含まれる文字を認識するとともに、その文字に所定の処理(翻訳、検索等)を施す。ホスト端末3は、その処理結果を携帯端末1に送信する(ステップS4〜S8)。携帯端末1は、ホスト端末3から受信した処理結果を表示する(ステップS9、S10)。
【選択図】 図1

Description

本発明は、入力されたデータに対して所定の処理を施す情報処理装置に係わり、特に、携帯端末装置を用いて撮影された画像データをホスト装置に処理させる技術に関する。
情報処理装置を用いてデータベース検索や言語翻訳などを実行する際は、通常検索したいキーワードや翻訳したい文章またはフレーズをキーボード等から入力する。そして、入力された文字が指定されたアプリケーションプログラム(検索プログラムや翻訳プログラム)によって処理され、その結果がディスプレイに表示される。
データベース検索では、通常、ネットワークを介して接続されたデータベースにアクセスすることによって検索結果を得る。また、言語翻訳は、スタンドアロンで実行されることが多いが、近年ネットワーク上のサーバマシンにその処理を依頼するケースも増えてきている。
ところが、上述のような処理に際してより簡単なユーザインタフェイスが求められる場合もある。たとえば、キー入力以外の方式で文字を入力したいと考えるユーザも多い。キー入力以外の文字入力方式としては、専用のペンを用いて表示画面上から手書き入力する形態が知られているが、細かいパターンを描きにくい場合があり、また、既に紙面などに書かれている内容を翻訳・検索したいときには、それをもう一度ペン入力する必用があり面倒である。また、携帯端末装置を用いて上述のような翻訳・検索処理を「何時でも何処でも」行いたいと考えるユーザも多い。
本発明の課題は、情報処理装置を用いた検索や翻訳などにおけるユーザインタフェイスの向上を計ることである。
本発明の携帯端末装置は、文字を含む画像データを撮影する撮影手段と、この撮影された画像データに対する複数の処理をホスト装置へ依頼する複数のサービスの中から所望のサービスを指定するサービス指定手段と、前記ホスト装置へ依頼した前記サービスの処理結果を前記携帯端末装置へ表示するか否かを示す情報を指定する表示指定手段と、前記指定されたサービスを示すサービスコード、前記表示指定手段で指定された情報および前記撮影された画像データを前記ホスト装置へ通信ネットワークを介して送信する送信手段と、前記画像データを受けた前記ホスト装置において、この画像データから認識された文字に対して前記指定されたサービスに基づく処理を実行した処理結果のデータを、前記指定された情報に応じて前記通信ネットワークを介して前記ホスト装置から受信する受信手段と、前記受信した処理結果のデータを表示する表示手段と、を有する。
本発明のホスト装置は、携帯端末装置から通信ネットワークを介して送信されたデータを受信する受信手段と、前記受信したデータに含まれているサービスコードの種類を判断する判断手段と、前記受信したデータに含まれている画像データから文字を認識し、この文字に対して前記判断されたサービスコードに応じた処理を実行する処理手段と、前記受信したデータに前記処理の結果を前記携帯端末装置へ表示する情報が含まれていれば、前記処理手段による処理結果のデータを前記携帯端末装置へ送信する送信手段と、を有する。
例えば、サービスは、画像データに含まれる文字の言語翻訳、その文字をキーワードとしたデータベース検索等である。画像データは、携帯端末装置の撮影手段によって撮影される。即ち、携帯端末装置の撮影手段で所望の文字を撮影し、上記ホスト装置にサービスを要求することにより、上記所望の文字に対する処理結果が得られる。
本発明の携帯端末装置によれば、ホスト装置へ依頼する複数のサービスの中から所望のサービスを指定し、サービスの処理結果を前記携帯端末装置へ表示するか否かを示す情報を指定し、文字を含む画像データをホスト装置に送信することにより、 携帯端末装置では画像データを撮影することにより、ユーザが必要とするサービスを選択的にホスト装置側に実行させることができ、携帯端末装置によるユーザインタフェスが向上する。更に、処理結果を携帯端末装置に表示するか任意に選択できるので、ユーザーが必要なデータを選択的に入手することができる。更に、携帯端末装置側での認識処理およびサービスの内容に応じた処理が不要になり、その処理負担を軽減できる。また、本発明のホスト装置によれば、処理結果を携帯端末装置に表示するかの選択に応じて、ユーザーに必要なデータを選択的に提供することができる。
以下、本発明の実施形態について図面を参照しながら説明する。図1は、本実施形態のシステム構成図である。携帯端末1は、通信機能を備えており、ネットワーク2に接続された他の装置にデータ処理を依頼して、その結果を受け取って表示することができる。携帯端末1は、最寄りの基地局を介して無線でデータを送受信する方式、通信機能を持った装置(光リンクユニット)との間でIr(赤外線)通信などでデータを送受信する方式、または有線でデータを送受信する方式でネットワーク2に接続される。
ネットワーク2には、ホスト端末3が収容されている。ホスト端末3は、サーバマシンであり、携帯端末1から転送されてくる依頼に従ってデータ処理を実行する。また、ホスト端末3は、必要に応じて、他のサーバ(翻訳サーバ4、検索サーバ5など)に処理を依頼する。そして、ホスト端末3は、処理結果を所定の端末(主に、処理依頼を発行した携帯端末1)に転送したり、あるいはその処理結果をホスト端末3内に蓄積する。なお、ネットワーク2には、他にも多数の端末(個人用PC6など)が収容されており、ホスト端末3は、これら他の端末からもアクセス可能である。
図2は、本実施形態のシステムの全体フローチャートである。本実施形態のシステムは、携帯端末1においてカメラを用いて取り込んだ画像データをホスト端末3に転送して解析(パターン認識、文字認識)させ、その解析結果に所定のサービスを提供して携帯端末1に返送するものである。
ステップS1では、携帯端末1に内蔵された(あるいは携帯端末1に接続された)カメラを用いて画像データを読み取る。ここでは、紙面に手書きされたメモ等、もしくは印刷された文書の一部を読み取るものとする。ステップS2では、サービスを指定する。サービスとしては、たとえば、ステップS1で読みとった画像データに含まれる文字(単語、フレーズ、文章)の翻訳、その文字をキーワードとしたデータベース検索などを指定する。ステップS3では、ステップS1で読み取った画像データをホスト端末3へ送信し、ステップS2で指定したサービスを要求する。
ホスト端末3は、ステップS4で携帯端末1から画像データとサービス要求を受信すると、ステップS5において、受信した画像データを処理するためのアプリケーションプログラムを起動する。ステップS6では、受信した画像データに対してパターン認識処理を実行してその中に含まれる文字を認識する。ステップS7では、携帯端末1において指定されたサービスを実行する。すなわち、ホスト端末3は、必要に応じて翻訳サーバ4や検索サーバ5に処理を依頼しながら、画像データに含まれている文字を翻訳したり、あるいはその文字をキーワードとしてデータベースを検索したりする。ステップS8では、ホスト端末3は、ステップS7による処理結果を携帯端末1に送信する。
携帯端末1は、ステップS9でホスト端末3から処理結果を受信すると、ステップS10においてその処理結果を自己の表示部に表示する。このように、本実施形態のシステムでは、翻訳または検索等を行いたいときには、所望の文字(処理対象の文字)を含む記録面をカメラで撮影して画像データとしてホスト端末3に送信するだけでよい。したがって、ユーザは、所望の文字を紙などにメモ書きしてそれをカメラで撮影するだけで翻訳サービスや検索サービスを受けることができる。また、携帯端末1は、上述のようなサービスを受けるための構成用件として、画像データを取り込む機能、通信機能、およびデータを表示する機能を備えればよいので、軽量化、低コスト化が計れる。
図3は、携帯端末1の外観図である。携帯端末1は、LCD表示部11、カメラ12、ICカード用スロット13、無線通信用アンテナ14を備えている。また、他の通信方式をサポートするために、Ir通信のためのソケットや、有線通信用のソケットなども備えている。LCD表示部11は、タッチパネル構成であり、携帯端末1は手書き入力情報を処理することができる。
図4は、携帯端末1の構成図である。CPU21は、記憶装置22(ROMおよびRAM)に格納されているプログラムを実行する。CPU21と記憶装置22とはバス23を介して互いに接続されている。
記憶装置22は、半導体メモリ、磁気的記録媒体、あるいは光学的記録媒体で構成され、プログラムおよびデータ等を格納している。記憶装置22は、携帯端末1に固定的に設けたものであってもよいし、着脱自在に装着するものであってもよい。
記録媒体ドライバ24は、バス23に接続されており、可搬性記録媒体(半導体メモリ、磁気ディスク、光ディスク、光磁気ディスクを含む)25に格納されているデータを読み出したり、あるいは可搬性記録媒体25にデータを書き込む装置である。可搬性記録媒体25の一例としては、ICカードを想定する。CPU21は、可搬性記録媒体25に格納されているプログラムを実行することもできる。
なお、記憶装置22に記録するプログラムおよびデータ等は、通信回線などを介して接続された他の機器から受信して記録する構成にしてもよく、さらに、CPU21が他の機器側に設けられた記憶装置に格納されているプログラムおよびデータ等を通信回線などを介して使用するようにしてもよい。
LCD表示部11に対応するユニットは、液晶ディスプレイ(LCD)31、液晶ディスプレイ31に表示すべき情報を格納するメモリ32、LCD制御部34の制御に従ってメモリ32に格納されている情報を液晶ディスプレイ31に出力するLCDドライバ33、メモリ32およびLCDドライバ33を制御するLCD制御部34、タッチパネル部35、およびタッチパネル部35が検出した入力情報をCPU21に通知するタッチパネル制御部36から構成される。
カメラ12は、たとえばCCDカメラであり、その出力はA/Dコンバータ37によってビットマップ形式のデジタルデータに変換されてメモリ38に書き込まれる。カメラ制御部39は、CPU21の指示に従って、メモリ38に保持されている画像データをバス23に出力する。
通信制御部40は、携帯端末1からデータを送出する際には、CPU21の指示に従って送信パケットを生成して無線トランシーバ41、42または有線トランシーバ43に渡す。また、データを受信する際には、無線トランシーバ41、42、または有線トランシーバ43を介して受信したパケットに格納されているデータをバス24上に出力する。無線トランシーバ41は、図3に示した無線通信用アンテナ14に接続されており、無線基地局4との間で無線データを授受する。無線トランシーバ42は、Ir通信を行うための送受信機であり、また、有線トランシーバ43は例えばモデムである。無線トランシーバ42および有線トランシーバ43は、オプションで着脱される。なお、携帯端末1は、さらに時計44を備えている。
図5は、携帯端末1においてカメラ撮影により取り込んだ画像データをホスト端末3に転送して所望のサービスを要求する処理のフローチャートであり、図2のステップS1〜S3の詳細を示すものである。このフローチャートで示す各機能を実現するプログラムは、CPU21が読み取り可能なプログラムコードの形態で記憶装置22に格納されている。
以下のフローチャートは、携帯端末1が入力待ち状態において何らかの入力を検出した後の処理を示している。また、この実施例では、ユーザがメモ書きした文字をカメラ撮影する例を説明する。
ステップS11では、検出した入力がカメラ12からの入力であるか調べ、カメラ12からの入力であればステップS12以降の処理を実行し、他の入力であれば、ステップS23においてその入力に対応する他の処理を実行する。このように、ユーザが携帯端末1のカメラ12を用いて撮影すると、ステップS12以降の処理が開始される。なお、カメラ入力があったときには、時計44の出力である時刻情報を保持しておく。
ステップS12では、カメラ12によって取り込まれた画像データをLCD表示部11に表示する。すなわち、カメラ12によって取り込まれた画像データをLCD表示部11のメモリ32に書き込み、その画像データを液晶ディスプレイ31に表示する。このことにより、ユーザは、撮影した画像をその場で見ることができる。図6(a) は、ユーザがカメラ撮影により取り込んだ画像データの表示例である。ここでは、ユーザが紙などに「PHS」および「ISDN」とメモ書きしてそれをカメラ撮影した場合の例を示している。尚、表示画面の右下に「修正終了」とあるのは、入力指示のためのボタンである。
ここで、ステップS12の処理によって図6(a) に示す画面が表示された際のユーザの動作例を説明する。ユーザは、表示画面の内容を修正したい場合には、手書きペンを用いてLCD表示部11上で修正内容を手書き入力する。例えば、「PHS」という用語のみを処理対象とする場合には、図6(b) に示すように、LCD表示部11上で手書きペンを用いて「PHS」を囲むような枠を手書き入力する。あるいは、図6(c) に示すように、不要な表示(「PHS」を処理対象とする場合には、「ISDN」が不要である)に対して手書きペンを用いて削除マークを手書きする。なお、処理対象とは、翻訳の対象となる文字列、または検索に際してのキーワードとなる文字列等を言う。ユーザは、修正が終了すると、修正終了ボタンを手書きペンで押圧する。
上記ユーザの動作に伴ってステップS13およびS14が実行される。ステップS13において修正終了ボタンが押圧されたことを検出すると、ステップS14へ進む。なお、ユーザがLCD表示部11に表示されている画像データを修正することなく修正終了ボタンを押圧したときには、ステップS14がスキップされてステップS15へ進む。
ステップS14では、ユーザによるペン入力指示に従って画像データを更新する。すなわち、ペン入力によってLCD表示部11上で押圧された軌跡パターンをビットマップ形式のデータとしてメモリ32に上書きする。このとき、メモリ32には現在LCD表示部11に表示されている画像データが格納されているので、カメラ撮影によって取り込まれた画像データとペン入力によって書き込まれた軌跡パターンとが合成される。
ステップS15では、ユーザに所望のサービスを指定させるための画面をLCD表示部11に表示する。このとき、メモリ32に格納されている画像データを記憶装置22のRAMに待避する。そして、ユーザに所望のサービスを指定させるための画面の画像データを記憶装置22のROMから読み出してメモり32に書き込む。ユーザに所望のサービスを指定させるための画面の一例を図7(a) に示す。携帯端末1は、この後ユーザからの指示を待つ状態に遷る。
ここで、ユーザがサービスを指定する手順を説明する。サービス指定画面は、図7(a) に示すように、6つのボタンを有している。これら6つのボタンは、図6に表示されていた画像データに対する処理を指定させるものである。
「翻訳」は、画像データに含まれている文字などを所定の言語に翻訳するサービスを指定するためのボタンである。「検索」は、画像データに含まれている文字などをキーワードとしてデータベース検索などを行うサービスを指定するためのボタンである。「認識」は、画像データを解析して文字認識を行うサービスを指定するためのボタンである。翻訳サービスおよび検索サービスは、認識サービスを含んでいる。「イメージ」は、携帯端末1で取り込んだ画像データをホスト端末3に格納しておくサービスを指定するためのボタンである。「保存」は、携帯端末1で取り込んだ画像データを携帯端末1側で保存することを指定するためのボタンである。「キャンセル」は、画像データを廃棄することを指定するためのボタンである。ユーザは、上記6つのボタンの中の1つを押圧する。
翻訳ボタンが押圧されたときには、図7(b) に示す言語指定画面がLCD表示部11に表示される。ユーザが所望の翻訳言語を指定すると、図7(c) に示す表示指定画面が表示される。表示指定画面は、ホスト端末3に依頼する翻訳結果を携帯端末1に表示させるか否かをユーザに指定させるための画面である。
検索ボタンが押圧されたときには、図7(d) に示す検索先指定画面がLCD表示部11に表示される。この状態でユーザが所望の検索先を指定すると、この場合も図7(c) に示す表示指定画面が表示される。
このように、ユーザは、LCD表示部11の表示画面に従ってサービスを指定する。上述のようにしてユーザがサービスを指定すると、ステップS16以下の処理が実行される。まず、ステップS16では、サービスコードを認識する。この処理は、図7(a) のサービス指定画面でユーザがどのボタンを押圧したかを検出するものである。ステップS17では、指定されたサービスコードが「翻訳」「検索」「認識」または「イメージ格納」であるかを判断する。これら4つのサービスは、ホスト端末3に処理を依頼するものであるので、ステップS17は、実質的には、ホスト端末3に処理を依頼する必要があるのか否かを判断するステップである。
ホスト端末3に処理を依頼する必要があれば(ステップS17:Yes)、ステップS18でパケットを作成し、ステップS19でそのパケットをホスト端末3に送出する。ホスト端末3に処理を依頼する必要がなければ(ステップS17:No)、ステップS20において、ユーザが保存ボタンを押圧したかを判断する。ユーザが保存ボタンを押圧したのであれば、ステップS21で携帯端末1側で画像データを保存する。一方、ユーザが保存ボタンを押圧したのでなければ、ユーザがキャンセルボタンを押圧したものと見なし、ステップS22で画像データを廃棄する。
図8は、携帯端末1から送出されるパケットの構造を示す図である。このパケットは、図5に示すステップS18において作成される。各パケットは、ヘッダ部およびデータ部から構成される。ヘッダ部は、送信元アドレスおよび着信先アドレスなどを格納する。送信元アドレスおよび着信先アドレスとしてどのようなアドレス体系のアドレスを格納するのかは、本実施形態が適用されるネットワーク構成によって決まり、たとえば、TCP/IP通信では、IPアドレスが格納される。
データ部には、アプリケーション識別情報、端末ID、画像データ、サービスコード、付加情報、表示フラグ、時刻情報などが格納される。アプリケーション識別情報は、着信先の端末(ここでは、ホスト端末3)において起動すべきアプリケーションプログラムを識別する情報である。本実施形態においては、画像データ解析・認識プログラムを識別する情報が設定される。なお、アプリケーション識別情報は、TCP/IP通信では、ポート番号として指定される。
端末IDは、携帯端末1の識別番号である。画像データは、カメラ撮影によって取り込んだ画像データであり、パケットに格納されるときには圧縮される。なお、図6(b) または(c) のように手書きペンによる書込みがあった場合には、そのペン入力の軌跡パターンも画像データとして合成されている。
サービスコードは、例えば図9(a) および(b) に示すような8ビットの情報であり、「翻訳」「検索」「認識」または「イメージ格納」を識別する。付加情報は、図9(a) 、(c) および(d) に示すように、各サービスの内容を詳細に指定する情報である。たとえば、翻訳サービスであれば、翻訳言語を識別する。また、検索サービスであれば、検索先を識別する。検索先としては、公衆に公開されている各種データベースの他に、各ユーザが作成する個人データベースにもアクセスできる。表示フラグは、ホスト端末3における処理結果を携帯端末1に表示させるか否かを指定する1ビットの情報であり、例えば、図7(c) の画面上で「はい」が選択されると、「1」が設定される。時刻情報は、ホスト端末3へ送出される画像データがカメラ撮影された時刻を表す情報である。
図10は、図5に示すステップS18のパケット作成処理の詳細フローチャートである。ステップS31では、ホスト端末3へ転送する画像データを圧縮し、データ部に格納する。ステップS32では、上記画像データをカメラ撮影した時刻を表す時刻情報を設定する。ステップS33〜35では、図9に示すように、サービスコード、付加情報および表示フラグをそれぞれデータ部の所定領域に設定する。ステップS36では、アプリケーション識別情報として、画像データ解析・認識プログラムを識別する情報を設定する。ステップS37では、携帯端末1を識別する情報(自機を識別する情報)として端末IDを設定する。さらに、ステップS38においてヘッダ部を作成する。ヘッダ部には、少なくとも、送信元アドレスとして携帯端末1のアドレス(自機のアドレス)、および着信先アドレスとしてホスト端末3のアドレスを設定する。
上述のようにして作成されたパケットは、ネットワーク2に送出される。ネットワーク2は、パケットの着信先アドレスに従ってそのパケットをホスト端末3へ転送する。以下では、このパケットを受信して処理するホスト端末3について説明する。
図11は、ホスト端末3の構成図である。記憶装置51は、半導体メモリ、磁気的記録媒体、あるいは光学的記録媒体で構成され、プログラムおよびデータ等を格納している。記憶装置51は、ホスト端末3に固定的に設けたものであってもよいし、着脱自在に装着するものであってもよい。
記録媒体ドライバ52は、可搬性記録媒体(半導体メモリ、磁気ディスク、光ディスク、光磁気ディスク等を含む)53に格納されているデータを読み出したり、あるいは可搬性記録媒体53にデータを書き込む装置である。通信制御部54は、ネットワークとの間でのデータの授受を制御するユニットである。各携帯端末との間のパケットの送受信もここで制御される。
CPU55は、記憶装置51または可搬性記録媒体53からプログラム等をメモリ56にロードして実行する。なお、記憶装置51に記録するプログラムおよびデータ等は、可搬性記録媒体53に格納されていたものを書き込んだものであってもよく、また、通信回線などを介してネットワーク上の他の機器から受信して記録する構成にしてもよい。さらに、CPU55は、ネットワーク上に設けられた他の記憶装置に格納されているプログラムおよびデータ等を通信回線などを介して使用するようにしてもよい。
図12は、ホスト端末3の処理を説明するフローチャートであり、図2のステップS4〜S8の詳細を示すものである。ここでは、ホスト端末3が携帯端末1から送出されたパケット(図5のフローチャートの処理によって作成されたパケット)を受信し、そのデータ部に設定されている情報に従って画像データを処理する動作を説明する。
ステップS41でパケットを受信すると、ステップS42でそのパケットに設定されている端末IDを調べることによってそのパケットを送出した端末を認識する。ここでは、携帯端末1が認識されるものとする。続いて、ステップS43では、受信したパケットに設定されているアプリケーション指定情報に従ってアプリケーションプログラムを起動する。このことにより、画像データを解析・認識するプログラムが起動される。
ステップS44以降は、画像データ解析・認識プログラムによる処理である。ステップS44では、受信したパケットに設定されているサービスコードを認識する。続いて、ステップS45では、そのサービスコードが「翻訳」、「検索」または「認識」であるかを調べる。サービスコードが「翻訳」、「検索」または「認識」であればステップS46以降の処理を実行し、そうでなければステップS54へ進む。
ステップS46では、受信したパケットに格納されていた画像データを解凍する。ステップS47では、解凍した画像データに対してパターン認識処理を施してその中に含まれている文字を認識する。ステップS48では、ステップS47で認識した文字を文字コードに変換する。
ステップS49では、サービスコードが「翻訳」であるかを調べ、「翻訳」であれば図13に示す翻訳処理を実行し、「翻訳」でなければステップS50へ進む。ステップS50では、サービスコードが「検索」であるかを調べ、「検索」であれば図14に示す検索処理を実行し、「検索」でなければステップS51へ進む。ステップS51では、サービスコードが「認識」であるか調べ、「認識」であればステップS52においてステップS47およびS48による処理結果を端末IDに対応づけて記憶装置51の所定領域に格納し、「認識」でなければステップS53へ進んでエラー処理を実行する。
ステップS54では、サービスコードが「イメージ格納」であるか調べ、「イメージ格納」であればステップS55においてパケットに格納されていた画像データを端末IDに対応づけて記憶装置51の所定領域に格納する。一方、「イメージ格納」でなければステップS56へ進んで設定されていたサービスコードに対応する処理を実行する。
図13は、翻訳処理のフローチャートである。ステップS61では、ホスト端末3は、ステップS48で得られた文字コードおよび受信パケットに設定されていた付加情報(翻訳タイプ)を翻訳サーバ4に転送することによって翻訳処理を依頼する。以下のステップS62〜S65は、翻訳サーバ4の処理である。
ステップS62では、付加情報から翻訳タイプを認識する。すなわち、翻訳元の言語および翻訳先の言語を認識する。続いて、ステップS63で1つ以上の文字コード(文字列)から単語を切り出し、ステップS64において、公知の手法により翻訳を実行する。そして、ステップS65では、翻訳結果をホスト端末3へ渡す。
ステップS66において、ホスト端末3は、受信パケットに設定されている表示フラグを調べる。表示フラグが「表示する」に設定されていれば、ステップS67で翻訳結果をパケットに格納し、ステップS68でそのパケットを携帯端末1に送出する。このことにより、携帯端末1は、携帯端末1に内蔵されるカメラ12で撮影した画像データに含まれていた文字の翻訳結果を受け取る。携帯端末1は、この翻訳結果をLCD表示部11に表示する。一方、表示フラグが「表示せず」に設定されていれば、ステップS69において、翻訳結果を端末IDに対応づけて記憶装置51の所定領域に格納する。
図14は、検索処理のフローチャートである。ステップS71では、ホスト端末3は、ステップS48で得られた文字コードおよび受信パケットに設定されていた付加情報(検索先)を検索サーバ5に転送することによって検索処理を依頼する。以下のステップS72〜S74は、検索サーバ5の処理である。
ステップS72では、付加情報から検索先のデータベースを認識する。すなわち、どのデータベースにアクセスするのかを認識する。続いて、ステップS73では、受け取った文字列をキーワードとして公知の手法によりデータベース検索を実行する。そして、ステップS74で検索結果をホスト端末3へ渡す。
ステップS75において、ホスト端末3は、受信パケットに設定されている表示フラグを調べる。表示フラグが「表示する」に設定されていれば、ステップS76で検索結果をパケットに格納し、ステップS77でそのパケットを携帯端末1に送出する。このことにより、携帯端末1は、携帯端末1に内蔵されるカメラ12で撮影した画像データに含まれていた文字をキーワードとしたデータベース検索の検索結果を受け取る。携帯端末1は、この検索結果をLCD表示部11に表示する。一方、表示フラグが「表示せず」に設定されていれば、ステップS78において、検索結果を端末IDに対応づけて記憶装置51の所定領域に格納する。
なお、図12に示したステップS47のパターン認識処理は、公知の手法を用いるが、図6(b) に示すように、手書きペンで書き込まれた枠状のパターンの内側の領域に存在する文字のみを処理対象とする方式の場合には、パターン認識処理として図15に示すフローチャートの処理が実行される。
ステップS81では、受信パケットに格納されていた画像データにおいて所定の領域を取り囲む枠状のパターンをサーチする。ステップS82では、枠状のパターンが存在するか否かを判断する。存在するのであれば、ステップS83において、その枠状のパターン内の画像データのみに対して画像認識処理を実行して文字を認識する。一方、枠状のパターンが存在しないのであれば、すべての画像データに対して認識処理を実行する。上記方式を採用することにより、カメラ撮影で取り込まれた画像データの中から翻訳処理または検索処理などに不要な文字を簡単に除外できる。さらに、削除マークの場合は、削除マークを検出し、この削除マークに該当する文字を除いて文字認識する。なお、認識対象から除外する処理をホスト側で行っているが、端末側でこれらの処理を行い、認識すべきデータをホスト側へ送信するようにしてもよい。
図16は、端末ID毎に格納されるデータを模式的に示す図である。これらのデータは、図12のステップS52、S55、図13のステップS69、および図14のステップS78によって記憶装置51の所定領域に格納される。このとき、受信パケットに設定されていた時刻情報を用いて撮影時刻順にデータを格納してもよい。上記データは、携帯端末1からアクセスできるだけでなく、ネットワーク2に接続される他の端末(個人用PC6など)からもアクセスできるように構成されている。
ところで、上記実施形態では、携帯端末として、図3に示すような手書き入力機能を持った手帳型のものを採り上げて説明したが、本発明は、この形態に限定されるものではなく、たとえば図17に示すような腕時計型の端末装置であってもよい。
図17に示すように、携帯端末61は、カメラ62を備え、たとえば紙面63上にペン64で手書きされたメモ等もしくは印刷された文書の一部を画像データとして取り込むことができる。また、この携帯端末61は、通信機能を備えており、図1に示すネットワーク2を介してホスト端末3とデータを送受信する。なお、形態端末61の構成は、基本的に図4に示したものと同じである。
携帯端末61は、そのサイズを考えると、図3に示す携帯端末1のようなペン入力機能等を持たせることは困難である。このため、手帳型の携帯端末1では、サービスの指定(カメラ撮影によって取り込んだ画像データにどのような処理を施すのかについての指定)を図7のような画面を表示して入力させていたが、携帯端末61では、同様の手順でサービスを指定することが難しい。この点を考慮し、携帯端末61では、翻訳または検索対象の文字等といっしょにホスト端末3に依頼するサービス種別も画像データとしてカメラ62で取り込み、ホスト端末3で画像データのパターン認識をする際にホスト端末3がユーザの指定するサービス種別を認識する方式とする。
図18は、サービス指定方法の例を示す図である。ここでは、「同報通信」という言葉をホスト端末3に翻訳させる例を説明する。図18(a) に示す手法においては、ユーザが紙面63に「同報通信」と書くとともに、ホスト端末3に依頼するサービス種別として「翻訳」と書く。さらに、翻訳対象文字とサービス種別文字とを識別するために、サービス種別を指定する文字の両端を[ ]などの記号で囲む。そして、カメラ62を用いてこれらの文字および記号をまとめて画像データとして取り込んでホスト端末3へ転送する。
図18(b) に示す手法では、この場合も紙面63に「同報通信」及び「翻訳」と書くが、翻訳対象文字とサービス種別文字とを識別するために、色情報を利用する。すなわち、ここでは、サービス種別は赤色等で記入し、翻訳対象を黒色で記入する。この場合も、カメラ62を用いてこれらの文字等をまとめて画像データとして取り込んでホスト端末3へ転送する。
図19は、携帯端末61の動作フローチャートである。ここでは、画像データを取り込んでホスト端末3に処理を依頼(サービスを要求)する際の最低限の機能を示す。なお、このフローチャートで示す各機能を実現するプログラムは、CPU21が読み取り可能なプログラムコードの形態で記憶装置22に格納されている。
入力待ち状態において入力を検出すると、ステップS91でカメラ62からの入力であるかを調べ、カメラ入力であればステップS92でパケットを作成してステップS93でそのパケットをホスト端末3に送出する。一方、カメラ入力以外の入力であれば、ステップS94でその入力に対応する処理を実行する。ステップS92で作成するパケットは、基本的に図8に示すものと同じであるが、サービスコード等は画像データの中に含まれている。
図20は、携帯端末側で図18(a) もしくは図18(b) に示す手法でサービス種別を指定した際のホスト端末3の処理を説明するフローチャートである。ここでは、ホスト端末3が携帯端末61から送出されたパケット(図19のフローチャートの処理によって作成されたパケット)を受信し、そのデータ部に設定されている情報に従って画像データを処理する動作を説明する。
ステップS101〜S103は、図12に示すステップS41〜S43と同じである。ステップS104では、受信パケットのデータ部に格納されている画像データに対してパターン認識処理を実行し、その中から特定の記号もしくは色を検出する。ステップS105では、検出した記号の内側の領域の画像データもしくは特定の色に対して文字認識処理を実行し、ユーザが指定したサービスを認識する。図18(a) もしくは図18(b) に示した例では、「翻訳」という文字を検出し、ユーザが翻訳サービスを要求していることを認識する。
ステップS106では、認識されたサービスに従った処理を実行する。なお、ステップS106の処理は、図12〜図14のステップS48以降の処理に相当する。この結果、たとえば、携帯端末61において取り込んだ画像データが図18(a) もしくは図18(b) に示す文字等であった場合、「同報通信」が“multi-cast communication”に翻訳される。そして、ステップS107において、処理結果をパケットに格納して携帯端末61に送出する。
携帯端末61は、ホスト端末3による処理結果が格納されたパケットを受信すると、その処理結果を表示する。このように、携帯端末61は、カメラ62で撮影した画像データに所定のサービスを施した結果(この例では、翻訳結果)を表示することができる。
なお、上記実施形態において、ホスト端末3において実行される処理プログラム、すなわち、図12〜図15、図20のフローチャートで示す各機能を実現するプログラム、および携帯端末1または61から転送されてくるコマンドを解釈して処理するプログラム等は、CPU55が読み取り可能なプログラムコードの形態で記憶装置51あるいは可搬性記録媒体53に格納されている。あるいは、ネットワークを介して接続される他の装置に格納されているものを利用する。
なお、上記実施形態では、カメラを用いて画像データを取り込む構成を示したが、本発明はこの構成に限定されず、たとえば、イメージスキャナを用いて読み込んだ画像データをホスト端末に転送するようにしてもよい。
このように、本実施形態の画像データ処理システムは、携帯端末で取り込んだ画像データをホスト端末へ転送し、ホスト端末がその画像データに含まれている文字を認識して処理する構成である。このため、携帯端末には、画像データなどを取り込んでホスト端末へ転送する機能、ホスト端末3に処理を依頼する機能、およびホスト端末から転送されてくるデータを表示する機能のみを持たせればよい。すなわち、携帯端末は、高速処理が要求される高精度のパターン認識処理や各種処理を実行する必用がない。このため、携帯端末は、大容量のメモリや高性能プロセッサを設けることなく、高度な画像処理結果を得ることができる。
本実施形態のシステム構成図である。 本実施形態のシステムの全体フローチャートである。 携帯端末の外観図である。 携帯端末の構成図である。 携帯端末においてカメラ撮影により取り込んだ画像データをホスト端末に転送して所望のサービスを要求する処理のフローチャートである。 (a) は、カメラ撮影した画像データを携帯端末の表示部に表示した例であり、(b) および(c) は、携帯端末上で画像データを修正する動作例を説明する図である。 ユーザに所望のサービスを指定させるための画面例を示す図である。 携帯端末から送出されるパケットの構造を示す図である。 パケットに設定される各種情報を説明する図である。 パケット作成処理の詳細フローチャートである。 ホスト端末の構成図である。 ホスト端末の処理を説明するフローチャートである。 翻訳処理のフローチャートである。 検索処理のフローチャートである。 パターン認識処理の一実施例のフローチャートである。 端末ID毎に格納されるデータを模式的に示す図である。 腕時計型の携帯端末の外観図である。 サービス指定方法の例を示す図である。 図17に示す携帯端末の動作フローチャートである。 図18(a) もしくは図18(b) に示すサービス指定方法に対応するホスト端末の処理を説明するフローチャートである。
符号の説明
1、61 携帯端末
2 ネットワーク
3 ホスト端末
4 翻訳サーバ
5 検索サーバ
11 LCD表示部
12、62 カメラ
21 CPU
22 記憶装置
23 バス
24 記録媒体ドライバ
25 可搬性記録媒体
31 液晶ディスプレイ
35 タッチパネル部
40 通信制御部
41、42 無線トランシーバ
43 有線トランシーバ
44 時計
51 記憶装置
52 記録媒体ドライバ
53 可搬性記録媒体
54 通信制御部
55 CPU
56 メモリ

Claims (4)

  1. 文字を含む画像データを撮影する撮影手段と、
    この撮影された画像データに対する複数の処理をホスト装置へ依頼する複数のサービスの中から所望のサービスを指定するサービス指定手段と、
    前記ホスト装置へ依頼した前記サービスの処理結果を前記携帯端末装置へ表示するか否かを示す情報を指定する表示指定手段と、
    前記指定されたサービスを示すサービスコード、前記表示指定手段で指定された情報および前記撮影された画像データを前記ホスト装置へ通信ネットワークを介して送信する送信手段と、
    前記画像データを受けた前記ホスト装置において、この画像データから認識された文字に対して前記指定されたサービスに基づく処理を実行した処理結果のデータを、前記指定された情報に応じて前記通信ネットワークを介して前記ホスト装置から受信する受信手段と、
    前記受信した処理結果のデータを表示する表示手段と、
    を具備したことを特徴とする携帯端末装置。
  2. 前記サービス指定手段は、前記ホスト装置へ依頼するサービスの指定画面を表示し、翻訳、検索、認識を含む何れか複数のサービスの中から所望のサービスを指定することを特徴とする請求項1記載の携帯端末装置。
  3. 前記撮影手段で撮影された画像データを画面に表示し、この画像データの文字を修正する手段を有することを特徴とする請求項1記載の携帯端末装置。
  4. 携帯端末装置から通信ネットワークを介して送信されたデータを受信する受信手段と、
    前記受信したデータに含まれているサービスコードの種類を判断する判断手段と、
    前記受信したデータに含まれている画像データから文字を認識し、この文字に対して前記判断されたサービスコードに応じた処理を実行する処理手段と、
    前記受信したデータに前記処理の結果を前記携帯端末装置へ表示する情報が含まれていれば、前記処理手段による処理結果のデータを前記携帯端末装置へ送信する送信手段と、
    を具備したことを特徴とするホスト装置。
JP2003396840A 2003-11-27 2003-11-27 携帯端末装置またはホスト装置 Pending JP2004173289A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2003396840A JP2004173289A (ja) 2003-11-27 2003-11-27 携帯端末装置またはホスト装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2003396840A JP2004173289A (ja) 2003-11-27 2003-11-27 携帯端末装置またはホスト装置

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
JP8285620A Division JPH10134004A (ja) 1996-10-28 1996-10-28 画像データ処理システム

Publications (1)

Publication Number Publication Date
JP2004173289A true JP2004173289A (ja) 2004-06-17

Family

ID=32709323

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2003396840A Pending JP2004173289A (ja) 2003-11-27 2003-11-27 携帯端末装置またはホスト装置

Country Status (1)

Country Link
JP (1) JP2004173289A (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2012128496A (ja) * 2010-12-13 2012-07-05 Ntt Docomo Inc 管理装置、管理方法及びプログラム
JP2013034237A (ja) * 2012-10-17 2013-02-14 Sony Corp 画像処理装置、画像処理方法、画像処理システム
JP2014026302A (ja) * 2012-07-24 2014-02-06 Casio Comput Co Ltd 情報処理装置及びプログラム

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2012128496A (ja) * 2010-12-13 2012-07-05 Ntt Docomo Inc 管理装置、管理方法及びプログラム
JP2014026302A (ja) * 2012-07-24 2014-02-06 Casio Comput Co Ltd 情報処理装置及びプログラム
JP2013034237A (ja) * 2012-10-17 2013-02-14 Sony Corp 画像処理装置、画像処理方法、画像処理システム

Similar Documents

Publication Publication Date Title
KR100308543B1 (ko) 문자인식을기초로하는데이터송수신장치
US6054990A (en) Computer system with handwriting annotation
US6178426B1 (en) Apparatus with extended markup language data capture capability
JPH10134004A (ja) 画像データ処理システム
US20020051262A1 (en) Image capture device with handwritten annotation
JP4237215B2 (ja) 画像読取システム、サーバ装置、画像読取装置、および端末装置
JPH11167532A (ja) データ加工システムおよび装置、データ加工方法、記録媒体
JPH10260916A (ja) 画像データ処理システム
US20030058344A1 (en) Method, apparatus, and program for photography
KR20050017316A (ko) 카메라를 구비한 휴대용 단말기에서의 주소록 관리 장치및 방법
JP4289038B2 (ja) 画像読取装置、データ管理装置、キーワード付加プログラムおよびデータ管理プログラム
JPS6395578A (ja) 画像情報処理装置
US20080018772A1 (en) Input apparatus for image
JP2004173289A (ja) 携帯端末装置またはホスト装置
JP4766135B2 (ja) 情報提供装置、情報提供方法および情報提供プログラム
JP3994962B2 (ja) 画像データ格納システムまたは携帯端末装置
JP4666789B2 (ja) コンテンツ配信システムおよびコンテンツ配信サーバ
US7418654B2 (en) Communication terminal, storage medium and communication system
JP2005038344A (ja) 書類引継システム及び書類引継方法
JPH0793369A (ja) 画像データの通信システム
JP5223328B2 (ja) 情報管理装置及び情報管理方法ならびにそのプログラム
JPH10255063A (ja) 画像処理システム
JP2002354309A (ja) デジタルカメラ連携システムおよび画像データ処理プログラムを記録した記録媒体
JPH10254989A (ja) 画像処理システムおよびその方法
JP2005044138A (ja) 印刷プレビューシステム

Legal Events

Date Code Title Description
A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20051128

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20051213

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20060209

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20060404