WO2003050714A1

WO2003050714A1 - Systeme de traitement d'image de terminal cellulaire, terminal cellulaire et serveur

Info

Publication number: WO2003050714A1
Application number: PCT/JP2002/012281
Authority: WO
Inventors: Takashi Hirano; Yasuhiro Okada
Original assignee: Mitsubishi Denki Kabushiki Kaisha
Priority date: 2001-12-10
Filing date: 2002-11-26
Publication date: 2003-06-19
Also published as: JP2003178067A; CN1615478A; US20050221856A1

Description

明細書

携帯端末型画像処理システム、携帯端末およびサーバ技術分野

本発明は、携帯端末のカメラで撮像した画像に含まれる文字を翻訳する携帯端末型画像処理システム、携帯端末およびサーバに関するものである。背景技術

近年、カメラを装備した携帯電話の製品化が盛んになつてきた。このような携帯端末のカメラで撮像した画像に含まれる文字列を文字認識して、認識結果のテキストを翻訳するシステムについて特開平 9 一 1 3 8 8 0 2号公報に開示されている。この方式は、携帯端末内部に文字認識処理と翻訳処理を持ち、これらの処理を用いてカメラで撮像した画像内の文字列を認識 · 翻訳するものである。しかし、この方式では、携帯端末のサイズ上の制限により、高度な文字認識処理と翻訳処理を行うことが困難な課題がある。

一方、これに対して、携帯端末（携帯電話）のカメラで撮像した画像を外部のサーバに一旦送信し、サーバ側で画像内の文字を認識 · 翻訳した結果を携帯端末に送り返す方式が特開平 1 0 — 1 3 4 0 0 4号公報に提案されている。この方式によれば、処理性能の高いサーバ側で文字認識と翻訳を行うため、高度な処理が可能となる。以下、この方式の動作について図 2 5 を用いて説明する。

図 2 5は従来の携帯端末型画像処理システムに係る処理手順を示すフローチャートで、この処理手順は、携帯端末における処理とサーバにおける処理の二つに別れる。

まず、携帯端末側において、ユーザが携帯端末に内蔵または接続されたカメラを用いて画像を撮像する。ここでは、紙面に手書きされたメモや、印刷された文書の一部を読み取る（ステップ S T 1 )。読み取った画像に関して処理したいサービスを指定する。サービスとしては、例えばステツプ S T 1で撮像した画像に含まれる文字列の翻訳や、その文字をキーワードとしたデータべ一ス検索などを指定する。ここでは、文字列の翻訳サービスを指定するものとする（ステツプ S T 2 )。その後、撮像した画像と指定したサービス要求をサーバに送信する（ステップ S T 3 )。

次にサ一バ側において、携帯端耒からの画像とサービス要求を受信すると（ステップ S T 4 )、受信した画像を処理するアプリケーションプログラムを起動する（ステップ S T 5 )。起動したアプリケーションプログラムにより受信した画像に含まれる文字列を認識して、テキストを得る（ステツプ S T 6 )。次に、携帯端末で指定したサービスを実行する。ここでは、翻訳サービスを指定しているので抽出されたテキストを翻訳する（ステップ S T 7 )。翻訳の処理結果を携帯端末に送信する（ステップ S T 8 )。

その後、携帯端末側において、サーバから送信された処理結果を受信する（ステップ S T 9 )。受信した処理結果の内容、すなわち翻訳文を携帯端末のディスプレイに表示する（ステップ S T 1 0 )。

以上の処理により、携帯端末のカメラで撮像した画像に含まれる文字列の翻訳結果を得ることができる。

以上述べたように、従来の方式は画像内の文字列を文字認識した結果の文字列（テキスト）を翻訳することで、画像内の文字列に対する翻訳結果を得ている。しかし、携帯端末のカメラで撮像した画像は、一般の O C R (文字認識装置）が認識対象とするスキャナで読み取った画像に比べて解像度が低く、画像の品質が悪い。また、海外において他国語で記入された看板中の文字列をカメラで撮像して、自国語に翻訳するというような使用方法が想定されるが、看板の文字列は飾り文字が多い。このような品質の悪い画像内の文字列や飾り文字に対して、現状の文字認識処理の性能は低く、誤認識する可能性が高い。そのため、文字認識処理で得たテキストをそのまま翻訳しても、正しい結果が得ることは困難であるという課題があつた。

また、一度に多数の文字列を翻訳する場合、ユーザは翻訳したい文字列上にカメラの視野を移動させてシャッターを押すという作業を何度も繰り返す必要が生じ、手間を要するという課題があった。さらに、携帯端末のカメラで撮像した画像は解像度が低いため、長い文字列や文章を 1枚の画像内に納めることができない。これに対して、カメラを後ろに引くなどして広範囲を撮像すれば、長い文字列も 1枚の画像に納めることは可能であるが、 1文字を表現する画素数は少なくなり、文字認識率が低下する。このため翻訳可能な文字列の長さが制限されるという課題があった,

― さらにまた、携帯端末で撮像した画像をサ一パに送信する場合、送信するデ一夕量が大きいため、一般の電話回線ではデータ送信に時間がかかるという課題がある。加えて、従来の方式において、サーバが持つ文字認識処理や翻訳処理は、一般用語を対象としたものと考えられるが、その場合はメニューに載っている郷土料理の名前や診断書に記入された病名等、専門性の高い用語に対して十分な文字認識性能および翻訳性能を得ることが困難であるという課題があった。また、このようなシステムを海外旅行等で使用する場合、画像に含まれる他国語の文字列を自国語に翻訳する使用形態に加え、逆に自国語で入力したテキストを他国語に翻訳する要求も想定される。しかし、携帯端末では、テキス卜の入力に手間がかかるなどの課題があった。

この発明は上記のような課題を解決するためになされたもので、翻訳を行う上で利便性の高い携帯端末型翻訳システム、携帯端末およびサーバを得ることを目的とする。発明の開示

第 1 の発明に係る携帯端末型翻訳システムは、携帯端末とこの携帯端末とデータ交換を行うサーバとからなり、前記携帯端末は、画像撮像部と、この画像撮像部により撮像した画像を蓄積する画像バッファと、キ一ワードを入力するキー入力部と、前記サーバへ依頼する処理サービスの種類を指定する処理指示部と、前記画像バッファに蓄積された画像あるいは前記キー入力部により入力されたキーヮ一ド、指定された処理サービスの種類および前記携帯端末の関連情報からなるデータを前記サーバに送信するデータ送信部と、前記サーバにおいて翻訳処理された翻訳結果を受信する結果受信部と、受信した前記翻訳結果を表示する表示部とを備え、前記サーバは、前記携帯端末から送信されたデータを受信するデータ受信部と、受信した前記画像に含まれる 1個の文字列に対して複数個の文字列を抽出し、抽出した前記複数個の文字列を翻訳してそれぞれの翻訳結果を生成する画像内文字列認識 · 翻訳部と、受信した前記キーワードに対する関連文を生成し、生成された前記関連文を翻訳して翻訳結果を生成するテキスト翻訳部と、受信したデ一夕に含まれる前記指定された処理サービスの種類に従って前記画像内文字列認識 · 翻訳部で処理するか、あるいは前記テキス卜翻訳部で処理するかを切り替え制御する処理制御部と、前記画像内文字列認識 · 翻訳部または前記テキスト翻訳部で生成された翻訳結果を前記関連情報に基づいて前記携帯端末に送信する結果送信部とを備えたものである。

第 2 の発明に係る携帯端末型翻訳システムは、携帯端末とこの携帯端末とデータ交換を行うサーバとからなり、前記携帯端末は、画像撮像部と、この画像撮像部により撮像した画像を蓄積する画像バッファと、前記サーバへ依頼する処理サービスを指示する処理指示部と、前記画像バッファに蓄積された画像、前記処理サービスの指示および前記携帯端末の関連情報からなるデ一夕を前記サーバに送信するデータ送信部と、前記サーバにおいて翻訳処理された翻訳結果を受信する結果受信部と、受信した前記翻訳結果を表示する表示部とを備え、前記サーバは、前記携帯端末から送信されたデ一夕を受信するデータ受信部と、受信した前記画像に含まれる 1個の文字列に対して複数個の文字列を抽出し、抽出した前記複数個の文字列を翻訳してそれぞれの翻訳結果を生成する画像内文字列認識 · 翻訳部と、受信したデ一夕に含まれる前記処理サービスの指示に従って ■ 前記画像内文字列認識 ·翻訳部を動作させる処理制御部と、生成された前記翻訳結果を前記関連情報に基づいて前記携帯端末に送信する結果送信部とを備えたものである。

第 3の発明に係る携帯端末型翻訳システムは、携帯端末とこの携帯端末とデータ交換を行うサ一バとからなり、前記携帯端末は、キ一ワードを入力するキ一入力部と、前記サーバへ依頼する処理サービスを指示する処理指示部と、前記キー入力部により入力されたキーワード、前記処理サ —ビスの指示および前記携帯端末の関連情報からなるデ一タを前記サーバに送信するデータ送信部と、前記サーバにおいて翻訳処理された翻訳結果を受信する結果受信部と、受信した前記翻訳結果を表示する表示部とを備え、前記サ —バは、前記携帯端末から送信されたデータを受信するデ —タ受信部と、受信したデータに含まれる前記キーワードに対する関連文を生成し、生成された前記関連文を翻訳して前記翻訳結果を生成するテキスト翻訳部と、受信したデ —夕に含まれる前記処理サービスの指示に従って前記テキスト翻訳部を動作させる処理制御部と、生成された前記翻訳結果を前記関連情報に基づいて前記携帯端末に送信する結果送信部とを備えたものである。

第 4の発明に係る携帯端末型翻訳システムは、サーバの画像内文字列認識 · 翻訳部が、異なる複数の条件で画像内の 1個の文字列を認識することにより複数個の文字列認識結果を生成する画像内文字列認識部と、生成した前記複数個の文字列認識結果をそれぞれ翻訳した複数個の翻訳結果を生成する画像内文字列翻訳部とを有したものである。第 5 の発明に係る携帯端末型翻訳システムは、サーバの画像内文字列認識 · 翻訳部が、異なる複数の条件で画像内の 1個の文字列を認識することにより複数個の文字列認識結果を生成すると共に、言語辞書を用いて前記複数個の文字列認識結果に対してスペリングが類似する類似文字列を生成する画像内文字列認識部と、生成した前記文字列認識結果と前記類似文字列のそれぞれを翻訳することにより複数個の翻訳結果を生成する画像内文字列翻訳部とを有したものである。

第 6 の発明に係る携帯端末型翻訳システムは、サーバのテキスト翻訳部が、受信したキーワードに基づいて関連文辞書を参照して前記キーワードに関連性の高い複数個の文章を生成する関連文生成部と、生成された前記複数個の文章を翻訳することにより翻訳結果を生成する関連文翻訳部とを有したものである。

第 7の発明に係る携帯端末型翻訳システムは、携帯端末は、画像撮像部により一定の時間間隔で連続的に撮像され画像バッファに蓄積した各画像を順次選択してデータ送信部に出力する送信画像制御部を備え、サーバが、受信した前記各画像に含まれる文字列の各翻訳結果を順次生成して前記携帯端末に送信し、前記携帯端末の表示部が、前記各翻訳結果を受信する都度表示するようにしたものである。第 8 の発明に係る携帯端末型翻訳システムは、携帯端末の送信制御部が、画像パッファから順次読み出す画像について、新しく撮像された画像とその一つ前に撮像された画像との差を比較し、その差が閾値以下となった場合に前記新しく撮像された画像を選択してデータ送信部に出力するようにしたものである。

第 9 の発明に係る携帯端末型翻訳システムは、サーバは、連続的に受信された複数個の画像を合成して 1枚の合成画像を作成する画像統合部を備え、画像内文字列認識 · 翻訳部が、作成された前記合成画像に含まれる文字列に対する翻訳結果を生成するようにしたものである。

第 1 0の発明に係る携帯端末型翻訳システムは、携帯端末は、当該携帯端末の現在位置を取得してサーバに送信するデータに加える G P S部を備え、前記サーバは、各施設の位置を格納した地図データを備え、前記サーバの処理制御部が、受信した前記現在位置に基づいて前記地図データを参照することにより当該携帯端末を所持するユーザが現在いる施設を特定し、当該サーバ内で用いる各種の辞書を特定された前記施設に対応する専用辞書に置き換えるようにしたものである。

第 1 1の発明に係る携帯端末型翻訳システムは、携帯端末の処理指示部が、ユーザにより専用辞書の種類を指定できるように構成し、指定された前記専用辞書の種類をサ一バに送信するデータに加え、前記サーバの処理制御部が、受信した前記専用辞書の種類に基づいて当該サーバ内で用 T JP02/12281

9 いる各種の辞書を指定された専用辞書に置き換えるようにしたものである。

第 1 2 の発明に係る携帯端末型翻訳システムは、携帯端末は、，画像バッファに蓄積されたカラ一画像あるいはダレ一スケール画像から文字列と背景を分離するように二値化した前処理後画像を作成し前記画像バッファに蓄積する画像前処理部を備え、前記前処理後画像をサーバに送信して翻訳結果を得るようにしたものである。

第 1 3 の発明に係る携帯端末型翻訳システムは、携帯端末が、前処理後画像にノイズが含まれる場合にはキー入力により前記ノイズを囲むノイズ除去対象領域を指定できるように構成され、画像前処理部が、前記ノイズ除去対象領域内の黒画素を白画素に変換して前処理後画像を編集するようにしたものである。

第 1 4の発明に係る携帯端末は、翻訳処理を行うサーバとデータ交換を行う携帯端末であって、画像撮像部と、この画像撮像部により撮像した画像を蓄積する画像バッファと、キーワードを入力するキー入力部と、前記サ一バへ依頼する処理サービスの種類を指定する処理指示部と、前記画像バッファに蓄積された画像あるいは入力されたキ一ヮ —ド、指定した前記処理サービスの種類および前記携帯端末の関連情報からなるデ一夕を前記サーバに送信するデ一夕送信部と、前記サ一バにおいて認識された認識文字列および翻訳処理された翻訳結果を受信する結果受信部と、受信した前記翻訳結果を表示する表示部とを備えたものである。第 1 5の発明に係る携帯端末は、翻訳処理を行うサーバとデータ交換を行う携帯端末であって、画像撮像部と、この画像撮像部により撮像した画像を蓄積する画像バッファと、前記サーバへ依頼する処理サービスを指示する処理指 - 示部と、前記画像バッファに蓄積された画像、前記処理サ一ビスの指示および前記携帯端末の関連情報からなるデ一夕を前記サーバに送信するデータ送信部と、前記サーバにおいて認識された認識文字列および翻訳処理された翻訳結果を受信する結果受信部と、受信した前記翻訳結果を表示する表示部とを備えたものである。

第 1 6の発明に係る携帯端末は、翻訳処理を行うサーバとデータ交換を行う携帯端末であって、キーワードを入力するキー入力部と、前記サーバへ依頼する処理サ一ビスを指示する処理指示部と、入力されたキーワード、前記処理サービスの指示および前記携帯端末の関連情報からなるデ一夕を前記サーバに送信するデ一夕送信部と、前記サーバにおいて翻訳処理された翻訳結果を受信する結果受信部と、受信した前記翻訳結果を表示する表示部とを備えたものである。

第 1 7の発明に係る携帯端末は、画像撮像部により一定の時間間隔で連続的に撮像され画像バッファに蓄積した各画像を順次選択してデータ送信部に出力する送信画像制御部を備え、表示部が、サーバから順次受信する前記各画像に含まれる文字列の各翻訳結果を逐次表示するようにしたものである。

第 1 8の発明に係る携帯端末は、送信制御部が、画像バッファから順次読み出す画像について、新しく撮像された画像とその一つ前に撮像された画像との差を比較し、その差が閾値以下となった場合に前記新しく撮像された画像を選択してデ一夕送信部に出力するようにしたものである。

第 1 9の発明に係る携帯端末は、 G P S機能により当該携帯端末の現在位置を取得してサーバに送信するデ一夕に加える G P S部を備えたものである。

第 2 0の発明に係る携帯端末は、サーバ内で使用する専用辞書の種類をユーザにより指定できるように構成し、指定された前記専用辞書の種類をサーバに送信するデータに加えるようにしたものである。

第 2 1 の発明に係る携帯端末は、画像バッファに蓄積されたカラー画像あるいはグレースケール画像から文字列と背景を分離するように二値化した前処理後画像を作成し前記画像バッファに蓄積する画像前処理部を備え、前記画像バッファから読み出した前記前処理後画像をサーバに送信して翻訳結果を得るようにしたものである。

第 2 2 の発明に係る携帯端末は、前処理後画像にノイズが含まれる場合にはキ一入力により前記ノイズを囲むノィズ除去対象領域を指定できるように構成され、画像前処理部が、前記ノイズ除去対象領域内の黒画素を白画素に変換して前処理後画像を編集するようにしたものである。

第 2 3 の発明に係るサーバは、携帯端末とデータ交換を行うサーバであって、前記携帯端末から送信された画像あるいはキー入力されたキーワード、指定された処理サ一ビスの種類および前記携帯端末の関連情報からなるデータを受信するデータ受信部と、受信した前記画像に含まれる 1 個の文字列に対して複数個の文字列を抽出し、抽出した前記複数個の文字列を翻訳してそれぞれの翻訳結果を生成する画像内文字列認識 · 翻訳部と、前記キーワードに対する関連文を生成し、生成した前記関連文を翻訳して翻訳結果を生成するテキスト翻訳部と、前記指定された処理サ一ビスの種類に従って前記画像内文字列認識 · 翻訳部で処理するか、あるいは前記テキスト翻訳部で処理するかを切り替え制御する処理制御部と、前記画像内文字列認識 · 翻訳部あるいは前記テキスト翻訳部で生成した翻訳結果を前記関連情報に基づいて前記携帯端末に送信する結果送信部とを備えたものである。

第 2 4の発明に係るサーバは、携帯端末とデータ交換を行うサーバであって、前記携帯端末から送信された画像、処理サービスの指示および前記携帯端末の関連情報からなるデータを受信するデ一夕受信部と、受信した前記画像に含まれる 1個の文字列に対して複数個の文字列を抽出し、抽出した前記複数個の文字列を翻訳してそれぞれの翻訳結果を生成する画像内文字列認識 · 翻訳部と、受信したデ一夕に含まれる前記処理サービスの指示に従って前記画像内文字列認識 · 翻訳部を動作させる処理制御部と、俞記画像内文字列認識 · 翻訳部あるいは前記テキスト翻訳部で生成した翻訳結果を前記関連情報に基づいて前記携帯端末に送信する結果送信部とを備えたものである。

第 2 5の発明に係るサーバは、携帯端末とデータ交換を行うサーバであって、キー入力されたキーワード、処理サ一ビスの指示および前記携帯端末の関連情報からなるデ一夕を受信するデータ受信部と、前記キーワードに対する関連文を生成し、生成した前記関連文を翻訳して翻訳結果を生成するテキスト翻訳部と、受信したデ一夕に含まれる前記処理サービスの指示に従って前記テキスト翻訳部を動作させる処理制御部と、前記テキスト翻訳部で生成した翻訳結果を前記関連情報に基づいて前記携畨端末に送信する結果送信部とを備えたものである。

第 2 6の発明に係るサーバは、画像内文字列認識 · 翻訳部が、，異なる複数の条件で画像内の 1個の文字列を認識することにより複数個の文字列認識結果を生成する画像内文字列認識部と、生成した前記複数個の文字列認識結果をそれぞれ翻訳した複数個の翻訳結果を生成する画像内文字列翻訳部とを有したものである。

第 2 7の発明に係るサーバは、画像内文字列認識 · 翻訳部が、異なる複数の条件で画像内の 1個の文字列を認識す . ることにより複数個の文字列認識結果を生成すると共に、言語辞書を用いて前記複数個の文字列認識結果に対してスペリングが類似する類似文字列を生成する画像内文字列認識部と、生成した前記文字列認識結果と前記類似文字列のそれぞれを翻訳することにより複数個の翻訳結果を生成する画像内文字列翻訳部とを有したものである。

第 2 8の発明に係るサーバは、テキスト翻訳部が、キ一入力部で入力したキ一ワードに基づいて関連文辞書を参照して前記キーワードに関連性の高い複数個の文章を生成する関連文生成部と、生成された前記複数個の文章を翻訳することにより翻訳結果を生成する関連文翻訳部とを有したものである。

第 2 9の発明に係るサーバは、連続的に受信された複数個の画像を合成して 1枚の合成画像を作成する画像統合部を備え、画像内文字列認識 · 翻訳部が、作成された前記合成画像に含まれる文字列に対する翻訳結果を生成するようにしたものである。

第 3 0の発明に係るサーバは、各施設の位置を格納した地図データを備え、処理制御部が、受信したデータに含まれる携帯端末の現在位置に基づいて前記地図データを参照することにより当該携帯端末を所持するユーザが現在いる施設を特定し、当該サ一バ内で用いる各種の辞書を特定された前記施設に対応する専用辞書に置き換えるようにしたものである。

第 3 1 の発明に係るサーバは、処理制御部が、受信したデータに含まれる指定された専用辞書の種類に基づいて当該サーバ内で用いる各種の辞書を指定された専用辞書に置き換るようにしたものである。図面の簡単な説明

図 1 は本発明の実施例 1 による携帯端末型翻訳システムの構成を示すブロック図、

図 2は本発明の実施例 1 に係る画像の撮像状況を説明する説明図、

図 3は本発明の実施例 1 に係る画像内文字列認識部の処理手順を示すフローチヤ一ト、図 4は本発明の実施例 1 に係る画像内文字列認識部の動作例を説明する説明図、

図 5は本発明の実施例 1 に係る誤りを含む文字認識処理の例を説明する説明図、

図 6は本発明の実施例 1 に係る画像内文字列翻訳部の動作例を説明する説明図、

図 7は本発明の実施例 1 に係る画像内文字列翻訳結果生成部の動作例を説明する説明図、

図 8は本発明の実施例 1 に係る画像内文字列翻訳結果の表示例を示す説明図、

図 9は本発明の実施例 1 に係るキーワード入力の表示例を示す説明図、

図 1 0は本発明の実施例 1 に係る関連文辞書の構成例を示す説明図、

図 1 1 は本発明の実施例 1 に係る関連文翻訳部の動作例を説明する説明図、

図 1 2は本発明の実施例 1 に係る関連文翻訳結果の例を示す説明図、

図 1 3は本発明の実施例 1 に係る関連文翻訳結果の表示例を示す説明図、

図 1 4は本発明の実施例 2による携帯端末型翻訳システムの構成を示すブロック図、

図 1 5は本発明の実施例 2および実施例 3 に係る画像の撮像状況を示す説明図、

図 1 6は本発明の実施例 2および実施例 3 に係る連続的に撮像された画像例を示す説明図、図 1 7 は本発明の実施例 2 に係る送信画像制御部の動作を説明する説明図、

図 1 8は本発明の実施例 3 による携帯端末型翻訳システムの構成を示すブロック図、

図 1 9は本発明の実施例 3 に係る画像統合部の動作を説明する説明図、

図 2 0は本発明の実施例 4による携帯端末型翻訳システムの構成を示すブロック図、

図 2 1 は本発明の実施例 4に係る認識条件指定の例を示す説明図、

図 2 2は本発明の実施例 5 による携帯端末型翻訳システムの構成を示すプロック図、

図 2 3は本発明の実施例 5 に係る画像前処理部の動作を説明する説明図、

図 2 4は本発明の実施例 5 に係る画像補正処理を説明する説明図、

図 2 5は従来の技術による携帯端末型画像処理システムに係る処理手順を示すフローチャートである。発明を実施するための最良の形態

実施例 1 .

図 1 は本発明の実施例 1 による携帯端末型翻訳システムの構成を示すブロック図である。図において、 1 0 1 は携帯端末、 1 0 2はデータ送信部、 1 0 3はキー入力部、 1 0 4は処理指示部、 1 0 5は画像撮像部、 1 0 6は画像バッファ、 1 0 7は表示部、 1 0 8は結果受信部である。 1 0 9はサーバ、 1 1 0はデータ受信部、 1 1 1 は結果送信部、 1 1 2は処理制御部、 1 1 3は画像内文字列認識 · 翻訳部、 1 1 9はテキスト翻訳部である。画像内文字列認識 - 翻訳部 1 1 3 において、 1 1 4は画像内文字列認識部、 1 1 5は画像内文字列翻訳部、 1 1 6は画像内文字列翻訳結果生成部、 1 1 7は認識辞書、 i 1 8は言語辞書、 1 2 4 は第 1翻訳辞書である。テキスト翻訳部 1 1 9に,おいて、 1 2 0は関連文生成部、 1 2 1 は関連文翻訳部、 1 2 2は関連文翻訳結果生成部、 1 2 3は関連文辞書、 1 2 5は第 2翻訳辞書である。

図 2は画像の撮像状況を説明する説明図であり、 2 0 1 は文書、 2 0 2はカメラ視野である。図 3は画像内文字列認識部の処理手順を示すフローチャートである。図 4は画像内文字列認識部の動作例を説明する説明図で、 4 0 1 は撮像画像、 4 0 2は前処理後画像、 4 0 3は抽出文字列、 4 0 4は切出した文字パターン、 4 0 5は文字認識結果である。図 5は誤りを含む文字認識処理の例を説明する説明図で、 5 0 1 は切出した文字パターン、 5 0 2は誤りを含む文字認識結果である。図 6 は画像内文字列翻訳部の動作例を説明する説明図で、 6 0 1 は文字列認識結果、 6 0 2 は類似文字列、 6 0 3は文字列認識結果 6 0 1 を翻訳した文字列翻訳結果、 6 0 4は類似文字列 6 0 2の文字列翻訳結果である。

図 7は画像内文字列翻訳結果生成部の動作例を説明する説明図で、 7 0 1 は画像内文字列翻訳結果の例である。図 8は画像内文字列翻訳結果の表示例を示す説明図で、 8 0 1は認識文字列画像、 8 0 2は画像内文字列翻訳結果の画像である。図 9はキーワード入力の表示例を示す説明図で、 9 0 1はキ一ヮ一ド入力エリア、 9 0 2は翻訳ポタン表示である。図 1 0は関連文辞書の構成例を示す説明図で、 1 0 0 1 は関連文辞書データである。図 1 1 は関連文翻訳部の動作例を説明する説明図で、 1 1 0 1は入力テキスト、 1 1 0 2は関連文、 1 1 0 3， 1 1 0 4は文字列翻訳結果である。図 1 2は関連文翻訳結果生成部の動作例を説明する説明図で、 1 2 0 1 は関連文翻訳結果生成部の出力結果である。図 1 3は関連文翻訳結果の表示例を示す説明図で、 1 3 0 1 は翻訳結果である。

次に動作について説明する。

ごの翻訳システムは携帯端末 1 0 1 とサーバ 1 0 9で構成される。この携帯端末 1 0 1 は、サーバ 1 0 9 とデ一夕を送受信する通信機能を備え'ており、サ一バ 1 0 9 に処理を依頼して、その処理結果を受信して表示することができる。この携帯端末 1 0 1'とサ一バ 1 0 9間の通信は、無線でデータを送受信する方式や赤外線通信でデ一夕を送受信する方式または有線でデータを送受信する方式により行う。ここで、サーバ 1 0 9は 2つのサ一ビスを有する。一つは携帯端末の画像撮像部 1 0 5より撮像した画像に含まれる文字列を翻訳'するサービスであり、以降これを画像内文字列認識 · 翻訳サービスと呼ぶ。もう一つは、携帯端末のキ —入力部 1 0 3より入力したテキストの内容を翻訳するサ一ビスであり、以降、これをテキスト翻訳サービスと呼ぶ。画像内文字列認識 · 翻訳サービスの動作を説明する。ユーザは携帯端末 1 0 1 の画像撮像部 1 0 5 により文字列を含む画像を撮像する。例えば、図 2 に示すように携帯端末 1 0 1 を文書 2 0 1 の前に近づけて、カメラ視野 2 0 2の範囲を 1枚の画像として撮像する。この画像撮像部 1 0 5は、携帯端末 1 0 1 に付属または接続された画像撮像機能を持つ C C Dや C M O Sセンサ等を備えたカメラであり、撮像した画像はカラ一画像もしくはダレ一スケール画像である。また、撮像する対象は文書の一部あるいは看板や案内板等情景中の文字である。画像撮像部 1 0 5で撮像された画像は画像バッファ 1 0 6 に蓄積される。

次に、処理指示部 1 0 4はサーバ 1 0 9で行う処理サ一ビスの種類を指定する。この指定は、キー入力部 1 0 3からユーザが行うか、またはデフォルトの設定を用いて自動的に行うようになっている。ここでは、処理サービスの種類として、. 画像内文字列認識 · 翻訳を指定する。処理指示部 1 0 4により処理サービスが指定されると、デ一夕送信部 1 0 2は、画像バッファ 1 0 6 に蓄積された画像、処理指示部 1 0 4で指定した処理サービスの種類および携帯端末 1 0 1 に関する関連情報（例えば、機種コード等）からなるデータをサーバ 1 0 9 に送信する。

サーバ 1 0 9では、データ受信部 1 1 0 により携帯端末 1 0 1 のデ一夕送信部 1 0 2から送信されたデータを受信すると、処理制御部 1 1 2 に入力する。

処理制御部 1 1 2は、指定した処理サービスの種類に応じて以降の処理内容を切り替える。ここでは、前述したように画像内文字列認識 ·翻訳サービスを指定しているので、画像内文字列認識 · 翻訳部 1 1 3が動作するように制御される。仮に処理指示部 1 0 4でテキスト翻訳サービスが指定されている場合には、テキスト翻訳部 1 1 9が動作するように制御されることになる。

画像内文字列認識 · 翻訳部 1 1 3では、まず画像内文字列認識部 1 1 4が動作し、携帯端末 1 0 1から送信されたデータの画像内の文字列を認識する。この画像内文字列認識部 1 1 4の具体的な動作を図 3の処理手順に従い説明する。

まず、携帯端末 1 0 1から送信された画像に対して前処理を行い（ステップ S T 2 1 )、画像内の文字列と背景を分離した前処理後画像を作成する。例えば、携帯端末 1 0 1 から図 4に示すようなカラーの撮像画像 4 0 1が送信された場合、この撮像画像 4 0 1 に前処理を適用することで、背景を白色、文字列を黒色とした白黒の前処理後画像 4 0 2 を得る。このような前処理の実現方法については、論文 T e x t e x t r a c t i o n f r o m c o l o r d o c u m e n t s 一 c l u s t e r i n g a p p r o a c h e s i n t h r e e a n d f o u r d i m e n s i o n s ", T . P e r r o u d , K . S o b o t t k a , H . B u n k e , I n t e r n a t i o n a l C o n f e r e n c e o n D o c u m e n t A n a l y s i s a n d R e c o g n i t i o n ( 2 0 0 1 ) に開示されている。

次に、前処理後画像から抽出して抽出文字列を得る（ステツプ S T 2 2 )。例えば、図 4の前処理後画像 4 0 2から抽出文字列 4 0 3 を抽出する。このような白黒の画像から文字列を抽出する処理には、従来の O C Rで既に実現されている方式が用いられる。ステップ S T 2 2で抽出した抽出文字列の内容を文字認識する（ステップ S T 2 3 )。文字認識の方法としては、文字列を構成する 1文字のパターンを切出し、切出したパターンを認識辞書 1 1 7 と比較して文字コードに変換する方法が広く知られている。ここで、切出したパターンを文字コードに変換する際に、言語辞書 1 1 8を参照することにより、言語的に整合性の高い文字認識結果を得ることができる。この方法も一般的である。例えば、図 4に示す抽出文字列 4 0 3 に本処理を適用した場合、まず 1文字づっ切出した文字パターン 4 0 4を得、それら文字パターン 4 0 4を文字コードに変換することで、テキスト化された文字認識結果 4 0 5 を得る。

以上の処理により、画像内の文字列に対する文字列認識結果（テキスト）を得ることができる。ただし、対象とする画像の解像度が低く、品質の悪い場合や、認識対象とする文字列が飾り文字である場合には、文字認識結果を誤ることが多い。例えば図 5に示すように、切出した文字バタ —ン 5 0 1 に誤りが生じ、その結果として誤った文字認識結果 5 0 2 を得ることがある。この問題に対処するため、処理パラメ一夕を変更してステップ S T 2 1 〜 S T 2 3の処理を複数回繰り返し、複数個の文字認識結果を得る（ステツプ S T 2 4 )。例えば、図 4の抽出文字列 4 0 3に対して処理パラメータを変えてステップ S T 2 1 〜 S T 2 3の処理を 2回繰り返すことで、図 6で示すように、 2個の文字列認識結果 6 0 1 として " S t r a t e g i c " と " S t r a n g e r " を得る。このように、複数個の文字列認識結果を取得すれば、その中に正解の文字列認識結果が含まれる可能性は高い。しかし、ステップ S T 2 4で得た複数個の文字列認識結果にも正解が含まれない場合がある。そこで、言語辞書 1 1 8 を参照して、ステップ S T 2 4で得た複数個の文字列認識結果とスペリングが類似した文字列を複数個抽出する（ステップ S T 2 5 )。例えば図 6 に示すように、ステップ S T 2 4で得た 2個の文字列認識結果 6 0 1 から、スペリングの類似した 3個の類似文字列 6 0 2を作成する。 '

画像内文字列認識部 1 1 4は、ステップ S T 2 4で得た複数個の文字列認識結果とステップ S T 2 5で得た複数個の類似文字列とを合せて画像内文字列翻訳部 1 1 5 に出力する（ステップ S T 2 6 )。このように複数個の文字列認識結果とそれらの文字列認識結果に対する複数個の類似文字列とを出力するため、その中に正解の文字列認識結果が含まれる可能性が一層高くなる。以上が画像内文字列認識部 1 1 4の動作である。

次に画像内文字列翻訳部 1 1 5は、翻訳に必要な情報を格納した第 1翻訳辞書 1 2 4を参照して、画像内文字列認識部 1 1 4で得た複数個の文字列認識結果を翻訳し、文字列翻訳結果を得て画像内文字列翻訳結果生成部 1 1 6 に出力する。この翻訳処理は、例えば図 6 に示すように、画像内文字列認識部 1 1 4で得た文字列認識結果 6 0 1 と類似文字列 6 0 2 に対して、それぞれ翻訳した文字列翻訳結果 6 0 3， 6 0 4を得る。

画像内文字列翻訳結果生成部 1 1 6は、画像内文字認識部 1 1 4で得た文字列認識結果と類似文字列、および画像内文字列翻訳部 1 1 5で得た文字列翻訳結果をまとめ、携帯端末 1 0 1 に対して送信するためのデータとして画像内文字列翻訳結果を作成する。例えば、図 7の画像内文字列翻訳結果 7 0 1 は、図 4に示す撮像画像 4 0 1 に対して得られたものである。この画像内文字列翻訳結果 7 0 1 は、前処理後画像 4 0 2から切出した抽出文字列 4 0 3の位置座標（例えば、文字列を囲む外接矩形の左上点 x， y座標と外接矩形の幅 w、高さ h ) を持つ。加えて、画像内文字認識部 1 1 4で得た文字列認識結果と類似文字列、および画像内文字列翻訳部 1 1 5で得た文字列翻訳結果を持つ。

サーバ 1 0 9は、画像内文字列翻訳結果生成部 1 1 6で作成した文字列翻訳結果を結果送信部 1 1 1から携帯端末 1 0 1 に送信する。

ここで文字列認識結果と類似文字列、および文字列翻訳結果のデ一夕形式はテキストか、または画像である。例えば、携帯端末 1 0 1が文字列認識結果を構成する言語の文字を表示する機能を持たない場合、その文字列認識結果の描かれた画像を画像内文字列翻訳結果に用いる。同様に、携帯端末 1 0 1が文字列翻訳結果を構成する言語の文字を表示する機能を持たない場合、その文字列翻訳結果の描かれた画像を画像内文字列翻訳結果に用いる。ここで、携帯端末 1 0 1が特定の言語の文字を表示する機能を持つか否かの判定は、携帯端末 1 0 1 の持つデータ送信部 1 0 2から送信された携帯端末に関する関連情報（機種コード等）に基づいて行う。

次に、携帯端末 1 0 1では、まず結果受信部 1 0 8が、サーバ 1 0 9の結果送信部 1 1 1から送信された画像内文字列翻訳結果を受信する。その後、表示部 1 0 7は、画像バッファ 1 0 6 に蓄積した撮像画像と受信した画像内文字列翻訳結果を基に、撮像画像に含まれる文字列の翻訳結果を表示部 1 0 7 に表示する。この表示部 1 0 7は、液晶デイスプレイ等の文字や画像を表示することのできる表示装置である。例えば図 8 に示すように、表示部 1 0 7上に認識した文字列を表す認識文字列画像 8 0 1 を表示し、同時に、文字列認識結果、類似文字列および文字列翻訳結果からなる画像内文字列翻訳結果の画像 8 0 2 を表示する。以上が、画像内文字列認識 · 翻訳サービスの実行例である。テキスト翻訳サービスの動作'を説明する。

携帯端末 1 0 1 において、まずユーザがキー入力部 1 0 3により、翻訳したいテキストを入力する。ただし、一般の携帯端末ではテキストの入力に手間を要するため、ここではテキストの内容に関連したキーワードを入力する。例えば「次のバスは何時に出発しますか？」というテキストを翻訳したい場合、キーワードとして「バス」と「時間」を入力する。図 9は携帯端末でキーワードを入力した例であり、入力したキーワードが表示部 1 0 7上のキ一ワード入力エリア 9 0 1 に表示されている。キーワードを入力した後、ユーザがキー入力部 1 0 3 を操作して表示部 1 0 7 上に表示された翻訳ボタン表示 9 0 2 を実行すると、翻訳のための処理を開始する。

処理指示部 1 0 4はサーバ 1 0 9で行う処理サ一ビスの種類を指定する。ここでは処理サービスの種類として、テキスト翻訳サ一ビスを指定する。すると、データ送信部 1 0 2は、キ一ワード入力エリア 9 0 1 に入力されたキ一ヮード、処理指示部 1 0 4で指定した処理サービスの種類および携帯端末 1 0 1 に関する関連情報（例えば、機種コード等）をサーバ 1 0 9 に送信する。

サーバ 1 0 9 において、データ受信部 1 1 0が携帯端末 '1 0 1 のデータ送信部 1 0 2から送信されたデータを受信し、処理制御部 1 1 2 に入力する。処理制御部 1 1 2は、処理指示部 1 0 4で指定した処理サービスの種類に応じて以降の処理内容を切り替える。ここでは、処理指示部 1 0 4でテキスト翻訳サービスが指定されているため、テキスト翻訳部 1 1 9が動作するように制御する。

テキスト翻訳部 1 1 9では、まず関連文生成部 1 2 0が動作し、携帯端末 1 0 1 から送信されたキーワードと関連文辞書 1 2 3のデ一夕とを基に、キーワードから類推される文章（以降、関連文と呼ぶ）を生成する。ここで関連文辞書 1 2 3は、例えば図 1 0 に示すような関連文辞書デー夕 1 0 0 1 を持つ。この関連文辞書デ一夕は多数の関連文と、その索引を格納したものである。関連文生成部 1 2 0 は、この索引とデータ送信部 1 0 2から送信されたキーヮ一ドとを比較し、索引にキーワードを含む関連文を関連文辞書 1 2 3から読み出し関連文翻訳部 1 2 1 に出力する。例えば、キーワードが「バス」と「時間」の場合、関連文辞書デ一夕 1 0 0 1 における関連文 N o . 1 「次のバスはいつ出発しますか？」と関連文 N o . 2 「バスでどれくらい時間がかかりますか？」を出力する。

関連文翻訳部 1 2 1 は、データ送信部 1 0 2から送信されたキ一ワードと関連文生成部 1 2 0で得た関連文を、第 2翻訳辞書 1 2 5を用いて翻訳する。例えば、図 1 1 に示すキーワードに該当する入力テキスト 1 1 0 1 と関連文 1 1 0 2 に対して翻訳処理を行い、それぞれ文字列翻訳結果 1 1 0 3 , 1 1 0 4を得て関連文翻訳結果生成部 1 2 2 に出力する。このようなテキストを翻訳する機能は、一般の翻訳ソフトで既に実現されている方法である。

関連文翻訳結果生成部 1 2 2 は、データ送信部 1 0 2から送信されたキーワード、関連文生成部 1 2 0で得た関連文および関連文翻訳部 1 2 1で得た文字列翻訳結果をまとめて、携帯端末 1 0 1 に送るデータとして関連文翻訳結果を作成し、結果送信部 1 1 1 に出力する。例として、図 1 2の関連文翻訳結果 1 2 0 1が示される。ここには、「キ一ワードと関連文」およびそれらの「翻訳結果」が対応付けて格納されている。

結果送信部 1 1 1 は、関連文翻訳結果生成部 1 2 2で作成した関連文翻訳結果を携帯端末 1 0 1 に送信する。

ここで、翻訳結果のデータ形式は、テキストか画像である。例えば、携帯端末 1 0 1が翻訳結果を構成する言語の文字を表示する機能を持たない場合、その翻訳結果の描かれた画像を関連文翻訳結果に用いる。ここで、携帯端末 1 0 1が特定の言語の文字を表示する機能を持つか否かの判定は、携帯端末 1 0 1 の持つデータ送信部 1 0 2から送信された携帯端末に関する関連情報（機種コード等）に基づいて行う。

携帯端末 1 0 1 は、結果受信部 1 0 8 により関連文翻訳結果を受信し、表示部 1 0 7 に与える。表示部 1 0 7は、受信した関連文翻訳結果の内容を表示する。例えば図 1 3 に示すように、表示部 1 0 7はテキスト、関連分およびそれらの翻訳結果からなる翻訳結果 1 3 0 1が表示される。以上が、テキスト翻訳サ一ビスの実行例である。

以上のように、この実施例 1 によれば、画像内文字列に対する翻訳と入力したテキストに対する翻訳の両方に対応できるシステムを実現する効果が得られる。画像内文字列認識 · 翻訳サービスにおいて、画像内文字列認識部 1 1 4 は、画像内の文字列から複数個の文字認識結果と複数個の類似文字列を作成し、画像内文字列翻訳部 1 1 5では、それら複数個の文字認識結果と複数個の類似文字列に対するそれぞれの翻訳結果を作成し、これら複数個の翻訳結果を携帯端末 1 0 1 に送信して表示部 1 0 7 に表示するようにしたので、文字認識が困難で解像度が低い品質の悪い画像内の文字や飾り文字に対しても正解率の高い翻訳結果を出せる効果が得られる。また、テキスト翻訳サービスでは、携帯端末 1 0 1で入力したキ一ワードから複数個の関連文を生成し、それらの翻訳結果を携帯端末 1 0 1 の表示部 1 0 7 に表示するようにしたので、翻訳したい全てのテキストを入力する必要がなく、面倒なテキスト入力の手間を削減できると共に、正解率の高い要求する文章の翻訳結果を得ることができる効果が得られる。実施例 2 .

次に本発明の別の実施例に係る画像内文字列認識 · 翻訳サービスについて説明する。上記実施例 1 の画像内文字列認識 · 翻訳サ一ビスでは、ユーザが携帯端末 1 0 1で 1枚の画像を撮像した後、その画像をサーバ 1 0 9に送信して、その画像内に含まれる文字列の翻訳結果を得る。そのため、一度.に多数の文字列を翻訳する場合、ユーザは翻訳したい文字列上にカメラの視野を移動させてシャッターを押す作業を何度も繰り返す必要があり、手間を要する。この課題は、ュ一ザが撮像を開始すると、その後は一定の時間間隔で自動的に撮像を行い、その撮像した画像を逐次サーバ 1 0 9で翻訳することにより、半リアルタイムに翻訳結果を得るようにできれば解決できる。実施例 2 はこれを実現するものである。

実施例 2について図 1 4から図 1 7 を用いて説明する。図中、実施例 1 の各図と共通な部分は同一の符号を付し、その説明を原則として省略する。図 1 4は実施例 2 による携帯端末型翻訳システムの構成を示すブロック図で、 1 4 0 1 は送信画像制御部である。図 1 5は連続的な画像の撮像状況を示す説明図で、 1 5 0 1はカメラ視野、 1 5 0 2 はカメラ視野の移動軌跡である。図 1 6は連続的に撮像された画像例を示す説明図で、 1 6 0 1 は連続的に撮像した画像である。図 1 7は送信画像制御部の動作を説明する説明図で、 1 7 0 1 は分割領域である。次に動作について説明する。

携帯端末 1 0 1 において、画像内文字列認識 · 翻訳サービスを実行する際、画像撮像部 1 0 5が文字列を含む画像を撮像する。実施例 1 と異なり、画像撮像部 1 0 5は 1度画像を撮像した後、一定の時間間隔で連続的に画像を撮像する。画像撮像部 1 0 5で撮像した画像は、毎回、画像バッファ 1 0 6 に蓄積される。この画像バッファ 1 0 6 には 1枚以上の画像を蓄積することができる。次に、送信画像制御部 1 4 0 1は、まず画像バッファ 1 0 6 に蓄積された画像の 1枚を選択するが、この段階では、最初に撮像された画像を選択する。処理指示部 1 0 4は、実施例 1 と同様にサーバ 1 ひ 9で行う処理サ一ビスの種類を指定する。ここでは、処理サービスの種類として画像内文字列認識 · 翻訳を指定することとする。 '

データ送信部 1 0 2 は、送信画像制御部 1 4 0 1で選択した画像、処理指示部 1 0 4で指定した処理サ一ビスの種類および携帯端末 1 0 1 に関する関連情報（例えば、機種コード等）をサーバ 1 0 9に送信する。

サーバ 1 0 9では、実施例 1 と同様に、データ送信部 1 0 2で送信した撮像画像に含まれる文字列を翻訳して、その処理によって得られた画像内文字列翻訳結果を携帯端末 1 0 1 に送信する。その後、実施例 1 と同様に、携帯端末 1 0 1 において、結果受信部 1 0 8がサーバ 1 0 9からの画像内文字列翻訳結果を受信して表示部 1 0 7 により受信した翻訳結果を表示する。

次に、携帯端末 1 0 1 において、送信画像制御部 1 4 0 1は画像バッファ 1 0 6に蓄積された別の画像（今翻訳した画像の次に撮像された画像）を選択し、同様にサ一パ 1

0 9 に対して画像内文字列認識 · 翻訳サ一ビスを依頼し、その翻訳結果を受け取って表示部 1 0 7 に表示する。以降、画像バッファ 1 0 6 に蓄積された残りの画像に対して、同様に一連の処理を順次繰り返す。

上記の一連の処理を繰り返している間、翻訳したい文章を全て撮像するために、携帯端末 1 0 1 のカメラ視野 1 5 0 1 を、図 1 5 に示すように移動軌跡 1 5 0 2 に従って移動させていたとする。その結果、図 1 6 に示すような 1 1 個の撮像画像 1 6 0 1が得られる。 t は時間を表し、 t = 0が最初に撮像された画像を示し、 t = 1 0が最後に撮像された画像を示す。これら各々の撮像画像 1 6 0 1は、サ —バ 1 0 9に送信され、最初に撮像された画像から順番に逐次翻訳され、その各翻訳結果が携帯端末 1 0 1 の表示部 1 0 7上に表示される。

なお、ここで送信画像制御部 1 4 0 1 は、撮像された順に全ての画像を選択すると説明したが、全ての画像を選択してサーバ 1 0 9に画像内文字列認識 · 翻訳サービスを依頼することは、送信するデータ量の増加と、サーバ 1 0 9 の処理量増加を招く。そこで、別の基準に従って選択する画像を絞り込んでも良い。例えば、送信画像制御部 1 4 0 1 は、画像バッファ 1 0 6に蓄積された画像に対して、図 1 7 に示すように、縦と横に N等分した分割領域 1 7 0 1 を作成し、分割領域毎の輝度を求める。そして、新しく撮像された画像と、その一つ前に撮像された画像とで分割領域毎の輝度値の差を計算し、差の合計値が閾値以下となる場合に、新しく撮像された画像を選択する。これにより、カメラの移動が停止した時点で撮像された画像のみが選択され、ユーザが翻訳したい文字列を含む画像のみをサーバに送信することができる。図 1 7の例では、時間 t = 1、 t = 5、 t = 7、 t = 1 0 の撮像画像 1 6 0 1が選択されることになる。

以上のように、実施例 2 によれば、ユーザが撮像を開始すると、その後は一定の時間間隔で自動的に撮像を行い、サーバ 1 0 9側で、その撮像した画像を逐次翻訳する。これにより、一度に多数の文字列を翻訳する場合、ユーザは翻訳したい文字列上にカメラの視野を移動させてシャツ夕一を押す作業を何度も繰り返す必要がなく、ユーザの手間を削減すると共に、半リアルタイムに翻訳結果を得ることができる効果が得られる。また、送信画像制御部 1 4 0 1 は、撮像された画像とその一つ前に撮像された画像との間で画像の変化量を求め、その変化量が閾値以下の場合となる画像を選択してサーバ 1 0 9 に送信するので、ユーザが翻訳したい文字列を含む画像のみに対する翻訳結果を得る ' ことができ、かつデータ送信量とサーバ 1 0 9の処理量を削減する効果が得られる。実施例 3 .

上記実施例 1 と 2 の画像内文字列認識 · 翻訳サービスでは、翻訳したい文字列を 1枚の画像内に含む必要がある。しかし、携帯端末 1 0 1 のカメラで撮像した画像は解像度が低いため、長い文字列や文章を 1枚の画像内に納めることが困難である。そのため翻訳可能な文字列の長さが制限されることになる。このような課題は、携帯端末 1 0 1 から文字列や文章の断片を撮像した複数枚の画像をサーバ 1 0 9 に送信し、サーバ 1 0 9側で、これらの複数枚の画像から 1枚の大きな合成画像を作成し、この合成画像に含まれる文字列を翻訳するようにすれば解決できる。実施例 3 はこれを実現するものである。

以下、この発明の実施例 3 について図 1 5、図 1 6、図 1 8および図 1 9 を用いて説明するが.、図中、実施例 1 と 2の各図と共通な部分は同一の符号を付し、その説明を原則的には省略する。図 1 8はこの発明の実施例 3 による携帯端末型翻訳システムの構成を示すブロック図で、 1 8 0 1 は画像統合部である。図 1 9は画像統合部の動作例を説明する説明図で、 1 9 0 1は合成画像、 1 9 0 2 は合成画像に対応する前処理後画像、 1 9 0 3は抽出文字列、 1 9 0 4は文字列認識結果、 1 9 0 5は類似文字列である。次に動作について説明する。

画像内文字列認識 · 翻訳サービスを実行する際、まず携帯端末 1 0 1では、実施例 2 と同様に一定の時間間隔で画像を取得し、それら複数の画像を画像バッファ 1 0 6 に蓄積する。例えば、図 1 5に示したようにカメラ視野の移動軌跡 1 5 0 2に従ってカメラ視野 1 5 0 1 を移動させた場合、複数個の撮像画像 1 6 0 1が画像バッファ 1 0 6に蓄積される。

次に、処理指示部 1 0 4はサーバ 1 0 9で行う処理サービスの種類を指定する。ここでは処理サービスの種類として画像内文字列認識 · 翻訳サービスを指定すると共に、その実行条件として「合成画像を作成する」と指定する。この指定は、キー入力部 1 0 3から人間が行うか、もしくはデフォルトの設定を用いて自動的に行う。これにより、デ一夕送信部 1 0 2は、画像バッファ 1 0 6に蓄積された複数個の画像、処理指示部 1 0 4で指定した処理サービスの種類および実行条件、さらに携帯端末 1 0 1 に関する関連情報（例えば、機種コード等）をサーバ 1 0 9 に送信する。サーバ 1 0 9では、まずデータ受信部 1 1 0がデ一夕送信部 1 0 2から送信されたデータを受信し、処理制御部 1 1 2 は、指定された処理サービスの種類に応じて以降の処理内容を切り替える。また、画像内文字列認識 · 翻訳ザ一ビスが指定されている場合、画像統合部 1 8 0 1 も動作する。画像統合部 1 8 0 1 は、指定した処理サ一ビスの実行条件に「合成画像を作成する」との指定がある場合、受信された複数個の画像を合成して 1枚の合成画像を作成する。例えば、図 1 6 に示す複数個の撮像画像 1 6 0 1 を合成することで、図 1 9 に示す合成画像 1 9 0 1 を得る。このように複数の断片的な画像から 1枚の大きな合成画像を作成する処理は、既に市販のディジタルカメラや画像処理ソフトに搭載されており、これらの方式を用いて実現することができる。

以降、画像統合部 1 8 0 1で作成した合成画像を対象として、画像内文字列認識部 1 1 4が動作する。この画像内文字列認識部 1 1 4では実施例 1および 2 と同様な処理を行う。例えば図 1 9 に示すように、合成画像 1 9 0 1から前処理後画像 1 9 0 2 を作成し、この前処理後画像 1 9 0 2から抽出文字列 1 9 0 3 を抽出する。そして、この抽出文字列 1 9 0 3に対して複数個の文字列認識結果 1 9 0 4 と類似文字列 1 9 0 5 を得る。次に、画像内文字列翻訳部 1 1 5は、実施例 1および 2 と同様に、画像内文字列認識部 1 1 4で得た複数個の内文字列認識結果と類似文字列に対するそれぞれの文字列翻訳結果を生成する。

文字列翻訳結果が得られると、画像内文字列翻訳結果生成部 1 1 6は、画像内文字列翻訳結果を作成する。実施例 1お'よび 2では、画像内文字列翻訳結果は、図 7 に示したように文字列位置座標、文字列認識結果、類似文字列および文字列翻訳結果を持つ。この実施例 3では、合成画像から抽出した抽出文字列も画像内文字列翻訳結果に追加する。その後、実施例 1および 2 と同様に、画像内文字列翻訳結果生成部 1 1 6で作成した画像内文字列翻訳結果を結果送信部 1 1 1 により携帯端末 1 0 1 に送信する。

携帯端末 1 0 1では、結果受信部 1 0 8が、サーバ 1 0 9送信された画像内文字列翻訳結果を結果受信部 1 0 8で受信し、表示部 1 0 7 に与えて表示する。この表示結果としては、図 8 に示したと同様に、合成画像から抽出した認識文字列画像 8 0 1 を表示し、文字列認識結果、類似文字列および文字列翻訳結果を含む画像内文字列翻訳結果の画像 8 0 2を表示する。

以上のように、この実施例 3によれば、携帯端末 1 0 1 から文字列や文章の断片を撮像した複数枚の画像をサーバ 1 0 9 に送信すると、サーバ 1 0 9はこれらの画像を統合して 1枚の大きな合成画像を作成し、この合成画像に含まれる文字列を認識して抽出し翻訳するようにしたので、これによりカメラの視野に納まらない長い文字列や文章の内容を翻訳できる効果が得られる。実施例 4 .

上記実施例 1から 3 において、サーバが持つ文字列認識処理や翻訳処理は、一般用語を対象としたものである。しかし、例えば海外のレストランに入って郷土料理の名前を翻訳したい場合、あるいは海外の病院で診断書に記入された病名を翻訳したい場合等では、専門性の高い用語を翻訳する必要がある。このような場合は、十分な文字認識性能および翻訳性能を得ることが困難である。この課題に対しては、ュ一ザの指定や携帯端末の G P S ( G 1 o b a 1 P o s i t i o n i n g S y s t e m ) 機能から得られたユーザの現在位置を基に、文字認識処理や翻訳処理に用いる各種辞書を適切な専門用語辞書に置き換えて処理を行うことで解決できる。実施例 4はこれを実現するものである。以下、実施例 4について図 2 0および図 2 1 を用いて説明する。図中、実施例 1から 3 と共通な部分は同一の符号を付し、原則としてその説明を省略する。図 2 0は実施例 4による携帯端末型翻訳システムの構成を示すブロック図で、 2 0 0 1 は G P S部、 2 0 0 2は専用認識辞書、 2 0 0 3は専用言語辞書、 2 0 0 4は第 1専用翻訳辞書、 2 0 0 5は専用関連文辞書、 2 0 0 6 は第 2専用翻訳辞書、 2 0 0 7は地図データである。図 2 1は認識条件指定の例を示す説明図で、 2 1 1は選択画面である。

次に動作について説明するが、まず、画像内文字列認識 · 翻訳サービスを実行する場合について説明する。

ここでは実施例 1から 3 と同様な処理により、画像撮像部 1 0 5が文字列を含む画像を撮像して撮像画像を画像バッファ 1 0 6 に蓄積する。その後、送信画像制御部 1 4 0 1 は、画像バッファ 1 0 6 に蓄積された 1枚の画像を選択する。処理指示部 1 0 4はサーバ 1 0 9で行う処理サービスの種類とその実行条件を指定する。ここでは、処理サ一ビスの種類として画像内文字列認識 · 翻訳サ一ビスを指定する。

また、 0 ? 3部 2 0 0 1 は、 G P S機能により人工衛星の発信した電波から所持している携帯端末 1 0 1 の現在位置を取得する。データ送信部 1 0 2は、送信画像制御部 1 4 0 1で選択した画像と、処理指示部 1 0 4で指定した処理サービスの種類および携帯端末 1 0 1 に関する情報をサーバ 1 0 9 に送信する。ここで携帯端末 1 0 1 に関する情報としては、関連情報（例、機種コ一ド）と G P S部 2 0 0 1で取得した携帯端末 1 0 1 の現在位置とが含まれる。サーバ 1 0 9では、実施例 1から 3 と同様に、データ送信部 1 0 2で送信した撮像画像に含まれる文字列を翻訳して、その結果を携帯端末 1 0 1 に送信する。ただしその際、処理制御部 1 1 2は、 G P S部 2 0 0 1で取得した携帯端末 1 0 1 の現在位置に基づいて地図データ 2 0 0 7の内容を参照して、携帯端末を所持するユーザが現在いる施設を特定する。そして、画像内文字列認識 · 翻訳部 1 1 3で用いる各種の辞書を、特定された施設に対応する専用辞書に置き換える。具体的には、図 1 に示された認識辞書 1 1 7 と言語辞書 1 1 8 と第 1翻訳辞書 1 2 4を、専用認識辞書 2 0 0 2 と専用言語辞書 2 0 0 3 と第 1専用翻訳辞書 2 0 0 4にそれぞれ置き換える。

ここで、地図データ 2 0 0 7 には各種施設の位置情報が格納されており、 G P S部 2 0 0 1で取得した携帯端末 1 0 1の現在位置から、ユーザがどの施設にいるかを知ることができる。したがって、処理制御部 1 1 2は、その施設に対応した専用辞書を選択する。例えば、ユーザがレストランにいる場合は、レストランで使用される確率が高い郷土料理のメニュー等を含んだ専用辞書を選択する。以降、画像内文字列認識 · 翻訳部 1 1 3では、各専用辞書 2 0 0 2 , 2 0 0 3 , 2 0 0 4を用いて、実施例 1から 3 と同様な処理を行う。そして、処理した翻訳結果を携帯端末 1 0 1 に送り、表示部 1 0 7で表示する。以上が実施例 4における画像内文字列認識 · 翻訳サービスの動作である。

次に、テキスト翻訳サ一ビスの動作を説明する。

まず実施例 1 と同様に、ユーザがキー入力部 1 0 3 により翻訳するキ一ワードを入力し、処理指示部 1 0 4はサーバ 1 0 9で行う処理サービスの種類としてテキスト翻訳サ一ビスを指定する。データ送信部 1 0 2 は、キー入力部 1 0 3で入力したキーワード、処理指示部 1 0 4で指定した処理サービスの種類および携帯端末 1 0 1 に関する情報 (機種コードと、 G P S部 2 0 0 1で取得したユーザの現在位置）をサーバ 1 0 9 に送信する。

以降、実施例 1 と同様な処理で翻訳処理を行い、その結果を携帯端末 1 0 1 の表示部 1 0 7 に表示する。ただし、処理制御部 1 1 2は、デ一夕送信部 1 0 2で指定された処理サービスの種類がテキスト翻訳サービスである場合、 G P S部 2 0 0 1で取得した携帯端末 1 0 1の現在位置に基づいて地図デ一夕 2 0 0 7の内容を参照し、携帯端末 1 0 1 を所持するユーザが現在いる施設を特定する。そして、テキスト翻訳部 1 1 9で用いる各種の辞書を特定された施設に対応する専用辞書に置き換える。具体的には、図 1 に示された関連文辞書 1 2 3 と第 2翻訳辞書 1 2 5 を、専用関連文辞書 2 0 0 5 と第 2専用翻訳辞書 2 0 0 6 にそれぞれ置き換える。以上が本実施例におけるテキスト翻訳サ一ビスの動作である。

なお、上記の動作説明では、処理制御部 1 1 2は G P S 部 2 0 0 1で得たユーザの現在位置と地図データ 2 0 0 7 に基づいて專用辞書の種類を選択するとしたが、代りに携帯端末 1 0 1から直接に専用辞書の種類を指定するようにしても良い。例えば、処理指示部 1 0 4により、表示部 1 0 7 に図 2 1 に示すような専用辞書の種類を表す選択画面 2 1 0 1 を表示し、ユーザがその中から希望する専用辞書の種類を指定できるようにする。そして、データ送信部 1 0 2がサーバ 1 0 9 に対して画像内文字列認識 · 翻訳サービスやテキスト翻訳サ一ビスを依頼する際に、処理指示部 1 0 4によりユーザが指定した専用辞書の種類を送信デ一夕に付けてサーバ 1 0 9へ送信する。これにより、処理制御部 1 1 2は、ユーザが指定した専用辞書を選択し画像内文字列認識 · 翻訳部 1 1 3やテキス卜翻訳部 1 1 9の処理を実行するようにする。

以上のように、この実施例 4によれば、ユーザにより指定するか、あるいは G P S部 2 0 0 1で得た携帯端末 1 0 1 の現在位置とサーバ 1 0 9の持つ地図データ 2 0 0 7 に基づいてユーザが現在いる施設を特定し、サーバの文字列認識処理や翻訳処理に用いる各種辞書を適切な専用辞書に置き換えるようにしたので、これにより翻訳結果の性能を向上させる効果が得られる。実施例 5 .

上記実施例 1から 4における画像内文字列認識 · 翻訳サ一ビスでは、携帯端末 1 0 1からサーバ 1 0 9 に対して画像撮像部 1 0 5で撮像したカラ一画像もしくはグレースケール画像を送信した。しかし、カラー画像やダレ一スケ一ル画像はデータ量が大きいため送信に時間を要する。この課題は、データサイズを削減した画像を作成してサーバに送信することで解決できる。実施例 5 はこれを実現するものである。

以下、実施例 5 について図 2 2から図 2 4を用いて説明する。図中、実施例 1から 4 と共通な部分は同一の符号を付し、原則としてその説明を省略する。図 2 2は実施例 5 による携帯端末型翻訳システムの構成を示すブロック図で、 2 2 0 1 は画像前処理部である。図 2 3は画像前処理部の動作を説明する説明図で、 2 3 0 1 は撮像画像、 2 3 0 2 は前処理後画像である。図 2 4は画像前処理部における画像補正処理を説明する説明図で、 2 4 0 1 はノイズ、 2 4 0 2はノイズ除去後の前処理後画像、 2 4 0 3はノイズ除去対象領域である。

次に動作について説明する。

まず、実施例 1から 4 と同様に、画像撮像部 1 0 5は文字列を含む画像を撮像し、画像バッファ 1 0 6は画像撮像 '部 1 0 5で撮像した画像を蓄積する。

次に、画像前処理部 2 2 0 1 は、画像バッファ 1 0 6に蓄積された撮像画像に対して画像処理を行い、画像のデ一夕量を削減する。この画像処理は、サーバ 1 0 9の画像内文字列認識部 1 1 4の処理手順に含まれる前処理（図 3のステップ S T 2 1 ) と同じである。例えば、図 2 3 に示すように、画像バッファ 1 0 6 に蓄積された画像 2 3 0 1 に対して前処理を適用すると、文字列部分を黒く背景部分を白くした白黒の前処理後画像 2 3 0 2 を得る。このような色数が白黒の二色しかない二値化した画像は、画像撮像部 1 0 5で撮像したカラ一画像やグレースケール画像に比べてデータ量が小さい。このようにデータ量を削減した前処理後画像は再び画像バッファ 1 0 6 に蓄積される。

また、画像撮像部 1 0 5で撮像した画像上にノィズが含まれると、そのノイズが前処理後の画像に残る場合がある。例えば図 2 4では、ノイズ 2 4 0 1が前処理後画像 2 3 0 2上に黒く残っている。このようなノイズ 2 4 0 1 は、文字認識処理における誤認識の原因となる。そのため、画像前処理部 2 2 0 1 は、前処理後画像からユーザがノイズを削除できる機能を持つ。例えば、前処理後画像を表示部 1 0 7 に表示して、ユーザはこれを目視でチェックする。そしてノイズを発見した場合は、図 2 4に示すようにノイズ 2 4 0 1 を囲む矩形のノイズ除去対象領域 2 4 0 3 を指定する。この指定はキー入力部 1 0 3を操作して行う。矩形のノイズ除去対象領域 2 4 0 3が指定されると、画像前処理部 2 2 0 1 はノイズ除去対象領域 2 4 0 3 内の黒画素を白画素に変換し、ノイズの無い前処理後画像 2 4 0 2 に編集する。

その後、携帯端末 1 0 1から画像内文字列認識 · 翻訳サ一ビスをサーバ 1 0 9 に依頼する際は、デ一タ送信部 1 0 2は画像バッファ 1 0 6 に蓄積された俞処理後画像をサーバ 1 0 9に送信する。以降の処理は実施例 1から 4 と同じである。ただし、実施例 1から 4ではサーバ 1 0 9で行つていた前処理を既に携帯端末 1 0 1で行っているため、この実施例 5のサーバ 1 0 9では前処理をスキップする。サ —バ 1 0 9は、この前処理後画を受信して、含まれる文字列を認識し、その翻訳結果を得て携帯端末 1 0 1 に送信する。以上が実施例 5の動作である。

以上のように、この実施例 5 によれば、携帯端末 1 0 1 の画像前処理部 2 2 0 1 で前処理を行い、カラ一画像あるいはグレースケール画像から文字列と背景を分離するように二値化した前処理後画像を作成しサ一パ 1 0 9 に送信し、前処理後画像に含まれる文字列を翻訳するようにしたので、データ量を削減でき、カラ一画像やグレースケール画像に起因する送信時間を削減すると共に、サーバ 1 0 9での処理時間の短縮化が図れる効果が得られる。また前処理後画像にノイズが含まれる場合には、ノイズを除去した前処理後画像を得るようにしたので、サーバ 1 0 9側の文字認識処理時における誤認識を引き起こす原因を取り除くことができる効果が得られる。く各実施例について説明してきたが、これらの例は、画像撮像部で撮像した画像に含まれる文字列に対する翻訳処理と、キー入力部で入力したキーワードについて関連文生成してその関連文に対する翻訳処理とを共に持つ構成についてであった。これらの翻訳処理はシステムとして別々に成り立つものである。また、サーバ側が両方の処理ができる構成を備えているが、携帯端末側がいずれか一方の処理だけを行うデータを送る構成となる場合もある。ただし、その場合には、処理指示部や処理制御部等の機能は若干変更されることになる。産業上の利用の可能性

本発明は上記のように構成されているので、携帯端末とこの携帯端末とデータ交換を行うサーバとからなり、携帯端末は、画像撮像部と、この画像撮像部により撮像した画像を蓄積する画像バッファと、キーワードを入力するキ一入力部と、サーバへ依頼する処理サービスの種類を指定する処理指示部と、画像バッファに蓄積された画像あるいはキー入力部により入力されたキーワード、指定された処理サービスの種類および携帯端末の関連情報からなるデ一夕をサーバに送信するデータ送信部と、サーバにおいて翻訳処理された翻訳結果を受信する結果受信部と、受信した翻. 訳結果を表示する表示部とを備え、サーバは、携帯端末から送信されたデータを受信するデータ受信部と、受信した画像に含まれる 1個の文字列に対して複数個の文字列を抽出し、抽出した複数個の文字列を翻訳してそれぞれの翻訳結果を生成する画像内文字列認識 · 翻訳部と、受信したキ一ワードに対する関連文を生成し、生成された関連文を翻訳して翻訳結果を生成するテキスト翻訳部と、受信したデ一夕に含まれる指定された処理サ一ビスの種類に従って画像内文字列認識 · 翻訳部で処理するか、あるいはテキスト翻訳部で処理するかを切り替え制御する処理制御部と、画像内文字列認識 · 翻訳部またはテキスト翻訳部で生成された翻訳結果を関連情報に基づいて携帯端末に送信する結果送信部とを備えるように構成したので、画像内文字列に対する翻訳と入力したテキス卜に対する翻訳の両方に対応できるシステムを実現する効果がある。また、画像内文字列認識 · 翻訳の処理においては、文字認識が困難で解像度が低い品質の悪い画像内の文字や飾り文字に対して、複数個の文字列を抽出することで翻訳を行うので、正解率の高い翻訳結果が得られる効果があり、さらに、テキスト翻訳の処理においては、キーワード入力のため、翻訳したい全てのテキストを入力する必要がなく、テキスト入力の手間を削減できる効果がある。

また本発明は上記のように構成されているので、携帯端末とこの携帯端末とデータ交換を行うサーバとからなり、携帯端末は、画像撮像部と、この画像撮像部により撮像した画像を蓄積する画像バッファと、サーバへ依頼する処理サービスを指示する処理指示部と、画像バッファに蓄積された画像、処理サービスの指示および携帯端末の関連情報からなるデータをサーバに送信するデ一夕送信部と、サーバにおいて翻訳処理された翻訳結果を受信する結果受信部と、受信した翻訳結果を表示する表示部とを備え、サーバは、携帯端末から送信されたデ一夕を受信するデ一夕受信部と、受信した画像に含まれる 1個の文字列に対して複数個の文字列を抽出し、抽出した複数個の文字列を翻訳してそれぞれの翻訳結果を生成する画像内文字列認識 · 翻訳部と、受信したデ一夕に含まれる処理サービスの指示に従つて画像内文字列認識 · 翻訳部を動作させる処理制御部と、生成された翻訳結果を関連情報に基づいて携帯端末に送信する結果送信部とを備えるように構成したので、文字認識が困難で解像度が低い品質の悪い画像内の文字や飾り文字に対しても正解率の高い翻訳結果を得ることができる効果がある。

また本発明は上記のように構成されているので、携帯端末とこの携帯端末とデータ交換を行うサーバとからなり、携帯端末は、キーワードを入力するキー入力部と、サーバへ依頼する処理サ一ビスを指示する処理指示部と、キー入力部により入力されたキーワード、処理サ一ビスの指示および携帯端末の関連情報からなるデ一夕をサーバに送信するデータ送信部と、サーバにおいて翻訳処理された翻訳結果を受信する結果受信部と、受信した翻訳結果を表示する表示部とを備え、サーバは、携帯端末から送信されたデ一夕を受信するデータ受信部と、受信したデータに含まれるキーワードに対する関連文を生成し、生成された関連文を翻訳して翻訳結果を生成するテキスト翻訳部と、受信したデ一夕に含まれる処理サ一ビスの指示に従ってテキスト翻訳部を動作させる処理制御部と、生成された翻訳結果を関連情報に基づいて携帯端末に送信する結果送信部とを備えるように構成したので、キーワード入力のため、翻訳したい全てのテキストを入力する必要がなく、面倒なテキスト入力の手間を削減できる効果がある。

また本発明は上記のように構成されているので、サーバの画像内文字列認識 · 翻訳部が、処理時のパラメータを変えるなどして異なる複数の条件で画像内の 1個の文字列を認識することにより複数個の文字列認識結果を生成する画像内文字列認識部と、生成した複数個の文字列認識結果をそれぞれ翻訳した複数個の翻訳結果を生成する画像内文字列翻訳部とを有するように構成したので、文字認識が困難で解像度が低い品質の悪い画像内の文字や飾り文字に対しても正解率の高い翻訳結果を得ることができる効果がある。

また本発明は上記のように構成されているので、サーバの画像内文字列認識 · 翻訳部が、処理時のパラメータを変えるなどして異なる複数の条件で画像内の 1個の文字列を認識することにより複数個の文字列認識結果を生成すると共に、言語辞書を用いて複数個の文字列認識結果に対してスペリングが類似する類似文字列を生成する画像内文字列認識部と、生成した文字列認識結果と類似文字列のそれぞれを翻訳することにより複数個の翻訳結果を生成する画像内文字列翻訳部とを有するように構成したので、認識が困難で解像度が低い品質の悪い画像内の文字や飾り文字に対しても正解率の極めて高い翻訳結果を得ることができる効果がある。

また本発明は上記のように構成されているので、サーバのテキスト翻訳部が、受信したキーワードに基づいて関連文辞書を参照してキーワードに関連性の高い複数個の文章を生成する関連文生成部と、生成された複数個の文章を翻訳することにより翻訳結果を生成する関連文翻訳部とを有するように構成したので、キーワード入力のため、翻訳したい全てのテキストを入力する必要がなく、面倒なテキスト入力の手間を削減できると共に、正解率の高い要求する文章の翻訳結果を得ることができる効果がある。

また本発明は上記のように構成されているので、携帯端末は、画像撮像部により一定の時間間隔で連続的に撮像され画像バッファに蓄積した各画像を順次選択してデータ送信部に出力す'る送信画像制御部を備え、サーバが、受信した各画像に含まれる文字列の各翻訳結果を順次生成して携帯端末に送信し、携帯端末の表示部が、各翻訳結果を受信する都度表示するように構成したので、一度に多数の文字列を翻訳する場合、ユーザは翻訳したい文字列上にカメラの視野を移動させてシャッターを押す作業を何度も繰り返す必要もなくユーザの手間を削減すると共に、半リアル夕ィムに翻訳結果が得られる効果がある。

また本発明は上記のように構成されているので、携帯端末の送信制御部が、画像バッファから順次読み出す画像について、新しく撮像された画像とその一つ前に撮像された画像との差を比較し、その差が閾値以下となった場合に新しく撮像された画像を選択してデータ送信部に出力するように構成したので、連続的な複数の画像からユーザが翻訳したい文字列を含む画像のみに対する翻訳結果を得ることができ、またデータ送信量とサーバの処理量を削減する効果がある。

また本発明は上記のように構成されているので、サーバは、連続的に受信された複数個の画像を合成して 1枚の合成画像を作成する画像統合部を備え、画像内文字列認識 · 翻訳部が、作成された合成画像に含まれる文字列に対する翻訳結果を生成するように構成したので、カメラの視野に納まらない長い文字列や文章の内容を翻訳できる効果がある。

また本発明は上記のように構成されているので、携帯端末は、当該携帯端末の現在位置を取得してサーバに送信するデ一夕に加える G P S部を備え、サーバは、各施設の位置を格納した地図データを備え、サーバの処理制御部が、受信した現在位置に基づいて地図データを参照することにより当該携帯端末を所持するユーザが現在いる施設を特定し、当該サーバ内で用いる各種の辞書を特定された施設に対応する専用辞書に置き換えるように構成したので、ユーザが意識することなく適切な辞書に切り換えて翻訳を行うことにより翻訳結果の性能を向上させる効果がある。

また本発明は上記のように構成されているので、携帯端末の処理指示部が、ユーザにより専用辞書の種類を指定できるように構成し、指定された専用辞書の種類をサーバに送信するデータに加え、サーバの処理制御部が、受信した専用辞書の種類に基づいて当該サーバ内で用いる各種の辞書を指定された専用辞書に置き換えるように構成したので、ユーザの要求に応じた翻訳に対応でき、翻訳結果の性能を向上させる効果がある。

また本発明は上記のように構成されているので、携帯端末は、画像バッファに蓄積されたカラー画像あるいはダレ一スケール画像から文字列と背景を分離するように二値化した前処理後画像を作成し画像バッファに蓄積する画像前処理部を備え、前処理後画像をサーバに送信して翻訳結果を得るように構成したので、データ量を削減でき、カラ一画像やグレースケール画像に起因する送信時間を削減すると共に、サーバでの処理時間の短縮化が図れる効果がある。

また本発明は上記のように構成されているので、携帯端末が、前処理後画像にノィズが含まれる場合にはキー入力によりノイズを囲むノイズ除去対象領域を指定できるように構成され、画像前処理部が、ノイズ除去対象領域内の黒画素を白画素に変換して前処理後画像を編集するように構成したので、サーバ側の文字認識処理時における誤認識を引き起こす原因を取り除くことができる効果がある。

また本発明は上記のように構成されているので、翻訳処理を行うサーバとデータ交換を行う携帯端末であって、画像撮像部と、この画像撮像部により撮像した画像を蓄積する画像バッファと、キ一ワードを入力するキー入力部と、サーバへ依頼する処理サービスの種類を指定する処理指示部と、画像バッファに蓄積された画像あるいは入力されたキーワード、指定した処理サービスの種類および携帯端末の関連情報からなるデータをサーバに送信するデ一夕送信部と、サーバにおいて認識された認識文字列および翻訳処理された翻訳結果を受信する結果受信部と、受信した翻訳結果を表示する表示部とを備えるように構成したので、サーバ側における画像内文字列に対する翻訳と入力したテキストに対する翻訳の両方のサービスに対応できる携帯端末を実現する効果がある。

また本発明は上記のように構成されているので、翻訳処理を行うサーバとデータ交換を行う携帯端末であって、画像撮像部と、この画像撮像部により撮像した画像を蓄積する画像バッファと、サーバへ依頼する処理サービスを指示する処理指示部と、画像バッファに蓄積された画像、処理サービスの指示および携帯端末の関連情報からなるデ一夕をサーバに送信するデ一夕送信部と、サーバにおいて認識された認識文字列および翻訳処理された翻訳結果を受信する結果受信部と、受信した翻訳結果を表示する表示部とを備えるように構成したので、サ一バ側における画像内文字列に対する翻訳を要求し、その翻訳結果を受信表示できる携帯端末を実現する効果がある。

また本発明は上記のように構成されているので、翻訳処理を行うサーバとデータ交換を行う携帯端末であって、キ —ワードを入力するキー入力部と、サーバへ依頼する処理サービスを指示する処理指示部と、入力されたキーワード、処理サービスの指示および携帯端末の関連情報からなるデ一夕をサーバに送信するデ一夕送信部と、サーバにおいて翻訳処理された翻訳結果を受信する結果受信部と、受信した翻訳結果を表示する表示部とを備えるように構成したので、翻訳したい全てのテキストの入力を要しない入力キ一ワードに関連する翻訳サービスに対応できる携帯端末を実現する効果がある。

また本発明は上記のように構成されているので、画像撮像部により一定の時間間隔で連続的に撮像され画像バッファに蓄積した各画像を順次選択してデータ送信部に出力する送信画像制御部を備え、表示部が、サーバから順次受信する各画像に含まれる文字列の各翻訳結果を逐次表示するように構成したので、一度に多数の文字列を翻訳する場合、ユーザは翻訳したい文字列上にカメラの視野を移動させてシャツ夕一を押す作業を何度も繰り返す必要もなくユーザの手間を削減すると共に、半リアルタイムに翻訳結果が得られる携帯端末を実現する効果がある。

また本発明は上記のように構成されているので、送信制御部が、画像バッファから順次読み出す画像について、新しく撮像された画像とその一つ前に撮像された画像との差を比較し、その差が閾値以下となった場合に新しく撮像された画像を選択してデ一夕送信部に出力するように構成したので、連続的な複数の画像からユーザが翻訳したい文字列を含む画像のみに対する翻訳結果を得ることができ、またデータ送信量とサーバの処理量を削減する携帯端末を実現する効果がある。

また本発明は上記のように構成されているので、 G P S 機能により当該携帯端末の現在位置を取得してサーバに送信するデータに加える G P S部を備えるように構成したので、ユーザが意識することなくサーバ側で適切な辞書により翻訳を行う場合に適した携帯端末を実現する効果がある。また本発明は上記のように構成されているので、サーバ内で使用する専用辞書の種類をユーザにより指定できるようにし、指定された専用辞書の種類をサーバに送信するデ —夕に加えるように構成したので、サーバ側でユーザの要求に応じた適切な辞書により翻訳を行う場合に適した携帯端末を実現する効果がある。

また本発明.は上記のように構成されているので、画像バッファに蓄積されたカラ一画像あるいはダレ一スケール画像から文字列と背景を分離するように二値化した前処理後画像を作成し画像バッファに蓄積する画像前処理部を備え、画像バッファから読み出した前処理後画像をザ一バに送信して翻訳結果を得るように構成したので、デ一夕量を削減でき、カラ一画像やグレースケール画像に起因する送信時間を削減すると共に、サーバでの処理時間の短縮化が図れる携帯端末を実現する効果がある。

また本発明は上記のように構成されているので、前処理後画像にノイズが含まれる場合にはキー入力によりノィズを囲むノイズ除去対象領域を指定できるようにし、画像前処理部が、ノイズ除去対象領域内の黒画素を白画素に変換して前処理後画像を編集するように構成したので、サーバ側の文字認識処理時における誤認識を引き起こす原因を取り除く携帯端末を実現する効果がある。また本発明は上記のように構成されているので、携帯端末とデ一夕交換を行うサーバであって、携帯端末から送信された画像あるいはキー入力されたキーワード、指定された処理サービスの種類および携帯端末の関連情報からなるデータを受信するデータ受信部と、受信した画像に含まれる 1個の文字列に対して複数個の文字列を抽出し、抽出した複数個の文字列を翻訳してそれぞれの翻訳結果を生成する画像内文字列認識 · 翻訳部と、キーワードに対する関連文を生成し、生成した関連文を翻訳して翻訳結果を生成するテキス卜翻訳部と、指定された処理サービスの種類に従つて画像内文字列認識 · 翻訳部で処理するか、あるいはテキスト翻訳部で処理するかを切り替え制御する処理制御部と、画像内文字列認識 · 翻訳部あるいはテキスト翻訳部で生成した翻訳結果を関連情報に基づいて携帯端末に送信する結果送信部とを備えるように構成したので、画像内文字列に対する翻訳と入力したテキストに対する翻訳の両方に対応できるサーバを実現する効果がある。また、画像内文字列認識 · 翻訳の処理においては、文字認識が困難で解像度が低い品質の悪い画像内の文字や飾り文字に対して、複数個の文字列を抽出することで翻訳を行うので、正解率の高い翻訳結果が得られる効果があり、さらに、テキスト翻訳の処理においては、受信したキーワードから関連文を生成するため、翻訳したい全てのテキストを取得する必要がなく、ユーザが要求する翻訳結果を得ることができ、かつ携帯端末側での入力時のユーザの負担を軽減できる効果がある。また本発明は上記のように構成されているので、携帯端末とデータ交換を行うサーバであって、携帯端末から送信された画像、処理サービスの指示および携帯端末の関連情報からなるデ一夕を受信するデータ受信部と、受信した画像に含まれる 1個の文字列に対して複数個の文字列を抽出し、抽出した複数個の文字列を翻訳してそれぞれの翻訳結果を生成する画像内文字列認識 · '翻訳部と、受信したデー夕に含まれる処理サービスの指示に従って画像内文字列認識*翻訳部を動作させる処理制御部と、画像内文字列認識 - 翻訳部あるいはテキス卜翻訳部で生成した翻訳結果を関連情報に基づいて携帯端末に送信する結果送信部とを備えるように構成したので、文字認識が困難で解像度が低い品質の悪い画像内の文字や飾り文字に対しても正解率の高い翻訳結果を得るサーバを実現する効果がある。

また本発明は上記のように構成されているので、携帯端末とデータ交換を行うサーバであって、キー入力されたキ —ワード、処理サービスの指示および携帯端末の関連情報からなるデータを受信するデ一夕受信部と、キーワードに対する関連文を生成し、生成した関連文を翻訳して翻訳結果を生成するテキスト翻訳部と、受信したデータに含まれる処理サービスの指示に従ってテキス卜翻訳部を動作させる処理制御部と、テキス卜翻訳部で生成した翻訳結果を関連情報に基づいて携帯端末に送信する結果送信部とを備えるように構成したので、受信したキ一ワードから関連文を生成するため、翻訳したい全てのテキストを受信しなくても、ユーザが要求する翻訳結果を得るサーバを実現し、また携帯端末側での入力時のユーザの負担を軽減できる効果がある。

また本発明は上記のように構成されているので、画像内文字列認識 · 翻訳部が、処理時のパラメ一夕を変えるなどして異なる複数の条件で画像内の 1個の文字列を認識することにより複数個の文字列認識結果を生成する画像内文字列認識部と、生成した複数個の文字列認識結果をそれぞれ翻訳した複数個の翻訳結果を生成する画像内文字列翻訳部とを有するように構成したので、文字認識が困難で解像度が低い品質の悪い画像内の文字や飾り文字に対しても正解率の高い翻訳結果を得るサーバを実現する効果がある。

また本発明は上記のように構成されているので、画像内文字列認識 · 翻訳部が、処理時のパラメ一夕を変えるなどして異なる複数の条件で画像内の 1個の文字列を認識することにより複数個の文字列認識結果を生成すると共に、言語辞書を用いて複数個の文字列認識結果に対してスペリングが類似する類似文字列を生成する画像内文字列認識部と、生成した文字列認識結果と類似文字列のそれぞれを翻訳することにより複数個の翻訳結果を生成する画像内文字列翻訳部とを有するように構成したので、認識が困難で解像度が低い品質の悪い画像内の文字や飾り文字に対しても正解率の極めて高い翻訳結果を得るサーバを実現する効果がある。

また本発明は上記のように構成されているので、テキスト翻訳部が、キー入力部で入力したキーワードに基づいて関連文辞書を参照してキーワードに関連性の高い複数個の文章を生成する関連文生成部と、生成された複数個の文章を翻訳することにより翻訳結果を生成する関連文翻訳部とを有するように構成したので、受信したキ一ワードから複数個の関連文を生成するため、翻訳したい全てのテキストを受信しなくてもユーザが要求に対して極めて正解率の高い翻訳結果を得るサーバを実現し、また携帯端末側での入力時のユーザの負担を軽減できる効果がある。

また本発明は上記のように構成されているので、連続的に受信された複数個の画像を合成して 1枚の合成画像を作成する画像統合部を備え、画像内文字列認識 · 翻訳部が、作成された合成画像に含まれる文字列に対する翻訳結果を生成するように構成したので、カメラの視野に納まらない長い文字列や文章の内容を翻訳できるサーバを実現する効果がある。

また本発明は上記のように構成されているので、各施設の位置を格納した地図データを備え、処理制御部が、受信したデータに含まれる携帯端末の現在位置に基づいて地図データを参照することにより当該携帯端末を所持するユーザが現在いる施設を特定し、当該サーバ内で用いる各種の辞書を特定された施設に対応する専用辞書に置き換えるように構成したので、ユーザが意識することなく適切な辞書に切り換えて翻訳を行うことにより翻訳結果の性能を向上させるサーバを実現する効果がある。

また本発明は上記のように構成されているので、処理制御部が、受信したデ一夕に含まれる指定された専用辞書の種類に基づいて当該サーバ内で用いる各種の辞書を指定された専用辞書に置き換えるように構成したので、ユーザの要求に応じた翻訳に対応でき、翻訳結果の性能を向上させるサーバを実現する効果がある。

Claims

請求の範囲

1 . 携帯端末とこの携帯端末とデータ交換を行うサーバとからなる携帯端末型画像処理システムであって、

前記携帯端末は、

画像撮像部と、

この画像撮像部により撮像した画像を蓄積する画像バッファと、

キーワードを入力するキー入力部と、前記サーバへ依頼する処理サ一ビスの種類を指定する処理指示部と、

前記画像バッファに蓄積された画像あるいは前記キ一入力部により入力されたキーワード、指定された処理サービスの種類および前記携帯端末の関連情^からなるデ一夕を前記サーバに送信するデータ送信部と、

前記サーバにおいて翻訳処理された翻訳結果を受信する結果受信部と、

受信した前記翻訳結果を表示する表示部とを備え、前記サーバは、

前記携帯端末から送信されたデータを受信するデータ受信部と、

受信した前記画像に含まれる 1個の文字列に対して複数個の文字列を抽出し、抽出した前記複数個の文字列を翻訳してそれぞれの翻訳結果を生成する画像内文字列認識 · 翻訳部と、

受信した前記キーワードに対する関連文を生成し、生成された前記関連文を翻訳して翻訳結果を生成するテキスト翻訳部と、

受信したデ一夕に含まれる前記指定された処理サービスの種類に従って前記画像内文字列認識 · 翻訳部で処理するか、あるいは前記テキスト翻訳部で処理するかを切り替え制御する処理制御部と、

前記画像内文字列認識 · 翻訳部または前記テキスト翻訳部で生成された翻訳結果を前記関連情報に基づいて前記携帯端末に送信する結果送信部とを備えたことを特徴とする . 携帯端末型画像処理システム。

2 . 携帯端末とこの携帯端末とデータ交換を行うサーバとからなる携帯端末型画像処理システムであって、

前記携帯端末は、

画像撮像部と、

前記サーバへ依頼する処理サービスを指示する処理指示部と、

前記画像バッファに蓄積された画像、前記処理サービスの指示および前記携帯端末の関連情報からなるデータを前記サーバに送信するデータ送信部と、

前記携帯端末から送信されたデ一夕を受信するデータ受信部と、

受信したデータに含まれる前記処理サービスの指示に従つて前記画像内文字列認識 · 翻訳部を動作させる処理制御部と、

生成された前記翻訳結果を前記関連情報に基づいて前記携帯端末に送信する結果送信部とを備えたことを特徴とする携帯端末型画像処理システム。

3 . 携帯端末とこの携帯端末とデータ交換を行うサーバとからなる携帯端末型画像処理システムであって、

前記携帯端末は、

キ一ワードを入力するキー入力部と、

前記キー入力部により入力されたキーワード、前記処理サービスの指示および前記携帯端末の関連情報からなるデ —夕を前記サーバに送信するデータ送信部と、

前記携帯端末から送信されたデータを受信するデータ受信部と、受信したデータに含まれる前記キーワードに対する関連文を生成し、生成された前記関連文を翻訳して前記翻訳果を生成するテキスト翻訳部と、

受信したデータに含まれる前記処理サービスの指示に従つて前記テキスト翻訳部を動作させる処理制御部と、

4 . サーバの画像内文字列認識 · 翻訳部が、

異なる複数の条件で画像内の 1個の文字列を認識することにより複数個の文字列認識結果を生成する画像内文字列認識部と、 .

生成した前記複数個の文字列認識結果をそれぞれ翻訳した複数個の翻訳結果を生成する画像内文字列翻訳部とを有したことを特徴とする請求の範囲第 1項または請求の範囲第 2記載の携帯端末型画像処理システム。

5 . サーバの画像内文字列認識 · 翻訳部が、

異なる複数の条件で画像内の 1個の文字列を認識することにより複数個の文字列認識結果を生成すると共に、言語辞書を用いて前記複数個の文字列認識結果に対してスペリングが類似する類似文字列を生成する画像内文字列認識部と、

生成した前記文字列認識結果と前記類似文字列のそれぞれを翻訳することにより複数個の翻訳結果を生成する画像内文字列翻訳部とを有したことを特徴とする請求の範囲第 1項または請求の範囲第 2項記載の携帯端末型画像処理システム。

6 . サーバのテキス卜翻訳部が、

受信したキーワードに基づいて関連文辞書を参照して前記キーワードに関連性の高い複数個の文章を生成する関連文生成部と、

生成された前記複数個の文章を翻訳することにより翻訳結果を生成する関連文翻訳部とを有したことを特徴とする請求の範囲第 1項または請求の範囲第 3項記載の携帯端末型画像処理システム。

7 . 携帯端末は、画像撮像部により一定の時間間隔で連続的に撮像され画像バッファに蓄積した各画像を順次選択してデ一夕送信部に出力する送信画像制御部を備え、サーバが、受信した前記各画像に含まれる文字列の各翻訳結果を順次生成して前記携帯端末に送信し、

前記携帯端末の表示部が、前記各翻訳結果を受信する都度表示するようにしたことを特徴とする請求の範囲第 1項または請求の範囲第 2項記載の携帯端末型画像処理システム。

8 . 携帯端末の送信制御部が、画像バッファから順次読み出す画像について、新しく撮像された画像とその一つ前に撮像された画像との差を比較し、その差が閾値以下となつた場合に前記新しく撮像された画像を選択してデ一夕送信部に出力するようにしたことを特徴とする請求の範囲第 7項記載の携帯端末型画像処理システム。

9 - サ一パは、連続的に受信された複数個の画像を合成して 1枚の合成画像を作成する画像統合部を備え、画像内文字列認識 · 翻訳部が、作成された前記合成画像に含まれる文字列に対する翻訳結果を生成するようにしたことを特徴とする請求の範囲第 7項または請求の範囲第 8 項記載の携帯端末型画像処理システム。

1 0 . 携帯端末は、当該携帯端末の現在位置を取得してサーバに送信するデータに加える G P S部を備え、

前記サーバは、各施設の位置を格納した地図デ一夕を備え、

前記サーバの処理制御部が、受信した前記現在位置に基づいて前記地.図データを参照することにより当該携帯端末を所持するユーザが現在いる施設を特定し、当該サーバ内で用いる各種の辞書を特定された前記施設に対応する専用辞書に置き換えるようにしたことを特徴とする請求の範囲第 1項から請求の範囲第 9項のうちのいずれか 1項記載の携帯端末型画像処理システム。

1 1 . 携帯端末の処理指示部が、ユーザにより専用辞書の種類を指定できるように構成し、指定された前記専用辞書の種類をサーバに送信するデータに加え、

前記サーバの処理制御部が、受信した前記専用辞書の種類に基づいて当該サーバ内で用いる各種の辞書を指定された専用辞書に置き換えるようにしたことを特徴とする請求の範囲第 1項から請求の範囲第 9項のうちのいずれか 1項記載の携帯端末型画像処理システム。

1 2 . 携帯端末は、画像バッファに蓄積されたカラー画像あるいはグレースケール画像から文字列と背景を分離するように二値化した前処理後画像を作成し前記画像バッファに蓄積する画像前処理部を備え、前記前処理後画像をサーバに送信して翻訳結果を得るようにしたことを特徴とする請求の範囲第 1項、請求の範囲第 3項から請求の範囲第 5項、請求の範囲第 7項から請求の範囲第 1 1項のうちのいずれか 1項記載の携帯端末型画像処理システム。

1 3 . 携帯端末が、前処理後画像にノイズが含まれる場合にはキー入力により前記ノイズを囲むノイズ除去対象領 . 域を指定できるように構成され、

画像前処理部が、前記ノイズ除去対象領域内の黒画素を白画素に変換して前処理後画像を編集するようにしたことを特徴とする請求の範囲第 1 2項記載の携帯端末型画像処理システム。

1 4 . 翻訳処理を行うサーバとデータ交換を行う携帯端末であって、

画像撮像部と、

キーワードを入力するキー入力部と、

前記サーバへ依頼する処理サービスの種類を指定する処理指示部と、

前記画像バッファに蓄積された画像あるいは入力されたキーワード、指定した前記処理サービスの種類および前記携帯端末の関連情報からなるデ一夕を前記サーバに送信するデータ送信部と、

前記サ一バにおいて認識された認識文字列および翻訳処理された翻訳結果を受信する結果受信部と、受信した前記翻訳結果を表示する表示部とを備えたことを特徴とする携帯端末。

1 5 . 翻訳処理を行うサーバとデータ交換を行う携帯端末であつて、

画像撮像部と、

前記サーバにおいて認識された認識文字列および翻訳処理された翻訳結果を受信する結果受信部と、

受信した前記翻訳結果を表示する表示部とを備えたことを特徴とする携帯端末。

1 6 . 翻訳処理を行うサーバとデータ交換を行う携帯端末であって、

キ一ワードを入力'するキ一入力部と、

入力されたキーワード、前記処理サービスの指示および前記携帯端末の関連情報からなるデータを前記サーバに送信するデータ送信部と、

前記サーバにおいて翻訳処理された翻訳結果を受信する結果受信部と、受信した前記翻訳結果を表示する表示部とを備えたことを特徴とする携帯端末。

1 7 . 画像撮像部により一定の時間間隔で連続的に撮像され画像バッファに蓄積した各画像を順次選択してデータ送信部に出力する送信画像制御部を備え、

表示部が、サーバから順次受信する前記各画像に含まれる文字列の各翻訳結果を逐次表示するようにしたことを特徵とする請求の範囲第 1 4項または請求の範囲第 1 5項記載の携帯端末。 ' 1 8 . 送信制御部が、画像バッファから順次読み出す画像について、新しく撮像された画像とその一つ前に撮像された画像との差を比較し、その差が閾値以下となった場合に前記新しく撮像された画像を選択してデータ送信部に出力するようにしたことを特徴とする請求の範囲第 1 7項記載の携帯端末。

1 9 . G P S機能により当該携帯端末の現在位置を取得してサーバに送信するデータに加える G P S部を備えたことを特徴とする請求の範囲第 1 4項から請求の範囲第 1 8 項のうちのいずれか 1項記載の携帯端末。

2 0 . 処理指示部が、サーバ内で使用する専用辞書の種類をユーザにより指定できるように構成し、指定された前記専用辞書の種類をサーバに送信するデータに加えるようにしたことを特徴とする請求の範囲第 1 4項から請求の範囲第 1 8項のうちのいずれか 1項記載の携帯端末。

2 1 . 画像バッファに蓄積されたカラー画像あるいはグレースケール画像から文字列と背景を分離するように二値化した前処理後画像を作成し前記画像バッファに蓄積する画像前処理部を備え、前記画像バッファから読み出した前記前処理後画像をサーバに送信して翻訳結果を得るようにしたことを特徴とする請求の範囲第 1 4項、請求の範囲第 1 5項および請求の範囲第 1 7項から請求の範囲第 2 0項のうちのいずれか 1項記載の携帯端末。

2 2 . 前処理後画像にノイズが含まれる場合にはキー入力により前記ノイズを囲むノイズ除去対象領域を指定できるように構成され、

画像前処理部が、前記ノイズ除去対象領域内の黒画素を白画素に変換して前処理後画像を編集するようにしたことを特徴とする請求の範囲第 2 1項記載の携帯端末。

2 3 . 携帯端末とデータ交換を行うサーバであって、前記携帯端末から送信された画像あるいはキー入力されたキーワード、指定された処理サービスの種類および前記携帯端末の関連情報からなるデータを受信するデータ受信部と、

前記キーワードに対する関連文を生成し、生成した前記関連文を翻訳して翻訳結果を生成するテキス卜翻訳部と、前記指定された処理サービスの種類に従って前記画像内文字列認識 · 翻訳部で処理するか、あるいは前記テキスト翻訳部で処理するかを切り替え制御する処理制御部と、前記画像内文字列認識 · 翻訳部あるいは前記テキスト翻訳部で生成した翻訳結果を前記関連情報に基づいて前記携帯端末に送信する結果送信部とを備えたことを特徴とするサーバ。

2 4 . 携帯端末とデータ交換を行うサーバであって、前記携帯端末から送信された画像、処理サービスの指示および前記携帯端末の関連情報からなるデータを受信するデータ受信部と、

前記画像内文字列認識 · 翻訳部あるいは前記テキスト翻訳部で生成した翻訳結果を前記関連情報に基づいて前記携帯端末に送信する結果送信部とを備えたことを特徴とするサーバ。

2 5 . 携帯端末とデータ交換を行うサーバであって、キー入力されたキーワード、処理サービスの指示および前記携帯端末の関連情報からなるデータを受信するデータ受信部と、

前記キーワードに対する関連文を生成し、生成した前記関連文を翻訳して翻訳結果を生成するテキスト翻訳部と、受信したデータに含まれる前記処理サービスの指示に従つて前記テキスト翻訳部を動作させる処理制御部と、前記テキスト翻訳部で生成した翻訳結果を前記関連情報に基づいて前記携帯端末に送信する結果送信部とを備えたことを特徴とするサーバ。

2 6 . 画像内文字列認識 · 翻訳部が、

異なる複数の条件で画像内の 1個の文字列を認識することにより複数個の文字列認識結果を生成する画像内文字列認識部と、

生成した前記複数個の文字列認識結果をそれぞれ翻訳した複数個の翻訳結果を生成する画像内文字列翻訳部とを有したことを特徴とする請求の範囲第 2 3項または請求の範囲第 2 4項記載のサーバ。

2 7 . 画像内文字列認識 · 翻訳部が、

生成した前記文字列認識結果と前記類似文字列のそれぞれを翻訳することにより複数個の翻訳結果を生成する画像内文字列翻訳部とを有したことを特徴とする請求の範囲第 2 3項または請求の範囲第 2 4項記載のサーバ。

2 8 . テキスト翻訳部が、

キー入力部で入力したキーワードに基づいて関連文辞書を参照して前記キーワードに関連性の高い複数個の文章を生成する関連文生成部と、生成された前記複数個の文章を翻訳することにより翻訳結果を生成する関連文翻訳部とを有したことを特徴とする請求の範囲第 2 5項記載のサーバ。

2 9 . 連続的に受信された複数個の画像を合成して 1枚の合成画像を作成する画像統合部を備え、

画像内文字列認識 · 翻訳部が、作成された前記合成画像に含まれる文字列に対す ¾翻訳結果を生成するようにしたことを特徵とする請求の範囲第 2 3項、請求の範囲第 2 4 項および請求の範囲第 2 6項および請求の範囲第 2 7項のうちのいずれか 1項記載のサーバ。

3 0 . 各施設の位置を格納した地図デ一夕を備え、処理制御部が、受信したデータに含まれる携帯端末の現在位置に基づいて前記地図データを参照することにより当該携帯端末を所持するユーザが現在いる施設を特定し、当該サーバ内で用いる各種の辞書を特定された前記施設に対応する専用辞書に置き換えるようにしたことを特徴とする請求の範囲第 2 3項から請求の範囲第 2 9項のうちのいずれか 1項記載のサーバ。

3 1 . 処理制御部が、受信したデータに含まれる指定された専用辞書の種類に基づいて当該サーバ内で用いる各種の辞書を指定された専用辞書に置き換えるようにしたことを特徴とする請求の範囲第 2 3項から請求の範囲第 2 9項のうちのいずれか 1項記載のサーバ。