JP2003178067A - 携帯端末型画像処理システム、携帯端末およびサーバ - Google Patents

携帯端末型画像処理システム、携帯端末およびサーバ

Info

Publication number
JP2003178067A
JP2003178067A JP2001376254A JP2001376254A JP2003178067A JP 2003178067 A JP2003178067 A JP 2003178067A JP 2001376254 A JP2001376254 A JP 2001376254A JP 2001376254 A JP2001376254 A JP 2001376254A JP 2003178067 A JP2003178067 A JP 2003178067A
Authority
JP
Japan
Prior art keywords
image
unit
translation
character string
mobile terminal
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2001376254A
Other languages
English (en)
Inventor
Takashi Hirano
敬 平野
Yasuhiro Okada
康裕 岡田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Mitsubishi Electric Corp
Original Assignee
Mitsubishi Electric Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Mitsubishi Electric Corp filed Critical Mitsubishi Electric Corp
Priority to JP2001376254A priority Critical patent/JP2003178067A/ja
Priority to PCT/JP2002/012281 priority patent/WO2003050714A1/ja
Priority to US10/498,267 priority patent/US20050221856A1/en
Priority to CNA028271130A priority patent/CN1615478A/zh
Publication of JP2003178067A publication Critical patent/JP2003178067A/ja
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/40Processing or translation of natural language
    • G06F40/58Use of machine translation, e.g. for multi-lingual retrieval, for server-side translation for client devices or for real-time translation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition

Abstract

(57)【要約】 【課題】 携帯端末のカメラで撮像した画像は、解像度
が低く、画像の品質が悪く、また、これらの画像の文字
を現状の文字認識処理で行った場合、誤認識する可能性
が高く、得たテキストをそのまま翻訳しても、正しい結
果が得にくいなどの課題があった。 【解決手段】 携帯端末のカメラにより撮像した画像あ
るいはキー入力部で入力したキーワード、処理サービス
の種類および携帯端末の関連情報からなるデータを送信
し、サーバにおいて、画像内文字列認識・翻訳部により
受信画像に含まれる1個の文字列に対して抽出した複数
個の文字列を翻訳するか、あるいは受信キーワードに対
し生成した関連文を翻訳して翻訳結果を携帯端末に送信
する。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】この発明は携帯端末のカメラ
で撮像した画像に含まれる文字を翻訳する携帯端末型画
像処理システム、携帯端末およびサーバに関するもので
ある。
【0002】
【従来の技術】近年、カメラを装備した携帯電話の製品
化が盛んになってきた。このような携帯端末のカメラで
撮像した画像に含まれる文字列を文字認識して、認識結
果のテキストを翻訳するシステムについて特開平9−1
38802号公報に開示されている。この方式は、携帯
端末内部に文字認識処理と翻訳処理を持ち、これらの処
理を用いてカメラで撮像した画像内の文字列を認識・翻
訳するものである。しかし、この方式では、携帯端末の
サイズ上の制限により、高度な文字認識処理と翻訳処理
を行うことが困難な課題がある。
【0003】一方、これに対して、携帯端末(携帯電
話)のカメラで撮像した画像を外部のサーバに一旦送信
し、サーバ側で画像内の文字を認識・翻訳した結果を携
帯端末に送り返す方式が特開平10−134004号公
報に提案されている。この方式によれば、処理性能の高
いサーバ側で文字認識と翻訳を行うため、高度な処理が
可能となる。以下、この方式の動作について図25を用
いて説明する。
【0004】図25は従来の携帯端末型画像処理システ
ムに係る処理手順を示すフローチャートで、この処理手
順は、携帯端末における処理とサーバにおける処理の二
つに別れる。まず、携帯端末側において、ユーザが携帯
端末に内蔵または接続されたカメラを用いて画像を撮像
する。ここでは、紙面に手書きされたメモや、印刷され
た文書の一部を読み取る(ステップST1)。読み取っ
た画像に関して処理したいサービスを指定する。サービ
スとしては、例えばステップST1で撮像した画像に含
まれる文字列の翻訳や、その文字をキーワードとしたデ
ータベース検索などを指定する。ここでは、文字列の翻
訳サービスを指定するものとする(ステップST2)。
その後、撮像した画像と指定したサービス要求をサーバ
に送信する(ステップST3)。
【0005】次にサーバ側において、携帯端末からの画
像とサービス要求を受信すると(ステップST4)、受
信した画像を処理するアプリケーションプログラムを起
動する(ステップST5)。起動したアプリケーション
プログラムにより受信した画像に含まれる文字列を認識
して、テキストを得る(ステップST6)。次に、携帯
端末で指定したサービスを実行する。ここでは、翻訳サ
ービスを指定しているので抽出されたテキストを翻訳す
る(ステップST7)。翻訳の処理結果を携帯端末に送
信する(ステップST8)。
【0006】その後、携帯端末側において、サーバから
送信された処理結果を受信する(ステップST9)。受
信した処理結果の内容、すなわち翻訳文を携帯端末のデ
ィスプレイに表示する(ステップST10)。以上の処
理により、携帯端末のカメラで撮像した画像に含まれる
文字列の翻訳結果を得ることができる。
【0007】
【発明が解決しようとする課題】従来の方式は以上のよ
うに構成されているので、画像内の文字列を文字認識し
た結果の文字列(テキスト)を翻訳することで、画像内
の文字列に対する翻訳結果を得ている。しかし、携帯端
末のカメラで撮像した画像は、一般のOCR(文字認識
装置)が認識対象とするスキャナで読み取った画像に比
べて解像度が低く、画像の品質が悪い。また、海外にお
いて他国語で記入された看板中の文字列をカメラで撮像
して、自国語に翻訳するというような使用方法が想定さ
れるが、看板の文字列は飾り文字が多い。このような品
質の悪い画像内の文字列や飾り文字に対して、現状の文
字認識処理の性能は低く、誤認識する可能性が高い。そ
のため、文字認識処理で得たテキストをそのまま翻訳し
ても、正しい結果が得ることは困難であるという課題が
あった。
【0008】また、一度に多数の文字列を翻訳する場
合、ユーザは翻訳したい文字列上にカメラの視野を移動
させてシャッターを押すという作業を何度も繰り返す必
要が生じ、手間を要するという課題があった。さらに、
携帯端末のカメラで撮像した画像は解像度が低いため、
長い文字列や文章を1枚の画像内に納めることができな
い。これに対して、カメラを後ろに引くなどして広範囲
を撮像すれば、長い文字列も1枚の画像に納めることは
可能であるが、1文字を表現する画素数は少なくなり、
文字認識率が低下する。このため翻訳可能な文字列の長
さが制限されるという課題があった。
【0009】さらにまた、携帯端末で撮像した画像をサ
ーバに送信する場合、送信するデータ量が大きいため、
一般の電話回線ではデータ送信に時間がかかるという課
題がある。加えて、従来の方式において、サーバが持つ
文字認識処理や翻訳処理は、一般用語を対象としたもの
と考えられるが、その場合はメニューに載っている郷土
料理の名前や診断書に記入された病名等、専門性の高い
用語に対して十分な文字認識性能および翻訳性能を得る
ことが困難であるという課題があった。また、このよう
なシステムを海外旅行等で使用する場合、画像に含まれ
る他国語の文字列を自国語に翻訳する使用形態に加え、
逆に自国語で入力したテキストを他国語に翻訳する要求
も想定される。しかし、携帯端末では、テキストの入力
に手間がかかるなどの課題があった。
【0010】この発明は上記のような課題を解決するた
めになされたもので、翻訳を行う上で利便性の高い携帯
端末型翻訳システム、携帯端末およびサーバを得ること
を目的とする。
【0011】
【課題を解決するための手段】この発明に係る携帯端末
型翻訳システムは、携帯端末とこの携帯端末とデータ交
換を行うサーバとからなり、前記携帯端末は、画像撮像
部と、この画像撮像部により撮像した画像を蓄積する画
像バッファと、キーワードを入力するキー入力部と、前
記サーバへ依頼する処理サービスの種類を指定する処理
指示部と、前記画像バッファに蓄積された画像あるいは
前記キー入力部により入力されたキーワード、指定され
た処理サービスの種類および前記携帯端末の関連情報か
らなるデータを前記サーバに送信するデータ送信部と、
前記サーバにおいて翻訳処理された翻訳結果を受信する
結果受信部と、受信した前記翻訳結果を表示する表示部
とを備え、前記サーバは、前記携帯端末から送信された
データを受信するデータ受信部と、受信した前記画像に
含まれる1個の文字列に対して複数個の文字列を抽出
し、抽出した前記複数個の文字列を翻訳してそれぞれの
翻訳結果を生成する画像内文字列認識・翻訳部と、受信
した前記キーワードに対する関連文を生成し、生成され
た前記関連文を翻訳して翻訳結果を生成するテキスト翻
訳部と、受信したデータに含まれる前記指定された処理
サービスの種類に従って前記画像内文字列認識・翻訳部
で処理するか、あるいは前記テキスト翻訳部で処理する
かを切り替え制御する処理制御部と、前記画像内文字列
認識・翻訳部または前記テキスト翻訳部で生成された翻
訳結果を前記関連情報に基づいて前記携帯端末に送信す
る結果送信部とを備えたものである。
【0012】この発明に係る携帯端末型翻訳システム
は、携帯端末とこの携帯端末とデータ交換を行うサーバ
とからなり、前記携帯端末は、画像撮像部と、この画像
撮像部により撮像した画像を蓄積する画像バッファと、
前記サーバへ依頼する処理サービスを指示する処理指示
部と、前記画像バッファに蓄積された画像、前記処理サ
ービスの指示および前記携帯端末の関連情報からなるデ
ータを前記サーバに送信するデータ送信部と、前記サー
バにおいて翻訳処理された翻訳結果を受信する結果受信
部と、受信した前記翻訳結果を表示する表示部とを備
え、前記サーバは、前記携帯端末から送信されたデータ
を受信するデータ受信部と、受信した前記画像に含まれ
る1個の文字列に対して複数個の文字列を抽出し、抽出
した前記複数個の文字列を翻訳してそれぞれの翻訳結果
を生成する画像内文字列認識・翻訳部と、受信したデー
タに含まれる前記処理サービスの指示に従って前記画像
内文字列認識・翻訳部を動作させる処理制御部と、生成
された前記翻訳結果を前記関連情報に基づいて前記携帯
端末に送信する結果送信部とを備えたものである。
【0013】この発明に係る携帯端末型翻訳システム
は、携帯端末とこの携帯端末とデータ交換を行うサーバ
とからなり、前記携帯端末は、キーワードを入力するキ
ー入力部と、前記サーバへ依頼する処理サービスを指示
する処理指示部と、前記キー入力部により入力されたキ
ーワード、前記処理サービスの指示および前記携帯端末
の関連情報からなるデータを前記サーバに送信するデー
タ送信部と、前記サーバにおいて翻訳処理された翻訳結
果を受信する結果受信部と、受信した前記翻訳結果を表
示する表示部とを備え、前記サーバは、前記携帯端末か
ら送信されたデータを受信するデータ受信部と、受信し
たデータに含まれる前記キーワードに対する関連文を生
成し、生成された前記関連文を翻訳して前記翻訳結果を
生成するテキスト翻訳部と、受信したデータに含まれる
前記処理サービスの指示に従って前記テキスト翻訳部を
動作させる処理制御部と、生成された前記翻訳結果を前
記関連情報に基づいて前記携帯端末に送信する結果送信
部とを備えたものである。
【0014】この発明に係る携帯端末型翻訳システム
は、サーバの画像内文字列認識・翻訳部が、異なる複数
の条件で画像内の1個の文字列を認識することにより複
数個の文字列認識結果を生成する画像内文字列認識部
と、生成した前記複数個の文字列認識結果をそれぞれ翻
訳した複数個の翻訳結果を生成する画像内文字列翻訳部
とを有したものである。
【0015】この発明に係る携帯端末型翻訳システム
は、サーバの画像内文字列認識・翻訳部が、異なる複数
の条件で画像内の1個の文字列を認識することにより複
数個の文字列認識結果を生成すると共に、言語辞書を用
いて前記複数個の文字列認識結果に対してスペリングが
類似する類似文字列を生成する画像内文字列認識部と、
生成した前記文字列認識結果と前記類似文字列のそれぞ
れを翻訳することにより複数個の翻訳結果を生成する画
像内文字列翻訳部とを有したものである。
【0016】この発明に係る携帯端末型翻訳システム
は、サーバのテキスト翻訳部が、受信したキーワードに
基づいて関連文辞書を参照して前記キーワードに関連性
の高い複数個の文章を生成する関連文生成部と、生成さ
れた前記複数個の文章を翻訳することにより翻訳結果を
生成する関連文翻訳部とを有したものである。
【0017】この発明に係る携帯端末型翻訳システム
は、携帯端末は、画像撮像部により一定の時間間隔で連
続的に撮像され画像バッファに蓄積した各画像を順次選
択してデータ送信部に出力する送信画像制御部を備え、
サーバが、受信した前記各画像に含まれる文字列の各翻
訳結果を順次生成して前記携帯端末に送信し、前記携帯
端末の表示部が、前記各翻訳結果を受信する都度表示す
るようにしたものである。
【0018】この発明に係る携帯端末型翻訳システム
は、携帯端末の送信制御部が、画像バッファから順次読
み出す画像について、新しく撮像された画像とその一つ
前に撮像された画像との差を比較し、その差が閾値以下
となった場合に前記新しく撮像された画像を選択してデ
ータ送信部に出力するようにしたものである。
【0019】この発明に係る携帯端末型翻訳システム
は、サーバは、連続的に受信された複数個の画像を合成
して1枚の合成画像を作成する画像統合部を備え、画像
内文字列認識・翻訳部が、作成された前記合成画像に含
まれる文字列に対する翻訳結果を生成するようにしたも
のである。
【0020】この発明に係る携帯端末型翻訳システム
は、携帯端末は、当該携帯端末の現在位置を取得してサ
ーバに送信するデータに加えるGPS部を備え、前記サ
ーバは、各施設の位置を格納した地図データを備え、前
記サーバの処理制御部が、受信した前記現在位置に基づ
いて前記地図データを参照することにより当該携帯端末
を所持するユーザが現在いる施設を特定し、当該サーバ
内で用いる各種の辞書を特定された前記施設に対応する
専用辞書に置き換えるようにしたものである。
【0021】この発明に係る携帯端末型翻訳システム
は、携帯端末の処理指示部が、ユーザにより専用辞書の
種類を指定できるように構成し、指定された前記専用辞
書の種類をサーバに送信するデータに加え、前記サーバ
の処理制御部が、受信した前記専用辞書の種類に基づい
て当該サーバ内で用いる各種の辞書を指定された専用辞
書に置き換えるようにしたものである。
【0022】この発明に係る携帯端末型翻訳システム
は、携帯端末は、画像バッファに蓄積されたカラー画像
あるいはグレースケール画像から文字列と背景を分離す
るように二値化した前処理後画像を作成し前記画像バッ
ファに蓄積する画像前処理部を備え、前記前処理後画像
をサーバに送信して翻訳結果を得るようにしたものであ
る。
【0023】この発明に係る携帯端末型翻訳システム
は、携帯端末が、前処理後画像にノイズが含まれる場合
にはキー入力により前記ノイズを囲むノイズ除去対象領
域を指定できるように構成され、画像前処理部が、前記
ノイズ除去対象領域内の黒画素を白画素に変換して前処
理後画像を編集するようにしたものである。
【0024】この発明に係る携帯端末は、翻訳処理を行
うサーバとデータ交換を行う携帯端末であって、画像撮
像部と、この画像撮像部により撮像した画像を蓄積する
画像バッファと、キーワードを入力するキー入力部と、
前記サーバへ依頼する処理サービスの種類を指定する処
理指示部と、前記画像バッファに蓄積された画像あるい
は入力されたキーワード、指定した前記処理サービスの
種類および前記携帯端末の関連情報からなるデータを前
記サーバに送信するデータ送信部と、前記サーバにおい
て認識された認識文字列および翻訳処理された翻訳結果
を受信する結果受信部と、受信した前記翻訳結果を表示
する表示部とを備えたものである。
【0025】この発明に係る携帯端末は、翻訳処理を行
うサーバとデータ交換を行う携帯端末であって、画像撮
像部と、この画像撮像部により撮像した画像を蓄積する
画像バッファと、前記サーバへ依頼する処理サービスを
指示する処理指示部と、前記画像バッファに蓄積された
画像、前記処理サービスの指示および前記携帯端末の関
連情報からなるデータを前記サーバに送信するデータ送
信部と、前記サーバにおいて認識された認識文字列およ
び翻訳処理された翻訳結果を受信する結果受信部と、受
信した前記翻訳結果を表示する表示部とを備えたもので
ある。
【0026】この発明に係る携帯端末は、翻訳処理を行
うサーバとデータ交換を行う携帯端末であって、キーワ
ードを入力するキー入力部と、前記サーバへ依頼する処
理サービスを指示する処理指示部と、入力されたキーワ
ード、前記処理サービスの指示および前記携帯端末の関
連情報からなるデータを前記サーバに送信するデータ送
信部と、前記サーバにおいて翻訳処理された翻訳結果を
受信する結果受信部と、受信した前記翻訳結果を表示す
る表示部とを備えたものである。
【0027】この発明に係る携帯端末は、画像撮像部に
より一定の時間間隔で連続的に撮像され画像バッファに
蓄積した各画像を順次選択してデータ送信部に出力する
送信画像制御部を備え、表示部が、サーバから順次受信
する前記各画像に含まれる文字列の各翻訳結果を逐次表
示するようにしたものである。
【0028】この発明に係る携帯端末は、送信制御部
が、画像バッファから順次読み出す画像について、新し
く撮像された画像とその一つ前に撮像された画像との差
を比較し、その差が閾値以下となった場合に前記新しく
撮像された画像を選択してデータ送信部に出力するよう
にしたものである。
【0029】この発明に係る携帯端末は、GPS機能に
より当該携帯端末の現在位置を取得してサーバに送信す
るデータに加えるGPS部を備えたものである。
【0030】この発明に係る携帯端末は、サーバ内で使
用する専用辞書の種類をユーザにより指定できるように
構成し、指定された前記専用辞書の種類をサーバに送信
するデータに加えるようにしたものである。
【0031】この発明に係る携帯端末は、画像バッファ
に蓄積されたカラー画像あるいはグレースケール画像か
ら文字列と背景を分離するように二値化した前処理後画
像を作成し前記画像バッファに蓄積する画像前処理部を
備え、前記画像バッファから読み出した前記前処理後画
像をサーバに送信して翻訳結果を得るようにしたもので
ある。
【0032】この発明に係る携帯端末は、前処理後画像
にノイズが含まれる場合にはキー入力により前記ノイズ
を囲むノイズ除去対象領域を指定できるように構成さ
れ、画像前処理部が、前記ノイズ除去対象領域内の黒画
素を白画素に変換して前処理後画像を編集するようにし
たものである。
【0033】この発明に係るサーバは、携帯端末とデー
タ交換を行うサーバであって、前記携帯端末から送信さ
れた画像あるいはキー入力されたキーワード、指定され
た処理サービスの種類および前記携帯端末の関連情報か
らなるデータを受信するデータ受信部と、受信した前記
画像に含まれる1個の文字列に対して複数個の文字列を
抽出し、抽出した前記複数個の文字列を翻訳してそれぞ
れの翻訳結果を生成する画像内文字列認識・翻訳部と、
前記キーワードに対する関連文を生成し、生成した前記
関連文を翻訳して翻訳結果を生成するテキスト翻訳部
と、前記指定された処理サービスの種類に従って前記画
像内文字列認識・翻訳部で処理するか、あるいは前記テ
キスト翻訳部で処理するかを切り替え制御する処理制御
部と、前記画像内文字列認識・翻訳部あるいは前記テキ
スト翻訳部で生成した翻訳結果を前記関連情報に基づい
て前記携帯端末に送信する結果送信部とを備えたもので
ある。
【0034】この発明に係るサーバは、携帯端末とデー
タ交換を行うサーバであって、前記携帯端末から送信さ
れた画像、処理サービスの指示および前記携帯端末の関
連情報からなるデータを受信するデータ受信部と、受信
した前記画像に含まれる1個の文字列に対して複数個の
文字列を抽出し、抽出した前記複数個の文字列を翻訳し
てそれぞれの翻訳結果を生成する画像内文字列認識・翻
訳部と、受信したデータに含まれる前記処理サービスの
指示に従って前記画像内文字列認識・翻訳部を動作させ
る処理制御部と、前記画像内文字列認識・翻訳部あるい
は前記テキスト翻訳部で生成した翻訳結果を前記関連情
報に基づいて前記携帯端末に送信する結果送信部とを備
えたものである。
【0035】この発明に係るサーバは、携帯端末とデー
タ交換を行うサーバであって、キー入力されたキーワー
ド、処理サービスの指示および前記携帯端末の関連情報
からなるデータを受信するデータ受信部と、前記キーワ
ードに対する関連文を生成し、生成した前記関連文を翻
訳して翻訳結果を生成するテキスト翻訳部と、受信した
データに含まれる前記処理サービスの指示に従って前記
テキスト翻訳部を動作させる処理制御部と、前記テキス
ト翻訳部で生成した翻訳結果を前記関連情報に基づいて
前記携帯端末に送信する結果送信部とを備えたものであ
る。
【0036】この発明に係るサーバは、画像内文字列認
識・翻訳部が、異なる複数の条件で画像内の1個の文字
列を認識することにより複数個の文字列認識結果を生成
する画像内文字列認識部と、生成した前記複数個の文字
列認識結果をそれぞれ翻訳した複数個の翻訳結果を生成
する画像内文字列翻訳部とを有したものである。
【0037】この発明に係るサーバは、画像内文字列認
識・翻訳部が、異なる複数の条件で画像内の1個の文字
列を認識することにより複数個の文字列認識結果を生成
すると共に、言語辞書を用いて前記複数個の文字列認識
結果に対してスペリングが類似する類似文字列を生成す
る画像内文字列認識部と、生成した前記文字列認識結果
と前記類似文字列のそれぞれを翻訳することにより複数
個の翻訳結果を生成する画像内文字列翻訳部とを有した
ものである。
【0038】この発明に係るサーバは、テキスト翻訳部
が、キー入力部で入力したキーワードに基づいて関連文
辞書を参照して前記キーワードに関連性の高い複数個の
文章を生成する関連文生成部と、生成された前記複数個
の文章を翻訳することにより翻訳結果を生成する関連文
翻訳部とを有したものである。
【0039】この発明に係るサーバは、連続的に受信さ
れた複数個の画像を合成して1枚の合成画像を作成する
画像統合部を備え、画像内文字列認識・翻訳部が、作成
された前記合成画像に含まれる文字列に対する翻訳結果
を生成するようにしたものである。
【0040】この発明に係るサーバは、各施設の位置を
格納した地図データを備え、処理制御部が、受信したデ
ータに含まれる携帯端末の現在位置に基づいて前記地図
データを参照することにより当該携帯端末を所持するユ
ーザが現在いる施設を特定し、当該サーバ内で用いる各
種の辞書を特定された前記施設に対応する専用辞書に置
き換えるようにしたものである。
【0041】この発明に係るサーバは、処理制御部が、
受信したデータに含まれる指定された専用辞書の種類に
基づいて当該サーバ内で用いる各種の辞書を指定された
専用辞書に置き換えるようにしたものである。
【0042】
【発明の実施の形態】以下、この発明の実施の一形態を
説明する。 実施の形態1.図1はこの発明の実施の形態1による携
帯端末型翻訳システムの構成を示すブロック図である。
図において、101は携帯端末、102はデータ送信
部、103はキー入力部、104は処理指示部、105
は画像撮像部、106は画像バッファ、107は表示
部、108は結果受信部である。109はサーバ、11
0はデータ受信部、111は結果送信部、112は処理
制御部、113は画像内文字列認識・翻訳部、119は
テキスト翻訳部である。画像内文字列認識・翻訳部11
3において、114は画像内文字列認識部、115は画
像内文字列翻訳部、116は画像内文字列翻訳結果生成
部、117は認識辞書、118は言語辞書、124は第
1翻訳辞書である。テキスト翻訳部119において、1
20は関連文生成部、121は関連文翻訳部、122は
関連文翻訳結果生成部、123は関連文辞書、125は
第2翻訳辞書である。
【0043】図2は画像の撮像状況を説明する説明図で
あり、201は文書、202はカメラ視野である。図3
は画像内文字列認識部の処理手順を示すフローチャート
である。図4は画像内文字列認識部の動作例を説明する
説明図で、401は撮像画像、402は前処理後画像、
403は抽出文字列、404は切出した文字パターン、
405は文字認識結果である。図5は誤りを含む文字認
識処理の例を説明する説明図で、501は切出した文字
パターン、502は誤りを含む文字認識結果である。図
6は画像内文字列翻訳部の動作例を説明する説明図で、
601は文字列認識結果、602は類似文字列、603
は文字列認識結果601を翻訳した文字列翻訳結果、6
04は類似文字列602の文字列翻訳結果である。
【0044】図7は画像内文字列翻訳結果生成部の動作
例を説明する説明図で、701は画像内文字列翻訳結果
の例である。図8は画像内文字列翻訳結果の表示例を示
す説明図で、801は認識文字列画像、802は画像内
文字列翻訳結果の画像である。図9はキーワード入力の
表示例を示す説明図で、901はキーワード入力エリ
ア、902は翻訳ボタン表示である。図10は関連文辞
書の構成例を示す説明図で、1001は関連文辞書デー
タである。図11は関連文翻訳部の動作例を説明する説
明図で、1101は入力テキスト、1102は関連文、
1103,1104は文字列翻訳結果である。図12は
関連文翻訳結果生成部の動作例を説明する説明図で、1
201は関連文翻訳結果生成部の出力結果である。図1
3は関連文翻訳結果の表示例を示す説明図で、1301
は翻訳結果である。
【0045】次に動作について説明する。この翻訳シス
テムは携帯端末101とサーバ109で構成される。こ
の携帯端末101は、サーバ109とデータを送受信す
る通信機能を備えており、サーバ109に処理を依頼し
て、その処理結果を受信して表示することができる。こ
の携帯端末101とサーバ109間の通信は、無線でデ
ータを送受信する方式や赤外線通信でデータを送受信す
る方式または有線でデータを送受信する方式により行
う。ここで、サーバ109は2つのサービスを有する。
一つは携帯端末の画像撮像部105より撮像した画像に
含まれる文字列を翻訳するサービスであり、以降これを
画像内文字列認識・翻訳サービスと呼ぶ。もう一つは、
携帯端末のキー入力部103より入力したテキストの内
容を翻訳するサービスであり、以降、これをテキスト翻
訳サービスと呼ぶ。
【0046】画像内文字列認識・翻訳サービスの動作を
説明する。ユーザは携帯端末101の画像撮像部105
により文字列を含む画像を撮像する。例えば、図2に示
すように携帯端末101を文書201の前に近づけて、
カメラ視野202の範囲を1枚の画像として撮像する。
この画像撮像部105は、携帯端末101に付属または
接続された画像撮像機能を持つCCDやCMOSセンサ
等を備えたカメラであり、撮像した画像はカラー画像も
しくはグレースケール画像である。また、撮像する対象
は文書の一部あるいは看板や案内板等情景中の文字であ
る。画像撮像部105で撮像された画像は画像バッファ
106に蓄積される。
【0047】次に、処理指示部104はサーバ109で
行う処理サービスの種類を指定する。この指定は、キー
入力部103からユーザが行うか、またはデフォルトの
設定を用いて自動的に行うようになっている。ここで
は、処理サービスの種類として、画像内文字列認識・翻
訳を指定する。処理指示部104により処理サービスが
指定されると、データ送信部102は、画像バッファ1
06に蓄積された画像、処理指示部104で指定した処
理サービスの種類および携帯端末101に関する関連情
報(例えば、機種コード等)からなるデータをサーバ1
09に送信する。
【0048】サーバ109では、データ受信部110に
より携帯端末101のデータ送信部102から送信され
たデータを受信すると、処理制御部112に入力する。
処理制御部112は、指定した処理サービスの種類に応
じて以降の処理内容を切り替える。ここでは、前述した
ように画像内文字列認識・翻訳サービスを指定している
ので、画像内文字列認識・翻訳部113が動作するよう
に制御される。仮に処理指示部104でテキスト翻訳サ
ービスが指定されている場合には、テキスト翻訳部11
9が動作するように制御されることになる。
【0049】画像内文字列認識・翻訳部113では、ま
ず画像内文字列認識部114が動作し、携帯端末101
から送信されたデータの画像内の文字列を認識する。こ
の画像内文字列認識部114の具体的な動作を図3の処
理手順に従い説明する。まず、携帯端末101から送信
された画像に対して前処理を行い(ステップST2
1)、画像内の文字列と背景を分離した前処理後画像を
作成する。例えば、携帯端末101から図4に示すよう
なカラーの撮像画像401が送信された場合、この撮像
画像401に前処理を適用することで、背景を白色、文
字列を黒色とした白黒の前処理後画像402を得る。こ
のような前処理の実現方法については、論文“Text
extraction from color do
cuments − clustering appr
oaches in three and four
dimensions”, T. Perroud,
K. Sobottka, H. Bunke, In
ternationalConference on
Document Analysis andReco
gnition (2001)に開示されている。
【0050】次に、前処理後画像から抽出して抽出文字
列を得る(ステップST22)。例えば、図4の前処理
後画像402から抽出文字列403を抽出する。このよ
うな白黒の画像から文字列を抽出する処理には、従来の
OCRで既に実現されている方式が用いられる。ステッ
プST22で抽出した抽出文字列の内容を文字認識する
(ステップST23)。文字認識の方法としては、文字
列を構成する1文字のパターンを切出し、切出したパタ
ーンを認識辞書117と比較して文字コードに変換する
方法が広く知られている。ここで、切出したパターンを
文字コードに変換する際に、言語辞書118を参照する
ことにより、言語的に整合性の高い文字認識結果を得る
ことができる。この方法も一般的である。例えば、図4
に示す抽出文字列403に本処理を適用した場合、まず
1文字づつ切出した文字パターン404を得、それら文
字パターン404を文字コードに変換することで、テキ
スト化された文字認識結果405を得る。
【0051】以上の処理により、画像内の文字列に対す
る文字列認識結果(テキスト)を得ることができる。た
だし、対象とする画像の解像度が低く、品質の悪い場合
や、認識対象とする文字列が飾り文字である場合には、
文字認識結果を誤ることが多い。例えば図5に示すよう
に、切出した文字パターン501に誤りが生じ、その結
果として誤った文字認識結果502を得ることがある。
この問題に対処するため、処理パラメータを変更してス
テップST21〜ST23の処理を複数回繰り返し、複
数個の文字認識結果を得る(ステップST24)。例え
ば、図4の抽出文字列403に対して処理パラメータを
変えてステップST21〜ST23の処理を2回繰り返
すことで、図6で示すように、2個の文字列認識結果6
01として“Strategic”と“Strange
r”を得る。このように、複数個の文字列認識結果を取
得すれば、その中に正解の文字列認識結果が含まれる可
能性は高い。しかし、ステップST24で得た複数個の
文字列認識結果にも正解が含まれない場合がある。そこ
で、言語辞書118を参照して、ステップST24で得
た複数個の文字列認識結果とスペリングが類似した文字
列を複数個抽出する(ステップST25)。例えば図6
に示すように、ステップST24で得た2個の文字列認
識結果601から、スペリングの類似した3個の類似文
字列602を作成する。
【0052】画像内文字列認識部114は、ステップS
T24で得た複数個の文字列認識結果とステップST2
5で得た複数個の類似文字列とを合せて画像内文字列翻
訳部115に出力する(ステップST26)。このよう
に複数個の文字列認識結果とそれらの文字列認識結果に
対する複数個の類似文字列とを出力するため、その中に
正解の文字列認識結果が含まれる可能性が一層高くな
る。以上が画像内文字列認識部114の動作である。
【0053】次に画像内文字列翻訳部115は、翻訳に
必要な情報を格納した第1翻訳辞書124を参照して、
画像内文字列認識部114で得た複数個の文字列認識結
果を翻訳し、文字列翻訳結果を得て画像内文字列翻訳結
果生成部116に出力する。この翻訳処理は、例えば図
6に示すように、画像内文字列認識部114で得た文字
列認識結果601と類似文字列602に対して、それぞ
れ翻訳した文字列翻訳結果603,604を得る。
【0054】画像内文字列翻訳結果生成部116は、画
像内文字認識部114で得た文字列認識結果と類似文字
列、および画像内文字列翻訳部115で得た文字列翻訳
結果をまとめ、携帯端末101に対して送信するための
データとして画像内文字列翻訳結果を作成する。例え
ば、図7の画像内文字列翻訳結果701は、図4に示す
撮像画像401に対して得られたものである。この画像
内文字列翻訳結果701は、前処理後画像402から切
出した抽出文字列403の位置座標(例えば、文字列を
囲む外接矩形の左上点x,y座標と外接矩形の幅w、高
さh)を持つ。加えて、画像内文字認識部114で得た
文字列認識結果と類似文字列、および画像内文字列翻訳
部115で得た文字列翻訳結果を持つ。サーバ109
は、画像内文字列翻訳結果生成部116で作成した文字
列翻訳結果を結果送信部111から携帯端末101に送
信する。
【0055】ここで文字列認識結果と類似文字列、およ
び文字列翻訳結果のデータ形式はテキストか、または画
像である。例えば、携帯端末101が文字列認識結果を
構成する言語の文字を表示する機能を持たない場合、そ
の文字列認識結果の描かれた画像を画像内文字列翻訳結
果に用いる。同様に、携帯端末101が文字列翻訳結果
を構成する言語の文字を表示する機能を持たない場合、
その文字列翻訳結果の描かれた画像を画像内文字列翻訳
結果に用いる。ここで、携帯端末101が特定の言語の
文字を表示する機能を持つか否かの判定は、携帯端末1
01の持つデータ送信部102から送信された携帯端末
に関する関連情報(機種コード等)に基づいて行う。
【0056】次に、携帯端末101では、まず結果受信
部108が、サーバ109の結果送信部111から送信
された画像内文字列翻訳結果を受信する。その後、表示
部107は、画像バッファ106に蓄積した撮像画像と
受信した画像内文字列翻訳結果を基に、撮像画像に含ま
れる文字列の翻訳結果を表示部107に表示する。この
表示部107は、液晶ディスプレイ等の文字や画像を表
示することのできる表示装置である。例えば図8に示す
ように、表示部107上に認識した文字列を表す認識文
字列画像801を表示し、同時に、文字列認識結果、類
似文字列および文字列翻訳結果からなる画像内文字列翻
訳結果の画像802を表示する。以上が、画像内文字列
認識・翻訳サービスの実行例である。
【0057】テキスト翻訳サービスの動作を説明する。
携帯端末101において、まずユーザがキー入力部10
3により、翻訳したいテキストを入力する。ただし、一
般の携帯端末ではテキストの入力に手間を要するため、
ここではテキストの内容に関連したキーワードを入力す
る。例えば「次のバスは何時に出発しますか?」という
テキストを翻訳したい場合、キーワードとして「バス」
と「時間」を入力する。図9は携帯端末でキーワードを
入力した例であり、入力したキーワードが表示部107
上のキーワード入力エリア901に表示されている。キ
ーワードを入力した後、ユーザがキー入力部103を操
作して表示部107上に表示された翻訳ボタン表示90
2を実行すると、翻訳のための処理を開始する。
【0058】処理指示部104はサーバ109で行う処
理サービスの種類を指定する。ここでは処理サービスの
種類として、テキスト翻訳サービスを指定する。する
と、データ送信部102は、キーワード入力エリア90
1に入力されたキーワード、処理指示部104で指定し
た処理サービスの種類および携帯端末101に関する関
連情報(例えば、機種コード等)をサーバ109に送信
する。
【0059】サーバ109において、データ受信部11
0が携帯端末101のデータ送信部102から送信され
たデータを受信し、処理制御部112に入力する。処理
制御部112は、処理指示部104で指定した処理サー
ビスの種類に応じて以降の処理内容を切り替える。ここ
では、処理指示部104でテキスト翻訳サービスが指定
されているため、テキスト翻訳部119が動作するよう
に制御する。
【0060】テキスト翻訳部119では、まず関連文生
成部120が動作し、携帯端末101から送信されたキ
ーワードと関連文辞書123のデータとを基に、キーワ
ードから類推される文章(以降、関連文と呼ぶ)を生成
する。ここで関連文辞書123は、例えば図10に示す
ような関連文辞書データ1001を持つ。この関連文辞
書データは多数の関連文と、その索引を格納したもので
ある。関連文生成部120は、この索引とデータ送信部
102から送信されたキーワードとを比較し、索引にキ
ーワードを含む関連文を関連文辞書123から読み出し
関連文翻訳部121に出力する。例えば、キーワードが
「バス」と「時間」の場合、関連文辞書データ1001
における関連文No.1「次のバスはいつ出発しますか
?」と関連文No.2「バスでどれくらい時間がかかり
ますか?」を出力する。
【0061】関連文翻訳部121は、データ送信部10
2から送信されたキーワードと関連文生成部120で得
た関連文を、第2翻訳辞書125を用いて翻訳する。例
えば、図11に示すキーワードに該当する入力テキスト
1101と関連文1102に対して翻訳処理を行い、そ
れぞれ文字列翻訳結果1103,1104を得て関連文
翻訳結果生成部122に出力する。このようなテキスト
を翻訳する機能は、一般の翻訳ソフトで既に実現されて
いる方法である。
【0062】関連文翻訳結果生成部122は、データ送
信部102から送信されたキーワード、関連文生成部1
20で得た関連文および関連文翻訳部121で得た文字
列翻訳結果をまとめて、携帯端末101に送るデータと
して関連文翻訳結果を作成し、結果送信部111に出力
する。例として、図12の関連文翻訳結果1201が示
される。ここには、「キーワードと関連文」およびそれ
らの「翻訳結果」が対応付けて格納されている。結果送
信部111は、関連文翻訳結果生成部122で作成した
関連文翻訳結果を携帯端末101に送信する。
【0063】ここで、翻訳結果のデータ形式は、テキス
トか画像である。例えば、携帯端末101が翻訳結果を
構成する言語の文字を表示する機能を持たない場合、そ
の翻訳結果の描かれた画像を関連文翻訳結果に用いる。
ここで、携帯端末101が特定の言語の文字を表示する
機能を持つか否かの判定は、携帯端末101の持つデー
タ送信部102から送信された携帯端末に関する関連情
報(機種コード等)に基づいて行う。
【0064】携帯端末101は、結果受信部108によ
り関連文翻訳結果を受信し、表示部107に与える。表
示部107は、受信した関連文翻訳結果の内容を表示す
る。例えば図13に示すように、表示部107はテキス
ト、関連分およびそれらの翻訳結果からなる翻訳結果1
301が表示される。以上が、テキスト翻訳サービスの
実行例である。
【0065】以上のように、この実施の形態1によれ
ば、画像内文字列に対する翻訳と入力したテキストに対
する翻訳の両方に対応できるシステムを実現する効果が
得られる。画像内文字列認識・翻訳サービスにおいて、
画像内文字列認識部114は、画像内の文字列から複数
個の文字認識結果と複数個の類似文字列を作成し、画像
内文字列翻訳部115では、それら複数個の文字認識結
果と複数個の類似文字列に対するそれぞれの翻訳結果を
作成し、これら複数個の翻訳結果を携帯端末101に送
信して表示部107に表示するようにしたので、文字認
識が困難で解像度が低い品質の悪い画像内の文字や飾り
文字に対しても正解率の高い翻訳結果を出せる効果が得
られる。また、テキスト翻訳サービスでは、携帯端末1
01で入力したキーワードから複数個の関連文を生成
し、それらの翻訳結果を携帯端末101の表示部107
に表示するようにしたので、翻訳したい全てのテキスト
を入力する必要がなく、面倒なテキスト入力の手間を削
減できると共に、正解率の高い要求する文章の翻訳結果
を得ることができる効果が得られる。
【0066】実施の形態2.上記実施の形態1の画像内
文字列認識・翻訳サービスでは、ユーザが携帯端末10
1で1枚の画像を撮像した後、その画像をサーバ109
に送信して、その画像内に含まれる文字列の翻訳結果を
得る。そのため、一度に多数の文字列を翻訳する場合、
ユーザは翻訳したい文字列上にカメラの視野を移動させ
てシャッターを押す作業を何度も繰り返す必要があり、
手間を要する。この課題は、ユーザが撮像を開始する
と、その後は一定の時間間隔で自動的に撮像を行い、そ
の撮像した画像を逐次サーバ109で翻訳することによ
り、半リアルタイムに翻訳結果を得るようにできれば解
決できる。実施の形態2はこれを実現するものである。
【0067】実施の形態2について図14から図17を
用いて説明する。図中、実施の形態1の各図と共通な部
分は同一の符号を付し、その説明を原則として省略す
る。図14は実施の形態2による携帯端末型翻訳システ
ムの構成を示すブロック図で、1401は送信画像制御
部である。図15は連続的な画像の撮像状況を示す説明
図で、1501はカメラ視野、1502はカメラ視野の
移動軌跡である。図16は連続的に撮像された画像例を
示す説明図で、1601は連続的に撮像した画像であ
る。図17は送信画像制御部の動作を説明する説明図
で、1701は分割領域である。
【0068】次に動作について説明する。携帯端末10
1において、画像内文字列認識・翻訳サービスを実行す
る際、画像撮像部105が文字列を含む画像を撮像す
る。実施の形態1と異なり、画像撮像部105は1度画
像を撮像した後、一定の時間間隔で連続的に画像を撮像
する。画像撮像部105で撮像した画像は、毎回、画像
バッファ106に蓄積される。この画像バッファ106
には1枚以上の画像を蓄積することができる。次に、送
信画像制御部1401は、まず画像バッファ106に蓄
積された画像の1枚を選択するが、この段階では、最初
に撮像された画像を選択する。処理指示部104は、実
施の形態1と同様にサーバ109で行う処理サービスの
種類を指定する。ここでは、処理サービスの種類として
画像内文字列認識・翻訳を指定することとする。
【0069】データ送信部102は、送信画像制御部1
401で選択した画像、処理指示部104で指定した処
理サービスの種類および携帯端末101に関する関連情
報(例えば、機種コード等)をサーバ109に送信す
る。サーバ109では、実施の形態1と同様に、データ
送信部102で送信した撮像画像に含まれる文字列を翻
訳して、その処理によって得られた画像内文字列翻訳結
果を携帯端末101に送信する。その後、実施の形態1
と同様に、携帯端末101において、結果受信部108
がサーバ109からの画像内文字列翻訳結果を受信して
表示部107により受信した翻訳結果を表示する。
【0070】次に、携帯端末101において、送信画像
制御部1401は画像バッファ106に蓄積された別の
画像(今翻訳した画像の次に撮像された画像)を選択
し、同様にサーバ109に対して画像内文字列認識・翻
訳サービスを依頼し、その翻訳結果を受け取って表示部
107に表示する。以降、画像バッファ106に蓄積さ
れた残りの画像に対して、同様に一連の処理を順次繰り
返す。
【0071】上記の一連の処理を繰り返している間、翻
訳したい文章を全て撮像するために、携帯端末101の
カメラ視野1501を、図15に示すように移動軌跡1
502に従って移動させていたとする。その結果、図1
6に示すような11個の撮像画像1601が得られる。
tは時間を表し、t=0が最初に撮像された画像を示
し、t=10が最後に撮像された画像を示す。これら各
々の撮像画像1601は、サーバ109に送信され、最
初に撮像された画像から順番に逐次翻訳され、その各翻
訳結果が携帯端末101の表示部107上に表示され
る。
【0072】なお、ここで送信画像制御部1401は、
撮像された順に全ての画像を選択すると説明したが、全
ての画像を選択してサーバ109に画像内文字列認識・
翻訳サービスを依頼することは、送信するデータ量の増
加と、サーバ109の処理量増加を招く。そこで、別の
基準に従って選択する画像を絞り込んでも良い。例え
ば、送信画像制御部1401は、画像バッファ106に
蓄積された画像に対して、図17に示すように、縦と横
にN等分した分割領域1701を作成し、分割領域毎の
輝度を求める。そして、新しく撮像された画像と、その
一つ前に撮像された画像とで分割領域毎の輝度値の差を
計算し、差の合計値が閾値以下となる場合に、新しく撮
像された画像を選択する。これにより、カメラの移動が
停止した時点で撮像された画像のみが選択され、ユーザ
が翻訳したい文字列を含む画像のみをサーバに送信する
ことができる。図17の例では、時間t=1、t=5、
t=7、t=10の撮像画像1601が選択されること
になる。
【0073】以上のように、実施の形態2によれば、ユ
ーザが撮像を開始すると、その後は一定の時間間隔で自
動的に撮像を行い、サーバ109側で、その撮像した画
像を逐次翻訳する。これにより、一度に多数の文字列を
翻訳する場合、ユーザは翻訳したい文字列上にカメラの
視野を移動させてシャッターを押す作業を何度も繰り返
す必要がなく、ユーザの手間を削減すると共に、半リア
ルタイムに翻訳結果を得ることができる効果が得られ
る。また、送信画像制御部1401は、撮像された画像
とその一つ前に撮像された画像との間で画像の変化量を
求め、その変化量が閾値以下の場合となる画像を選択し
てサーバ109に送信するので、ユーザが翻訳したい文
字列を含む画像のみに対する翻訳結果を得ることがで
き、かつデータ送信量とサーバ109の処理量を削減す
る効果が得られる。
【0074】実施の形態3.上記実施の形態1と2の画
像内文字列認識・翻訳サービスでは、翻訳したい文字列
を1枚の画像内に含む必要がある。しかし、携帯端末1
01のカメラで撮像した画像は解像度が低いため、長い
文字列や文章を1枚の画像内に納めることが困難であ
る。そのため翻訳可能な文字列の長さが制限されること
になる。このような課題は、携帯端末101から文字列
や文章の断片を撮像した複数枚の画像をサーバ109に
送信し、サーバ109側で、これらの複数枚の画像から
1枚の大きな合成画像を作成し、この合成画像に含まれ
る文字列を翻訳するようにすれば解決できる。実施の形
態3はこれを実現するものである。
【0075】以下、この発明の実施の形態3について図
15、図16、図18および図19を用いて説明する
が、図中、実施の形態1と2の各図と共通な部分は同一
の符号を付し、その説明を原則的には省略する。図18
はこの発明の実施の形態3による携帯端末型翻訳システ
ムの構成を示すブロック図で、1801は画像統合部で
ある。図19は画像統合部の動作例を説明する説明図
で、1901は合成画像、1902は合成画像に対応す
る前処理後画像、1903は抽出文字列、1904は文
字列認識結果、1905は類似文字列である。
【0076】次に動作について説明する。画像内文字列
認識・翻訳サービスを実行する際、まず携帯端末101
では、実施の形態2と同様に一定の時間間隔で画像を取
得し、それら複数の画像を画像バッファ106に蓄積す
る。例えば、図15に示したようにカメラ視野の移動軌
跡1502に従ってカメラ視野1501を移動させた場
合、複数個の撮像画像1601が画像バッファ106に
蓄積される。
【0077】次に、処理指示部104はサーバ109で
行う処理サービスの種類を指定する。ここでは処理サー
ビスの種類として画像内文字列認識・翻訳サービスを指
定すると共に、その実行条件として「合成画像を作成す
る」と指定する。この指定は、キー入力部103から人
間が行うか、もしくはデフォルトの設定を用いて自動的
に行う。これにより、データ送信部102は、画像バッ
ファ106に蓄積された複数個の画像、処理指示部10
4で指定した処理サービスの種類および実行条件、さら
に携帯端末101に関する関連情報(例えば、機種コー
ド等)をサーバ109に送信する。
【0078】サーバ109では、まずデータ受信部11
0がデータ送信部102から送信されたデータを受信
し、処理制御部112は、指定された処理サービスの種
類に応じて以降の処理内容を切り替える。また、画像内
文字列認識・翻訳サービスが指定されている場合、画像
統合部1801も動作する。画像統合部1801は、指
定した処理サービスの実行条件に「合成画像を作成す
る」との指定がある場合、受信された複数個の画像を合
成して1枚の合成画像を作成する。例えば、図16に示
す複数個の撮像画像1601を合成することで、図19
に示す合成画像1901を得る。このように複数の断片
的な画像から1枚の大きな合成画像を作成する処理は、
既に市販のディジタルカメラや画像処理ソフトに搭載さ
れており、これらの方式を用いて実現することができ
る。
【0079】以降、画像統合部1801で作成した合成
画像を対象として、画像内文字列認識部114が動作す
る。この画像内文字列認識部114では実施の形態1お
よび2と同様な処理を行う。例えば図19に示すよう
に、合成画像1901から前処理後画像1902を作成
し、この前処理後画像1902から抽出文字列1903
を抽出する。そして、この抽出文字列1903に対して
複数個の文字列認識結果1904と類似文字列1905
を得る。次に、画像内文字列翻訳部115は、実施の形
態1および2と同様に、画像内文字列認識部114で得
た複数個の内文字列認識結果と類似文字列に対するそれ
ぞれの文字列翻訳結果を生成する。
【0080】文字列翻訳結果が得られると、画像内文字
列翻訳結果生成部116は、画像内文字列翻訳結果を作
成する。実施の形態1および2では、画像内文字列翻訳
結果は、図7に示したように文字列位置座標、文字列認
識結果、類似文字列および文字列翻訳結果を持つ。この
実施の形態3では、合成画像から抽出した抽出文字列も
画像内文字列翻訳結果に追加する。その後、実施の形態
1および2と同様に、画像内文字列翻訳結果生成部11
6で作成した画像内文字列翻訳結果を結果送信部111
により携帯端末101に送信する。
【0081】携帯端末101では、結果受信部108
が、サーバ109送信された画像内文字列翻訳結果を結
果受信部108で受信し、表示部107に与えて表示す
る。この表示結果としては、図8に示したと同様に、合
成画像から抽出した認識文字列画像801を表示し、文
字列認識結果、類似文字列および文字列翻訳結果を含む
画像内文字列翻訳結果の画像802を表示する。
【0082】以上のように、この実施の形態3によれ
ば、携帯端末101から文字列や文章の断片を撮像した
複数枚の画像をサーバ109に送信すると、サーバ10
9はこれらの画像を統合して1枚の大きな合成画像を作
成し、この合成画像に含まれる文字列を認識して抽出し
翻訳するようにしたので、これによりカメラの視野に納
まらない長い文字列や文章の内容を翻訳できる効果が得
られる。
【0083】実施の形態4.上記実施の形態1から3に
おいて、サーバが持つ文字列認識処理や翻訳処理は、一
般用語を対象としたものである。しかし、例えば海外の
レストランに入って郷土料理の名前を翻訳したい場合、
あるいは海外の病院で診断書に記入された病名を翻訳し
たい場合等では、専門性の高い用語を翻訳する必要があ
る。このような場合は、十分な文字認識性能および翻訳
性能を得ることが困難である。この課題に対しては、ユ
ーザの指定や携帯端末のGPS(Global Pos
itioning System)機能から得られたユ
ーザの現在位置を基に、文字認識処理や翻訳処理に用い
る各種辞書を適切な専門用語辞書に置き換えて処理を行
うことで解決できる。実施の形態4はこれを実現するも
のである。
【0084】以下、実施の形態4について図20および
図21を用いて説明する。図中、実施の形態1から3と
共通な部分は同一の符号を付し、原則としてその説明を
省略する。図20は実施の形態4による携帯端末型翻訳
システムの構成を示すブロック図で、2001はGPS
部、2002は専用認識辞書、2003は専用言語辞
書、2004は第1専用翻訳辞書、2005は専用関連
文辞書、2006は第2専用翻訳辞書、2007は地図
データである。図21は認識条件指定の例を示す説明図
で、2101は選択画面である。
【0085】次に動作について説明するが、まず、画像
内文字列認識・翻訳サービスを実行する場合について説
明する。ここでは実施の形態1から3と同様な処理によ
り、画像撮像部105が文字列を含む画像を撮像して撮
像画像を画像バッファ106に蓄積する。その後、送信
画像制御部1401は、画像バッファ106に蓄積され
た1枚の画像を選択する。処理指示部104はサーバ1
09で行う処理サービスの種類とその実行条件を指定す
る。ここでは、処理サービスの種類として画像内文字列
認識・翻訳サービスを指定する。
【0086】また、GPS部2001は、GPS機能に
より人工衛星の発信した電波から所持している携帯端末
101の現在位置を取得する。データ送信部102は、
送信画像制御部1401で選択した画像と、処理指示部
104で指定した処理サービスの種類および携帯端末1
01に関する情報をサーバ109に送信する。ここで携
帯端末101に関する情報としては、関連情報(例、機
種コード)とGPS部2001で取得した携帯端末10
1の現在位置とが含まれる。
【0087】サーバ109では、実施の形態1から3と
同様に、データ送信部102で送信した撮像画像に含ま
れる文字列を翻訳して、その結果を携帯端末101に送
信する。ただしその際、処理制御部112は、GPS部
2001で取得した携帯端末101の現在位置に基づい
て地図データ2007の内容を参照して、携帯端末を所
持するユーザが現在いる施設を特定する。そして、画像
内文字列認識・翻訳部113で用いる各種の辞書を、特
定された施設に対応する専用辞書に置き換える。具体的
には、図1に示された認識辞書117と言語辞書118
と第1翻訳辞書124を、専用認識辞書2002と専用
言語辞書2003と第1専用翻訳辞書2004にそれぞ
れ置き換える。
【0088】ここで、地図データ2007には各種施設
の位置情報が格納されており、GPS部2001で取得
した携帯端末101の現在位置から、ユーザがどの施設
にいるかを知ることができる。したがって、処理制御部
112は、その施設に対応した専用辞書を選択する。例
えば、ユーザがレストランにいる場合は、レストランで
使用される確率が高い郷土料理のメニュー等を含んだ専
用辞書を選択する。以降、画像内文字列認識・翻訳部1
13では、各専用辞書2002,2003,2004を
用いて、実施の形態1から3と同様な処理を行う。そし
て、処理した翻訳結果を携帯端末101に送り、表示部
107で表示する。以上が実施の形態4における画像内
文字列認識・翻訳サービスの動作である。
【0089】次に、テキスト翻訳サービスの動作を説明
する。まず実施の形態1と同様に、ユーザがキー入力部
103により翻訳するキーワードを入力し、処理指示部
104はサーバ109で行う処理サービスの種類として
テキスト翻訳サービスを指定する。データ送信部102
は、キー入力部103で入力したキーワード、処理指示
部104で指定した処理サービスの種類および携帯端末
101に関する情報(機種コードと、GPS部2001
で取得したユーザの現在位置)をサーバ109に送信す
る。
【0090】以降、実施の形態1と同様な処理で翻訳処
理を行い、その結果を携帯端末101の表示部107に
表示する。ただし、処理制御部112は、データ送信部
102で指定された処理サービスの種類がテキスト翻訳
サービスである場合、GPS部2001で取得した携帯
端末101の現在位置に基づいて地図データ2007の
内容を参照し、携帯端末101を所持するユーザが現在
いる施設を特定する。そして、テキスト翻訳部119で
用いる各種の辞書を特定された施設に対応する専用辞書
に置き換える。具体的には、図1に示された関連文辞書
123と第2翻訳辞書125を、専用関連文辞書200
5と第2専用翻訳辞書2006にそれぞれ置き換える。
以上が本実施の形態におけるテキスト翻訳サービスの動
作である。
【0091】なお、上記の動作説明では、処理制御部1
12はGPS部2001で得たユーザの現在位置と地図
データ2007に基づいて専用辞書の種類を選択すると
したが、代りに携帯端末101から直接に専用辞書の種
類を指定するようにしても良い。例えば、処理指示部1
04により、表示部107に図21に示すような専用辞
書の種類を表す選択画面2101を表示し、ユーザがそ
の中から希望する専用辞書の種類を指定できるようにす
る。そして、データ送信部102がサーバ109に対し
て画像内文字列認識・翻訳サービスやテキスト翻訳サー
ビスを依頼する際に、処理指示部104によりユーザが
指定した専用辞書の種類を送信データに付けてサーバ1
09へ送信する。これにより、処理制御部112は、ユ
ーザが指定した専用辞書を選択し画像内文字列認識・翻
訳部113やテキスト翻訳部119の処理を実行するよ
うにする。
【0092】以上のように、この実施の形態4によれ
ば、ユーザにより指定するか、あるいはGPS部200
1で得た携帯端末101の現在位置とサーバ109の持
つ地図データ2007に基づいてユーザが現在いる施設
を特定し、サーバの文字列認識処理や翻訳処理に用いる
各種辞書を適切な専用辞書に置き換えるようにしたの
で、これにより翻訳結果の性能を向上させる効果が得ら
れる。
【0093】実施の形態5.上記実施の形態1から4に
おける画像内文字列認識・翻訳サービスでは、携帯端末
101からサーバ109に対して画像撮像部105で撮
像したカラー画像もしくはグレースケール画像を送信し
た。しかし、カラー画像やグレースケール画像はデータ
量が大きいため送信に時間を要する。この課題は、デー
タサイズを削減した画像を作成してサーバに送信するこ
とで解決できる。実施の形態5はこれを実現するもので
ある。
【0094】以下、実施の形態5について図22から図
24を用いて説明する。図中、実施の形態1から4と共
通な部分は同一の符号を付し、原則としてその説明を省
略する。図22は実施の形態5による携帯端末型翻訳シ
ステムの構成を示すブロック図で、2201は画像前処
理部である。図23は画像前処理部の動作を説明する説
明図で、2301は撮像画像、2302は前処理後画像
である。図24は画像前処理部における画像補正処理を
説明する説明図で、2401はノイズ、2402はノイ
ズ除去後の前処理後画像、2403はノイズ除去対象領
域である。
【0095】次に動作について説明する。まず、実施の
形態1から4と同様に、画像撮像部105は文字列を含
む画像を撮像し、画像バッファ106は画像撮像部10
5で撮像した画像を蓄積する。次に、画像前処理部22
01は、画像バッファ106に蓄積された撮像画像に対
して画像処理を行い、画像のデータ量を削減する。この
画像処理は、サーバ109の画像内文字列認識部114
の処理手順に含まれる前処理(図3のステップST2
1)と同じである。例えば、図23に示すように、画像
バッファ106に蓄積された画像2301に対して前処
理を適用すると、文字列部分を黒く背景部分を白くした
白黒の前処理後画像2302を得る。このような色数が
白黒の二色しかない二値化した画像は、画像撮像部10
5で撮像したカラー画像やグレースケール画像に比べて
データ量が小さい。このようにデータ量を削減した前処
理後画像は再び画像バッファ106に蓄積される。
【0096】また、画像撮像部105で撮像した画像上
にノイズが含まれると、そのノイズが前処理後の画像に
残る場合がある。例えば図24では、ノイズ2401が
前処理後画像2302上に黒く残っている。このような
ノイズ2401は、文字認識処理における誤認識の原因
となる。そのため、画像前処理部2201は、前処理後
画像からユーザがノイズを削除できる機能を持つ。例え
ば、前処理後画像を表示部107に表示して、ユーザは
これを目視でチェックする。そしてノイズを発見した場
合は、図24に示すようにノイズ2401を囲む矩形の
ノイズ除去対象領域2403を指定する。この指定はキ
ー入力部103を操作して行う。矩形のノイズ除去対象
領域2403が指定されると、画像前処理部2201は
ノイズ除去対象領域2403内の黒画素を白画素に変換
し、ノイズの無い前処理後画像2402に編集する。
【0097】その後、携帯端末101から画像内文字列
認識・翻訳サービスをサーバ109に依頼する際は、デ
ータ送信部102は画像バッファ106に蓄積された前
処理後画像をサーバ109に送信する。以降の処理は実
施の形態1から4と同じである。ただし、実施の形態1
から4ではサーバ109で行っていた前処理を既に携帯
端末101で行っているため、この実施の形態5のサー
バ109では前処理をスキップする。サーバ109は、
この前処理後画像を受信して、含まれる文字列を認識
し、その翻訳結果を得て携帯端末101に送信する。以
上が実施の形態5の動作である。
【0098】以上のように、この実施の形態5によれ
ば、携帯端末101の画像前処理部2201で前処理を
行い、カラー画像あるいはグレースケール画像から文字
列と背景を分離するように二値化した前処理後画像を作
成しサーバ109に送信し、前処理後画像に含まれる文
字列を翻訳するようにしたので、データ量を削減でき、
カラー画像やグレースケール画像に起因する送信時間を
削減すると共に、サーバ109での処理時間の短縮化が
図れる効果が得られる。また前処理後画像にノイズが含
まれる場合には、ノイズを除去した前処理後画像を得る
ようにしたので、サーバ109側の文字認識処理時にお
ける誤認識を引き起こす原因を取り除くことができる効
果が得られる。
【0099】各実施の形態について説明してきたが、こ
れらの例は、画像撮像部で撮像した画像に含まれる文字
列に対する翻訳処理と、キー入力部で入力したキーワー
ドについて関連文生成してその関連文に対する翻訳処理
とを共に持つ構成についてであった。これらの翻訳処理
はシステムとして別々に成り立つものである。また、サ
ーバ側が両方の処理ができる構成を備えているが、携帯
端末側がいずれか一方の処理だけを行うデータを送る構
成となる場合もある。ただし、その場合には、処理指示
部や処理制御部等の機能は若干変更されることになる。
【0100】
【発明の効果】以上のように、この発明によれば、携帯
端末とこの携帯端末とデータ交換を行うサーバとからな
り、携帯端末は、画像撮像部と、この画像撮像部により
撮像した画像を蓄積する画像バッファと、キーワードを
入力するキー入力部と、サーバへ依頼する処理サービス
の種類を指定する処理指示部と、画像バッファに蓄積さ
れた画像あるいはキー入力部により入力されたキーワー
ド、指定された処理サービスの種類および携帯端末の関
連情報からなるデータをサーバに送信するデータ送信部
と、サーバにおいて翻訳処理された翻訳結果を受信する
結果受信部と、受信した翻訳結果を表示する表示部とを
備え、サーバは、携帯端末から送信されたデータを受信
するデータ受信部と、受信した画像に含まれる1個の文
字列に対して複数個の文字列を抽出し、抽出した複数個
の文字列を翻訳してそれぞれの翻訳結果を生成する画像
内文字列認識・翻訳部と、受信したキーワードに対する
関連文を生成し、生成された関連文を翻訳して翻訳結果
を生成するテキスト翻訳部と、受信したデータに含まれ
る指定された処理サービスの種類に従って画像内文字列
認識・翻訳部で処理するか、あるいはテキスト翻訳部で
処理するかを切り替え制御する処理制御部と、画像内文
字列認識・翻訳部またはテキスト翻訳部で生成された翻
訳結果を関連情報に基づいて携帯端末に送信する結果送
信部とを備えるように構成したので、画像内文字列に対
する翻訳と入力したテキストに対する翻訳の両方に対応
できるシステムを実現する効果がある。また、画像内文
字列認識・翻訳の処理においては、文字認識が困難で解
像度が低い品質の悪い画像内の文字や飾り文字に対し
て、複数個の文字列を抽出することで翻訳を行うので、
正解率の高い翻訳結果が得られる効果があり、さらに、
テキスト翻訳の処理においては、キーワード入力のた
め、翻訳したい全てのテキストを入力する必要がなく、
テキスト入力の手間を削減できる効果がある。
【0101】この発明によれば、携帯端末とこの携帯端
末とデータ交換を行うサーバとからなり、携帯端末は、
画像撮像部と、この画像撮像部により撮像した画像を蓄
積する画像バッファと、サーバへ依頼する処理サービス
を指示する処理指示部と、画像バッファに蓄積された画
像、処理サービスの指示および携帯端末の関連情報から
なるデータをサーバに送信するデータ送信部と、サーバ
において翻訳処理された翻訳結果を受信する結果受信部
と、受信した翻訳結果を表示する表示部とを備え、サー
バは、携帯端末から送信されたデータを受信するデータ
受信部と、受信した画像に含まれる1個の文字列に対し
て複数個の文字列を抽出し、抽出した複数個の文字列を
翻訳してそれぞれの翻訳結果を生成する画像内文字列認
識・翻訳部と、受信したデータに含まれる処理サービス
の指示に従って画像内文字列認識・翻訳部を動作させる
処理制御部と、生成された翻訳結果を関連情報に基づい
て携帯端末に送信する結果送信部とを備えるように構成
したので、文字認識が困難で解像度が低い品質の悪い画
像内の文字や飾り文字に対しても正解率の高い翻訳結果
を得ることができる効果がある。
【0102】この発明によれば、携帯端末とこの携帯端
末とデータ交換を行うサーバとからなり、携帯端末は、
キーワードを入力するキー入力部と、サーバへ依頼する
処理サービスを指示する処理指示部と、キー入力部によ
り入力されたキーワード、処理サービスの指示および携
帯端末の関連情報からなるデータをサーバに送信するデ
ータ送信部と、サーバにおいて翻訳処理された翻訳結果
を受信する結果受信部と、受信した翻訳結果を表示する
表示部とを備え、サーバは、携帯端末から送信されたデ
ータを受信するデータ受信部と、受信したデータに含ま
れるキーワードに対する関連文を生成し、生成された関
連文を翻訳して翻訳結果を生成するテキスト翻訳部と、
受信したデータに含まれる処理サービスの指示に従って
テキスト翻訳部を動作させる処理制御部と、生成された
翻訳結果を関連情報に基づいて携帯端末に送信する結果
送信部とを備えるように構成したので、キーワード入力
のため、翻訳したい全てのテキストを入力する必要がな
く、面倒なテキスト入力の手間を削減できる効果があ
る。
【0103】この発明によれば、サーバの画像内文字列
認識・翻訳部が、処理時のパラメータを変えるなどして
異なる複数の条件で画像内の1個の文字列を認識するこ
とにより複数個の文字列認識結果を生成する画像内文字
列認識部と、生成した複数個の文字列認識結果をそれぞ
れ翻訳した複数個の翻訳結果を生成する画像内文字列翻
訳部とを有するように構成したので、文字認識が困難で
解像度が低い品質の悪い画像内の文字や飾り文字に対し
ても正解率の高い翻訳結果を得ることができる効果があ
る。
【0104】この発明によれば、サーバの画像内文字列
認識・翻訳部が、処理時のパラメータを変えるなどして
異なる複数の条件で画像内の1個の文字列を認識するこ
とにより複数個の文字列認識結果を生成すると共に、言
語辞書を用いて複数個の文字列認識結果に対してスペリ
ングが類似する類似文字列を生成する画像内文字列認識
部と、生成した文字列認識結果と類似文字列のそれぞれ
を翻訳することにより複数個の翻訳結果を生成する画像
内文字列翻訳部とを有するように構成したので、認識が
困難で解像度が低い品質の悪い画像内の文字や飾り文字
に対しても正解率の極めて高い翻訳結果を得ることがで
きる効果がある。
【0105】この発明によれば、サーバのテキスト翻訳
部が、受信したキーワードに基づいて関連文辞書を参照
してキーワードに関連性の高い複数個の文章を生成する
関連文生成部と、生成された複数個の文章を翻訳するこ
とにより翻訳結果を生成する関連文翻訳部とを有するよ
うに構成したので、キーワード入力のため、翻訳したい
全てのテキストを入力する必要がなく、面倒なテキスト
入力の手間を削減できると共に、正解率の高い要求する
文章の翻訳結果を得ることができる効果がある。
【0106】この発明によれば、携帯端末は、画像撮像
部により一定の時間間隔で連続的に撮像され画像バッフ
ァに蓄積した各画像を順次選択してデータ送信部に出力
する送信画像制御部を備え、サーバが、受信した各画像
に含まれる文字列の各翻訳結果を順次生成して携帯端末
に送信し、携帯端末の表示部が、各翻訳結果を受信する
都度表示するように構成したので、一度に多数の文字列
を翻訳する場合、ユーザは翻訳したい文字列上にカメラ
の視野を移動させてシャッターを押す作業を何度も繰り
返す必要もなくユーザの手間を削減すると共に、半リア
ルタイムに翻訳結果が得られる効果がある。
【0107】この発明によれば、携帯端末の送信制御部
が、画像バッファから順次読み出す画像について、新し
く撮像された画像とその一つ前に撮像された画像との差
を比較し、その差が閾値以下となった場合に新しく撮像
された画像を選択してデータ送信部に出力するように構
成したので、連続的な複数の画像からユーザが翻訳した
い文字列を含む画像のみに対する翻訳結果を得ることが
でき、またデータ送信量とサーバの処理量を削減する効
果がある。
【0108】この発明によれば、サーバは、連続的に受
信された複数個の画像を合成して1枚の合成画像を作成
する画像統合部を備え、画像内文字列認識・翻訳部が、
作成された合成画像に含まれる文字列に対する翻訳結果
を生成するように構成したので、カメラの視野に納まら
ない長い文字列や文章の内容を翻訳できる効果がある。
【0109】この発明によれば、携帯端末は、当該携帯
端末の現在位置を取得してサーバに送信するデータに加
えるGPS部を備え、サーバは、各施設の位置を格納し
た地図データを備え、サーバの処理制御部が、受信した
現在位置に基づいて地図データを参照することにより当
該携帯端末を所持するユーザが現在いる施設を特定し、
当該サーバ内で用いる各種の辞書を特定された施設に対
応する専用辞書に置き換えるように構成したので、ユー
ザが意識することなく適切な辞書に切り換えて翻訳を行
うことにより翻訳結果の性能を向上させる効果がある。
【0110】この発明によれば、携帯端末の処理指示部
が、ユーザにより専用辞書の種類を指定できるように構
成し、指定された専用辞書の種類をサーバに送信するデ
ータに加え、サーバの処理制御部が、受信した専用辞書
の種類に基づいて当該サーバ内で用いる各種の辞書を指
定された専用辞書に置き換えるように構成したので、ユ
ーザの要求に応じた翻訳に対応でき、翻訳結果の性能を
向上させる効果がある。
【0111】この発明によれば、携帯端末は、画像バッ
ファに蓄積されたカラー画像あるいはグレースケール画
像から文字列と背景を分離するように二値化した前処理
後画像を作成し画像バッファに蓄積する画像前処理部を
備え、前処理後画像をサーバに送信して翻訳結果を得る
ように構成したので、データ量を削減でき、カラー画像
やグレースケール画像に起因する送信時間を削減すると
共に、サーバでの処理時間の短縮化が図れる効果があ
る。
【0112】この発明によれば、携帯端末が、前処理後
画像にノイズが含まれる場合にはキー入力によりノイズ
を囲むノイズ除去対象領域を指定できるように構成さ
れ、画像前処理部が、ノイズ除去対象領域内の黒画素を
白画素に変換して前処理後画像を編集するように構成し
たので、サーバ側の文字認識処理時における誤認識を引
き起こす原因を取り除くことができる効果がある。
【0113】この発明によれば、翻訳処理を行うサーバ
とデータ交換を行う携帯端末であって、画像撮像部と、
この画像撮像部により撮像した画像を蓄積する画像バッ
ファと、キーワードを入力するキー入力部と、サーバへ
依頼する処理サービスの種類を指定する処理指示部と、
画像バッファに蓄積された画像あるいは入力されたキー
ワード、指定した処理サービスの種類および携帯端末の
関連情報からなるデータをサーバに送信するデータ送信
部と、サーバにおいて認識された認識文字列および翻訳
処理された翻訳結果を受信する結果受信部と、受信した
翻訳結果を表示する表示部とを備えるように構成したの
で、サーバ側における画像内文字列に対する翻訳と入力
したテキストに対する翻訳の両方のサービスに対応でき
る携帯端末を実現する効果がある。
【0114】この発明によれば、翻訳処理を行うサーバ
とデータ交換を行う携帯端末であって、画像撮像部と、
この画像撮像部により撮像した画像を蓄積する画像バッ
ファと、サーバへ依頼する処理サービスを指示する処理
指示部と、画像バッファに蓄積された画像、処理サービ
スの指示および携帯端末の関連情報からなるデータをサ
ーバに送信するデータ送信部と、サーバにおいて認識さ
れた認識文字列および翻訳処理された翻訳結果を受信す
る結果受信部と、受信した翻訳結果を表示する表示部と
を備えるように構成したので、サーバ側における画像内
文字列に対する翻訳を要求し、その翻訳結果を受信表示
できる携帯端末を実現する効果がある。
【0115】この発明によれば、翻訳処理を行うサーバ
とデータ交換を行う携帯端末であって、キーワードを入
力するキー入力部と、サーバへ依頼する処理サービスを
指示する処理指示部と、入力されたキーワード、処理サ
ービスの指示および携帯端末の関連情報からなるデータ
をサーバに送信するデータ送信部と、サーバにおいて翻
訳処理された翻訳結果を受信する結果受信部と、受信し
た翻訳結果を表示する表示部とを備えるように構成した
ので、翻訳したい全てのテキストの入力を要しない入力
キーワードに関連する翻訳サービスに対応できる携帯端
末を実現する効果がある。
【0116】この発明によれば、画像撮像部により一定
の時間間隔で連続的に撮像され画像バッファに蓄積した
各画像を順次選択してデータ送信部に出力する送信画像
制御部を備え、表示部が、サーバから順次受信する各画
像に含まれる文字列の各翻訳結果を逐次表示するように
構成したので、一度に多数の文字列を翻訳する場合、ユ
ーザは翻訳したい文字列上にカメラの視野を移動させて
シャッターを押す作業を何度も繰り返す必要もなくユー
ザの手間を削減すると共に、半リアルタイムに翻訳結果
が得られる携帯端末を実現する効果がある。
【0117】この発明によれば、送信制御部が、画像バ
ッファから順次読み出す画像について、新しく撮像され
た画像とその一つ前に撮像された画像との差を比較し、
その差が閾値以下となった場合に新しく撮像された画像
を選択してデータ送信部に出力するように構成したの
で、連続的な複数の画像からユーザが翻訳したい文字列
を含む画像のみに対する翻訳結果を得ることができ、ま
たデータ送信量とサーバの処理量を削減する携帯端末を
実現する効果がある。
【0118】この発明によれば、GPS機能により当該
携帯端末の現在位置を取得してサーバに送信するデータ
に加えるGPS部を備えるように構成したので、ユーザ
が意識することなくサーバ側で適切な辞書により翻訳を
行う場合に適した携帯端末を実現する効果がある。
【0119】この発明によれば、サーバ内で使用する専
用辞書の種類をユーザにより指定できるようにし、指定
された専用辞書の種類をサーバに送信するデータに加え
るように構成したので、サーバ側でユーザの要求に応じ
た適切な辞書により翻訳を行う場合に適した携帯端末を
実現する効果がある。
【0120】この発明によれば、画像バッファに蓄積さ
れたカラー画像あるいはグレースケール画像から文字列
と背景を分離するように二値化した前処理後画像を作成
し画像バッファに蓄積する画像前処理部を備え、画像バ
ッファから読み出した前処理後画像をサーバに送信して
翻訳結果を得るように構成したので、データ量を削減で
き、カラー画像やグレースケール画像に起因する送信時
間を削減すると共に、サーバでの処理時間の短縮化が図
れる携帯端末を実現する効果がある。
【0121】この発明によれば、前処理後画像にノイズ
が含まれる場合にはキー入力によりノイズを囲むノイズ
除去対象領域を指定できるようにし、画像前処理部が、
ノイズ除去対象領域内の黒画素を白画素に変換して前処
理後画像を編集するように構成したので、サーバ側の文
字認識処理時における誤認識を引き起こす原因を取り除
く携帯端末を実現する効果がある。
【0122】この発明によれば、携帯端末とデータ交換
を行うサーバであって、携帯端末から送信された画像あ
るいはキー入力されたキーワード、指定された処理サー
ビスの種類および携帯端末の関連情報からなるデータを
受信するデータ受信部と、受信した画像に含まれる1個
の文字列に対して複数個の文字列を抽出し、抽出した複
数個の文字列を翻訳してそれぞれの翻訳結果を生成する
画像内文字列認識・翻訳部と、キーワードに対する関連
文を生成し、生成した関連文を翻訳して翻訳結果を生成
するテキスト翻訳部と、指定された処理サービスの種類
に従って画像内文字列認識・翻訳部で処理するか、ある
いはテキスト翻訳部で処理するかを切り替え制御する処
理制御部と、画像内文字列認識・翻訳部あるいはテキス
ト翻訳部で生成した翻訳結果を関連情報に基づいて携帯
端末に送信する結果送信部とを備えるように構成したの
で、画像内文字列に対する翻訳と入力したテキストに対
する翻訳の両方に対応できるサーバを実現する効果があ
る。また、画像内文字列認識・翻訳の処理においては、
文字認識が困難で解像度が低い品質の悪い画像内の文字
や飾り文字に対して、複数個の文字列を抽出することで
翻訳を行うので、正解率の高い翻訳結果が得られる効果
があり、さらに、テキスト翻訳の処理においては、受信
したキーワードから関連文を生成するため、翻訳したい
全てのテキストを取得する必要がなく、ユーザが要求す
る翻訳結果を得ることができ、かつ携帯端末側での入力
時のユーザの負担を軽減できる効果がある。
【0123】この発明によれば、携帯端末とデータ交換
を行うサーバであって、携帯端末から送信された画像、
処理サービスの指示および携帯端末の関連情報からなる
データを受信するデータ受信部と、受信した画像に含ま
れる1個の文字列に対して複数個の文字列を抽出し、抽
出した複数個の文字列を翻訳してそれぞれの翻訳結果を
生成する画像内文字列認識・翻訳部と、受信したデータ
に含まれる処理サービスの指示に従って画像内文字列認
識・翻訳部を動作させる処理制御部と、画像内文字列認
識・翻訳部あるいはテキスト翻訳部で生成した翻訳結果
を関連情報に基づいて携帯端末に送信する結果送信部と
を備えるように構成したので、文字認識が困難で解像度
が低い品質の悪い画像内の文字や飾り文字に対しても正
解率の高い翻訳結果を得るサーバを実現する効果があ
る。
【0124】この発明によれば、携帯端末とデータ交換
を行うサーバであって、キー入力されたキーワード、処
理サービスの指示および携帯端末の関連情報からなるデ
ータを受信するデータ受信部と、キーワードに対する関
連文を生成し、生成した関連文を翻訳して翻訳結果を生
成するテキスト翻訳部と、受信したデータに含まれる処
理サービスの指示に従ってテキスト翻訳部を動作させる
処理制御部と、テキスト翻訳部で生成した翻訳結果を関
連情報に基づいて携帯端末に送信する結果送信部とを備
えるように構成したので、受信したキーワードから関連
文を生成するため、翻訳したい全てのテキストを受信し
なくても、ユーザが要求する翻訳結果を得るサーバを実
現し、また携帯端末側での入力時のユーザの負担を軽減
できる効果がある。
【0125】この発明によれば、画像内文字列認識・翻
訳部が、処理時のパラメータを変えるなどして異なる複
数の条件で画像内の1個の文字列を認識することにより
複数個の文字列認識結果を生成する画像内文字列認識部
と、生成した複数個の文字列認識結果をそれぞれ翻訳し
た複数個の翻訳結果を生成する画像内文字列翻訳部とを
有するように構成したので、文字認識が困難で解像度が
低い品質の悪い画像内の文字や飾り文字に対しても正解
率の高い翻訳結果を得るサーバを実現する効果がある。
【0126】この発明によれば、画像内文字列認識・翻
訳部が、処理時のパラメータを変えるなどして異なる複
数の条件で画像内の1個の文字列を認識することにより
複数個の文字列認識結果を生成すると共に、言語辞書を
用いて複数個の文字列認識結果に対してスペリングが類
似する類似文字列を生成する画像内文字列認識部と、生
成した文字列認識結果と類似文字列のそれぞれを翻訳す
ることにより複数個の翻訳結果を生成する画像内文字列
翻訳部とを有するように構成したので、認識が困難で解
像度が低い品質の悪い画像内の文字や飾り文字に対して
も正解率の極めて高い翻訳結果を得るサーバを実現する
効果がある。
【0127】この発明によれば、テキスト翻訳部が、キ
ー入力部で入力したキーワードに基づいて関連文辞書を
参照してキーワードに関連性の高い複数個の文章を生成
する関連文生成部と、生成された複数個の文章を翻訳す
ることにより翻訳結果を生成する関連文翻訳部とを有す
るように構成したので、受信したキーワードから複数個
の関連文を生成するため、翻訳したい全てのテキストを
受信しなくてもユーザが要求に対して極めて正解率の高
い翻訳結果を得るサーバを実現し、また携帯端末側での
入力時のユーザの負担を軽減できる効果がある。
【0128】この発明によれば、連続的に受信された複
数個の画像を合成して1枚の合成画像を作成する画像統
合部を備え、画像内文字列認識・翻訳部が、作成された
合成画像に含まれる文字列に対する翻訳結果を生成する
ように構成したので、カメラの視野に納まらない長い文
字列や文章の内容を翻訳できるサーバを実現する効果が
ある。
【0129】この発明によれば、各施設の位置を格納し
た地図データを備え、処理制御部が、受信したデータに
含まれる携帯端末の現在位置に基づいて地図データを参
照することにより当該携帯端末を所持するユーザが現在
いる施設を特定し、当該サーバ内で用いる各種の辞書を
特定された施設に対応する専用辞書に置き換えるように
構成したので、ユーザが意識することなく適切な辞書に
切り換えて翻訳を行うことにより翻訳結果の性能を向上
させるサーバを実現する効果がある。
【0130】この発明によれば、処理制御部が、受信し
たデータに含まれる指定された専用辞書の種類に基づい
て当該サーバ内で用いる各種の辞書を指定された専用辞
書に置き換えるように構成したので、ユーザの要求に応
じた翻訳に対応でき、翻訳結果の性能を向上させるサー
バを実現する効果がある。
【図面の簡単な説明】
【図1】 この発明の実施の形態1による携帯端末型翻
訳システムの構成を示すブロック図である。
【図2】 同実施の形態1に係る画像の撮像状況を説明
する説明図である。
【図3】 同実施の形態1に係る画像内文字列認識部の
処理手順を示すフローチャートである。
【図4】 同実施の形態1に係る画像内文字列認識部の
動作例を説明する説明図である。
【図5】 同実施の形態1に係る誤りを含む文字認識処
理の例を説明する説明図である。
【図6】 同実施の形態1に係る画像内文字列翻訳部の
動作例を説明する説明図である。
【図7】 同実施の形態1に係る画像内文字列翻訳結果
生成部の動作例を説明する説明図である。
【図8】 同実施の形態1に係る画像内文字列翻訳結果
の表示例を示す説明図である。
【図9】 同実施の形態1に係るキーワード入力の表示
例を示す説明図である。
【図10】 同実施の形態1に係る関連文辞書の構成例
を示す説明図である。
【図11】 同実施の形態1に係る関連文翻訳部の動作
例を説明する説明図である。
【図12】 同実施の形態1に係る関連文翻訳結果の例
を示す説明図である。
【図13】 同実施の形態1に係る関連文翻訳結果の表
示例を示す説明図である。
【図14】 この発明の実施の形態2による携帯端末型
翻訳システムの構成を示すブロック図である。
【図15】 同実施の形態2および実施の形態3に係る
画像の撮像状況を示す説明図である。
【図16】 同実施の形態2および実施の形態3に係る
連続的に撮像された画像例を示す説明図である。
【図17】 同実施の形態2に係る送信画像制御部の動
作を説明する説明図である。
【図18】 この発明の実施の形態3による携帯端末型
翻訳システムの構成を示すブロック図である。
【図19】 同実施の形態3に係る画像統合部の動作を
説明する説明図である。
【図20】 この発明の実施の形態4による携帯端末型
翻訳システムの構成を示すブロック図である。
【図21】 同実施の形態4に係る認識条件指定の例を
示す説明図である。
【図22】 この発明の実施の形態5による携帯端末型
翻訳システムの構成を示すブロック図である。
【図23】 同実施の形態5に係る画像前処理部の動作
を説明する説明図である。
【図24】 同実施の形態5に係る画像補正処理を説明
する説明図である。
【図25】 従来の携帯端末型画像処理システムに係る
処理手順を示すフローチャートである。
【符号の説明】 101 携帯端末、102 データ送信部、103 キ
ー入力部、104 処理指示部、105 画像撮像部、
106 画像バッファ、107 表示部、108 結果
受信部、109 サーバ、110 データ受信部、11
1 結果送信部、112 処理制御部、113 画像内
文字列認識・翻訳部、114 画像内文字列認識部、1
15 画像内文字列翻訳部、116 画像内文字列翻訳
結果生成部、117 認識辞書、118 言語辞書、1
19 テキスト翻訳部、120関連文生成部、121
関連文翻訳部、122 関連文翻訳結果生成部、123
関連文辞書、124 第1翻訳辞書、125 第2翻訳
辞書、201 文書、202 カメラ視野、401 撮
像画像、402 前処理後画像、403 抽出文字列、
404 文字パターン、405 文字認識結果、501
文字パターン、502 文字認識結果、601 文字
列認識結果、602 類似文字列、603,604 文
字列翻訳結果、701 画像内文字列翻訳結果、801
認識文字列画像、802 画像内文字列翻訳結果の画
像、901 キーワード入力エリア、902 翻訳ボタ
ン表示、1001 関連文辞書データ、1101 入力
テキスト、1102 関連文、1103,1104 文
字列翻訳結果、1201関連文翻訳結果、1301 翻
訳結果、1401 送信画像制御部、1501カメラ視
野、1502 移動軌跡、1601 撮像画像、170
1 分割領域、1801 画像統合部、1901 合成
画像、1902 前処理後画像、1903 抽出文字
列、1904 文字列認識結果、1905 類似文字
列、2001GPS部、2002 専用認識辞書、20
03 専用言語辞書、2004 第1専用翻訳辞書、2
005 専用関連文辞書、2006 第2専用翻訳辞
書、2007 地図データ、2101 選択画面、22
01 画像前処理部、2301撮像画像、2302 前
処理後画像、2401 ノイズ、2402 前処理後画
像、2403 ノイズ除去対象領域。
───────────────────────────────────────────────────── フロントページの続き (51)Int.Cl.7 識別記号 FI テーマコート゛(参考) H04M 3/42 H04M 3/42 R 11/00 302 11/00 302 Fターム(参考) 5B019 GA10 HE18 JA10 5B085 AA08 BE01 BE03 BE07 BG02 CA03 CA04 5B091 AA05 AA06 BA02 BA03 CB02 CB09 CD01 CD03 5K024 AA74 CC11 DD01 EE00 FF03 5K101 KK15 LL12 NN06 NN18

Claims (31)

    【特許請求の範囲】
  1. 【請求項1】 携帯端末とこの携帯端末とデータ交換を
    行うサーバとからなる携帯端末型画像処理システムであ
    って、 前記携帯端末は、 画像撮像部と、 この画像撮像部により撮像した画像を蓄積する画像バッ
    ファと、 キーワードを入力するキー入力部と、 前記サーバへ依頼する処理サービスの種類を指定する処
    理指示部と、 前記画像バッファに蓄積された画像あるいは前記キー入
    力部により入力されたキーワード、指定された処理サー
    ビスの種類および前記携帯端末の関連情報からなるデー
    タを前記サーバに送信するデータ送信部と、 前記サーバにおいて翻訳処理された翻訳結果を受信する
    結果受信部と、 受信した前記翻訳結果を表示する表示部とを備え、 前記サーバは、 前記携帯端末から送信されたデータを受信するデータ受
    信部と、 受信した前記画像に含まれる1個の文字列に対して複数
    個の文字列を抽出し、抽出した前記複数個の文字列を翻
    訳してそれぞれの翻訳結果を生成する画像内文字列認識
    ・翻訳部と、 受信した前記キーワードに対する関連文を生成し、生成
    された前記関連文を翻訳して翻訳結果を生成するテキス
    ト翻訳部と、 受信したデータに含まれる前記指定された処理サービス
    の種類に従って前記画像内文字列認識・翻訳部で処理す
    るか、あるいは前記テキスト翻訳部で処理するかを切り
    替え制御する処理制御部と、 前記画像内文字列認識・翻訳部または前記テキスト翻訳
    部で生成された翻訳結果を前記関連情報に基づいて前記
    携帯端末に送信する結果送信部とを備えたことを特徴と
    する携帯端末型画像処理システム。
  2. 【請求項2】 携帯端末とこの携帯端末とデータ交換を
    行うサーバとからなる携帯端末型画像処理システムであ
    って、 前記携帯端末は、 画像撮像部と、 この画像撮像部により撮像した画像を蓄積する画像バッ
    ファと、 前記サーバへ依頼する処理サービスを指示する処理指示
    部と、 前記画像バッファに蓄積された画像、前記処理サービス
    の指示および前記携帯端末の関連情報からなるデータを
    前記サーバに送信するデータ送信部と、 前記サーバにおいて翻訳処理された翻訳結果を受信する
    結果受信部と、 受信した前記翻訳結果を表示する表示部とを備え、 前記サーバは、 前記携帯端末から送信されたデータを受信するデータ受
    信部と、 受信した前記画像に含まれる1個の文字列に対して複数
    個の文字列を抽出し、抽出した前記複数個の文字列を翻
    訳してそれぞれの翻訳結果を生成する画像内文字列認識
    ・翻訳部と、 受信したデータに含まれる前記処理サービスの指示に従
    って前記画像内文字列認識・翻訳部を動作させる処理制
    御部と、 生成された前記翻訳結果を前記関連情報に基づいて前記
    携帯端末に送信する結果送信部とを備えたことを特徴と
    する携帯端末型画像処理システム。
  3. 【請求項3】 携帯端末とこの携帯端末とデータ交換を
    行うサーバとからなる携帯端末型画像処理システムであ
    って、 前記携帯端末は、 キーワードを入力するキー入力部と、 前記サーバへ依頼する処理サービスを指示する処理指示
    部と、 前記キー入力部により入力されたキーワード、前記処理
    サービスの指示および前記携帯端末の関連情報からなる
    データを前記サーバに送信するデータ送信部と、 前記サーバにおいて翻訳処理された翻訳結果を受信する
    結果受信部と、 受信した前記翻訳結果を表示する表示部とを備え、 前記サーバは、 前記携帯端末から送信されたデータを受信するデータ受
    信部と、 受信したデータに含まれる前記キーワードに対する関連
    文を生成し、生成された前記関連文を翻訳して前記翻訳
    結果を生成するテキスト翻訳部と、受信したデータに含
    まれる前記処理サービスの指示に従って前記テキスト翻
    訳部を動作させる処理制御部と、 生成された前記翻訳結果を前記関連情報に基づいて前記
    携帯端末に送信する結果送信部とを備えたことを特徴と
    する携帯端末型画像処理システム。
  4. 【請求項4】 サーバの画像内文字列認識・翻訳部が、 異なる複数の条件で画像内の1個の文字列を認識するこ
    とにより複数個の文字列認識結果を生成する画像内文字
    列認識部と、 生成した前記複数個の文字列認識結果をそれぞれ翻訳し
    た複数個の翻訳結果を生成する画像内文字列翻訳部とを
    有したことを特徴とする請求項1または請求項2記載の
    携帯端末型画像処理システム。
  5. 【請求項5】 サーバの画像内文字列認識・翻訳部が、 異なる複数の条件で画像内の1個の文字列を認識するこ
    とにより複数個の文字列認識結果を生成すると共に、言
    語辞書を用いて前記複数個の文字列認識結果に対してス
    ペリングが類似する類似文字列を生成する画像内文字列
    認識部と、 生成した前記文字列認識結果と前記類似文字列のそれぞ
    れを翻訳することにより複数個の翻訳結果を生成する画
    像内文字列翻訳部とを有したことを特徴とする請求項1
    または請求項2記載の携帯端末型画像処理システム。
  6. 【請求項6】 サーバのテキスト翻訳部が、 受信したキーワードに基づいて関連文辞書を参照して前
    記キーワードに関連性の高い複数個の文章を生成する関
    連文生成部と、 生成された前記複数個の文章を翻訳することにより翻訳
    結果を生成する関連文翻訳部とを有したことを特徴とす
    る請求項1または請求項3記載の携帯端末型画像処理シ
    ステム。
  7. 【請求項7】 携帯端末は、画像撮像部により一定の時
    間間隔で連続的に撮像され画像バッファに蓄積した各画
    像を順次選択してデータ送信部に出力する送信画像制御
    部を備え、 サーバが、受信した前記各画像に含まれる文字列の各翻
    訳結果を順次生成して前記携帯端末に送信し、 前記携帯端末の表示部が、前記各翻訳結果を受信する都
    度表示するようにしたことを特徴とする請求項1または
    請求項2記載の携帯端末型画像処理システム。
  8. 【請求項8】 携帯端末の送信制御部が、画像バッファ
    から順次読み出す画像について、新しく撮像された画像
    とその一つ前に撮像された画像との差を比較し、その差
    が閾値以下となった場合に前記新しく撮像された画像を
    選択してデータ送信部に出力するようにしたことを特徴
    とする請求項7記載の携帯端末型画像処理システム。
  9. 【請求項9】 サーバは、連続的に受信された複数個の
    画像を合成して1枚の合成画像を作成する画像統合部を
    備え、 画像内文字列認識・翻訳部が、作成された前記合成画像
    に含まれる文字列に対する翻訳結果を生成するようにし
    たことを特徴とする請求項7または請求項8記載の携帯
    端末型画像処理システム。
  10. 【請求項10】 携帯端末は、当該携帯端末の現在位置
    を取得してサーバに送信するデータに加えるGPS部を
    備え、 前記サーバは、各施設の位置を格納した地図データを備
    え、 前記サーバの処理制御部が、受信した前記現在位置に基
    づいて前記地図データを参照することにより当該携帯端
    末を所持するユーザが現在いる施設を特定し、当該サー
    バ内で用いる各種の辞書を特定された前記施設に対応す
    る専用辞書に置き換えるようにしたことを特徴とする請
    求項1から請求項9のうちのいずれか1項記載の携帯端
    末型画像処理システム。
  11. 【請求項11】 携帯端末の処理指示部が、ユーザによ
    り専用辞書の種類を指定できるように構成し、指定され
    た前記専用辞書の種類をサーバに送信するデータに加
    え、 前記サーバの処理制御部が、受信した前記専用辞書の種
    類に基づいて当該サーバ内で用いる各種の辞書を指定さ
    れた専用辞書に置き換えるようにしたことを特徴とする
    請求項1から請求項9のうちのいずれか1項記載の携帯
    端末型画像処理システム。
  12. 【請求項12】 携帯端末は、画像バッファに蓄積され
    たカラー画像あるいはグレースケール画像から文字列と
    背景を分離するように二値化した前処理後画像を作成し
    前記画像バッファに蓄積する画像前処理部を備え、前記
    前処理後画像をサーバに送信して翻訳結果を得るように
    したことを特徴とする請求項1、請求項3から請求項
    5、請求項7から請求項11のうちのいずれか1項記載
    の携帯端末型画像処理システム。
  13. 【請求項13】 携帯端末が、前処理後画像にノイズが
    含まれる場合にはキー入力により前記ノイズを囲むノイ
    ズ除去対象領域を指定できるように構成され、 画像前処理部が、前記ノイズ除去対象領域内の黒画素を
    白画素に変換して前処理後画像を編集するようにしたこ
    とを特徴とする請求項12記載の携帯端末型画像処理シ
    ステム。
  14. 【請求項14】 翻訳処理を行うサーバとデータ交換を
    行う携帯端末であって、 画像撮像部と、 この画像撮像部により撮像した画像を蓄積する画像バッ
    ファと、 キーワードを入力するキー入力部と、 前記サーバへ依頼する処理サービスの種類を指定する処
    理指示部と、 前記画像バッファに蓄積された画像あるいは入力された
    キーワード、指定した前記処理サービスの種類および前
    記携帯端末の関連情報からなるデータを前記サーバに送
    信するデータ送信部と、 前記サーバにおいて認識された認識文字列および翻訳処
    理された翻訳結果を受信する結果受信部と、 受信した前記翻訳結果を表示する表示部とを備えたこと
    を特徴とする携帯端末。
  15. 【請求項15】 翻訳処理を行うサーバとデータ交換を
    行う携帯端末であって、 画像撮像部と、 この画像撮像部により撮像した画像を蓄積する画像バッ
    ファと、 前記サーバへ依頼する処理サービスを指示する処理指示
    部と、 前記画像バッファに蓄積された画像、前記処理サービス
    の指示および前記携帯端末の関連情報からなるデータを
    前記サーバに送信するデータ送信部と、 前記サーバにおいて認識された認識文字列および翻訳処
    理された翻訳結果を受信する結果受信部と、 受信した前記翻訳結果を表示する表示部とを備えたこと
    を特徴とする携帯端末。
  16. 【請求項16】 翻訳処理を行うサーバとデータ交換を
    行う携帯端末であって、 キーワードを入力するキー入力部と、 前記サーバへ依頼する処理サービスを指示する処理指示
    部と、 入力されたキーワード、前記処理サービスの指示および
    前記携帯端末の関連情報からなるデータを前記サーバに
    送信するデータ送信部と、 前記サーバにおいて翻訳処理された翻訳結果を受信する
    結果受信部と、 受信した前記翻訳結果を表示する表示部とを備えたこと
    を特徴とする携帯端末。
  17. 【請求項17】 画像撮像部により一定の時間間隔で連
    続的に撮像され画像バッファに蓄積した各画像を順次選
    択してデータ送信部に出力する送信画像制御部を備え、 表示部が、サーバから順次受信する前記各画像に含まれ
    る文字列の各翻訳結果を逐次表示するようにしたことを
    特徴とする請求項14または請求項15記載の携帯端
    末。
  18. 【請求項18】 送信制御部が、画像バッファから順次
    読み出す画像について、新しく撮像された画像とその一
    つ前に撮像された画像との差を比較し、その差が閾値以
    下となった場合に前記新しく撮像された画像を選択して
    データ送信部に出力するようにしたことを特徴とする請
    求項17記載の携帯端末。
  19. 【請求項19】 GPS機能により当該携帯端末の現在
    位置を取得してサーバに送信するデータに加えるGPS
    部を備えたことを特徴とする請求項14から請求項18
    のうちのいずれか1項記載の携帯端末。
  20. 【請求項20】 処理指示部が、サーバ内で使用する専
    用辞書の種類をユーザにより指定できるように構成し、
    指定された前記専用辞書の種類をサーバに送信するデー
    タに加えるようにしたことを特徴とする請求項14から
    請求項18のうちのいずれか1項記載の携帯端末。
  21. 【請求項21】 画像バッファに蓄積されたカラー画像
    あるいはグレースケール画像から文字列と背景を分離す
    るように二値化した前処理後画像を作成し前記画像バッ
    ファに蓄積する画像前処理部を備え、前記画像バッファ
    から読み出した前記前処理後画像をサーバに送信して翻
    訳結果を得るようにしたことを特徴とする請求項14、
    請求項15および請求項17から請求項20のうちのい
    ずれか1項記載の携帯端末。
  22. 【請求項22】 前処理後画像にノイズが含まれる場合
    にはキー入力により前記ノイズを囲むノイズ除去対象領
    域を指定できるように構成され、 画像前処理部が、前記ノイズ除去対象領域内の黒画素を
    白画素に変換して前処理後画像を編集するようにしたこ
    とを特徴とする請求項21記載の携帯端末。
  23. 【請求項23】 携帯端末とデータ交換を行うサーバで
    あって、 前記携帯端末から送信された画像あるいはキー入力され
    たキーワード、指定された処理サービスの種類および前
    記携帯端末の関連情報からなるデータを受信するデータ
    受信部と、 受信した前記画像に含まれる1個の文字列に対して複数
    個の文字列を抽出し、抽出した前記複数個の文字列を翻
    訳してそれぞれの翻訳結果を生成する画像内文字列認識
    ・翻訳部と、 前記キーワードに対する関連文を生成し、生成した前記
    関連文を翻訳して翻訳結果を生成するテキスト翻訳部
    と、 前記指定された処理サービスの種類に従って前記画像内
    文字列認識・翻訳部で処理するか、あるいは前記テキス
    ト翻訳部で処理するかを切り替え制御する処理制御部
    と、 前記画像内文字列認識・翻訳部あるいは前記テキスト翻
    訳部で生成した翻訳結果を前記関連情報に基づいて前記
    携帯端末に送信する結果送信部とを備えたことを特徴と
    するサーバ。
  24. 【請求項24】 携帯端末とデータ交換を行うサーバで
    あって、 前記携帯端末から送信された画像、処理サービスの指示
    および前記携帯端末の関連情報からなるデータを受信す
    るデータ受信部と、 受信した前記画像に含まれる1個の文字列に対して複数
    個の文字列を抽出し、抽出した前記複数個の文字列を翻
    訳してそれぞれの翻訳結果を生成する画像内文字列認識
    ・翻訳部と、 受信したデータに含まれる前記処理サービスの指示に従
    って前記画像内文字列認識・翻訳部を動作させる処理制
    御部と、 前記画像内文字列認識・翻訳部あるいは前記テキスト翻
    訳部で生成した翻訳結果を前記関連情報に基づいて前記
    携帯端末に送信する結果送信部とを備えたことを特徴と
    するサーバ。
  25. 【請求項25】 携帯端末とデータ交換を行うサーバで
    あって、 キー入力されたキーワード、処理サービスの指示および
    前記携帯端末の関連情報からなるデータを受信するデー
    タ受信部と、 前記キーワードに対する関連文を生成し、生成した前記
    関連文を翻訳して翻訳結果を生成するテキスト翻訳部
    と、 受信したデータに含まれる前記処理サービスの指示に従
    って前記テキスト翻訳部を動作させる処理制御部と、 前記テキスト翻訳部で生成した翻訳結果を前記関連情報
    に基づいて前記携帯端末に送信する結果送信部とを備え
    たことを特徴とするサーバ。
  26. 【請求項26】 画像内文字列認識・翻訳部が、 異なる複数の条件で画像内の1個の文字列を認識するこ
    とにより複数個の文字列認識結果を生成する画像内文字
    列認識部と、 生成した前記複数個の文字列認識結果をそれぞれ翻訳し
    た複数個の翻訳結果を生成する画像内文字列翻訳部とを
    有したことを特徴とする請求項23または請求項24記
    載のサーバ。
  27. 【請求項27】 画像内文字列認識・翻訳部が、 異なる複数の条件で画像内の1個の文字列を認識するこ
    とにより複数個の文字列認識結果を生成すると共に、言
    語辞書を用いて前記複数個の文字列認識結果に対してス
    ペリングが類似する類似文字列を生成する画像内文字列
    認識部と、 生成した前記文字列認識結果と前記類似文字列のそれぞ
    れを翻訳することにより複数個の翻訳結果を生成する画
    像内文字列翻訳部とを有したことを特徴とする請求項2
    3または請求項24記載のサーバ。
  28. 【請求項28】 テキスト翻訳部が、 キー入力部で入力したキーワードに基づいて関連文辞書
    を参照して前記キーワードに関連性の高い複数個の文章
    を生成する関連文生成部と、 生成された前記複数個の文章を翻訳することにより翻訳
    結果を生成する関連文翻訳部とを有したことを特徴とす
    る請求項25記載のサーバ。
  29. 【請求項29】 連続的に受信された複数個の画像を合
    成して1枚の合成画像を作成する画像統合部を備え、 画像内文字列認識・翻訳部が、作成された前記合成画像
    に含まれる文字列に対する翻訳結果を生成するようにし
    たことを特徴とする請求項23、請求項24および請求
    項26および請求項27のうちのいずれか1項記載のサ
    ーバ。
  30. 【請求項30】 各施設の位置を格納した地図データを
    備え、 処理制御部が、受信したデータに含まれる携帯端末の現
    在位置に基づいて前記地図データを参照することにより
    当該携帯端末を所持するユーザが現在いる施設を特定
    し、当該サーバ内で用いる各種の辞書を特定された前記
    施設に対応する専用辞書に置き換えるようにしたことを
    特徴とする請求項23から請求項29のうちのいずれか
    1項記載のサーバ。
  31. 【請求項31】 処理制御部が、受信したデータに含ま
    れる指定された専用辞書の種類に基づいて当該サーバ内
    で用いる各種の辞書を指定された専用辞書に置き換える
    ようにしたことを特徴とする請求項23から請求項29
    のうちのいずれか1項記載のサーバ。
JP2001376254A 2001-12-10 2001-12-10 携帯端末型画像処理システム、携帯端末およびサーバ Pending JP2003178067A (ja)

Priority Applications (4)

Application Number Priority Date Filing Date Title
JP2001376254A JP2003178067A (ja) 2001-12-10 2001-12-10 携帯端末型画像処理システム、携帯端末およびサーバ
PCT/JP2002/012281 WO2003050714A1 (fr) 2001-12-10 2002-11-26 Systeme de traitement d'image de terminal cellulaire, terminal cellulaire et serveur
US10/498,267 US20050221856A1 (en) 2001-12-10 2002-11-26 Cellular terminal image processing system, cellular terminal, and server
CNA028271130A CN1615478A (zh) 2001-12-10 2002-11-26 便携终端式图像处理系统、便携终端和服务器

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2001376254A JP2003178067A (ja) 2001-12-10 2001-12-10 携帯端末型画像処理システム、携帯端末およびサーバ

Publications (1)

Publication Number Publication Date
JP2003178067A true JP2003178067A (ja) 2003-06-27

Family

ID=19184484

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2001376254A Pending JP2003178067A (ja) 2001-12-10 2001-12-10 携帯端末型画像処理システム、携帯端末およびサーバ

Country Status (4)

Country Link
US (1) US20050221856A1 (ja)
JP (1) JP2003178067A (ja)
CN (1) CN1615478A (ja)
WO (1) WO2003050714A1 (ja)

Cited By (19)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2005066882A1 (ja) * 2004-01-08 2005-07-21 Nec Corporation 文字認識装置、移動通信システム、移動端末装置、固定局装置、文字認識方法および文字認識プログラム
JP2006185101A (ja) * 2004-12-27 2006-07-13 Aisin Aw Co Ltd 画像認識装置及び方法、ナビゲーション装置
US7369704B2 (en) 2004-05-18 2008-05-06 Sharp Kabushiki Kaisha Image processing apparatus, image processing system, and image processing method
JP2010218041A (ja) * 2009-03-13 2010-09-30 Omron Corp 携帯式文字認識装置、文字認識プログラム及び文字認識方法
US7904724B2 (en) 2005-03-25 2011-03-08 Fuji Xerox Co., Ltd. Translation device, translation method, and storage medium
JP2011090681A (ja) * 2010-10-25 2011-05-06 Aisin Aw Co Ltd 画像認識装置及び方法、ナビゲーション装置
JP2012194984A (ja) * 2006-01-26 2012-10-11 Evryx Technologies Inc データ取得及び識別のためのシステム及び方法
US8712193B2 (en) 2000-11-06 2014-04-29 Nant Holdings Ip, Llc Image capture and identification system and process
US8792750B2 (en) 2000-11-06 2014-07-29 Nant Holdings Ip, Llc Object information derived from object images
JP2014529249A (ja) * 2011-09-01 2014-10-30 クアルコム,インコーポレイテッド モバイルデバイスを使用した拡張メニューを伴うシステムおよび方法
JP2014529822A (ja) * 2011-08-29 2014-11-13 クアルコム,インコーポレイテッド コンテキスト情報を用いるカメラocr
WO2015045680A1 (ja) * 2013-09-27 2015-04-02 シャープ株式会社 翻訳装置およびその制御プログラム
WO2015079752A1 (ja) * 2013-11-28 2015-06-04 シャープ株式会社 翻訳装置、および翻訳装置の制御方法
US9310892B2 (en) 2000-11-06 2016-04-12 Nant Holdings Ip, Llc Object information derived from object images
JP2017525026A (ja) * 2014-06-18 2017-08-31 グーグル インコーポレイテッド 文脈検索の提示の生成
JP2018018404A (ja) * 2016-07-29 2018-02-01 株式会社Nttドコモ 翻訳システム
JP2018129689A (ja) * 2017-02-08 2018-08-16 パナソニック株式会社 文字認識システム、文字認識方法、及び文字認識サーバ
US10617568B2 (en) 2000-11-06 2020-04-14 Nant Holdings Ip, Llc Image capture and identification system and process
WO2022195870A1 (ja) * 2021-03-19 2022-09-22 ソニーグループ株式会社 情報処理装置、情報処理方法、情報処理プログラムおよび端末装置

Families Citing this family (26)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100464040B1 (ko) * 2002-12-16 2005-01-03 엘지전자 주식회사 얼굴 움직임을 이용한 이동 통신 단말기의 제어 방법
CN100342742C (zh) * 2003-05-18 2007-10-10 刘珉恺 具有图像识别能力的电话机
US9116890B2 (en) * 2004-04-01 2015-08-25 Google Inc. Triggering actions in response to optically or acoustically capturing keywords from a rendered document
JP2006276911A (ja) * 2005-03-25 2006-10-12 Fuji Xerox Co Ltd 電子機器およびプログラム
JP2006303651A (ja) * 2005-04-15 2006-11-02 Nokia Corp 電子装置
WO2007082534A1 (en) * 2006-01-17 2007-07-26 Flemming Ast Mobile unit with camera and optical character recognition, optionally for conversion of imaged text into comprehensible speech
CN101082956B (zh) * 2006-06-02 2010-10-13 英华达(上海)电子有限公司 手持设备上基于图片进行外文翻译的装置及方法
US20080094496A1 (en) * 2006-10-24 2008-04-24 Kong Qiao Wang Mobile communication terminal
US7787693B2 (en) * 2006-11-20 2010-08-31 Microsoft Corporation Text detection on mobile communications devices
CN101193158B (zh) * 2006-11-30 2010-12-08 财团法人工业技术研究院 应用行动通信设备翻译影像文字的方法及其系统
JP4396719B2 (ja) * 2007-03-22 2010-01-13 ブラザー工業株式会社 印刷システム、携帯端末、及び携帯端末プログラム
US8144990B2 (en) 2007-03-22 2012-03-27 Sony Ericsson Mobile Communications Ab Translation and display of text in picture
IL184179A0 (en) * 2007-06-24 2008-03-20 Rdc Rafael Dev Corp Ltd A method and apparatus for connecting a cellular telephone user to the internet
KR101291195B1 (ko) * 2007-11-22 2013-07-31 삼성전자주식회사 문자인식장치 및 방법
JP4626777B2 (ja) * 2008-03-14 2011-02-09 富士ゼロックス株式会社 情報処理装置及び情報処理プログラム
EP2144189A3 (en) * 2008-07-10 2014-03-05 Samsung Electronics Co., Ltd. Method for recognizing and translating characters in camera-based image
EP2189926B1 (en) * 2008-11-21 2012-09-19 beyo GmbH Method for providing camera-based services using a portable communication device of a user and portable communication device of a user
CN101834894A (zh) * 2010-04-19 2010-09-15 中兴通讯股份有限公司 远程处理方法、装置及系统
WO2011150969A1 (en) * 2010-06-02 2011-12-08 Naxos Finance Sa Apparatus for image data recording and reproducing, and method thereof
CN102479177A (zh) * 2010-11-23 2012-05-30 英业达股份有限公司 移动装置的实时翻译方法
JP5606385B2 (ja) 2011-04-28 2014-10-15 楽天株式会社 サーバ装置、サーバ装置の制御方法、及び、プログラム
JP5982844B2 (ja) * 2012-02-06 2016-08-31 オムロン株式会社 文字読取用のプログラムおよび文字読取装置
CN102798986A (zh) * 2012-06-13 2012-11-28 南京物联传感技术有限公司 一种智能眼镜及其工作方法
KR20140030361A (ko) * 2012-08-27 2014-03-12 삼성전자주식회사 휴대단말기의 문자 인식장치 및 방법
US9558158B2 (en) 2015-03-06 2017-01-31 Translation Management Systems, Ltd Automated document translation
JP6780129B1 (ja) * 2019-03-27 2020-11-04 三菱電機ビルテクノサービス株式会社 設備機器情報収集システム

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2828138B2 (ja) * 1996-08-28 1998-11-25 日本電気株式会社 画像合成方法及び画像合成装置
JPH1069536A (ja) * 1996-08-28 1998-03-10 Sharp Corp 画像合成装置
JPH10134004A (ja) * 1996-10-28 1998-05-22 Casio Comput Co Ltd 画像データ処理システム
JPH10312381A (ja) * 1997-05-12 1998-11-24 Nippon Hoso Kyokai <Nhk> 翻訳方法および装置
JP2000194698A (ja) * 1998-12-25 2000-07-14 Sony Corp 情報処理装置および方法、並びに提供媒体
JP3822990B2 (ja) * 1999-01-07 2006-09-20 株式会社日立製作所 翻訳装置、記録媒体
JP2000207401A (ja) * 1999-01-20 2000-07-28 Sony Corp 情報処理装置および方法、並びに提供媒体

Cited By (116)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9104916B2 (en) 2000-11-06 2015-08-11 Nant Holdings Ip, Llc Object information derived from object images
US9342748B2 (en) 2000-11-06 2016-05-17 Nant Holdings Ip. Llc Image capture and identification system and process
US10772765B2 (en) 2000-11-06 2020-09-15 Nant Holdings Ip, Llc Image capture and identification system and process
US10639199B2 (en) 2000-11-06 2020-05-05 Nant Holdings Ip, Llc Image capture and identification system and process
US10635714B2 (en) 2000-11-06 2020-04-28 Nant Holdings Ip, Llc Object information derived from object images
US10617568B2 (en) 2000-11-06 2020-04-14 Nant Holdings Ip, Llc Image capture and identification system and process
US9087240B2 (en) 2000-11-06 2015-07-21 Nant Holdings Ip, Llc Object information derived from object images
US10509821B2 (en) 2000-11-06 2019-12-17 Nant Holdings Ip, Llc Data capture and identification system and process
US10500097B2 (en) 2000-11-06 2019-12-10 Nant Holdings Ip, Llc Image capture and identification system and process
US10095712B2 (en) 2000-11-06 2018-10-09 Nant Holdings Ip, Llc Data capture and identification system and process
US10089329B2 (en) 2000-11-06 2018-10-02 Nant Holdings Ip, Llc Object information derived from object images
US10080686B2 (en) 2000-11-06 2018-09-25 Nant Holdings Ip, Llc Image capture and identification system and process
US9844466B2 (en) 2000-11-06 2017-12-19 Nant Holdings Ip Llc Image capture and identification system and process
US9844469B2 (en) 2000-11-06 2017-12-19 Nant Holdings Ip Llc Image capture and identification system and process
US8712193B2 (en) 2000-11-06 2014-04-29 Nant Holdings Ip, Llc Image capture and identification system and process
US8718410B2 (en) 2000-11-06 2014-05-06 Nant Holdings Ip, Llc Image capture and identification system and process
US8774463B2 (en) 2000-11-06 2014-07-08 Nant Holdings Ip, Llc Image capture and identification system and process
US8792750B2 (en) 2000-11-06 2014-07-29 Nant Holdings Ip, Llc Object information derived from object images
US8798322B2 (en) 2000-11-06 2014-08-05 Nant Holdings Ip, Llc Object information derived from object images
US8798368B2 (en) 2000-11-06 2014-08-05 Nant Holdings Ip, Llc Image capture and identification system and process
US8824738B2 (en) 2000-11-06 2014-09-02 Nant Holdings Ip, Llc Data capture and identification system and process
US8837868B2 (en) 2000-11-06 2014-09-16 Nant Holdings Ip, Llc Image capture and identification system and process
US8842941B2 (en) 2000-11-06 2014-09-23 Nant Holdings Ip, Llc Image capture and identification system and process
US8849069B2 (en) 2000-11-06 2014-09-30 Nant Holdings Ip, Llc Object information derived from object images
US8855423B2 (en) 2000-11-06 2014-10-07 Nant Holdings Ip, Llc Image capture and identification system and process
US8861859B2 (en) 2000-11-06 2014-10-14 Nant Holdings Ip, Llc Image capture and identification system and process
US8867839B2 (en) 2000-11-06 2014-10-21 Nant Holdings Ip, Llc Image capture and identification system and process
US8873891B2 (en) 2000-11-06 2014-10-28 Nant Holdings Ip, Llc Image capture and identification system and process
US9844468B2 (en) 2000-11-06 2017-12-19 Nant Holdings Ip Llc Image capture and identification system and process
US8885982B2 (en) 2000-11-06 2014-11-11 Nant Holdings Ip, Llc Object information derived from object images
US8885983B2 (en) 2000-11-06 2014-11-11 Nant Holdings Ip, Llc Image capture and identification system and process
US9844467B2 (en) 2000-11-06 2017-12-19 Nant Holdings Ip Llc Image capture and identification system and process
US8923563B2 (en) 2000-11-06 2014-12-30 Nant Holdings Ip, Llc Image capture and identification system and process
US9824099B2 (en) 2000-11-06 2017-11-21 Nant Holdings Ip, Llc Data capture and identification system and process
US8938096B2 (en) 2000-11-06 2015-01-20 Nant Holdings Ip, Llc Image capture and identification system and process
US8948544B2 (en) 2000-11-06 2015-02-03 Nant Holdings Ip, Llc Object information derived from object images
US8948460B2 (en) 2000-11-06 2015-02-03 Nant Holdings Ip, Llc Image capture and identification system and process
US8948459B2 (en) 2000-11-06 2015-02-03 Nant Holdings Ip, Llc Image capture and identification system and process
US9808376B2 (en) 2000-11-06 2017-11-07 Nant Holdings Ip, Llc Image capture and identification system and process
US9805063B2 (en) 2000-11-06 2017-10-31 Nant Holdings Ip Llc Object information derived from object images
US9014515B2 (en) 2000-11-06 2015-04-21 Nant Holdings Ip, Llc Image capture and identification system and process
US9014512B2 (en) 2000-11-06 2015-04-21 Nant Holdings Ip, Llc Object information derived from object images
US9014516B2 (en) 2000-11-06 2015-04-21 Nant Holdings Ip, Llc Object information derived from object images
US9014513B2 (en) 2000-11-06 2015-04-21 Nant Holdings Ip, Llc Image capture and identification system and process
US9014514B2 (en) 2000-11-06 2015-04-21 Nant Holdings Ip, Llc Image capture and identification system and process
US9020305B2 (en) 2000-11-06 2015-04-28 Nant Holdings Ip, Llc Image capture and identification system and process
US9025814B2 (en) 2000-11-06 2015-05-05 Nant Holdings Ip, Llc Image capture and identification system and process
US9025813B2 (en) 2000-11-06 2015-05-05 Nant Holdings Ip, Llc Image capture and identification system and process
US9031278B2 (en) 2000-11-06 2015-05-12 Nant Holdings Ip, Llc Image capture and identification system and process
US9031290B2 (en) 2000-11-06 2015-05-12 Nant Holdings Ip, Llc Object information derived from object images
US9036948B2 (en) 2000-11-06 2015-05-19 Nant Holdings Ip, Llc Image capture and identification system and process
US9036949B2 (en) 2000-11-06 2015-05-19 Nant Holdings Ip, Llc Object information derived from object images
US9036862B2 (en) 2000-11-06 2015-05-19 Nant Holdings Ip, Llc Object information derived from object images
US9036947B2 (en) 2000-11-06 2015-05-19 Nant Holdings Ip, Llc Image capture and identification system and process
US9046930B2 (en) 2000-11-06 2015-06-02 Nant Holdings Ip, Llc Object information derived from object images
US9785859B2 (en) 2000-11-06 2017-10-10 Nant Holdings Ip Llc Image capture and identification system and process
US9785651B2 (en) 2000-11-06 2017-10-10 Nant Holdings Ip, Llc Object information derived from object images
US9613284B2 (en) 2000-11-06 2017-04-04 Nant Holdings Ip, Llc Image capture and identification system and process
US10509820B2 (en) 2000-11-06 2019-12-17 Nant Holdings Ip, Llc Object information derived from object images
US9578107B2 (en) 2000-11-06 2017-02-21 Nant Holdings Ip, Llc Data capture and identification system and process
US9110925B2 (en) 2000-11-06 2015-08-18 Nant Holdings Ip, Llc Image capture and identification system and process
US9116920B2 (en) 2000-11-06 2015-08-25 Nant Holdings Ip, Llc Image capture and identification system and process
US9135355B2 (en) 2000-11-06 2015-09-15 Nant Holdings Ip, Llc Image capture and identification system and process
US9141714B2 (en) 2000-11-06 2015-09-22 Nant Holdings Ip, Llc Image capture and identification system and process
US9148562B2 (en) 2000-11-06 2015-09-29 Nant Holdings Ip, Llc Image capture and identification system and process
US9154694B2 (en) 2000-11-06 2015-10-06 Nant Holdings Ip, Llc Image capture and identification system and process
US9154695B2 (en) 2000-11-06 2015-10-06 Nant Holdings Ip, Llc Image capture and identification system and process
US9152864B2 (en) 2000-11-06 2015-10-06 Nant Holdings Ip, Llc Object information derived from object images
US9170654B2 (en) 2000-11-06 2015-10-27 Nant Holdings Ip, Llc Object information derived from object images
US9536168B2 (en) 2000-11-06 2017-01-03 Nant Holdings Ip, Llc Image capture and identification system and process
US9182828B2 (en) 2000-11-06 2015-11-10 Nant Holdings Ip, Llc Object information derived from object images
US9235600B2 (en) 2000-11-06 2016-01-12 Nant Holdings Ip, Llc Image capture and identification system and process
US9244943B2 (en) 2000-11-06 2016-01-26 Nant Holdings Ip, Llc Image capture and identification system and process
US9262440B2 (en) 2000-11-06 2016-02-16 Nant Holdings Ip, Llc Image capture and identification system and process
US9288271B2 (en) 2000-11-06 2016-03-15 Nant Holdings Ip, Llc Data capture and identification system and process
US9310892B2 (en) 2000-11-06 2016-04-12 Nant Holdings Ip, Llc Object information derived from object images
US9311554B2 (en) 2000-11-06 2016-04-12 Nant Holdings Ip, Llc Image capture and identification system and process
US9311552B2 (en) 2000-11-06 2016-04-12 Nant Holdings IP, LLC. Image capture and identification system and process
US9311553B2 (en) 2000-11-06 2016-04-12 Nant Holdings IP, LLC. Image capture and identification system and process
US9317769B2 (en) 2000-11-06 2016-04-19 Nant Holdings Ip, Llc Image capture and identification system and process
US9324004B2 (en) 2000-11-06 2016-04-26 Nant Holdings Ip, Llc Image capture and identification system and process
US9330326B2 (en) 2000-11-06 2016-05-03 Nant Holdings Ip, Llc Image capture and identification system and process
US9330327B2 (en) 2000-11-06 2016-05-03 Nant Holdings Ip, Llc Image capture and identification system and process
US9330328B2 (en) 2000-11-06 2016-05-03 Nant Holdings Ip, Llc Image capture and identification system and process
US9360945B2 (en) 2000-11-06 2016-06-07 Nant Holdings Ip Llc Object information derived from object images
US9336453B2 (en) 2000-11-06 2016-05-10 Nant Holdings Ip, Llc Image capture and identification system and process
CN100433050C (zh) * 2004-01-08 2008-11-12 日本电气株式会社 移动通信系统、移动终端和固定站设备,字符识别设备、方法和程序
JP4591353B2 (ja) * 2004-01-08 2010-12-01 日本電気株式会社 文字認識装置、移動通信システム、移動端末装置、固定局装置、文字認識方法および文字認識プログラム
US8135218B2 (en) 2004-01-08 2012-03-13 Nec Corporation Character recognition device, mobile communication system, mobile terminal device, fixed station device, character recognition method and character recognition program
WO2005066882A1 (ja) * 2004-01-08 2005-07-21 Nec Corporation 文字認識装置、移動通信システム、移動端末装置、固定局装置、文字認識方法および文字認識プログラム
JPWO2005066882A1 (ja) * 2004-01-08 2007-12-20 日本電気株式会社 文字認識装置、移動通信システム、移動端末装置、固定局装置、文字認識方法および文字認識プログラム
US7916948B2 (en) 2004-01-08 2011-03-29 Nec Corporation Character recognition device, mobile communication system, mobile terminal device, fixed station device, character recognition method and character recognition program
US7369704B2 (en) 2004-05-18 2008-05-06 Sharp Kabushiki Kaisha Image processing apparatus, image processing system, and image processing method
CN100416548C (zh) * 2004-05-18 2008-09-03 夏普株式会社 图像处理装置、图像处理系统、图像处理方法
JP2006185101A (ja) * 2004-12-27 2006-07-13 Aisin Aw Co Ltd 画像認識装置及び方法、ナビゲーション装置
JP4648697B2 (ja) * 2004-12-27 2011-03-09 アイシン・エィ・ダブリュ株式会社 画像認識装置及び方法、ナビゲーション装置
US7904724B2 (en) 2005-03-25 2011-03-08 Fuji Xerox Co., Ltd. Translation device, translation method, and storage medium
JP2015007992A (ja) * 2006-01-26 2015-01-15 ナント・ホールデイングス・アイ・ピー・エル・エル・シー データ取得及び識別のためのシステム及び方法
JP2012194984A (ja) * 2006-01-26 2012-10-11 Evryx Technologies Inc データ取得及び識別のためのシステム及び方法
JP2010218041A (ja) * 2009-03-13 2010-09-30 Omron Corp 携帯式文字認識装置、文字認識プログラム及び文字認識方法
JP2011090681A (ja) * 2010-10-25 2011-05-06 Aisin Aw Co Ltd 画像認識装置及び方法、ナビゲーション装置
JP2014529822A (ja) * 2011-08-29 2014-11-13 クアルコム,インコーポレイテッド コンテキスト情報を用いるカメラocr
US9082035B2 (en) 2011-08-29 2015-07-14 Qualcomm Incorporated Camera OCR with context information
KR101619252B1 (ko) 2011-09-01 2016-05-10 퀄컴 인코포레이티드 모바일 디바이스를 사용한 증강 메뉴를 수반하는 시스템들 및 방법들
US9179278B2 (en) 2011-09-01 2015-11-03 Qualcomm Incorporated Systems and methods involving augmented menu using mobile device
JP2016173847A (ja) * 2011-09-01 2016-09-29 クアルコム,インコーポレイテッド モバイルデバイスを使用した拡張メニューを伴うシステムおよび方法
JP2014529249A (ja) * 2011-09-01 2014-10-30 クアルコム,インコーポレイテッド モバイルデバイスを使用した拡張メニューを伴うシステムおよび方法
WO2015045680A1 (ja) * 2013-09-27 2015-04-02 シャープ株式会社 翻訳装置およびその制御プログラム
JP2015069366A (ja) * 2013-09-27 2015-04-13 シャープ株式会社 翻訳装置およびその制御プログラム
JP2015106183A (ja) * 2013-11-28 2015-06-08 シャープ株式会社 翻訳装置、および翻訳装置の制御方法
WO2015079752A1 (ja) * 2013-11-28 2015-06-04 シャープ株式会社 翻訳装置、および翻訳装置の制御方法
US10394841B2 (en) 2014-06-18 2019-08-27 Google Llc Generating contextual search presentations
JP2017525026A (ja) * 2014-06-18 2017-08-31 グーグル インコーポレイテッド 文脈検索の提示の生成
JP2018018404A (ja) * 2016-07-29 2018-02-01 株式会社Nttドコモ 翻訳システム
JP2018129689A (ja) * 2017-02-08 2018-08-16 パナソニック株式会社 文字認識システム、文字認識方法、及び文字認識サーバ
WO2022195870A1 (ja) * 2021-03-19 2022-09-22 ソニーグループ株式会社 情報処理装置、情報処理方法、情報処理プログラムおよび端末装置

Also Published As

Publication number Publication date
US20050221856A1 (en) 2005-10-06
CN1615478A (zh) 2005-05-11
WO2003050714A1 (fr) 2003-06-19

Similar Documents

Publication Publication Date Title
JP2003178067A (ja) 携帯端末型画像処理システム、携帯端末およびサーバ
US9589198B2 (en) Camera based method for text input and keyword detection
EP1553517B1 (en) Character recognition processing device, character recognition processing method, and mobile terminal device
US5262860A (en) Method and system communication establishment utilizing captured and processed visually perceptible data within a broadcast video signal
CN101667251B (zh) 具备辅助定位功能的ocr识别方法和装置
US20110167081A1 (en) Image processing apparatus and image processing method
US7623742B2 (en) Method for processing document image captured by camera
JPWO2008149709A1 (ja) 携帯端末、携帯端末の制御方法、携帯端末の制御プログラムおよびこれを記録したコンピュータ読み取り可能な記録媒体
CN102201051A (zh) 文字摘录装置、方法和系统
CN108171231A (zh) 一种基于图像识别的通信方法和装置
JP2009081785A (ja) 撮像装置、画像生成方法、およびプログラム
JP4597644B2 (ja) 文字認識装置、プログラムおよび記録媒体
CN111144141A (zh) 基于拍照功能的翻译方法
JP2001008072A (ja) 電子カメラ及びその制御方法
KR100772581B1 (ko) 카메라부를 구비하는 휴대 단말과 그의 사전 정보 제공방법
CN101674420A (zh) 撷取图像文字的翻译系统及其方法
JP5181935B2 (ja) 画像処理装置、プログラム及び被写体検出方法
JP2005135210A (ja) 文字認識機能を有する携帯機器
JP2005057360A (ja) 画像撮影装置およびプログラム
JP2005018507A (ja) 携帯情報端末及びそれを用いた文字認識方法
JP2002216148A (ja) 画像表示制御装置、画像表示制御方法およびその方法をコンピュータに実行させるプログラム
JP2010191907A (ja) 文字入力装置および文字入力方法
KR100821159B1 (ko) 핫코드를 인식하는 이동통신 단말기 및 그 방법
KR20090039404A (ko) 디지털 영상처리장치 및 그 제어방법
KR20080044726A (ko) 카메라를 구비한 단말기 및 그의 동작방법

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20041115

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20060801

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20060929

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20061024