JP4036168B2

JP4036168B2 - 携帯電話

Info

Publication number: JP4036168B2
Application number: JP2003316179A
Authority: JP
Inventors: 正裕山崎; 英樹桑本
Original assignee: Hitachi Ltd
Current assignee: Hitachi Ltd
Priority date: 2003-09-09
Filing date: 2003-09-09
Publication date: 2008-01-23
Anticipated expiration: 2023-09-09
Also published as: CN1595944A; JP2005084951A; US20050052558A1; CN1595944B

Description

本発明は、撮像部を備えた情報処理装置に関するものである。

特開２００２−２５２６９１号公報には、OCR（Optical Character Recognition）機能により、撮像した画像情報に含まれる文字を文字情報に変換し、印刷物に掲載された住所や名前、電話番号、URL（Uniform Resource Locator）などを入力できる携帯電話が提案されている。

特開２００２−２５２６９１

しかしながら、上記特許文献１では、印刷物に掲載された住所等の情報を入力できるＯＣＲ機能を搭載した携帯電話が開示されているものの、機能を使用する際の使い勝手の検討が不十分であった。例えば、雑誌に記載されたURLなどを携帯電話に登載されたカメラを使って撮像する際に、実際に紙面上に書かれた文字の位置と携帯電話のディスプレイに表示された文字の位置とがずれてしまうため、ユーザが認識させたい文字をディスプレイの所定の位置に合わせるのが難しいといった問題があった。すなわち、認識対象を特定する操作が煩わしいという問題があった。

そこで、本発明は、使い勝手の向上した携帯電話を提供することを目的とする。

上記課題を解決するために、例えば、特許請求の範囲に記載された如く構成すればよい。

本発明によれば、使い勝手の向上した携帯電話を提供することができる。

以下、本発明の実施の形態を、図面を用いて説明する。なお、以下の図面において、同一の構成部については同符号を用いる。

図１は、本実施形態（第１の実施形態）に係る携帯電話の構成ブロック図である。本実施形態においては、携帯電話に搭載された画像認識機能（ＯＣＲ機能）を利用して、雑誌等に掲載されたＵＲＬを携帯電話に入力する場合について説明する。

なお、以下、携帯電話について説明するが、例えば、携帯電話以外にも、デジタルカメラ、PHS（Personal Handy-phone System）、PDA（Personal Digital Assistant）やPC（Personal Computer）等でもよい。

入力部１０１は、キーボード等の電話番号その他の情報を入力する入力部であり、携帯電話の電源をＯＮ/ＯＦＦするとき、被写体を撮像するときなど、ユーザが携帯電話に入力を与える際に使用するものである。

ＣＰＵ１０２は、記憶部１０４に記憶されたプログラムに基づいて動作し、例えば、入力部１０１からの入力に応じて各部を制御するものである。

撮像部１０３は、例えば、カメラなどで構成されたものであり、被写体である人の顔や、景色、文字などを撮像し、ＣＰＵ１０２で扱える画像情報に変換し、変換された画像情報は必要に応じて表示部１０７等に出力する。ユーザは、表示部１０７に出力された画像情報をモニタしながら撮像したい画像を選んで、例えば、シャッターキーとして割り当てられた操作キー（以下、シャッターキー）等を押下することにより撮像の指示を行う。シャッターキーが押下されれば、撮像された画像情報は記憶部１０４に記憶される。また、記憶部１０４は、例えば、ＲＯＭ（Read Only Memory）やＲＡＭ(Random Access Memory)等で構成され、携帯電話１００で扱うデータやソフトウェアなども記憶する。

画像認識部１０５は、画像情報に含まれる文字や記号等の識別情報を認識する。ここで、識別情報とは、文字、記号等で表された情報であり、例えば、ホームページのアドレス、メールアドレス、住所、電話番号、地図情報あるいは英語の単語等のように文字や記号等で表現されたものであり、事物を識別できる情報であれば上記例以外のものでも構わない。

また、ここで、認識とは、撮像部１０３により撮像された画像情報に含まれる識別情報を抽出し、その識別情報を所定の領域ごとに分割し、分割された領域を所定のパラメータ値に変換し、そのパラメータ値に基づいて分割された領域がどのような情報であるかを決定することをいう。

より具体的にいえば、例えば、画像情報内の「abc」という文字を「認識」する場合を考えると、まず、「abc」が画像情報内のどの位置の情報であるかを特定し（文字列抽出）、次に、「a」「b」「c」に分割し、「a」を所定のパラメータ値（例えば、その文字を縦、横、斜めからの見た線分の構成を、文字の白色部分を「０」、黒色部分を「１」としてパラメータ化された値）に変換する。そして、変換されたパラメータ値に最も類似したパラメータ値と対応付けされた文字を文字パターンデータ表より選び出す。文字パターンデータ表とは、パラメータ値とそのパラメータ値に対応したアルファベット等の文字とが記述されている表であり、予め記憶されているものである。なお、画像認識部１０５はＯＣＲ機能を備えており、ＯＣＲ機能を実現する具体的な構成は、例えば、特許文献１に記されている。

また、認識する前に認識対象となる識別情報を特定するのであるが、特定する手段として、例えば、表示部１０７の中心に表示された「＋」マークを識別情報の上に持っていけば、「＋」マークの位置から近傍のスペース情報からスペース情報までの部分を一区切りの単語として自動的に特定するようにしてもよい。

また、ユーザが入力部１０１を利用して認識部分をカーソル等で指定できるようにしても構わない。更に、認識対象を決定する方法が複数ある場合に、複数個同時に選択できるようにしても構わないし、動画の場合は、動画を静止画でコマ送りできるように設定しておき、そのコマ送り画面で認識対象部を選択できるようにしても構わない。

また更に、認識対象を決定するためにひとまず対象を決定する「仮決定」と仮決定された対象が間違っていない場合に「本決定」を行うように構成すれば、仮決定の段階で認識対象の特定に誤りがある場合に容易に対象文字等の変更を行うことができるために使い勝手がよい。

表示部１０７は、例えば、ＬＣＤ（Liquid Crystal Display）や有機ＥＬ（Electroluminescence）等で構成され、撮像部１０３により撮像された画像や画像認識部１０５により認識された識別情報を表示する。その他、表示部１０７に、例えば、電源状態、電波強度、電池残量、サーバ接続状態もしくは未読メール等の動作状態、入力した電話番号、メール宛先、メール送信文書等や、動画および静止画、着信時の発呼者の電話番号、着信メール文書、接続されたインターネット画面等の受信データの表示、また、携帯電話の機能を利用するために必要な画面を表示する。

通信部１０６は、他の情報処理装置とデータのやり取りを行う。また、携帯電話１００がインターネットや他の情報処理装置などにアクセスするための通信処理等も行う。また、通信部１０６は、図１に示すように１つのみを使用する場合に限らず、例えば、ＣＤＭＡ、ＥＶ−ＤＯ、無線ＬＡＮ等の複数の通信方式を利用可能にするために複数備えても良い。

また、ＣＰＵ１０２は、モード判定フラグを利用して、撮像モードが通常の静止画又は動画を撮像する通常撮像モードであるか、画像認識部１０５を利用して識別情報を認識するモードである認識モードであるかを判定する。ここで、モード判定フラグは、例えば、記憶部１０４に記憶されたソフトウェアのプログラム中に存在する変数で、認識モードの場合と通常撮像モードとでは異なる値になるようにし、ＣＰＵ１０２はこの変数に基づいて認識モードと通常撮像モードとを、例えば、入力部１０１による操作により切り換える。以下、実施形態では、「認識モード」と「通常撮像モード」との２種類を有する場合を考えるが、これに限定されるものではなく、それ以外にモードがあっても構わない。

図２は、携帯電話１００の外観図である。図２（１）は、携帯電話１００の前面図、図２（２）は、携帯電話１００の側面図、図２（３）は、携帯電話１００の背面図である。携帯電話１００は表示部１０７及び撮像部１０３を有する筐体１１０と、入力部１０１を有する筐体１２０とがヒンジ部１３０を介して接続され、折り畳み可能となっている。

撮像部１０３は、筐体１２０のうち表示部１０７が配置されている面（以下、「前面」）と対向する裏側の面（以下、「背面」）であって、当該面と表示部１０７の中心付近から表示部の法線方向に引いた直線とが交わる点の近くに配置されている。ここで、表示部１０７の中心とは、表示部１０７の重心であるとする。ここでいう重心とは、その物体の質量や密度は考慮されずに決定される幾何学的な重心である。
例えば、表示部１０７が長方形であると想定すると、その質量分布の偏り等に関わらず対角線の交点が重心となり、すなわち、表示部１０７の「中心」となる。

なお、厳密に重心である必要はない。実際に肉眼で紙面等を見る場合と撮像部１０３により取得された紙面等の画像情報を見る場合とでその位置のギャップによる違和感が感じられないならば、例えば、数ｍｍ程度の誤差があっても構わない。

このように撮像部１０３が、表示部１０７の中心から表示部と対向する背面に対して引かれた法線が当該背面に交わる点（以下、背面中心対応点と呼ぶ）の付近に配置されることで、紙面上の文字と、携帯電話の表示部に表示された文字の位置とがユーザから見るとほぼ同じ位置になる。従って、ユーザが文字認識する際に認識させたい文字の選択が違和感なく容易に行えるため、使い勝手がよい。

なお、配置される撮像部１０３は上記背面から突出しないように構成するほうが好ましい。これは、ユーザは通常携帯電話が折り畳まれた状態で持ち歩いており、例えば、カバンや机等と衝突して破損する危険があるためである。

なお、本実施形態では、メインの表示部１０７（図２（１）参照）だけを備えた例を示したが、筐体１１０の背面に種々の表示を行うためのサブ表示部を備えた構成にしてもよい。携帯電話を折畳んだ状態でメールの受信や着信、時計などを確認することができるため、非常に便利である。

この場合を、図３（１）〜（３）に例示する。図３（１）は、サブ表示部３０１が撮像部１０３の図面において上側に、すなわち、撮像部１０３から見てヒンジ部１３０とは反対側に配置されたことを示す図である。もちろん、撮像部１０３の図面において下側に、すなわち、ヒンジ部１３０と撮像部１０３との間のスペースにサブ表示部３０１を設けるように構成しても良い。

図３（２）は、撮像部１０３の上側にサブ表示部３０１が配置され、下側にサブ表示部３０２が配置されたことを示す図である。この配置は、上述したように背面中心対応点付近に撮像部１０３が配置されることによってサブ表示部３０１の大きさが限定されてしまうといった課題を考慮してなされたものである。

このように、背面に設けられるサブ表示部が複数あることにより、携帯電話が折りたたまれた状態においても参照可能な表示領域を十分に確保できる。更に、それぞれのサブ表示部毎に役割を決めて表示内容を表示させるようにすれば、ユーザの利便性を向上させることができる。

例えば、携帯電話を閉じた状態でＭＰ３やＭＩＤＩファイル等の楽曲ファイルを聴く場合について説明すると、あるサブ表示部にはアーチスト名、他のサブ表示部には歌詞等を表示させるようにすれば、ユーザの使い勝手は向上する。この場合、携帯電話１００には音楽を聴くためのスピーカ等の音声データ出力部（図示しない）が備わっているというのは言うまでもない。

また更に、図３（２）のように複数のサブ表示部を有する場合に、どのサブ表示部を利用するかをユーザが入力部１０１等を介して選択できるようにしてもよい。この場合、ユーザにより使用するサブ表示部の選択指示がなされれば、サブ表示部選択信号がＣＰＵ１０２に入力され、当該サブ表示部選択信号を受信したＣＰＵ１０２は、サブ表示部選択信号に基づいて電力を供給するサブ表示部を決定する。

これにより、サブ表示部が複数ある場合でも、ユーザは使用するサブ表示部のみを選択できる。従って、必ずしも複数のサブ表示部全てに電力を供給させるわけではないため、無駄な消費電力の低減に貢献するとともに使い勝手も向上する。

なお、ここでは、撮像部１０３を挟んで上下方向に分割してサブ表示部３０１及び３０２の２つのサブ表示部が配置されているが、これに限定するものではなく、例えば、横方向に２つ分割して配置されていたり、あるいは、図３（３）に示すようにサブ表示部３０３が撮像部１０３を取り囲むように配置されていても構わない。また、サブ表示部の数も２つ以上であっても構わない。

図４は、メインの表示部１０７に画像認識部１０５により識別情報を認識する場合に利用するための表示画面（以下、ＯＣＲ専用画面：図面では４０２）を特別に設けた図例である。

ユーザが入力部１０１を介して認識モードを選択したとすると、ＣＰＵ１０２は、予め記憶部１０４に記憶されたＯＣＲ専用画面４０２をＯＣＲ画面領域データに基づいて表示する。ここで、ＯＣＲ画面領域データとは、ＯＣＲ専用画面４０２を表示部４０１のどこに表示するかを表すデータである。ＣＰＵ１０２は、太枠などを利用してＯＣＲ専用画面４０２が表示部４０１内のどの辺りに位置するかを明確に分かるように表示する。

また、ＣＰＵ１０２は、撮像部１０３により出力された画像情報をＯＣＲ専用画面４０２に表示する。

この場合は、図２や図３と異なり、撮像部１０３は、表示部１０７ではなくＯＣＲ専用画面４０２の中心からＯＣＲ専用画面４０２と対向する背面に対して引かれた法線が当該背面に交わる点の付近に配置される。ここで、例えば、図４に示すように、ＯＣＲ専用画面４０２を表示部１０７の下部に位置するようにすれば、背面に配置される撮像部１０３の位置も図面において下の方、すわわち、ヒンジ部よりに配置されるため、背面にサブ表示部を設けるためのスペースが図２等に比べて大きくなる。

そのため、前述したように違和感なく容易に文字認識できるだけでなく、サブ表示部の面積を大きくすることができる。そのため、閉じた状態におけるユーザの使い勝手が向上する。

なお、図４では、ＯＣＲ専用画面４０２を下部に設けるように構成したが、これに限定するものではなく、例えば、上部に設けるようにしても構わない。

また、表示画面４０１内でＯＣＲ専用画面４０２以外の領域に他の機能に関する表示画面を出力するようにしても構わない。

例えば、ＯＣＲ専用画面を利用して名刺等に記載されたメールアドレスを認識した場合に、記憶部１０４に記憶されたアドレス帳を表示画面４０１内でＯＣＲ専用画面４０２以外の領域に表示する。この際に、所定の操作を介して当該メールアドレスをアドレス帳に記憶できるようにしても構わない。

これにより、ユーザはわざわざ改めてアドレス帳に登録する指示を行うことなく、速やかにアドレス帳に登録できるため、使い勝手がよい。これ以外にも、例えば、認識対象がＵＲＬ情報の場合に、表示画面４０１内でＯＣＲ専用画面４０２以外の領域にそのＵＲＬの内容を表示させてもよい。

また、上記実施形態では、折り畳み可能な携帯電話を想定したが、それ以外の形状の携帯電話にも適用できる。例えば、図５のように、メインディスプレイを有する筐体５１０とメイン操作部を有する筐体５２０とが連結部５３０を介し紙面に対して略水平方向に回転可能である携帯電話（以下、水平回転可能携帯電話）の場合について説明する。

図５（１）は、携帯電話が閉じた状態を示し、図５（２）は、携帯電話が開いた状態を示し、図５（３）は、図５（２）の裏側の面を示した図である。

図５（３）に示すように、図５（２）のように携帯電話が開いた状態において表示画面５０４の背面中心対応点付近に撮像部５０１が配置される。そして、図５（１）のように携帯電話が閉じた状態において表示画面５０４の裏側の面であって、表示画面５０４の中心からその裏側の面に対して引かれた法線が当該裏側の面と交わる点付近に撮像部５０２が配置される。

これにより、ユーザが水平回転可能携帯電話の閉じた状態又は開いた状態で文字認識する場合に認識させたい文字の選択が違和感なく容易に行えるため、使い勝手がよい。

他の形状の携帯電話においても、撮像部１０３により出力された画像情報を表示する表示部と撮像部１０３の対応位置関係を工夫して、その結果、ユーザが文字認識する場合に認識させたい文字の選択が違和感なく容易に行えるのであれば多少の位置誤差があっても構わない。

なお、入力操作キー５０３を用いることで、図５（１）のように閉じた状態でも操作可能となり便利である。

次に、文字認識する際に撮像部１０３を表示部の背面中心対応点付近に動かす場合を説明する。図６は、この場合を図示したものである。図６では、撮像部１０３とサブ表示部６０１とが一体化されており、撮像部１０３が動いたとしても両者の相対距離はほぼ同じとなる。本実施形態において、撮像部１０３を背面に沿って移動させるものとする。

通常は、図６（２）のように、サブ表示部６０１が背面のほぼ中心付近に位置しており、画像認識部１０５により識別情報を認識する場合に図６（３）のように撮像部１０３を背面中心対応点付近に移動させる場合について説明する。

この場合、筐体１１０の背面には予め撮像部１０３が移動できるための移動溝６０２が形成されており、背面中心対応点付近の移動溝６０２には認識モードを起動するための回路を配置しておく。これにより、撮像部１０３を背面中心対応点付近に移動させると撮像部１０３に予め設けられたスイッチ部が上記回路と接続する。そして、スイッチが回路と接続すれば、ＣＰＵ１０２は、認識モードが起動するように処理する。すなわち、撮像部１０３により取得された画像情報をメインの表示部１０７に表示する。

これにより、通常時にはサブ表示部６０１を背面の中心付近に配置することができるため、当該サブ表示部６０１が見やすくなる。更に、撮像部１０３を移動させることにより自動的に認識モードが起動するため、操作の手間を省くことができる。

なお、上記では、撮像部１０３とサブ表示部６０１とが一体化された構造について説明したが、一体化されていなくても構わない。

次に、第２の実施形態について説明する。上述したように、背面中心対応点付近に撮像部１０３を設けるように構成しようとすると、表示部１０７と撮像部１０３によって筐体１１０の厚みが大きくなってしまい、持ちづらくなってしまったり、デザイン的に美観を損ねる恐れもある。また、前述したように、撮像部１０３の配置位置によってサブ表示部の大きさも制限されるという問題もある。

そこで、本実施形態においては、撮像部１０３を背面中心対応点付近からずらした位置、例えば、筐体１１０の背面でヒンジ部１３０に近い位置に表示部１０７と重ならないように配置する場合について説明する。この場合においても、ユーザが文字認識時の認識対象の選択を違和感なく行えるための構成を以下に説明する。

図７は、本実施形態の携帯電話１００の撮像部１０３、表示部１０７、名刺及び雑誌等の紙面７０１との位置関係を示した図である。ここでは、サブ表示部７０５も備えている場合を考える。認識する場合に紙面上の文字の位置と表示部１０７に表示される文字の位置とがほぼ同じに見えるようにするため、撮像部１０３は表示部１０７の法線と紙面７０１との交点付近に向くように傾けて配置される。すなわち、撮像部１０３は鉛直方向より傾き角度θ７０２だけ傾けられている。この傾き角度θ７０２は、距離Ｄ７０３と距離ｄ７０４を基にして決定される。ここで、距離Ｄ７０３とは、表示部１０７の中心から引かれた法線と紙面７０１とが交わる点Ａと撮像部１０３の中心付近から当該法線と平行の向きに引いた直線と紙面７０１とが交わる点Ｂとの距離である。また、距離ｄ７０４は撮像部１０３の中心付近と紙面７０１との距離である。距離ｄ７０４及び距離Ｄ７０３は予め、例えば、距離ｄ７０４は２〜４cm、距離Ｄ７０３は２〜４cmといったように設計時に設定しておいて、その初期設定値から傾き角度θ７０２を求める。

なお、距離ｄ７０４の初期設定値は、例えば、紙面等とどのくらい離れれば認ユーザは文字等を認識しやすいのか等実際の文字認識の場合を想定して設定することが望ましい。
また、距離Ｄ７０３の初期設定値は、例えば、撮像部１０３と表示部の大きさによって決定される。

しかし、上記の場合、表示部１０７に表示される画像情報が紙面上の文字を斜めから撮像するために斜め方向に歪み、見づらい表示画面となってしまう。

そのため、歪められた画像情報に変換処理を施し、見づらさを低減する実施形態について以下説明する。

図８は（１）は、撮像部１０３を傾ける前の画像情報の表示例である。ここでは、撮像部１０３の位置が下部（ヒンジ部側）に配置されていることにより、名刺等の下部のみが表示されている。

図８（２）は、図８（１）の状態から撮像部１０３の傾きを調整した場合の表示画面例である。表示部１０７の下方に表示される文字が大きく、上方に表示される文字が小さくなっており、文字も斜めに表示されてしまう。このままでは、ユーザは認識したい文字を選択するのが難しい。

そこで、ＣＰＵ１０２は、斜めに表示された画像を補正して平面的に表示されるように処理する。補正の方法としては、例えば、台形（キーストン）補正を用いて斜めの画像を平面になるように補正する。なお、その他の補正方法を用いても構わない。

その画面例を、図８（３）に示す。このように、撮像部１０３が筐体面に対して傾いて配置されていることに起因する歪みを補正することで、紙面等の文字と表示部１０７に表示される文字とがユーザから見てほぼ同じ位置、大きさに見えるため、認識する際に認識対象の文字を選択し易くなり使い勝手が向上する。

次に、第３の実施形態について説明する。上記第２の実施形態のように撮像部１０３を斜めに傾かせて配置した携帯電話では、文字認識する際は有効である。しかし、普通に人物や風景を撮像する場合、つまり、「認識モード」ではなく「通常撮像モード」で撮像する場合は、撮像部１０３が角度θ７０２傾いているために、ユーザの視線の先にある撮像対象物と、表示部１０７に表示されるものとが随分異なってしまう場合がある。例えば、ある人の顔を撮像したいのにその人の足元が表示部に表示されてしまう場合などである。これだと人物の顔などを撮像することが困難となる。

そこで、本実施形態では、撮像部１０３の傾きを可変にする場合を想定し、特に、「認識モード」時のみ撮像部１０３の傾きを変えられる場合を考える。

本実施形態の携帯電話には、撮像部１０３の隣接部分に撮像部１０３の傾きを変える角度調整部９０１が備えられている。図９を用いて、以下に説明する。

図９（１）に示すように、角度調整部９０１は回転駆動部９０２を有している。そして、この回転駆動部９０２の回転が撮像部１０３に伝わることによって撮像部１０３は回転する。なお、ここでは、撮像部１０３として撮像レンズ９０３と撮像回路９０４からなるモジュール型の撮像部１０３を考えており、回転駆動部９０２は撮像回路部と接続される形態をとっているが、これに限定するものではない。

次に、撮像部１０３の傾きを調整する処理について説明する。ユーザにより入力部１０１を介して撮像部１０３の傾きを変更する指示操作がなされれば、ＣＰＵ１０２は、モード判定フラグの値を読み取って「認識モード」あるいは「通常撮像モード」のいずれのモードであるかを判定する。

そして、「認識モード」である場合は、予め記憶部１０４に記憶された角度調整信号を角度調整部９０１に送信する。角度調整信号を受信した角度調整部９０１は、当該角度調整信号に対応した回転量だけ回転する。その結果、撮像部１０３は所定角度回転することになる。

「認識モード」が終了されれば、その旨を示した認識モード終了信号がＣＰＵ１０２に入力され、ＣＰＵ１０２は、回転された撮像部１０３を元通りの傾きに戻すために再度角度調整信号を角度調整部９０１に送信する。ここで、送信される角度調整信号は、先ほど送信した角度調整信号とは逆の回転を示すデータもしくは元通りの傾きになるために必要なデータを含んでいる。そして、この角度調整信号を受信した角度調整部９０１は、当該角度調整信号に応じて撮像部１０３を元通りになるように回転させる。

一方、モード判定フラグの値により「通常撮像モード」であると判定したＣＰＵ１０２は、角度調整信号の出力を行わないように処理する。

以上のように、「認識モード」の場合だけ撮像部１０３を可動にすることで「通常撮像モード」において、いたずらに撮像部１０３が回転することを防止することができる。その結果、通常の人物等の撮像時においてユーザの視線の先にある撮像対象物と表示部１０７に表示されるものとが随分異なってしまうといった問題を解消できる。

また、「認識モード」が終了すれば撮像部１０３を自動的に元の傾きに戻すように処理することで、わざわざ撮像部１０３を元通りにする手間を省略することができるため、使い勝手がよい。さらに、撮像部が傾いた状態であれば、筐体面から撮像部１０３の一部分が突出してしまう場合があり、撮像部１０３を自動的に元の傾きに戻すことで、その突出による撮像部１０３の破損を防ぐことができる。

なお、上記において、「通常撮像モード」であると判定した場合に撮像部１０３を角度を調整させないようするとともに、現在の撮像モードが「通常撮像モード」であることを通知するようにすれば、ユーザは撮像部１０３が可動しない理由（認識モードでないということ）を容易に知ることができる。

また、上記第３の実施形態では、「認識モード」時のみ撮像部１０３の傾きを変えられる場合を想定したが、「通常撮像モード」の時も撮像部１０３の傾きを変えられるようにしても構わない。この場合、「通常撮像モード」時に撮像部１０３の傾きを変えると、「通常撮像モード」終了時には自動的に元通りの傾きになるように構成する。これにより、上記のように、例えば、ある人の顔を撮像したいがその人の足元が表示部に表示されてしまう場合などの問題を解消できる。

また、角度調整部９０１は、図９（２）に示すように、撮像部１０３にアクチュエーター９０５が接続された構造としてもよい。ここでは、アクチュエータ９０５が４本撮像部１０３と接続されている場合を考えており、この場合は、４本それぞれのアクチュエータの動きにより撮像部１０３の傾きを変える。このように構成することで、撮像部１０３を様々な方向に傾かせることができるため、ユーザは細かい微調整が可能となり使い勝手がよい。

さらに、図１０のように、角度上げボタン１００１、角度下げボタン１００２等の撮像部１０３の傾きを変更するための専用ボタンを設けてもよい。角度上げボタン１００１は、撮像部１０３の傾きを上げるボタンであり、このボタンがユーザによって押下されると、角度上げ指示信号がＣＰＵ１０２を介して角度調整部９０１に出力され、その信号を受信した角度調整部は、撮像部１０３の傾きを角度上げ指示信号に基づいて調整する。角度下げボタン１００２がユーザにより押下された場合も同様に調整する。

このように、ユーザ自身が撮像部１０３の傾きを調整できるため、ユーザの一番見易い方向に撮像部１０３を向けることができ、より使い勝手がよくなる。

また、角度上げボタン１００１や角度下げボタン１００２の代わりに、角度調整ダイヤル１００３のようにダイヤル形式で構成しても構わない。これにより、微妙な角度調整を行える。

なお、傾き方向はヒンジ軸（ヒンジ部の中心軸）周りだけでなく、それ以外の方向に傾かせるように構成しても構わない。この場合、３６０度回転に対応した操作キー（例：ジョイスティック）等を用いる。これにより、携帯電話を持つ手を固定したままで、紙面等に記載された認識対象単語を探索でき、使い勝手がよい。

次に、第４の実施形態について説明する。本実施形態においては、距離センサを用いて自動的に撮像部１０３の傾きを調整する方法について説明する。

図１１は、本実施形態に係る携帯電話の外観図である。距離センサ１１０１は、付属の投光部１１０２から発せられた赤外線がセンサ前方の物体に反射してセンサ１１０１に付属している受光部１１０３に戻ってくるまでの時間を計測して、センサ１１０１前方の対象物とセンサ１１０１間の距離を計測するものである。ここでは赤外線距離センサ１１０１を用いたが、超音波等の他の手段を用いた距離センサであっても良い。また、当該センサは、正確な距離を検出できるものでなくてもよく、センサからある大まかな距離に物体が有るか否かを判定できる程度のセンサであっても良い。

また、距離センサ１１０１は、撮像部１０３の近くに備えることが望ましい。これは、
距離センサ１１０１と撮像部１０３とが離れて配置されていると、撮像部−紙面間の距離と距離センサ−紙面間の距離との差が大きくなる恐れがあり、撮像部−紙面間の距離d７０４が不正確な値となってしまうからである。

図１２は、本実施形態の処理を示すフローチャート図である。ここでは、認識対象をモニタ中に撮像部１０３の傾きを調整する場合について説明する。モニタ中とは、撮像部によりカメラ機能を起動させた後撮像決定もしくは認識対象特定の指示がなされていない状態を意味する。

まず、携帯電話がキー入力を待つ状態（ステップＳ１２０１）において、カメラ機能を起動するキー入力をＣＰＵ１０２が検出すると（ステップＳ１２０２）、記憶部１０４に保存されているカメラ機能に関する変数の初期化等といったカメラ起動処理を行う（ステップＳ１２０３）。その後、ＣＰＵ１０２は、撮像モードが、「認識モード」「通常撮像モード」のいずれかであるかを判定する。

次に、距離センサ１１０１によって紙面と撮像部１０３との距離を測定し（ステップＳ１２０４）、測定結果を記憶部１０４に保存する。ＣＰＵ１０２が記憶部１０４に保存された上記測定結果を読み取り、その測定結果から傾きθを計算する（ステップＳ１２０５）。その後、撮像部１０３の向きをその傾きθに変更するように要求する角度調整信号を角度調整部９０１に送り、その角度調整信号を受信した角度調整部９０１は角度調整信号に基づいて撮像部１０３の傾きをθに変更する（ステップＳ１２０６）。

次に、撮像部１０３が画像を取得し、記憶部１０４に一時的に保存する（ステップＳ１２０７）。その画像をＣＰＵ１０２が読み取り、距離センサによって測定された撮像部１０３と紙面との距離を用いて、斜めから撮られたことにより歪められた画像情報を補正して記憶部１０４に保存する（ステップＳ１２０８）。ここで、補正手段として、「台形補正（キーストン補正）」を用いて歪みを補正する。

その画像をＣＰＵ１０２が読み取り、表示部１０７に表示する（ステップＳ１２０９）。

その後、シャッターキーが押下されたか否かを判断し（ステップＳ１２１０）、シャッターキーの押下が検出されなかった場合は、またステップＳ０４に戻って同様の処理を繰り返す。

ステップＳ１２１０において、シャッターキーの入力を検出した場合は、撮像部１０３が撮像対象物を撮像し（ステップＳ１２１１）、その画像を用いて画像認識部１０５が文字認識を行う（ステップＳ１２１２）。そして、その結果を表示部１０７に表示する（ステップＳ１２１３）。

このように、撮像部１０３の傾きを適宜自動的に調整することで、紙面上の文字と表示部１０７に表示される文字とをほぼ同じ位置に見えるようにすることができ、ユーザは文字認識の対象となる文字列の選択がし易く、使い勝手がよい。

また、図１１では距離センサを撮像部１０３の横に１つだけ備えた例を示したが、筐体１１０の背面の上部にもう１つ備えてもよい。この場合、２つの距離センサの測定結果と筐体１１０の設計値（縦方向の長さ）を用いて、表示部１０７と認識対象文字等が記載された紙面等とのなす角度を求めることができる。この角度を使えば、表示部１０７と紙面とが平行でなかった場合でも、表示部１０７に表示する画像を補正することができる。なお、距離センサは携帯電話１００に搭載可能な数であるならば、いくつ搭載しても構わない。

また、携帯電話の傾きを測定する方法として、携帯電話にかかる加速度を測定する加速度センサを利用してもよい。加速度センサは、窒素や炭酸ガスなどの気体を閉じ込めた空間の中に一部の気体の温度を上昇させるヒータ、気体の温度を測定する温度計などを備えたものとして構成されている。加速度センサに加速度がかかった場合に、ヒータによって温度が上昇した一部の気体と、それ以外の温度が上昇していない気体との位置が変化するため、温度分布が変化する。その温度分布を温度計で測定することにより、センサにかかった加速度を測定する。この測定された加速度から加速度センサの鉛直方向に対する傾きが計算される。

これにより、加速度センサを備えることにより、携帯電話１００の傾きを知ることができる。通常、加速度センサの方が距離センサに比べて大きさが小さいため、距離センサを備えるより携帯電話をコンパクトにすることができるというメリットがある。

次に、第５の実施形態について説明する。本実施形態では、文字認識する際に認識させたい文字を特定する操作が煩わしいといった問題に鑑み、この問題を解決するために、所定の入力に従い、文字認識時に上述のような調節操作を行わずに認識させたい文字を選択できるように構成する。ここで、所定の入力とは、例えば、認識対象を「メールアドレス」や「電話番号」などといった種類の中から選択する操作などである。

以下、詳細に説明する。図１３に、本実施形態における携帯電話の処理のフローチャートを示す。ここで、ステップＳ１３０１〜ステップＳ１３０３までは、図１２のステップＳ１２０１〜ステップＳ１２０３と同じ処理である。

ステップＳ１３０３において撮像部１０３を起動させた後、シャッターキー等が押下されることにより撮像対象物の画像データが取得され、取得された画像データは記憶部１０４に一時的に保存される（ステップＳ１３０４）。次に、当該画像データを画像認識部１０５が読み取り（ステップＳ１３０５）、文字認識処理を行う。文字認識処理は、まず、文字行抽出処理によって、画像データのどこに文字行があるかを抽出する（ステップＳ１３０６）。そして、文字行の範囲が決定したら、その文字行の中で黒画素の集合と集合との間隔が所定値以上である場合は、それらの集合はスペースによって区切られた文字列とする。このように抽出された文字列の範囲の座標は記憶部１０４に保存される。

上記処理によって文字列の存在がＣＰＵ１０２により確認された場合は、ＣＰＵ１０２は、その文字列に含まれる文字を認識するように文字認識指示信号を画像認識部１０５に送信し、文字認識指示信号を受信した画像認識部１０５は当該文字列の文字認識処理を行う（ステップＳ１３０８）。そして、文字認識された結果を示す認識結果データは記憶部１０４に保存される。文字列の存在がＣＰＵ１０２により確認されなかった場合は、ステップＳ１３０４に戻る。

次に、ＣＰＵ１０２は記憶部１０４から認識結果データを読み取り、当該認識結果データがメールアドレスであるのか、或いは電話番号であるのかなど、何を意味する文字列であるのかを判別する（ステップＳ１３０９）。判別方法としては、例えば、文字列の中に“＠”が含まれていれば「メールアドレス」、“http:”が含まれていれば「URL」、文字列が数字と“−”だけで構成されていれば「電話番号」、アルファベットだけで構成されていれば「英単語」とする。さらに、文字列の中に“TEL:”や“FAX:”、“E-mail:”などといった単語が含まれていた場合は、これを判別に利用しても構わない。

判別処理が終了した後、ＣＰＵ１０２は、例えば、ユーザなどにより予め設定された認識対象の種類と実際に認識した文字列の種類とが一致しているか判定する（ステップＳ１３１０）。一致していた場合は、認識した文字列の周りに表示部１０７に枠等を表示させ（ステップＳ１３１１）、例えば、入力部１０１により所定の操作がなされれば認識結果を表示する（ステップＳ１３１２）。この際に、特に入力部１０１による所定操作を介さずに自動的に表示部１０７に認識結果を表示させるようにすれば、ユーザの入力手間を省略できるため使い勝手がよい。

ステップＳ１３１０において、設定された認識対象の種類と認識した文字列の種類とが一致していなかった場合は、ＣＰＵ１０２は画像中における文字行抽出処理の開始点をずらすように画像認識部１０５に指示し（ステップＳ１３１３）、再び文字行抽出処理を行う（ステップＳ１３０６）。

ここで、上行から下行へ順々に画像データの文字行抽出処理を実行していく場合には、ステップＳ１３１３では、ＣＰＵ１０２は、文字認識処理の処理開始点を所定量だけ下にずらす処理を行う。また、一行に複数のメールアドレスや電話番号が記載されている場合も想定して、空白部分があったらその前後で別の文字列として扱う。

この場合、まず空白の左側にある文字列についてステップＳ１３０８からステップＳ１３１０までの処理を行なった後、空白の右側にある文字列について同様の処理を行う。

なお、画像中に含まれる全ての文字に対して文字行抽出処理を行った後、文字認識処理以降の処理を実行していく方法も考えられる。この場合は、記憶部１０４に文字行抽出結果、例えば、抽出した文字列の左上と右下の画像上の座標などを保存しておき、それぞれの文字列に対してステップＳ１３０８からステップＳ１３１２までの処理を順番に実行していく方法も考えられる。

次に、本実施形態における携帯電話の画面表示例を図１４、図１５に示す。図１４は、認識対象の種類を選択する画面例である。図１４（１）は、カメラ起動した後の画面である。この状態で「サブメニュー」キーが押下されると、カメラ及び文字認識などに関するメニューが表示される（図１４（２））。この状態で「(2)認識対象設定」が選択されると、認識対象の種類を選択する画面が表示される（図１４（３））。この状態で、例えば、「(3)電話番号」が選択されると、認識対象の種類を「電話番号」に設定したことをユーザに知らせる画面が表示される。

図１５（１）は、上記のような操作を行い、認識対象の種類として「電話番号」を設定した場合に、名刺１５０３をモニタした際の画面表示例である。画面に表示された文字のうち枠１５０４で囲まれた電話番号“０４５−○○○−１２３４”が、画像認識部１０５によって認識され、その認識結果が認識結果表示領域１５０５に表示されている。図１５（１）中の１５０１は、認識対象の種類を「電話番号」に設定していることをユーザに知らせるためのアイコンである。ユーザはこのアイコンを見て、認識対象の種類が「電話番号」になっていることを確認できる。

図１５（２）は、認識対象の種類を「メールアドレス」に設定した場合に、名刺１５０３をモニタした際の画面表示例である。この場合は、枠１５０６で囲まれたメールアドレス“yamada@denki.○○.co.jp”が画像認識部１０５によって認識され、その認識結果が１５０７のように表示されている。また、認識対象の種類が「メールアドレス」であることをユーザに知らせるために、１５０２のようなアイコンを表示している。

以上のように、本実施形態においては、予め選択された認識対象の種類、例えば、モニタ中の画像に「メールアドレス」があれば自動的にそれを抽出し、その認識結果を表示させる。これにより、ユーザは、文字認識する際に認識対象を特定するために携帯電話の位置を調節するという手間が省け、使い勝手がよい。

また、１つの画像上に認識対象となる文字列が複数ある場合、例えば、メールアドレスが２つ表示されていた場合は、２つとも認識して認識結果を表示してもよい。この場合の表示画面例を図１５（３）に示す。

図１５（３）に示すように認識対象となったメールアドレスの近傍に、例えば、番号１５０８、番号１５０９に示されるように「(1)」「(2)」と番号を付す。そして、例えば、「１」に対応したメールアドレスの認識結果の近傍に「(1)」、「２」に対応したメールアドレスの認識結果の近傍に「(2)」とそれぞれ対応した番号を付しておけば、認識対象のメールアドレスとその認識結果との対応関係が視覚的に容易に理解できるため使い勝手がよい。
（認識結果を数字キーで選択して表示）
更にまた、メールアドレスが複数あり、全ての認識結果を表示できない場合は、番号１５０８また番号１５０９に対応した数字キーを押下することで、その番号に対応したメールアドレスの認識結果を表示させてもよい。例えば、「１」キーが押下された際に認識結果表示領域には、“yamada@denki.○○.co.jp”と表示される。また、「２」キーが押下されれば、“taro@×××.ne.jp”が表示される。このようにすることで、携帯電話のように画面が小さい場合でも複数の認識結果を簡単に表示することができ、使い勝手がよい。

更にまた、図１５（４）に示すように頭文字入力領域１５１２を設ける。ユーザが入力部１０１を押下して頭文字入力領域１５１２に英文字等が入力されると、ＣＰＵ１０２は、その文字から始まるメールアドレスを抽出する。そして、抽出されたメールアドレスに枠等を表示して、そのメールアドレスの認識結果を認識結果表示領域に表示する。図１５（４）においては、複数のメールアドレスからユーザにより入力された「ｙ」を頭文字とするメールアドレス「yama＠×××.○○○.co.jp」が認識対象として選択されている。

このように、複数の認識対象から認識結果を表示させたいメールアドレスを簡単に素早く選択するできるため使い勝手がよい。

なお、もちろん、図１５（３）と図１５（４）に示した機能は組み合わせてもよい。

更にまた、認識対象の候補が複数個ある場合に十字キー等の入力部１０１を介して選択できるようにしても構わない。このようにすれば、認識対象の種類を選択した後に上述したように認識対象が複数ある場合においても簡単に認識対象を特定できるため使い勝手がよい。更に、上記の頭文字検索の実施形態で、例えば、頭文字が「ｙ」のメールアドレスが複数ある場合に、まず、頭文字検索でおおまかに認識対象を選択し、そして、真に認識したいメールアドレスを十字キーを用いて簡単に選択することができるため、更に使い勝手は向上する。

また、上記処理により認識された認識結果を記憶部１０４に予め記憶されたアドレス帳に記憶させるようにする。これによれば、ユーザはわざわざ入力操作を介することなく名刺等に記載されたメールアドレス等の個人情報を当該アドレス帳に登録させることができるため、使い勝手が向上する。

次に、第６の実施形態について説明する。図１５（４）に示されたような機能は、認識対象の文字検索機能としても応用できる。例えば、英字新聞の中に特許関連の記事が記載されていることは分かっているが、その新聞内のどこに書かれているかが分からない場合もある。このような場合、例えば「patent」という単語を探せられれば良いのだが、
何万単語で構成されている英字新聞内の中からその単語を検索するのは目が疲れる上嫌気が差してしまう。そこで、検索したいキーワード（以下、検索対象単語）の一部又は全部をユーザが入力して、それを用いて、新聞内等のどこにそのキーワードがあるかを検索する場合を考える。

この場合、検索対象単語の一部又は全部が入力されると、その検索対象の単語を特定するための検索単語特定データがＣＰＵ１０２に入力される。そして、当該検索単語特定データを受信したＣＰＵ１０２は、撮像部１０３により取得された画像情報内の単語からその検索単語特定データに基づいて検索対象単語を検索する。撮像部１０３により取得された画像情報内に検索単語特定データを含む単語データが存在する場合は、ＣＰＵ１０２は、当該検索対象単語が検索されたことをユーザに通知するよう処理する。

通知形態としては、例えば、検索対象単語の周囲に枠で表示する形態などが考えられる。撮像部１０３により取得された画像情報内に検索単語特定データを含む単語データが存在しない場合は、ＣＰＵ１０２は、例えば、「検索単語はありません」といった表示を行うなど、その旨をユーザに通知するよう処理する。

なお、検索する際に所定時間だけ検索するようにしても構わない。これにより検索時間が長い場合に検索に区切りをつけることができ、その結果、無駄な時間を省くことができる。

図１６は、本実施形態に係る表示画面例を示した図である。例えば“parameter”という単語にだけ枠を表示する場合の表示画面例を示す。

図１６（１）は、頭文字入力領域１６０１に、頭文字“p”を入力して英文をモニタした画面の表示例である。頭文字は、ユーザが入力部１０１を数回押下することで入力できる構成とする。この画面では、“p”を頭文字とする英単語“portion”、“parameter”、“pattern”の単語の周りに枠が表示されている。

続いて、図１６（２）では、頭文字入力領域に“para”と入力した状態で英文をモニタした画面の表示例である。この画面では、“parameter”の単語の周りにだけ枠が表示され、ユーザは簡単に“parameter”の印刷された位置や数を知ることが出来る。この際に、紙面等に記載された“parameter”の数を表示するようにしても良い。

この状態で、携帯電話を右方向に移動させれば、英文の右側に印刷された“parameter”の周りに枠を表示する（図１６（３））。

このように、携帯電話を移動させる容易な操作だけで認識目的の単語（“parameter”）の位置がわかるため、文字情報が多く記載された印刷物でも簡単に文字の検索ができる。従って、わざわざ探す手間が省けるので非常に使い勝手がよい。

なお、検索された単語の意味や翻訳を表示するようにしても良い。

次に、第７の実施形態について説明する。携帯電話１００に、例えば、英単語などの外国語とそれに対応した日本語訳が記載された辞書データを備えることで、画像認識部１０５が認識した英単語などの外国語に対応した日本語訳を表示部１０７に表示することができる。すなわち、入力操作が簡単で便利な英和電子辞書機能を備えた携帯電話となる。本実施形態はこのような場合について説明する。

図１７は、本実施形態の処理フローチャートを示した図である。まず、図１３のステップＳ１３０１からステップＳ１３０５までと同様の処理を行うことにより、携帯電話の撮像部１０３が起動され、撮像部１０３が取得した画像データを画像認識部１０５が取得する。

本実施形態において、例えば、表示部１０７の中心に表示された「＋」マークに最近接している単語を抽出してその単語を認識対象単語とする（ステップＳ１７０１）。そして、ＣＰＵ１０２は、認識対象単語として特定された単語の周囲に枠表示を行い、現在認識対象として特定されている単語が何であるかをユーザに通知する（ステップＳ１７０２）。

次に、画像認識部１０５が文字認識処理を行い（ステップＳ１７０３）、当該画像データに含まれた英単語を一つ抽出して文字認識し、認識結果を記憶部１０４に保存する（ステップＳ１７０４）。

画像認識部１０５によって認識された認識結果をＣＰＵ１０２が記憶部１０４から読み取り、辞書データに含まれる単語データの中から、認識結果と一致する単語を検索する（ステップＳ１７０５）。

検索する方法としては、まず文字列が完全に一致するものを探し出し、完全に一致するものがなかった場合は一文字だけ異なるがその他の文字は一致している単語を探し出すという方法が好ましい。この方法を採用することで、画像認識部１０５が紙面上の文字を誤って認識した場合でも、その文字列に一番近い単語を探し出すことができ、何度も撮像して文字認識をやり直す手間が省くことができ、使い勝手がよい。

また、一文字だけ異なる単語もない場合は、二文字異なる単語、三文字異なる単語、というふうに異なる文字数をだんだん増やして検索してもよく、この場合は認識率が低くても該当する単語を探し出すことができる。

上記検索によって辞書データ内に一致する単語が見つかった場合は、ＣＰＵ１０２は、その単語に対応する日本語訳を辞書データから読み取って（ステップＳ１７０７）、表示部１０７に入力操作なく自動的に日本語訳を表示する（ステップＳ１７０８）。一方、辞書データ内に一致する単語が見つからなかった場合は、「該当する単語が見つかりません」などといった表示を表示部１０７に表示する（ステップＳ１７０９）。

その後、撮像部１０３が取得した画像データを表示部１０７に表示し、最後に認識対象となった単語の周りに枠を表示する。そして、再びステップＳ１３０４に戻り、撮像部１０３が画像データを取得する処理に戻る。

図１８（１）は、本実施形態の表示画面例である。ここでは、携帯電話を用いて英文をモニタした際に「length」という英単語の訳を表示させる場合について説明する。

画像認識部１０５により「length」が認識され、その認識結果と一致する単語データを辞書データから検索する。

図１８（１）は、辞書データから検索された「length」に対応する日本語訳「長さ、たけ、期間...」を読み出して表示部１０７に表示した画面の表示例である。

図１８（２）は、携帯電話を右方向にずらし、表示部１０７の中心付近に「width」という英単語が表示された場合に、その日本語訳「広さ、幅、横の距離...」を表示した画面の表示例である。

このように、上記処理を連続的に行うことにより、ユーザはボタンを押下するなどの操作が必要なく、例えば、携帯電話を横にずらすだけで認識対象となる単語の翻訳等を参照できるため、使い勝手がよい。

なお、上記例だと、認識対象となる単語が携帯電話を動かすとともに次々と変わってしまい、表示画面が煩雑になってしまうという問題が新たに生じる。そのため、通常の認識対象操作（例えば、上記「＋」カーソルを認識対象単語の上に持っていき、所定の操作ボタンを押下するなどして認識対象を特定する操作）を経てから日本語訳等を表示するようにしても構わない。

また、ここで、処理能力の関係上、認識対象単語の枠表示とその翻訳表示との間にタイムラグが生じ、ある単語からある単語へと認識対象が変わる際に、移行後の認識対象に枠が表示されるがその訳等は移行前の認識対象単語のものとなってしまうといったような問題がある。これではユーザも困惑してしまう。その問題を解決するためにはＣＰＵ１０２により枠表示と翻訳表示とを同じようなタイミングで表示させればよい。この場合、例えば、通常翻訳表示にかかる時間の方が枠表示のそれより長いため、枠表示のタイミングを翻訳表示のタイミングにあわせるようにＣＰＵ１０２に処理させる。

これにより、認識対象単語の枠表示とその翻訳表示が表示されるタイミングが一致し、ユーザは今どの単語が認識対象でその訳は何であるかが正確に参照できるため、使い勝手がよい。

次に、第８の実施形態について説明する。物語などには、一般の辞書には掲載されていない特別な固有名詞が出現したり、辞書に掲載されている単語でも、物語中において特有の使い方をすることがある。こういった単語に遭遇した読者は、その単語の意味が分からなくても辞書で調べようがないため、その物語を最初から隈なく読んでその単語の意味を理解するか、その物語に詳しい友人に聞くなどといった行為をしなければならない。

この問題を解決するために、書籍の裏表紙などに記載されたＩＳＢＮ（International Standard Book Number）を利用して、当該書籍の中で使用される単語の意味を知ることができるようなシステムを提案する。ここで、ＩＳＢＮとは国際標準図書番号のことであり、世界中で出版されている書籍の中から特定の書籍を識別するための番号である。

図１９は、本実施形態に係る構成例を示す図である。本実施形態は、携帯電話１００、サーバ１９００で構成される。

携帯電話１９００は、図１で示した構成部の他に辞書データ１９０８を備えたものとして構成される。

辞書データ１９０８は、上述したように、例えば、英単語などの外国語とそれに対応した日本語訳や専門用語等の意味が記載されてある。

サーバ１９５０は、図１９に示されるような構成部から成る。ＳＶ−ＣＰＵ１９０２は、ＳＶ記憶部１９０４に記憶されたプログラムに基づいて動作し、例えば、ＳＶ通信部１９０６からの信号に応じて各部を制御するものである。ＳＶ記憶部１９０４は、通信部から受信するデータなど、サーバ１９５０で扱うデータを記憶しておく。

ＩＳＢＮ固有辞書データ１９０５は、ＩＳＢＮが示す書籍の中でのみ使用される固有名詞や同単語でも通常の意味とは異なる意味で使用される単語などの意味が記された辞書データである。ＩＳＢＮ固有辞書データ１９０５にはそれぞれ辞書ＩＤが割り当てられ、ＩＳＢＮ固有辞書データ１９０５は、辞書ＩＤで管理される。

ＩＳＢＮ−辞書ＩＤ対応表１９０３は、ＩＳＢＮとそのＩＳＢＮが示す書籍に対応付けられたＩＳＢＮ固有辞書の辞書ＩＤなどとの関係が記された表である。

図２０は、ＩＳＢＮ−辞書ＩＤ対応表１９０３の例を示したものである。ＩＳＢＮ−辞書ＩＤ対応表１９０３は、例えば、ＩＳＢＮ２００１、書籍の題名、書籍の出版社などの書籍情報２００２と辞書ＩＤ２００３から構成され、書籍の題名や書籍の出版社等はＩＳＢＮから知ることができる。ここで、書籍情報は、書籍に関する情報であり、上記に列挙されたものに限定するものではない。

ＳＶ通信部１９０６は、サーバ１９５０がインターネットや他の情報処理装置などとアクセスするための通信処理やデータのやり取りを行う。ＳＶ入力部１９０１は、ＳＶ記憶部１９０４にＩＳＢＮ−辞書ＩＤ対応表１９０３やＩＳＢＮ固有辞書データ１９０５を保存や更新する際に使用するキーボードやマウスなどといった入力装置である。

ＳＶ表示部１９０７は、ＳＶ記憶部１９０４に保存されたデータなどを表示するための出力装置である。

次に、図２１及び図２２のフローチャートを用いて本実施形態における携帯電話の処理手順を説明する。

まず、図２１を用いて、ＩＳＢＮに対応する固有辞書を登録して利用できる状態にするまでについて説明する。特に、ここでは、ＩＳＢＮに対応する固有辞書は、サーバ１９５０に記憶されている場合について説明する。

携帯電話１９００のＣＰＵ１０２は、上述してきたような文字認識処理を行い（ステップＳ２１００）、認識結果データを記憶部１０４に保存し、認識結果を表示部１０７に表示する。

ＣＰＵ１０２は、記憶部１０４から当該認識結果データを読み取り、ＩＳＢＮであるかどうか判定し（ステップＳ２１０１）、判定結果を記憶部１０４に保存する。その方法としては、文字列が数字とハイフンから構成され、電話番号とは異なった位置にハイフンが挿入されている場合や、文字列の先頭が“ＩＳＢＮ”から始まっているなどの情報を使用する方法などがある。

ステップＳ２１０１において、認識結果がＩＳＢＮではないと判定された場合は、ＣＰＵ１０２はその認識対象の種類毎に割り当てられた表示画面を表示する（ステップＳ２１０２）。例えば、ＣＰＵ１０２は、認識対象の種類がメールアドレスであればメールに関連した表示画面を出力し、また、認識対象の種類がＵＲＬ情報であれば当該ＵＲＬに関連した表示画面を出力する。

ステップＳ２１０１において、認識結果がＩＳＢＮであると判定された場合は、ＣＰＵ１０２は認識対象がＩＳＢＮである場合の専用画面を表示する。

以下では、認識結果がＩＳＢＮであると判定された場合について説明する。

ユーザの入力操作を介して認識結果のＩＳＢＮをサーバに送信することを指示する指示信号がＣＰＵ１０２に入力される。当該指示信号を受信したＣＰＵ１０２は、記憶部１０４から認識結果を読み取り、サーバに送信する（ステップＳ２１０３）。

サーバのＳＶ通信部１９０６はＩＳＢＮデータを受信すると（ステップＳ２１０４）、一時的にＳＶ記憶部１９０４に保存する。ＳＶ−ＣＰＵ１９０２は、ＳＶ記憶部１９０４に保存されたＩＳＢＮデータを読み取り、ＩＳＢＮ−辞書ＩＤ対応表１９０３を参照する。そして、ＳＶ−ＣＰＵ１９０２は、受信したＩＳＢＮが対応表１９０３に存在するかどうかを検索する（ステップＳ２１０５）。

受信したＩＳＢＮが対応表１９０３に存在しない場合は、ＳＶ−ＣＰＵ１９０２は、受信したＩＳＢＮに対応する辞書ＩＤがサーバ内に存在しない旨を通知するためのエラーメッセージを携帯電話１９００に送信する（ステップＳ２１１０）。

一方、受信したＩＳＢＮが対応表１９０３に存在した場合、ＳＶ−ＣＰＵ１９０２は当該ＩＳＢＮに対応する辞書ＩＤ２００３を対応表１９０３から読み取る。そして、ＳＶ−ＣＰＵ１９０２は、当該辞書ＩＤ２００３を携帯電話に向けて送信するよう指示する辞書ＩＤ送信指示信号をＳＶ通信部１９０４に送信する。辞書ＩＤ送信指示信号を受信したＳＶ通信部１９０４は、ＳＶ−ＣＰＵ１９０２によって対応表１９０３から読み取られた辞書ＩＤ２００３を携帯電話に送信する（ステップＳ２１０６）。

辞書ＩＤ２００３を受信した携帯電話は、辞書ＩＤ２００３を記憶部１０４に保存する（ステップＳ２１０７）。また、認識したＩＳＢＮに対する固有辞書がサーバ上に存在したことなどを表示する（ステップＳ２１０８）。そして、受信した辞書ＩＤ２００３を記憶部１０４に登録する（ステップ２１０９）。

以上により、携帯電話のユーザは、上記辞書ＩＤ２００３を介してサーバ上にあるＩＳＢＮに対応する固有の辞書を利用することができるため、記憶容量の低減を図れるとともに使い勝手が向上する。

なお、上記実施形態では、ＩＳＢＮに対応した固有辞書そのものではなく辞書ＩＤ２００３をダウンロードするように構成したが、ＩＳＢＮに対応した固有辞書そのものをダウンロードして記憶するようにしても構わない。このように、一旦、携帯電話内に当該固有辞書を記憶すれば、当該固有辞書を参照する際のサーバ１９５０との通信時間を省略することができる。

また、上記実施形態において、当該ＩＳＢＮに対応した固有辞書の辞書ＩＤをダウンロードする際に、当該ＩＳＢＮに対応した書籍に関する情報、例えば、書籍名などもいっしょにダウンロードするようにしても構わない。

この場合、サーバ１９５０より受信した辞書ＩＤと書籍情報とを関連付けて携帯電話の記憶部１０４に記憶する。そして、例えば、辞書ＩＤを用いてＩＳＢＮ固有辞書データ参照する前、参照中もしくは参照後などに当該辞書ＩＤに対応した書籍情報を表示するように構成する。

これにより、ユーザはＩＳＢＮに対応した固有辞書を参照する前後、もしくは参照中に当該固有辞書がどのような書籍に関係した辞書なのかを確認することができる。従って、例えば、ユーザの所望する固有辞書とは異なる固有辞書を利用していた場合などにも容易に気づくことができるため、使い勝手がよい。この際、ユーザの所望する固有辞書に選択しなおすように構成すれば、更に使い勝手は向上する。

次に、上記のように登録された固有辞書を利用して単語の意味等を参照する具体例を図２２のフローチャートを用いて説明する。ここでは、携帯電話内には予め一般的な用語の意味等が記載された辞書データ１９０８が記憶されてあり、辞書データ１９０８内に含まれないような特殊な単語に関してＩＳＢＮに対応した固有辞書を検索する場合について説明する。

まず、上述したように、ＣＰＵ１０２は、認識対象単語に対して文字認識処理を行い、認識結果データを記憶部１０４に保存して表示部１０７に表示する（ステップＳ２２０１）。そして、ＣＰＵ１０２は、記憶部１０４から当該認識結果データを読み取り、辞書データ１０８に含まれる英単語から一致する単語を検索する（ステップＳ２２０２）。

検索の結果、該当する単語が見つかった場合は、その単語に対応する意味データや翻訳データ（以下、意味/翻訳データ）を辞書データ１０８から読み取り、表示部に表示する（ステップＳ２２１１）。

検索の結果、該当する単語が見つからなかった場合は、ＣＰＵ１０２は、記憶部１０４に保存された認識結果データ及び辞書ＩＤ２００３を読み取る。そして、当該認識結果データ及び辞書ＩＤ２００３をサーバに送信指示する送信指示信号を受信したＣＰＵ１０２は、認識結果データ及び辞書ＩＤ２００３を通信部１０６を介してサーバ１９５０に送信する（ステップＳ２２０４）。

当該認識結果データ及び辞書ＩＤ２００３をサーバ１９５０が受信する（ステップＳ２２０５）と、ＳＶ−ＣＰＵ１９０２は、辞書ＩＤ２００３に対応づけられたＩＳＢＮ固有辞書データ１９０５にアクセス処理を行う（ステップＳ２２０６）。そして、ＳＶ−ＣＰＵ１９０２は、当該受信した認識結果データと一致する単語をＩＳＢＮ固有辞書データ１９０５から検索する（ステップＳ２２０７）。
この際、ＳＶ−ＣＰＵ１９０２は、当該受信した認識結果データと一致する単語が当該ＩＳＢＮ固有辞書データ１９０５に存在するか否かを判定する（ステップＳ２２０８）。当該受信した認識結果データと一致する単語が当該ＩＳＢＮ固有辞書データ１９０５に存在しない場合は、エラーメッセージを携帯電話に送信する（ステップＳ２２１２）。

一方、ステップＳ２２０８において、該当する単語が見つかった場合は、ＳＶ−ＣＰＵ１９０２は、ＳＶ記憶部１９０４に保存された意味/翻訳データを読み取る。そして、その意味/翻訳データを送信するよう指示する指示信号を受信したＳＶ−ＣＰＵ１９０２は、ＳＶ通信部１９０６を介して意味/翻訳データを携帯電話１９００に送信する（ステップＳ２２０９）。そして、通信部１０６を介してこの意味/翻訳データを受信した携帯電話１９００のＣＰＵ１０２は（ステップＳ２２１０）、意味/翻訳データを表示部１０７に表示する（ステップＳ２２１１）。

図２３は、本実施形態における携帯電話の画面の表示例である。図２３（１）では、書籍に記載されたＩＳＢＮを撮像部１０３が撮像し、その画像に含まれたＩＳＢＮ情報を画像認識部１０５が認識して、表示部１０７が認識結果を表示した画面例である。例えば、図１４（３）のように、認識対象の種類を「(4)ＩＳＢＮ」とすることにより画面に含まれる複数の文字列のうちＩＳＢＮを形成する文字列を認識する方法などを用いることができる。

図２３（１）の状態で、表示画面右下に表示された「サブメニュー」に対応する操作キーが押下されると、文字認識に関するサブメニューが表示される（図２３（２））。

次に、「(3)書籍情報取得」が選択されると、認識結果のＩＳＢＮと当該ＩＳＢＮに対応した辞書もしくは当該辞書ＩＤを要求する要求信号をサーバに送信する。そして、例えば、図２３（３）に示すようにサーバとの接続経過等を表示する。

次に、図２３（４）は、認識結果のＩＳＢＮに対応する固有辞書の辞書ＩＤ及び当該ＩＳＢＮに対応した書籍情報をサーバより受信した場合の表示画面例である。ここでは、書籍情報として「(1)題名」、「(2)出版社」、「(3)著者」を表示し、あわせて「(4)固有辞書の有無」も表示している。

これにより、ユーザは認識結果のＩＳＢＮに対応する書籍情報及び認識結果のＩＳＢＮに対応する固有辞書がサーバにあるかないかを簡単に確認することができる。

また、この状態で「(4)固有辞書」が選択されると、サーバから受信した辞書ＩＤを補助辞書として記憶部１０４に登録するか否かを、ユーザに選択させる画面に遷移する（図２３（５））。ここで、補助辞書とは、主として利用される辞書データ１９０８に対して補助的に利用される辞書という意味である。

この状態で、「１．はい」を選択すると、上記辞書ＩＤを補助辞書として登録する。ここで、登録処理は、例えば、サーバから受信した辞書ＩＤの値を、記憶部１０４にある補助辞書を表す変数に代入する処理等が考えられる。その後、上記固有辞書を補助辞書に登録したことをユーザに伝えるメッセージを表示する（図２３（６））。

なお、上記では、図２３（４）で「(4)固有辞書」が選択されると、認識結果のＩＳＢＮに対応する固有辞書の辞書ＩＤを登録する場合を説明したが、前述したように、認識結果のＩＳＢＮに対応する固有辞書そのものを受信し、記憶部１０４に記憶するように構成しても構わない。

また、上記実施形態では、サーバから補助辞書として利用される辞書ＩＤもしくは辞書そのものをダウンロードする場合について説明したが、これに限定するものではない。例えば、メモリカード等の記録媒体を介して当該辞書ＩＤや辞書そのものを受信するように構成しても構わない。

これらにより、サーバに接続するために費やされる通信費及び通信時間を省略できる。

次に、ＩＳＢＮ対応固有辞書を利用して単語の意味を表示している表示画面例を図２４に示す。

図２４（１）は、認識結果を表示した表示画面例である。ここでは、認識対象の単語である「Zakky」が認識されたことを示している。更に、この単語「Zakky」の意味を参照するために辞書データ１０８（以下、メイン辞書）を利用するか、あるいはＩＳＢＮ対応辞書データ（以下、補助辞書）を利用するかを選択できるようにしている（２４０１、２４０２）。

これにより、例えば、メイン辞書に登録されていないことが明確である単語である場合には、最初から補助辞書を選択できる。一方、メイン辞書に登録されている可能性が高いような単語の場合は、補助辞書を選択せずにまずはメイン辞書を用いて当該単語の意味等があるか否かを検索させる。このように構成することで、ユーザは、メイン辞書又は補助辞書をその都度使い分けることができるため、使い勝手がよい。

図２４（２）は、例えば、メイン辞書を利用して意味等を参照しようとしたが、メイン辞書に認識対象単語（ここでは、「Zakky」）がない場合を示した図である。ここでは、ＣＰＵ１０２は、認識結果表示領域を上方にずらし、該当単語がメイン辞書にない旨を表示するポップアップ画面を表示する領域を確保する処理を行う。これにより、表示画面の有効利用が図れる。

図２４（３）は、メイン辞書に認識対象単語が登録されていない場合に代わりに補助辞書利用（２４０２）を選択した場合の表示画面例である。ここでは、補助辞書に「Zakky」が登録されており、ＣＰＵ１０２は単語「Zakky」の意味を表示するように処理する。

図２４（４）は、メイン辞書及び補助辞書に認識対象単語「Zakky」が登録されていない場合の表示画面例である。ここでは、その旨を表示する。

図２４（５）は、メイン辞書及び補助辞書に認識対象単語「Zakky」が登録されていない場合に上記辞書とは異なる辞書を選択する場合の表示画面例である。図２４（４）の表示画面の状態から「辞書２４０３」が選択されると、図２４（５）の表示画面に遷移する。ここでは、予め記憶部１０４に複数の辞書ＩＤもしくは辞書そのもののデータが記憶されている。そして、それらからメイン辞書及び補助辞書を設定できるようにしている。

これにより、例えば、認識対象単語を記載した辞書とは異なる辞書を利用していた場合などにも辞書を選択し直すことができ、正しい意味を知る可能性が高まる。

なお、上記例では、メイン辞書及び補助辞書を設定できるようにしたが、これに限定するものではなく、どちらか一方の辞書設定のみを行えるようにしても構わない。例えば、メイン辞書は固定の辞書で補助辞書のみを設定変更可能にしても構わない。これにより、いたずらに辞書変更を行うことが許容されないため、例えば、頻繁な辞書変更のためにどの辞書がメイン辞書だったかといった不要な混乱を防止することができる。

図２４（６）は、現在設定されている補助辞書が何であるかをユーザに通知する場合の表示画面例である。ここでは、補助辞書を選択するためのアイコンの上に現在設定されている補助辞書（ここでは、Ｈｅｌｌｏ！Ｚａｋｋｙ：２４０４）を表示する。

これにより、ユーザは、視覚的に簡単に現在設定されている補助辞書等を確認することができ、使い勝手がよい。

なお、通知形態は、上記したものに限定するものではない。例えば、補助辞書を示す番号やアイコン等で表示するようにしても良い。これにより、表示画面の比較的小さい携帯電話などにおいては、表示領域を有効に利用できる。

また、上記では、補助辞書の設定について説明したが、現在設定されているメイン辞書が何であるかをユーザに通知するようにしてもいいのは言うまでもない。

なお、上述してきた種々の機能をソフトウェアで実現してもよく、ユーザは、例えば、ＣＤ―ＲＯＭ等の記録媒体やサーバから当該ソフトウェアを受信して当該種々の機能を実現できる。これにより、必要な機能だけを搭載したり、また、好みに応じて色々な機能を追加もしくは削除、あるいは更新することが容易となる。

更に、上述してきた実施形態を組み合わせて新しく実施形態を構成することができることは言うまでもない。

また、本発明は、上記に示された実施形態に限定されるものではなく、ここに開示された原理及び新しい特性は広範囲の技術的範囲を含むものである。

第１の実施例に係る携帯電話の構成ブロック図である。第１の実施例に係る携帯電話の外観図である。第１の実施例に係る携帯電話において背面にサブ表示部を備えた場合の外観図である。第１の実施例に係る携帯電話においてメイン表示部にＯＣＲ専用画面を設けた場合の外観図である。第１の実施例に係る水平回転可能携帯電話の外観図である。第１の実施例に係る携帯電話においてサブ表示部と撮像部を可動にした場合の外観図である。第２の実施例に係る携帯電話で文字認識する場合の撮像部、表示部、名刺等の紙面との位置関係を示した図である。第２の実施例に係る携帯電話の画面表示例である。第３の実施例に係る携帯電話の撮像部の傾きを変えるための構成を示した図である。第３の実施例に係る携帯電話の外観図である。第４の実施例に係る携帯電話の外観図である。第４の実施例に係る携帯電話の処理を示すフローチャートである。第５の実施例に係る携帯電話の処理を示すフローチャートである。第５の実施例に係る携帯電話において認識対象の種類を選択する画面表示例である。第５の実施例に係る携帯電話において認識対象の種類を電話番号に設定した場合に、名刺をモニタした際の画面表示例である。第６の実施例に係る携帯電話の画面表示例である。第７の実施例に係る携帯電話の処理を示すフローチャートである。第７の実施例に係る携帯電話の画面表示例である。第８の実施例に係る構成例を示す図である。ＩＳＢＮ−辞書ＩＤ対応表の内容例を示した図である。第８の実施例に係る携帯電話において、ＩＳＢＮ固有辞書の辞書ＩＤを登録する処理を示すフローチャートである。第８の実施例に係る携帯電話において、ＩＳＢＮ固有辞書を利用して認識した単語の意味/翻訳データを表示する処理を示すフローチャートである。第８の実施例に係る携帯電話において、ＩＳＢＮ固有辞書の辞書ＩＤを登録する場合の画面表示例である。第８の実施例に係る携帯電話において、ＩＳＢＮ固有辞書を利用して認識した単語の意味/翻訳データを表示した画面表示例である。

符号の説明

１００携帯電話
１０１入力部
１０２ＣＰＵ
１０３撮像部
１０４記憶部
１０５画像認識部
１０６通信部
１０７表示部
１１０筐体
１２０筐体
１３０ヒンジ部
３０１サブ表示部
３０２サブ表示部
３０３サブ表示部
４０１サブ表示部
４０２ＯＣＲ専用画面
４０３サブ表示部
５０１水平回転可能携帯電話における撮像部
５０２水平回転可能携帯電話における撮像部
５０３入力部
５０４表示部
５１０メインディスプレイを有する筐体
５２０メイン操作部を有する筐体
５３０連結部
６０１サブ表示部
６０２移動溝
７０１名刺や雑誌等の紙面
７０２角度
７０３距離
７０４距離
９０１角度調整部
９０２回転駆動部
９０３撮像レンズ
９０４撮像回路部
９０５アクチュエータ
１００１角度上げボタン
１００２角度下げボタン
１００３角度調整ボタン
１１０１距離センサ
１１０２投光部
１１０３受光部
１１０４距離センサ
１１０５投光部
１１０６受光部
１９００携帯電話
１９０１ＳＶ入力部
１９０２ＳＶ−ＣＰＵ
１９０３ＩＳＢＮ−辞書ＩＤ対応表
１９０４ＳＶ記憶部
１９０５ＩＳＢＮ固有辞書データ
１９０６ＳＶ通信部
１９０７ＳＶ表示部
１９０８辞書データ
１９５０サーバ
２００１ＩＳＢＮ
２００２書籍情報
２００３辞書ＩＤ

Claims

情報を表示可能な表示部を備えた携帯電話であって、
画像情報を撮像する撮像部と、
前記撮像部により出力された画像情報に含まれる識別情報を認識する認識部と、
前記認識部により識別情報を認識する認識モードを選択するモード選択部と、
前記撮像部により撮影される物体との間の距離を測定する測定部と、
前記モード選択部により認識モードが選択された場合に、前記測定部により測定された距離を用いて前記撮像部の傾きを変更し、前記測定部により測定された距離を用いて前記表示部に前記画像情報が表示される位置又は角度を一部又は全部を変換するように制御する制御部とを備えることを特徴とする携帯電話。
請求項１記載の携帯電話において、
前記制御部は、台形補正を用いて変換することを特徴とする携帯電話。