以下、この発明につき図面を参照しつつ詳細に説明する。なお、この発明を実施するための形態(以下実施形態という)により本発明が限定されるものではない。また、下記実施形態における構成要素には、当業者が容易に想定できるものあるいは実質的に同一のもの、いわゆる均等の範囲内のものが含まれる。以下においては、携帯電話機を携帯電子機器の一例として取り上げるが、本発明の適用対象は携帯電話機に限定されるものではなく、画像を撮影する撮像手段及び音声を出力する出力手段を有していれば、例えば、PHS(Personal Handy phone System)、PDA(Personal Data Assistant)、ポータブルナビゲーション装置、ノートパソコン、ゲーム機等に対しても本発明は適用できる。
図1は、本実施形態に係る携帯電子機器の正面図である。図2は、本実施形態に係る携帯電子機器の側面図である。図3は、本実施形態に係る携帯電子機器の背面図である。本実施形態は、画像を撮影する撮像手段と、音声を出力する出力手段とを有する携帯電子機器において、撮像手段が撮像した、撮像手段の入光部と対向する位置の被写体の画像(被写体の撮像状態)に基づき、出力手段が出力する音声出力(音量、速度、周波数等)を調整する点に特徴がある。以下においては、撮像手段の入光部と対向する位置の被写体の画像として、撮像手段の入光部を覆う被写体の画像を用いる例を説明する。被写体は、撮像手段の入光部に接した状態で前記入光部を覆ってもよく、前記入光部に対向する(すなわち、互いに向き合う)とともに、前記入光部から離れた位置で撮像手段に撮像されるものであってもよい。本実施形態では、撮像手段が撮像した被写体の画像を用いて音声出力を調整するので、撮像手段の入光部と被写体との距離は、本実施形態に係る音声出力の調整を実現できる範囲となる。
本実施形態において、図1〜図3に示す携帯電子機器1は、無線通信機能と、出力手段と、音声取得手段と、撮像手段とを有する携帯電話機である。携帯電子機器1は、筐体1Cが複数の筐体で構成される。具体的には、筐体1Cは、第1筐体1CAと第2筐体1CBとで開閉可能に構成される。すなわち、携帯電子機器1は、折り畳み式の筐体を有する。なお、携帯電子機器1の筐体は、このような構造に限定されるものではない。例えば、携帯電子機器1の筐体は、両方の筐体を重ね合わせた状態から一方の筐体と他方の筐体とを互いにスライドできるようにしたスライド式の筐体であってもよいし、重ね合わせ方向に沿う軸線を中心に、一方の筐体を回転させるようにした回転式や、2軸ヒンジを介して両方の筐体を連結したものでもよい。
第1筐体1CAと第2筐体1CBとは、連結部であるヒンジ機構8で連結されている。ヒンジ機構8は、第1筐体1CA側の第1ヒンジ部8Aと第2筐体1CB側の第2ヒンジ部8Bとで構成される。ヒンジ機構8で第1筐体1CAと第2筐体1CBとを連結することにより、第1筐体1CA及び第2筐体1CBは、ヒンジ機構8を中心としてともに回動して、互いに遠ざかる方向及び互いに接近する方向(図2の矢印Rで示す方向)に回動できるように構成される。第1筐体1CAと第2筐体1CBとが互いに遠ざかる方向に回動すると携帯電子機器1が開き、第1筐体1CAと第2筐体1CBとが互いに接近する方向に回動すると携帯電子機器1が閉じて、折り畳まれた状態となる(図2の点線で示す状態)。
第1筐体1CAには、表示部として、図1に示すディスプレイ2が設けられる。ディスプレイ2は、携帯電子機器1が受信を待機している状態のときに待ち受け画像を表示したり、携帯電子機器1の操作を補助するために用いられるメニュー画像を表示したりする。また、第1筐体1CAには、携帯電子機器1の通話時に音声を出力する出力手段であるレシーバ6が設けられる。
第2筐体1CBには、通話相手の電話番号や、メール作成時等に文字を入力するための操作キー3Aが複数設けられ、また、ディスプレイ2に表示されるメニューの選択及び決定や画面のスクロール等を容易に実行するための方向及び決定キー3Bが設けられる。操作キー3A及び方向及び決定キー3Bは、携帯電子機器1の操作部3を構成する。また、第2筐体1CBには、携帯電子機器1の通話時に音声を受け取る音声取得手段であるマイク5が設けられる。操作部3は、図2に示す、第2筐体1CBの操作面1PCに設けられる。操作面1PCとは反対側の面が、携帯電子機器1の背面1PBである。
第2筐体1CBの内部には、アンテナ7が設けられている。アンテナ7は、無線通信に用いる送受信アンテナであり、携帯電子機器1と基地局との間で通話や電子メール等に係る電波(電磁波)の送受信に用いられる。アンテナ7は、第2筐体1CBの第2ヒンジ部8Bとは反対側に配置される。また、第2筐体1CBには、マイク5が設けられる。マイク5は、図2に示す、携帯電子機器1の操作面1PC側に配置される。
図2、図3に示すように、携帯電子機器1の背面1PBには、撮像手段であるカメラ4Cが設けられる。すなわち、カメラ4Cは、マイク5とは反対側に設けられる。カメラ4Cは、入光部(画像を撮像素子に取り入れる部分)が第2筐体1CBの外部に露出している。後述するように、本実施形態では、レシーバ6が出力する音声の音量や速度等を調整する場合、携帯電子機器1の使用者の指等でカメラ4Cの入光部が覆われるが、カメラ4Cを、マイク5が設けられる操作面1PCとは反対側に設けることにより、使用者の指でカメラ4Cを覆いやすくなる。これによって、音量や音声の速度を調整する際の利便性が向上する。
本実施形態において、カメラ4Cには、例えば、CCD(Charge Coupled Device Image Sensor)のような撮像素子が用いられる。カメラ4Cは、撮像素子の制御回路とともにカメラモジュール4に組み込まれる。ここで、カメラ4Cの入光部は、カメラ4Cの最も被写体側に設けられて、撮像素子が撮像する画像が最初に入射する部分である。本実施形態において、第2筐体1CBの背面1PBには、カメラ4Cの周囲の明るさを検出する明るさ検出手段として、明度センサ9が設けられる。明度センサ9は、例えば、フォトダイオードが用いられる。
図4は、本実施形態に係る携帯電子機器の機能を説明するためのブロック図である。携帯電子機器1の動作は、制御装置10により制御される。制御装置10は制御手段であり、主処理部11と、記憶部12と、画像処理部13と、音声処理部14と、通信処理部15とを有する。主処理部11は、記憶部12、画像処理部13、音声処理部14、通信処理部15、ディスプレイ2、操作部3、明度センサ9が接続される。そして、主処理部11は、携帯電子機器1の全体的な動作を統括的に制御する。すなわち、主処理部11は、携帯電子機器1の各種の処理が、操作部3の操作や携帯電子機器1の記憶部12に保存されるソフトウェアに応じて適切な手順で実行されるように、通信処理部15や音声処理部14、あるいは画像処理部13等の動作を制御する。
携帯電子機器1の各種の処理としては、例えば、回線交換網を介して行われる音声通話、電子メールの作成及び送受信等がある。また、通信処理部15や音声処理部14等の動作としては、例えば、通信処理部15における信号の送受信、音声処理部14における音声の制御や入出力、カメラ4Cが撮像した画像の画像処理部13による処理等がある。
主処理部11は、記憶部12に保存されているプログラム(例えば、オペレーティングシステムプログラム、アプリケーションプログラム等)に基づいて処理を実行する。主処理部11は、例えば、マイクロプロセッサユニット(MPU:Micro Processor Unit)で構成され、前記ソフトウェアで指示された手順に従って上述した携帯電子機器1の各種の処理を実行する。すなわち、主処理部11は、記憶部12に保存されるオペレーティングシステムプログラムやアプリケーションプログラム等から命令コードを順次読み込んで処理を実行する。
また、主処理部11は、音声処理部14に出力する音声データのレベル(音量)や速度等を調整する。これによって、音声処理部14に接続されるレシーバ6から出力される音声の音量や速度等が変更される。また、主処理部11は、マイク5が取得し、音声処理部14から入力される音声データを通信処理部15に出力しない処理も可能である。これによって、携帯電子機器1からの送話をミュートすることができる。
記憶部12は、主処理部11での処理に利用されるソフトウェアやデータを保存する。例えば、記憶部12は、ダウンロードされた画像データや音声データ、あるいは主処理部11が記憶部12に対する制御に用いるソフトウェア、通信相手の電話番号やメールアドレス等を保存し管理するアドレス帳、発信音や着信音等の音声ファイル、ソフトウェアの処理過程で用いられる一時的なデータ等を保存する。記憶部12は、例えば、不揮発性の記憶デバイス(ROM:Read Only Memory等の不揮発性半導体メモリ、ハードディスク装置等)や、読み書き可能な記憶デバイス(例えば、SRAM:Static Random Access Memory、DRAM:Dynamic Random Access Memory)等で構成される。
本実施形態において、画像処理部13、音声処理部14、通信処理部15は、それぞれの機能を実現するための専用のIC(Integral Circuit:集積回路)で構成される。画像処理部13は、画像処理手段である。画像処理部13は、カメラモジュール4が接続されており、これに組み込まれるカメラ4Cが撮像し、カメラモジュール4から送られる被写体の画像信号を取得する。そして、画像処理部13は、取得した画像信号に対して各種の処理を施して画像情報を生成し、主処理部11へ出力する。各種の処理としては、例えば、AD変換(Analog Digital変換)処理や、さらに符号化等の処理がある。
音声処理部14は、音声制御手段であり、マイク(MIC)5、レシーバ(RCV)6、スピーカ17が接続される。音声処理部14は、レシーバ6から出力される音声やマイク5に入力される音声の信号処理を実行する。すなわち、音声処理部14は、マイク5から入力される音声を増幅し、AD変換(Analog Digital変換)を実行した後さらに符号化等の信号処理を施して、ディジタルの音声データに変換して主処理部11へ出力する。また、音声処理部14は、主処理部11から送られる音声データに対して復号化、DA変換(Digital Analog変換)、増幅等の処理を施してアナログの音声信号に変換してから、レシーバ6へ出力する。さらに、音声処理部14は、着信音や電子メールの送信音等をスピーカ17から出力させる。
通信手段である通信処理部15は、アンテナ7が接続されており、基地局のいずれかによって割り当てられるチャンネルを介して、前記基地局との間で無線通信を行う。この無線通信において、通信処理部15は、前記基地局を介して取得した通信対象の携帯電子機器の音声データを主処理部11へ出力する。また、前記無線通信において、通信処理部15は、携帯電子機器1のマイク5が取得し、音声処理部14によって信号処理された音声データを、前記基地局を介して通信対象の携帯電子機器へ出力する。
携帯電子機器1が他の携帯電子機器と通信(基地局を介した無線通信)している場合、通信相手からの音声はレシーバ6から出力されるが、その音量や速度を調整したい場合がある。また、携帯電子機器1からの送話をミュートする、すなわち、携帯電子機器1のマイク5が取得した音声を通信相手には送信しないことが必要になる場合もある。なお、送話のミュート時には、通信相手からの音声はレシーバ6から出力される。このような場合、携帯電子機器1は、カメラ4Cを利用して、音量や音声の速度を調整する際の利便性を向上させる。次に、この手法を説明する。
図5は、本実施形態に係る音声調整方法の手順を示すフローチャートである。本実施形態に係る音声調整方法は、携帯電子機器1によって実行され、より具体的には携帯電子機器1の制御装置10が実行する。本実施形態に係る音声調整方法は、携帯電子機器1の通話中に実行される。ステップS101において、図4に示す制御装置10の主処理部11は、携帯電子機器1が通話中であるか否かを判定する。ステップS101でNoと判定された場合、すなわち、主処理部11が携帯電子機器1は通話中でないと判定した場合、STARTに戻り、主処理部11は、携帯電子機器1の状態の監視を継続する。
ステップS101でYesと判定された場合、ステップS102へ進む。ステップS102において、主処理部11は、カメラ4Cによる音声調整機能が有効であるか否かを判定する。カメラ4Cによる音声調整機能(以下、カメラ音声調整機能という)とは、携帯電子機器1の通話中にカメラ4Cを使用者の指等で覆い、カメラ4Cが覆われる程度(面積)を変更することで、レシーバ6からの音声の音量を調整したり、レシーバ6からの音声の速度を調整したりする機能である。カメラ音声調整機能は、携帯電子機器1の使用者によって使用するか否か、何を調整するのか等を設定できる。
図6は、メニュー画面の一例を示す図である。例えば、カメラ音声調整機能は、ディスプレイ2に表示されるメニュー画面によって設定できる。携帯電子機器1の使用者は、操作キー3Aや方向及び決定キー3Bを用いて図6に示すメニュー画面を読み出し、カメラ音量調整機能を設定する。この例では、カメラ4Cを利用して、レシーバ6から出力される音声の音量及び速度を調整できるように設定できる。例えば、図6のメニュー画面の音量をONにすると、カメラ4Cの入光部を覆う面積を変更することによりレシーバ6から出力される音声の音量を調整できる。また、図6のメニュー画面の速度をONにすると、カメラ4Cの入光部を覆う面積を変更することによりレシーバ6から出力される音声の速度を調整できる。それぞれの項目をOFFにすると、音声の音量及び速度はカメラ4Cによっては変更できず、通常の音声調整機能で音声の音量や速度が調整されることになる。ここで、通常の音声調整機能とは、操作キー3Aや方向及び決定キー3Bを操作することによりレシーバ6から出力される音声を調整する機能である。
ステップS102でNoと判定された場合、すなわち、主処理部11が、カメラ音声調整機能は有効でないと判定した場合、ステップS103へ進み、上述した通常の音声調整により、レシーバ6から出力される音声の音量や速度が調整される。ステップS102でYesと判定された場合、すなわち、主処理部11が、カメラ音声調整機能は有効であると判定した場合、ステップS104へ進む。ステップS104で、主処理部11は、携帯電子機器1のカメラ4Cが起動中であるか否かを判定する。
ステップS104でNoと判定された場合、すなわち、主処理部11は、携帯電子機器1のカメラ4Cが起動していないと判定した場合、ステップS105に進み、主処理部11は、携帯電子機器1のカメラ4Cを起動する。カメラ音声調整機能は、携帯電子機器1の通話中にカメラ4Cを用いるため、カメラ4Cが起動していないとカメラ音声調整機能は実行できないからである。ステップS105でカメラを起動した後、あるいはステップS104でYesと判定された場合(主処理部11が携帯電子機器1のカメラ4Cは起動中であると判定した場合)、ステップS106へ進む。
ステップS106において、主処理部11は、携帯電子機器1の使用環境、より具体的にはカメラ4Cの使用環境の明るさが所定値以上であるか否かを判定する。本実施形態では、カメラ4Cを使用者の指等で覆い、カメラ4Cが覆われる程度(面積)に応じてレシーバ6の音声出力を調整する。このため、カメラ4Cは、被写体である使用者の指等を認識できることが必要である。したがって、本実施形態に係る音声調整方法では、カメラ4Cの使用環境はカメラ4Cが被写体を認識できる程度の明るさが必要となる。このため、ステップS106で、カメラ4Cの使用環境の明るさが所定値以上であるか否かが判定される。
本実施形態では、カメラ4Cの使用環境の明るさを、図3、図4に示す明度センサ9で検出する。ステップS106での明るさの所定値、すなわち、ステップS106の判断における明るさの閾値は、カメラ4Cの仕様等から予め定めておき、記憶部12へ格納しておく。ステップS106において主処理部11は、明度センサ9からカメラ4Cの使用環境における実際の明るさと記憶部12へ格納された明るさの閾値とを取得し、両者を比較する。その結果、カメラ4Cの使用環境における実際の明るさが明るさの閾値よりも小さい場合(ステップS106:No)、カメラ4Cの使用環境の明るさではカメラ4Cが被写体を認識できないと判断できる。この場合、ステップS103へ進み、上述した通常の音声調整により、レシーバ6から出力される音声の音量や速度が調整される。
ここで、ステップS106の判断において、主処理部11は、制御装置10に内蔵された時計を用いて、現在の時刻から、カメラ4Cの使用環境は、カメラ4Cが被写体を認識できる程度の明るさであるか否かを判定してもよい。このようにすれば、明度センサ9は不要なので、携帯電子機器1の装置構成を簡単にできるとともに、製造コストを低減できる。しかし、季節によっては同じ時刻であってもカメラ4Cの使用環境の明るさは異なることや、照明の有無によってもカメラ4Cの使用環境の明るさは異なる。したがって、時刻による判定は明度センサ9による判定の精度を高めるための補助として用いることが好ましい。
カメラ4Cの使用環境における実際の明るさが明るさの閾値以上である場合(ステップS106:Yes)、カメラ4Cの使用環境の明るさは、カメラ4Cが被写体を認識できる程度である判断できる。この場合、ステップS107へ進む。ステップS107で、主処理部11は、カメラ4Cからの画像情報を取得する。カメラ4Cからの画像情報は、カメラ4Cが撮像した画像信号に画像処理部13が所定の画像処理を施すことにより生成される。主処理部11は、画像処理部13を介して、カメラ4Cからの画像情報を取得する。次にステップS108へ進み、主処理部11は、カメラ4Cが撮像し、画像処理部13で画像処理された画像情報から、単色画像(画素)を連続して検出したか否かを判定する。
図7は、カメラによって撮像された画像の画像情報を構成する画素と、それぞれの画素の色情報との関係を示す図である。図8は、カメラによって撮像され、画像処理された画像情報を示す模式図である。図8は、カメラ4Cによって撮像され、画像処理部13で画像処理されることにより生成された画像情報20であり、複数の画素P0、P1、P2・・・Pnから構成される(nは画素の識別番号)。画像情報20は、XY座標上に表され、Y軸は携帯電子機器1の長手方向(レシーバ6からマイク5に向かう方向)と平行な軸であり、X軸はY軸と直交する軸である。
例えば、携帯電子機器1の使用者がレシーバ6の音量を調整するためにカメラ4Cを指で覆った場合、カメラ4Cは、その指を被写体として撮像する。すると、撮像された被写体の部分は、例えば、図8に示す画像情報20に単色となって現れる。したがって、主処理部11が、カメラ4Cによって撮像され、画像処理部13で画像処理された画像情報20から連続する単色画像を検出した場合には、携帯電子機器1の使用者の指でカメラ4Cの一部又は全部が覆われていると判断できる。図7に示す例では、画素P1〜Pn−1までの色情報は連続していないが、画素Pn以降の色情報はすべて00(16進)で連続している。このような画素を有する画像情報は、連続する単色画像が検出されることになる。
なお、指の色は必ずしも単色で検出されるとは限らないので、予め携帯電子機器1の使用者の指をカメラ4Cで撮像し、その色をカメラ音声調整機能に用いる判定色として設定し、記憶部12へ格納してもよい。この場合、ステップS108では、単色画像の代わりに設定した判定色を用いる。このようにすれば、カメラ音声調整機能を実行するためにカメラ4Cの入光部を覆う被写体を精度よく、より確実に検出できる。
ステップS108で連続する単色画像が検出されない場合(ステップS108:No)、STARTに戻り、主処理部11は、携帯電子機器1の状態の監視を継続する。ステップS108で連続する単色画像が検出されたら(ステップS108:Yes)、ステップS109へ進む。ステップS109において、主処理部11は、携帯電子機器1の使用者の指等でカメラ4Cが覆われた時間(カメラ4Cが使用者の指等を撮像した時間)が、予め定めた所定の時間Tw継続したか否かを判定する。これは、連続する単色画像が検出された状態が所定の待機時間Tw継続したか否かで判定される。
ステップS109でNoと判定された場合、すなわち、主処理部11が、連続する単色画像の検出された状態が所定の待機時間Tw継続しなかったと判定した場合、STARTに戻り、主処理部11は、携帯電子機器1の状態の監視を継続する。ステップS109でYesと判定された場合、すなわち、主処理部11が、連続する単色画像が検出された状態が所定の待機時間Tw継続したと判定した場合、ステップS110に進む。このように、カメラ4Cが覆われた時間が、予め定めた所定の時間Tw継続してから、本実施形態に係る音声調整方法の次のステップへ移行することにより、カメラ音声調整機能を利用して音声を調整しようとする携帯電子機器1の使用者の意思を確認できる。これによって、前記使用者の意思を反映させた制御が可能になる。ステップS109でYesと判定されたらステップS110へ進み、主処理部11は、基準値を設定する。
図9、図10は、画像情報とこの画像情報に含まれる単色画像の面積率と音量との関係を示す模式図である。図9、図10のX、Yは、図8のX軸、Y軸に対応する(以下同様)。また、面積率ρは、画像情報中に存在する連続する単色画像の割合であり、より具体的には、画像情報の全画素数に占める連続する単色画像の画素数の割合である。本実施形態では、カメラ音声調整機能を実行するためにカメラ4Cが指等の被写体で覆われたときにカメラ4Cが撮像した画像の画像情報のときの音声出力(例えば音量)を、調整する対象の基準値とする。そして、例えば、指等の被写体によってカメラ4Cの覆われる程度(面積)が変化した場合には、カメラ4Cによって得られた画像情報における単色画像の面積率が変化するので、これに応じて前記基準値から音声出力を変更する。
図9に示す例では、主処理部11は、携帯電子機器1の使用者の指がカメラ4Cを完全に覆ったとき、すなわち、カメラ4Cが撮像した画像の画像情報に含まれる連続する単色画像の面積率が100%であるときの音量を基準値Vdとして設定し、記憶部12へ格納する。また、図10に示す例では、主処理部11は、携帯電子機器1の使用者の指がカメラ4Cを7割程度覆ったとき、すなわち、カメラ4Cが撮像した画像の画像情報に含まれる連続する単色画像の面積率が70%程度であるときの音量を基準値Vdとして設定し、記憶部12へ格納する。
図9に示す例では、連続する単色画像の面積率ρに応じて音量を設定する。例えば、面積率ρが100%のときは基準値Vdであり、面積率ρが75%のときの音量は0.75×Vdである。また、本実施形態では、面積率ρが0%のとき、すなわち、カメラ4Cが覆われない状態では、後述するように送話をミュートする関係から、面積率ρが0%のときでもレシーバ6から音声が出力されるようにしてある。本実施形態では、送話のミュート時における音量は、基準値Vdに0.1を乗じた値としてあるが、これに限定されるものではない。また、図9に示す例では、説明の便宜上、面積率ρを断続的に表しているが、図9にない面積率ρに対する音量は、図9に存在する面積率ρに対応する音量から補間して求める(以下の例でも同様)。なお、面積率ρと音量との関係は、記憶部12に保存されている。
ステップS110で基準値が設定されたらステップS111へ進む。ステップS111において、主処理部11は、画像処理部13から出力されるカメラ4Cからの画像情報に含まれる連続する単色画像の変化を検出したか否かを判断する。例えば、主処理部11は、異なる時間T1、T2において画像情報に含まれる連続する単色画像の画線率ρ1とρ2との差の絶対値|ρ1−ρ2|を求め、この値が所定の閾値ρc以上であれば、連続する単色画像の変化を検出したと判断する。ここで、連続する単色画像の変化は、例えば、図9に示す例において、連続する単色画像の面積率ρが100%から50%に変化した場合や、75%から50%に変化した場合等である。連続する単色画像の変化は、携帯電子機器1の使用者の指等を動かして、使用者の指等がカメラ4Cの入光部を覆う面積が変化することにより、カメラ4Cが撮像した画像に含まれる前記指等に相当する部分の面積が変化して発生する。
ステップS111でNoと判定された場合、すなわち、主処理部11が、連続する単色画像の変化を検出していない場合、カメラ4Cを覆った指の位置は変化していないと判断できる。この場合、STARTに戻り、主処理部11は、携帯電子機器1の状態の監視を継続する。ステップS111でYesと判定された場合、すなわち、主処理部11が、画像処理部13から出力されるカメラ4Cからの画像情報中に含まれる連続する単色画像の変化を検出した場合、カメラ4Cを覆った指の位置は変化していると判断できる。この場合、携帯電子機器1の使用者は、レシーバ6からの音声出力(この例では音量)を変更する意思があると判断できる。
この場合、ステップS112に進み、主処理部11は、カメラ4Cが被写体(この例では、携帯電子機器1の使用者の指)に覆われる程度に応じて、より具体的には検出された連続する単色画像の面積率ρに応じて、レシーバ6から出力される音声の音量を調整する。例えば、主処理部11は、連続する単色画像が変化した後における連続する単色画像の面積率ρに対応する音量とする。この場合、主処理部11は、カメラ4Cが撮像し画像処理部13によって画像処理された画像情報から連続する単色画像の面積率ρを求め、記憶部12に格納される面積率ρと音量との関係から、求めた面積率ρに対応する音量を設定する。そして、主処理部11は、設定した音量となるように音声信号を生成し、音声処理部14へ出力する。音声処理部14は、主処理部11から出力された音声信号に基づき、レシーバ6の駆動信号を生成してレシーバ6を駆動する。これによって、携帯電子機器1の通話中にレシーバ6から出力される音声を変更できる。
このように、本実施形態では、カメラ4Cが撮像したカメラ4Cの入光部を覆う被写体(本実施形態では、携帯電子機器1の使用者の指等)の画像に基づき、レシーバ6の音声出力(音量、速度等)を調整する。すなわち、カメラ4Cの入光部と対向する被写体、より具体的にはカメラ4Cの入光部を覆う被写体の状態に基づき、レシーバ6から出力される音声出力を調整する。これによって、携帯電子機器1の通話中にレシーバ6から出力される音声出力を調整する場合には、簡単な操作で調整できるので、通話中に音声出力を調整する際の利便性が向上する。
また、本実施形態では、カメラ4Cが撮像した画像中において被写体が占める程度、すなわち、カメラ4Cの入光部が被写体に覆われる程度(面積)に応じて音声出力が調整される。そして、本実施形態では、音量を調整する場合、被写体にカメラ4Cが覆われる程度(面積)が小さくなるにしたがって、音量が小さくなる。これによって、音量の大きさを変更しやすくなる。
図9に示す例では、カメラ4Cの入光部を覆う使用者の指をY軸のマイナス(−)方向、すなわち、レシーバ6からマイク5に向かって動かすことにより、レシーバ6から出力される音声の音量を小さくできる。携帯電子機器1の通話中、レシーバ6は使用者の耳の付近に位置し、マイク5は使用者の口の付近に位置する。一般に、人間は頭が上で足が下という認識がある。そして、一般には、上方向が音量や速度の増加、下方向が音量や速度の減少という認識がある。
したがって、本実施形態のように、レシーバ6(頭側、すなわち上側)からマイク5(足側、すなわち下側)に向かって使用者の指を動かした場合に、レシーバ6から出力される音声の音量が小さくなるようにすると、操作の方向と操作結果(音量の変化等)とが人間の認識と一致する。その結果、操作の間違いを低減できるので好ましい。なお、カメラ4Cの入光部を覆う指等を動かす方向(移動方向)と操作結果との対応は、上述した関係に限定されるものではない。
ステップS112で音量が変更されたら、ステップS113へ進む。ステップS113において、主処理部11は、カメラ4Cが撮像し画像処理部13によって画像処理された画像情報から連続する単色情報が検出されるか否かを判定する。ステップS113でNoと判定された場合、すなわち、主処理部11が、カメラ4Cからの画像に基づいて得られる画像情報から連続する単色情報を検出した場合、STARTに戻り、主処理部11は、携帯電子機器1の状態の監視を継続する。
ステップS113でYesと判定された場合、すなわち、主処理部11が、カメラ4Cからの画像に基づいて得られる画像情報から連続する単色情報を検出しない場合、ステップS114へ進む。この場合、携帯電子機器1の使用者の指はカメラ4Cから外されて、カメラ4Cの入光部を覆うものは何も存在しない状態であり、カメラ4Cは被写体(前記指等)を撮像しない状態である。すなわち、カメラ4Cからの画像に基づいて得られる画像情報に含まれる、連続する単色画像の面積率ρは0%である。このような状態になった場合、本実施形態では、送話をミュートする。すなわち、携帯電子機器1のマイク5が取得した音声を通信相手には送信しない。このため、主処理部11は、マイク5が取得し、音声処理部14から入力される音声データを通信処理部15に出力しない処理を実行する。これによって、携帯電子機器1からの送話はミュートされるが、上述したように、レシーバ6からは音声が出力される。すなわち、ミュート時には、携帯電子機器1から通話相手への送話はされないが、通話相手から携帯電子機器1への送話は可能であり、送話された音声は、携帯電子機器1のレシーバ6から出力される。このように、本実施形態では、カメラ4Cが撮像した被写体の画像に基づき、制御装置10を構成する通信処理部14による音声の送出が調整され、ミュート時には、通信処理部14による音声の送出は実行されない。
このように、本実施形態では、携帯電子機器1の通話中にレシーバ6から音声出力を調整する場合、指等でカメラ4Cを覆い、カメラ4C上でその指等を動かすだけでよい。これによって、操作部3のキー操作やディスプレイ2を確認しながらのキー操作が不要になるので、携帯電子機器1の通話中における音声出力の調整が簡易かつ容易に実現できる。また、通話中にレシーバ6から耳を離さずに音声出力を調整でき、さらに、カメラ4Cから指等を離すだけの簡単な操作で通話中における送話のミュートも実現できる。このように、本実施形態によれば、通話中に音声出力を調整する際の利便性を向上させることができる。さらに、携帯電子機器1にカメラ4Cが搭載されている場合、これを利用してソフトウェアを変更するのみで本実施形態に係る音声調整方法を実現できるので、新たなスイッチ等を設ける必要はない。これによって、携帯電子機器1の製造コストの上昇を抑制できる。
図10に示す例は、上述したように、ステップS109で設定する基準値Vdを、カメラ4Cが撮像した画像の画像情報に含まれる連続する単色画像の面積率が70%程度であるときの音量とする。この場合、携帯電子機器1の使用者の指等がカメラ4Cの入光部を覆う面積は、基準値Vdにおける面積に対して増減させることができる。したがって、この場合、主処理部11は、前記面積が基準値Vdにおける面積よりも減少した場合にはレシーバ6から出力される音声の音量を小さくし、前記面積が基準値Vdにおける面積よりも増加した場合にはレシーバ6から出力される音声の音量を増加させる。
例えば、カメラ4Cからの画像に基づき得られる画像情報に含まれる、連続する単色画像の面積率ρが90%の場合、音量は1.2×Vdに設定し、面積率が100%(完全に指等でカメラ4Cを覆ったとき)の場合、音量は1.5×Vd(最大音量)に設定する。また、面積率ρが70%よりも減少すると、音量はそれに応じて減少するように設定される。このように、携帯電子機器1の使用者の指等がカメラ4Cを完全に覆わない状態においてカメラ4Cが取得した画像の画像情報を用いて音量等の基準値を設定すると、音量等の増加、減少の両方を実現できる。
図11は、連続する単色画像の変化の方向によって音量を変更する例を説明する図である。図11に示す例では、携帯電子機器1の使用者の指等がカメラ4Cを完全に覆った状態(面積率ρ=100%)から、指等をY軸のマイナス(−)方向に向かって動かすと、レシーバ6から出力される音声の音量は減少する。また、携帯電子機器1の使用者の指等がカメラ4Cを完全に覆った状態(面積率ρ=100%)から、指等をX軸のマイナス(−)方向に向かって動かすと、レシーバ6から出力される音声の音量は増加する。そして、指等をX軸のマイナス(−)方向に向かって動かした結果、カメラ4Cが指等に覆われなくなった状態(面積率ρ=0%)で音量は最大値の2×Vdとなる。
図8に示すように、画像情報20には、それぞれの画素の座標(P1(X1、Y1)、P2(X2、Y2)等)も含まれるので、主処理部11は、連続する単色画像を構成するそれぞれの画素の座標を特定できる。したがって、画像情報20を構成する画素の色情報及び座標から、連続する単色画像の変化の方向も判別できる。これによって、連続する単色画像の異なる変化の方向を用いて、音量の増加、減少の両方を調整できる。なお、図11に示す例において、音量を増加させる際には、変化の方向をX軸のプラス(+)方向としてもよい。
図12は、連続する単色画像の変化の方向によって音量及び音声の速度を変更する例を説明する図である。図12に示す例では、携帯電子機器1の使用者の指等がカメラ4Cを完全に覆った状態(面積率ρ=100%)から、指等をY軸のマイナス(−)方向に向かって動かすと、レシーバ6から出力される音声の速度はSdで一定のまま、音量は減少する。また、携帯電子機器1の使用者の指等がカメラ4Cを完全に覆った状態(面積率ρ=100%)から、指等をX軸のマイナス(−)方向に向かって動かすと、レシーバ6から出力される音声の音量はVdで一定のまま速度は減少する。指等をX軸のマイナス(−)方向に向かって動かした結果、カメラ4Cが指等に覆われなくなった状態(面積率ρ=0%)で、音声の速度は最小値の0.5×Vdとなる。このように、連続する単色画像の異なる変化の方向を用いて、複数の音声出力(この例では音量及び速度)を調整することができる。
このように、カメラ4Cが被写体に覆われる程度及びカメラ4Cの入光部を覆う被写体の動作方向に応じて音声出力を調整することによって、音声出力を2方向(例えば、音量であれば増加方向及び減少方向)に調整できる。さらに、カメラ4Cが被写体に覆われる程度及びカメラ4Cの入光部を覆う被写体の動作方向に応じて音声出力を調整することによって、2種類の音声出力(例えば、音量及び速度)を調整できる。なお、本実施形態では、カメラ4Cの入光部と対向する位置の被写体の画像に基づきレシーバ6の音声出力を調整する例を説明したが、カメラ4Cの入光部と対向する位置の被写体の画像に基づきスピーカ17の音声出力を調整してもよい。