WO2023275920A1

WO2023275920A1 - トリガー信号発生装置及び携帯端末

Info

Publication number: WO2023275920A1
Application number: PCT/JP2021/024315
Authority: WO
Inventors: 好則神山
Original assignee: 株式会社pop
Priority date: 2021-06-28
Filing date: 2021-06-28
Publication date: 2023-01-05
Also published as: JPWO2023275920A1

Abstract

本発明の一態様であるトリガー信号発生装置は、携帯端末へジェスチャが行われたタイミングを示すトリガー信号を発生するトリガー信号発生装置であって、前記携帯端末を原点とする座標系の３軸方向のそれぞれの動き情報を検出する動き情報検出部と、前記動き情報検出部により検出された３つの動き情報のうちの１つの正負符号が、残りの２つの正負符号と異なるようになったタイミングで、前記トリガー信号を発生するトリガー信号発生部と、を備えている。

Description

トリガー信号発生装置及び携帯端末

　本発明は、トリガー信号発生装置及び携帯端末に関する。

　従来、スマートフォンを所定のパターンで動かすことによって、撮像装置を動作させる技術が開示されている（特許文献１参照）。具体的には、特許文献１の技術は、ユーザがスマートフォンを反時計周りに振り上げ、時計回りに振り下ろし、スマートフォンを止めるという一連の動きを検出すると、スマートフォンに搭載された撮像装置を動作させる。

　また、スマートフォンを所定のパターンで動かすことによって、動画の再生、停止、早送り、巻き戻しなどを行う技術が開示されている（特許文献２参照）。具体的には、特許文献２の技術は、ユーザがスマートフォンをｘ軸周り又はｙ軸周りに傾ける操作を検知して、検知した操作内容に基づいて、動画の再生、停止等を行う。

特許第６１４２０６０９号公報国際公開第２０１８／６６７０５号

　本発明は、従来技術の問題を解決する。

　本発明の第１の態様は、携帯端末へジェスチャが行われたタイミングを示すトリガー信号を発生するトリガー信号発生装置であって、前記携帯端末を原点とする座標系の３軸方向のそれぞれの動き情報を検出する動き情報検出部と、前記動き情報検出部により検出された３つの動き情報のうちの１つの正負符号が、残りの２つの正負符号と異なるようになったタイミングで、前記トリガー信号を発生するトリガー信号発生部と、を備える。

　本発明の第２の態様は、被写体を撮像してフレーム画像を生成する撮像部と、前記撮像部により生成されたフレーム画像を順次記憶する画像記憶部と、前記動き情報検出部により検出された３つの動き情報に基づいて、前記携帯端末が静止状態になった静止期間を検出する静止期間検出部と、ジェスチャが行われたタイミングを示すトリガー信号を発生するトリガー信号発生装置であって、前記携帯端末を原点とする座標系の３軸方向のそれぞれの動き情報を検出する動き情報検出部と、前記動き情報検出部により検出された３つの動き情報のうちの１つの正負符号が、残りの２つの正負符号と異なるようになったタイミングで、前記トリガー信号を発生するトリガー信号発生部と、を有するトリガー信号発生装置と、前記画像記憶部に記憶された複数のフレーム画像の中から、前記トリガー信号の発生タイミングの前又は後に前記静止期間検出部によって検出された前記静止期間に対応するフレーム画像を、静止画として選択する静止画選択部と、を備える。

　本発明は、ユーザが携帯端末に簡単なジェスチャを行うだけで携帯端末を操作することができる。

図１は、実施形態に係るスマートフォンの構成を示す図である。図２は、ユーザがスマートフォンを保持した状態を示す図である。図３Ａは、ユーザのタップ操作を説明する図である。図３Ｂは、ユーザのタップ操作を説明する図である。図４は、タップ操作が行われた場合の３軸方向のそれぞれの加速度の変化を示す図である。図５は、ユーザのフリップ操作を説明する図である。図６は、フリップ操作が行われた場合の３軸方向のそれぞれの加速度の変化を示す図である。図７は、静止状態の判定において設定される静止開始点及び静止終了点を示す図である。図８は、ジェスチャ検出のための式のパラメータを説明するための図である。図９は、複数のフレーム画像の中から選択される静止画を説明する図である。図１０は、操作タイミングの補助のためにタッチパネルに表示された表示物を示す図である。図１１は、ジェスチャ操作による動画再生を示す図である。図１２は、再生に対応するジェスチャが行われた場合の３軸方向の加速度を示す図である。図１３は、停止に対応するジェスチャが行われた場合の３軸方向の加速度を示す図である。図１４は、早送りに対応するジェスチャが行われた場合の３軸方向の加速度を示す図である。図１５は、巻き戻しに対応するジェスチャが行われた場合の３軸方向の加速度を示す図である。図１６は、５×５ピクセルで構成された基準セルを示す図である。図１７は、２つの基準セルの類似度の判定手法を説明する図である。図１８は、フレーム画像に対応づけられた仮想レイヤーファイルを示す図である。図１９は、フレーム画像内の物体を追尾する状況を説明する図である。図２０は、プレビュー画像として高解像度画像が表示された状況を示す図である。図２１Ａは、局所画像をタップした状態を示す図である。図２１Ｂは、サングラスの類似画像検索結果を示す図である。図２１Ｃは、ユーザ編集画面を示す図である。図２２は、背景画像上に表示された局所画像を示す図である。図２３は、スマートフォンの通信ネットワークを説明する図である。図２４は、制御部の写真撮影処理ルーチンを示すフローチャートである。図２５は、局所画像抽出ルーチンを示すフローチャートである。図２６は、局所画像の類似検索ルーチンを示すフローチャートである。図２７は、スマートフォンにタップ操作が行われた場合の３軸方向のそれぞれの角速度の変化を示す図である。図２８は、スマートフォンにフリップ操作が行われた場合の３軸方向のそれぞれの角速度の変化を示す図である。図２９は、角速度を用いた静止状態の判定において設定される静止開始点及び静止終了点を示す図である。

　以下、本発明の実施形態について図面を参照しながら詳細に説明する。
（スマートフォン１の構成）
　図１は、本実施形態に係るスマートフォン１の構成を示す図である。
　スマートフォン１は、被写体を撮像する撮像部１１と、撮像部１１で生成された画像に対して所定の画像処理を行う画像処理部１２と、画像やその他のデータを記憶するデータ記憶部１３と、を備える。

　スマートフォン１は、さらに、３軸方向の動きに関する物理量を検出するセンサ１４、画像や操作画面等を表示するタッチパネル１５、外部機器とデータ通信するための通信部１６を備える。

　スマートフォン１は、タッチパネル１５の操作に応じて動作するだけでなく、ユーザのジェスチャ（後述するフリップ操作又はタップ操作）に応じて動作する。本実施形態では、スマートフォン１は、主に、ユーザのジェスチャや静止状態に応じて動作する。

　図２は、右手座標系のｘｙｚ空間においてユーザがスマートフォン１を保持した状態を示す図である。なお、ｘｙｚ空間の原点は、スマートフォン１の中心部である。

　スマートフォン１は、一軸方向（図２ではｙ軸）を長手とする矩形面を有する筐体で覆われている。タッチパネル１５は、ｘｙ平面上、具体的には上述の矩形面上に設けられている。ｚ軸は、タッチパネル１５に直交する方向になる。本実施形態では、ユーザは、撮影する場合、スマートフォン１を図２に示すようなｘｙｚ空間で保持する。本実施形態では、ユーザがスマートフォン１を保持した場合のｘ軸、ｙ軸及びｚ軸の各方向は、次のように定義される。

　タッチパネル１５の長手方向の上側が正のｙ軸方向になり、その下側が負のｙ軸方向になる。タッチパネル１５の長手方向に直交する方向の右側が正のｘ軸方向になり、その左側が負のｘ軸方向になる。タッチパネル１５の正面側が正のｚ軸方向になり、タッチパネル１５の背面側が負のｚ軸方向になる。

　図１に示すように、撮像部１１は、被写体からの光に応じて画像を生成するイメージセンサである。撮像部１１は、例えば、ＣＣＤイメージセンサ、ＣＭＯＳイメージセンサが該当する。なお、本実施形態では、スマートフォン１には、２つの撮像部１１が設けられている。２つの撮像部１１のうちの一方はタッチパネル１５と同じ矩形面に設けられ、他方はタッチパネル１５の背面側の矩形面に設けられる。

　撮像部１１は、電子シャッター機能を備えており、静止画用又は動画用のフレーム画像を生成する。静止画撮影のレリーズ操作は、タッチパネル１５上の表示ボタンへのタップ又はスマートフォン１本体へのジェスチャによって行われる。

　但し、本実施形態では、レリーズ操作は、スマートフォン１本体へのジェスチャによって行われる。撮像部１１によって生成されたフレーム画像は、ライブ動画像としてタッチパネル１５に表示されたり、データ記憶部１３に記憶されたりする。

　画像処理部１２は、撮像部１１で生成されたフレーム画像に対して、ホワイトバランス調整、ガンマ補正等の所定の画像処理を実行する。画像処理部１２によって所定の処理が実行された画像は、データ記憶部１３に記憶される。なお、ライブ動画像の場合、画像は、データ記憶部１３に一時的に記憶され、その後、ライブ動画像の表示のためにタッチパネル１５に供給される。

　データ記憶部１３は、例えばＤＲＡＭ、フラッシュメモリ等が該当し、データを一時的に又は長期的に保存する。データ記憶部１３には、様々なアプリケーションプログラムが記憶されている。制御部１７は、上述のアプリケーションプログラムに従って、所定のデータ処理を実行する。

　また、データ記憶部１３には、撮像部１１で生成された画像、通信部１６によって外部ネットワークから受信されたデータ等が記憶される。データ記憶部１３へのデータの書き込み、データ記憶部１３からのデータの読み出しは、制御部１７によって制御される。

　センサ１４は、スマートフォン１の動きに関する情報を検出するモーションセンサである。本実施形態では、センサ１４は、スマートフォン１の３軸方向のそれぞれの加速度を検出する加速度センサである。センサ１４は、スマートフォン１の３軸方向のそれぞれの加速度を検出し、それらの検出値を制御部１７へ供給する。　

　センサ１４は、本実施形態では加速度センサであるが、スマートフォン１の動きに関する情報を検出することができれば、加速度センサに限定されるものではない。例えば、センサ１４は、速度センサ、角速度センサ（ジャイロセンサ）、地磁気センサであってもよい。

　タッチパネル１５は、スマートフォン１の正面（もっと広い矩形面）に設けられている。タッチパネル１５には、撮像部１１により生成された又はデータ記憶部１３から読み出されたフレーム画像が表示される。また、タッチパネル１５には、スマートフォン１を操作するための様々な操作ボタンが表示される。

（動作モード）
　スマートフォン１は、写真撮影モード、動画撮影モード、及びライブ動画像（プレビュー動画像）モードを有している。

　写真撮影モードでは、ユーザは、タッチパネル１５に表示される被写体を確認しながら、スマートフォン１の撮影位置を決める。静止画用のレリーズ操作が行われると、レリーズ操作によって特定される単一のフレーム画像（写真画像）又は複数のフレーム画像（連写画像）がデータ記憶部１３に記憶され、タッチパネル１５に表示される。

　動画撮影モードでは、ユーザは、タッチパネル１５に表示される被写体を確認しながら、スマートフォン１の撮影位置を決める。動画用のレリーズ操作が行われると、レリーズ操作後の複数のフレーム画像（動画）がデータ記憶部１３に記憶され、タッチパネル１５に表示される。

　ライブ動画像モードでは、ユーザは、タッチパネル１５に表示される被写体を確認する。このとき、撮像部１１で生成される複数のフレーム画像（動画）がデータ記憶部１３に記憶され、タッチパネル１５に表示される。つまり、ライブ動画像モードでも、フレーム画像がデータ記憶部１３に記憶される。

　なお、上述した３つのいずれのモードにおいても、データ記憶部１３に記憶されたフレーム画像は、再生操作が行われた場合、タッチパネル１５に表示される。また、制御部１７は、外部サーバから静止画又は動画のフレーム画像をダウンロードして、データ記憶部１３に格納することができる。その後、制御部１７は、ダウンロードしたフレーム画像をデータ記憶部１３から読み出して、タッチパネル１５に表示させることもできる。

　通信部１６は、通信ネットワークを介して、外部サーバ等の外部機器との間で、フレーム画像やその他のデータの送受信が可能である。制御部１７は、例えば中央演算ユニット（ＣＰＵ）を有し、データ記憶部１３に記憶された撮影アプリケーション、その他の様々なアプリケーションを実行することにより、スマートフォン１全体を制御する。

　制御部１７は、センサ１４から３軸方向のそれぞれの検出値を周期的に受信し、それらの検出値の時間変化パターンに基づいて、スマートフォン１を制御する。具体的には、制御部１７は、スマートフォン１が静止状態であるか、スマートフォン１にジェスチャが行われたかを判定し、その判定結果に基づいて静止画撮影のレリーズタイミングを決定して、静止画のフレーム画像を得る。

（ジェスチャの内容）
　ユーザは、スマートフォン１に対してジェスチャをすることで、静止画撮影のレリーズ操作を行うことができる。本実施形態では、静止画撮影のレリーズ操作を指示するジェスチャとして、タップ操作とフリップ操作がある。

　図３Ａ及び図３Ｂは、スマートフォン１へのユーザのタップ操作を説明する図である。ユーザは、図３に示すように、スマートフォン１の下部を右手で持ち、被写体（例えば、自撮りする場合はユーザ自身）がタッチパネル１５に適切に表示されるように、スマートフォン１の位置及び撮影方向を決定する。

　次に、ユーザは、スマートフォン１をしっかり静止させる。そして、ユーザは、スマートフォン１を静止させた状態で、スマートフォン１の背面（タッチパネル１５の反対側）を人差し指ではたき、スマートフォン１に振動を与える。このように、タップ操作とは、スマートフォン１の背面を指ではたくことをいう。

　図２に示すｘｙｚ空間においては、ユーザは、スマートフォン１に対してｚ軸方向にタップする。なお、タップされる場所のｘ座標及びｙ座標は任意でよい。このとき、スマートフォン１には、ｚ軸方向だけでなく、ｘ軸方向及びｙ軸方向にも振動が発生する。各軸方向の振動は、図１のセンサ１４によって検出される。

　なお、スマートフォン１を保持する手は、右手でも左手でもよい。また、ユーザは、スマートフォン１を縦又は横にして持ってもよい。本実施形態では、ユーザは、スマートフォン１の背面をはたいたが、スマートフォン１の正面又は側面をはたいても良い。また、ユーザは、スマートフォン１の本体の上部又は下部の側面をはたいても良い。

　図４は、スマートフォン１にタップ操作が行われた場合の３軸方向のそれぞれの加速度の変化を示す図である。スマートフォン１が静止状態の場合にフリップ操作が行われると、３軸方向のそれぞれの加速度は特徴的な波形になる。

　具体的には、フリップ操作が行われると、ｚ軸方向の加速度ｄ３が閾値ｔｈを超えてピークに達する。ｄ３がピークに達するタイミング（時刻ｔ_ｉ）にほぼ同期して、ｘ軸方向の加速度ｄ１及びｙ軸方向の加速度ｄ２もピークに達する。このように、ピーク値が初めて同期するタイミングでは、ｄ１は負の値であるが、ｄ２及びｄ３は正の値になる。

　図５は、スマートフォン１へのユーザのフリップ操作を説明する図である。ユーザは、図５に示すように、スマートフォンの下部を右手で持ち、被写体（例えば、自撮りする場合はユーザ自身）がタッチパネル１５に適切に表示されるように、スマートフォン１の位置及び撮影方向を決定する。

　次に、ユーザは、スマートフォン１をしっかり静止させる。そして、ユーザは、スマートフォン１を背面側に傾けた後、素早く元の静止位置に戻し、スマートフォン１に振動を与える。このように、フリップ操作とは、スマートフォン１を静止した状態から、所定方向に傾けた後、素早く元の静止位置に戻すことをいう。

　図２に示すｘｙｚ空間においては、ユーザは、スマートフォン１をｚ軸周りに傾ける。なお、スマートフォン１を傾ける方向は、ｚ軸周りに限らず、ｘ軸周りやｙ軸周りであってもよい。また、スマートフォン１を保持する手は、右手でも左手でもよい。

　図６は、スマートフォン１にフリップ操作が行われた場合の３軸方向のそれぞれの加速度の変化を示す図である。スマートフォン１が静止状態の場合にフリップ操作が行われると、３軸方向のそれぞれの加速度は特徴的な波形になる。

　具体的には、フリップ操作が行われると、ｚ軸方向の加速度ｄ３が閾値ｔｈを超えてピークに達する。ｄ３がピークに達するタイミング（時刻ｔ_ｉ）にほぼ同期して、ｘ軸方向の加速度ｄ１及びｙ軸方向の加速度ｄ２もピークに達する。このように、ピーク値が初めて同期するタイミングでは、ｄ１は負の値であるが、ｄ２及びｄ３は正の値になる。つまり、フリップ操作が行われた場合の３軸方向の各加速度は、タップ操作が行われた場合と同様の特徴的な波形になる。

（静止状態の判定）
　スマートフォン１の制御部１７は、写真撮影モードの場合、次のようにして静止状態を判定する。

　制御部１７は、写真撮影モードの場合、常時、センサ１４から供給される３軸方向のそれぞれの検出値を監視する。制御部１７は、センサ１４のすべての検出値の絶対値が所定値以下になる状態が所定時間以上連続する場合、その連続期間をスマートフォン１の静止状態と判定する。

　ここで、ｘ軸方向、ｙ軸方向及びｚ軸方向のそれぞれのセンサ１４の検出値（加速度）をｘ、ｙ及びｚとする。微小時間をΔｔとする。静止状態を判定するためのセンサ出力閾値をαとする。なお、αはゼロ近傍の値である。このとき、制御部１７は、式（１）を満たすか否かを判定する。
（｜ｄ１｜＋｜ｄ２｜＋｜ｄ３｜）／３＜α　　　・・・（１）

　図７は、静止状態の判定において設定される静止開始点ＳＴ及び静止終了点ＥＤを示す図である。制御部１７は、式（１）を満たす状態が所定時間を超える場合、その期間をスマートフォン１の静止状態と判定する。そして、制御部１７は、式（１）を初めて満たした時点を静止開始点ＳＴとして設定し、静止開始点ＳＴの情報（静止開始点情報）をデータ記憶部１３に記憶する。静止開始点情報は、静止開始点ＳＴの時間（時刻）、静止開始点ＳＴのｘｙｚの各軸方向のそれぞれの加速度ｄ１，ｄ２，ｄ３である。

　制御部１７は、上記の所定時間経過後に式（１）を満たさなくなった場合、式（１）を満たさなくなった時点を静止終了点ＥＤとして設定し、静止終了点ＥＤの情報（静止終了点情報）をデータ記憶部１３に記憶する。静止終了点情報は、静止開始点ＳＴの時間（時刻）、ｘｙｚの各軸方向の加速度である。

　なお、制御部１７による静止状態の判定方法は、上述した方法に限定されるものではなく、センサ１４の検出値に基づいて静止状態の始点情報を判定することができれば、その他の方法でも適用可能である。

　例えば、静止状態か否かの判定条件は、式（１）に限らず、例えば次のようなものでもよい。例えば、制御部１７は、センサ１４から出力された３軸方向のそれぞれの検出値の少なくとも１つが閾値ｔｈ１未満になるか否かを判定してもよい（図７参照）。すなわち、制御部１７は、加速度ｄ１，ｄ２，ｄ３の少なくとも１つが閾値ｔｈ１未満になるか否かを判定してもよい。または、制御部１７は、微小時間Δｔ毎にセンサ１４から供給される３つの加速度ｄ１，ｄ２，ｄ３を用いて、それぞれの単位時間当たりの変化量Δｄ１，Δｄ２，Δｄ３の絶対値の少なくとも１つが所定の閾値未満であるか否か判定してもよい。

　制御部１７は、上述した静止判定処理の結果、肯定判定になる状態が所定時間（例えば０．３秒）を超えた場合に、静止状態になったと判定する。なお、０．３秒に限らず、０.１～１．０秒までの任意の時間でもよい。この場合、制御部１７は、上記条件を初めて満たした時点を静止開始点ＳＴとして設定し、上記条件を満たさなくなった時点を静止終了点ＥＤとして設定する。また、静止状態の判定は、後述するジェスチャ検出の前又は後に行われる。

（ジェスチャ検出）
　図４及び図６で説明したように、ユーザがスマートフォン１にジェスチャ（タップ操作又はフリップ操作）をした場合、センサ１４の３つ検出値（加速度）の時間変化パターンは、次の２つの特徴を有する。

　第１の特徴は、１つの検出値が閾値を超えて最初のピークになった場合、他の２つの検出値もほぼ同期して最初のピークになる点である。つまり、３つの検出値の最初のピークは、ほぼ同期して発生する。第２の特徴は、１つの検出値が閾値を超えて最初のピークになった場合、３つの検出値のうちの１つの検出値の正負符号は、残りの２つの検出値の正負符号と異なる点である。

　制御部１７は、上述した２つの特徴を考慮して、次の手順に従って、所定期間毎にセンサ１４の３軸方向のそれぞれ３つの検出値を用いて、ジェスチャ（タップ操作又はフリップ操作）があったか否かを検出して、ジェスチャがあったタイミングでトリガー信号を発生する。

（手順１）制御部１７は、所定期間毎に、センサ１４の３軸方向のそれぞれ３つの検出値の少なくとも１つについて、所定時間あたりの変化量が予め定める閾値を超えるか否かを判定する。制御部１７は、ある所定期間において、３つの検出値の少なくとも１つの変化量が閾値を超えた場合、次の処理に移行する。

（手順２）制御部１７は、上記の所定期間において、３つの検出値の１つが一方の正負符号（例えば正の値）になり、残りの２つが他方の正負符号（例えば負の値）になるか否かを判定する。

　制御部１７は、肯定的な判定結果の場合、ユーザがジェスチャ操作を行っていると判定して、判定結果を得た時点をジェスチャ開始時点に設定する。このように、ジェスチャ開始時点では、センサ１４の３つの検出値が瞬間的に（ほぼ同期して）変化して、かつ、３つの検出値のうちの１つの正負符号は残りの２つの正負符号と異なる、という特性がある。

（手順３）制御部１７は、ジェスチャの検出後に静止状態になる期間がある場合、静止開始点の１フレーム前をジェスチャ終了時点に設定する。

（ジェスチャ検出方法１）
　制御部１７は、以下のようにしてジェスチャを検出する。制御部１７は、センサ１４から３つの検出値ｄ１，ｄ２，ｄ３を微小時間Δｔ毎に周期的に受信する。

　制御部１７は、微小時間Δｔ毎に、３つの検出値ｄ１，ｄ２，ｄ３のうちの少なくとも１つが閾値を超えたか否かを判定する。制御部１７は、肯定判定の場合、３つの検出値ｄ１，ｄ２，ｄ３のうちの少なくとも１つが閾値を超えた時点ｔ_ｉを時間変化パターンの開始時点とする。なお、図４では、ｄ２及びｄ３は閾値を超えているが、ｄ１は閾値を超えていない。

　次に、制御部１７は、時間変化パターンの開始時点において、３つの検出値ｄ１，ｄ２，ｄ３の正負符号を判定する。具体的には、制御部１７は、３つの検出値の１つの正負符号が残りの２つの正負符号と異なる状態になったか否かを判定する。制御部１７は、肯定判定の場合、肯定判定を得た時点をジェスチャ開始時点に設定し、ジェスチャ検出を示すトリガー信号を発生する。その後、制御部１７は、ジェスチャ検出後に静止状態の期間がある場合、静止開始点の１フレーム前の時点をジェスチャ終了時点に設定する。

（ジェスチャ検出方法２）
　制御部１７は、上述したジェスチャ検出方法１の他に、以下のようにしてジェスチャを検出してもよい。
　図８は、ジェスチャ検出のための式のパラメータを説明するための図である。制御部１７は、微小時間Δｔ毎に、次の式（２）～（４）を計算する。なお、Δｄ１，Δｄ２，Δｄ３は、微小時間Δｔにおけるｄ１，ｄ２，ｄ３の変化量である。

ａｘ＝Δｄ１／Δｔ・・・（２）
ａｙ＝Δｄ２／Δｔ・・・（３）
ａｚ＝Δｄ３／Δｔ・・・（４）

　ａｘ、ａｙ、ａｚは、センサ１４のｘ軸方向、ｙ軸方向、ｚ軸方向のそれぞれの検出値の微小時間Δｔ（サンプリング期間）当たりの傾きを示す。次に、制御部１７は、次の式（５）～（７）の少なくとも１つを満たすか否かを判定する。
｜ａｘ｜≧２　　・・・（５）
｜ａｙ｜≧２　　・・・（６）
｜ａｚ｜≧２　　・・・（７）

　制御部１７は、式（５）～（７）の少なくとも１つを満たし、かつ、ａｘ、ａｙ、ａｚのうち２つの値が同符号であって残りの１つの値が異符号の場合、これらの条件を満たした時点をジェスチャ開始時点として設定し、ジェスチャ検出を示すトリガー信号を発生する。

　なお、制御部１７は、フレーム画像と共に、センサ１４の３つの検出値のそれぞれの変化量をデータ記憶部１３に記憶してもよい。また、制御部１７は、ジェスチャ検出のための計算・判定については、被写体の撮影中にリアルタイムで実行してもよいし、被写体の撮影後に独立して実行してよい。式（５）～（７）の“２”は、ジェスチャ検出のための閾値である。この閾値は“２”に限定されず、他の値でもよい。

　本実施形態では、制御部１７は、ユーザのジェスチャを検出するために、式（２）～（７）を用いたが、式（２）～（７）に限定されるものではない。すなわち、制御部１７は、上述した手順１～３を実行することができれば、判定式は特に限定されるものではない。

（写真撮影モードの静止画撮影）
　写真撮影モードでは、撮像部１１で生成されたフレーム画像がデータ記憶部１３に順次記憶される。ユーザは、スマートフォン１５に表示される被写体を確認しながら、スマートフォン１を静止させて、シャッター操作（ジェスチャ）を行う。このとき、制御部１７は、上述した静止状態判定処理及びジェスチャ検出処理をそれぞれ独立して実行して、静止画を取得する。

　具体的には、制御部１７は、ジェスチャを検出すると、静止状態の判定結果を用いて、データ記憶部１３に記憶されている複数のフレーム画像の中から、静止画として最適なフレーム画像を選択する。

　図９は、複数のフレーム画像の中から選択される静止画を説明する図である。ジェスチャが検出された場合、通常、ジェスチャ検出時ＴＪの前又は後に静止状態になる期間（静止開始点ＳＴから静止終了点ＥＤまで静止期間ＳＤ）が存在する。なお、ジェスチャ検出時ＴＪの後に検出値のピーク時ＴＰがある。そこで、制御部１７は、ジェスチャ検出ＪＤの前又は後の静止期間ＳＤの複数のフレーム画像の中から、静止画に最適なフレーム画像を選択する。フレーム画像の選択方法は、次のようなものがある。

（フレーム画像の選択方法）
　例えば、制御部１７は、ジェスチャ検出時を基準にしてその前後の両方に静止期間がある場合、静止期間内のすべてのフレーム画像の中から、ジェスチャ検出時から時間的に最も近いフレーム画像を静止画として選択してもよい。

　なお、制御部１７は、静止終了点から次のジェスチャ検出時までの時間が所定時間（例えば、０～５秒までの任意の時間）を超える場合、その静止終了点を含む静止期間のフレーム画像を、静止画の対象から除外することができる。また、制御部１７は、ジェスチャ検出時から次の静止開始点までの時間が上記の所定時間を超える場合、その静止開始点を含む静止期間のフレーム画像を、静止画の対象から除外することができる。

　ジェスチャと静止期間との間の時間が上記所定時間を超える場合、静止期間のフレーム画像は、ユーザの希望する静止画とは異なるケースが多い。そこで、制御部１７は、上記の条件を満たす場合、静止期間のフレーム画像を静止画の対象から除外することによって、写真撮影動作の誤作動を防止することができる。また、スマートフォン１に搭載されている近接センサを利用して、誤動作を防止してもよい。

　すなわち、制御部１７は、ジェスチャと静止期間との間の時間が上記所定時間を超えるか否かを判定し、ジェスチャとの間の時間が上記所定時間を超えない静止期間を選択して、選択した静止期間の中からフレーム画像を選択すればよい。

　制御部１７は、静止期間のフレーム画像の中から静止画を選択する場合、例えば、静止開始点のフレーム画像を選択しても良い。また、制御部１７は、静止開始点から所定時間後のフレーム画像を選択しても良いし、静止開始点から所定のフレーム数後のフレーム画像を選択してもよい。

　また、制御部１７は、静止期間のフレーム画像の中から、スマートフォン１の動きに応じて、最適な静止画を選択することもできる。具体的には、制御部１７は、センサ１４からの３つの検出値に基づいて、スマートフォン１の振動の大きさ、傾き方向及び初速を検出する。そして、制御部１７は、その検出結果を用いて、ジェスチャ検出時から何フレーム前又は何フレーム後のフレーム画像が静止画として最適であるかを判定して、その最適なフレーム画像を選択してもよい。

　さらに、制御部１７は、連写機能が設定されている場合、静止期間内の複数のフレーム画像の中から、予め定められた枚数のフレーム画像を選択してもよいし、静止期間内のすべてのフレーム画像を選択してもよい。

（静止判定のみを用いた静止画撮影）
　制御部１７は、ジェスチャを検出することなく、静止判定のみを行って、静止画を選択することもできる。具体的には、制御部１７は、上述した静止判定処理を行って静止開始点ＳＴを設定する。次に、制御部１７は、静止期間内において、静止開始点ＳＴを基準にして所定時間が経過したか否かを判定する。制御部１７は、静止開始点ＳＴを基準にして所定時間が経過した時点でトリガー信号を発生する。

　そして、制御部１７は、データ記憶部１３に記憶されている複数のフレーム画像の中から、上記のトリガー信号が発生した時点のフレーム画像を静止画として選択する。この結果、ユーザは、スマートフォン１を静止させるだけで、静止画を撮影することができる。

（ヒストグラムを用いたフレーム画像の選択方法）
　制御部１７は、ヒストグラムを用いて、静止画に最適なフレーム画像を選択することができる。具体的には、制御部１７は、ジェスチャ検出時のフレーム画像のＲＧＢ色ヒストグラムと、静止期間内のフレーム画像のＲＧＢ色ヒストグラムと、をそれぞれ演算して、各フレーム画像のＲＧＢ色ヒストグラムの差を求める。

　制御部１７は、各フレーム画像のＲＧＢ色ヒストグラムの差が閾値より小さい場合、静止期間内の上記フレーム画像を静止画として選択し、各フレーム画像のＲＧＢ色ヒストグラムの差が閾値以上の場合、静止期間内の上記フレーム画像を静止画の対象外とする。

　通常、ユーザは、ジェスチャ操作前に、撮影フレームの位置（撮影位置及び撮影方向）を決定する。上述したＲＧＢ色ヒストグラムの差が閾値以上の場合は、ジェスチャ検出時のフレーム画像と静止期間内のフレーム画像が大きく異なり、撮影フレームの位置ずれが発生している可能性がある。そこで、上述した処理を行うことによって、撮影フレームの位置ずれを回避することができる。

　なお、ユーザは、自身に適した時間変化パターン、閾値、判定・検出方法を予め設定してもよい。これにより、制御部１７は、ユーザ毎に、最適な時間変化パターン、閾値、判定・検出方法を利用することができる。

（検出値の可視化による操作タイミングの補助）
　図１０は、操作タイミングの補助のためにタッチパネル１５に表示された表示物Ｄを示す図である。制御部１７は、タッチパネル１５のプレビュー画像ＰＶにオーバーレイする透明な仮想レイヤーファイルＶＬＦを用いて、センサ１４の３軸方向の各検出値を可視化して、ユーザの操作タイミングを補助することができる。

　具体的には、制御部１７は、センサ１４の検出値をリアルタイムで演算する。そして、制御部１７は、仮想レイヤーファイルＶＬＦに記述されている３次元形状の表示物Ｄ（例えば水平標準器、ｘｙｚ空間の３軸等）を読み出して、タッチパネル１５に表示する。そして、制御部１７は、センサ１４の３軸方向の各検出値を３次元座標に変換して、３次元形状の表示物Ｄを動的に動かす。この結果、センサ１４の検出値の状態を可視化した表示物Ｄをタッチパネル１５に表示することができる。

　これにより、タッチパネル１５上で、スマートフォン１の静止状態やジェスチャの動きが可視化され、スマートフォン１へのジェスチャ操作を補助することができる。なお、仮想レイヤーファイルＶＬＦに記述される表示物Ｄやその他の情報は、ユーザ毎に設定可能である。表示物Ｄは、３次元形状のロゴやマークなどでもよい。

（フレーム画像の関連情報）
　データ記憶部１３には、制御部１７によって、フレーム画像だけでなく、当該フレーム画像の関連情報が記憶される。関連情報としては、例えば、対応するフレーム画像の生成時にセンサ１４によって検出された３軸方向のそれぞれの検出値、各検出値の時間変化量が該当する。

　また、その他の関連情報としては、例えば、対応するフレーム画像がスマートフォン１の振動や傾きの発生時（ジェスチャ検出時）から何番目のフレームであるかを示すフレーム番号、静止状態検出時から何番目のフレームであるかを示すフレーム番号、角度、傾き方向などの特徴量が該当する。上述した各フレーム番号は、Ｔ’に同期して、自動的に付与される。また、上述した各フレーム番号が指定された場合、指定された各フレーム番号に対応するフレーム画像が読み出される。

　フレーム画像及び関連情報は、通信部１６によって、外部サーバに送信され、その外部サーバに保存されてもよい。データ記憶部１３又は外部サーバに保存されたフレーム画像及び関連情報は、静止画又は動画の再生時に、適宜読み出される。

　例えば、制御部１７は、静止画の選択時において、３軸方向の全ての検出値又は検出値の時間変化量が予め定める閾値の範囲内にあり、その状態（静止状態）が所定時間以上継続する静止期間を検出する。次に、制御部１７は、静止期間において、完全静止に最も近い状態のフレーム画像を静止画像として選択する。

　完全静止に最も近い状態のフレーム画像とは、例えば、３軸方向の全ての検出値の絶対値の合計、又は各検出値の時間変化量の絶対値の合計が最も小さい値になったときのフレーム画像が該当する。そして、制御部１７は、データ記憶部１３又は外部サーバから静止画像を読み出し、読み出した静止画像をタッチパネル１５に表示する。

　制御部１７は、静止画の選択時において、次の処理を行うこともできる。例えば、制御部１７は、静止基準フレーム番号又はジェスチャ基準フレーム番号を指定して、指定した番号に対応するフレーム画像をデータ記憶部１３又は外部サーバから読み出しても良い。また、制御部１７は、角度や傾きなどの特徴量を指定して、指定した特徴量に対応するフレーム画像をデータ記憶部１３又は外部サーバから読み出しても良い。

（再生機能）
　図１１は、ジェスチャ操作による動画再生を示す図である。ユーザは、スマートフォン１を所定方向に傾けるジェスチャ操作（フリップ操作）を行うことで、動画を視聴することやタッチパネル１５に表示される情報等をスクロールすることができる。

　制御部１７は、上述したジェスチャ検出処理によってジェスチャを検出すると、ジェスチャ検出時におけるセンサ１４の３軸方向の各検出値を用いて、ジェスチャ内容（スマートフォン１がどの方向に傾いたか）を判定する。ジェスチャ内容と再生機能との対応関係を示すテープルは、予めデータ記憶部１３に記憶されている。

　テーブルの内容は次の通りである。なお、スマートフォン１の外縁を形成する４つの辺のうち、スマートフォン１に対してｘ軸の正方向にある短手の辺を上辺とする。さらに、ｘ軸の負方向にある短手の辺を下辺、ｙ軸の正方向になる辺を左辺、ｙ軸の負方向にある辺を右辺とする。
ジェスチャ：右辺をｚ軸の負方向へ１回傾ける→再生
ジェスチャ：停止：右辺をｚ軸の負方向へ１回傾ける→停止
ジェスチャ：上辺をｚ軸の負方向へ１回傾ける→早送り
ジェスチャ：下辺をｚ軸の負方向へ１回傾ける→巻き戻し

　図１２は、再生に対応するジェスチャが行われた場合の３軸方向の加速度を示す図である。図１３は、停止に対応するジェスチャが行われた場合の３軸方向の加速度を示す図である。図１４は、早送りに対応するジェスチャが行われた場合の３軸方向の加速度を示す図である。図１５は、巻き戻しに対応するジェスチャが行われた場合の３軸方向の加速度を示す図である。

　図１２から図１５に示す３つの加速度は、図４及び図６で説明した２つの特徴を有している。このため、制御部１７は、上述したジェスチャ検出処理を行うことによって、再生、停止、早送り、巻き戻しに対応するそれぞれのジェスチャを検出することができる。

　そこで、制御部１７は、テーブルを参照して、ジェスチャ検出時に、右辺がｚ軸の負方向へ１回傾いたことを検出すると、データ記憶部１３からフレーム画像を読み出して、タッチパネル１５に動画を再生する。制御部１７は、動画再生中にジェスチャを検出した場合、テーブルに従って、スマートフォン１の傾いた方向に対応する動作を実行する。

　なお、スマートフォン１は、所定時間当たりのジェスチャ検出回数を増やすことによって、多機能再生やスクロールを実行することができる。この場合、操作内容テーブルには、所定時間当たりのジェスチャ検出回数と、スマートフォン１の傾いた方向と、によって特定される様々な再生機能（一時停止、コマ送り再生、コマ戻し再生など）が記述される。よって、制御部１７は、所定時間当たりのジェスチャ検出回数及びスマートフォン１の傾いた方向をそれぞれ検出し、操作内容テーブルに従って、それらの検出内容に対応する再生機能やスクロールを実行すればよい。

（類似検索）
　データ記憶部１３には、非常に多くのフレーム画像が記憶される。しかし、ユーザが、フレーム画像に写った被写体（物体）に関する情報を１つ１つ探し出し、そのような情報をいつでも利用できるように準備するのは非常に困難である。

　これに対して、スマートフォン１は、データ記憶部１３に記憶されたフレーム画像について、外部サーバ内にアクセスして類似画像検索を行って、当該フレーム画像に写った被写体（物体）に関する情報を入手することができる。スマートフォン１の制御部１７は、類似画像検索を行うための前処理として、フレーム画像に写った物体を抽出するための局所画像の抽出処理を行う。

（局所画像の抽出）
　制御部１７は、フレーム画像に写った物体を識別するために、対象となるフレーム画像の中から局所画像を抽出する。ここで、対象となる画像は、上述した処理によって得られた写真（静止画）、動画のフレーム画像、プレビュー動画のフレーム画像、ユーザのジェスチャ操作時の動画のフレーム画像などである。制御部１７は、基準セルを用いて、対象となる画像から局所画像を抽出する。

　図１６は、ｘｙ平面において５×５ピクセルで構成された基準セルを示す図である。対象画像の水平方向にｘ軸、垂直方向にｙ軸を設定する。ｘ軸及びｙ軸の交点には、基準セルの中心ピクセルである基準中心ピクセルの座標を配置し、基準中心ピクセルの座標を（ｘ０，ｙ０）とする。

　このとき、基準中心ピクセルに対して、ｘ方向に隣接する２つのピクセル、及びｙ方向に隣接する２つのピクセルが隣接ピクセルとなる。例えば、基準中心ピクセル（ｘ０，ｙ０）に対して、（ｘ－１，ｙ０）、（ｘ＋１，ｙ０）、（ｘ０，ｙ＋１）、（ｘ０，ｙ－１）の４つのピクセルが隣接ピクセルとなる。

　図１７は、２つの基準セルの類似度の判定手法を説明する図である。制御部１７は、隣接する２つの基準セルの各領域内で、赤（Ｒ）、緑（Ｇ）、青（Ｂ）について色ヒストグラムを作成し（ＨＳＶ色空間変換）、２つの基準セルの類似度を判定する。制御部１７は、隣接する２つの基準セルのそれぞれについて、ＨＳＶ色空間での色相、彩度、明度の各要素の特徴量を検出し、２つの基準セルが類似する度合いを示す類似値を演算する。

　類似値は、２つの比較対象が完全同一の場合はゼロになり、比較対象のずれが大きくなるに従って大きな値になる。そして、制御部１７は、類似値が閾値未満の場合、隣接する２つの基準セルは類似すると判定して、当該２つの基準セルを連結する。

　このように、制御部１７は、隣接する２つの基準セルが類似する場合、その２つの基準セルを次々に連結することにより、基準セルをグループ化することにより、局所画像を抽出する。

（局所画像を抽出する手順）
　制御部１７は、以下の手順に従って、フレーム画像から局所画像を抽出する。
（手順１）制御部１７は、フレーム画像中の各基準セルにおいて、色ヒストグラムＣｈｉｓｔ＝｛Ｃ（Ｈ，１），Ｃ（Ｈ，２）…Ｃ（Ｈ，Ｎ），Ｃ（Ｓ，１），Ｃ（Ｓ，２）…Ｃ（Ｓ，Ｎ），Ｃ（Ｖ，１），Ｃ（Ｖ，２）…Ｃ（Ｖ，Ｎ）｝を作成する。ここで、Ｈ，Ｓ，Ｖは、色相（Ｈ）、彩度（Ｓ）、明度（Ｖ）で表されるＨＳＶ色空間の各要素である。Ｎは量子化数である。

（手順２）制御部１７は、次の色ヒストグラム式を計算することにより、Ｃ（ｒ∈｛Ｈ，Ｓ，Ｖ｝，ｎ）を求める。

　なお、Ｍは基準セルの大きさ（ピクセル）である。ｎは量子化の番号ｎ＝（１，２，・・・，Ｎ）である。ｆ（Ｐｃ（ｘ，ｙ，ｒ））はＰｃ（ｘ，ｙ，ｒ）を量子化した値である。このように、Ｃ（ｒ，ｎ）は、基準セル内の各ピクセルの色Ｐｃ（ｘ，ｙ，Ｈ）、Ｐｃ（ｘ，ｙ，Ｓ）、Ｐｃ（ｘ，ｙ，Ｖ）の累積値である。

（手順３）制御部１７は、手順（１）及び（２）で算出された色ヒストグラムを用いて、セルｉ，ｊについて、次のヒストグラムインターセクション式を計算することより、類似度Ｓ（ｉ，ｊ）を求める。

　なお、Ｂは、色ヒストグラムのビン数である。制御部１７は、隣接する２つの基準セルについて、各類似度（近似値）が予め定めた範囲内にある場合は、当該隣接する基準セルを近似ピクセルとして連結する。制御部１７は、隣接する基準セルを次々に連結することによって基準セルをグループ化して、グループ化された基準セルを局所画像として判別する。

　なお、局所画像の抽出方法は、上述した実施形態に限定されるものではなく、様々な方法を用いることができる。例えば、物体の形状を捉えるための局所特徴量を抽出したり、物体のエッジを検出したりすることで、局所画像を抽出してもよい。

（仮想レイヤーファイルの構成）
　図１８は、フレーム画像（プレビュー画像ＰＶ）に対応づけられた仮想レイヤーファイルＶＬＦを示す図である。制御部１７は、それぞれのフレーム画像に対して仮想レイヤーファイルＶＬＦを生成する。仮想レイヤーファイルＶＬＦとは、対応するフレーム画像に関連する情報が記述されたファイルをいう。フレーム画像には、１枚の仮想レイヤーファイルＶＬＦが対応づけられている（Ｔ’同期）。

　仮想レイヤーファイルには、レイヤーファイル番号が付与される。仮想レイヤーファイルには、対応するフレーム画像から抽出された局所画像の領域やその中心位置を示すｘｙ座標、上記の局所画像のフォーカスポイントＦＰのｘｙ座標（ｘ０，ｙ０）が記述される。

　局所画像の領域やその中心位置を示すｘｙ座標は、局所画像の抽出処理の際に、制御部１７によって算出される。フォーカスポイントＦＰは、被写体の撮影時に生成された情報が利用される。

　また、仮想レイヤーファイルＶＬＦには、対応するフレーム画像の画像特徴量（ヒストグラム等）、センサ１４の３軸方向のそれぞれの検出値、対応するフレーム画像との同期時間Ｔ’（対応するフレームとの時間）が記述される。

　さらに、仮想レイヤーファイルには、対応するフレーム画像が撮影された場所を示すＧＰＳ位置情報、フレーム画像に関する撮影情報が記述される。仮想レイヤーファイルには、対応するフレーム画像に同期して、上述した様々な情報が自動的に記述される。ユーザが、仮想レイヤーファイルに手動で上述した情報を書き込んでもよい。

　制御部１７は、必要に応じて仮想レイヤーファイルを連続的に読み込むことで、局所画像の中心位置を認識して、追跡することが可能になる。なお、本実施形態では、フレーム画像に関する情報は、すべて仮想レイヤーファイルに記述されるものとするが、これに限定されるものではない。すなわち、フレーム画像に関する情報のうちの一部は、仮想レイヤーファイルと異なるファイルに記述されたり、通信ネットワーク上のサーバに記述・保存されてもよい。

　図１９は、フレーム画像内の物体を追尾する状況を説明する図である。制御部１７は、物体（局所画像）を追尾する場合、その局所画像に同期した仮想レイヤーファイルのフォーカスポイントを位置情報として利用する。

　最初に、制御部１７は、データ記憶部１３から局所画像を含んだフレーム画像を読み出し、当該フレーム画像に同期する仮想レイヤーファイルも読み出す。制御部１７は、この仮想レイヤーファイルから追尾対象の物体のフォーカスポイント（位置情報）ＦＰである基本座標ＢＣ（ｘ０，ｙ０）を取得する。

　そして、制御部１７は、データ記憶部１３からフレーム画像を読み出す毎に、同期する仮想レイヤーファイルも読み出し、仮想レイヤーファイルからフォーカスポイントを順次読み出すことによって、追尾座標ＴＣ（ｘ０，ｙ＋７），（ｘ＋１，ｙ＋４），（ｘ０，ｙ＋２），（ｘ、０）を取得する。なお、追尾情報は、仮想レイヤーファイルに記述されてもよいし、スマートフォン１内のデータ記憶部１３や外部サーバに保存されてもよい。

（情報の保存・管理）
　制御部１７は、センサ１４の３軸方向のそれぞれの検出値、その変化量、時間変化パターン、角度・傾き方向などの特徴量をデータ記憶部１３に記憶する。また、制御部１７は、すべてのフレーム画像について、ＲＧＢ色ヒストグラム情報、グレースケール変換情報、局所画像に現れた物体の時間ごとの位置情報、局所画像のオブジェクト領域を表わす２次元ｘｙ軸座標、上記の物体に対するフォーカスポイントデータである３次元ｘｙｚ軸座標をデータ記憶部１３に記憶する。さらに、制御部１７は、物体を撮影したときの撮影情報、ＧＰＳ位置情報、局所画像の物体追尾情報等をデータ記憶部１３に記憶する。

　なお、制御部１７は、上述した各種の情報を、仮想レイヤーファイルの内部に格納してもよいが、フレーム画像の内部に格納してもよい。また、制御部１７は、上述した各種情報をスマートフォン１の内部にあるデータ記憶部１３に保存するのではなく、通信ネットワークを介して、外部サーバに保存してもよい。

（局所画像の表示）
　制御部１７は、タッチパネル１５に表示された物体（局所画像）へのタップを検出した場合、当該物体に関連する情報をデータ記憶部１３から読み出し、読み出した情報をタッチパネル１５に表示する。

　なお、データ記憶部１３には、予め、局所画像の高画質データを記憶してもよい。この場合、制御部１７は、タッチパネル１５に表示された局所画像へのタップを検出すると、データ記憶部１３から高画質データを読み出し、タップされた局所画像の高解像度画像（例えば４Ｋ／８Ｋなど）をタッチパネル１５に表示してもよい。

　図２０は、プレビュー画像ＰＶとして高解像度画像が表示された状況を示す図である。プレビュー画像ＰＶが高解像度画像の場合、制御部１７は、プレビュー画像ＰＶを例えば８分割して、分割された高解像度画像毎に、局所画像を抽出することができる。なお、プレビュー画像ＰＶは、８分割される場合に限らず、４分割にされてもよい。

　図２１Ａは、局所画像をタップした状態を示す図である。制御部１７は、タップされた局所画像の拡大画像及び局所画像の類似検索結果をタッチパネル１５に表示する。例えば、タッチパネル１５に表示された人物のサングラスがタップされた場合、制御部１７は、タップされたサングラスの拡大画像をタッチパネル１５に表示する。

　制御部１７は、さらに、外部サーバに対して、タップされたサングラスの類似画像検索を指示する。外部サーバは、データベースの中からそのサングラスに類似する類似画像を検索すると、類似するサングラスの画像や関連情報をスマートフォン１へ送信する。

　図２１Ｂは、サングラスの類似画像検索結果を示す図である。制御部１７は、タッチパネル１５に、サングラスの拡大画像だけでなく、そのサングラスに類似する複数のサングラスの画像や関連情報を表示することができる。ここで、ユーザは、このサングラスに関する情報を入力・編集することができる。

　図２１Ｃは、ユーザ編集画面を示す図である。ユーザは、タッチパネル１５上に表示される編集画面を操作して、サングラスに関する任意の情報を入力することができる。制御部１７は、ユーザによって入力された情報をデータ記憶部１３又は外部サーバに保存して、必要なときに読み出すことができる。

（フレーム画像に同期する情報）
　制御部１７は、フレーム画像から局所画像を抽出するだけでなく、すべてのフレーム画像に対して様々な情報を同期させる。具体的には、制御部１７は、写真撮影による単一のフレーム画像、連続写真撮影による連続フレーム画像、動画撮影又はプレビュー動画の連続フレーム画像のそれぞれに対して、画像特徴量として、フレーム番号及び時間情報を付与する。

　すなわち、すべてのフレーム画像に、フレーム番号及び時間情報が付与される。写真撮影又は動画撮影によって生成されたフレーム画像は、フレーム番号及び時間情報と共に、データ記憶部に記憶される。データ記憶部１３に記憶されたフレーム番号及び時間情報は、フレーム画像の抽出や管理に利用される。

（局所画像と背景画像）
　図２２は、背景画像ＢＩ上に表示された局所画像ＬＩを示す図である。制御部１７は、フレーム画像毎に局所画像ＬＩを抽出した後、局所画像ＬＩと背景画像ＢＩ（局所画像ＬＩ以外のフレーム画像）とを区別して、データ記憶部１３や外部サーバに保存することができる。さらに、制御部１７は、局所画像ＬＩ又は背景画像ＢＩに関する画像情報、局所画像ＬＩの特徴量などを、データ記憶部１３又は外部サーバに保存してもよい。

　また、制御部１７は、動画（連続する複数のフレーム画像）については、動きのある局所画像ＬＩと動きのない背景画像ＢＩとを区別してもよい。再生時には、制御部１７は、例えば特徴量に基づいて局所画像ＬＩ及び背景画像ＢＩをそれぞれデータ記憶部１３等から読み出して、背景画像ＢＩ上に局所画像ＬＩを上書きする。制御部１７は、タッチパネル１５上に、局所画像ＬＩ又はその拡大画像を表示する。

（プレビュー画像表示と局所画像の抽出）
　制御部１７は、タッチパネル１５にプレビュー画像を表示しながら、プレビュー画像のフレーム画像から局所画像を抽出してもよい。また、制御部１７は、プレビュー画像をデータ記憶部１３に一旦保存し、その後、データ記憶部１３からプレビュー画像のフレーム画像を読み出し、フレーム画像から局所画像を抽出してもよい。

（傾きに応じた表示補正）
　制御部１７は、プレビュー画像又は再生画像をタッチパネル１５に表示する場合、スマートフォン１の振動や傾きに応じて、表示画像を調整することができる。具体的には、制御部１７は、センサ１４からの３軸方向のそれぞれの検出値に基づいて、スマートフォン１がどの方向にどの程度傾いているかを判定する。

　そして、制御部１７は、上記の判定結果に基づいて、表示画面が水平になる仮想表示装置をタッチパネル１５内に構成する。これにより、ユーザは、スマートフォン１の振動や傾きに影響されることなく、画像を見ることができる。

（被写体までの距離に応じた縮小画像・拡大画像）
　また、スマートフォン１から被写体までの距離に応じて縮小画像又は拡大画像を表示することも可能である。具体的には、制御部１７は、撮像部１１内の焦点距離ｆ及び絞り値ｘを用いて、スマートフォン１（撮像レンズ）から被写体（図２４ではユーザ自身）までの距離ａを求める。なお、距離ａの演算方法は、特に限定されず、公知の技術を使うことができる。制御部１７は、求めた距離ａに応じて、プレビュー画像、撮影後の画像である再生画像（例えば、静止画像や動画像）をタッチパネル１５に縮小又は拡大表示することができる。

（通信ネットワークの構成例）
　図２３は、スマートフォン１の通信ネットワークを説明する図である。スマートフォン１は、ネットワークＮＷを介して様々な外部サーバに接続されている。外部サーバとしては、例えば、通信事業者サーバ１０１、クラウドサーバ１０２、画像データベースサーバ１０３、事業者用画像データベースサーバ１０４がある。これらのサーバには、スマートフォン１で使用されるデータ、当該データに関する様々なデータが記憶されている。

　図２４は、制御部１７の写真撮影処理ルーチンを示すフローチャートである。制御部１７は、次の写真撮影処理ルーチンに従って、撮像部１１で生成された複数のフレーム画像の中から、静止画として最適なフレーム画像を選択する。なお、以下の各ステップでは、既に説明した処理が行われるため、その詳細は省略する。

　制御部１７は、カメラ機能が起動すると、センサ１４から３軸方向のそれぞれの検出値を受信する（ステップＳ１）。制御部１７は、ユーザの操作によって写真撮影モードに移行して（ステップＳ２）、撮像部１１で生成されたフレーム画像をプレビュー画像としてタッチパネル１５に表示する。

　制御部１７は、センサ１４の３つの検出値を用いて上述した静止状態判定を行って、スマートフォン１が静止したか否かを判定する（ステップＳ３）。制御部１７は、スマートフォン１が静止したと判定されるまでステップＳ３に待機して、スマートフォン１が静止したと判定されると、次のステップＳ４に進む。

　制御部１７は、センサ１４の３つの検出値を用いて上述したジェスチャ検出処理を行う（ステップＳ４）。制御部１７は、ジェスチャを検出するまでステップＳ４に待機して、ジェスチャを検出すると、次のステップＳ５に進む。

　制御部１７は、再びスマートフォン１が静止したか否かを判定する（ステップＳ５）。制御部１７は、スマートフォン１が静止したと判定されると、次のステップＳ６に進む。なお、制御部１７は、スマートフォン１が静止したと判定されるまでステップＳ５に待機するが、ジェスチャ検出時から所定時間（例えば５秒）が経過した場合、自動的に次のステップＳ６へ進む。

　制御部１７は、静止画撮影のために、データ記憶部１３に記憶されている複数のフレーム画像うち、静止期間に対応するフレーム画像の中から、静止画として最適なフレーム画像を選択する（ステップＳ６）。静止画として最適なフレーム画像の選択方法は、上述した通りであり、特に限定されるものではない。制御部１７は、ステップＳ６で選択されたフレーム画像をデータ記憶部１３又は外部サーバへ保存する（ステップＳ７）。

　なお、制御部１７は、図２４ではステップＳ３～Ｓ５のすべてで実行するが、ステップＳ３～Ｓ５をすべて実行する必要はなく、ステップＳ３又はステップＳ５を省略してもよい。例えば、制御部１７は、ステップＳ５を省略して、ジェスチャ検出時より前の静止期間にある複数のフレーム画像の中から、静止画を選択してもよい。また、制御部１７は、ステップＳ３を省略して、ジェスチャ検出時より後の静止期間にある複数のフレーム画像の中から、静止画を選択してもよい。

　図２５は、局所画像抽出ルーチンを示すフローチャートである。制御部１７は、次の局所画像抽出ルーチンに従って、フレーム画像から局所画像を抽出する。以下の各ステップでは、既に説明した処理が行われるため、その詳細は省略する。

　制御部１７は、カメラ機能が起動すると、センサ１４から３軸方向のそれぞれの検出値を受信する（ステップＳ１１）。制御部１７は、ユーザの操作によってライブ動画モードに移行して（ステップＳ１２）、撮像部１１で生成されたフレーム画像をプレビュー画像としてタッチパネル１５に表示する（ステップＳ１３）。なお、タッチパネル１５に表示される画像は、ライブ動画モードのプレビュー画像に限らず、データ記憶部１３から読み出されるフレーム画像であってもよい。

　制御部１７は、表示画像のフレーム画像から画像特徴量を抽出して（ステップＳ１４）、さらにフレーム画像から局所画像を抽出する（ステップＳ１５）。制御部１７は、局所画像を含むフレーム画像にＴ’同期する仮想レイヤーファイルを作成して、様々な情報を仮想レイヤーファイルに記述する（ステップＳ１６）。

　例えば、制御部１７は、局所画像を構成するピクセルの中心位置にｘｙ座標を設定し、局所画像にフォーカスポイントのｘｙ座標を設定して、これらの設定情報を仮想レイヤーファイルに記述する。さらに、制御部１７は、仮想レイヤーファイルのフォーカスポイントを位置情報として利用して、局所画像を追尾する（ステップＳ１７）。そして、制御部１７は、上述した処理をフレームレート毎に管理して保存する（ステップＳ１８）。

　図２６は、局所画像の類似検索ルーチンを示すフローチャートである。制御部１７は、次の局所画像の類似検索ルーチンに従って、局所画像に関する情報を検索して、タッチパネル１５に表示する。以下の各ステップでは、既に説明した処理が行われるため、その詳細は省略する。

　制御部１７は、タッチパネル１５に画像を表示する（ステップＳ２１）。タッチパネル１５に表示される画像は、プレビュー画像でもよいし、データ記憶部１３から読み出されたフレーム画像でもよい。

　制御部１７は、タッチパネル１５に表示されるすべての画像の局所画像について、例えば図２３に示す画像データベースに対して、類似検索を指示する（ステップＳ２２）。このとき、画像データベースは、局所画像に類似する画像や局所画像に関連する情報を検索して、検索によって求められた画像や情報をスマートフォン１へ送信する。

　スマートフォン１の制御部１７は、検索によって求められた画像や情報を受信すると、それらの画像や情報をタッチパネル１５に表示する。これにより、制御部１７は、フレーム画像の局所画像（物体）に類似する画像を高速で検索することができる。

　制御部１７は、タッチパネル１５に表示される局所画像へのタップを検出したか否かを判定する（ステップＳ２３）。制御部１７は、タップが検出されるまではステップＳ２３で待機して、タップが検出されると次のステップＳ２４へ進む。

　制御部１７は、タップされた局所画像について、画像データベースから受信した情報を動的にタッチパネル１５に表示する（ステップＳ２４）。例えば、局所画像がサングラスを示す場合、そのサングラスに類似するサングラスがタッチパネル１５に表示される。このとき、ユーザは、画像情報を仮想レイヤーファイルに手動で記述できる。制御部１７は、この仮想レイヤーファイルをデータ記憶部１３や外部サーバ等に保存する（ステップＳ２５）。

（その他の情報利用例）
　制御部１７は、局所画像（物体）のオブジェクト領域の位置情報としてフォーカスポイントを利用することによって、フレーム画像から物体だけでなく位置情報を取得して、物体及び位置情報をタッチパネル１５に表示することができる。さらに、タッチパネル１５に表示される再生動画又はライブ動画像（すべてのフレーム画像）から、特定の物体等を追尾することができる。

　なお、制御部１７は、センサ１４の３軸方向の３つの検出値、各検出値の時間変化量、時間変化パターン、角度・傾き方向などの特徴量、全てのフレーム画像のＲＧＢ色ヒストグラム情報又はグレースケール変換情報、局所画像（物体）の時間軸における位置情報をデータ記憶部１３に記憶することができる。

　さらに、制御部１７は、局所画像のオブジェクト領域を表わす２次元ｘｙ座標、３次元ｘｙｚ軸座標のフォーカスポイントデータ、撮影情報、ＧＰＳ位置情報、局所画像の物体追尾情報などのデータセット等をデータ記憶部１３に記憶することができる。

　制御部１７は、上述したデータをメモリ配列にキャッシュしたり、画像ファイル内部やオーバーレイした仮想レイヤーファイル内に保存したり、図２７に示す外部サーバに保存してもよい。そして、制御部１７は、上述のように保存された各種のデータを必要に応じて読み込み、所定の演算処理を行って、画像やその他の方法をタッチパネル１５に表示することも可能である。

　以上詳細に説明したように、本実施形態に係るスマートフォン１は、被写体を撮影する撮像部１１、３軸方向に関する位置又は位置に関連する量を検出するセンサ１４、及びセンサ１４から出力される３つの検出値のうちの少なくとも１つを用いて、撮像部１１の動作や再生機能を制御する制御部１７を備える。これにより、スマートフォン１は、ユーザがスマートフォンにジェスチャ操作をすることにより、撮像部１１の動作や再生機能を制御することが可能となる。

　本発明は、上述した実施形態に限定されるものではなく、請求の範囲に記載された事項の範囲内で設計変更されたものにも適用可能である。本発明は、スマートフォン１以外にも適用可能であり、例えば、電話機能のない携帯端末にも適用可能である。

　上述した実施形態では、センサ１４は加速度センサであるが、センサ１４は角速度センサ（ジャイロセンサ）であってもよい。
　図２７は、スマートフォン１にタップ操作が行われた場合の３軸方向のそれぞれの角速度の変化を示す図である。図２８は、スマートフォン１にフリップ操作が行われた場合の３軸方向のそれぞれの角速度の変化を示す図である。スマートフォン１が静止状態の場合にタップ操作又はフリップ操作が行われると、３軸方向のそれぞれの角速度は、加速度の場合と同様の２つの特徴を有する。

　図２９は、角速度を用いた静止状態の判定において設定される静止開始点及び静止終了点を示す図である。この場合、制御部１７は、例えば上述した式（１）を用いて、静止開始点ＳＴ及び静止終了点ＥＤを設定することができる。なお、式（１）のαは、センサ１４としてジャイロセンサを用いた場合に最適な値にする。

１　スマートフォン
１１　撮像部
１２　画像処理部
１３　データ記憶部
１４　センサ
１５　タッチパネル
１６　通信部
１７　制御部

Claims

　携帯端末へジェスチャが行われたタイミングを示すトリガー信号を発生するトリガー信号発生装置であって、
　前記携帯端末を原点とする座標系の３軸方向のそれぞれの動き情報を検出する動き情報検出部と、
　前記動き情報検出部により検出された３つの動き情報のうちの１つの正負符号が、残りの２つの正負符号と異なるようになったタイミングで、前記トリガー信号を発生するトリガー信号発生部と、
　を備えたトリガー信号発生装置。
　前記トリガー信号発生部は、前記動き情報検出部により検出された３つの動き情報のうちの少なくとも１つが閾値を超え、かつ、前記３つの動き情報のうちの１つの正負符号が、残りの２つの正負符号と異なるようになったタイミングで、前記トリガー信号を発生する
　請求項１に記載のトリガー信号発生装置。
　前記トリガー信号発生部は、前記動き情報検出部により検出された３つの動き情報のそれぞれの時間当たりの変化量の絶対値の少なくとも１つが閾値を超え、かつ、前記３つの動き情報のうちの１つの正負符号が、残りの２つの正負符号と異なるようになったタイミングで、前記トリガー信号を発生する
　請求項１に記載のトリガー信号発生装置。
　前記動き情報検出部は、前記動き情報として、速度、加速度、角速度、角加速度、地磁気のいずれか１つを検出する
　請求項１に記載のトリガー信号発生装置。
　前記動き情報検出部によって検出された動き情報の向きと、前記トリガー信号発生部により所定時間内に発生されたトリガー信号の回数と、に基づいて、前記携帯端末の機能を制御する機能制御部を更に備えた
　請求項１に記載のトリガー信号発生装置。
　被写体を撮像してフレーム画像を生成する撮像部と、
　前記撮像部により生成されたフレーム画像を順次記憶する画像記憶部と、
　前記動き情報検出部により検出された３つの動き情報に基づいて、前記携帯端末が静止状態になった静止期間を検出する静止期間検出部と、
　座標系の３軸方向のそれぞれの動き情報を検出する動き情報検出部と、
　前記動き情報検出部により検出された３つの動き情報のうちの１つの正負符号が、残りの２つの正負符号と異なるようになったタイミングで、ジェスチャが行われたタイミングを示すトリガー信号を発生するトリガー信号発生部と、
　前記画像記憶部に記憶された複数のフレーム画像の中から、前記トリガー信号の発生タイミングの前又は後に前記静止期間検出部によって検出された前記静止期間に対応するフレーム画像を、静止画として選択する静止画選択部と、
　を備えた携帯端末。
　前記静止画選択部は、前記トリガー信号の発生タイミングから前又は後の前記静止期間のうち、前記トリガー信号の発生タイミングから所定時間離れた前記静止期間を除外して、残りの前記静止期間に対応するフレーム画像を、静止画として選択する
　請求項６に記載の携帯端末。
　前記撮像部により生成されたフレーム画像と、３次元形状の表示物と、を表示する表示部と、
　前記動き情報検出部により検出された３軸方向のそれぞれの動き情報に応じて、前記表示部に表示された表示物を動かす制御を行う表示物制御部と、
　を更に備えた請求項６に記載の携帯端末。
　前記画像選択部により静止画として選択されたフレーム画像を記憶する静止画記憶部と、
　前記静止画記憶部に記憶されたフレーム画像から、前記被写体に相当する局所画像を抽出する局所画像抽出部と、
　前記局所画像抽出部により抽出された局所画像に関連する情報について、外部サーバに検索要求する検索要求部と、
　前記外部サーバから返信された検索結果を表示する検索結果表示部と、を更に備えた
　請求項６に記載の携帯端末。
　前記検索結果表示部は、前記局所画像に関連する情報として、前記局所画像に類似する類似画像を表示する
　請求項９に記載の携帯端末。
　前記撮像部がフォーカス機能を用いて被写体を撮像したときのフォーカスポイント情報を前記局所画像の位置情報として記述された仮想レイヤーファイルを、フレーム画像毎に作成するファイル作成部と、
　前記ファイル作成部によって作成された仮想レイヤーファイルの位置情報に基づいて、前記局所画像を追跡する局所画像追跡部と、
　を更に備えた請求項９に記載の携帯端末。
　被写体を撮像してフレーム画像を生成する撮像部と、
　前記撮像部により生成されたフレーム画像を順次記憶する画像記憶部と、
　座標系の３軸方向のそれぞれの動き情報を検出する動き情報検出部と、
　前記動き情報検出部により検出された３つの動き情報の少なくとも１つに基づいて、静止状態になったタイミングを基準にして所定時間経過したタイミングで、前記静止状態のジェスチャが行われたタイミングを示すトリガー信号を発生するトリガー信号発生部と、
　前記画像記憶部に記憶された複数のフレーム画像の中から、前記トリガー信号の発生タイミングに対応するフレーム画像を、静止画として選択する静止画選択部と、
　を備えた携帯端末。