JP2016506688A - シングルクリックに基づく映像クリップの始点および終点の判定方法 - Google Patents
シングルクリックに基づく映像クリップの始点および終点の判定方法 Download PDFInfo
- Publication number
- JP2016506688A JP2016506688A JP2015551253A JP2015551253A JP2016506688A JP 2016506688 A JP2016506688 A JP 2016506688A JP 2015551253 A JP2015551253 A JP 2015551253A JP 2015551253 A JP2015551253 A JP 2015551253A JP 2016506688 A JP2016506688 A JP 2016506688A
- Authority
- JP
- Japan
- Prior art keywords
- multimedia file
- multimedia
- decision function
- moment
- data
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/01—Input arrangements or combined input and output arrangements for interaction between user and computer
- G06F3/048—Interaction techniques based on graphical user interfaces [GUI]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/40—Information retrieval; Database structures therefor; File system structures therefor of multimedia data, e.g. slideshows comprising image and additional audio data
- G06F16/44—Browsing; Visualisation therefor
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- General Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Multimedia (AREA)
- Data Mining & Analysis (AREA)
- Databases & Information Systems (AREA)
- Human Computer Interaction (AREA)
- Television Signal Processing For Recording (AREA)
- Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)
Abstract
シングル「クリック」で映像クリップを取り込む方法を提供する。本方法は、マルチメディアファイルを取り込むステップと;前記取込みに関する運動学的データを取得するステップと;ユーザの行動によって、前記マルチメディアファイル上のタイムスタンプであるスナップショットモーメントを表示するステップと;決定関数を適用するステップであって、決定関数は、取り込まれたマルチメディアファイル、スナップショットモーメント、および運動学的データのうちの少なくとも1つを入力データとして受信し、スナップショットモーメントに先行するマルチメディアファイル上のタイムスタンプである始点、および、スナップショットモーメントの後続のタイムスタンプである終点を出力データとして出力する、ステップと、を含む。
Description
本発明は、概して、画像および映像の処理に関し、特に、画像および映像の処理において、画像および映像の外部データを用いる、画像および映像の処理に関する。
スマートフォンを使用した映像取込み(video capturing)が広く普及するにつれ、映像品質と取込み工程の総合的なユーザエクスペリエンスとを共に改良し、かつ、向上させるますます多くの方法が開発されている。現在のスマートフォンでは、通常、静止画像取込みおよび映像取込みが可能であり、ユーザが2つの異なるモードを選択可能である。
本明細書において、本発明の一態様に係る、シングル「クリック」で映像クリップを取り込む方法を説明する。本方法は、
マルチメディアファイルを取り込むステップと;
前記取込みに関連した運動学的データを取得するステップと;
ユーザの行動に反応するマルチメディアファイル上のタイムスタンプであるスナップショットモーメントを表示するステップと;
決定関数を適用するステップであって、前記決定関数は、前記取り込まれたマルチメディアファイル、前記スナップショットモーメント、および前記運動学的データのうちの少なくとも1つを入力データとして受信し、前記スナップショットモーメントに先行する前記マルチメディアファイル上のタイムスタンプである始点、および、前記スナップショットモーメントの後続のタイプスタンプである終点を出力データとして出力するステップと、を含む。
マルチメディアファイルを取り込むステップと;
前記取込みに関連した運動学的データを取得するステップと;
ユーザの行動に反応するマルチメディアファイル上のタイムスタンプであるスナップショットモーメントを表示するステップと;
決定関数を適用するステップであって、前記決定関数は、前記取り込まれたマルチメディアファイル、前記スナップショットモーメント、および前記運動学的データのうちの少なくとも1つを入力データとして受信し、前記スナップショットモーメントに先行する前記マルチメディアファイル上のタイムスタンプである始点、および、前記スナップショットモーメントの後続のタイプスタンプである終点を出力データとして出力するステップと、を含む。
本明細書において、本発明の他の態様に係る、シングル「クリック」で映像クリップを取り込むためのシステムを説明する。本システムは、
マルチメディアファイルを取り込むように構成された取込み装置と;
前記取込みに関連した運動学的データを抽出するように構成された前記取込み装置に物理的に結合した運動センサと;
コンピュータプロセッサであって、
ユーザの行動に反応する前記マルチメディアファイル上のタイムスタンプであるスナップショットモーメントを表示するように構成され、かつ、
取り込んだ前記マルチメディアファイル、前記スナップショットモーメント、および前記運動学的データのうちの少なくとも1つを入力データとして受信し、前記スナップショットモーメントに先行する前記マルチメディアファイル上のタイムスタンプである始点、および、前記スナップショットモーメントの後続のタイムスタンプである終点を出力データとして出力する決定関数を適用するように構成された、コンピュータプロセッサと、を含む。
マルチメディアファイルを取り込むように構成された取込み装置と;
前記取込みに関連した運動学的データを抽出するように構成された前記取込み装置に物理的に結合した運動センサと;
コンピュータプロセッサであって、
ユーザの行動に反応する前記マルチメディアファイル上のタイムスタンプであるスナップショットモーメントを表示するように構成され、かつ、
取り込んだ前記マルチメディアファイル、前記スナップショットモーメント、および前記運動学的データのうちの少なくとも1つを入力データとして受信し、前記スナップショットモーメントに先行する前記マルチメディアファイル上のタイムスタンプである始点、および、前記スナップショットモーメントの後続のタイムスタンプである終点を出力データとして出力する決定関数を適用するように構成された、コンピュータプロセッサと、を含む。
本発明の追加的および/または他の態様および/または利点を以下の詳細な説明に記載する。
本明細書の結論部において、本発明の主題を具体的に提示し、かつ、明確に特許請求する。しかしながら、本発明の操作体系と操作方法との両方は、本発明の目的、特徴、および利点と共に、以下の詳細な説明を添付の図面と共に参照することにより、最もよく理解され得る。
図の簡潔さと明確性のために、図中に示す要素は、必ずしも一定の縮尺で描かれていないことが理解されるであろう。例えば、いくつかの要素の寸法は、明確性のために他の要素と比べて誇張してあってもよい。また、適切と考えられる場合は、対応要素または類似要素を示すために、複数の図中で同じ参照符号が付されていてもよい。
以下の詳細な説明では、本発明を完全に理解できるように多くの具体的詳細について述べる。しかしながら、本発明がかかる具体的詳細なしで実施され得ることが当業者にはわかるであろう。また、周知の方法、工程、および構成要素は、本発明があいまいにならないように詳細には記載していない。
本発明の実施形態によって、ユーザは、通常の方法で静止画像を取り込みながら映像クリップを創作することができる。本発明の実施形態によって、映像クリップを創作することができる一方で、取り込まれた静止画像は、標準的な静止画像として記憶されても、見られてもよい。取込みエクスペリエンスは、画像取込み(すなわち、通常の静止画像取込みエクスペリエンス)と同じであり得る。したがって、本発明の実施形態によって、非常に素早くかつ/または便利に映像クリップを創作することができる。
本発明の複数の実施形態は、画像取込み工程中に記録されたデータに基づき、静止画像を撮像しながら映像クリップを取り込む方法を提供する。一般的に、本発明の実施形態は、カメラを含み、かつ、任意で追加のセンサおよび/または検出能力を含み得る携帯機器(例えば、携帯電話、カメラ付携帯電話、タブレットコンピュータ)に適用可能である。しかしながら、本発明は、特定の種類の機器に限定されない。用語「動画」および「映像」は、本明細書中で相互に交換可能に使用され得、それらの意味は、外見上動く像または当分野で共通の任意の他の意味であり得る。また、用語「写真」、「画像」、および「フォト」は、本明細書中で相互に交換可能に使用され得る。
図1は、本発明のいくつかの実施形態に係るシステム100を図示するブロック図である。システム100は、マルチメディアファイル112を取り込むように構成された取込み装置100、運動センサ120、コンピュータプロセッサ130、およびユーザインタフェース180等を含む。運動センサ120は、取込み装置110に物理的に結合され得、かつ/または取込みに関連した運動学的データ122を取得するように構成され得る。コンピュータプロセッサ130は、ユーザの行動に反応するマルチメディアファイル112上のタイムスタンプであるスナップショットモーメント140を表示するように構成され得、ユーザの行動は、ユーザインタフェース180等を介してなされ得る。また、コンピュータプロセッサ130は、決定関数150を適用するように構成され得、決定関数150は、マルチメディアファイル112、スナップショットモーメント140、運動学的データ122のうちの少なくとも1つを入力データとして受信し得、かつ/または、スナップショットモーメント140に先行するマルチメディアファイル112上のタイムスタンプである始点162、および/または、スナップショットモーメント140の後続のタイムスタンプである終点164を出力し得る。
本発明のいくつかの実施形態によれば、コンピュータプロセッサ130によって実行され得る決定関数150と機能的に関連するコンピュータプロセッサ130は、マルチメディアクリップ170を生成し得る。マルチメディアクリップ170は、スナップショットモーメント140を含んでもよく、かつ、取り込まれたマルチメディアファイル112に含まれる記録されたマルチメディアセグメント170Aの下位集合であり得る。この場合、マルチメディアクリップ170は、始点162で開始してもよく、かつ/または、決定関数150によって出力された終点164で終了してもよい。
本発明のいくつかの実施形態によれば、マルチメディアファイル112は、映像シーケンスを含んでもよく、この場合、スナップショットモーメント140は、単一の静止画像と関連し得る。さらに、マルチメディアファイル112はまた、オーディオシーケンスを含んでもよく、この場合、スナップショットモーメント140は、オーディオクリップ中の単一のモーメントと関連し得る。
本発明のいくつかの実施形態によれば、マルチメディアファイル112は、映像シーケンスとオーディオシーケンスとを共に含んでもよく、この場合、映像シーケンスおよびオーディオシーケンスは、それぞれ、各々の始点および/もしくは終点、ならびに/または共通のスナップショットモーメントと関連し得る。より具体的には、オーディオシーケンスの始点および終点は、映像シーケンスの始点および終点と異なり得る。
本発明のいくつかの実施形態によれば、決定関数150は、ユーザに関するメタデータおよび取込みのコンテクストに関するメタデータのうちの少なくとも1つを入力データとしてさらに受信し得る。より具体的には、決定関数150は、始点および終点の判定に際して考慮され得る、画像処理アルゴリズムおよびオーディオ処理アルゴリズムのうちの少なくとも1つをさらに適用してもよい。
決定関数の適用は、例えば、より良い結果が得られるように、マルチメディアファイルの取込み終了後、オフラインで行なわれ得ることに留意されたい。しかしながら、決定関数は、リアルタイムでも適用され得る。
決定関数150は、特定の定性的測定基準の所定のレベル未満であるマルチメディアファイル112の一部分をフィルタリングし得る。一実施形態では、運動学的データは、取込み装置の空間的経路に変換されて決定関数に送られ得る。一実施形態では、決定関数が、運動学的データと所定の閾値の全項目とを比較してもよい。一実施形態では、マルチメディアファイルがオーディオシーケンスを含む場合、決定関数は、音声認識アルゴリズム、衝撃音信号アルゴリズムの多角的検出、ピーク音量検出、および/またはピッチ検出のうちの少なくとも1種類のオーディオ信号処理を適用し得る。したがって、共通のマルチメディアファイルに由来する、オーディオクリップおよび映像クリップの始点および終点は異なり得る。
他の実施形態では、スナップショットモーメントを表示することを複数回繰り返して、例えば、複数のスナップショットモーメントを出力してもよく、かつ/または、この場合、ユーザの行動は、マルチメディア全体の取込み後に開始される。
いくつかの実施形態によれば、コンピュータプロセッサ130はさらに、マルチメディアクリップに、静止画像に由来するデータを表示するタグを付けるように構成される。また、コンピュータプロセッサ130はさらに、このタグに基づき、生成されたマルチメディアクリップを含む複数のマルチメディアクリップのシーケンスに所定の操作を適用するように構成される。代替的に、分析およびデータ処理等のいくつかのタグ付け関連処理がシステム100に遠隔接続されたサーバ上で行なわれ得る。より具体的には、コンピュータプロセッサ130はさらに、タグに基づき、マルチメディアクリップの検索操作を適用するように構成され得る。
図2は、本発明のいくつかの実施形態に係る方法を示す高レベルのフローチャートである。方法200は、マルチメディアファイル210を取り込むステップで開始される。次いで、本方法は、取込みに関連した運動学的データを取得するステップ220に進む。次いで、本方法は、マルチメディアファイル上のタイムスタンプであるスナップショットモーメントをユーザの行動によって表示するステップ230に進む。次いで、本方法は、取り込んだマルチメディアファイル、スナップショットモーメント、および運動学的データのうちの少なくとも1つを入力データとして受信し、スナップショットモーメントに先行するマルチメディアファイル上のタイムスタンプである始点、およびスナップショットモーメントの後続のタイムスタンプである終点を出力データとして出力する決定関数を適用するステップ240に進む。
次いで、図3を参照する。図3は、本発明の実施形態に係る静止画像取込み工程に基づく他の例示的な映像作製システム300の模式図である。なお、本明細書中での「映像」という言及が「オーディオ」を含むべきであり、また、映像シーケンス生成工程が映像シーケンス生成に付随するオーディオシーケンス生成を含むことに留意されたい。
システム300は、携帯電話、スマートフォン、カメラ付き携帯電話、タブレットコンピュータ、または任意の他の適切な装置等に相当し得る装置310を含み得る。装置310は、プロセッサ312、メモリ314、カメラ316、ユーザインタフェース318、オーディオ記録装置(図示せず)、および、3軸ジャイロスコープならびに/または加速度計等の加速度センサ(図示せず)を含み得る。また、システム300は、例えば、無線接続および/またはセルラー接続を通して装置10とインターネット通信し得るアプリケーションサーバ350を含み得る。
装置310は、本発明の実施形態に係る静止画像取込み工程に基づく映像作製を可能にし得るコードおよび/またはオブジェクト等のソフトウェアアイテムをアプリケーションサーバ350から受信してもよい。例えば、かかるソフトウェアアイテムは、自動的にまたはユーザインタフェース318を介して入力されたユーザコマンドに従ってダウンロードされ得、かつ、メモリ314内に記憶され得る。例えば、かかるソフトウェアアイテムは、本発明の実施形態に係る静止画像取込みデータに基づく映像作製工程前、および/またはその間に、ダウンロードされ得、かつ、メモリ314に記憶され得る。メモリ314は、アプリケーションサーバ350からダウンロードされたソフトウェアアイテム等のコンピュータが実行可能な命令等の命令を符号化するか、含むか、または、記憶するメモリカード、ディスクドライブ、またはUSBフラッシュメモリ等の、コンピュータまたはプロセッサが読取り可能な非一時的記憶媒体等の物品を含み得る。メモリ314に記憶されかつ/または含まれた命令は、プロセッサ312等のプロセッサまたは制御装置によって実行されるとき、このプロセッサまたは制御装置に本明細書に記載の方法を実行させ得る。
本発明の特定の実施形態では、本発明の実施形態によって必要となるいくつかの処理が、アプリケーションサーバ350において実行され得る。例えば、本発明の実施形態に係る方法の実行中に、データ、情報、要求、および/またはコマンドを装置310から受信し、データを処理し、かつ、処理したデータおよび/または要求された任意のデータを装置310に返信する。
カメラ316は、任意の適切な種類の光センサ、および、例えば、1つ以上のレンズを含み得る光学系を含み得る。ユーザインタフェース318は、ユーザが装置310(すわなち、制御装置310)にコマンドを入力し、装置310等からデータを受信しかつ/または閲覧することを可能にし得るソフトウェアおよびまたはハードウェア(例えば、画面、タッチスクリーン、キーボード、ボタン、オーディオ入力装置、オーディオ記録ソフトウェア、オーディオ記録ハードウェア、音声認識ソフトウェア、音声認識ハードウェア、装置310を介した音声的/視覚的示度表示、ならびに/または他の適切なユーザインタフェースソフトウェアおよび/または他の適切なユーザインタフェースハードウェア)を含み得る。
ユーザインタフェース318を介して、ユーザは、例えば、カメラ316によって写真を撮影してもよくかつ/またはカメラ316を制御してもよい。カメラ316によって撮影された写真は、付随するデータと共に、メモリ314に記憶され得る。本発明の実施形態によれば、カメラ316による写真撮影は、撮影された写真それぞれに関連したマルチメディアファイル(例えば、映像および/またはオーディオファイル)の作製を伴い得る。例えば、本発明の実施形態に係るマルチメディアファイルには、撮影された写真のマルチメディアデータと共に、実際の写真の取込みモーメントの間、その前、および/またはその後に記録された映像データおよび/またはオーディオデータ等の追加データが含まれ得る。マルチメディアファイルに含まれるデータは、取込みモーメント前に開始され、かつ、取込みモーメント後に終了する時間内で記録され得、この時間は、取込み工程時間としてみなされ得る。例えば、取込み工程時間は、カメラ316を起動し、写真撮影の準備が整ったときに、開始され得る。例えば、新たな写真撮影のためにカメラの準備が整ったとき(例えば、写真撮影後2秒〜3秒以内)、または、カメラの画面の動作停止時(例えば、カメラのログアウト時、カメラの電源を切るとき、または装置310のシャットダウン時等)に、取込み工程時間は、終了し得る。したがって、マルチメディアファイルは、実際の取込みモーメントの間、その前、および/またはその後に記録された画像データを含み得る。また、データファイルは、実際の取込みモーメントの間、その前、および/またはその後にオーディオ記録装置によって記録されたオーディオデータ等を含み得る。さらに、取込み工程ファイルは、実際の取込みモーメントの間、その前、および/またはその後の装置の位置、場所、加速度、および/または速度についての、加速度センサ等によって収集され得る情報を含み得る。したがって、取込みモーメントのそれぞれについて、対応する映像クリップまたはオーディオクリップの始点および終点を判定することが、本発明の一態様である。
取込みモーメントは、ユーザコマンドに従って写真が撮影される瞬間であり得る。通常、取込みモーメントは、ユーザが写真撮影のためにカメラのボタンに触れるかまたはこれを押下した後の短い時間(必ずではないが通常、装置にとって典型的であり得、かつ/または、画像化される環境の照明、動き、および/または装置の不安定さ等に依存し得る一定のシャッターラグ時間の後の短い時間)生じている。
次いで、図4を参照する。図4は、カメラ316等の本発明の実施形態に係るカメラによって取り込まれた画像データの例示的なタイムライン400の模式図である。簡潔さのために、オーディオファイルは図4では省略してあるが、オーディオファイルの場合にも映像ファイル生成の場合と同様の機構が提供され得、その結果、取込みモーメントおよびさまざまな他のコンテクストに関連したデータに基づき判定された始点および終点をそれぞれが有する、順序付けられた複数のオーディオファイルの集合も提供され得ることがわかる。
一例として、また、限定することなく、映像クリップのみに関し、ユーザは、図4中のT軸によって示されている時間に沿っていくつかの画像I1、I2、I3、およびI4等を取り込んでもよい。図4は、4つの画像I1、I2、I3、およびI4を示しているが、かかる点で本発明は限定されず、本発明の実施形態によって任意の他の数の画像を使用することができる。本発明の実施形態によれば、上述のとおり、撮影された写真I1、I2、I3、およびI4等は、当該写真それぞれの実際の取込みモーメントt01、t02、t03、およびt04の間、その前、および/またはその後に記録されたマルチメディアと共に、画像データとして記憶され得る。上述のとおり、プロセッサ312は、取込み工程データを記録してもよく、取込み工程データは、取込み工程時間中に記録されたデータを含み得る。上述のとおり、取込み工程データは、取込み工程時間中に記録され得る、装置の位置、方向、加速度、測度についてのデータ、および/または任意の他のマルチメディアデータを追加的に含んでもよい。したがって、マルチメディアデータは、取込みモーメント前に開始され、かつ、取込みモーメント後に終了する時間内に記録され得、この時間は、図4において、それぞれ、CT1、CT2、CT3、またはCT4として示されている取込み工程時間としてみなされ得る。上述のとおり、取込み工程時間CT1、CT2、CT3、またはCT4は、カメラ316を起動し、写真撮影の準備が整ったときに、開始され得る。例えば、新たな写真撮影のためにカメラの準備が整ったとき(例えば、写真撮影後2秒〜3秒以内)、または、例えば、カメラの動作停止時(例えば、カメラのログアウト時、カメラの電源を切るとき、または装置310の画面のシャットダウン時)に、取込み工程時間CT1、CT2、CT3、またはCT4は、終了し得る。したがって、マルチメディアファイルは、取り込まれた画像データ、オーディオデータ、および取込み工程メタデータ等を含んでもよい。取り込んだ画像データファイルは、取り込んだ画像のマルチメディアデータを含んでもよい。映像データファイルは、実際の取込みモーメントt01、t02、t03、またはt04の間、その前、および/またはその後に取り込まれた画像データを含んでもよい。取込み工程データファイルは、実際の取込みモーメントの間、その前、およびその後(例えば、取込み工程時間中)の装置の位置、場所、方向、加速度(空間的加速度および/もしくは角加速度)、ならびに/または速度(空間的速度および/もしくは角速度)についての情報等の取込み工程データを含んでもよい。
本発明の実施形態によれば、プロセッサ312および/またはアプリケーションサーバ350は、I1、I2、I3、またはI4等の最初に取り込んだ画像に関連したマルチメディアファイルを受信してもよく、かつ、取込み工程時間中に記録されたマルチメディアデータの一部分を選択することによって映像セグメントを作製してもよい。本発明の実施形態によれば、プロセッサ312は、取り込まれた静止画像に関連し得、かつ、見るのに相対的にスムーズかつ簡便であり得るデータを含むマルチメディアセグメントを取得するために、マルチメディアデータの一部分を選択してもよい。かかる一部分の選択は、画像を取り込む際のユーザの意図に一致し得る画像データの一部分を特定するために決定され得る予め設定したデータおよび/または基準に基づき得る。例えば、プロセッサ312は、予め設定した基準に基づき、最初に取り込まれた写真に関して相対的に整合性があり得かつ連続的であり得る画像データの一部分を特定してもよい。プロセッサ312によって実行されるものとして本明細書に記載された、一部のまたはすべての操作は、代替的にまたは追加的に、アプリケーションサーバ350によって実行され得る。
次いで、図5を参照する。図5は、本発明の実施形態に係るタイムライン500として示される、取込み工程時間CT中に取り込まれた画像データの一部分ΔTMの選択の模式図である。同様に、簡潔さのため、オーディオファイルは、図5では示されず、また、オーディオファイルは、基本的には映像クリップと同様に取り扱われる。映像シーケンスの生成は、組み合せた映像クリップとオーディオクリップとの両方を伴い、一緒に取り込まれた映像クリップとオーディオクリップとの重ね合せが必須ではないため、各オーディオファイルは、個別に記憶される。
図5のT軸は、時間を表す。プロセッサ312は、取込み工程時間CT中に(すなわち、取込みモーメントt0時点で)記録されたマルチメディアデータの一部分ΔTMを選択し得る。部分ΔTMは、取込みモーメントt0それ自体、取込みモーメントt0前の時間である時間tpre、および/または取込みモーメントt0後の時間である時間tpostを含み得る。
上述のとおり、部分ΔTMの選択は、画像を取り込む際のユーザの意図に一致し得る画像データの一部分を特定するために決定され得る予め設定されたデータおよび/または基準に基づき得る。例えば、プロセッサ312は、予め設定された基準に基づき、最初に取り込まれた写真に関して相対的に整合性があり得かつ連続的であり得る画像データの一部分を特定し得る。プロセッサ312は、取込み工程データの予め設定したデータを分析し得る。本発明のいくつかの実施形態では、プロセッサ312は、取込み工程時間中に記録され、かつ、メタデータファイルに含められた、装置の位置、方向、加速度、速度についてのデータ等に基づき、取込み工程時間中の装置の動きを分析し得る。プロセッサ312は、メタデータを分析してもよく、また、例えば、装置の動きが相対的にスムーズおよび/または単調な(例えば、速度および/または方向の変化量の予め設定した閾値等に照らして、速度および/または方向の急激な変化がない)取込み工程時間の一部分を認識し得る。また、プロセッサ312は、空間における装置の経路を特定し得る。空間における装置の経路は、「ユーザの腰の高さよりも全体的に高い経路」等の予め定義した制約に相関的であり得る。
経路は、例えば、取込み工程時間中に記録され、取込み工程データファイルに含められた装置の位置および方向についてのデータに基づき引き出され得る。プロセッサ312は、記録されかつ特定された経路を分析してもよく、また、例えば、経路が相対的に連続的でありかつ/またはなだらかな場合の取込み工程時間の一部分を判定してもよい。相対的ななだらかさおよび/または連続性は、方向および/または位置等の変化量の予め設定した閾値に応じて認識され得る。また、プロセッサ312は、取込みモーメント時点で、その前に、および/またはその後に記録された画像データを分析してもよく、撮像された場面における相対的に急激な変化等の画像データにおける変移モーメント(transition moment)を認識してもよい。撮像された場面における相対的に急激な変化は、例えば、映像データクリップにおける変化量の予め設定された閾値に応じて、認識され得る。
記録されたデータの分析に基づき、プロセッサ312は、予め設定した基準等に基づき、記録されたマルチメディアデータの一部分を選択し得る。例えば、選択された部分が最初に取り込まれた写真を含むことが予め設定され得る。画像データの部分であって、その大部分が写真撮影時のユーザの意図に沿い得るものを選択するために、他の適切な分析および基準が本方法中に含まれ得る。選択された部分は、最初に撮影された写真に関連し得る映像セグメントを構成し得る。したがって、本発明の実施形態に基づき選択された複数の映像セグメントは、それぞれ、対応する最初に取りこまれた画像のマルチメディアデータに関連付けて、メモリ314等に記憶され得る。取込みセッションが終了し、取込みモーメントに基づく映像クリップおよびオーディオクリップの最適な生成に達するための時間およびメタデータが十分であるときに、上記分析および生成は、好ましくはオフラインで実行可能であることに留意されたい。
代替的に、本発明のいくつかの実施形態では、データの分析および画像データの一部分の選択は、リアルタイムで(例えば、取込み工程中に)行なわれ得る。例えば、取込み工程中、プロセッサ312は、速度および/または方向の相対的に急激な変化を認識してもよく、動きが相対的に滑らかおよび/または単調である場合の一部分を選択してもよい。また、取込み工程中、プロセッサ312は、撮像された場面における相対的に急激な変化等の、画像データにおける変移モーメントを認識してもよい。そのため、本発明のいくつかの実施形態では、撮像された場面において相対的に急激な変化を含まず、空間における装置の相対的になだらかかつ連続的な経路を含み、かつ/または、速度および/もしくは方向の急激な変化を含まない、記録された画像データの一部分を、プロセッサ312は、リアルタイムで選択してもよい。
また、本発明のいくつかの実施形態によれば、プロセッサ312は、装置310を最も頻繁に使用するユーザ等の特定のユーザの写真取込みの癖を学習してもよい。例えば、いくつかの場合では、ユーザは通常、写真撮影前の非常に短時間のtpreで写真を撮影してもよく、または、多少の安定した腕前であってもよく、かつ/または、画像データの最も適切な一部分の選択において使用される基準および/または閾値に影響を与え得る任意の他の適切な撮影癖を有してもよい。ユーザの癖に基づき、プロセッサ312は、基準および/または閾値を再生成してもよく、この基準および/または閾値に応じて、画像データの最も適切な一部分が選択され得る。
本発明のいくつかの実施形態では、プロセッサ312は、映像データの一部分と共に、装置310によって記録されたオーディオデータの適切な一部分を選択してもよい。かかる選択は、予め設定された基準に応じて行なわれ得る。例えば、記録されたオーディオデータの選択された一部分が取込みモーメント時点でまたは取込みモーメント直近で記録されたオーディオデータを含むことが予め設定され得る。また、例えば、記録されたオーディオデータの選択された一部分が、話者が遮られている部分を含まないことが予め設定され得る。
いくつかの実施形態では、選択された映像セグメントは、可能であれば選択されたオーディオセグメントと共に、順次組み合されて組合せ映像を形成してもよい。この場合、映像セグメントは、1超の映像セグメントが連続するものであってもよく、かつ/または、例えば、1つの映像セグメント内で開始され、複数の組み合わされた映像セグメントのうちの別の映像セグメント内で終了してもよい。
本発明の実施形態によれば、ユーザは、ユーザインタフェース318等を介して、ユーザが組合せ映像に変換しようと望む複数の取り込まれた画像を選択してもよい。また、ユーザは、選択した画像が映像中で現れるべき順序を選択してもよい。
本明細書において、本発明の特定の特徴を例示し、説明してきたが、当業者は、多くの修正、代用、変更、および均等物を思いつくであろう。したがって、添付の特許請求の範囲は、本発明の真の精神の範囲内のすべての修正および変更を包含するように意図されていることを理解されたい。
Claims (34)
- マルチメディアファイルを取り込むステップと;
前記取込みに関連した運動学的データを取得するステップと;
ユーザの行動によって、前記マルチメディアファイル上のタイムスタンプであるスナップショットモーメントを表示するステップと;
決定関数を適用するステップであって、前記決定関数は、前記取り込まれたマルチメディアファイル、前記スナップショットモーメント、および前記運動学的データのうちの少なくとも1つを入力データとして受信し、前記スナップショットモーメントに先行する前記マルチメディアファイル上のタイムスタンプである始点、および、前記スナップショットモーメントの後続のタイムスタンプである終点を出力データとして出力する、ステップと、
を含む、方法。 - 前記取り込まれたマルチメディアファイルの下位集合であるマルチメディアクリップを生成するステップであって、前記マルチメディアクリップは、前記始点で開始され、前記スナップショットモーメントを含み、かつ、前記終点で終了するステップをさらに含む、
請求項1に記載の方法。 - 前記マルチメディアファイルは、映像シーケンスを含み、
前記スナップショットモーメントは、単一の静止画像に関連する、
請求項1に記載の方法。 - 前記マルチメディアファイルは、オーディオシーケンスを含み、
前記スナップショットモーメントは、オーディオクリップに関連する、
請求項1に記載の方法。 - 前記マルチメディアファイルは、映像シーケンスおよびオーディオシーケンスの両方を含み、
前記映像シーケンスおよび前記オーディオシーケンスは、それぞれ、各々の始点および終点、ならびに共通のスナップショットモーメントに関連する、
請求項1に記載の方法。 - 前記決定関数は、前記ユーザに関するメタデータおよび前記取込みのコンテクストに関するメタデータのうちの少なくとも1つを入力データとしてさらに受信する、
請求項1に記載の方法。 - 前記決定関数は、前記始点および前記終点を判定する際に考慮される、画像処理アルゴリズムおよびオーディオ処理アルゴリズムのうちの少なくとも1つをさらに適用する、
請求項1に記載の方法。 - 前記決定関数を適用するステップは、前記マルチメディアファイルの前記取込みの終了後、オフラインで行なわれる、
請求項1に記載の方法。 - 前記決定関数は、特定の定性的測定基準の所定のレベル未満である、前記マルチメディアファイルの部分をフィルタリングする、
請求項1に記載の方法。 - 前記運動学的データは、取込み装置の空間的経路に変換され、前記空間的経路は、前記決定関数に送られる、
請求項1に記載の方法。 - 前記決定関数は、前記運動学的データと所定の閾値の全項目とを比較する、
請求項1に記載の方法。 - 前記マルチメディアファイルがオーディオシーケンスを含む場合に、前記決定関数は、少なくとも1種類のオーディオ信号処理を適用する、
請求項1に記載の方法。 - 前記表示するステップは、複数回繰り返されて複数のスナップショットモーメントを出力し、
前記ユーザの行動は、前記マルチメディア全体の取込み後に開始される、
請求項1に記載の方法。 - 前記メタデータは、前記スナップショットモーメントに関連した静止画像に基づく、
請求項6に記載の方法。 - 前記マルチメディアファイル内に含まれ、かつ、前記スナップショットモーメントに関連した静止画像に由来するデータを表示するタグを前記マルチメディアクリップに付けるステップをさらに含む、
請求項1に記載の方法。 - 前記タグに基づき、前記マルチメディアクリップに所定の操作を適用するステップをさらに含む、
請求項15に記載の方法。 - 前記タグに基づき、前記マルチメディアクリップの検索操作をさらに適用する、
請求項16に記載の方法。 - マルチメディアファイルを取り込むように構成された取込み装置と;
前記取込みに関する運動学的データを取得するように構成された前記取込み装置に物理的に結合された運動センサと;
ユーザの行動に反応する前記マルチメディアファイル上のタイムスタンプであるスナップショットモーメントを表示するように構成されたユーザインタフェースと;
決定関数を適用するように構成されたコンピュータプロセッサであって、前記決定関数は、前記取り込まれたマルチメディアファイル、前記スナップショットモーメント、および前記運動学的データのうちの少なくとも1つを入力データとして受信し、前記スナップショットモーメントに先行する前記マルチメディアファイル上のタイムスタンプである始点、および、前記スナップショットモーメントの後続のタイムスタンプである終点を出力データとして出力する、コンピュータプロセッサと、
を含む、システム。 - 前記コンピュータプロセッサは、前記取り込まれたマルチメディアファイルの下位集合であるマルチメディアクリップを生成するようにさらに構成され、
前記マルチメディアクリップは、前記始点で開始され、前記スナップショットモーメントを含み、かつ、前記終点で終了する、
請求項18に記載のシステム。 - 前記マルチメディアファイルは、映像シーケンスを含み、
前記スナップショットモーメントは、単一の静止画像に関連する、
請求項18に記載のシステム。 - 前記マルチメディアファイルは、オーディオシーケンスを含み、
前記スナップショットモーメントは、オーディオクリップに関連する、
請求項18に記載のシステム。 - 前記マルチメディアファイルは、映像シーケンスおよびオーディオシーケンスの両方を含み、
前記映像シーケンスおよび前記オーディオシーケンスは、それぞれ、各々の始点および終点、ならびに共通のスナップショットモーメントに関連する、
請求項18に記載のシステム。 - 前記決定関数は、前記ユーザに関するメタデータおよび前記取込みのコンテクストに関するメタデータのうちの少なくとも1つを入力データとしてさらに受信する、
請求項18に記載のシステム。 - 前記決定関数は、前記始点および前記終点を判定する際に考慮される、画像処理アルゴリズムおよびオーディオ処理アルゴリズムのうちの少なくとも1つをさらに適用する、
請求項18に記載のシステム。 - 前記決定関数を適用するステップは、前記マルチメディアファイルの前記取込みの終了後、オフラインで行なわれる、
請求項18に記載のシステム。 - 前記決定関数は、特定の定性的測定基準の所定のレベル未満のマルチメディアファイルの部分をフィルタリングする、
請求項18に記載のシステム。 - 前記運動学的データは、前記取込み装置の空間的経路に変換され、前記空間的経路は、前記決定関数に送られる、
請求項18に記載のシステム。 - 前記決定関数は、前記運動学的データと所定の閾値の全項目とを比較する、
請求項18に記載のシステム。 - 前記マルチメディアファイルがオーディオシーケンスを含む場合に、前記決定関数は、少なくともオーディオ信号処理を適用する、
請求項18に記載のシステム。 - 前記表示するステップは、複数回繰り返されて複数のスナップショットモーメントを出力し、
前記ユーザの行動は、前記マルチメディア全体の取込み後に開始される、
請求項18に記載のシステム。 - 前記メタデータは、前記スナップショットモーメントに関連した静止画像に基づく、
請求項22に記載のシステム。 - 前記マルチメディアファイル内に含まれ、かつ、前記スナップショットモーメントに関連した静止画像に由来するデータを表示するタグを前記マルチメディアクリップに付けるステップをさらに含む、
請求項18に記載のシステム。 - 前記タグに基づき、前記マルチメディアクリップに所定の操作を適用するステップをさらに含む、
請求項29に記載の方法。 - 前記タグに基づき、前記マルチメディアクリップの検索操作をさらに適用する、
請求項29に記載の方法。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US13/734,981 US20140195917A1 (en) | 2013-01-06 | 2013-01-06 | Determining start and end points of a video clip based on a single click |
US13/734,981 | 2013-01-06 | ||
PCT/IL2014/050013 WO2014106851A1 (en) | 2013-01-06 | 2014-01-06 | Determining start and end points of a video clip based on a single click |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2016506688A true JP2016506688A (ja) | 2016-03-03 |
Family
ID=51061983
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2015551253A Pending JP2016506688A (ja) | 2013-01-06 | 2014-01-06 | シングルクリックに基づく映像クリップの始点および終点の判定方法 |
Country Status (4)
Country | Link |
---|---|
US (1) | US20140195917A1 (ja) |
JP (1) | JP2016506688A (ja) |
KR (1) | KR20160016746A (ja) |
WO (1) | WO2014106851A1 (ja) |
Families Citing this family (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP5731083B1 (ja) * | 2014-06-13 | 2015-06-10 | 株式会社日立システムズ | 作業記録装置、作業記録システム、作業記録プログラムおよび作業記録方法 |
US10911839B2 (en) | 2017-04-17 | 2021-02-02 | Sony Corporation | Providing smart tags |
US20200117910A1 (en) * | 2018-10-16 | 2020-04-16 | Thomas WILLOMITZER | Methods and apparatus for generating a video clip |
Family Cites Families (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6449653B2 (en) * | 1997-03-25 | 2002-09-10 | Microsoft Corporation | Interleaved multiple multimedia stream for synchronized transmission over a computer network |
US20020046218A1 (en) * | 1999-06-23 | 2002-04-18 | Scott Gilbert | System for digitally capturing and recording panoramic movies |
TW502532B (en) * | 1999-12-24 | 2002-09-11 | Sanyo Electric Co | Digital still camera, memory control device therefor, apparatus and method for image processing |
US20050223799A1 (en) * | 2004-03-31 | 2005-10-13 | Brian Murphy | System and method for motion capture and analysis |
US9113124B2 (en) * | 2009-04-13 | 2015-08-18 | Linkedin Corporation | Method and system for still image capture from video footage |
US20100265313A1 (en) * | 2009-04-17 | 2010-10-21 | Sony Corporation | In-camera generation of high quality composite panoramic images |
US9564173B2 (en) * | 2009-04-30 | 2017-02-07 | Apple Inc. | Media editing application for auditioning different types of media clips |
WO2011100480A1 (en) * | 2010-02-10 | 2011-08-18 | Brian Lamb | Automatic motion tracking, event detection and video image capture and tagging |
-
2013
- 2013-01-06 US US13/734,981 patent/US20140195917A1/en not_active Abandoned
-
2014
- 2014-01-06 KR KR1020157021307A patent/KR20160016746A/ko not_active Application Discontinuation
- 2014-01-06 WO PCT/IL2014/050013 patent/WO2014106851A1/en active Application Filing
- 2014-01-06 JP JP2015551253A patent/JP2016506688A/ja active Pending
Also Published As
Publication number | Publication date |
---|---|
WO2014106851A1 (en) | 2014-07-10 |
US20140195917A1 (en) | 2014-07-10 |
KR20160016746A (ko) | 2016-02-15 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US9934820B2 (en) | Mobile device video personalization | |
US20160080835A1 (en) | Synopsis video creation based on video metadata | |
US20120098946A1 (en) | Image processing apparatus and methods of associating audio data with image data therein | |
KR102127351B1 (ko) | 사용자 단말 장치 및 그 제어 방법 | |
US20160321833A1 (en) | Method and apparatus for generating moving photograph based on moving effect | |
US9565350B2 (en) | Storyboards for capturing images | |
US20180205999A1 (en) | Mobile device video personalization | |
US9449646B2 (en) | Methods and systems for media file management | |
US20140226955A1 (en) | Generating a sequence of video clips based on meta data | |
JP6640460B2 (ja) | 画像撮影装置、画像撮影方法、プログラムおよび記録媒体 | |
KR20160129077A (ko) | 이미지 수집 방법 및 장치 | |
JP2014132461A (ja) | 電子装置でコンテンツを制御する装置及びその方法 | |
US20160127651A1 (en) | Electronic device and method for capturing image using assistant icon | |
JP2016506688A (ja) | シングルクリックに基づく映像クリップの始点および終点の判定方法 | |
US10924637B2 (en) | Playback method, playback device and computer-readable storage medium | |
JP6214762B2 (ja) | 画像検索システム、検索画面表示方法 | |
JP2015103968A (ja) | 画像処理装置、画像処理方法及び画像処理プログラム | |
US11836847B2 (en) | Systems and methods for creating and displaying interactive 3D representations of real objects | |
US10438632B2 (en) | Direct user manipulation of video to generate scrubbing videos | |
US20180204600A1 (en) | Mobile device video personalization | |
US20150215530A1 (en) | Universal capture | |
US10181337B2 (en) | Information processor, information processing method, and program | |
TWI464695B (zh) | 基於臉部表情播放文檔的電子裝置及方法 | |
JP6249771B2 (ja) | 画像処理装置、画像処理方法、プログラム | |
JP2019022039A (ja) | 画像記録装置、画像記録方法及びプログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A711 | Notification of change in applicant |
Free format text: JAPANESE INTERMEDIATE CODE: A711 Effective date: 20160128 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A821 Effective date: 20160129 |