JP2009076071A - マルチメディア処理用の高性能入力制御装置、入力制御方法および入力制御用プログラム - Google Patents

マルチメディア処理用の高性能入力制御装置、入力制御方法および入力制御用プログラム Download PDF

Info

Publication number
JP2009076071A
JP2009076071A JP2008234458A JP2008234458A JP2009076071A JP 2009076071 A JP2009076071 A JP 2009076071A JP 2008234458 A JP2008234458 A JP 2008234458A JP 2008234458 A JP2008234458 A JP 2008234458A JP 2009076071 A JP2009076071 A JP 2009076071A
Authority
JP
Japan
Prior art keywords
feature image
camera
multimedia material
input control
image
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2008234458A
Other languages
English (en)
Inventor
Laurent Denoue
ドゥヌ ローラン
Scott Carter
カーター スコット
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujifilm Business Innovation Corp
Original Assignee
Fuji Xerox Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fuji Xerox Co Ltd filed Critical Fuji Xerox Co Ltd
Publication of JP2009076071A publication Critical patent/JP2009076071A/ja
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/01Input arrangements or combined input and output arrangements for interaction between user and computer
    • G06F3/03Arrangements for converting the position or the displacement of a member into a coded form
    • G06F3/0304Detection arrangements using opto-electronic means
    • G06F3/0325Detection arrangements using opto-electronic means using a plurality of light emitters or reflectors or a plurality of detectors forming a reference frame from which to derive the orientation of the object, e.g. by triangulation or on the basis of reference deformation in the picked up image

Landscapes

  • Engineering & Computer Science (AREA)
  • General Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Studio Devices (AREA)
  • User Interface Of Digital Computer (AREA)
  • Digital Computer Display Output (AREA)
  • Position Input By Displaying (AREA)

Abstract

【課題】画像やビデオクリップの再生中に、ウェブカメラを仮想フラッシュライトとして画面上で使用可能にする入力制御システム、方法およびプログラムを提供する。
【解決手段】入力制御システムにおいて、マルチメディア素材を表している特徴画像を画面上で生成する、処理制御装置と、処理制御装置に接続されるとともに、特徴画像の画像の撮像を作成するカメラとを備え、処理制御装置が、特徴画像の位置を繰り返し更新するために特徴画像の撮像を使用するとともに、カメラの位置に基づいて特徴画像の位置を決定し、繰り返しごとに、特徴画像の位置を記録し、さらに特徴画像の記録された位置に基づいて、マルチメディア素材を変換する。
【選択図】図1

Description

本発明は、マルチメディア処理用の高性能入力制御装置、入力制御方法および入力制御用プログラムに関する。
デジタルカメラや携帯電話を使用しているユーザは、数多くの画像やビデオクリップを蓄積している。Adobe Photoshop Elements SlideShowエディタなどのプログラムは、ユーザがパンアンドスキャンを利用できる一連の画像から、必要なスライドショーを手作業で作成するための、人気のあるプログラムである。自動的に製作されるスライドショーも、画像の表面上でズーミング機能やスキャニング機能を活用しており、これがビデオクリップにまで拡張されてきている。
このように、本領域における一つの側面として、非特許文献1のようなAdobe社製などのプログラムは、使用することが困難であり、ユーザが甚大な努力を払わねばならない。また本領域における別の側面として、画像から自動的に作成されるビデオには、人間的な味わいがない。従って、すぐにつまらないと感じ、斬新ではなくなり、当然のこととして個人特有のビデオとしての感覚をもつことができない。標準のビデオ編集ツールおよび画面収集ツールは、一部の編集作業では実用的ではあるが、2つの大きな欠点がある。すなわち、1)ユーザは、メディアのインポートと整理を別々のインタフェースで行わなければならないという点と、2)あるがままの(すなわちカムコーダ様に)画面を録画できないので、その代わりに通常、ユーザが記録しようとする特定の領域もしくは画面枠を定義せざるを得ない。
カムコーダ様のビデオ編集用制御を実現化するための一つの方法としては、単にカムコーダを使用して、コンピュータ画面に表示される画像を撮影して、ビデオのムービーを生成することが考えられる。しかし、カムコーダを2番目の複製の作成に用いると、この方法で記録されたビデオは質が劣化せざるを得ない。
このように、既存の技術ではいずれも、ユーザが、画像やビデオクリップから必要な個人化されたビデオを、自然に作成することができない。
http://www.adobe.com/products/photoshopelwin/samples/slideshow_travel.html
本発明は、マルチメディア処理にかかわる上述の問題およびその他の問題のうちの一つもしくはそれ以上を実質的に回避するシステム、方法およびプログラムを対象としている。
本発明の第1の態様は、入力制御システムであって、入力制御システムは、a.マルチメディア素材を表示している画面上に特徴画像を生成する処理制御装置と、b.処理制御装置に動作可能なように連結され、特徴画像の撮像を作成することができるカメラとを備え、処理制御装置が、i.特徴画像の位置を繰り返し更新するために特徴画像の撮像を使用するとともに、カメラの位置に基づいて特徴画像の位置を決定し、ii.繰り返しごとに、特徴画像の位置を記録し、さらにiii.特徴画像の記録された位置に基づいて、マルチメディア素材を変換する。
本発明の第2の態様は、第1の態様の入力制御システムにおいて、特徴画像が、着色された円、着色された矩形もしくは着色された四辺形をさらに有する。
本発明の第3の態様は、第1の態様の入力制御システムにおいて、処理制御装置が、さらに、特徴画像の表面積を計算し、計算された表面積を使用してカメラとディスプレイとの間の距離を測定できる。
本発明の第4の態様は、第1の態様の入力制御システムにおいて、画像の使用に、ディスプレイに表示されているマルチメディア素材から、フィルタをかけて特徴画像の色彩を除去することが含まれる。
本発明の第5の態様は、第1の態様の入力制御システムにおいて、カメラがウェブカメラである。
本発明の第6の態様は、第1の態様の入力制御システムにおいて、処理制御装置が、さらにスプライン曲線を使用して、ディスプレイ上に特徴画像の位置を平滑化処理できる。
本発明の第7の態様は、第1の態様の入力制御システムにおいて、マルチメディア素材が、少なくとも2つのフレームを有し、さらにマルチメディア素材の変換処理に、特徴画像の位置とサイズとに従って、マルチメディア素材の少なくとも2つのフレームをクロップすることが含まれる。
本発明の第8の態様は、第7の態様の入力制御システムにおいて、クロップされた少なくとも2つのフレームをビデオクリップに組み立てることを含む。
本発明の第9の態様は、第1の態様の入力制御システムにおいて、処理制御装置が、さらに特徴画像の撮像を使用して、ディスプレイに対するカメラの角度を測定できる。
本発明の第10の態様は、第1の態様の入力制御システムにおいて、マルチメディア素材が、複数のフレームを有し、処理制御装置がさらに、変換されたマルチメディア素材を使用して少なくとも2つのビデオクリップを作成でき、処理制御装置がさらに、少なくとも2つのビデオクリップ間にトランジションを内挿できる。
本発明の第11の態様は、入力制御方法であって、a.マルチメディア素材を表示している画面上に特徴画像を生成し、b.カメラを使用して、特徴画像の撮像を作成し、c.特徴画像の位置を繰り返し更新するために特徴画像の撮像を使用するとともに、カメラの位置に基づいて特徴画像の位置を決定し、d.繰り返しごとに、画像の位置を記録し、e.特徴画像の記録された位置に基づいて、マルチメディア素材を変換する。
本発明の第12の態様は、第11の態様の入力制御方法において、特徴画像に、着色された円、着色された矩形もしくは着色された四辺形が含まれる。
本発明の第13の態様は、第11の態様の入力制御方法において、さらに、特徴画像の表面積を計算し、計算された表面積を使用して、カメラとディスプレイとの間の距離を測定する。
本発明の第14の態様は、第11の態様の入力制御方法において、画像の使用に、ディスプレイ上に表示されているマルチメディア素材から、フィルタをかけて特徴画像の色彩を除去することを含む。
本発明の第15の態様は、第11の態様の入力制御方法において、カメラが、ウェブカメラである。
本発明の第16の態様は、第11の態様の入力制御方法において、スプライン曲線を使用して、さらにディスプレイ上の特徴画像の位置を平滑化処理する。
本発明の第17の態様は、第11の態様の入力制御方法において、マルチメディア素材が、少なくとも2つのフレームを有し、マルチメディア素材の変換処理に、特徴画像の位置とサイズとに従って、マルチメディア素材の少なくとも2つのフレームをクロップすることを含む。
本発明の第18の態様は、第11の態様の入力制御方法において、さらに、クロップされた少なくとも2つのフレームをビデオクリップに組み立てる。
本発明の第19の態様は、第11の態様の入力制御方法において、特徴画像の画像を使用して、ディスプレイに対するカメラの角度を測定し、さらに、測定された角度に基づいて、マルチメディア素材を変換する。
本発明の第20の態様は、第11の態様の入力制御方法において、マルチメディア素材が複数のフレームを有し、さらに変換されたマルチメディア素材を使用して少なくとも2つのクロップを作成し、少なくとも2つのビデオクリップ間にトランジションを内挿する。
本発明の第21の態様は、コンピュータプログラムであって、コンピュータに、a.マルチメディア素材を表示している画面上に特徴画像を生成するステップと、b.カメラを使用して、特徴画像の撮像を作成するステップと、c.特徴画像の位置を繰り返し更新するために特徴画像の画撮像を使用するとともに、カメラの位置に基づいて特徴画像の位置を決定するステップと、d.繰り返しごとに、特徴画像の位置を記録するステップと、e.特徴画像の記録された位置に基づいて、マルチメディア素材を変換するステップと、を実行させることを含む。
本発明に関するその他の態様は、後述の説明で一部が述べられているので、その説明から部分的に明らかとなるであろうし、本発明を実施することによって知ることもできるであろう。本発明の態様は、要素類および各種要素類の組み合わせによって実現および達成されるが、特に後述の発明を実施するための最良の形態ならびに添付の特許請求の範囲で指摘されている態様に関しては、その点がさらに顕著である。
前述の説明と後述の説明とはともに、典型的な事例を挙げて説明を行っているにすぎず、いかなる形でも特許請求項に記載されている発明およびその適用を制限することを意図していないことを理解すべきである。
マルチメディアを再生している画面を利用して、マルチメディアの編集が可能となるため、これまでの技術と比較して、マルチメディアの編集の自由度を高めることができる。
本明細書に取り込まれ、その一部を構成している添付の図面は、本発明の具体的例を示しており、関連する記述とともに、本発明の技術の原理を説明し、図解する役割を果たしている。
以下の詳細な説明では、同一の機能要素が同じ番号で表されている、添付の図面を参照する。前述の添付の図面は、図解することを目的としており、本発明の原理と一致する特定の実施形態および実施例に限定することを目的とはしてはいない。これらの実施例については、当業者であれば本発明を実施できるほど十分詳細に説明されており、他の実施例を使用して、本発明の対象範囲と精神とから逸脱することなく、各種要素の少なくとも構造的変更および置換のいずれかができることを理解すべきである。従って、後述の詳細な説明は、限定された意味で解釈すべきではない。さらに、本明細書に記述されている本発明の各種実施形態は、汎用コンピュータで動作するソフトウェアの形態、専用ハードウェアの形態もしくはソフトウェアとハードウェアとを組み合わせた形態のいずれかで、実現することができる。
本発明の技術の一つの実施形態は、ユーザのモニタに表示される画像、ビデオもしくはその他のマルチメディアのパン、スキャンおよびズームなどの表示(ビュー)パラメータをユーザが簡単に生成し、新しく生成されたビューを用いてカスタムマルチメディアプレゼンテーションを作成するのを可能にする、入力制御装置(ビューポート)である。具体的には、本発明の入力制御装置システムの一つの実施形態では、画像もしくはビデオクリップが画面上で再生されているときに、ウェブカメラを画面への仮想フラッシュライトとして使用することができる。画面に向けたウェブカメラフラッシュライトの位置、傾きおよび回転が記録され、ウェブカメラもしくはユーザが保持しているその他のポインティングデバイスの位置情報から得られた、ビューパラメータ(パン、スキャンおよびズーム)を用いて、マルチメディアファイルを変換することで、魅力的なムービーが円滑に作成される。ユーザは、画面の近くまでウェブカメラを移動させて特定の領域に焦点を当てること、ウェブカメラを回転させて必要な回転操作を行わせること、およびウェブカメラをパンニングして側面から見た被写体をシミュレートすることなどができる。ユーザのムービーがすべて記録されたなら、ユーザによる本発明のシステムとの対話によって決定されたとおりに、オリジナルのマルチメディア素材を変換することによって、新しいムービーやその他のマルチメディアプレゼンテーションが生成される。
図1は、本発明のシステムの典型的な実施形態である。具体的には、図に示されている実施形態100では、システムには、モニタ101の方向を向いたカメラ102の形態の、ポインティングデバイスを備えている。本発明の実施形態のシステムは、モニタ101に表示される特徴画像104を使用して、カメラ102の向きと位置とを読み取る。モニタ101は、ユーザが変換することを望むマルチメディアコンテンツ(図示せず)も表示する。カメラ102から取得される画像情報105は、本発明の処理装置103に有線もしくは無線通信により送信される。この装置は、調整信号106をモニタ101に送信する。信号106は、特徴画像104の表示される位置を調整する。システム100は、カメラ102の位置と向きとを連続的に記録し、この情報を使用して、モニタ101に表示されるマルチメディアコンテンツを変換する。
本発明のシステムの実施形態では、ユーザが画面101上で、ウェブカメラのような、カメラ102を移動する。ユーザは、画像をズームインおよびズームアウト、スキャン、ある点からある点へ移動させることができる(例えば、顔から顔、線に沿って、など)。本発明のシステム100の実施形態は、ユーザに対しリアルタイムでフィードバックを提供する。カメラ102の移動に伴って、円、矩形もしくは四辺形などの特徴画像104が、カメラ102の現在の位置と向きを表すために、マルチメディアメディア要素(例えば、画像もしくはビデオクリップ)上に描画される。基本的には、本発明のシステムの図示されている実施形態を使用する方法は、画面に向けてフラッシュライトを当てる方法と類似している。ユーザは、光線の大きさによって、どの程度の量の画像が最終的なアニメーションに使用されるのかを知ることができる。
ズーム、スキャンおよび回転に加えて、本発明の一つの実施形態では、パン(カメラの左右の旋回)およびチルト(カメラの旋回)の各処理を検出できる。これらのさらなる2つの要素が加わることで、たとえ表示される面が平坦なままであったとしても、パンやチルトの場面で、実際に3次元の物体の回りを移動しているかのようにユーザが感じられるような、最終的なアニメーションの臨場感の改善が得られる。
つぎに、本発明のシステムの動作原理について説明する。第一に、ユーザが、画像やビデオクリップなどの、表示するメディア要素を選択する。一つの実施形態では、本発明のシステムで、この要素にフィルタを適用して、例えば青色などの、仮想のフラッシュライトによって使用される成分を除去できる。これは画像だけでなく、ビデオクリップにも適用される。例えば、Actionscript/Flashでビットマップフィルタをリアルタイムで適用して、ディスプレイ上に描画される前に、すべてのフレームの青い構成要素を除去することができる。その後で、本発明のシステムの一つの実施形態では、例えば画面の中心など、ディスプレイ上の所定の位置に、青い円、矩形もしくは四辺形などの仮想フラッシュライトがオーバーレイされる。
残りのステップについて、図2を参照しながら説明する。ステップ201では、システムが、カメラから時間tに一致するフレームを捕捉する。ステップ202では、システムが、画面上で青い円、矩形もしくは四辺形の検出を迅速化するため、青以外のピクセルをフィルタで除去する。ステップ203では、青い円、矩形もしくは四辺形に一致するブロブ(blob(小塊))の位置が計算される。具体的には、本発明のシステムの実施形態では、横方向(X)と縦方向(Y)の両方向それぞれで、ブロブのエッジ(minX、maxX、minY、maxY)の位置が判定される。その後で、ブロブの中心の位置bxとbyだけでなく、表面積も計算される。一つの実施形態では、画面から円もしくは矩形の実測サイズを逆方向の距離にマップすることによって、画面101からカメラ102までの距離を測定するときに、ブロブの表面積が使用される。
本発明の実施形態においては、ステップ203でブロブの中心が計算された後に、システムが、ステップ204で逆方向の距離だけ仮想フラッシュライトの位置を移動させる。例えば、ブロブがウェブカメラのフレームの中心から左下端部にあることを認識したなら、システムは、青い円、矩形もしくは四辺形を右上端部に移動する。ユーザが意図せずにうっかり意思表示した場合に対処するため、ブロブがウェブカメラによって取得されたフレームの中心付近にすでに位置している場合には、システムは、青い円、矩形もしくは四辺形を移動させない。ステップ205では、画面上のブロブの新しい位置が更新される。このループ210により、ユーザが、どこにウェブカメラを向けていても、システムが青い丸、矩形もしくは四辺形を移動させることができる。
カメラのパンとチルトの各操作を推定するため、本発明のシステムの一つの実施形態では、本明細書に全体として参考のために示されている、2007年8月14日に出願された米国特許出願番号11/838,817に詳細に記述されている方法が採用できる。カメラ102の画面までの距離は、ブロブの表面積を用いて計算される。そのために、本発明のシステムの実施形態では、ブロブの幅と高さとを計算し、その結果に基づいて、青い円、矩形もしくは四辺形のサイズが変更される。例えば、ブロブのサイズは、その幅が常時フレームの幅の1/4を占めるように調整される。ステップ201で捕捉されたフレームごとに、本発明のシステムの実施形態は、フレームの時間t、画面上のブロブの位置(x,y)を含むビューパラメータ、ならびにカメラから画面zまでの距離を記録する。本発明のもう一つの実施形態では、システムが、画面に対するカメラの角度など、カメラの向きパラメータを記録する。このように、ステップ206では、カメラのビュー情報が時系列の3次元もしくは4次元の点として記録される。時間tごとに、記録される情報には、ディスプレイ上の青い円と、矩形もしくは四辺形のx,y座標、青い円、矩形もしくいは四辺形のサイズと、入手可能な場合、ディスプレイに対するカメラの回転情報が含まれる。
本発明の一つの実施形態では、ステップ207で、記録されたビューパラメータが、例えばスプライン曲線などを使用して、平滑化処理される。本発明の一つの実施形態では、適切な時期に(x,y)座標に適合するように、パラメトリック2Dスプライン曲線が計算される。パラメトリック1Dスプライン曲線は、青い丸、矩形もしくは四辺形の連続したサイズに適合するように計算される。つぎに本発明のこの実施形態では、これら2本の平滑化処理された曲線を使用して、捕捉時に表示されたオリジナルの素材から一連のフレームが作成される。
システムは、時間t=0から処理を進め、第一のスプライン曲線によって与えられる2D位置と、第二のスプライン曲線によって与えられる1Dサイズとを読み取る。これらのパラメータを使用して、システムは、切り取る原画像(もしくはビデオクリップフレーム)の領域を明確に決定する。この決定に従って、この実施形態例では、フレームを切り取り、時間tに関する出力フレームとしてこれが書き込まれる。ステップ208を参照のこと。回転情報も入手可能な場合には、オリジナルの画像が対応する角度だけはじめに回転され、ついで切り取られる。これにより、黒い隅部が表示されない。ステップ209で、フレームの切り取り領域が出力される。
2Dおよび1Dのスプライン曲線の適合処理は数個の点にのみ依存し、一連のすべての点には依存しないので、システムは、ほぼリアルタイムでスムースなアニメーションを作成することもできる。これは、下記の典型的な応用例のシナリオに説明されているように、システムが共同利用されているときには、有効である。
本発明の一つの実施形態では、ユーザは、前述のステップ209で出力される切り取りフレームのアスペクト比を制御できる。本システムの一つの実施形態では、前述のアスペクト比を変更するのに、コンピュータキーボードまたは、制御装置の1個もしくはそれ以上のキーを使用する。本発明の一つの実施形態では、コンピュータ画面に表示されるオリジナルのフレーム(画像)に対するビューポートの位置と向きとによって定まる、新しいカメラの角度をシミュレートするため、マルチメディア素材のフレーム(画像)が変換される。本発明のシステムのある実施形態では、少なくともクロップおよび変換のいずれか一方がなされたフレーム(画像)が、一つもしくはそれ以上のムービークリップに組み立てられる。その結果、ユーザは、前述のムービークリップ(複数可)に対して音響効果を付加することができる。
つぎに、本発明のシステムの一つの実施形態の典型的応用例のシナリオについて説明する。ユーザが娘の誕生日のパーティの画像と何枚かのビデオクリップを撮影したと想定する。数秒間画像が表示されてから、ビデオクリップが全体として再生される典型的なスライドショーモードで、システムが、これらの画像とビデオクリップを表示する。スライドショーが行われている間、ユーザは、このウェブカメラを使用して、メディアの特定の面積に焦点を当てる。さらに、ユーザは、パンやズーム操作を行いながらナレーションを入れ、この処理が終わったなら、別の装置で録画しておいた新しいクラリネットを演奏している娘のミュージッククリップを追加する。その後で、彼は、自分の家族に新しく作成されたクリップをeメールで送信し、自分専用のインターネット動画アーカイブにアップロードする。
第一のユーザである配管工は、いまだ経験したことのない設備における漏れをくい止める必要性があることを発見したとする。彼の会社には教育訓練用ビデオがあるので、彼はアーカイブをサーチして、自分のモバイル装置でビデオを見て復習することができる。しかし、これは、2つの理由できわめて困難である。すなわち、1)ほとんどのモバイル装置と同様に、彼の装置も断続的にしかネットワークに接続できないので、膨大なビデオのセットをサーチし尽くすには、非常に多くの時間を費やしてしまう。2)ビデオは本来、大画面用に設計されており、小画面で見ることはなかなか難しい。その代わり、彼は、会社の本社にいる第二のユーザに連絡を取る。この第二のユーザが、自分の画面でその漏れを止める方法に関するビデオクリップを再生するが、第二のユーザは、第一のユーザのモバイル装置にクリップ全体をストリーム出力するのではなく、自分のウェブカメラを用いて最重要な要素だけを送信するが、そうでない場合には、ビデオ全体を観察したときのみ発見できる最初のユーザコンテキストを提供する。
本発明のシステムの一つの実施形態では、一連の小さなクリップからさらに大きなビデオを構成する処理がサポートされる。フェーディングなど、クリップ間のトランジションは、ユーザが定義することができる。あるいは、システムは、2つのクリップ間に自動的に内挿し、最初のクリップの終わりから次のクリップの初めまで(x,yおよびxの位置、ならびにチルト、パンおよびカントを含む)ビューポートを平滑化処理することにより調整する。この自動的方法は、(例えば、ユーザが、しばらくの間、カメラを画面からそらせていた場合など)ビューポートが画面のある部分から別の部分へ分岐するときに、クリップ内で使用することもできる。
ビューポートが、画面の別の部分に分岐し、青いブロブが「見えなくなった」ときに、カメラの現在の位置を検出するための多数の方法が周知である点に留意されたい。このような周知の方法の一つは、携帯電話のカメラを使用して、カーソルの位置を特定するのにすでに適用されている、Datamatrixタグに依拠している。
図1に示されているウェブカメラは、本発明の入力制御装置の一つの実施形態のみを表しているが、他の実施形態も可能である。例えば、通常の当業者にとって周知のWii(登録商標)コントローラは、自由度6が可能であり(IRセンサを介して3、加速度計を介してさらに3)ウェブカメラと類似した直接的方法で、ビューポートを制御するのに使用できる。本発明の一つの実施形態では、本発明のビューポートとして、前述のWiiコントローラを利用し、そのキーを使用して、「フラッシュライト」の第6自由度、ヨーを制御する。この実施形態では、(x,y)の位置を制御するのに、システムがWiiの内部赤外線センサに依存している。一つの実施形態では、標準のWiiセンサバーの代わりに、システムは、2つの赤外線フラッシュライトを使用して、Wiiのxとyの位置を導き出す。フラッシュライト間は、固定距離だけ離れており、この距離は、Wiiが画面に次第に近づくにつれて広がっていく。Wiiコントローラは、静止力を測定するのに引力に依存する加速度計を備えているが、パン操作(ヨー)を記録することはできない。このように、本発明の一つの実施形態では、代わりにWiiアローキーを使用してパン操作とチルト操作の両方を制御する。傾斜面(cant)(円筒)座標系を制御するのに、システムはWiiの加速度計を使用して、Wiiの傾斜面をビューポートの傾斜面に直接投影する。最後に、本発明のシステムのこの実施形態では、Wiiの+と−の各キーを使用して、捕捉するフレームのアスペクト比を制御する。
図3は、本発明の方法の一つの実施形態を実現できる、コンピュータ/サーバシステム300の一つの実施形態を図解しているブロック図である。システム300には、コンピュータ/サーバープラットフォーム301と、周辺機器302と、ネットワークリソース303とが備わっている。
コンピュータプラットフォーム301は、データバス304、もしくはコンピュータプラットフォーム301の各部間および各部内で情報を交換するための他の通信機構と、情報処理ならびに他の演算タスクや制御タスクを実行するためのバス304に連結したプロセッサ305とを備えていてもよい。コンピュータプラットフォーム301には、各種情報の他に、プロセッサ305によって実行される命令を格納しておくため、バス304に連結されているランダムアクセスメモリ(RAM)もしくはその他の動的記憶装置など、揮発性記憶装置306も備わっている。揮発性記憶装置306は、プロセッサ305による命令の実行時に、仮の変数やその他の中間処理情報を格納するのに使用することもできる。コンピュータプラットフォーム301はさらに、基本入出力システム(BIOS)などプロセッサ305に関する静的情報と命令、その他に各種システム構成パラメータも格納するため、バス304に連結されている読取専用メモリ(RAMもしくはEPROM)307を備えていてもよい。情報や命令を記憶するため、磁気ディスク、光ディスクもしくはソリッドステートフラッシュメモリ装置などの固定記憶装置が備わっており、バス304に連結されている。
コンピュータプラットフォーム301には、コンピュータプラットフォーム301のシステムアドミニストレータもしくはユーザに対して情報を提示するため、陰極線管(CRT)ディスプレイ、プラズマディスプレイもしくは液晶ディスプレイなどのディスプレイ309を、バス304を経由して連結させてもよい。プロセッサ305に情報やコマンド選択肢を伝達するため、英数字キーやその他のキーをはじめとする入力デバイス310がバス304に連結されている。プロセッサ305に指示情報およびコマンド選択肢を伝達し、さらにディスプレイ309上でのカーソルの移動を制御するための、マウス、トラックボールもしくはカーソル方向キーなど、もう一つの種類の入力デバイスが、カーソル制御デバイス311である。この入力デバイスは、通常、デバイスによって平面上で位置を指定するのを可能にする、第一の軸(例えば、x)と第二の軸(例えば、y)の2軸における、自由度2を備えている。
バス304を経由して、外付け記憶装置312をコンピュータプラットフォーム301に接続し、コンピュータプラットフォーム301に対して追加のリムーバブル記憶容量を付加してもよい。コンピュータシステム300の一つの実施形態では、外付けのリムーバブル記憶装置312を、他のコンピュータシステムとのデータ交換を促進するのに使用することもできる。
本発明は、本明細書に記載されている技術を実現するためのコンピュータ300の使用に関する。一つの実施形態では、本発明のシステムは、コンピュータプラットフォーム301などのマシン上に常駐させておくことができる。本発明の一つの実施形態によれば、本明細書に記載の技術は、揮発性メモリ306に格納されている一つもしくはそれ以上の命令から成る一つもしくはそれ以上のシーケンスを実行しているプロセッサ305に応答して、コンピュータシステム300によって遂行される。このような命令は、固定記憶装置308などの別のコンピュータ読取可能媒体から揮発性メモリ306に読み込むこともできる。揮発性メモリ306に格納されている命令シーケンスを実行することにより、プロセッサ305が本明細書に記載のプロセスステップを遂行することができる。別の実施形態では、本発明を実現するためのソフトウェア命令の代わりに、もしくはこれらのソフトウェア命令と組み合わせて、ハードワイヤード回路を使用することができる。このように、本発明の実施形態は、ハードウェア回路とソフトウェアとの、いずれかの特定の組み合わせに限定されない。
本明細書で使用されている「コンピュータ読取可能媒体」という用語は、実行する命令プログラムをプロセッサ305に提供する操作に関わるいずれかの媒体を表す。コンピュータ読取可能媒体とは、少なくとも本明細書に記載されている方法および技術のいずれか一方を実現するための命令を実行することのできるプログラムを含む、機械読取可能媒体のほんの一例にすぎない。このような媒体には、不揮発性媒体、揮発性媒体および伝送媒体をはじめとする多くの形態を取りうるが、これらに限定されない。不揮発性媒体としては、例えば、記憶装置308などの光ディスクもしくは磁気ディスクがあげられる。揮発性媒体としては、揮発性装置306などの動的メモリがあげられる。伝送媒体には、同軸ケーブルや、データバス304を有するワイヤなどの銅線や光ファイバがあげられる。伝送媒体は、電波データ通信及び赤外線データ通信時に生成される波など、音波や光波の形態を取ることもできる。
一般的形態のコンピュータ読取可能媒体としては、例えば、フロッピディスク、フレキシブルディスク、ハードディスク、磁気テープもしくはその他のいずれかの種類の磁気媒体、CD−ROM、他のいずれかの種類の光媒体、パンチカード、紙テープ、ホールパターンを有する他のいずれかの種類の物理的媒体、RAM、PROM、EPROM、FLASH−EPROM、フラッシュドライブ、メモリカード、他のいずれかのメモリチップもしくはカートリッジ、後述の搬送波、もしくはコンピュータが読み取ることのできるその他のいずれかの媒体などがあげられる。
実行する一つもしくはそれ以上の命令から成る一つもしくはそれ以上のシーケンスの、プロセッサ305への搬送には、さまざまな形態のコンピュータ読取可能媒体がかかわることができる。例えば、命令は、最初、リモートコンピュータから磁気ディスクに搬送してもよい。あるいは、リモートコンピュータが、命令を自己の動的メモリにロードし、モデムを使用して、電話回線を通じてそれらの命令を送信することもできる。コンピュータシステム300にとってローカルなモデムが、電話回線を通じてデータを受信し、赤外線トランスミッタを使用してデータを赤外線信号に変換することができる。赤外線検出器が赤外線信号を受信し、適切な回路系がデータをデータバス304上に送出することができる。バス304は、データを揮発性記憶装置に搬送し、そこからプロセッサ305が命令を受信し、実行する。揮発性メモリ306によって受信された命令は、プロセッサ305による実行前もしくは実行後に、固定記憶装置308に状況に応じて格納してもよい。これらの命令は、本技術分野で周知の、多種多様なネットワークデータ通信プロトコルを用いて、インターネットを通じてコンピュータプラットフォーム301にダウンロードすることもできる。
コンピュータプラットフォーム301には、データバス304に連結されたネットワークインタフェースカード313などの、通信インタフェースも備わっている。通信インタフェース313は、ローカルネットワーク315に接続されたネットワークリンク314に対する双方向データ通信連結を可能にする。例えば、通信インタフェース313は、対応する種類の電話回線に対するデータ通信の接続を可能にする、総合デジタル通信網(ISDN)カードもしくはモデムであってよい。もう一つの例として、通信インタフェース313は、互換性のあるLANに対するデータ通信の接続を可能にする、ローカルエリアネットワークインタフェースカード(LAN(NIC))であってもよい。周知の802.11a、802.11b、802.11gおよびブルートゥースなどのワイヤレスリンクも、ネットワークの実施例に使用してもよい。このような実施例ではいずれも、通信インタフェース313が、各種情報を表すデジタルデータストリームを搬送する電気信号、電磁信号もしくは光信号を送受信する。
ネットワークリンク314は、通常、一つもしくは複数のネットワークを経由する、他のネットワークリソースに対するデータ通信を可能にする。例えば、ネットワークリンク314は、ローカルネットワーク315を経由した、ホストコンピュータ316もしくはネットワーク記憶装置/サーバー317に対する接続を可能にする。それに加えあるいはそれとは別に、ネットワークリンク314は、ゲートウェイ/ファイアウォール317を経由して、インターネットなどの広域ネットワークやグローバルネットワークに接続してもよい。このように、コンピュータプラットフォーム301は、リモートネットワーク記憶装置/サーバー319など、インターネット318上のどこに配置されたネットワークリソースであってもアクセスすることができる。一方で、コンピュータプラットフォーム301に対しては、少なくともローカルエリアネットワーク315およびインターネット318上のいずれかのどこに配置されたクライアントからでもアクセスできる。ネットワーククライアント320とネットワーククライアント321自体とは、プラットフォーム301に類似したコンピュータプラットフォームに基づいて実現することができる。
ローカルエリアネットワーク315とインターネット318とはともに、デジタルデータストリームを搬送する電気信号、電磁信号もしくは光信号を使用する。各種ネットワークを通過する信号と、ネットワークリンク314およびコンピュータプラットフォーム301との間でデジタル信号の搬送を行う、通信インタフェース313を経由する信号とは、情報を輸送する典型的な搬送波である。
コンピュータプラットフォーム301は、インターネット318やLAN315などの多様なネットワーク(複数可)ならびに、ネットワークリンク314や通信インタフェース313を経由して、メッセージを送信し、プログラムコードなどのデータを受信することができる。インターネットを例にあげると、システム301は、ネットワークサーバーとして動作しているときには、インターネット318、ゲートウェイ/ファイアウォール317、ローカルエリアネットワーク315および通信インタフェース313を経由して、少なくともクライアント(複数可)320および321上のいずれか一方で実行されているアプリケーションプログラムに関する要求されたコードやデータを送信することもできる。同様に、システム301は、他のネットワークリソースからコードを受信することもできる。
このコードは、受信されると、プロセッサ305によって実行され、さらに/あるいは固定記憶装置308もしくは揮発性記憶装置306にそれぞれ格納されるか、後で実行できるように他の不揮発性記憶装置に格納される。このようにして、コンピュータシステム301は、搬送波の形態でアプリケーションコードを取得することができる。
最後になるが、本明細書に記載されているプロセスおよび技術は、本来、どのような特定の装置に関するものでもなく、構成要素の好適ないずれかの組み合わせによってインプリメンントできるという点を理解されたい。さらに、本明細書に記載されている教示内容に従って、さまざまな種類の汎用装置を使用することができる。また、本明細書に記載されている方法の各ステップを実行するよう、専用装置を構成すると好都合であろう。本発明について、あらゆる点で制限を課すのではなく図によって詳細に解説することを目的として、特定の例をあげて説明してきた。当業者であるならば、ハードウェア、ソフトウェアおよびファームウェアの多くの異なる組み合わせが、本発明を実施するのに好適であるということを理解するであろう。例えば、記述されているプログラムは、アセンブラ、C/C++、perl、shell、PHP、Java(登録商標)などの多種多様なプログラミング言語やスクリプト言語で実現できる。
さらに、当業者であるなら、本明細書の考察および本明細書に開示されている本発明の実施から、本発明の他の実施例が明らかになるであろう。記述されている実施形態のさまざまな態様、構成要素は、単独で、もしくは本発明の入力制御装置と任意に組み合わせて使用することができる。本明細書および実施例は、添付の特許請求の範囲に記載されている本発明の真の対象範囲および精神の下に、体表例としてのみ取り上げることを目的としている。
本発明のシステムの典型的な実施形態を示す図である。 本発明のシステムの一つの実施形態の典型的な動作順序を示す図である。 本発明のシステムを実現できるコンピュータプラットフォームの典型的な実施形態を示す図である。

Claims (21)

  1. 入力制御システムであって、
    a.マルチメディア素材を表示している画面上に特徴画像を生成する処理制御装置と、
    b.前記処理制御装置に接続されるとともに、前記特徴の画像の撮像を作成するカメラとを備え、
    前記処理制御装置が、
    i.前記特徴画像の位置を繰り返し更新するために前記特徴画像の撮像を使用するとともに、前記カメラの位置に基づいて前記特徴画像の位置を決定し、
    ii.前記繰り返しごとに、前記特徴画像の位置を記録し、さらに
    iii.前記特徴画像の前記記録された位置に基づいて、前記マルチメディア素材を変換する、
    入力制御システム。
  2. 前記特徴画像が、着色された円、着色された矩形もしくは着色された四辺形をさらに有する、請求項1に記載の入力制御システム。
  3. 前記処理制御装置が、さらに、前記特徴画像の表面積を計算し、計算された前記表面積を使用して前記カメラと前記ディスプレイとの間の距離を測定できる、請求項1に記載の入力制御システム。
  4. 前記画像の使用に、前記ディスプレイに表示されている前記マルチメディア素材から、フィルタをかけて前記特徴画像の色彩を除去することが含まれる、請求項1に記載の入力制御システム。
  5. 前記カメラが、ウェブカメラである、請求項1に記載の入力制御システム。
  6. 前記処理制御装置が、さらにスプライン曲線を使用して、前記ディスプレイ上に前記特徴画像の位置を平滑化処理できる、請求項1に記載の入力制御システム。
  7. 前記マルチメディア素材が、少なくとも2つのフレームを有し、
    さらに前記マルチメディア素材の変換処理に、前記特徴画像の前記位置とサイズとに従って、前記マルチメディア素材の前記少なくとも2つのフレームを切り取ることが含まれる、
    請求項1に記載の入力制御システム。
  8. 前記切り取られた少なくとも2つのフレームをビデオクリップに組み立てることを含む、請求項7に記載の入力制御システム。
  9. 前記処理制御装置が、さらに前記特徴画像の撮像を使用して、前記ディスプレイに対する前記カメラの角度を測定できる、請求項1に記載の入力制御システム。
  10. 前記マルチメディア素材が、複数のフレームを有し、
    前記処理制御装置がさらに、前記変換されたマルチメディア素材を使用して少なくとも2つのビデオクリップを作成でき、前記処理制御装置がさらに、前記少なくとも2つのビデオクリップ間にトランジションを内挿できる、請求項1に記載の入力制御システム。
  11. a.マルチメディア素材を表示している画面上に特徴画像を生成し、
    b.カメラを使用して、前記特徴画像の撮像を作成し、
    c.前記特徴画像の位置を繰り返し更新するために前記特徴画像の撮像を使用するとともに、前記カメラの位置に基づいて前記特徴画像の位置を決定し、
    d.前記繰り返しごとに、前記画像の前記位置を記録し、
    e.前記特徴画像の前記記録された位置に基づいて、前記マルチメディア素材を変換する、
    入力制御方法。
  12. 前記特徴画像に、着色された円、着色された矩形もしくは着色された四辺形が含まれる、請求項11に記載の方法。
  13. さらに、前記特徴画像の表面積を計算し、
    前記計算された表面積を使用して、前記カメラと前記ディスプレイとの間の距離を測定する、請求項11に記載の方法。
  14. 前記画像の使用に、前記ディスプレイ上に表示されている前記マルチメディア素材から、フィルタをかけて前記特徴画像の色彩を除去することを含む、請求項11に記載の方法。
  15. 前記カメラが、ウェブカメラである、請求項11に記載の方法。
  16. スプライン曲線を使用して、さらに前記ディスプレイ上の前記特徴画像の前記位置を平滑化処理する、請求項11に記載の方法。
  17. 前記マルチメディア素材が、少なくとも2つのフレームを有し、
    前記マルチメディア素材の変換処理に、前記特徴画像の前記位置とサイズとに従って、前記マルチメディア素材の前記少なくとも2つのフレームを切り取ることを含む、
    請求項11に記載の方法。
  18. さらに、前記切り取られた少なくとも2つのフレームをビデオクリップに組み立てる、請求項11に記載の方法。
  19. 前記特徴画像の画像を使用して、前記ディスプレイに対する前記カメラの角度を測定し、
    さらに、前記測定された角度に基づいて、前記マルチメディア素材を変換する、
    請求項11に記載の方法。
  20. 前記マルチメディア素材が複数のフレームを有し、
    さらに前記変換されたマルチメディア素材を使用して少なくとも2つのクリップを作成し、前記少なくとも2つのビデオクリップ間にトランジションを内挿する、
    請求項11に記載の方法。
  21. コンピュータに、
    a.マルチメディア素材を表示している画面上に特徴画像を生成するステップと、
    b.カメラを使用して、前記特徴画像の撮像を作成するステップと、
    c.前記特徴画像の位置を繰り返し更新するために前記特徴画像の画撮像を使用するとともに、前記カメラの位置に基づいて前記特徴画像の位置を決定するステップと、
    d.前記繰り返しごとに、前記特徴画像の前記位置を記録するステップと、
    e.前記特徴画像の前記記録された位置に基づいて、前記マルチメディア素材を変換するステップと、
    を実行させるためのコンピュータプログラム。
JP2008234458A 2007-09-19 2008-09-12 マルチメディア処理用の高性能入力制御装置、入力制御方法および入力制御用プログラム Pending JP2009076071A (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US99450107P 2007-09-19 2007-09-19
US11/869,979 US8054332B2 (en) 2007-09-19 2007-10-10 Advanced input controller for multimedia processing

Publications (1)

Publication Number Publication Date
JP2009076071A true JP2009076071A (ja) 2009-04-09

Family

ID=40454002

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2008234458A Pending JP2009076071A (ja) 2007-09-19 2008-09-12 マルチメディア処理用の高性能入力制御装置、入力制御方法および入力制御用プログラム

Country Status (2)

Country Link
US (1) US8054332B2 (ja)
JP (1) JP2009076071A (ja)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
SG152082A1 (en) * 2007-10-19 2009-05-29 Creative Tech Ltd A method and system for processing a composite video image
US10235596B2 (en) * 2013-11-06 2019-03-19 Research & Business Foundation Sungkyunkwan University System and method for transferring data using image code, outputting image code on display device, and decoding image code

Family Cites Families (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5926168A (en) * 1994-09-30 1999-07-20 Fan; Nong-Qiang Remote pointers for interactive televisions
US20010010514A1 (en) * 1999-09-07 2001-08-02 Yukinobu Ishino Position detector and attitude detector
US6738041B2 (en) * 1999-10-29 2004-05-18 Intel Corporation Using video information to control cursor position
US7852317B2 (en) * 2005-01-12 2010-12-14 Thinkoptics, Inc. Handheld device for handheld vision based absolute pointing system
US7486274B2 (en) * 2005-08-18 2009-02-03 Mitsubishi Electric Research Laboratories, Inc. Method for stabilizing and precisely locating pointers generated by handheld direct pointing devices
JP5424373B2 (ja) * 2006-03-09 2014-02-26 任天堂株式会社 画像処理装置、画像処理プログラム、画像処理システム、および画像処理方法
KR100844129B1 (ko) * 2006-09-13 2008-07-04 한국전자통신연구원 카메라를 이용한 마우스 인터페이스 장치, 이 장치에 의한시스템 및 방법, 그리고 이를 실현하기 위한 컴퓨터로 읽을수 있는 기록매체
US8144123B2 (en) * 2007-08-14 2012-03-27 Fuji Xerox Co., Ltd. Dynamically controlling a cursor on a screen when using a video camera as a pointing device
US20090066648A1 (en) * 2007-09-07 2009-03-12 Apple Inc. Gui applications for use with 3d remote controller

Also Published As

Publication number Publication date
US8054332B2 (en) 2011-11-08
US20090073267A1 (en) 2009-03-19

Similar Documents

Publication Publication Date Title
JP7139515B2 (ja) 動画撮像方法、動画撮像装置、電子機器、およびコンピューター読取可能な記憶媒体
US20180192146A1 (en) Method and Apparatus for Playing Video Content From Any Location and Any Time
JP5428210B2 (ja) 情報処理装置、撮像システム、録画制御方法及びプログラム
JP5406813B2 (ja) パノラマ画像表示装置およびパノラマ画像表示方法
US11417062B2 (en) Information processing device, information processing method, and program
JP4414708B2 (ja) 動画表示用パーソナルコンピュータ、データ表示システム、動画表示方法、動画表示プログラムおよび記録媒体
KR101791778B1 (ko) 게임 플레이 동영상에 광고 컨텐츠를 추가 적용하여 제공하는 서비스 방법
WO2022100162A1 (zh) 一种短视频中动态镜头制作的方法和装置
WO2014034256A1 (ja) 表示制御装置、表示制御システムおよび表示制御方法
JP2009177431A (ja) 動画像再生システム、サーバ装置、端末装置及び動画像生成方法等
JP2010183384A (ja) 撮影カメラ学習装置及びそのプログラム
US9426408B2 (en) Method and apparatus for recording video sequences
US20230317115A1 (en) Video framing based on device orientation
JP2009076071A (ja) マルチメディア処理用の高性能入力制御装置、入力制御方法および入力制御用プログラム
US10474743B2 (en) Method for presenting notifications when annotations are received from a remote device
US20220264008A1 (en) Image processing device, image processing method, and program
US20170069354A1 (en) Method, system and apparatus for generating a position marker in video images
JP5646033B2 (ja) 画像表示装置および画像表示方法
JP4934066B2 (ja) 情報生成装置、情報生成方法及び情報生成プログラム
JP2004241834A (ja) 動画像生成装置及び方法、動画像送信システム、プログラム並びに記録媒体
US20230360333A1 (en) Systems and methods for augmented reality video generation
JP2010045539A (ja) 情報処理装置及びその制御方法
JP2004020960A (ja) クライアント装置、画像表示処理方法およびクライアントサーバシステム
JP2004078314A (ja) 画像入力装置の制御方法、カプセル化文書及び記憶媒体
KR20040093224A (ko) 멀티 프로젝터 및 그 제어방법