JP4901040B2 - ビデオストリームにおける移動物体のマーキング - Google Patents

ビデオストリームにおける移動物体のマーキング Download PDF

Info

Publication number
JP4901040B2
JP4901040B2 JP2001522419A JP2001522419A JP4901040B2 JP 4901040 B2 JP4901040 B2 JP 4901040B2 JP 2001522419 A JP2001522419 A JP 2001522419A JP 2001522419 A JP2001522419 A JP 2001522419A JP 4901040 B2 JP4901040 B2 JP 4901040B2
Authority
JP
Japan
Prior art keywords
frames
video
location
frame
interactive
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP2001522419A
Other languages
English (en)
Other versions
JP2003509880A (ja
Inventor
ヤコヴ カメン
レオン シャーマン
Original Assignee
ジェイエルビー ヴェンチャーズ リミテッド ライアビリティ カンパニー
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Priority claimed from US09/390,047 external-priority patent/US6570586B1/en
Application filed by ジェイエルビー ヴェンチャーズ リミテッド ライアビリティ カンパニー filed Critical ジェイエルビー ヴェンチャーズ リミテッド ライアビリティ カンパニー
Publication of JP2003509880A publication Critical patent/JP2003509880A/ja
Application granted granted Critical
Publication of JP4901040B2 publication Critical patent/JP4901040B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/80Generation or processing of content or additional data by content creator independently of the distribution process; Content per se
    • H04N21/85Assembly of content; Generation of multimedia applications
    • H04N21/858Linking data to content, e.g. by linking an URL to a video object, by creating a hotspot
    • H04N21/8583Linking data to content, e.g. by linking an URL to a video object, by creating a hotspot by creating hot-spots
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/40Information retrieval; Database structures therefor; File system structures therefor of multimedia data, e.g. slideshows comprising image and additional audio data
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/70Information retrieval; Database structures therefor; File system structures therefor of video data
    • G06F16/74Browsing; Visualisation therefor
    • G06F16/748Hypervideo
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/93Document management systems
    • G06F16/94Hypermedia
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/955Retrieval from the web using information identifiers, e.g. uniform resource locators [URL]
    • G06F16/9558Details of hyperlinks; Management of linked annotations
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/20Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
    • H04N21/23Processing of content or additional data; Elementary server operations; Server middleware
    • H04N21/234Processing of video elementary streams, e.g. splicing of video streams or manipulating encoded video stream scene graphs
    • H04N21/2343Processing of video elementary streams, e.g. splicing of video streams or manipulating encoded video stream scene graphs involving reformatting operations of video signals for distribution or compliance with end-user requests or end-user device requirements
    • H04N21/234318Processing of video elementary streams, e.g. splicing of video streams or manipulating encoded video stream scene graphs involving reformatting operations of video signals for distribution or compliance with end-user requests or end-user device requirements by decomposing into objects, e.g. MPEG-4 objects
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/20Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
    • H04N21/23Processing of content or additional data; Elementary server operations; Server middleware
    • H04N21/235Processing of additional data, e.g. scrambling of additional data or processing content descriptors
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/43Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
    • H04N21/435Processing of additional data, e.g. decrypting of additional data, reconstructing software from modules extracted from the transport stream
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/47End-user applications
    • H04N21/472End-user interface for requesting content, additional data or services; End-user interface for interacting with content, e.g. for content reservation or setting reminders, for requesting event notification, for manipulating displayed content
    • H04N21/4722End-user interface for requesting content, additional data or services; End-user interface for interacting with content, e.g. for content reservation or setting reminders, for requesting event notification, for manipulating displayed content for requesting additional data associated with the content
    • H04N21/4725End-user interface for requesting content, additional data or services; End-user interface for interacting with content, e.g. for content reservation or setting reminders, for requesting event notification, for manipulating displayed content for requesting additional data associated with the content using interactive regions of the image, e.g. hot spots
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/80Generation or processing of content or additional data by content creator independently of the distribution process; Content per se
    • H04N21/85Assembly of content; Generation of multimedia applications
    • H04N21/858Linking data to content, e.g. by linking an URL to a video object, by creating a hotspot
    • H04N21/8586Linking data to content, e.g. by linking an URL to a video object, by creating a hotspot by using a URL
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N7/00Television systems
    • H04N7/16Analogue secrecy systems; Analogue subscription systems
    • H04N7/162Authorising the user terminal, e.g. by paying; Registering the use of a subscription channel, e.g. billing
    • H04N7/165Centralised control of user terminal ; Registering at central

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Theoretical Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Signal Processing (AREA)
  • General Physics & Mathematics (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Human Computer Interaction (AREA)
  • Computer Security & Cryptography (AREA)
  • General Business, Economics & Management (AREA)
  • Business, Economics & Management (AREA)
  • Television Signal Processing For Recording (AREA)
  • Processing Or Creating Images (AREA)
  • Complex Calculations (AREA)
  • Image Analysis (AREA)
  • User Interface Of Digital Computer (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Description

【0001】
(技術分野)
本出願は、ビデオストリームにおける物体のマーキングに関する。
【0002】
(背景技術)
インタラクティブリンクを用いてビデオストリームにおける物体に注釈付けすること即ち「マークする」ことは、当技術分野では周知である。例えば、自動車レースのビデオプログラムを見て、コースを回りながら走行する何台ものレーシング・カーが表示されていることを想定する。また、これらの車はインタラクティブリンクでマークされていたとする。このことは、それらの車の1台の画像にカーソルを置き、該画像をクリックできることを意味する。このことにより、ビデオ画面を制御しているシステムは、その画像にリンクされている情報を表示することができる。このリンクはURL形式をとることができ、該システムはクリックされた車又はドライバーに関する情報を示すウェブページを表示する。
【0003】
物体を「マークする」と、「活動領域(インタラクティブ領域)」として、その物体を取り巻く(又はその物体付近に)ビデオ画面の領域が設定される。観察者が次に該活動領域をクリックすると、リンクが呼び出される。上述の例を再度参照すると、レーシング・カーの1台がマークされたならば、そのレーシング・カーの画像を取り巻いて、又はその画像付近に活動領域ができる。観察者がカーソルをその「活動領域」に動かし、その活動領域をクリックすると、上述のリンクが呼び出される。
【0004】
レーシング・カーのビデオの中で、その車は常に動いており、ビデオ画面上のその位置は常に変わる。従って、その車に対応している活動領域は常に変化し、その車に「ついていく」必要がある。このため、ビデオの各フレームは、その車に対する適切な活動領域でマークされなくてはならない。多くの場合、これは画像認識により達成される。換言すると、編集処理中に、その車がビデオ画面の右側から左側に移動したかどうかをビデオ編集装置が認識する。この移動が起きると、編集装置は、車が画面の左側にあるビデオフレームにおいて画面の左側にその車についての新たな活動領域を設定する。残念なことに、画像認識には幾つかの問題がある。例えば、画像認識システムは通常、物体の色を利用してその位置を追跡する。例えば物体に影が投げかけられているため光線の当たり方が変化している領域に該物体が移動した場合には、それは、正確な画像認識を妨げる恐れがある。更に、画像認識は、その他に物体のマーキング処理に誤差を誘発させる可能性のある問題がある。
【0005】
画像認識は当技術分野では周知であり、J.P.ルイスによる「高速正規化相関関係(Fast Normalized Cross−Correlation)、http://www.idiom.com/―zilla/Papers/nvisionInterface/nip.htm、 ワルチ等の米国特許第5、267、332号、 ネトラヴァリ等の米国特許第4、611、347号、 ワトソンIII世の米国特許第4、868、871号、 1973年にJohn Wiley and Sonsから出版されたR.O.デューダ等の「図形分類及び場面分析(Pattern Classification and Scene Analysis)」、及び1992年にAddison−Wesleyから出版されたR.C.ゴンザレツ等の「デジタル画像処理(Digital Image Processing)」第3版の中で論じられている。ルイス、ワルチ、ネトラヴァリ、ワトソン、デューダ及びゴンザレツは、引用によりここに組み入れる。
【0006】
画像認識装置を用いる代わりに、ビデオの各フレームを手動によりマークすることもできる。しかし、ビデオの各フレームをマークすることは、非常に退屈で多くの時間がかかるものである。必要なことは、移動物体のマーキングに関し、求められる人的介入の程度を削減する新たな方法である。
【0007】
(発明の開示)
本発明による方法は、リンクを用いてビデオクリップに注釈付けするステップを含む。(ビデオクリップは、アニメーションでもよく、ここでは、「ビデオ」はアニメーションを含む。)リンクは、ウェブページ又はその他の情報源へのリンク、又はアプリケーション・ソフトウェアへのリンクでもよい。一つの実施形態において、ビデオクリップ内のフレームの第1セットは、例えばビデオ編集装置を用いて注釈付けされる。この注釈付けステップ中に、各注釈付けフレームの一部が「活動領域」として指定される。このことは、該活動領域にカーソルを移動し、該活動領域内においてクリックした場合には、該活動領域と関連したリンクが実行されることを意味する。
【0008】
活動領域は、具体的には、例えばコースを回りながらレースをする車、ある場面の俳優、コマーシャルに表示される商品、漫画キャラクター、又はその他の人物や物など、一つの物体の画像と関連する。従って、フレームへの注釈付けの間に、ビデオクリップに注釈付けをする者は、その物体と関連する活動領域の位置を設定する。(活動領域は、具体的には、問題となっている物体を取り囲む四角形又は円形の区画である。)
【0009】
この方法において、ビデオクリップのすべてのフレームに注釈付けをすることは極めて厄介なことである。そのため、本発明では、フレームのサブセット(例えば、10番目のフレーム毎)にのみ注釈付けをする。その他のフレームの活動領域の位置は補間によって設定される。該位置は、直線補間技術によって設定できる。もう一つの選択肢として、該位置はスプライン曲線補間技術など、曲線を作り出す補間技術によっても設定できる。
【0010】
本発明による方法の別の実施形態において、フレームのサブセットは、例えば、一連のしたフレーム関し最初と最後のフレームのような2つのフレームが、手動により注釈付けされる。次に、ビデオ編集システムは、補間アルゴリズムに基づいてこれら一連の手動注釈付けフレーム間の各フレームに対して、活動領域の位置を計算する。引き続き、該システムはフレーム毎に、補間された活動領域の位置と、該活動領域が関連する物体の位置との間のズレを判定する。この計算は画像認識に基づくものである。画像認識は画像認識ソフトウェアによって実行可能である。或いは、画像認識はハードウェア及びソフトウェアの組み合わせによっても実行できる。(画像認識は又、ハードウェアによる実行も可能である。ハードウェアとソフトウェアとの間の分離は種々の方法で実行できる。)その後、該システムは、システムが最も大きな誤差を示していると判断したフレームを強調表示する。換言すると、該システムは、活動領域と該活動領域に関連する物体との間の距離が最大となるフレームを強調表示する。当業者であれば、選択した領域と該物体内の点との間の最大、最小、又は平均距離に基づいて、活動領域と該物体との間の距離を決めることができる。
【0011】
一つの実施形態において、該システムは最大の誤差をともなうフレームにフラグを立てる。別の実施形態において、そのシステムは、nを整数としたとき、n番目までの最大誤差をともなうn個のフレームにフラグを立てる。別の実施形態において、該システムは、誤差が一定の限界を超えているフレームのすべてにフラグを立てる。
【0012】
その後で、ビデオクリップに注釈付けをする者は、フラグが立てられたフレームを確認し、それらフレームに手動による注釈付けを望むかどうかを決める。ビデオクリップに注釈付けをする者には、補間の再計算という選択肢もある。補間の再計算後にユーザは、手動注釈付けが求められるその他のフレームにフラグが立てられているかどうかを確認できる。
フラグ立ては、表示上にフラグが立てられたフレームを強調表示することにより、又は、その他の形式の出力インジケータを設けることにより達成することができる。
【0013】
本発明の別の態様によれば、一つ又はそれ以上の観察者がビデオ信号を観察できるように、ビデオ信号は、一つ又はそれ以上のビデオ表示システムに送られる。ビデオ信号は多数の観察者に配信できる。ビデオ信号のフレームの幾つかについては、ビデオ信号に関連した一つ又はそれ以上の活動領域の位置が、一つ又はそれ以上のビデオ表示システムに通信されるが、ビデオ信号のその他のフレームについては通信されない。一つ又はそれ以上のビデオ表示システムは、補間によって、その他のフレームについて一つ又はそれ以上の活動領域の位置を判定する。このように、各々のフレームについて活動領域位置に関するデータをビデオ表示システムに提供する代わりに、このデータは、選択されたフレームについてのみ提供され、更に、ビデオ表示システムは、例えば直線補間技術又はスプライン曲線補間技術を用いた補間により、その他のフレームの活動領域がどこにあるべきかを計算する。ビデオ信号源が信号の各フレームに対して活動領域情報を提供する必要がないため、この情報を通信するための帯域幅条件は緩和される。
一つの実施形態において、活動領域の位置がこのようにして通信されるだけでなく、活動領域の大きさも又、この方法で同様に通信される。
【0014】
本発明の別の態様によると、一組のフレームを含むビデオ信号が、フレームの幾つかについての活動領域の位置と共に通信され、それ以外のフレームについては通信されない。該活動領域は、それらフレームに表示された物体に対応する。該物体は、製品、人物、漫画キャラクター、又はビデオで表示することができるものなら何でも良い。上述したように、物体は、上記他のフレームに表示されているが、該他のフレームについては活動領域は通信されない。受信システムは、フレームの前記幾つかについての活動領域の位置に基づく補間によって、活動領域の位置を計算する。こうして、活動領域の位置を通信するための帯域幅条件が緩和される。
【0015】
(発明を実施するための最良の形態)
図1は、編集機能をマークするための一般的なグラフィカル・ユーザ・インターフェース(「GUI」)を図示した表示画面100を示す。このようなインターフェースは、本発明による方法の実施に用いることができる。画面100は、編集領域にある一連のいわゆるキーフレーム101aないし101pを示す。当業界では周知のように、ビデオ画像は一連のフレームを含む。デジタルビデオの場合には、各フレームは画素配列に相当する。各画素は、フレームの小領域の色、輝度及び彩度に相当するデータ値である。ある種のビデオ圧縮又は暗号化方式においては、画素配列の全てをフレーム全てについて格納するのに代えて、ある「キー」フレームについてのみ画素配列全体を格納する。その他のフレームと先のキーフレームとの間における画像の相違を表わすだけのデータが、その他のフレームのために格納される。この方式を用いる圧縮技術の例はMPEG−2(動画専門グループ標準2)である。
【0016】
圧縮又は暗号化されていない線形的にデジタル化されたアナログビデオの場合には、n番目毎のフレーム(例えば10番目毎のフレーム)を(場面変化に対応するフレームと共に)キーフレームとして選択することができる。上述したように、画面100は、一連のキーフレーム101aないし101pを図示する。
矢印104aないし104dは、画面100に図示されるわけではない。むしろ、単に一連のフレームに時間的順序を象徴するために、矢印104aないし104dが図1に含まれている。
【0017】
画面100は、キーフレーム101aないし101pの一つを図示する区画106を含む。区画106の画像は、画面上の他の場所にあるキーフレーム101aないし101pの図と比べて拡大されており、現在編集中のフレームを示す。図1の例では、キーフレーム101gが編集中である。このことは、フレーム101gに置かれたアイコン即ちマーク101g’の存在によって示される。
通常、画面100は、早送り、早戻し、新規ファイル等の機能のためのナビゲーションバー及びツールバーも示している。ディスプレイ100を駆動するシステムは、ナビゲーションバー及びツールバーを維持するソフトウェアの駆動部を含む。これらナビゲーションバー及びツールバーは、簡略化のために図1には示されていない。
【0018】
さらに画面100には、物体の周りにある活動領域の形をユーザに選択させ、観察者がクリックできるようにするメニューボックス108が示される。図1には、その一部しか示されていないが、ボックス108は、編集機能に、活動領域について多数の異なる形の中から選択できるようにしている。上述したように、活動領域は、興味の物体(例えば自動車又は人物)が示されている画面上の位置である。その物体又は人物と関連する活動領域内でクリックすることにより、観察者が実際にその物体又は人物をクリックすることになる。
【0019】
(観察者が最終的にビデオクリップを見るときは、活動領域が表示されていても、或いは表示されていなくてもよい。例えば、ビデオが表示されるシステムは、活動領域を強調表示してもよい。或いは、ビデオが表示される他のシステムは、活動領域を強調表示しなくてもよい。更に別のシステムにおいては、観察者が活動領域を強調表示するかどうかを決める選択権を有してもよい。)
【0020】
図1を再び参照すると、ボックス110は、編集機能がリンク、具体的にはURLのようなリンクを画像に導入できるようにするメニューボックスである。しかし、所望のアプリケーション・ソフトウェアを起動する専用リンクを含む他の形式のリンクを設けることもできる。
図1から明らかなように、区画106は、頭部113が正方形114によってマークされ、リンクL1にリンクされた人物112を図示している。(正方形の形はメニューボックス108で選択され、リンクL1はメニューボックス110で選択されたものである。)正方形114は活動領域を表わす。ビデオ場面の動作中に、物体(例えば人物の頭部)は通常、制限された、急激な動きとならないように動く。(映画、テレビ番組又はその他のビデオを撮影中の適切なカメラ操作は通常、画面上の興味のどんな物体の急激な動きをも最小にすることを含む。又、急激な動きをする小さな物体は、たとえ近接しながら追随しても、注釈付きビデオを見るときに観察者が照準を合わせるのは難しい。)
【0021】
正方形114は、人物112にリンクされた情報にアクセスしたい場合に、観察者がクリックするビデオ画面の活動領域を示す。例えば、ビデオがメロドラマであり、人物112によって演じられる役柄について更に詳しい情報を得たい場合には、観察者は、人物112をクリックし、具体的には、正方形114によって示される活動領域内にカーソルを置く。
ビデオ中は、人物112は通常、セットを動き回る。従って、活動領域114を画面のあちこちに動かすことが必要である。このことが必要となるのは、人物112がビデオ画面の左側から右側まで歩き、観察者が更に、人物112についてもっと見たいと思う場合に、人物112の現在の位置をクリックしたいと思うためである。
【0022】
基本的に、人がビデオの各フレームに注釈付けを行い、活動領域114がどこに位置付けされるべきかを判断することはできるが、このことは極めて退屈で時間のかかる作業である。従って、この作業を簡素化することが望ましい。本発明によれば、フレームの幾つかは、適切な位置に活動領域114を置くことにより注釈付けがなされる。(このことは手動又は他の技術手段を介して実行できる。)その他のフレームは、下記の補間方法によって注釈付けされる。
【0023】
図2は、開始フレームAから終了フレームDまでの一連のフレームの中の各フレームについて、y方向に沿ったビデオ内の頭部113の位置を示す。点203は、場面開始時における頭部113の開始位置を表し、点204は、その場面の終了時における頭部113の終了位置を表す。線206は、その場面が進行するときに点203及び204間で頭部113が動く位置を追跡する。(ビデオ中に、例えば人物112がセットを動き回るときに、頭部113は位置を変える。)
線208は、203及び204の2点間に直線を設けることによって生じる直接的直線補間を示している。換言すると、手動により各フレームに注釈付けをするのではなく、活動領域114の位置は、203及び204の2点間で直線補間を実行することによって自動的に各フレームに挿入される。明らかなように、これは、必ずしもフレームの注釈付けの最も正確な方法というわけではない。手動による注釈付けが行なわれるフレームの数を多くし、手動による注釈付けが行われる各フレームの間で直線補間をすることによって、直線補間の精度を改善することができる。
【0024】
図2は又、中間点216、218を示し、それぞれフレームB及びCにおける頭部113の位置を示す。一つの実施形態において、活動領域114の位置は、例えばフレームA、B、C、Dのような一組のフレームについて(例えば目で見て)手動により挿入される。活動領域114の位置は、手動により活動領域114の位置に注釈付けされた各点間の直線補間によって設定される。このように、図2の線224、226及び228は、それぞれ点203と216間、点216と218間、及び点218と204間で、直線補間を行った結果である。
【0025】
補間をより正確に行う方法は、フレームからフレームへの物体の位置を表す曲線を生成させる補間技術を用いる方法である。こうした技術の一例としてスプライン曲線補間がある。スプライン曲線補間を実行する際には、通常は、終了点及び1箇所又は2箇所の中間点だけが必要であり、スプライン曲線補間技術により正確にその物体を追跡することになる。スプライン曲線は、動作を滑らかにし、画像認識に見られがちなブレを排除する。
物体の位置をy方向に設定する必要があるだけでなく、x方向にも設定する必要があることが分かるであろう。このように、本発明による方法の実施においては、活動領域の位置は、y及びxの両方向に対する補間によって設定されることになる。さらに、活動領域と関連する物体は、例えば、それがカメラに近づいたり、カメラから離れたりするため、ビデオ場面の進行中に拡大又は縮小することになる。従って、一つの実施形態において、活動領域114の大きさも1場面中の幾つかのフレームに対して手動の註釈付けがなされ、引き続いて、活動領域の大きさは、その物体の位置と同様の方法で補間される。
【0026】
図3は、本発明の第1実施形態による方法を説明するブロック図である。図3を参照すると、その方法は、一群のビデオフレームをメモリーにロードすることから始まる(ステップ301)。メモリーは、磁気メモリー(例えば磁気ディスク、磁気テープ又は光磁気ディスク)とすることができる。メモリーは又、光ディスク又はDRAM、SRAM、EPROM等の半導体メモリー、又は他の形式のメモリーでもよい。ビデオ情報は、アナログ方式又はデジタル方式のどちらでもよい。
【0027】
その後、手動により、これらフレームの一部の組に註釈付けをする(ステップ302)。この手動註釈付けステップの間は、一連のフレームは通常、画面100の区画101aないし101pに表示され、一度に、それらのフレームの一つが、註釈付けのために選択可能である。選択されたフレームは、画面100の区画106に表示される。活動領域の位置、大きさ及び形状は、註釈付けがされるフレーム内において設定され、次いで、該活動領域と関連するリンクが設定される。手動の註釈付けは、マウス、タッチパッド、ジョイスティック、トラックボール、カーソル・コントロール・キー、又はビデオ編集システムのその他の入力装置を用いて実行できる。このステップの間に、註釈に関する情報は、例えば下記で説明するように、メモリーに格納される。
【0028】
手動により注釈付けがされないフレームについて、註釈付けは、補間によって行われる(ステップ303)。これは、以下のステップのいずれかによって行うことができる。
a)活動領域の位置に関する直線補間及び活動領域の大きさに関する直線補間、
b)活動領域の大きさに変化のない活動領域の位置に関する直線補間、
c)活動領域の位置に関するスプライン曲線補間及び活動領域の大きさに関するスプライン曲線補間、又は
d)活動領域の大きさに変化のない活動領域の位置に関するスプライン曲線補間。
直線又はスプライン曲線補間の代わりに、その他の補間技術が使用可能である。例として、補間は以下の場合に可能である。
a)ビデオクリップにおける開始フレームと終了フレームとの間、又は
b)手動により註釈付けされた各フレームから手動により註釈付けされた次のフレームへの補間。(具体的には、該クリップの開始及び終了フレームは、手動により註釈付けされるフレーム中にある。)
【0029】
ブロック304を参照すると、補間が活動領域の位置に誤差を生む可能性がある。換言すると、物体の位置及び該物体に関連する活動領域の位置の間に差異が生じることがある。補間後、ビデオクリップに註釈付けした者は、画面100の区画101aないし101pの様々なフレームに関する活動領域の位置を目で確認することができる。フレームの一つが物体113の位置及び活動領域114間に大きな相違を示す場合には、ビデオクリップを編集する者は、そのフレームに手動により註釈付けを行い、更に手動により註釈付けを行っていないフレームに関しては、活動領域の全位置を編集システムに(例えば補間によって)再計算させる。
【0030】
活動領域114の位置の設定後にビデオクリップに註釈付けする者は、ユーザ向けに提示されたリンク形式を選択する。ボックス型、円、楕円又はその他の形状のものを用いる代わりに、活動領域は、ロゴ(例えばGIFファイル)、アニメ−ションの一つ(例えばアニメ化されたGIFファイル)又はその他のビデオストリーム断片で表すことが可能である。(GIFはグラフィックス・インターチェンジ・フォーマットの頭文字である。)上述したように、活動領域は、註釈付けされたビデオクリップを後で確認するとき、任意に、目で見て示すことができる。
ブロック306を参照すると、補間の前後のいずれかで、URLへのリンクを各活動領域に関連させることができる。このように、観察者が該活動領域をクリックすると、該URLが呼び出される。上述したように、該リンクはURLに対するものである必要はない。それは、アプリケーション・ソフトウェア、又は特定のアドレスに格納された情報源へのリンクでもよい。
【0031】
図4は、ビデオクリップをマークするために用いられるビデオ編集機能/プレーヤの一実施形態を図解するデータ・アーキテクチャである。このようなビデオ編集機能/プレーヤは、多数のビデオクリップを収納する大容量データ記憶装置406を含む。大容量データ記憶装置は、磁気ディスク、光磁気ディスク、光ディスク、半導体メモリー又はその他の形式のメモリー記憶装置でもよい。
一つ以上のビデオクリップ及び註釈ファイルが記憶装置406に格納されているが、簡略化のために図4においては、一つのビデオクリップ420aだけが、一つの対応する註釈ファイル421aと共に示されている。一つのビデオクリップにつき一つ以上の註釈ファイルが存在してもよい。註釈ファイルは、(公式として、又は予め決められたスプライン曲線型のセットに関連するものとして、いずれかの)スプライン曲線及びその関連パラメータ、リンク自体、及び活動領域のマーカの色や大きさ等のものを含んでいる。要素450は、テーブル又はデータベースであり、一連のフレームの各ビデオに関連する全ラベルを含み、かくしてビデオ提供用ディレクトリとして役立つ。そこには当然、映写に関する幾つかのデータベース及び註釈ファイルがあってもよく、階層構造において可能な限り体系化され、行われる編集によっては、それらはファイル420又は421の一部を共有してもよい。
【0032】
一つの実施形態において、註釈付けの間に、データは、フレーム番号、活動領域の位置、その形状、その大きさ及び該活動領域に関連するURL又はその他のリンクに対応するメモリーにロードされる。該データは、通常独立したファイルにあって、ビデオ信号と共に観察者に提供される。この情報は独立したデータ・ストリームとして観察者に提供可能である。観察者のビデオ表示システムは、フレーム番号を追跡し、各フレームについてそのフレームに対して設定された活動領域の一つの中に、カーソルが位置付けられているかどうかを判断する。
別の実施形態において、活動領域の位置、その形状、大きさ、及びリンクに関する情報が、ビデオ信号の一部として通信され、組み込まれる。この情報は、該信号の一つの空白時間の間に、又は通常使用されない信号がその他の区画にある間に、提供される。
【0033】
(補間誤差が最小化又は修正化される実施形態)
図2に明らかなように、補間を用いてビデオ画面に活動領域を設定する場合には、マークされた物体の位置と該活動領域の位置との間に誤差が存在することがある。本発明の別の実施形態によると、こうした誤差は、下記の技術により減少即ち最小化することができる。
1.ビデオフレームの一群がメモリーにロードされる(図3のステップ301)。
2.n個のフレームの第1の組が手動により註釈付けられる。但し、nは2よりも大きいか又は等しい(図3ステップ302)。n個のフレームは、ビデオ配列において開始フレーム及び終了フレームとすることができる。
3.手動により註釈付けされていないビデオ順列内にあるフレームについて、活動領域の計測位置を設定するために補間が実行される(図3のステップ303)。補間は、直線補間により実行可能である。或いは、補間はスプライン曲線技術など、結果として曲線にする技術によることが可能である。上述したように、線又は曲線を生成するために幾つかの補間技術を用いることができ、ビデオクリップに註釈付けをする者が、その内から選択することができる。
4.手動による註釈付けがされていない各フレームについて、ビデオシステムは、活動領域と該活動領域が関連する物体との間の距離を計算する。(活動領域の位置は補間によって設定される。物体の位置は、例えば上述したような自動化された画像認識技術によって設定される。上で指摘したように、画像認識は正確な場合も、そうではない場合もある。)
5.システムは、活動領域114と該活動領域が関連する物体113とのの間の距離が最大であるフレームにフラグを立てる。システムは、こうした距離を示すフレーム(例えば一つ又はそれ以上のフレーム101aないし101p)を強調表示すること及びそれらのフレームにアイコン又はその他のマーカをつけることができ、又はユーザに対してこれらフレームを識別するための他の技術を用いることができる。ユーザは、これらのフレームを見て、活動領域が、実際に、その関連する物体から容認できない距離にあるかどうかを確認することができる。
6.ユーザがこの距離は容認できないと考える場合には、容認できない誤差を示しているフレームに手動により註釈付けすることができる(図3のステップ304)。
7.容認できない誤差を示しているフレームに手動により註釈付けをした後に、ユーザは、システムに、新たな手動註釈を含むデータに基づいて活動領域の位置を(例えば再び補間によって)再計算させることができる。
8.任意に、ユーザは、システムに新たに補間された活動領域の位置を取らせ、最大誤差を有するフレームのリストを別に設定させることができる。ユーザがこれら誤差を容認でき、又は画像認識誤差に関する単なる間違いの結果であると気付いた場合には、それらを無視することができる。
9.次に、活動領域の形状(及び任意に、視覚インジケータ)及びリンクを活動領域に関連付ける。
【0034】
上述したように、図3のステップ304の間に、ユーザは、システムに、活動領域及び該活動領域と関連する物体の間の距離を計算させ、画面100の区画101aないし101pに示された容認できない誤差を有するフレームにフラグを立てさせることができる。該ユーザは、上述したように容認できない誤差を示しているフレームに手動により註釈付けすることができる。(この手順は、活動領域の(x及びyの両軸に沿った)位置及び大きさの両方を調整するために用いることができる。)
【0035】
(活動領域に関する情報のテレビ観察者への通信)
ビデオフレームが活動領域に関する情報によりマークされた後に、その情報を観察者のビデオシステムに通信する必要がある。図5は、送信されるべきビデオプログラムを格納する区画520を内蔵する大容量データ格納装置506を含んだビデオ送信システム500を図解している。該ビデオプログラムは、スポーツ競技、メロドラマ、教育番組、漫画及びその他のアニメーションなど、どのような形式の番組でもよい。又、大容量記憶装置506内には、註釈情報を有する区画521が含まれる。この註釈情報には、a)ビデオプログラムの様々なフレームに関連した幾つかの活動領域の位置、b)それら活動領域の大きさ、及びc)それらの活動領域が関連するリンク、が含まれる。(該リンクはURL方式でよい。)換言すると、註釈情報は、ビデオプログラムの特定のフレームにおいては、ビデオフレームの左上方部に位置する第1活動領域があり、その活動領域は、ある大きさを有するということを指示している場合がある。観察者がその活動領域をクリックしたならば、それにより、特定のウェブページへのリンクが起動されることになる。
【0036】
大容量記憶装置506は、磁気ディスク、磁気テープ、光又は光磁気媒体、又はその他のデータ格納構造等、いかなる形式の大容量記憶装置でもよい。
大容量記憶装置506からの情報は、ビデオ信号を抽出し、そのビデオ信号を従来型送信装置504に送るデータ分離回路505に送信される。(データ分離回路505は通常、サーバである。)テレビシステム501は、ビデオ信号を受信する受信機511を含む。図5は、ビデオ信号が従来のテレビ無線信号として送受信されることを示す記号を含み、該ビデオ信号は、例えば電気ケーブル、光ケーブル、マイクロ波衛星通信、電話回線、インターネット、又はその他の信号通信技術等のその他手段により通信することができる。
【0037】
註釈情報(例えば活動領域に関連するURL情報を伴う該活動領域の位置及び大きさ)は、該ビデオ信号を通信する媒体と同じ、又は異なる通信媒体503を経由してテレビシステム501に通信される。このような通信媒体503は、従来型無線信号、電気ケーブル、光ケーブル、マイクロ波、衛星通信、電話回線、インターネット、又はその他の信号通信技術でもよい。
【0038】
註釈情報は、前処理装置512によって受信される。前処理装置512は、そのデータが送信システム500により提供されないそれらのフレームについて、補間技術を介して各フレームのそれぞれの活動領域の位置を計算する。一つの実施形態において、補間技術は、例えば図2に関して上述したように直線補間技術である。例えば、送信システム500が、10番目のフレーム毎に、活動領域のための位置を提供すると仮定する。図6は、それぞれ、点600、601、602及び603で示されるフレーム0、10、20及び30の活動領域のy座標の値を表している。直線補間技術を用いる場合に、活動領域のy座標は、線604、605及び606により設定されると仮定される。特定の点間に直線に代わって曲線を生成する技術など、その他の補間技術が使用可能である。例えばスプライン曲線補間技術を用いることができる。スプライン曲線計算パラメータによるスプライン曲線補間技術が用いられる場合には、活動領域のy座標は曲線607に沿ったものになると仮定される。
【0039】
図6は、フレーム番号に対する活動領域のy座標を表している。同様の計算が活動領域のx座標、及び活動領域の大きさに対して実行される。(活動領域の大きさは、例えば活動領域と関連する該物体がカメラに向かってくるか、又はカメラから遠ざかって行くかによって、拡大又は縮小させることができる。)
【0040】
図5を再び参照すると、前処理装置512は、ビデオ信号をビデオ表示装置514に送ることが分かる。前処理装置512は、ユーザ・インターフェースに接続されている。ユーザ・インターフェース513は、ユーザに、例えば活動領域の位置を示すマーカが画面上に表示されるかどうかなど、表示装置514に表示される画像に関する機能を操作できるようにする。ユーザ・インターフェース513は、次に、ユーザに様々な活動領域をクリックさせ、それと関連するリンクを起動させることができるようにする。
【0041】
ユーザ・インターフェース513は通常、トラックボール、マウス、タッチパッド又はジョイスティック等の適切な操作手段を有する。このインターフェースは、観察者がどの物体をクリックしようとしているのかが分かるようにビデオ表示装置514上に目に見えるカーソルを位置付けるために用いられる。前処理装置512は、カーソルが活動領域上に位置付けられたかどうかを判定する。一つの実施形態において、前処理装置512はマイクロ・プロセッサ・システムを含む。
【0042】
上述したように、本発明の一つの実施形態において、選択されたフレームの活動領域は、例えば手動による註釈システムを用いて設定される。活動領域は、ビデオフレームに表示される物体に関連する。この方法の実施中に、各活動領域の位置、大きさ及び形状は、ビデオクリップのフレームの一部(全部ではない)に対して設定される。ビデオクリップのその他のフレームについては、活動領域の位置及び大きさは、補間することによりフレーム間で設定される。一つの実施形態において、手動により註釈付けされたフレームの活動領域の位置及び大きさがビデオシステム501に通信される。その他の実施形態においては、現在位置及び大きさが通信されるフレームは、他の基準に基づいて選択される。例えば、10番目毎のフレームについての活動領域の位置及び大きさを、受信ビデオシステム501に通信することができる。或いは、ビデオクリップのいわゆる「キーフレーム」に対してのみ活動領域の位置及び大きさを通信することができる。(上述したように、ある種のビデオ圧縮アルゴリズムは、ある種のキーフレームに対してのみ画素配列全体を通信する。その他のフレームについては、一つのフレーム及びその次のフレームの間の変化に対応する情報のみが通信される。キーフレームは、画素配列全体が通信されるフレームである。)
【0043】
図5を再び参照すると、一つの実施形態において、ワーク・ステーション550が、ビデオ送信システム500に接続できる。ワーク・ステーション550は、パーソナル・コンピュータ(「PC」)551及びローカルメモリー記憶装置552(例えばディスク)又は編集ソフトウェア553を内蔵するその他の非ローカル記憶装置(例えばサーバ)を含む。ワーク・ステーション550は、ビデオクリップに註釈付けするために用いられる。この例では、ワーク・ステーション550は通信回線554を経由してサーバ505に連結されているが、ワーク・ステーション550をサーバ505にネットワーク接続するために他の多くの方法を用いることができる。幾つかの実施形態においては、編集ソフトウェア553はサーバ505で動作できる。その他の実施形態において、ファイル(ビデオ及び註釈ファイルの両方)はローカルメモリー552に属することができる。
【0044】
本発明は具体的な実施形態に関して説明してきたが、当業者であれば、本発明の趣旨及び範囲から逸脱することなく、変更が適切かつ詳細になし得ることが理解されるであろう。例えば、ビデオフレームの画素は、RGB値によって格納できる。(RGBは、画素と関連する赤、青及び緑色の素子の値を指す。)或いは、画素値が、色、彩度及び輝度によって格納できる。画面100及び/又はビデオ表示装置514は、CRT画面及びLCD、プロジェクションディスプレイ、又はその他の適切な表示技術でもよい。様々な形式のビデオ編集/註釈付けシステムを用いて本発明の方法を実施することができる。補間は、マイクロプロセッサ又はシステム内にあるその他の計算装置によって実行できる。
【0045】
本発明の方法は、ビデオクリップに一つそれ以上の活動領域を設け、又は受信するために用いることができる。
手動による補間を行うフレームは、異なる方法により選択することができる。例えば、一つの実施形態において、n番目毎のフレームが手動により註釈付けされる、但しnは整数である(例えば10)。
補間及び編集を行うために選択される装置は、ビデオ編集及び/又は画像認識ソフトウェア・プログラムを実行する、表示画面を備えたマイクロ・プロセッサ・ベースのシステムでもよい。
【0046】
一つの実施形態において、最初及び最後のフレームは、手動により註釈付けがされない。従って、このような実施形態においては、活動領域の位置及び大きさは外挿される。
ビデオ信号が観察者に送信されると、ビデオ及び註釈情報が共に、独立した信号として受信システム501に送られても、又は、それらは合成信号の一部として通信されてもよい。合成信号は、送信装置504によって、放送媒体を経由して提供可能である。或いは、合成信号は、例えば光、ケーブル、マイクロ波伝送、衛星伝送等の上記の通信媒体のいずれかを経由して提供可能である。
【0047】
本発明の様々な態様は、互いに独立して実施できる。例えば、図1の註釈装置は、図5の信号通信装置を用いることなく使用できる。同様に、図5の通信装置は、図1から図4までに関する上記の方法以外の方法を用いて註釈付けされたビデオクリップと通信するために使用できる。従って、こうした変更の全ては、本発明の特許請求の範囲に含まれる。
【図面の簡単な説明】
【図1】 本発明によるビデオクリップに注釈付けするために用いられるビデオ編集機能/プレーヤの表示画面である。
【図2】 ビデオクリップの一連のフレームのフレーム番号に対するy方向に沿ったビデオ画面上の物体の位置を示す。
【図3】 本発明の第1実施形態による方法を説明するフロー図である。
【図4】 本発明によるビデオクリップをマークするために用いられるビデオ編集機能/プレーヤのデータ・アーキテクチャを示す。
【図5】 本発明の別の実施形態による信号送信システム及び受信表示システムのブロック図である。
【図6】 ビデオクリップの番号に対するy軸に沿った活動領域の位置を示す。

Claims (29)

  1. ビデオ画像源からビデオ画像を前記ビデオ画像源から遠隔の位置で受信するステップと、
    一連のフレームとして前記ビデオ画像を、前記ビデオ画像源の位置から遠隔の位置にある表示装置上に表示するステップと、
    前記フレームの幾つかについて少なくとも一つのインタラクティブ領域の位置に対応する情報を、前記ビデオ画像源の位置から遠隔であり、前記少なくともつのインタラクティブ領域の位置に対応する前記情報の情報源からも遠隔である位置において受信し、前記フレームのうちの他のフレームについては受信しないステップと、
    前記ビデオ画像源の位置から遠隔の前記位置において、前記他のフレームのための前記少なくとも一つのインタラクティブ領域の位置をスプライン曲線補間により決定するステップと、を含むことを特徴とする方法。
  2. 前記の決定するステップが直線補間によってさらに実行されることを特徴とする請求項1に記載の方法。
  3. 前記少なくとも一つのインタラクティブ領域の大きさに対応する情報が、前記フレームの前記幾つかについて受信され、前記他のフレームについては受信されず、前記他のフレームについて前記少なくとも一つのインタラクティブ領域の大きさを決定するステップをさらに含むことを特徴とする請求項1に記載の方法。
  4. 前記インタラクティブ領域がリンクと関連しており、前記リンクを起動させるステップをさらに含むことを特徴とする請求項1に記載の方法。
  5. 前記リンクはインターネット・ページへのリンクであることを特徴とする請求項に記載の方法。
  6. 前記の表示するステップが表示画面に前記ビデオ画像を表示することを含み、前記の起動させることが前記表示画面の前記少なくとも一つのインタラクティブ領域をクリックすることを含むことを特徴とする請求項7に記載の方法。
  7. 前記の前記ビデオ画像を受信するステップは、放送ビデオ画像を受信することを含み、前記表示するステップは、エンドユーザのビデオシステムによって実行され、前記決定するステップは前記エンドユーザのビデオシステムによって実行されることを特徴とする請求項1に記載の方法。
  8. 前記フレームの幾つかについて受信し、前記フレームの他のものについて受信しない、前記少なくともつのインタラクティブ領域の位置に対応する前記情報は放送されるものであり、
    前記フレームの幾つかについて受信し、前記フレームの他のものについて受信しない、前記少なくともつのインタラクティブ領域の位置に対応する前記情報を受信する前記ステップは、前記放送を受信することを含むことを特徴とする請求項に記載の方法。
  9. 一組のビデオフレームを含み、前記一組のビデオフレームのうちの幾つかのフレームが、前記ビデオフレームのうちの前記幾つかのフレームについてインタラクティブ領域が設定されたという注釈付けがされているビデオクリップを第1の位置から、前記第1の位置から遠隔の第2の位置に通信するステップと、
    前記一組のビデオフレームのうち、前記幾つかのビデオフレームについて前記インタラクティブ領域の位置を前記第1の位置から前記第2の位置に通信し、前記一組のビデオフレームのうちの前記フレームの他のものについては通信しないステップと、
    前記一組のビデオフレームのうち、前記ビデオフレームの幾つかについて、前記ビデオクリップ及び前記インタラクティブ領域の位置を前記第2の位置で受信し、前記フレームの前記他のものについては受信しないステップと、
    前記ビデオフレームの前記他のものの内の前記インタラクティブ領域の位置を、前記第2の位置で、スプライン曲線補間により設定するステップと、
    を含むことを特徴とする方法。
  10. 前記ビデオクリップは、前記第1の位置から前記第2の位置に第1通信媒体によって通信され、さらに前記インタラクティブ領域の前記位置は、前記第1の位置から前記第2の位置に前記第1通信媒体とは異なる第2通信媒体によって通信されることを特徴とする請求項に記載の方法。
  11. 前記インタラクティブ領域が、前記一組のビデオフレーム内の前記ビデオフレームの各々に示されている物体と関連していることを特徴とする請求項に記載の方法。
  12. 前記ビデオクリップを通信する前記ステップは、前記ビデオクリップを放送することを含み、前記一組のビデオフレームの内の前記ビデオフレームの前記幾つかについてであるが、前記一組のビデオフレームの内の前記ビデオフレームの他のものについてではない、前記インタラクティブ領域の位置を通信する前記ステップは、前記ビデオフレームの前記幾つかについて受信し、前記ビデオフレームの他のものについて受信しない、前記インタラクティブ領域の前記位置を放送することを含むことを特徴とする請求項に記載の方法。
  13. 前記ビデオクリップを通信するステップは、前記ビデオクリップをエンドユーザに通信することを含み、
    前記一組のビデオフレームの内の、前記ビデオフレームの幾つかについて受信し、前記ビデオフレームの他のものについて受信しない、前記インタラクティブ領域の位置の前記通信は、前記ビデオフレームの幾つかについて受信し、前記ビデオフレームの他のものについて受信しない、前記インタラクティブ領域の位置を前記エンドユーザに通信することを含むことを特徴とする請求項に記載の方法。
  14. ビデオ信号源からビデオ信号を受信するための受信機と、
    前記ビデオ信号に対応し、一組のフレームを含むビデオ画像を表示するための、前記受信機に接続されたディスプレイと、
    前記フレームの幾つかについて少なくとも一つのインタラクティブ領域の位置を示す情報を受信し、前記フレームのうちの他のフレームについては受信しない回路であって、前記フレームの前記幾つかについての前記少なくとも一つのインタラクティブ領域の位置に基づくスプライン曲線補間により、前記フレームの前記他のものについての前記少なくとも一つのインタラクティブ領域の位置を判定する回路と、を含み、
    前記受信機、前記ディスプレイ、及び前記回路は、前記ビデオ信号源及び前記情報の情報源から遠隔にあることを特徴とするシステム。
  15. 前記ビデオ信号源から前記受信機、前記ディスプレイ、及び前記回路の位置に、前記フレームのうちの前記いくつかについて、前記ビデオ信号及び前記少なくとも一つのインタラクティブ領域の位置に対応する前記情報を送信し、前記フレームのうちの前記他のものについては送信しない送信システムをさらに含むことを特徴とする請求項14に記載のシステム。
  16. 前記受信機は、ビデオ放送を受信し、情報を受信する前記回路によって受信される前記情報は放送されることを特徴とする請求項14に記載のシステム。
  17. 前記システムはエンドユーザシステムであることを特徴とする請求項14に記載のシステム。
  18. 一組のフレームを含むビデオ信号を格納する記憶格納装置と、
    前記フレームのうちの幾つかについてはインタラクティブ領域の位置を格納し、前記フレームの他のものについてはそれを記憶しない記憶格納装置と、
    前記フレームのうちの前記幾つかについて前記ビデオ信号及び前記インタラクティブ領域の前記位置を送信し、前記フレームのうちの前記他のものについては送信せず、それによって、前記ビデオ信号及び前記フレームのうちの前記幾つかについての前記インタラクティブ領域の前記位置を、前記送信機を介して受信する、送信機から遠隔にあるシステムが、スプライン曲線補間により、前記フレームのうちの前記他のものについて前記インタラクティブ領域の位置を確定できるような前記送信機と、を含むことを特徴とする装置。
  19. 前記送信機は、前記ビデオ信号、及び前記フレームの前記幾つかについてであるが、及び前記フレームの前記他のものについてではない、前記インタラクティブ領域の前記位置を放送することを特徴とする請求項18に記載のシステム。
  20. 前記装置から遠隔にある前記システムは、エンドユーザシステムであることを特徴とする請求項18に記載のシステム。
  21. ビデオクリップを格納する記憶装置と、
    前記ビデオクリップのフレームのうちの幾つかについてインタラクティブ領域の位置を設定し、前記ビデオクリップの他のフレームについては設定しない構成と、
    前記ビデオクリップの前記幾つかのフレームについて前記ビデオクリップ及び前記インタラクティブ領域の位置を遠隔の受信機へと送信し、前記ビデオクリップの前記他のフレームについては送信しない送信システムと、
    前記ビデオクリップを受信して表示し、前記他のフレームについて前記インタラクティブ領域の位置をスプライン曲線補間によって設定する受信装置と、を含むことを特徴とする装置。
  22. 前記送信システムは、前記ビデオ信号及び前記インタラクティブ領域の前記位置を、前記フレームの前記幾つかについて放送し、前記フレームの他のものについては放送しないことを特徴とする請求項21に記載の装置。
  23. 前記送信システムは、エンドユーザに送信することを特徴とする請求項21に記載の装置。
  24. ビデオ画像を第1の位置で受信するステップと、
    一連のフレームとして前記ビデオ画像を、前記第1の位置にある表示装置上に表示するステップと、
    前記フレームの幾つかについて少なくとも一つのインタラクティブ領域の位置に対応する情報を、前記情報の情報源から遠隔である第1の位置において受信し、前記フレームのうちの他のものについては受信しないステップと、
    前記第1の位置において、前記フレームのうちの前記他のもののための前記インタラクティブ領域の位置をスプライン曲線補間により決定するステップと、を含むことを特徴とする方法。
  25. 一組のビデオフレームを含むビデオクリップを第1の位置に通信するステップと、
    前記一組のビデオフレームのうち、前記幾つかのビデオフレームについてインタラクティブ領域の位置を前記第1の位置から遠隔にある第2の位置から前記第1の位置に通信し、前記一組のビデオフレームのうちの前記フレームの他のものについては通信しないステップであって、前記ビデオフレームの前記他のものについて前記インタラクティブ領域の位置を、前記第1の位置で、スプライン曲線補間により設定するものであるステップと、
    を含むことを特徴とする方法。
  26. ビデオ信号源からビデオ信号を受信するための受信機と、
    前記ビデオ信号に対応し、一組のフレームを含むビデオ画像を表示するための、前記受信機に接続されたディスプレイと、
    前記フレームの幾つかについて少なくとも一つのインタラクティブ領域の位置を示す情報を受信し、前記フレームのうちの他のフレームについては受信しない回路であって、前記フレームの前記幾つかについての前記インタラクティブ領域の位置に基づくスプライン曲線補間により、前記フレームの前記他のものについての前記インタラクティブ領域の位置を判定する回路と、を含み、
    前記受信機、前記ディスプレイ、及び前記回路は、前記情報の情報源から遠隔にあることを特徴とするシステム。
  27. 一組のフレームに対応するビデオ信号を格納する記憶格納装置と、
    前記フレームのうちの幾つかについてはインタラクティブ領域の位置を格納し、前記フレームの他のものについてはそれを記憶しない記憶格納装置と、
    前記ビデオ信号を送信する送信機と、
    前記フレームのうちの前記幾つかについて前記ビデオ信号及び前記インタラクティブ領域の前記位置を送信し、前記フレームのうちの前記他のものについては送信せず、それによって、前記ビデオ信号及び前記フレームのうちの前記幾つかについての前記インタラクティブ領域の前記位置を、送信機から遠隔にあるシステムが、スプライン曲線補間により、前記フレームのうちの前記他のものについて前記インタラクティブ領域の位置を確定できるような前記送信機と、を含むことを特徴とする装置。
  28. 前記インタラクティブ領域の前記位置を送信するための前記送信機は、無線信号、電気ケーブル、光ケーブル、マイクロ波、衛星、電話線、又はインターネットによって前記位置を送信することを特徴とする請求項27に記載の装置。
  29. ビデオ信号を記憶するための前記記憶装置は、大容量データ記憶装置の第1の部分を含み、前記フレームの幾つかのものについてであるが、前記フレームの他のものについてではない、前記インタラクティブ領域の位置を記憶するための前記記憶装置は、前記大容量データ記憶装置の第2の部分であることを特徴とする請求項27に記載の装置。
JP2001522419A 1999-09-03 2000-09-02 ビデオストリームにおける移動物体のマーキング Expired - Lifetime JP4901040B2 (ja)

Applications Claiming Priority (7)

Application Number Priority Date Filing Date Title
US39004499A 1999-09-03 1999-09-03
US38991699A 1999-09-03 1999-09-03
US09/389,916 1999-09-03
US09/390,047 1999-09-03
US09/390,047 US6570586B1 (en) 1999-09-03 1999-09-03 Bandwidth effective method for communicating interactive links
US09/390,044 1999-09-03
PCT/US2000/024263 WO2001018676A1 (en) 1999-09-03 2000-09-02 Marking of moving objects in video streams

Publications (2)

Publication Number Publication Date
JP2003509880A JP2003509880A (ja) 2003-03-11
JP4901040B2 true JP4901040B2 (ja) 2012-03-21

Family

ID=27409917

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2001522419A Expired - Lifetime JP4901040B2 (ja) 1999-09-03 2000-09-02 ビデオストリームにおける移動物体のマーキング

Country Status (7)

Country Link
US (1) US6229541B1 (ja)
EP (2) EP2287754A3 (ja)
JP (1) JP4901040B2 (ja)
CN (1) CN1391676A (ja)
AU (1) AU7110700A (ja)
HK (1) HK1052772A1 (ja)
WO (1) WO2001018676A1 (ja)

Families Citing this family (52)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6928652B1 (en) * 1998-05-29 2005-08-09 Webtv Networks, Inc. Method and apparatus for displaying HTML and video simultaneously
US6215483B1 (en) 1998-06-17 2001-04-10 Webtv Networks, Inc. Combining real-time and batch mode logical address links
US6938270B2 (en) * 1999-04-07 2005-08-30 Microsoft Corporation Communicating scripts in a data service channel of a video signal
US7103904B1 (en) * 1999-06-30 2006-09-05 Microsoft Corporation Methods and apparatus for broadcasting interactive advertising using remote advertising templates
US6396523B1 (en) 1999-07-29 2002-05-28 Interlink Electronics, Inc. Home entertainment device remote control
US6229541B1 (en) 1999-09-03 2001-05-08 Isurftv Use of templates for cost-effective secure linking of video stream objects
US7174562B1 (en) * 1999-12-20 2007-02-06 Microsoft Corporation Interactive television triggers having connected content/disconnected content attribute
US7343617B1 (en) 2000-02-29 2008-03-11 Goldpocket Interactive, Inc. Method and apparatus for interaction with hyperlinks in a television broadcast
US7367042B1 (en) * 2000-02-29 2008-04-29 Goldpocket Interactive, Inc. Method and apparatus for hyperlinking in a television broadcast
US6642940B1 (en) * 2000-03-03 2003-11-04 Massachusetts Institute Of Technology Management of properties for hyperlinked video
KR100826546B1 (ko) * 2000-03-23 2008-05-02 아이알 비젼 에이비 터치 스크린을 포함하는 그래픽 사용자 인터페이스에서정보를 제공하는 방법 및 장치
US6765557B1 (en) * 2000-04-10 2004-07-20 Interlink Electronics, Inc. Remote control having touch pad to screen mapping
US6766524B1 (en) * 2000-05-08 2004-07-20 Webtv Networks, Inc. System and method for encouraging viewers to watch television programs
US6714215B1 (en) * 2000-05-19 2004-03-30 Microsoft Corporation System and method for displaying media interactively on a video display device
EP1290539A1 (en) * 2000-05-24 2003-03-12 Koninklijke Philips Electronics N.V. A method and apparatus for shorthand processing of medical images
US7000242B1 (en) * 2000-07-31 2006-02-14 Jeff Haber Directing internet shopping traffic and tracking revenues generated as a result thereof
JP2004507989A (ja) * 2000-08-30 2004-03-11 ウォッチポイント メディア, インコーポレイテッド テレビ放送におけるハイパーリンクのための方法および装置
US6897880B2 (en) * 2001-02-22 2005-05-24 Sony Corporation User interface for generating parameter values in media presentations based on selected presentation instances
KR100400002B1 (ko) * 2001-03-09 2003-09-29 삼성전자주식회사 데이터 방송 시스템의 부가 정보 처리 장치 및 방법
US8374540B2 (en) * 2002-03-15 2013-02-12 Educational Testing Service Consolidated on-line assessment system
JP3971346B2 (ja) * 2002-06-24 2007-09-05 株式会社東芝 動画像再生装置、スケジュール・データ、動画像再生方法、及びプログラム
US8065614B2 (en) * 2003-04-09 2011-11-22 Ati Technologies, Inc. System for displaying video and method thereof
US7418656B1 (en) * 2003-10-03 2008-08-26 Adobe Systems Incorporated Dynamic annotations for electronics documents
US20050276514A1 (en) * 2004-06-14 2005-12-15 Fisher Paul A Image monitoring method and system
US9021529B2 (en) * 2004-07-15 2015-04-28 Microsoft Technology Licensing, Llc Content recordation techniques
JP4396586B2 (ja) * 2005-06-22 2010-01-13 ソニー株式会社 プログラム、情報処理方法、情報処理装置
US8667540B2 (en) * 2006-07-07 2014-03-04 Apple Partners, Lp Web-based video broadcasting system having multiple channels
US9035876B2 (en) 2008-01-14 2015-05-19 Apple Inc. Three-dimensional user interface session control
US20100275120A1 (en) * 2009-04-22 2010-10-28 Nicholas Pappas Processing of fields in motion picture videos or still photos
US8504918B2 (en) * 2010-02-16 2013-08-06 Nbcuniversal Media, Llc Identification of video segments
US20110310010A1 (en) * 2010-06-17 2011-12-22 Primesense Ltd. Gesture based user interface
CN101950578B (zh) * 2010-09-21 2012-11-07 北京奇艺世纪科技有限公司 一种视频信息添加方法及装置
US9377865B2 (en) 2011-07-05 2016-06-28 Apple Inc. Zoom-based gesture user interface
US8881051B2 (en) 2011-07-05 2014-11-04 Primesense Ltd Zoom-based gesture user interface
US9459758B2 (en) 2011-07-05 2016-10-04 Apple Inc. Gesture-based interface with enhanced features
US9030498B2 (en) 2011-08-15 2015-05-12 Apple Inc. Combining explicit select gestures and timeclick in a non-tactile three dimensional user interface
US9218063B2 (en) 2011-08-24 2015-12-22 Apple Inc. Sessionless pointing user interface
GB2497071A (en) * 2011-11-21 2013-06-05 Martin Wright A method of positioning active zones over media
US9229534B2 (en) 2012-02-28 2016-01-05 Apple Inc. Asymmetric mapping for tactile and non-tactile user interfaces
CN103188573A (zh) * 2012-04-01 2013-07-03 上海锐开信息科技有限公司 具有购物链接功能的显示系统
US20140089813A1 (en) * 2012-09-21 2014-03-27 Darius Vahdat Pajouh Ranking of user feedback based on user input device tracking
CN103402130A (zh) * 2013-07-24 2013-11-20 Tcl集团股份有限公司 一种在视频中显示广告的方法及系统
US9898451B2 (en) 2013-11-26 2018-02-20 Adobe Systems Incorporated Content adaptation based on selected reviewer comment
CN103702222A (zh) * 2013-12-20 2014-04-02 惠州Tcl移动通信有限公司 移动终端的互动信息生成方法及其视频文件播放方法
JP6114345B2 (ja) * 2015-08-07 2017-04-12 日本電信電話株式会社 出現位置補間装置、出現位置補間方法及び出現位置補間プログラム
JP6389996B1 (ja) * 2017-06-30 2018-09-19 Mil株式会社 広告表示方法、広告表示サーバ及び広告表示プログラム
US10757483B2 (en) * 2017-10-26 2020-08-25 Futurewei Technologies, Inc. Method and apparatus for data tracking and presenting
CN109979362A (zh) * 2017-12-27 2019-07-05 苏州锐创广告有限公司 一种电梯广告系统
JP2020077942A (ja) * 2018-11-06 2020-05-21 パロニム株式会社 領域設定装置、領域設定方法、及びプログラム
US11676316B1 (en) 2019-07-01 2023-06-13 Instasize, Inc. Shareable settings for modifying images
US11449664B1 (en) * 2019-07-01 2022-09-20 Instasize, Inc. Template for creating content item
US11263385B1 (en) * 2021-03-24 2022-03-01 Ebay Inc. Web browser extension for linking images to webpages

Family Cites Families (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4611347A (en) 1984-09-24 1986-09-09 At&T Bell Laboratories Video recognition system
US4868871A (en) 1987-08-13 1989-09-19 Texas Instruments Incorporated Nonparametric imaging tracker
US5339392A (en) * 1989-07-27 1994-08-16 Risberg Jeffrey S Apparatus and method for creation of a user definable video displayed document showing changes in real time data
US5267332A (en) 1991-06-19 1993-11-30 Technibuild Inc. Image recognition system
US5675752A (en) * 1994-09-15 1997-10-07 Sony Corporation Interactive applications generator for an interactive presentation environment
US5627915A (en) * 1995-01-31 1997-05-06 Princeton Video Image, Inc. Pattern recognition system employing unlike templates to detect objects having distinctive features in a video field
US5721851A (en) * 1995-07-31 1998-02-24 International Business Machines Corporation Transient link indicators in image maps
US5970504A (en) * 1996-01-31 1999-10-19 Mitsubishi Denki Kabushiki Kaisha Moving image anchoring apparatus and hypermedia apparatus which estimate the movement of an anchor based on the movement of the object with which the anchor is associated
US5929849A (en) * 1996-05-02 1999-07-27 Phoenix Technologies, Ltd. Integration of dynamic universal resource locators with television presentations
US5931908A (en) 1996-12-23 1999-08-03 The Walt Disney Corporation Visual object present within live programming as an actionable event for user selection of alternate programming wherein the actionable event is selected by human operator at a head end for distributed data and programming
US6006241A (en) * 1997-03-14 1999-12-21 Microsoft Corporation Production of a video stream with synchronized annotations over a computer network
EP1456780A4 (en) * 1997-04-01 2007-04-25 Medic Interactive Inc SYSTEM FOR THE AUTOMATIC GENERATION OF MEDIA PROGRAMS FROM A MEDIA ELEMENTS DATABASE
WO1998044435A1 (en) * 1997-04-02 1998-10-08 International Business Machines Corporation Method and apparatus for integrating hyperlinks in video
US6028600A (en) * 1997-06-02 2000-02-22 Sony Corporation Rotary menu wheel interface
US6229541B1 (en) 1999-09-03 2001-05-08 Isurftv Use of templates for cost-effective secure linking of video stream objects

Also Published As

Publication number Publication date
CN1391676A (zh) 2003-01-15
US6229541B1 (en) 2001-05-08
HK1052772A1 (zh) 2003-09-26
EP2287754A2 (en) 2011-02-23
EP2287754A3 (en) 2011-05-04
WO2001018676A1 (en) 2001-03-15
EP1222564A1 (en) 2002-07-17
AU7110700A (en) 2001-04-10
JP2003509880A (ja) 2003-03-11
EP1222564A4 (en) 2006-07-12

Similar Documents

Publication Publication Date Title
JP4901040B2 (ja) ビデオストリームにおける移動物体のマーキング
JP4218915B2 (ja) 画像処理方法、画像処理装置及び記憶媒体
US7652638B2 (en) Display control apparatus, system, and display control method
US5923365A (en) Sports event video manipulating system for highlighting movement
JP6179889B2 (ja) コメント情報生成装置およびコメント表示装置
US8174523B2 (en) Display controlling apparatus and display controlling method
US8730354B2 (en) Overlay video content on a mobile device
US6493872B1 (en) Method and apparatus for synchronous presentation of video and audio transmissions and their interactive enhancement streams for TV and internet environments
US8301669B2 (en) Concurrent presentation of video segments enabling rapid video file comprehension
EP1304876A2 (en) System and method to provide additional information associated with selectable display areas
CN102098478B (zh) 一种用于在多媒体装置上处理带内数据的方法及装置
US8013833B2 (en) Tag information display control apparatus, information processing apparatus, display apparatus, tag information display control method and recording medium
US20020167484A1 (en) Control system for controlling display device, server, medium and controlling method
US20100122208A1 (en) Panoramic Mapping Display
US20100169906A1 (en) User-Annotated Video Markup
US20040012621A1 (en) Hyper-media information providing method, hyper-media information providing program and hyper-media information providing apparatus
JP2003529237A (ja) ビデオ情報へのリンク
JPH11512902A (ja) インタラクティブディジタルメディアプログラム内でメディア内容を用いる装置
JP2012134954A (ja) メディアid整合に基づいた放送ar広告サービスシステム及びその方法
US20200388068A1 (en) System and apparatus for user controlled virtual camera for volumetric video
US6570586B1 (en) Bandwidth effective method for communicating interactive links
JP2019033430A (ja) 動画再生装置およびその制御方法、並びにプログラム
CN113709542B (zh) 一种交互式全景视频播放的方法和系统
US20140059134A1 (en) Multimedia delivery system and related computer program product for providing statistical graph related to auxiliary multimedia data
US8055076B2 (en) Tag information production apparatus, tag information production method and recording medium

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20070903

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20081215

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20090316

A602 Written permission of extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A602

Effective date: 20090324

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20090415

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20091119

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20100319

A711 Notification of change in applicant

Free format text: JAPANESE INTERMEDIATE CODE: A711

Effective date: 20100319

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20100629

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20100629

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20101006

A911 Transfer to examiner for re-examination before appeal (zenchi)

Free format text: JAPANESE INTERMEDIATE CODE: A911

Effective date: 20101101

A912 Re-examination (zenchi) completed and case transferred to appeal board

Free format text: JAPANESE INTERMEDIATE CODE: A912

Effective date: 20101203

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20111227

R150 Certificate of patent or registration of utility model

Ref document number: 4901040

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20150113

Year of fee payment: 3

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

EXPY Cancellation because of completion of term