JP2008537856A - ビデオ編集方法およびその装置 - Google Patents
ビデオ編集方法およびその装置 Download PDFInfo
- Publication number
- JP2008537856A JP2008537856A JP2008500899A JP2008500899A JP2008537856A JP 2008537856 A JP2008537856 A JP 2008537856A JP 2008500899 A JP2008500899 A JP 2008500899A JP 2008500899 A JP2008500899 A JP 2008500899A JP 2008537856 A JP2008537856 A JP 2008537856A
- Authority
- JP
- Japan
- Prior art keywords
- transcript
- user
- work
- video
- video data
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 32
- 238000013518 transcription Methods 0.000 claims abstract description 29
- 230000035897 transcription Effects 0.000 claims abstract description 29
- 230000003993 interaction Effects 0.000 claims description 9
- 230000004044 response Effects 0.000 claims description 8
- 238000004891 communication Methods 0.000 claims description 6
- 230000008569 process Effects 0.000 claims description 5
- 238000010586 diagram Methods 0.000 description 8
- 238000012545 processing Methods 0.000 description 5
- 238000004590 computer program Methods 0.000 description 4
- 230000000644 propagated effect Effects 0.000 description 4
- 238000012163 sequencing technique Methods 0.000 description 4
- 238000007726 management method Methods 0.000 description 3
- 238000012546 transfer Methods 0.000 description 3
- 230000008901 benefit Effects 0.000 description 2
- 238000004519 manufacturing process Methods 0.000 description 2
- 230000015654 memory Effects 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000012552 review Methods 0.000 description 2
- 238000013475 authorization Methods 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 238000010168 coupling process Methods 0.000 description 1
- 238000013500 data storage Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000010348 incorporation Methods 0.000 description 1
- 230000002452 interceptive effect Effects 0.000 description 1
- 238000013507 mapping Methods 0.000 description 1
- 230000001902 propagating effect Effects 0.000 description 1
- 238000005070 sampling Methods 0.000 description 1
- 230000004083 survival effect Effects 0.000 description 1
- 230000003936 working memory Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G11—INFORMATION STORAGE
- G11B—INFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
- G11B27/00—Editing; Indexing; Addressing; Timing or synchronising; Monitoring; Measuring tape travel
- G11B27/10—Indexing; Addressing; Timing or synchronising; Measuring tape travel
- G11B27/102—Programmed access in sequence to addressed parts of tracks of operating record carriers
- G11B27/105—Programmed access in sequence to addressed parts of tracks of operating record carriers of operating discs
-
- G—PHYSICS
- G11—INFORMATION STORAGE
- G11B—INFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
- G11B27/00—Editing; Indexing; Addressing; Timing or synchronising; Monitoring; Measuring tape travel
- G11B27/02—Editing, e.g. varying the order of information signals recorded on, or reproduced from, record carriers
- G11B27/031—Electronic editing of digitised analogue information signals, e.g. audio or video signals
- G11B27/034—Electronic editing of digitised analogue information signals, e.g. audio or video signals on discs
-
- G—PHYSICS
- G11—INFORMATION STORAGE
- G11B—INFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
- G11B27/00—Editing; Indexing; Addressing; Timing or synchronising; Monitoring; Measuring tape travel
- G11B27/10—Indexing; Addressing; Timing or synchronising; Measuring tape travel
- G11B27/11—Indexing; Addressing; Timing or synchronising; Measuring tape travel by using information not detectable on the record carrier
-
- G—PHYSICS
- G11—INFORMATION STORAGE
- G11B—INFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
- G11B27/00—Editing; Indexing; Addressing; Timing or synchronising; Monitoring; Measuring tape travel
- G11B27/10—Indexing; Addressing; Timing or synchronising; Measuring tape travel
- G11B27/19—Indexing; Addressing; Timing or synchronising; Measuring tape travel by using information detectable on the record carrier
- G11B27/28—Indexing; Addressing; Timing or synchronising; Measuring tape travel by using information detectable on the record carrier by using information signals recorded by the same method as the main recording
-
- G—PHYSICS
- G11—INFORMATION STORAGE
- G11B—INFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
- G11B27/00—Editing; Indexing; Addressing; Timing or synchronising; Monitoring; Measuring tape travel
- G11B27/10—Indexing; Addressing; Timing or synchronising; Measuring tape travel
- G11B27/34—Indicating arrangements
Landscapes
- Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Television Signal Processing For Recording (AREA)
- Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)
Abstract
【課題】コンピュータネットワークにおけるコンピュータビデオ編集システムおよび方法において、トランスクリプト部分のユーザ選択および順序付けが可能になるコンピュータビデオ編集システムおよび方法が開示される。
【解決手段】本システムおよび方法は、対象ビデオデータのデータストアまたは他のソース、トランスクリプションモジュールおよび組立要素を含む。トランスクリプションモジュールは、対象ソースビデオデータの対応するオーディオデータの作業トランスクリプトを作成する。作業トランスクリプトは、トランスクリプトを構成する節にごとにオリジナルのソースビデオの時間符号化を含む。組立要素によって、トランスクリプト部分のユーザ選択および順序付けが可能になる。
【選択図】 図3
【解決手段】本システムおよび方法は、対象ビデオデータのデータストアまたは他のソース、トランスクリプションモジュールおよび組立要素を含む。トランスクリプションモジュールは、対象ソースビデオデータの対応するオーディオデータの作業トランスクリプトを作成する。作業トランスクリプトは、トランスクリプトを構成する節にごとにオリジナルのソースビデオの時間符号化を含む。組立要素によって、トランスクリプト部分のユーザ選択および順序付けが可能になる。
【選択図】 図3
Description
本出願は、2005年3月10日出願の米国仮特許願第60/660,218号の利益を主張するものであり、この仮出願の全開示内容は、参照により本明細書に引用したものとする。
本発明は、ビデオデータから作業トランスクリプトを作成して、ビデオを編集する方法およびその装置に関する。
ビデオ作成工程の初期段階では、インタビュー場面を取得し、編集ビデオの第1原案を作成する。大まかなカットすなわち第1原案の作成は、インタビュー素材を含む作成において必要な段階である。第1原案は一般に、追加のグラフィックスまたはビデオ画像を伴わずに構成され、ストーリを創作して分かりやすく伝えることができるようにするためにのみ使用される。これは作成工程全体においてもっとも重要なステップの1つであり、またもっとも困難なものの1つである。ビデオ製作者にとって、1時間番組のための大まかなカットを完成するために、25、50、100または200時間ものソーステープを処理するのが一般的である。
大まかなカットを作成する現在の方法は断片的であり、非効率である。一部の製作者はインタビューのトランスクリプト(音声の文字を起こしたテキストデータ)を用いて作業し、スクリプトのワード処理を行い、その後ビデオ編集を実行する。他の製作者は単にソース映像を編集システムに直接移動して、編集システムでインタビュー全体をリアルタイム表示し、候補のインタビュー部分のセットを選択して、その後大まかなカットに編集する。
大まかなカットが完成すると、通常、検討のために製作責任者または法人顧客に配布される。この時に要求される修正は、多量のビデオ編集およびテキスト編集を含む。これらの修正サイクルは極めて高コストで時間を要し、時にはプロジェクト存続の可能性を危うくする。
本発明はビデオ編集のコンピュータ自動化方法および装置を提供することにより、従来技術の問題点に対処する。
好ましい実施形態では、本発明はグローバルネットワーク、例えばインターネットを介するビデオ編集サービスを提供する。したがって、いくつかの実施形態では、本発明は、ブラウザによるものであって、ウェブブラウザインタフェースを介するビデオ編集を可能にするレビューポータルを提供する。別の実施形態では、本発明は、ローカルエリアネットワーク、独立型の環境設定および他のコンピュータアーキテクチャ環境設定においてビデオ編集を提供する。
ホストコンピュータおよびホストコンピュータとの通信のために接続された複数のユーザコンピュータから構成されるコンピュータネットワークにおいて、一実施形態におけるビデオ編集方法および装置は、
(i)ホストコンピュータに対する対象ビデオデータのソースであって、ビデオデータは対応するオーディオ(音声)データを含むソースと、
(ii)対象ビデオデータをホストコンピュータから受信するように接続されたトランスクリプションモジュールと、
(iii)組立要素とを有する。
(i)ホストコンピュータに対する対象ビデオデータのソースであって、ビデオデータは対応するオーディオ(音声)データを含むソースと、
(ii)対象ビデオデータをホストコンピュータから受信するように接続されたトランスクリプションモジュールと、
(iii)組立要素とを有する。
トランスクリプションモジュールは対象ビデオデータの対応するオーディオデータの作業トランスクリプトを作成し、トランスクリプト部分を対象ビデオデータのそれぞれ対応する部分に関連付ける。詳細には、作業トランスクリプトの各部分は、対象ビデオデータの対応する部分のタイミングデータを取り込む。ホストコンピュータはユーザに作業トランスクリプトの表示を(例えばネットワークを介して)提供し、表示されたトランスクリプトを通して対象ビデオデータの部分のユーザ選択を効率的に可能にする。組立要素が表示されるトランスクリプトのトランスクリプト部分のユーザ選択に応答して、それぞれ対応するビデオデータ部分を取得する。ユーザが選択した各トランスクリプト部分に対して、組立要素は、リアルタイムで、(a)それぞれ対応するビデオデータ部分を取得し、(b)取得されたビデオデータ部分を組み合わせて、編集結果であるビデオ作品を作成し、(c)編集結果であるビデオ作品のテキストスクリプトを表示する。
ユーザが表示された作業トランスクリプトと対話(コンピュータがユーザに情報(作業とトランスクリプトなど)を呈示し、ユーザがコンピュータにコマンドおよびデータを供給すること)をしている間にユーザ命令を受けると、ホストコンピュータはユーザに編集結果であるビデオ作品の表示を提供するかまたは可能にする。
対象ビデオデータは符号化され、ホストにアップロードされるかまたは転送されてもよい。
本発明の一構成によれば、オリジナルまたは最初の作業トランスクリプトが、編集結果であるテキストスクリプトおよび/または編集結果であるビデオ作品の表示と、同時に(例えば、並べて)表示されてもよい。
本発明の別の構成によれば、表示される作業トランスクリプトは一連の節から構成される。トランスクリプト部分のユーザ選択は、この一連の節の少なくともいくつか(例えば少なくとも1つ)の節をユーザが順序付けることを含む。いくつかの実施形態では、各節は、対象ビデオデータの対応する部分の少なくとも1つの開始タイムスタンプまたは終了タイムスタンプを有する。例えば、ソースメディアの経過時間が各タイムスタンプを定める。好ましい実施形態では、対象ビデオデータの部分への作業トランスクリプトの部分の関連付けはタイムコードの使用を含む。
さらに、各節は、1つまたは複数のステートメント(一文)を含む。トランスクリプト部分のユーザの選択は、節におけるステートメントのサブセットのユーザの選択を含む。このようにして、本発明によって、ユーザは節を再度定める(分割または区分する)ことができる。
独立型環境設定またはLAN形態では、トランスクリプションモジュールはネットワークの内部もしくは外部またはホストコンピュータからリモートで実行される。作成された作業トランスクリプトはホストコンピュータに通信される。その後、ユーザ対話はホストコンピュータを介して(すなわちホストコンピュータにおいて)なされる。あるいは、トランスクリプションモジュールは、独立型またはLAN環境設定に組み込まれていてもよい。
他の構成は、ナレーションに重ねられた、グラフィックス、バックグラウンドオーディオ(音楽、自然音など)および2次(またはロールB)ビデオの組み込みを含む。ナレーションはインタビュー場面からなり、このインタビュー場面は、文字起こしされて、上記に要約されてさらに以下に詳細に説明される本発明の原理に従った第1原案を生成するように使用されるものである。
他の実施形態によれば、本発明によって、インターネット上における、ビデオブログ、ディスカッションフォーラム(すなわち、ビデオによって強化されたディスカッションスレッド)、電子メールなどとのユーザ対話を改善できる。
本発明の前述および他の目的、特徴および利点は、添付図に示されている、本発明の好ましい実施形態の以下のより詳細な説明から明らかになるであろう。図面では、同一参照符号は異なる図面であっても同一要素を指す。図面は必ずしも縮尺どおりでなく、代わりに本発明の原理を示すことに重点が置かれている。
以下に本発明の好ましい実施形態を説明する。
図1は、本発明が実現されるコンピュータネットワークまたは同様のディジタル処理環境を示している。
クライアントのコンピュータ/デバイス(装置)50およびサーバコンピュータ60は、アプリケーションプログラムなどを実行する、処理装置、記憶装置および入出力装置を備える。クライアントコンピュータ/デバイス50はまた、他のクライアントデバイス/プロセッサ50およびサーバコンピュータ60を含む他のコンピュータデバイスと通信ネットワーク70を介してリンクされている。通信ネットワーク70は、相互に通信するために、リモートアクセスネットワーク、グローバルネットワーク(例えばインターネット)、コンピュータの世界規模の集合、ローカルエリアもしくはワイドエリアネットワークおよびゲートウェイの一部であってもよい。これらのネットワークなどは、現在のところ、それぞれのプロトコル(TCP/IP、Bluetooth他)を使用する。他の電子デバイス/コンピュータネットワークアーキテクチャも適している。
図2は、図1のコンピュータシステムにおけるコンピュータ(例えばクライアントプロセッサ/デバイス50またはサーバコンピュータ60)の内部構造図である。各コンピュータ50、60はシステムバス79を内蔵する。このバスは、コンピュータもしくは処理システムのコンポーネント間のデータ転送のために使用されるハードウェア線のセットである。バス79は基本的に、コンピュータシステム内の様々な構成要素(例えば、プロセッサ、ディスク記憶、メモリ、入力/出力ポート、ネットワークポートなど)を接続する共有のパイプ(ルート)であって、要素間の情報の転送を可能にする。コンピュータ50、60への様々な入力および出力デバイス(例えば、キーボード、マウス、ディスプレイ、プリンタ、スピーカなど)を接続するために、I/Oデバイスインタフェース82がシステムバス79に接続されている。ネットワークインタフェース86によって、コンピュータは、ネットワーク(例えば図1のネットワーク70)に接続された様々な他のデバイスに接続できる。メモリ90は、本発明の実施形態を実装するために使用されるコンピュータソフトウェア命令(例えば、プログラムルーチン92およびデータ94、詳細は後述)に対して揮発性記憶を提供する。ディスク記憶95は、本発明の実施形態を実装するために使用される、コンピュータソフトウェア命令92およびデータ94に対して不揮発性記憶を提供する。中央プロセッサユニット84もまたシステムバス79に接続されて、コンピュータ命令を実行する。
後に明らかにされるとおり、データ94はソースビデオデータファイル11および対応する作業トランスクリプトファイル13を含む。作業トランスクリプトファイル13は、各ビデオデータ11のオーディオトラックのテキストトランスクリプション、つまり音声トラックを文字化してテキストデータとしたものである。ソースビデオデータ11は、オーディオおよび画像データを含む媒体、ビデオデータを付加しないオーディオデータを含む媒体、オーディオデータおよびグラフィックス、アニメーションなどの組み合わせを含む媒体などであってもよい。
一実施形態では、プロセッサルーチン92およびデータ94は、本発明のシステムに対するソフトウェア命令の少なくとも一部を備える、コンピュータ可読媒体(例えば、1つまたは複数のDVD−ROM、CD−ROM、フロッピー(登録商標)ディスク、テープなどの取外し可能記憶媒体)を含むコンピュータプログラム製品(総称して参照符号92で示す)である。コンピュータプログラム製品92は、技術的に公知の、任意の適切なソフトウェアインストール手順によってインストールされる。他の実施形態では、ソフトウェア命令の少なくとも一部は、ケーブル、通信および/または無線接続を介してダウンロードされてもよい。他の実施形態では、本発明のプログラムは、伝搬媒体(例えば、電波、赤外線波、レーザー波、音波、またはインターネットもしくは他のネットワークなどのグローバルネットワークを介して伝搬される電波)の伝搬信号に埋め込まれたコンピュータプログラム伝搬信号製品107である。このような搬送媒体または搬送信号は、本発明のルーチン/プログラム92に対するソフトウェア命令の少なくとも一部を備える。
別の実施形態では、伝搬信号は、アナログ搬送波または伝搬媒体上を搬送されるディジタル信号である。例えば、伝搬信号は、グローバルネットワーク(例えばインターネット)、電気通信ネットワークまたは他のネットワークを介して伝搬されるディジタル化信号であってもよい。一実施形態では、伝搬信号は、例えば数ミリ秒、数秒、数分の期間またはこれらよりも長い期間にわたりネットワークを介してパケットで送信されるソフトウェアアプリケーションの命令のような、ある期間にわたり伝搬媒体を介して転送される信号である。他の実施形態では、コンピュータプログラム製品92のコンピュータ可読媒体は、コンピュータプログラム伝搬信号製品について上述したとおり、コンピュータシステム50が、例えば、伝搬媒体を受信して伝搬媒体に埋め込まれた伝搬信号を識別することによって、受信して読み取ることができる、伝搬媒体である。
一実施形態では、ホストサーバコンピュータ60は、ビデオ編集に対するポータル(サービスおよび手段)を提供し、ルーチン92は本発明のビデオ編集システムを実装する。ユーザ(クライアントコンピュータ50)は、インターネットのようなグローバルコンピュータネットワーク70を介して本発明のビデオ編集ポータルにアクセスする。プログラム92は、好ましくはホストコンピュータ60によって実行され、ユーザが(クライアントコンピュータ50を介して)所望のビデオデータを編集できるようにするユーザ対話式ルーチンである。図3は、グローバルコンピュータネットワーク70の環境におけるビデオ編集サービスおよび手段についてのこのようなプログラム92の1つを示している。他の実施形態では、ネットワーク70はローカルエリアまたは同様のネットワークである。これを受けて、ホストコンピュータ60はある種のサーバであり、ユーザはクライアントコンピュータ50を介してまたは直接ホスト/サーバ60上で対話する。
最初のステップ100では、ユーザは、ユーザコンピュータ50を介して、本発明のポータルすなわちホストコンピュータ60に接続する。接続されると、ホストコンピュータ60はセッションを初期化し、ユーザIDなどを確認する。
次に(ステップ101)、ホストコンピュータ60は、ユーザの命令で転送された(アップロードまたは別の方法で提供された)入力すなわち対象ビデオデータ11を受信する。対象ビデオデータ11は、対応するオーディオデータ、マルチメディアなどを含む。応答(ステップ102)では、ホストコンピュータ60は、受信されたビデオデータ11の対応するオーディオデータを文字に起こし(transcribe)、作業トランスクリプト13を作成する、トランスクリプションモジュール23を使用する。受信されたオーディオデータから作業トランスクリプトを作成するのに、当技術分野では一般的である音声テキスト変換技術が利用される。このようにして、作業トランスクリプト13は対象(ソース)ビデオデータ11に対応するオーディオのテキストを提供する。さらに、トランスクリプションモジュール23は、作業トランスクリプト13の各部分とそれぞれ対応する対象ビデオデータ11の各部分との間の、それぞれの関連付けを生成する。生成された関連付けは、リンク、ポインタ、参照または他のデータ疎結合技法として実装される。好ましい実施形態では、トランスクリプションモジュール23は、作業トランスクリプト13の各部分に、対象ビデオデータ11の各部分のソース媒体トラック、フレームおよび経過時間に対応するタイムスタンプ(コード)33を挿入する。
ホストコンピュータ60は、ユーザコンピュータ50を介してユーザに作業トランスクリプト13を表示し、ユーザインタフェース27をサポートする(ステップ104)。ステップ103では、インタフェース27によって、ユーザは、表示される作業トランスクリプト13を通して場面を追うことができ、オーディオテキスト(作業トランスクリプト)の所望の部分を選択できる。ユーザインタフェース27によって、ユーザはまた、作業トランスクリプト13の対応する部分を通して選択される(、かつその対応する部分で並べて表示される)、ソースビデオデータ11の各部分を再生できる。これにより、オーディオ画像サンプリングおよび同時のトランスクリプト13の閲覧がもたらされる。この閲覧は、オリジナルのビデオデータ11のいずれの部分をカットまたは使用するのかをユーザが判断するのに役立つものである。ホストコンピュータ60は各ユーザの選択および命令に応答し、対象ビデオデータ11の対応する各部分を取得する(ステップ105)。すなわち、表示される作業トランスクリプト13のユーザが選択した部分から、ホストコンピュータの組立要素25が、(ステップ102から)以前に生成された関連付け33を利用して、ユーザが選択したオーディオテキスト(作業トランスクリプト13の部分)に対応するオリジナルのビデオデータ11の各部分を判別する。
ユーザはまた、ステップ105において、選択された各トランスクリプト部分の順序すなわちシーケンス(順番)を指定し、対象ビデオデータ11の対応する各部分を順序付ける。組立要素25は、ユーザによって選択された各部分および表示された作業トランスクリプト13の順序に対応する対象ビデオデータ11のこのように判別された部分すべてを、順序付けて追加または結合する。対象ビデオデータの編集バージョン15とこのビデオデータに対応するテキストスクリプト17とが結果として得られる。
ホストコンピュータ60は、結果として得られるビデオ作品(編集バージョン)15つまり生成されたビデオ作品15および対応するテキストスクリプト17を、ユーザコンピュータ50を介してユーザに表示(再生)する(ステップ108)。好ましくは、ユーザ命令を受けると、ホストコンピュータ60は、結果として得られるビデオ作品/編集(カット)バージョン15とオリジナルの作業トランスクリプト13を同時に表示する。このようにして、ユーザは、オリジナルのオーディオテキストを閲覧し、さらに編集(すなわち、対象ビデオデータ11の他の部分すなわち異なる部分、または各部分の異なる順序)が望まれるか否かを判定できる。望まれる場合、上述のようにステップ103、104、105、および108が繰り返される(ステップ109)。望まれない場合、処理はステップ110で完了する。
このようにして、本発明は、対象ソースビデオデータ11に対応するオーディオの作業トランスクリプト13のオンライン表示を使用して、オーディオ画像トランスクリプトに基づくビデオ編集処理を提供する。さらに、組立要素25は、作業トランスクリプト部分に対応する、ユーザの選択および順序付け(シーケンシング)のリアルタイムでの編集/カットバージョン15(および対応するテキストスクリプト17)を作成する。このような、ビデオ編集に対するリアルタイムの、トランスクリプトに基づく編集方法は、従来技術には存在しない。
さらに、このようなユーザを多数、および複数の異なるソースビデオデータ11を処理するために、ホストコンピュータ60は図4Aおよび4Bに示されているデータ構造を採用する。ソースビデオデータファイル11は、セッション識別子41でインデックスを付けられているかまたは参照されている。セッション識別子は例えば一意の文字列である。対応するトランスクリプトファイル13も同一のセッション識別子41でタグ付けされているか参照されている。トランスクリプトファイル13は、(図4Aの真ん中付近に両方向矢印によって示されているとおり、)作業トランスクリプトの異なる各部分からソースビデオデータ11のそれぞれ対応する各部分へのアソシエーション(関連付け)33(例えば、参照、ポインタまたはリンクなど)を保持する。好ましくは、作業トランスクリプト13は一連の節(passage)31a,31b,…,31nから構成される。各節31は、対応するビデオ化されるインタビュー(場面)の1つまたは複数のステートメント(一文)を含む。各節31は、インタビュー(場面)のオリジナルのメディアキャプチャのトラック、フレームおよび/または経過時間によって、タイプスタンプ33のインデックス付けがされている(、または時間コード化されている)。公知のタイムスタンプ技法が、トランスクリプトファイル13の節31と対応するソースビデオファイル11と間の、この関連付け/相互参照に利用される。
また、各節31は、ユーザが定義可能なシーケンス順序(1,2,3…は、一連の節の第1、第2、第3…番目を意味する)を有する。ユーザ使用に選択されない節31には、(例えば図3のステップ104、105の間に)作業シーケンス順序が割当てられない。ユーザによって選択された節31の順序すなわちシーケンシングが、シーケンスインジケータ35およびリンク付けリスト43(または他の公知の順序付け/シーケンシング技法)によって実装される。ユーザによって選択された節31のユーザ設定または変更シーケンス順序インジケータ35に応答して、組立要素25は、サポートするリンク付けリスト43を更新する。
図4aに示されている例では、インジケータ35a、35b、35cにおける値が示すとおり、ソースビデオデータ11からの節の最初の順序は、節31aの後に節31b、この後に節31c、…と続くものであった。したがって、最初のリンク付けリストは、リンク43aからリンク43bに、…以下同様に形成されていた(点線で示されている)。ユーザの対話の間(図3のステップ103、104、105)、ユーザは、節31a、31bおよび31nをこの順序で選択して、節31cを省くことを決定する。インジケータ35a、35bおよび35nはユーザによって選択された新しい順序(節31a、31bおよび31nの作業の一連)を示す。組立要素25は、リンク付けリスト43a、43cを調整し、これにより、ユーザが選択した第1番目の節31aの後に、ユーザが選択した第2番目の節31bが続き(リンク43a)、ユーザが選択した第3番目の節31nが節31bの直ぐ後に続く(リンク43c)。初期のリンク43bおよび初期の第3番目の節31cは事実上省かれる。その後、この編集バージョン15を再生するようにユーザが命令すると、組立要素25は(i)節31aの次に節31bが続き、その次に31nが続くことを示す、リンクリスト43a、43cに従い、(ii)それぞれのタイムスタンプ33a、33bを介してこれらの節についての対応するソースビデオデータ11を取得し、(iii)この順序で(インジケータ35を介してユーザによって定義されたとおり)取得したソースビデオデータを結合(追加)する。
さらに、ユーザは、節全体の代わりに、所望の節31の一部のみを選択できる。ステップ103、104、105の間、ユーザは、対象の節31に対応するビデオデータ11を再生し、表示される作業トランスクリプト13を通して節31のテキストを目で追って読む。ビデオで見て対応するトランスクリプト節31を読むことの間において、ユーザは、対象の節31および対応するビデオのいずれの部分(区域またはステートメント)を望むかを決定できる。図4Bに示されているとおり、ユーザインタフェース27によって、ユーザは、対応するビデオデータ11の再生中に、対象の節31bにおいて1つまたは複数の停止点37を指定することにより、所望の細分化された部分を明示することができる。図示された例では、3つのステートメントうちの最初の2つがユーザによって有効に選択される。ここで、停止点37は、ステートメント2の最後とステートメント3の前の間に位置している。(全体または一部の)ステートメントの他の組み合わせを選択するための他の停止点の配置も、同様に有効である。本発明のシステムは、ユーザ指定された停止点37に対して対応するタイムスタンプ(オリジナルのビデオ媒体のトラック/フレーム/経過時間)を判別する。これにより、対象の節31から、調整された作業節31b’すなわちユーザによって明示された作業節31b’が、有効に構成される。編集カット15を作成するために、ユーザによって選択されて順序付けされた一連の節31内における調整/再明示された節31b’を使用することは、図4Aに関連して上述したとおりである。
代わりに、本発明は、ローカルエリアもしくはワイドエリアネットワークにおけるクライアントサーバアーキテクチャにおいて、またはグローバルネットワーク70の代わりに独立型コンピュータ環境設定上で、有効に実装されてもよい。ローカルエリアネットワークまたは独立型環境設定では、ホストコンピュータ60は、ユーザに作業トランスクリプト13、編集/カットバージョン15、対応するテキストスクリプト17などの表示を提供して、本発明の動作においてユーザ対話を受信する。トランスクリプションの動作/モジュール23はネットワークの外部の(独立型/ホストコンピュータ60から分離され遠隔に位置する)コンピュータ上で実行され、構成された作業トランスクリプト13は、本発明における使用のために、ホストコンピュータ60と電子的に通信(例えば電子メールにより)される。ホストコンピュータ60はファイルメーカーまたは同様の技法を利用して、データ記憶94およびホスト60のワーキングメモリへの作業トランスクリプト13のアップロードを可能にする。このようにして、トランスクリプションサービスはトランスクリプションモジュール23として利用されてもよい。他の実施形態では、トランスクリプションモジュール23はホストコンピュータ60の内蔵コンポーネントである。
他の様々な構成も、本発明のこの開示で提供された当業者の認識範囲内にある。
図5を参照して、本発明の別の実施形態19では、ルーチン/プログラム92はウェブアプリケーションを提供する。この実施形態では、サーバ60は、ウェブサーバ61、Java(登録商標)アプレットサーバ63、SQLまたは他のデータベース管理サーバ65、ストリーミングデータ(例えばQuick Time)サーバ67およびFTPサーバ69を含む。クライアント50はエンコーダ/アップローダ53、トランスクライバ(文字起こし)55、ウェブビューア57およびプロデューサ/エディタ59を含む。いくつかの実施形態では、少なくともウェブビューア57およびプロデューサ/エディタ59はブラウザによるものである。
エンコーダ/アップローダクライアント53によって、ユーザは、本発明のデータベース/データストア(総称して94)のファイル11に現場からのインタビュー場面をディジタル化できる。ユーザは(クライアント53を介して)SQLサーバ65を呼び出してログオンする。クライアント53によって、ユーザは対象ソースビデオファイル11を符合化し、SQLサーバ65にこのソースビデオファイル11を記録する。これに応答して、SQLサーバ65は、ストリーミングサーバ67上でのファイル名およびファイルツリー位置を確定する。このストリーミングサーバ67は、ユーザによって対象ビデオファイル11がアップロードされるサーバである。したがって、クライアント53は、SQLサーバ65によって確定されるファイル名および位置を用いてストリーミングサーバ67に対象ビデオファイル11を転送する。
トランスクライバクライアント55によって、ビデオファイル11(このファイルのオーディオ部分)を文字に起こす責任を負うユーザは、本発明のシステム19と接続できる。トランスクライバクライアント55を介して、ユーザはSQLサーバ65にログオンして、ビデオファイル11(特定のファイルなど)に対する許可/アクセス権を取得する。ユーザは文字起こしのために対象ビデオデータ11を要求し、これに応答してSQLサーバ65はQuick Time(ストリーミング)サーバ67からクライアント55へのデータストリームを開始する(すなわち開く)。そして次に、トランスクライバクライアント55によって、ユーザは、(i)テキストに対象ビデオ11(対応するオーディオ)を文字起こしし、(ii)アップローダ/エンコーダクライアント53からストリーミングサーバ67にアップロードされた、オリジナルのソースメディアから時間コード33を取り込むことができる。トランスクリプション(文字起こし)および時間コード化が完了すると、ユーザ/クライアント55は、データストア94(SQLサーバ65)に結果として得られたトランスクリプト13をアップロードする。
いくつかの実施形態では、トランスクライバクライアント55はトランスクリプションサービスである。プロデューサ/エディタクライアント59によって、ユーザは、SQLサーバ65にログオンして、ユーザのビデオ編集プロジェクトへの許可されたアクセスを得ることができる。プロデューサ/エディタクライアント59によって、ユーザは、図4Aおよび4Bを用いて説明したとおり、作業トランスクリプト13の読取りおよびインタビュー場面を追うことができ、(節31の)選択、分割および順序付けを行う。このようにして、プロデューサ/エディタクライアント59によって、ユーザは、本発明の原理による編集カット15および対応するテキストスクリプト17を作成および閲覧できる。(すなわち、対応する作業トランスクリプト13を通して、ならびに、得られたテキストスクリプト17に選択されたすべての節31を移動すること、および対応する編集ビデオカット15を閲覧することのリアルタイムのユーザ命令を通して、ユーザはテキストスクリプト17を作成および閲覧できる。)ストリーミングサーバ67は、クライアント59に、ユーザが決定した順序で、ユーザによって選択された各節31のストリーミングビデオデータ11を供給する。SQLサーバ65は、ストリーミングサーバ67の動作を管理する。この管理には、該当のビデオデータのデータベース位置を判別することが含まれ、このビデオデータが編集カット15の表示をサポートする。
さらに、クライアント59は、アプリケーションのファイル管理および制御をプロジェクトのコンテクスト内に留めることを指示するプラットフォームを使用する。例えば、一実施形態では、プロデューサ/エディタクライアント59は自動的に”Photoshop”のような写真または画像の閲覧アプリケーションを開く。これによりユーザは、編集カット15に対する画像をトリミング(切取り)または編集できる。オーディオアプリケーションおよびアニメーションアプリケーションが同様に、編集カット15に関して制御される。さらに、クライアント59によって、ユーザは、ファイル名またはファイル位置を指定することを(ユーザが)必要とせずに、グラフィックスおよび各サーバ69、61に対して関連付けられたウェブグラフィックスを展開およびアップロードできる。その代わり、SQLサーバ65は、技術的に公知な技術もしくは一般的な技術を使用して、プロジェクトごとにファイルの出入りのチェックを管理する。クライアント59のユーザがこれらおよび他の2次アプリケーションのそれぞれを利用する際には、ファイル名、コンテンツおよびワークフローは所与のプロジェクトのコンテクスト内で解釈(定義および適用)される。
好ましい実施形態の別の構成では、音楽もしくは自然の音、自然のシーンなどのバックグラウンドオーディオ/ビデオが、シーン閲覧のPowerPointスタイルおよびユーザ定義された関連付けを使用して、作業編集カット15に加えられる。バックグラウンドオーディオの場合には、作業トランスクリプト13は、例えばナレーションのテキストトランスクリプションであり、バックグラウンドオーディオはビデオ画像(すなわちバックグラウンドビデオ)の対応するオーディオである。1つの例は音楽学校の作品である。演奏している演奏者のビデオクリップ(すなわち、ピアノ音楽を含むオーディオ(音)および演奏中のピアニストを表示するビデオ)が現場で撮影される。音楽学校内または音楽学校外でのインタビューもまた取り込まれ(少なくともオーディオソースデータとして)、このインタビューは音楽学校を説明するナレーションを提供する。インタビュー/ナレーションは、対象作品の主オーディオとして使用され、ナレーションのテキストは作業トランスクリプト13に文字起こしされる。ユーザがバックグラウンドオーディオおよびビデオに演奏家の場面を再生させながら、クライアント59を介して、ユーザはインタビューのトランスクリプト13を閲覧することができ、その結果ナレーションの流れを編集することができる。このようにして、ナレーションはバックグラウンドオーディオおよびビデオ(演奏者の演奏中のビデオクリップ)に重ねられ、対象の編集ビデオカット15を提供する。
ウェブビューアクライアント57によって、ユーザ、例えば編集カット15がその人用に作成されている顧客は、ウェブサーバ61にログオンすることができ、プロジェクトへの許可されたアクセスを取得できる。ウェブサーバ61による許可の後、ウェブビューアクライアント57のユーザはプロジェクトの原案すなわち編集カット15を選択および閲覧できる。このような閲覧の間、ウェブビューアクライアント57は対応する作業トランスクリプト13、編集/原案カット15に対応する結果として得られたスクリプト17および関連付けられたグラフィックスを表示する。オリジナルのソースビデオデータ11もユーザ命令で閲覧可能である。SQLサーバ65はストリーミングサーバ67を管理し、ウェブビューアクライアント57にストリーミングビデオデータを提供して、編集/原案カット15および/またはオリジナルのソースビデオデータ11の表示をサポートする。さらに、ウェブビューアクライアント57のユーザは、FTPサーバ69にグラフィックスおよびドキュメント(ステートメント)をアップロードできる。好ましい実施形態では、ユーザがコメントを入力し、対象プロジェクトの他の共同制作者のコメントを検閲できるようにするユーザインタフェースをウェブビューアクライアント57が提供する。ウェブサーバ61とSQLサーバ65間の通信は、Javaサーバアプレット63または同様の技術的に公知の技術によってサポートされる。
他の実施形態では、本発明は、グローバルコンピュータネットワーク(例えばインターネット)における、ビデオブログ、電子メール、ビデオによって強化されたディスカッションスレッドおよび同様のフォーラムに適用されてもよい。例えば、エンコーダ/アップローダ53はローカル(ローカルコンピュータ50に存在し、インターネットを介して接続される)またはリモート(ホストコンピュータ50、60のシステム内に存在する)である。
トランスクライバクライアント55はローカルであるか、またはホストコンピュータのシステム内に遠隔的に存在している。好ましくは、トランスクライバクライアント55は、米国仮特許出願第60/714,950号に(譲受人によって)開示されているとおり、音声認識モジュールおよびテキスト−ビデオマッピングと組み合わせられている。この出願の内容は参照により本明細書に引用したものとする。
プロデューサ/エディタクライアント59はウェブブラウザによるものである。「プロデューサ/エディタ」クライアントは「ウェブエディタ」クライアントである。
ウェブビューアクライアント57もまたウェブブラウザによるものであり、基本的に「プロデューサ/エディタ」クライアント59の「閲覧」コンポーネントである。ウェブビューア57およびプロデューサ/エディタクライアント59を合わせて、「ウェブエディタ/ビューア」クライアント57、59と称されてもよい。
この実施形態では、ホストコンピュータ60はポータルを開き、このポータルは、上述のコンポーネント(エンコーダ/アップローダ53、トランスクライバクライアント55、ウェブエディタ/ビューア57、59)へのアクセスを含む。
ポータルは、転送されたディジタル化オーディオおよびビデオメディア11を受信する。先に指定されたメディアソースに加えて、ローカルコンピュータ50に接続されたウェブカメラが、(1)ローカルに位置して、ホストコンピュータ60に符号化メディアファイルを送信するエンコーダ/アップローダアプレット、または(2)リモートサーバに位置して、メディアファイルを作成してホストコンピュータ60上にファイルを格納する符号化コンポーネント、のいずれかに信号を供給する。
次に、トランスクライバクライアント55がホストのメディアファイルへのアクセスを受信し、他の実施形態において先に説明されたとおり、ソースメディアファイルの時間コードによってリンク付けされたメディアファイルに対応する作業トランスクリプト13を作成する。
ウェブエディタ/ビューア57、59は、図3〜5に示したとおり、作業トランスクリプト13のビデオセグメントおよび対応する節31を表示する。さらに、メディアファイルおよびその対応する作業トランスクリプト13の部分から派生したセグメントデータは、図5における、クライアント、プロジェクト、トピックなどに類似して系統立てられているが、この実施形態では、レベル1、レベル1.1、レベル1.1.1と示されている。図6a、6bは実例である。
ウェブによるユーザインタフェースコンポーネントは、オーディオおよびビデオストリーミングメディアならびに対応するテキストスクリプト17を含むセグメントデータを並び替えて、最終的に表示する。
ポータル内に表示されるメディアファイルについてのセグメントデータは、ユーザ(ビューア)編集され、別の実施形態において先に説明された他のセグメントデータと共に順番に配置され、またリアルタイム再生モードでアクセスされる。ウェブ中心の(web-centric)実装において、このシーケンス(順番)は、「スレッド」に類似する。ここで、リアルタイム再生は図6Aおよび6Bに示されたものと同様の構造に沿ったフローを対象とし、さらに、スレッド展開を追跡するか、または主スレッドに戻ることを、リアルタイムでユーザが演出する(つまり指定する)。図6Aはユーザが演出した展開スレッドの再生を示すのに対して、図6Bは再生または主スレッドへの復帰を示している。
本発明は、好ましい実施形態に関して図示され、説明されているが、当業者であれば、形態および細部における様々な変更は、添付の特許請求の範囲に包含される本発明の範囲から逸脱することなく実施可能であることは理解されるであろう
う。
う。
11 ビデオデータ
13 作業トランスクリプト
50 ユーザコンピュータ
60 ホストコンピュータ
13 作業トランスクリプト
50 ユーザコンピュータ
60 ホストコンピュータ
Claims (29)
- ホストコンピュータおよびこのホストコンピュータと通信するように接続された複数のユーザコンピュータから構成されたコンピュータネットワークにおけるビデオ編集装置であって、
前記ホストコンピュータの対象ビデオデータのソースであって、前記ビデオデータは対応するオーディオデータを含む、対象ビデオデータのソースと、
前記ホストコンピュータから前記対象ビデオデータを受信するように接続されたトランスクリプションモジュールであって、このトランスクリプションモジュールは前記対象ビデオデータの対応するオーディオデータの作業トランスクリプトを作成し、この作業トランスクリプトの各部分を前記対象ビデオデータのそれぞれ対応する部分に関連付け、前記ホストコンピュータは、前記作業トランスクリプトの表示をユーザに提供し、前記表示された作業トランスクリプトを通じて前記対象ビデオデータの各部分の効率的なユーザ選択を可能にする、トランスクリプションモジュールと、
前記表示された作業トランスクリプトのトランスクリプト部分のユーザ選択に応答し、ユーザによって選択された各トランスクリプト部分にそれぞれ対応するビデオデータ部分を取得する組立要素であって、リアルタイムに、(i)前記それぞれ対応するビデオデータ部分を取得して、(ii)前記取得されたビデオデータ部分を組み合わせて、対応するテキストスクリプトを有するビデオ作品を作成する、組立要素とを備え、
前記ホストコンピュータが、前記表示される作業トランスクリプトとのユーザの対話中にユーザ命令を受けると、前記ユーザに前記ビデオ作品のリアルタイム表示を提供する、ビデオ編集装置。 - 請求項1において、前記ホストコンピュータが、前記作業トランスクリプトの表示と前記ビデオ作品の前記テキストスクリプトの表示との任意の組み合わせと同時に、前記ビデオ作品を表示する、ビデオ編集装置。
- 請求項1において、前記コンピュータネットワークがグローバルネットワークである、ビデオ編集装置。
- 請求項1において、前記ホストコンピュータが、前記ビデオ作品を他のユーザに対して表示を可能にする、ビデオ編集装置。
- 請求項1において、前記表示される作業トランスクリプトが一連の節から構成され、
トランスクリプト部分のユーザ選択は、前記一連の節の少なくともいくつかのユーザによる順序付けを含む、ビデオ編集装置。 - 請求項5において、各節は1つまたは複数のステートメントを有し、トランスクリプト部分のユーザ選択はある節におけるステートメントのサブセットのユーザ選択を含む、ビデオ編集装置。
- 請求項5において、各節は、対象ビデオデータの対応部分の開始時間コードおよび終了時間コードのうちの少なくとも1つを有する、ビデオ編集装置。
- 請求項1において、前記表示された作業トランスクリプトを通じて前記対象ビデオデータの各部分の効率的なユーザ選択を可能にする前記ホストコンピュータは、ユーザによって選択される部分のユーザ順序付けを可能にすることを含む、ビデオ編集装置。
- 請求項1において、前記コンピュータネットワークがローカルエリアネットワークである、ビデオ編集装置。
- 請求項9において、前記トランスクリプションモジュールが、前記ローカルエリアネットワークの外部のコンピュータで実行されるが、前記ホストコンピュータと通信し、
前記作業トランスクリプトの表示および前記表示された作業トランスクリプトとのユーザの対話は前記ホストコンピュータを介してなされる、ビデオ編集装置。 - 請求項1において、対象ビデオデータの前記ソースは、コンピュータネットワークによる、ビデオブログ、電子メール、ビデオによって強化されたユーザディスカッションスレッドおよびユーザフォーラムのいずれかである、ビデオ編集装置。
- ホストコンピュータおよび前記ホストコンピュータと通信するように接続された複数のユーザコンピュータから構成されたコンピュータネットワークにおけるビデオ編集方法であって、
前記ホストコンピュータにおける対象ビデオデータを受信する工程であって、前記ビデオデータは対応するオーディオデータを含む工程と、
前記対応するオーディオデータの作業トランスクリプトを作成するように前記受信された対象ビデオデータを文字起こしする工程と、
前記作業トランスクリプトの各部分を前記対象ビデオデータのそれぞれ対応する部分に関連付ける工程と、
ユーザに対して前記作業トランスクリプトを表示し、前記表示された作業トランスクリプトを通じて前記対象ビデオデータの各部分のユーザ選択を可能にする工程であって、前記ユーザ選択が前記対象ビデオデータの各部分の順序付けを含む工程と、
前記表示された作業トランスクリプトからユーザによって選択された各トランスクリプト部分に対して、リアルタイムに、(i)前記それぞれ対応するビデオデータ部分を取得し、(ii)前記取得されたビデオデータ部分を組み合わせて、対応するテキストスクリプトを有するビデオ作品を作成する工程と、
前記表示される作業トランスクリプトとのユーザの対話中にユーザ命令を受けると、前記ユーザにビデオ作品の表示を提供する工程とを備えた、ビデオ編集方法。 - 請求項12において、表示を提供する前記工程が、前記ビデオ作品、前記テキストスクリプトおよび前記作業トランスクリプトの任意の組み合わせをユーザに対して同時に表示することを含む、ビデオ編集方法。
- 請求項12において、前記コンピュータネットワークがグローバルネットワークである、ビデオ編集方法。
- 請求項12において、さらに、他のユーザに対して前記ビデオ作品の表示を可能にする工程を備えた、ビデオ編集方法。
- 請求項12において、前記表示される作業トランスクリプトは一連の節から構成され、
トランスクリプト部分のユーザ選択は、前記一連の節の少なくともいくつかのユーザによる順序付けを含む、ビデオ編集方法。 - 請求項16において、各節は1つまたは複数のステートメントを有し、トランスクリプト部分のユーザ選択はある節におけるステートメントのサブセットのユーザ選択を含む、ビデオ編集方法。
- 請求項16において、さらに、対象ビデオデータの対応部分の開始時間コードおよび終了時間コードの少なくとも1つを有する各節を提供する工程を備えた、ビデオ編集方法。
- 請求項12において、さらに、グラフィックス、画像、アニメーションおよび付加的なオーディオの任意の組み合わせを前記ビデオ作品に組み込む工程を備えた、ビデオ編集方法。
- 請求項12において、前記文字起こし工程が、1つまたは複数のトランスクリプションジョブを取得するように前記ホストにトランスクライバユーザを接続することを含み、このトランスクライバユーザは、(i)ホストの許可により対象ビデオデータにアクセスし、(ii)前記作業トランスクリプトを作成する、ビデオ編集方法。
- 請求項12において、前記コンピュータネットワークがローカルエリアネットワークである、ビデオ編集方法。
- 請求項21において、前記文字起こし工程が、前記ローカルエリアネットワークの外部のコンピュータで実行され、前記作業トランスクリプトは前記ホストコンピュータと電気的通信を行う、ビデオ編集方法。
- 請求項12において、対象ビデオデータを受信する前記工程が、コンピュータネットワークによる、ビデオブログ、電子メール、ビデオによって強化されたユーザディスカッションスレッドおよびユーザフォーラムのいずれかからのビデオデータを含む、ビデオ編集方法。
- ビデオ編集のコンピュータシステムであって、
対象ビデオデータを受信する手段であって、この対象ビデオデータが対応するオーディオデータを含む手段と、
前記対象ビデオデータの前記対応するオーディオデータを文字起こしする手段であって、前記対応するオーディオデータの作業トランスクリプトを作成し、前記作業トランスクリプトの各部分を前記対象ビデオデータのそれぞれの対応する各部分に関連付ける手段と、
ユーザに対して前記作業トランスクリプトを表示し、前記表示された作業トランスクリプトを通じて前記対象ビデオデータの各部分のユーザ選択を可能にする手段であって、前記表示された作業トランスクリプトからユーザによって選択されたトランスクリプトの部分に対して、リアルタイムに、(i)前記それぞれ対応するビデオデータ部分を取得し、(ii)前記取得されたビデオデータ部分を組み合わせて、ビデオ作品を作成し、(iii)前記表示された作業トランスクリプトとのユーザの対話中にユーザ命令を受けると、前記ユーザにビデオ作品を表示することを含む、手段とを備えたコンピュータシステム。 - 請求項24において、前記表示される作業トランスクリプトは一連の節から構成され、各節は1つまたは複数のステートメントを有し、
トランスクリプト部分のユーザ選択は、前記一連の節の少なくともいくつかのユーザ順序付けおよび/またはある節におけるステートメントのサブセットのユーザ選択を含む、コンピュータシステム。 - 請求項24において、前記ビデオ作品が対応するテキストスクリプトを含む、コンピュータシステム。
- 請求項24において、前記文字起こし手段が、前記表示手段から遠隔に位置する、コンピュータシステム。
- 請求項24において、前記対象ビデオデータは、コンピュータネットワークによる、ビデオブログ、電子メール、ユーザディスカッションスレッドおよびユーザフォーラムのいずれかからのビデオデータを含む、コンピュータシステム。
- ビデオ編集のコンピュータによる方法であって、
ユーザコンピュータにおいて対象ビデオデータを受信する工程であって、前記ビデオデータが対応するオーディオデータを含む工程と、
前記対応するオーディオデータの作業トランスクリプトを構成するように前記受信された対象ビデオデータを文字起こしする工程と、
前記ユーザコンピュータにおいて、前記作業トランスクリプトの各部分を前記対象ビデオデータのそれぞれの対応する部分に関連付ける工程と、
ユーザに対して前記作業トランスクリプトを表示し、前記表示された作業トランスクリプトを通じて前記対象ビデオデータの各部分のユーザ選択を可能にする工程であって、前記ユーザ選択が前記対象ビデオデータの各部分の順序付けを含む工程と、
前記表示された作業トランスクリプトから各ユーザによって選択されたトランスクリプト部分に対して、リアルタイムに、(i)前記それぞれ対応するビデオデータ部分を取得し、(ii)前記取得されたビデオデータ部分を組み合わせて、対応するテキストスクリプトを有するビデオ作品を作成する工程と、
前記表示される作業トランスクリプトとのユーザの対話中にユーザ命令を受けると、前記ユーザにビデオ作品の表示を提供する工程とを備えたビデオ編集のコンピュータによる方法。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US66021805P | 2005-03-10 | 2005-03-10 | |
PCT/US2006/008348 WO2006099008A1 (en) | 2005-03-10 | 2006-03-08 | Video editing method and apparatus |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2008537856A true JP2008537856A (ja) | 2008-09-25 |
Family
ID=36678641
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2008500899A Pending JP2008537856A (ja) | 2005-03-10 | 2006-03-08 | ビデオ編集方法およびその装置 |
Country Status (5)
Country | Link |
---|---|
US (1) | US20060206526A1 (ja) |
EP (1) | EP1856698A1 (ja) |
JP (1) | JP2008537856A (ja) |
CA (1) | CA2600733A1 (ja) |
WO (1) | WO2006099008A1 (ja) |
Families Citing this family (31)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7769756B2 (en) | 2004-06-07 | 2010-08-03 | Sling Media, Inc. | Selection and presentation of context-relevant supplemental content and advertising |
US9998802B2 (en) * | 2004-06-07 | 2018-06-12 | Sling Media LLC | Systems and methods for creating variable length clips from a media stream |
US7975062B2 (en) | 2004-06-07 | 2011-07-05 | Sling Media, Inc. | Capturing and sharing media content |
US7917932B2 (en) | 2005-06-07 | 2011-03-29 | Sling Media, Inc. | Personal video recorder functionality for placeshifting systems |
US7769819B2 (en) | 2005-04-20 | 2010-08-03 | Videoegg, Inc. | Video editing with timeline representations |
US20070118873A1 (en) * | 2005-11-09 | 2007-05-24 | Bbnt Solutions Llc | Methods and apparatus for merging media content |
DE102005059044A1 (de) * | 2005-12-08 | 2007-06-14 | Deutsche Thomson-Brandt Gmbh | Verfahren zum Bearbeiten von Medieninhalten in einer Netzwerkumgebung sowie Gerät zur Vorratsspeicherung von Medien-Daten |
US20080092047A1 (en) * | 2006-10-12 | 2008-04-17 | Rideo, Inc. | Interactive multimedia system and method for audio dubbing of video |
US7921176B2 (en) * | 2007-01-03 | 2011-04-05 | Madnani Rajkumar R | Mechanism for generating a composite email |
US20080172704A1 (en) * | 2007-01-16 | 2008-07-17 | Montazemi Peyman T | Interactive audiovisual editing system |
US8140341B2 (en) * | 2007-01-19 | 2012-03-20 | International Business Machines Corporation | Method for the semi-automatic editing of timed and annotated data |
US7986867B2 (en) * | 2007-01-26 | 2011-07-26 | Myspace, Inc. | Video downloading and scrubbing system and method |
US8218830B2 (en) * | 2007-01-29 | 2012-07-10 | Myspace Llc | Image editing system and method |
US7934011B2 (en) * | 2007-05-01 | 2011-04-26 | Flektor, Inc. | System and method for flow control in web-based video editing system |
US20090055538A1 (en) * | 2007-08-21 | 2009-02-26 | Microsoft Corporation | Content commentary |
US20090077170A1 (en) * | 2007-09-17 | 2009-03-19 | Andrew Morton Milburn | System, Architecture and Method for Real-Time Collaborative Viewing and Modifying of Multimedia |
KR101513888B1 (ko) * | 2007-12-13 | 2015-04-21 | 삼성전자주식회사 | 멀티미디어 이메일 합성 장치 및 방법 |
US8171148B2 (en) | 2009-04-17 | 2012-05-01 | Sling Media, Inc. | Systems and methods for establishing connections between devices communicating over a network |
US8621099B2 (en) * | 2009-09-21 | 2013-12-31 | Sling Media, Inc. | Systems and methods for formatting media content for distribution |
US9015225B2 (en) | 2009-11-16 | 2015-04-21 | Echostar Technologies L.L.C. | Systems and methods for delivering messages over a network |
US9178923B2 (en) | 2009-12-23 | 2015-11-03 | Echostar Technologies L.L.C. | Systems and methods for remotely controlling a media server via a network |
US9275054B2 (en) | 2009-12-28 | 2016-03-01 | Sling Media, Inc. | Systems and methods for searching media content |
US8302010B2 (en) * | 2010-03-29 | 2012-10-30 | Avid Technology, Inc. | Transcript editor |
US8572488B2 (en) * | 2010-03-29 | 2013-10-29 | Avid Technology, Inc. | Spot dialog editor |
US9443147B2 (en) * | 2010-04-26 | 2016-09-13 | Microsoft Technology Licensing, Llc | Enriching online videos by content detection, searching, and information aggregation |
US9113185B2 (en) | 2010-06-23 | 2015-08-18 | Sling Media Inc. | Systems and methods for authorizing access to network services using information obtained from subscriber equipment |
US8646013B2 (en) | 2011-04-29 | 2014-02-04 | Sling Media, Inc. | Identifying instances of media programming available from different content sources |
EP2765783A1 (en) * | 2013-02-11 | 2014-08-13 | Thomson Licensing | Method and device for enriching a multimedia content defined by a timeline and a chronological text description |
US9754624B2 (en) * | 2014-11-08 | 2017-09-05 | Wooshii Ltd | Video creation platform |
US9787819B2 (en) | 2015-09-18 | 2017-10-10 | Microsoft Technology Licensing, Llc | Transcription of spoken communications |
US11508411B2 (en) * | 2020-10-28 | 2022-11-22 | Meta Platforms Technologies, Llc | Text-driven editor for audio and video assembly |
Family Cites Families (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US4746994A (en) * | 1985-08-22 | 1988-05-24 | Cinedco, California Limited Partnership | Computer-based video editing system |
JP2986345B2 (ja) * | 1993-10-18 | 1999-12-06 | インターナショナル・ビジネス・マシーンズ・コーポレイション | 音声記録指標化装置及び方法 |
DE19740119A1 (de) * | 1997-09-12 | 1999-03-18 | Philips Patentverwaltung | System zum Schneiden digitaler Video- und Audioinformationen |
US6336093B2 (en) * | 1998-01-16 | 2002-01-01 | Avid Technology, Inc. | Apparatus and method using speech recognition and scripts to capture author and playback synchronized audio and video |
US6789228B1 (en) * | 1998-05-07 | 2004-09-07 | Medical Consumer Media | Method and system for the storage and retrieval of web-based education materials |
US6603921B1 (en) * | 1998-07-01 | 2003-08-05 | International Business Machines Corporation | Audio/video archive system and method for automatic indexing and searching |
US6697796B2 (en) * | 2000-01-13 | 2004-02-24 | Agere Systems Inc. | Voice clip search |
JP4660879B2 (ja) * | 2000-04-27 | 2011-03-30 | ソニー株式会社 | 情報提供装置および方法、並びにプログラム |
US7039585B2 (en) * | 2001-04-10 | 2006-05-02 | International Business Machines Corporation | Method and system for searching recorded speech and retrieving relevant segments |
US7870488B2 (en) * | 2005-02-10 | 2011-01-11 | Transcript Associates, Inc. | Media editing system |
-
2006
- 2006-03-08 US US11/371,251 patent/US20060206526A1/en not_active Abandoned
- 2006-03-08 WO PCT/US2006/008348 patent/WO2006099008A1/en active Application Filing
- 2006-03-08 EP EP06737514A patent/EP1856698A1/en not_active Withdrawn
- 2006-03-08 CA CA002600733A patent/CA2600733A1/en not_active Abandoned
- 2006-03-08 JP JP2008500899A patent/JP2008537856A/ja active Pending
Also Published As
Publication number | Publication date |
---|---|
WO2006099008A1 (en) | 2006-09-21 |
US20060206526A1 (en) | 2006-09-14 |
CA2600733A1 (en) | 2006-09-21 |
EP1856698A1 (en) | 2007-11-21 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP2008537856A (ja) | ビデオ編集方法およびその装置 | |
US8966360B2 (en) | Transcript editor | |
US20230199142A1 (en) | Creating and disseminating of user generated content over a network | |
US8173883B2 (en) | Personalized music remixing | |
US7099826B2 (en) | Text-to-speech synthesis system | |
US20070061728A1 (en) | Time approximation for text location in video editing method and apparatus | |
US7966184B2 (en) | System and method for audible web site navigation | |
US20150113410A1 (en) | Associating a generated voice with audio content | |
US20020091455A1 (en) | Method and apparatus for sound and music mixing on a network | |
US20110112835A1 (en) | Comment recording apparatus, method, program, and storage medium | |
WO2008001500A1 (fr) | Système de génération de contenus audio, système d'échange d'informations, programme, procédé de génération de contenus audio et procédé d'échange d'informations | |
JP6746923B2 (ja) | 情報処理システム、情報処理装置、情報処理方法および情報処理プログラム | |
JP2005341015A (ja) | 議事録作成支援機能を有するテレビ会議システム | |
US20070192107A1 (en) | Self-improving approximator in media editing method and apparatus | |
WO2018120820A1 (zh) | 一种演示文稿的制作方法和装置 | |
KR20100086136A (ko) | 동영상 편집 시스템 | |
WO2021111872A1 (ja) | コンテンツ提供システム、コンテンツ提供方法、及び記憶媒体 | |
JP2002157112A (ja) | 音声情報変換装置 | |
CN2909452Y (zh) | 用于再现接收的音乐内容的电子音乐装置 | |
JP2001202082A (ja) | 映像信号編集装置および方法 | |
JP7166373B2 (ja) | 音声ファイルに対するテキスト変換記録とメモをともに管理する方法、システム、およびコンピュータ読み取り可能な記録媒体 | |
JP2005080000A (ja) | インデキシング装置、映像再生装置及び方法 | |
KR20170130198A (ko) | 모바일 기반의 실시간 대본 리딩 시스템 및 방법 | |
JP4796466B2 (ja) | コンテンツ管理サーバ、コンテンツ提示装置、コンテンツ管理プログラム、及びコンテンツ提示プログラム | |
KR20170088255A (ko) | 온라인 기반의 연기자 대본 리딩을 위한 전자 대본 제공 시스템 및 방법 |