JP2007135197A - 字幕データを介して代替音声を作成する方法 - Google Patents

字幕データを介して代替音声を作成する方法 Download PDF

Info

Publication number
JP2007135197A
JP2007135197A JP2006272328A JP2006272328A JP2007135197A JP 2007135197 A JP2007135197 A JP 2007135197A JP 2006272328 A JP2006272328 A JP 2006272328A JP 2006272328 A JP2006272328 A JP 2006272328A JP 2007135197 A JP2007135197 A JP 2007135197A
Authority
JP
Japan
Prior art keywords
alternative
markers
program
subtitle data
client
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2006272328A
Other languages
English (en)
Other versions
JP5128103B2 (ja
Inventor
M Logan Bryan
ブライアン・エム・ローガン
T Nixa Terrence
テレンス・ティー・ニクサ
A Larson David
デービッド・エー・ラーソン
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
International Business Machines Corp
Original Assignee
International Business Machines Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by International Business Machines Corp filed Critical International Business Machines Corp
Publication of JP2007135197A publication Critical patent/JP2007135197A/ja
Application granted granted Critical
Publication of JP5128103B2 publication Critical patent/JP5128103B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/167Audio streaming, i.e. formatting and decoding of an encoded audio signal representation into a data stream for transmission or storage purposes
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L13/00Speech synthesis; Text to speech systems
    • G10L13/02Methods for producing synthetic speech; Speech synthesisers
    • G10L13/033Voice editing, e.g. manipulating the voice of the synthesiser
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B27/00Editing; Indexing; Addressing; Timing or synchronising; Monitoring; Measuring tape travel
    • G11B27/10Indexing; Addressing; Timing or synchronising; Measuring tape travel
    • G11B27/102Programmed access in sequence to addressed parts of tracks of operating record carriers
    • G11B27/105Programmed access in sequence to addressed parts of tracks of operating record carriers of operating discs
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B27/00Editing; Indexing; Addressing; Timing or synchronising; Monitoring; Measuring tape travel
    • G11B27/10Indexing; Addressing; Timing or synchronising; Measuring tape travel
    • G11B27/11Indexing; Addressing; Timing or synchronising; Measuring tape travel by using information not detectable on the record carrier

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)
  • Television Signal Processing For Recording (AREA)
  • Television Systems (AREA)

Abstract

【課題】 字幕データを介して代替音声を作成すること。
【解決手段】 一実施形態において、代替音声セグメントを有する代替音声ファイルを作成し、代替音声ファイル中にマーカーを組み込む、方法、装置、システム、及び信号伝達媒体が開示される。マーカーの各々は、それぞれの代替音声セグメントに関連付けられ、マーカーはプログラム中の原字幕データ・セグメントを識別する。代替音声ファイルはクライアントに送信される。クライアントは、プログラムをコンテンツ・プロバイダから受信し、マーカーを原字幕データ・セグメントに整合させ、プログラムの表示に際して、該整合によって原音声セグメントに代えて代替音声セグメントを用いる。一実施形態においては、代替字幕データ・セグメントを有する代替字幕データが作成される。
【選択図】 図2

Description

本発明の実施形態は、一般にディジタル・ビデオ・レコーダに関する。具体的には、本発明の実施形態は、一般にディジタル・ビデオ・レコーダを介して表示されるプログラムのための代替音声に関する。
テレビジョンは、確かに現代における最も影響力の強い力の一つである。テレビジョン・セット又はTVと呼ばれる装置を通して、視聴者はニュース、スポーツ、娯楽、情報、及びコマーシャルを受け取ることができる。テレビジョンは、見ること及び聞くことの両方によって最もよく楽しめる媒体である。しかし、視聴者が、話されている言語、或いはスクリーン上に表示されている文章を理解できない場合には、彼らは、その番組を十分に楽しむこと、或いは広告されている製品について十分に知ることができない。代替の言語を理解できる視聴者に対応するための現在の方法には、次の3つの選択肢、即ち、該代替言語専用の一つ又は複数のチャネルを提供することか、第2の音声プログラム(SAP)を介して代替音声を提供することか、又は、該代替言語における字幕(CC)を提供すること、がある。
専用チャネルの不便な点は、視聴者が少しのプログラム・チャネルに制限されることである。また、放送周波数帯の一つのチャネルが該代替言語に割り当てられ、多数の可能な言語が必要となるので、コンテンツ・プロバイダ(例えば、ケーブル又は衛星会社)は同じく多数の専用チャネルを提供しなければならない。この不便な点はまた、SAP及びCCが代替言語を提供するための有限の帯域幅を有するという点で、それらに悪影響を及ぼす。また、SAP音声は、普通、コンテンツの制作者によって提供されるので、代替音声を提供することはコンテンツ制作者にとって煩わしい負担となる。
従って、ビデオ・コンテンツに関連する代替言語の音声及び字幕テキストを提供するためのより優れた技術が必要である。
一実施形態において、代替音声セグメントを有する代替音声ファイルを作成し、該代替音声ファイル中にマーカーを組み込むための方法、装置、システム、及び信号伝達媒体が提供される。該マーカーの各々は、それぞれの代替音声セグメントに関連付けられ、該マーカーはプログラム中の原字幕データ・セグメントを識別する。該代替音声ファイルはクライアントに送信される。該クライアントは、コンテンツ・プロバイダから該プログラムを受信し、該マーカーを該原字幕データ・セグメントに整合させ、プログラムの表示に際して、該整合によって原音声セグメントに代えて代替音声セグメントを用いる。
一実施形態においては、代替字幕データ・セグメントを含む代替字幕データが作成される。マーカーが代替字幕データ中に組み込まれ、マーカーの各々は、代替字幕データ・セグメントのそれぞれの一つに関連付けられ、該マーカーは該プログラム中の原字幕データ・セグメントを識別する。該代替字幕データはクライアントに送信される。該クライアントは、該マーカーを該原字幕データ・セグメントに整合させ、プログラムの表示に際して、該整合によって該原音声セグメントに代えて代替音声セグメントを用いる。
一実施形態においては、代替音声及びビデオ・セグメントを含む代替コンテンツが作成される。マーカーが代替コンテンツ中に組み込まれ、該マーカーの各々は、代替音声及びビデオ・セグメントのそれぞれの一つに関連付けられ、該マーカーは該プログラム中の原字幕データ・セグメントを識別する。該代替コンテンツはクライアントに送信される。該クライアントは、該マーカーを該原字幕データ・セグメントに整合させ、プログラムの表示に際して、該整合によって該原字幕データ・セグメントに代えて代替音声及びビデオ・セグメントを用いる。
図面を参照すると、同じ番号は幾つかの図面にわたって同じ部品を示すが、図1は、本発明の一実施形態による、ディジタル動画及び/又は音声情報を記録/再生するために用いられる例示的なディタル・ビデオ・レコーダ(DVR)100のブロック・ダイアグラムを図示する。ディタル・ビデオ・レコーダ100は、CPU(中央処理装置)130、記憶デバイス132、一時記憶装置134、データ処理装置136、システム時間カウンタ138、音声/ビデオ入力端子142、TVチューナ144、音声/ビデオ出力端子146、ディスプレイ148、キーイン部149、エンコーダ150、デコーダ160、及びメモリ198を備えている。CPU130は、ディジタル・ビデオ・レコーダ100の動作を制御する、プログラム可能な汎用中央処理装置とすることができる。
記憶デバイス132は、直接アクセス記憶デバイス(DASD)、DVD−RAM、CD−RW、又は、データのエンコード、読み出し、及び書き込みが可能な任意の他の型の記憶デバイスとすることができる。記憶デバイス132は、プログラム174を格納する。プログラム174は、格納し、取得し、表示することのできるデータである。種々の実施形態において、プログラム174は、テレビジョン・プログラム、ラジオ・プログラム、映画、ビデオ、音声、静止画像、図形、又はそれらの任意の組合せ、とすることができる。一実施形態においては、プログラム174は原字幕データを包含する。
エンコーダ部分150は、アナログ・ディジタル・コンバータ152、ビデオ・エンコーダ153、音声エンコーダ154、サブ・ビデオ・エンコーダ155、及びフォーマッタ156を備える。アナログ・ディジタル・コンバータ152には、音声ビデオ入力端子142からの外部アナログ・ビデオ信号及び外部アナログ音声信号、或いは、TVチューナ144からのアナログTV信号及びアナログ音声若しくは音声信号、が供給される。アナログ・ディジタル・コンバータ152は、入力アナログ・ビデオ信号をディジタル形式に変換する。即ち、アナログ・ディジタル・コンバータ152は、輝度成分Y、色差成分Cr(又はY−R)、及び色差成分Cb(又はY−B)を量子化してディジタル形式にする。更に、アナログ・ディジタル・コンバータ152は、入力アナログ音声信号をディジタル形式に変換する。
アナログ・ビデオ信号及びディジタル音声信号がアナログ・ディジタル・コンバータ152に入力したときは、アナログ・ディジタル・コンバータ152はディジタル音声信号をそのまま通過させる。この際、ディジタル信号に付随するジッタを低減する処理、或いはサンプリング・レート又は量子化ビット数を変換する処理は、ディジタル音声信号のコンテンツを変えずに効率的に実施され得る。更に、ディジタル・ビデオ信号及びディジタル音声信号がアナログ・ディジタル・コンバータ152に入力したときは、アナログ・ディジタル・コンバータ152はディジタル・ビデオ信号及びディジタル音声信号をそのまま通過させる。ジッタ低減処理又はサンプリング・レート変換処理は、ディジタル信号のコンテンツを変えずに効率的に実施され得る。
アナログ・ディジタル・コンバータ152からのディジタル・ビデオ信号成分は、ビデオ・エンコーダ153を経由してフォーマッタ156に供給される。アナログ・ディジタル・コンバータ152からのディジタル音声信号成分は、音声エンコーダ154を経由してフォーマッタ156に供給される。
ビデオ・エンコーダ153は、入力ディジタル・ビデオ信号を可変ビット・レートで圧縮されたディジタル信号に変換する。例えば、ビデオ・エンコーダ153は、MPEG2又はMPEG1仕様を実装することができるが、他の実施形態においては任意の適切な仕様を用いてもよい。
音声エンコーダ154は、入力ディジタル音声信号を、例えばMPEG音声又はAC−3の仕様に基づく固定ビット・レートで圧縮されたディジタル信号(又は線形PCM(Pulse Code Modulation)のディジタル信号)に変換するが、他の実施形態においては任意の適切な仕様を用いることもできる。
音声ビデオ入力端子142からビデオ信号が入力したとき、或いは、TVチューナ144からビデオ信号が受信されたとき、ビデオ信号中のサブ・ビデオ信号成分がサブ・ビデオ・エンコーダ155に入力する。サブ・ビデオ・エンコーダ155に入力したサブ・ビデオ・データは、事前設定された信号構成に変換されて、フォーマッタ156に供給される。フォーマッタ156は、入力ビデオ信号、音声信号、サブ・ビデオ信号に対する事前設定の信号処理を実行し、記録データをデータ・プロセッサ136へ出力する。
一時記憶領域134は、記憶デバイス132に書き込まれるデータ(エンコーダ150から出力されたデータ)中の事前設定量のデータのバッファリング、或いは、記憶デバイス132から再生されたデータ(デコーダ領域160に入力されるデータ)中の事前設定量のデータのバッファリングを行う。データ・プロセッサ136は、エンコーダ領域150からの記録データを記憶デバイス132に供給し、記憶デバイス132から再生された再生信号を抽出し、記憶デバイス132に記録されている管理情報を書き換えるか、或いは、記憶デバイス132に記録されているデータをCPU130の制御に従って削除する。
ディジタル・ビデオ・レコーダ100を所有するユーザに通知されるべきコンテンツは、ディスプレイ148に表示されるか、或いは、TV又は音声ビデオ出力端子146に接続されたモニタ(図示せず)上に表示される。
CPU130が記憶デバイス132、データ・プロセッサ136、エンコーダ150、及び/又はデコーダ160を制御するタイミングは、システム時間カウンタ138からの時間データに基づいて設定される。記録/再生動作は、普通はシステム時間カウンタ138からのタイム・クロックと同期して実行され、他のプロセスは、システム時間カウンタ138から独立したタイミングで実行されてもよい。
デコーダ160は、再生データからの各パックを分離し抽出するためのセパレータ162と、セパレータ162によって分離された主ビデオ・データをデコードするためのビデオ・デコーダ164と、セパレータ162によって分離されたサブ・ビデオ・データをデコードするためのサブ・ビデオ・デコーダ165と、セパレータ162によって分離された音声データをデコードするための音声デコーダ168と、サブ・ビデオ・デコーダ165からのサブ・ビデオ・データをビデオ・デコーダ164からのビデオ・データと組み合わせるためのビデオ・プロセッサ166と、を備えている。
ビデオ・ディジタル・アナログ・コンバータ167は、ビデオ・プロセッサ166からのディジタル・ビデオ出力信号を、アナログ・ビデオ信号に変換する。音声ディジタル・アナログ・コンバータ169は、音声デコーダ168からのディジタル音声出力信号をアナログ音声信号に変換する。ビデオ・ディジタル・アナログ・コンバータ167からのアナログ・ビデオ信号と、音声ディジタル・アナログ・コンバータ169からのアナログ音声信号とは、音声ビデオ出力端子146を経由して、典型的には、テレビジョン・セット、モニタ、又はプロジェクタである、外部コンポーネント(図示せず)に供給される。
次に、本発明の一実施形態による、ディジタル・ビデオ・レコーダ100の記録プロセス及び再生プロセスが説明される。記録のためのデータ処理を行うとき、ユーザが初めにキーイン部149によってキーイン操作を実行する場合には、CPU130はプログラムに対する記録命令を受信し、記憶デバイス132から管理データを読み出して、ビデオ・データを記録する領域を決定する。別の実施形態においては、CPU130は記録すべきプログラムを決定する。
次に、CPU130は、管理領域中に決定された領域を設定し、記憶デバイス132上でのビデオ・データの記録開始アドレスを設定する。この場合、管理領域は、ファイルを管理するためのファイル管理部分を指定し、ファイル管理部分に必要な制御情報及びパラメータが順次記録される。
次に、CPU130はシステム時間カウンタ138の時間をリセットする。この実施例においては、システム時間カウンタ138はシステムの時計であり、その時間を参照としながら記録/再生動作が実行される。
ビデオ信号の流れは次の通りである。音声ビデオ入力端子142又はTVチューナ144から入力した音声ビデオ信号は、アナログ・ディジタル・コンバータ152によってA/D変換され、ビデオ信号及び音声信号は、それぞれ、ビデオ・エンコーダ153及び音声エンコーダ154に供給され、TVチューナ144からの字幕信号、又は文字放送の文字信号がサブ・ビデオ・エンコーダ155に供給される。
エンコーダ153、154、155は、それぞれの入力信号を圧縮してパケットを作成し、該パケットがフォーマッタ156に入力する。この場合、エンコーダ153、154、155は、システム時間カウンタ138の値に従って、各パケットのPTS(表示時間スタンプ)、DTS(デコード時間スタンプ)を決定し記録する。フォーマッタ156は、各入力パケット・データをパックに束ね、該パックを混合し、混合結果をデータ・プロセッサ136に供給する。データ・プロセッサ136は、該パック・データを記憶デバイス132に送信し、該記憶デバイスは該データをプログラム174の一つとして格納する。
再生動作の際には、ユーザは最初にキーイン部149によってキーイン操作を実行し、CPU130は、それから再生命令を受信する。次に、CPU130は記憶デバイス132に対して読み出し命令と、再生されるべきプログラム174のアドレスとを与える。記憶デバイス132は、与えられた命令に従ってセクタ・データを読み出し、該データをパック・データ形式でデコーダ部分160へ出力する。
デコーダ部分160において、セパレータ162は読出しパック・データを受信し、該データをパケット形式に形成し、ビデオ・パケット・データ(例えば、MPEGビデオ・データ)をビデオ・デコーダ164に転送し、音声パケット・データを音声デコーダ168に転送し、サブ・ビデオ・パケット・データをサブ・ビデオ・デコーダ165に転送する。
この後、デコーダ164、165、168は、それぞれのパケット・データ項のPTSの値に同期して再生プロセスを実行し(PTS値とシステム時間カウンタ138の値が互いに一致するタイミングにおいてデコードされたパケット・データを出力する)、音声字幕を伴った動画を、音声ビデオ出力端子146を経由して、TV,モニタ、又はプロジェクタ(図示せず)に供給する。
メモリ198はCPU130に接続され、言語選択部170及び制御部172を有する。言語選択部170は、プログラム174の部分を見る方法を記述する。別の実施形態においては、言語選択部170はプログラム174中に組み込まれるか、又はそれと一緒に格納される。言語選択部170は、以下で図4を参照して更に説明される。
制御部172は、CPU130上で実行可能な命令、又はCPU上で実行する命令によって解釈可能なステートメントを有し、以下で図3、図4、図5、図6、及び図7を参照して更に説明されるように、言語選択部170及びプログラム174を操作して、以下で図8及び図9を参照して更に説明されるように、諸機能を実行する。別の実施形態においては、制御部172はマイクロコード形式で実装することができる。別の実施形態においては、制御部172は論理ゲート、及び/又は、プロセッサを有するディジタル・ビデオ・レコーダの代わりに若しくはそれに加えた他の適切なハードウェア技術、によるハードウェアの形態で実装することができる。
他の実施形態においては、ディジタル・ビデオ・レコーダ100は、パーソナル・コンピュータ、メインフレーム・コンピュータ、ラップトップ若しくはノートブック・コンピュータ、PDA(携帯情報端末)、タブレット・コンピュータ、ポケット・コンピュータ、テレビジョン、セット・トップ・ボックス、ケーブル・デコーダ・ボックス、電話、ポケットベル、自動車、電話会議システム、カムコーダ、ラジオ、音声レコーダ、音声プレイヤ、ステレオ・システム、MP3(MPEG音声レイヤ3)プレイヤ、ディジタル・カメラ、電気製品、又は任意の他の適切な型の電子デバイス、とすることができる。
図2は、本発明の一実施形態による、ネットワーク230経由でクライアントのディジタル・ビデオ・レコーダ100に接続したサーバ・コンピュータ・システム200、及びネットワーク230経由でクライアント100に接続したコンテンツ・プロバイダ232を表すハイレベル・ブロック・ダイアグラムを図示する。「クライアント」及び「サーバ」という言葉は、便宜上用いているだけであり、他の実施形態においては、ある場合にクライアントとして動作する電子デバイスが、別の場合にはサーバとして動作してもよいし、或いはその逆であってもよい。コンピュータ・システム200の主要な構成部分には、一つ又はそれ以上のプロセッサ201、主メモリ202、端末インタフェース211、ストレージ・インタフェース212、I/O(入力/出力)デバイス・インタフェース213、及び通信/ネットワーク・インタフェース214があり、これらの全ては、メモリ・バス203、I/Oバス204、及びI/Oバス・インタフェース・ユニット205を介して、構成部分間通信のために相互接続される。
コンピュータ・システム200は、一つ又はそれ以上の汎用のプラグラム可能中央演算処理装置(CPUs)201A,201B,201C,及び201Dを有するが、ここで、これらを総称してプロセッサ201と呼ぶ。一実施形態において、コンピュータ・システム200は、比較的大きなシステムに典型的なマルチ・プロセッサを備えるが、しかし別の実施形態においては、コンピュータ・システム200は、その代りに単一CPUシステムとしてもよい。各プロセッサ201は、主メモリ202に格納されている命令を実行し、一つ又はそれ以上のオンボード・キャッシュを有することができる。
主メモリ202は、データ及びコンピュータ・プログラムを格納するランダム・アクセス半導体メモリである。主メモリ202は、概念的には単一モノリシック・エンティティであるが、他の実施形態においては、主メモリ202は、階層式キャッシュ及び他のメモリ・デバイスなど、より複雑な配列をとる。例えば、メモリは多層式キャッシュとして存在することができて、これらのキャッシュはさらに機能によって分類され、その結果、一つのキャッシュは命令を格納し、一方別のキャッシュは、プロセッサ又は複数のプロセッサが使用する非命令データを格納するようにすることができる。メモリは更に、様々ないわゆる非均等メモリ・アクセス(NUMA)コンピュータ・アーキテクチャのいずれかにおいて既知であるように、異なるCPUs又はCPUの組に分散させ関連付けることができる。
メモリ202は、翻訳サービス部270、言語データ272、代替音声ファイル274、代替字幕データ276、及び代替コンテンツ278を有する。翻訳サービス部270、言語データ272、代替音声ファイル274、代替字幕データ276、及び代替コンテンツ278は、コンピュータ・システム200におけるメモリ202に含まれているように図示されているが、他の実施形態においては、それらの幾つか又は全部が異なるコンピュータ上にあって、例えば、ネットワーク230経由でリモート・アクセス可能とすることもできる。コンピュータ・システム200は、仮想アドレス指定機構を使用することができ、それにより、コンピュータ・システム200のソフトウェアが、あたかも、複数の小さな記憶エンティティではなく、大きな単一の記憶エンティティだけにアクセスしているかのように振舞うことが可能となる。このように、翻訳サービス部270、言語データ272、代替音声ファイル274、代替字幕データ276、及び代替コンテンツ278は、メモリ202に常駐しているように図示されているが、これらの要素は、必ずしも全部が同時に同じ記憶デバイスに完全に含まれるのではない。
一実施形態において、翻訳サービス部270はプロセッサ201上で実行可能な命令、或いは、プロセッサ201上で実行する命令によって解釈可能なステートメントを有し、以下で図6及び図7を参照してさらに説明するように、言語データ272、代替音声ファイル274、代替字幕データ276、及び代替コンテンツ278を操作する。別の実施形態においては、翻訳サービス部270はマイクロコード形式で実装することができる。別の実施形態においては、翻訳サービス部270は、論理ゲート、及び/又は、プロセッサを有するシステムの代わりに若しくはそれに加えた他の適切なハードウェア技術によるハードウェアの形態で実装することができる。代替音声ファイル274、代替字幕データ276、及び代替コンテンツ278は、プログラム174に組み込まれていない、又はその部分ではないという意味で代替物であり、プログラム174に組み込まれているか、又はその部分である任意の原音声又は原字幕データから(及び言語が異なる点においても)区別される。
メモリ・バス203は、プロセッサ201、主メモリ202、及びI/Oバス・インタフェース・ユニット205の間でデータを転送するためのデータ通信パスを提供する。I/Oバス・インタフェース・ユニット205は更に、種々のI/Oユニットとの間でデータ転送を行うために、I/Oバス204に接続されている。I/Oバス・インタフェース・ユニット205は、I/Oプロセッサ(IOPs)又はI/Oアダプタ(IOAs)としても知られている、多重I/Oインタフェース・ユニット211、212、213、及び214と、システムI/Oバス204を通して交信する。システムI/Oバス204は、例えば、業界標準PCI(Peripheral Component Interconnect)バス、又は任意の他の適切なバス技術とすることができる。I/Oインタフェース・ユニットは様々な記憶及びI/Oデバイスとの通信をサポートする。例えば、端末インタフェース・ユニット211は、一つ又はそれ以上のユーザ端末221、222、223、及び224の接続をサポートする。
図2において、メモリ・バス203は、プロセッサ201、主メモリ202、及びI/Oバス・インタフェース205の間の直接通信パスを提供する、比較的簡単な単一のバス構造体として示されているが、別の実施形態においては、メモリ・バス203は複数の異なるバス又は通信パスを含むことができ、該パスは、階層状のポイント・ツー・ポイント・リンク、スター型又はウェブ状配置、多重階層バス、並行及び重複バス、などの様々な形態のいずれかに配置することができる。さらに、I/Oバス・インタフェース205及びI/Oバス204は、それぞれが単一のユニットとして示されているが、他の実施形態においては、コンピュータ・システム200は、多重I/Oバス・インタフェース・ユニット205及び/又は多重I/Oバス204を有することができる。多重I/Oインタフェース・ユニットは、システムI/Oバス204を種々のI/Oデバイスに向って延びる種々の通信パスから分離するように示されているが、他の実施形態においては、I/Oデバイスの幾つか又は全部が、一つ又はそれ以上のシステムI/Oバスに直接接続される。
ストレージ・インタフェース・ユニット212は、一つ又はそれ以上の直接アクセス記憶デバイス(DASD)225、226、及び227の接続をサポートし、該記憶デバイスは、典型的には、回転磁気ディスク・ドライブ記憶デバイスであるが、代替として他のデバイス、例えば、ホストには単一の大容量記憶デバイスとして見えるように構成されたディスク・ドライブのアレイとすることもできよう。I/O及び他のデバイス・インタフェース213は、任意の種々の他の入力/出力デバイス又は他の型のデバイスに対するインタフェースを提供する。二つのそのようなデバイス、プリンタ228及びファックス装置229、が図2の例示的な実施形態に示されているが、他の実施形態においては、多くの他のそのようなデバイスが存在してもよく、それらは異なる型のデバイスであってもよい。ネットワーク・インタフェース214は、コンピュータ・システム200から他のディジタル電子デバイス及びコンピュータ・システムへの、一つ又はそれ以上の通信パスを提供し、該パスは、例えば、一つ又はそれ以上のネットワーク230を含むことができる。
ネットワーク230は、任意の適切なネットワーク又はネットワークの組合せとすることができ、コンピュータ・システム200、コンテンツ・プロバイダ232、及び/又はクライアント100、へ/からのデータ、プログラム、及び/又はコードの通信のために適切なプロトコルをサポートすることができる。一実施形態においては、ネットワーク230は、テレビジョン・ネットワークを表し、ケーブル、衛星、又は放送TVのいずれであっても、また、アナログ又はディジタルのいずれであってもよい。一実施形態においては、ネットワーク230は、コンピュータ・システム200に直接に又は間接に接続した記憶デバイス又は記憶デバイスの組合せとすることができる。一実施形態においては、ネットワーク230はインフィニバンドをサポートすることができる。別の実施形態においては、ネットワーク230は無線通信をサポートすることができる。別の実施形態においては、ネットワーク230は、電話回線又はケーブルなど、有線通信をサポートすることができる。別の実施形態においては、ネットワーク230は、イーサネットIEEE(電気電子学会)802.3x仕様をサポートすることができる。別の実施形態においては、ネットワーク230はインターネットとして、IP(インターネット・プロトコル)をサポートすることができる。別の実施形態においては、ネットワーク230は、ローカル・エリア・ネットワーク(LAN)又は広域ネットワーク(WAN)とすることができる。別の実施形態においては、ネットワーク230はホット・スポット・サービス・プロバイダのネットワークとすることができる。別の実施形態においては、ネットワーク230はイントラネットとすることができる。別の実施形態においては、ネットワーク230はGPRS(汎用パケット無線サービス)ネットワークとすることができる。別の実施形態においては、ネットワーク230はFRS(家族無線サービス)ネットワークとすることができる。別の実施形態においては、ネットワーク230は、任意の適切なセルラー・データ・ネットワーク又はセル・ベースの無線ネットワーク技術とすることができる。別の実施形態においては、ネットワーク230はIEEE802.11B無線ネットワークとすることができる。さらに別の実施形態においては、ネットワーク230は、任意の適切なネットワーク又はネットワークの組合せとすることができる。一つのネットワーク230が図示されているが、他の実施形態においては、任意の数のネットワーク(同じ又は異なる型の)が存在してもよい。
図2に図示されているコンピュータ・システム200は、マルチ・ユーザ「メイン・フレーム」コンピュータ・システムの典型のように、多数の接続された端末221、222、223、及び224を備えている。典型的には、そのような場合には接続されるデバイスの実際の数は図2に示されているよりも大きいが、但し、本発明はいかなる特定の大きさのシステムにも限定されるものではない。コンピュータ・システム200は、その代わりに、典型的には単一のユーザ・ディスプレイ及びキーボード入力部を有する単一ユーザ・システム、或いは、ユーザ・インタフェースをほとんど又は全く有しないが、他のコンピュータ・システム(クライアント)からの要求を受信するサーバ又は類似のデバイスとすることができる。他の実施形態においては、コンピュータ・システム200は、パーソナル・コンピュータ、携帯用コンピュータ、ラップトップ又はノートブック・コンピュータ、PDA(携帯情報端末)、タブレット・コンピュータ、ポケット・コンピュータ、電話、ポケットベル、自動車、電話会議システム、ビデオ・レコーダ、カムコーダ、音声レコーダ、音声プレイヤ、ステレオ・システム、MP3(MPEG音声レイヤ3)プレイヤ、ディジタル・カメラ、電気製品、又は任意の他の適切な型の電子デバイス、として実装することができる
コンテンツ・プロバイダ232はプログラム174を有し、それをクライアント100がダウンロードすることができる。種々の実施形態において、コンテンツ・プロバイダ232は、テレビ放送局、ケーブル・テレビ施設、衛星テレビ施設、インターネット・テレビジョン・プロバイダ、又は任意の他の適切なコンテンツ・プロバイダとすることができる。コンテンツ・プロバイダ232はコンピュータ・システム200から分離しているように図示されているが、別の実施形態においては、それらを一纏めにすることができる。
図1及び図2は、クライアント100、コンピュータ・システム200、コンテンツ・プロバイダ232、及びネットワーク230の代表的な主要部分をハイレベルで図示することを意図したものであること、個々の部分は図1及び図2に示されたものより遥かに複雑であり得ること、図1及び図2に示されたものの代わりに、又はそれらに加えて、他の部分が存在し得ること、並びに、それら部分の数、型、及び構成を変更し得ること、を理解されたい。それら付加的な複雑さ又は付加的な変更の幾つかの具体的な実施例が、ここに開示されるが、これらは例示のためだけであり、必ずしもそれらの変更にとどまらないことを理解されたい。
図1及び図2に示される種々のソフトウェア部分、及び本発明の種々の実施形態を実施することは、以後「コンピュータ・プログラム」と総称する種々のコンピュータ・ソフトウェア・アプリケーション、ルーチン、コンポーネント、プログラム、オブジェクト、モジュール、データ構造体など、を用いることを含む多くの方法で実施することができる。コンピュータ・プログラムは、典型的には、クライアント100及びコンピュータ・システム200の中の種々のメモリ及び記憶デバイスに、種々の時間に常駐する一つ又はそれ以上の命令を含み、該命令は、クライアント100中の一つ又はそれ以上のプロセッサ130又は136、及び/又は、コンピュータ・システム200中のプロセッサ201によって読み出され、実行されるときには、クライアント100及び/又はコンピュータ・システム200に対して、本発明の一実施形態の種々の態様を具体化するステップ又は要素を実行するために必要なステップを実行させる。
さらに、本発明の実施形態は、完全に機能するコンピュータ・システム及びディジタル・ビデオ・レコーダに関連して説明され、また以下で説明されるであろうが、しかし本発明の種々の実施形態は、種々の形態のプログラム製品として配布することができ、本発明は、配布を実際に実施するために用いられる信号伝達媒体の特定の型に関らず、均等に適用される。本実施形態の機能を規定するプログラムは、クライアントのディジタル・ビデオ・レコーダ100及び/又はコンピュータ・システム200に対して、様々な有形の信号伝達コンピュータ書込み可能媒体を介して配布することができ、それらには、
(1)CD−ROM,DVD−R,又はDVD+Rなど、コンピュータ・システム中の又はそれに接続した読取り専用メモリ・デバイスなどの、非書換え可能記憶媒体に永続的に格納された情報
(2)例えば、ハード・ディスク・ドライブ(例えば、DASD 225,226、若しくは227、記憶デバイス132、又はメモリ198)、CD−RW、DVD−RW,DVD+RW,DVD−RAM,又はディスケットなど、書換え可能記憶媒体に格納された可変情報
(3)ディジタル・ビデオ・レコーダ100又はコンピュータ・システム200に対して、コンピュータ又は電話網を通して、例えば、無線通信を含むネットワーク230などの通信媒体によって、伝送された情報
が挙げられるが、それらに限定はされない。
そのような有形の信号伝達コンピュータ書込み可能媒体は、本発明の機能を指示する機械可読命令を所持する場合に、本発明の実施形態を表す。
本発明の実施形態はまた、クライアントの法人、非営利組織、政府事業体、内部組織構成体などとのサービス契約の部分として配信することができる。これらの実施形態の態様は、コンピュータ・システムを動作するように設定するステップと、ここで説明された方法の幾つか又は全てを実行するソフトウェア・システム及びウェブ・サービスを実装するステップと、を含む。これらの実施形態の態様はまた、クライアント会社を分析するステップと、分析結果に対応して提案を作成するステップと、提案の部分を実行するためのソフトウェアを生成するステップと、該ソフトウェアを既存のプロセス及びインフラストラクチャに統合するステップと、ここに説明された方法及びシステムの使用量を計量するステップと、ユーザに経費を割り当てるステップと、ユーザにこれらの方法及びシステムの使用に関する請求書を送るステップと、を含む。
さらに、以下に説明される種々のプログラムは、それらが本発明の特定の実施形態において実行されるアプリケーションに基づいて識別することが可能となる。しかし、以下のどの特別なプログラム術語も、単に便宜のために用いられるものであり、従って、本発明の実施形態は、そのような術語によって識別される及び/又は意味される、任意の特定のアップリケーション中に単独で用いることに限定されるものではない。
図1及び図2に示される例示的な環境は、本発明を限定することを意図するものではない。実際に、他の代替のハードウェア及び/又はソフトウェア環境を、本発明の範囲から逸脱せずに、用いることができる。
図3は、本発明の一実施形態による、例示的な言語データ272のブロック・ダイアグラムを図示する。言語データ272は、記録305及び310を含むが、他の実施形態においては、任意の適切なデータを有する任意の数の記録が存在し得る。記録305及び310の各々は、プログラム識別フィールド315、代替言語フィールド320、代替音声利用可能性フィールド325、及び代替字幕利用可能性フィールド330を有するが、他の実施形態においては、より多くの又はより少ないフィールドが存在し得る。
プログラム識別フィールド315は、プログラム174の一つを識別する。代替言語フィールド320は、関連するプログラム174に関して利用できる可能な代替言語の一覧表を識別する。代替音声利用可能性フィールド325は、代替言語320の各々が代替音声形式で現在利用可能かどうかを示し、もし現在利用できない場合には、代替音声の予想される利用可能期日(予想される利用可能期日が存在する場合)を絶対期日又は相対期日のいずれかにおいて示す。代替音声利用可能性フィールド325はまた、プログラムの原音声が既にその言語におけるものであるために関連する該言語が利用できないことを示す(例えば、英語はプログラムAには適用できないことが記録305に示され、スペイン語はプログラムBには適用できないことが記録310に示されているが、これらのプログラムはそれらの原音声に関してそれらの言語を有しているからである)。代替字幕利用可能性フィールド330は、代替言語の各々が、字幕形式で、現在利用可能かどうかを示し、もし現在利用できない場合には、予想される利用可能期日を絶対期日又は相対期日で示す。
図4は、本発明の一実施形態による例示的な言語選択部170のブロック・ダイアグラムを図示する。言語選択部170は、記録405、410、及び415を含むが、他の実施形態においては任意の適切なデータを有する任意の数の記録が存在してもよい。記録405,410、及び415の各々は、優先度フィールド420及び言語フィールド425を有するが、他の実施形態においては、より多くの又はより少ないフィールドが存在してもよい。優先度フィールド420は、関連する代替言語425に関するユーザの優先度、序列、又は選択順序を規定する。言語フィールド425は、代替言語320の一つを示す。
図5は、本発明の一実施形態による例示的プログラム174のブロック・ダイアグラムを図示する。例示的プログラム174はライン505を有する。ライン505は、NTSC(National Television System Committee)規格、又は任意の他の適切な規格若しくは形式で実行することができる。種々の規格及び形式の例として、PAL(Phase Alternate Line)、SECAM(Sequential Color and Memory)、RS170、RS330、HDTV(High Definition Television)、MPEG(Motion Picture Experts Group)、DVI(Digital Video Interface)、SDI(Serial Digital Interface)、AIFF、AU、CD、MP3、QuickTime、RealAudio、WAV、及びPCM(Pulse Code Modulation)が挙げられる。ライン505は、プログラム174中の任意のコンテンツ、例えばビデオ515、原音声520、原字幕データ525、原アドレス530、又はそれらの任意の部分、を表すことができる。ビデオ515は、一連の静止画像を含み、それらが示される又は表示されるときに運動の印象を与えることができる。音声520は音響を含む。
原字幕データ525は随意的なものであり、音声520のテキスト表示を含むことができて、典型的にはテキスト・ビデオ・オーバレイとして表示されるが、該テキスト・ビデオ・オーバレイは随意的なものであり、ビデオの常設部分であって常に表示されるオープン字幕とは反対に、要求されない限り普通には見えないものである。字幕は典型的には話しの音声及び音響効果のテキスト表示である。大部分のテレビジョン・セットは、スクリーンの底部近くに字幕データの随意的な表示を可能とするように設計されている。テレビジョン・セットはまた、デコーダ又はセット・トップ・ボックスを用いて字幕を表示することができる。字幕が典型的に用いられるのは、それによって、プログラム174を聴覚障害をもつ視聴者が理解できるように、また騒々しい環境(例えば、空港)において視聴者が理解できるように、又は、静かでなければならない環境(例えば、病院)において理解できるようにするためである。一実施形態においては、字幕データがビデオ信号中に、例えば垂直帰線消去時間(VBI)のライン21内に、エンコードされるが、他の実施形態においては任意の適切なエンコード技術を用いることもできる。
原アドレス530は、ライン505に関連するコンテンツを含んだ、ネットワーク230経由でアクセスされるアドレス又はウェブサイトなどの、プログラム174の外部のコンテンツのアドレス又は位置情報を含む。
図6は、本発明の一実施形態による、プログラム174の一例であるプログラム174−1の概念図のブロック・ダイアグラムを図示する。例示的プログラム174−1は、ビデオ515の例として、ビデオ515−1、515−2、及び515−3を有する。例示的プログラム174−1は、さらに、原音声520の例である原音声セグメント520−1、520−2、及び520−3を有する。例示的プログラム174−1は、さらに、原字幕データ525の例である原字幕データ・セグメント525−1、525−2、及び525−3を有する。プログラム174−1は、さらに、原アドレス530の例である原アドレス530−1を有する。ビデオ515−1、原音声セグメント520−1、原字幕データ・セグメント525−1、及び原アドレス530−1は、関連付けられて、それら又はそれらの関連するコンテンツが、同時に又は同期化された仕方で表されることになる。ビデオ515−2、原音声セグメント520−2、及び原字幕データ・セグメント525−2は関連付けられて、それらが同時に表されることになる。ビデオ515−3、原音声セグメント520−3、及び原字幕データ・セグメント525−3は関連付けられて、それらが同時に又は同期化された仕方で表されることになる。
図6は、さらに、本発明の一実施形態による、代替音声ファイル274に関する例示的なデータ構造体のブロック・ダイアグラムを図示する。代替音声ファイル274は、マーカーA 550−1、代替音声セグメントA 555−1、マーカーB 550−2,代替音声セグメントB 555−2、マーカーC 550−3、及び代替音声セグメントC 555−3を有する。代替音声ファイル274中のマーカーA 550−1は、代替音声セグメントA 555−1に関連付けられる。代替音声ファイル274中のマーカーB 550−2は、代替音声セグメントB 555−2に関連付けられる。代替音声ファイル274中のマーカーC 550−3は、代替音声セグメントC 555−3に関連付けられる。マーカーA 550−1は、原字幕データ・セグメント525−1などの原字幕データを指す又は識別する。マーカーB 550−2は、原字幕データ・セグメント525−2などの原字幕データを指す又は識別する。マーカーC 550−3は、原字幕データ・セグメント525−3などの原字幕データを指す又は識別する。
図6は、さらに、本発明の一実施形態による、代替字幕データ276に関する例示的なデータ構造体のブロック・ダイアグラムを示す。字幕データ276は、マーカーA 550−1、代替字幕セグメントA 565−1、マーカーB 550−2、代替字幕セグメントB 565−2、マーカーC 550−3、及び代替字幕セグメントC 565−3を有する。代替字幕データ276中のマーカーA 550−1は、代替字幕セグメントA 565−1と関連付けられる。代替字幕データ276中のマーカーB 550−2は、代替字幕セグメントB 565−2と関連付けられる。代替字幕データ276中のマーカーC 550−3は、代替字幕セグメントC 565−3と関連付けられる。マーカーA550−1は、原字幕データ・セグメント525−1などの原字幕データを指す又は識別する。マーカーB550−2は、原字幕データ・セグメント525−2などの原字幕データを指す又は識別する。マーカーC550−3は、原字幕データ・セグメント525−3などの原字幕データを指す又は識別する。
図7は、本発明の一実施形態による、例示的なプログラム174−1及び代替コンテンツ278の概念図のブロック・ダイアグラムを図示する。代替コンテンツは、例えば、特定の視聴者又は任意の適切な情報に合せて作られたコマーシャル、特定の場所又は言語(例えば、視聴者の地元の電話番号の表示)又は任意の他の適切な情報のためにコマーシャルをカスタマイズするビデオ・オーバレイ、などを有する。代替音声274及び代替字幕データ276は、図7には示されていないが、種々の実施形態においては、それらの一つ又は両方が存在してもよい。
代替コンテンツ278は、マーカーA 550−1、代替音声及び/又はビデオ・セグメントA 575−1、マーカーB 550−2、代替音声及び/又はビデオ・セグメントB 575−2、マーカーC 550−3、並びに、代替音声及び/又はビデオ・セグメントC 575−3を有する。代替コンテンツ278中のマーカーA 550−1は、代替音声/ビデオ・セグメントA 575−1に関連付けられる。代替コンテンツ278中のマーカーB 550−2は、代替音声/ビデオ・セグメントB 575−2に関連付けられる。代替コンテンツ278中のマーカーC 550−3は、代替音声/ビデオ・セグメントC 575−3に関連付けられる。マーカーA 550−1は、プログラム174−1中の原字幕データ・セグメント525−1などの原字幕データを指す又は識別する。マーカーB 550−2は、プログラム174−1中の原字幕データ・セグメント525−2などの原字幕データを指す又は識別する。マーカーC 550−3は、プログラム174−1中の原字幕データ・セグメント525−3などの原字幕データを指す又は識別する。
図8は、本発明の一実施形態による、例示的な処理手続のフローチャートを図示する。制御はブロック600で開始する。制御は次にブロック605に進み、そこでクライアント・コントローラ172が、選択された言語及びプログラム識別子を伴った要求を翻訳サービス部270へ送信する。次に制御はブロック610に進み、そこでは翻訳サービス部270が、受信した言語選択順序(言語フィールド425及び優先度フィールド420を介して)及び受信したプログラム識別子(プログラム識別フィールド315を介して)に基づいて言語データ275中の記録を見いだし、該記録をクライアント100に送信する。次に制御はブロック615に進み、そこではクライアント・コントローラ172が、受信した記録又は複数の記録中に、最高選好又は優先度を有する言語を選択する。一実施形態においては、ユーザは、クライアント・コントローラ172によって実行された言語の選択を無視する選択権を有する。
制御は次にブロック620に進み、そこではクライアント・コントローラ172が、選択された言語を伴った要求を翻訳サービス部270に送信する。制御は次にブロック625に進み、そこでは翻訳サービス部270が、以下で図9を参照してさらに説明されるように、要求を処理する。
制御は次にブロック627に進み、そこではクライアント・コントローラ172が、音声利用可能性フィールド325及び字幕利用可能性フィールド330を介して、選択された言語が利用できるかどうかを判断する。
ブロック627における判断が偽である場合には、制御はブロック628に進み、そこでクライアント・コントローラ172は、音声利用可能性フィールド325及び/又は字幕利用可能性フィールド330によって指定されたもっと後の期日に、選択された言語のデータをダウンロードすることを待つ。次に制御は、前述のようにブロック627に戻る。
別に実施形態においては、ブロック627及び628の処理は随意的であり、クライアント・コントローラ172は、それらを経ずにブロック630に進み、ユーザが代替言語の助けを受けずにプログラム174を視聴することを可能にする。
ブロック627における判断が真である場合には、制御はブロック630に進み、そこではクライアント・コントローラ172が、コンテンツ・プロバイダ232からの原字幕データを含んだプログラム174をダウンロードし、プログラム174中に任意の原アドレス530を随意的に見いだし、原アドレス530によって示される任意のコンテンツをダウンロードする。制御は次にブロック635に進み、そこでクライアント・コントローラ172は、翻訳サービス部270経由で、代替音声ファイル274、代替字幕データ276、及び/又は代替コンテンツ278(もし利用可能ならば)を、コンピュータ・システム100においてダウンロードする。
制御は次にブロック640に進み、そこでクライアント・コントローラ172はプログラム174を実行又は表示して、プログラム174中の原字幕データを、代替音声274、代替字幕データ276、及び/又は代替コンテンツ278、の中のマーカーに整合させ、該マーカーに基づいて、代替音声セグメント、代替字幕データ・セグメント、及び/又は代替コンテンツを、原音声セグメント、原ビデオ・セグメント、及び/又は原字幕データに代えて用いる。代替音声274、代替字幕データ276、及び/又は代替コンテンツ278が利用できない一実施形態においては、クライアント・コントローラ172はそれらを用いずにプログラム174を実行又は表示する。制御は次にブロック699に進み、そこで図8の論理回路が元に戻る。
図9は、本発明の一実施形態による、翻訳サービス部270の例示的な処理手続のフローチャートを図示する。制御はブロック700において開始する。制御は次にブロック705に進み、そこで翻訳サービス部270は、選択された言語及びプログラムを伴ったクライアント100からの要求を受信する。制御は次にブロック710に進み、そこで翻訳サービス部270は、選択された言語及びプログラムの翻訳のためのリソースを割り当てる。一実施形態においては、ブロック705における要求は事前要求であり、翻訳サービス部270がリソースに関する将来の要求を知ってブロック710においてリソースを割り当てることを可能にする。
制御は次にブロック715に進み、そこで翻訳サービス部270は、代替音声ファイル274、代替字幕データ276、及び/又は代替コンテンツが、選択された言語及びプログラムに対して利用可能かどうかを判断する。ブロック715における判断が真である場合には、制御はブロック720に進み、そこで翻訳サービス部270が、代替音声ファイル274、代替字幕データ276、及び/又は代替コンテンツ278をクライアント100に送信する。制御は次に799に進み、そこで図9の論理回路が元に戻る。
ブロック715における判断が偽である場合には、代替音声ファイル274、及び/又は代替字幕データ276が選択された言語に対して利用できず、そのため制御はブロック725に進み、そこで翻訳サービス部270が、選択された言語に関する代替音声ファイル274、代替字幕データ276、及び/又は代替コンテンツ278を、人的翻訳、テキスト―音声翻訳、又はテキスト―テキスト翻訳によって作成する。制御は次にブロック735に進み、そこで翻訳サービス部270は、マーカー(例えば、マーカー550−1、550−2、550−3)を作成して代替音声ファイル274、代替字幕データ276、及び/又は代替コンテンツ278の中に組み込み、該マーカーはプログラム174中の原字幕データ525を指す又は識別する。マーカーの各々は代替音声セグメントのそれぞれの一つに関連付けられ、マーカーはプログラム中の原字幕データを識別し、マーカーの各々はそれぞれの代替字幕データ・セグメントに関連付けられる。制御は次に、前述の通り、ブロック720に進む。
本発明の例示的な実施形態に関する前述の詳細な説明において、本明細書の一部を構成する添付の図面(そこでは、同じ番号は同じ要素を示す)が参照されたが、その図面中に本発明を実施可能とする特定の例示的な実施形態が、説明のために示されている。これらの実施形態は、当業者が本発明を実施することを可能にするのに十分に詳細に説明されたが、他の実施形態を利用することも可能であり、論理的、機械的、電気的、及び他の変更を、本発明の範囲から逸脱することなしに加えることができる。本明細書で用いられた用語「実施形態」の種々の場合は、必ずしも同じ実施形態を指すものではないが、そうであってもよい。従って、前述の詳細な説明は、限定的な意味に取られるべきでなく、本発明の範囲は、添付の請求項の範囲によってのみ規定される。
前述の説明において、多くの特定的な詳細が、本発明の十分な理解をもたらすために示された。しかし、本発明はこれらの特定的な詳細を用いずに実施可能である。他の場合には、本発明を不明瞭にしないために、周知の回路、構造体、及び技術は詳細には示されていない。
本発明の一実施形態を実施するための例示的なディジタル・ビデオ・レコーダのブロック・ダイアグラムを図示する。 本発明の一実施形態を実施するための例示的なコンピュータ・システムのブロック・ダイアグラムを図示する。 本発明の一実施形態による例示的な言語データのブロック・ダイアグラムを図示する。 本発明の一実施形態による例示的な言語選択のブロック・ダイアグラムを図示する。 本発明の一実施形態による例示的なプログラムのブロック・ダイアグラムを図示する。 本発明の一実施形態による例示的なプログラム、代替音声、及び代替字幕データの概念ビューのブロック・ダイアグラムを図示する。 本発明の一実施形態による例示的なプログラム及び代替コンテンツの概念ビューのブロック・ダイアグラムを図示する。 本発明の一実施形態による例示的な処理手続のフローチャートを図示する。 本発明の一実施形態による翻訳サービスに関する例示的な処理手続のフローチャートを図示する。
符号の説明
200:サーバ・コンピュータ・システム
201:プロセッサ
203:メモリ・バス
204:I/Oバス
221、222、223、224:ユーザ端末
225、226、227:記憶デバイス
228:プリンタ
229:ファックス装置

Claims (20)

  1. プログラムのための代替音声ファイルを、前記代替音声ファイルが複数の音声セグメントを有するように作成するステップと、
    第1の複数のマーカーを、該第1の複数のマーカーの各々が前記複数の音声セグメントのそれぞれの一つに関連付けられ、前記第1の複数のマーカーが前記プログラム中の複数の原字幕データ・セグメントを識別するように、前記代替音声ファイルに組み込むステップと、
    を含む方法。
  2. 前記代替音声ファイルをクライアントに送信するステップを更に含む、請求項1に記載の方法。
  3. 請求項2に記載の方法において、前記クライアントが前記プログラムをコンテンツ・プロバイダから受信し、前記第1の複数のマーカーを原字幕データ・セグメントに整合させ、前記プログラムの表示に際して、前記整合によって原音声セグメントに代えて代替音声セグメントを用いる方法。
  4. クライアントから受信した言語選択の順序に基づいて前記代替音声ファイルのための言語を選択するステップを更に含む、請求項1に記載の方法。
  5. 前記クライアントからの要求に応答して前記作成及び前記組み込みを実行するステップを更に含む、請求項4に記載の方法。
  6. 請求項1に記載の方法であって、
    複数の字幕データ・セグメントを含む代替字幕データを作成するステップと、
    前記代替字幕データ中に第2の複数のマーカーを組み込むステップ、
    を更に含み、
    前記第2の複数のマーカーの各々は、前記複数の代替字幕データ・セグメントのそれぞれの一つに関連付けられ、前記第2の複数のマーカーが前記プログラム中の前記複数の原字幕データ・セグメントを識別するものである方法。
  7. 請求項6に記載の方法であって、
    クライアントに前記代替字幕データを送信し、前記クライアントが、前記第2の複数のマーカーによって、前記代替字幕データを表示のためにプログラムのビデオに同期させるステップ、
    を更に含む方法
  8. 実行されるときに、
    プログラムに関する代替音声ファイルを、前記代替音声ファイルが複数の代替音声セグメントを含むように作成するステップと、
    第1の複数のマーカーを、該第1の複数のマーカーの各々が前記複数の代替音声セグメントのそれぞれの一つに関連付けられ、前記第1の複数のマーカーが前記プログラム中の複数の原字幕データ・セグメントを識別するように前記代替音声ファイル中に組み込むステップと、
    前記代替音声ファイルをクライアントに送信し、前記クライアントが前記プログラムをコンテンツ・プロバイダから受信し、前記第1の複数のマーカーを前記原字幕データ・セグメントに整合させ、前記プログラムの表示に際して、前記整合によって原音声セグメントに代えて代替音声セグメントを用いるようにするステップと、
    を行う命令によりエンコードされた信号伝達媒体。
  9. クライアントから受信した言語選択の順序に基づいて代替音声ファイルのための言語を選択するステップを更に含む、請求項8に記載の信号伝達媒体。
  10. クライアントからの要求に応答して前記作成及び前記組み込みを実行するステップ、
    を更に含む、請求項8に記載の信号伝達媒体。
  11. 請求項8に記載の信号伝達媒体であって、
    複数の代替字幕データ・セグメントを有する代替字幕データを作成するステップと、
    第2の複数のマーカーを、該第2の複数のマーカーの各々が前記複数の代替字幕データ・セグメントのそれぞれの一つに関連付けられ、該第2の複数のマーカーが前記プログラム中の前記複数の原字幕データ・セグメントを識別するように前記代替字幕データ中に組み込むステップと、
    を更に含む信号伝達媒体。
  12. 請求項11に記載の信号伝達媒体であって、
    前記代替字幕データをクライアントに送信し、前記クライアントは前記第2の複数のマーカーを前記原字幕データ・セグメントに整合させ、前記プログラムの表示に際して、前記整合によって原字幕データ・セグメントに代えて代替字幕データ・セグメントを用いるようにするステップ、
    を更に含む信号伝達媒体。
  13. 請求項8に記載の信号伝達媒体であって、
    複数の代替音声及びビデオ・セグメントを有する代替コンテンツを作成するステップと、
    第2の複数のマーカーを、該第2の複数のマーカーの各々が前記複数の音声及びビデオ・セグメントのそれぞれの一つに関連付けられ、該第2の複数のマーカーが前記プログラム中の前記複数の原字幕データ・セグメントを識別するように前記代替コンテンツ中に組み込むステップと、
    を更に含む信号伝達媒体。
  14. 請求項13に記載の信号伝達媒体であって、
    前記代替コンテンツをクライアントに送信し、前記クライアントは前記第2の複数のマーカーを原字幕データ・セグメントに整合させ、前記プログラムの表示に際して、前記整合によって原字幕データ・セグメントに代えて代替音声及びビデオ・セグメントを用いるようにするステップ、
    を更に含む信号伝達媒体
  15. コンピュータを構成する方法であって、
    クライアントから受信した言語選択の順序に基づいて、代替音声ファイルのための言語を選択するようにコンピュータを構成するステップと、
    プログラムに関する代替音声ファイルを、該代替音声ファイルが複数の代替音声セグメントを有する形態で作成するようにコンピュータを構成するステップと、
    第1の複数のマーカーを、該第1の複数のマーカーの各々が前記複数の代替音声セグメントのそれぞれの一つに関連付けられ、該第1の複数のマーカーが前記プログラム中の複数の原字幕データ・セグメントを識別する形態で前記代替音声ファイル中に組み込むようにコンピュータを構成するステップと、
    前記代替音声ファイルをクライアントに送信し、前記クライアントが前記プログラムをコンテンツ・プロバイダから受信し、前記第1の複数のマーカーを前記原字幕データ・セグメントに整合させ、前記プログラムの表示に際して、前記整合によって原音声セグメントに代えて代替音声セグメントを用いるようにするようにコンピュータを構成するステップと、
    を含む方法。
  16. 前記クライアントからの要求に応答して前記作成及び組み込みステップを実行するようにコンピュータを構成するステップ
    を更に含む請求項15に記載の方法。
  17. 請求項15に記載の方法であって、
    複数の代替字幕データ・セグメントを有する代替字幕データを作成するようにコンピュータを構成するステップと、
    第2の複数のマーカーを、該第2の複数のマーカーの各々が前記複数の代替字幕データ・セグメントのそれぞれの一つに関連付けられ、該第2の複数のマーカーが前記プログラム中の前記複数の原字幕データ・セグメントを識別する形態で前記代替字幕データ中に組み込むようにコンピュータを構成するステップと、
    を更に含む方法。
  18. 請求項17に記載の方法であって、
    前記代替字幕データをクライアントに送信し、前記クライアントが前記第2の複数のマーカーを前記原字幕データ・セグメントに整合させ、前記プログラムの表示に際して、前記整合によって原字幕データ・セグメントに代えて代替字幕データ・セグメントを用いるようにするようにコンピュータを構成するステップ、
    を更に含む方法。
  19. 請求項15に記載の方法であって、
    複数の代替音声及びビデオ・セグメントを有する代替コンテンツを作成するようにコンピュータを構成するステップと、
    第2の複数のマーカーを、該第2の複数のマーカーの各々が前記複数の代替音声及びビデオ・セグメントのそれぞれの一つに関連付けられ、該第2の複数のマーカーが前記プログラム中の前記複数の原字幕データ・セグメントを識別する形態で前記代替字幕データ中に組み込むようにコンピュータを構成するステップと、
    を更に含む方法。
  20. 請求項19に記載の方法であって、
    前記代替コンテンツをクライアントに送信し、前記クライアントが前記第2の複数のマーカーを原字幕データ・セグメントに整合させ、前記プログラムの表示に際して、前記整合によって原字幕データ・セグメントに代えて代替音声及びビデオ・セグメントを用いるようにするようにコンピュータを構成するステップ、
    を更に含む方法。
JP2006272328A 2005-11-10 2006-10-03 字幕データを介して代替音声を作成する方法 Expired - Fee Related JP5128103B2 (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US11/272,586 US20070106516A1 (en) 2005-11-10 2005-11-10 Creating alternative audio via closed caption data
US11/272586 2005-11-10

Publications (2)

Publication Number Publication Date
JP2007135197A true JP2007135197A (ja) 2007-05-31
JP5128103B2 JP5128103B2 (ja) 2013-01-23

Family

ID=38004927

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2006272328A Expired - Fee Related JP5128103B2 (ja) 2005-11-10 2006-10-03 字幕データを介して代替音声を作成する方法

Country Status (3)

Country Link
US (1) US20070106516A1 (ja)
JP (1) JP5128103B2 (ja)
CN (1) CN100477727C (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102340689A (zh) * 2011-09-20 2012-02-01 成都索贝数码科技股份有限公司 电视台生产系统中业务子系统的配置装置及方法

Families Citing this family (18)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20080085099A1 (en) * 2006-10-04 2008-04-10 Herve Guihot Media player apparatus and method thereof
JP4893750B2 (ja) 2006-12-26 2012-03-07 富士通株式会社 データ圧縮装置およびデータ復元装置
US8359399B2 (en) 2008-10-16 2013-01-22 Echostar Technologies L.L.C. Method and device for delivering supplemental content associated with audio/visual content to a user
US8330864B2 (en) * 2008-11-02 2012-12-11 Xorbit, Inc. Multi-lingual transmission and delay of closed caption content through a delivery system
US9244913B2 (en) * 2010-03-19 2016-01-26 Verizon Patent And Licensing Inc. Multi-language closed captioning
CN103004223A (zh) * 2010-07-19 2013-03-27 汤姆森许可贸易公司 针对电视观看的备选音频传送
GB201017174D0 (en) * 2010-10-12 2010-11-24 Muvemedia Ltd System and method for delivering multilingual video or film sound tracks or multilingual spoken or sung dialog for synchronization and playback
CN103188564B (zh) * 2011-12-28 2016-08-17 联想(北京)有限公司 电子设备及其信息处理方法
US20150113558A1 (en) * 2012-03-14 2015-04-23 Panasonic Corporation Receiver apparatus, broadcast/communication-cooperation system, and broadcast/communication-cooperation method
WO2014141054A1 (en) * 2013-03-11 2014-09-18 Video Dubber Ltd. Method, apparatus and system for regenerating voice intonation in automatically dubbed videos
US10244203B1 (en) * 2013-03-15 2019-03-26 Amazon Technologies, Inc. Adaptable captioning in a video broadcast
US10775877B2 (en) * 2013-03-19 2020-09-15 Arris Enterprises Llc System to generate a mixed media experience
US9361714B2 (en) * 2013-08-05 2016-06-07 Globalfoundries Inc. Enhanced video description
CN106068651B (zh) * 2014-03-18 2020-10-16 皇家飞利浦有限公司 视听内容项数据流
CN103997657A (zh) * 2014-06-06 2014-08-20 福建天晴数码有限公司 一种视频中音频的变换方法及装置
CN109218758A (zh) * 2018-11-19 2019-01-15 珠海迈科智能科技股份有限公司 一种支持cc字幕功能的转码系统及方法
WO2021018555A1 (en) * 2019-07-29 2021-02-04 Televic Education Media client for recording and playing back interpretation
CN114143592B (zh) * 2021-11-30 2023-10-27 抖音视界有限公司 视频处理方法、视频处理装置和计算机可读存储介质

Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH1198467A (ja) * 1997-09-19 1999-04-09 Hitachi Ltd 複数メディアのデータ同期再生装置
JP2002027429A (ja) * 2000-05-18 2002-01-25 Deutsche Thomson Brandt Gmbh オーディオ翻訳データをオンデマンドで与える方法及びその受信器
WO2002037841A1 (fr) * 2000-11-02 2002-05-10 Fujiyama Co., Ltd. Systeme de repartition du contenu d'une image numerique, procede de reproduction et support d'enregistrement de son programme de reproduction
JP2004080515A (ja) * 2002-08-20 2004-03-11 Toshiba Corp 映像デジタルデータ管理システム
WO2004029960A1 (en) * 2002-09-26 2004-04-08 Koninklijke Philips Electronics N.V. Method and device for recording information on a record medium, record medium containing information, and method and device for reading information from a record medium'
JP2004215126A (ja) * 2003-01-08 2004-07-29 Cyber Business Corp 多言語対応型動画配信システム
JP2005210196A (ja) * 2004-01-20 2005-08-04 Sony Corp 情報処理装置、情報処理方法
JP2005217816A (ja) * 2004-01-30 2005-08-11 Hitachi Ltd 映像再生装置および記録媒体
JP2005269595A (ja) * 2004-02-16 2005-09-29 Sony Corp 再生装置および再生方法、プログラム格納媒体、並びにプログラム

Family Cites Families (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7188353B1 (en) * 1999-04-06 2007-03-06 Sharp Laboratories Of America, Inc. System for presenting synchronized HTML documents in digital television receivers
US20020065678A1 (en) * 2000-08-25 2002-05-30 Steven Peliotis iSelect video
US7130790B1 (en) * 2000-10-24 2006-10-31 Global Translations, Inc. System and method for closed caption data translation
US7096416B1 (en) * 2000-10-30 2006-08-22 Autovod Methods and apparatuses for synchronizing mixed-media data files
US7117231B2 (en) * 2000-12-07 2006-10-03 International Business Machines Corporation Method and system for the automatic generation of multi-lingual synchronized sub-titles for audiovisual data
US6630963B1 (en) * 2001-01-23 2003-10-07 Digeo, Inc. Synchronizing a video program from a television broadcast with a secondary audio program
WO2002103484A2 (en) * 2001-06-18 2002-12-27 First International Digital, Inc Enhanced encoder for synchronizing multimedia files into an audio bit stream
WO2003061285A2 (en) * 2001-12-24 2003-07-24 Scientific Generics Limited Captioning system
US7006976B2 (en) * 2002-01-29 2006-02-28 Pace Micro Technology, Llp Apparatus and method for inserting data effects into a digital data stream
US20040044532A1 (en) * 2002-09-03 2004-03-04 International Business Machines Corporation System and method for remote audio caption visualizations
US8245252B2 (en) * 2002-09-10 2012-08-14 Caption Tv, Inc. System, method, and computer program product for selective replacement of objectionable program content with less-objectionable content
US20050212968A1 (en) * 2004-03-24 2005-09-29 Ryal Kim A Apparatus and method for synchronously displaying multiple video streams
US20060136226A1 (en) * 2004-10-06 2006-06-22 Ossama Emam System and method for creating artificial TV news programs
US8041190B2 (en) * 2004-12-15 2011-10-18 Sony Corporation System and method for the creation, synchronization and delivery of alternate content

Patent Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH1198467A (ja) * 1997-09-19 1999-04-09 Hitachi Ltd 複数メディアのデータ同期再生装置
JP2002027429A (ja) * 2000-05-18 2002-01-25 Deutsche Thomson Brandt Gmbh オーディオ翻訳データをオンデマンドで与える方法及びその受信器
WO2002037841A1 (fr) * 2000-11-02 2002-05-10 Fujiyama Co., Ltd. Systeme de repartition du contenu d'une image numerique, procede de reproduction et support d'enregistrement de son programme de reproduction
JP2004080515A (ja) * 2002-08-20 2004-03-11 Toshiba Corp 映像デジタルデータ管理システム
WO2004029960A1 (en) * 2002-09-26 2004-04-08 Koninklijke Philips Electronics N.V. Method and device for recording information on a record medium, record medium containing information, and method and device for reading information from a record medium'
JP2004215126A (ja) * 2003-01-08 2004-07-29 Cyber Business Corp 多言語対応型動画配信システム
JP2005210196A (ja) * 2004-01-20 2005-08-04 Sony Corp 情報処理装置、情報処理方法
JP2005217816A (ja) * 2004-01-30 2005-08-11 Hitachi Ltd 映像再生装置および記録媒体
JP2005269595A (ja) * 2004-02-16 2005-09-29 Sony Corp 再生装置および再生方法、プログラム格納媒体、並びにプログラム

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102340689A (zh) * 2011-09-20 2012-02-01 成都索贝数码科技股份有限公司 电视台生产系统中业务子系统的配置装置及方法

Also Published As

Publication number Publication date
CN1964428A (zh) 2007-05-16
CN100477727C (zh) 2009-04-08
US20070106516A1 (en) 2007-05-10
JP5128103B2 (ja) 2013-01-23

Similar Documents

Publication Publication Date Title
JP5128103B2 (ja) 字幕データを介して代替音声を作成する方法
CN101686365B (zh) 流产生装置和方法,流再现装置、方法和系统,流记录方法
US7116894B1 (en) System and method for digital multimedia stream conversion
JP4790776B2 (ja) 多重化装置、多重化方法、再生装置、再生方法、記録方法および再生システム
JP5052763B2 (ja) 映像データの記録された情報貯蔵媒体、その記録方法、記録装置、再生方法及び再生装置
US20050180462A1 (en) Apparatus and method for reproducing ancillary data in synchronization with an audio signal
JP2004355802A (ja) マルチストリームが記録された情報貯蔵媒体、その記録装置、その記録方法、その再生装置、及びその再生方法
JP2002084501A (ja) 記録媒体を通してa/vコンテンツの付加サービス情報を提供するための方法及び装置とそれによる記録媒体
JP2008160837A (ja) プレビュー機能を有するマルチメディアデータのエンコーディング/デコーディング方法及び装置
EP3261339B1 (en) Information processing device, information recording medium and information processing method, and program
US20060177199A1 (en) Information recording medium, information reproducing apparatus, information recording method and reproducing method
KR20020095797A (ko) 디지털 데이터 스트림 기록장치 및 방법과, 그에 따른기록매체
WO2017199743A1 (ja) 情報処理装置、情報記録媒体、および情報処理方法、並びにプログラム
JP4466482B2 (ja) 情報処理装置および方法、記録媒体、並びにプログラム
JP2008299972A (ja) 音声映像情報記録装置、および記録制御方法
JP2006352458A (ja) 情報処理装置および方法、記録媒体、並びにプログラム
KR100376578B1 (ko) 디지털 데이터 스트림 기록방법 및 그에 따른 표현제어정보 제공방법
JP2002247506A (ja) デジタル音声映像情報の記録装置
GB2421394A (en) Providing Audio-Visual Content
JP2006217229A (ja) デジタル放送受信装置
US20170223327A1 (en) Information processing apparatus, information processing method and program, and recording medium
GB2427785A (en) Providing audio-visual content on a mobile device with digital rights management
KR20080032630A (ko) 영상 데이터 기록 방법
KR20010016634A (ko) 디브이디와 브이시디2.0(시시에프이)의 자막 및언어선택형 스트리밍 전송방법
GB2427976A (en) Providing audio-visual content to a mobile device where the conversion module can determine the bit rate

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20090619

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20110617

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20110621

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20110801

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20110823

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20111011

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20120117

A911 Transfer to examiner for re-examination before appeal (zenchi)

Free format text: JAPANESE INTERMEDIATE CODE: A911

Effective date: 20120125

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20120703

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20120914

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20121009

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20121031

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20151109

Year of fee payment: 3

LAPS Cancellation because of no payment of annual fees