JP2005519538A - ビデオ・トリック・モード時に於けるゲートによる無音期間の除去 - Google Patents

ビデオ・トリック・モード時に於けるゲートによる無音期間の除去 Download PDF

Info

Publication number
JP2005519538A
JP2005519538A JP2003573870A JP2003573870A JP2005519538A JP 2005519538 A JP2005519538 A JP 2005519538A JP 2003573870 A JP2003573870 A JP 2003573870A JP 2003573870 A JP2003573870 A JP 2003573870A JP 2005519538 A JP2005519538 A JP 2005519538A
Authority
JP
Japan
Prior art keywords
audio
video
trick mode
presentation
gating
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2003573870A
Other languages
English (en)
Other versions
JP2005519538A5 (ja
JP4322682B2 (ja
Inventor
リン ブレア,ロナルド
アラン シユルツ,マーク
ワレン シユミツト,ロバート
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Thomson Licensing SAS
Original Assignee
Thomson Licensing SAS
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Family has litigation
First worldwide family litigation filed litigation Critical https://patents.darts-ip.com/?family=27787528&utm_source=google_patent&utm_medium=platform_link&utm_campaign=public_patent_search&patent=JP2005519538(A) "Global patent litigation dataset” by Darts-ip is licensed under a Creative Commons Attribution 4.0 International License.
Application filed by Thomson Licensing SAS filed Critical Thomson Licensing SAS
Publication of JP2005519538A publication Critical patent/JP2005519538A/ja
Publication of JP2005519538A5 publication Critical patent/JP2005519538A5/ja
Application granted granted Critical
Publication of JP4322682B2 publication Critical patent/JP4322682B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N5/00Details of television systems
    • H04N5/76Television signal recording
    • H04N5/91Television signal processing therefor
    • H04N5/93Regeneration of the television signal or of selected parts thereof
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N5/00Details of television systems
    • H04N5/76Television signal recording
    • H04N5/78Television signal recording using magnetic recording
    • H04N5/782Television signal recording using magnetic recording on tape
    • H04N5/783Adaptations for reproducing at a rate different from the recording rate
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N5/00Details of television systems
    • H04N5/76Television signal recording
    • H04N5/91Television signal processing therefor
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N5/00Details of television systems
    • H04N5/76Television signal recording
    • H04N5/91Television signal processing therefor
    • H04N5/92Transformation of the television signal for recording, e.g. modulation, frequency changing; Inverse transformation for playback
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N5/00Details of television systems
    • H04N5/76Television signal recording
    • H04N5/84Television signal recording using optical recording
    • H04N5/85Television signal recording using optical recording on discs or drums
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N9/00Details of colour television systems
    • H04N9/79Processing of colour television signals in connection with recording
    • H04N9/80Transformation of the television signal for recording, e.g. modulation, frequency changing; Inverse transformation for playback
    • H04N9/804Transformation of the television signal for recording, e.g. modulation, frequency changing; Inverse transformation for playback involving pulse code modulation of the colour picture signal components
    • H04N9/8042Transformation of the television signal for recording, e.g. modulation, frequency changing; Inverse transformation for playback involving pulse code modulation of the colour picture signal components involving data reduction
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N9/00Details of colour television systems
    • H04N9/79Processing of colour television signals in connection with recording
    • H04N9/80Transformation of the television signal for recording, e.g. modulation, frequency changing; Inverse transformation for playback
    • H04N9/804Transformation of the television signal for recording, e.g. modulation, frequency changing; Inverse transformation for playback involving pulse code modulation of the colour picture signal components
    • H04N9/806Transformation of the television signal for recording, e.g. modulation, frequency changing; Inverse transformation for playback involving pulse code modulation of the colour picture signal components with processing of the sound signal
    • H04N9/8063Transformation of the television signal for recording, e.g. modulation, frequency changing; Inverse transformation for playback involving pulse code modulation of the colour picture signal components with processing of the sound signal using time division multiplex of the PCM audio and PCM video signals

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Signal Processing For Digital Recording And Reproducing (AREA)
  • Indexing, Searching, Synchronizing, And The Amount Of Synchronization Travel Of Record Carriers (AREA)
  • Television Signal Processing For Recording (AREA)

Abstract

本発明は、ビデオ・プレゼンテーションの1倍より速い速度のビデオ・トリック・モード再生時にオーディオ・トラックを再生する方法および装置に関する。本発明の方法は、記憶媒体から情報を取り出して、あるプレゼンテーションの少なくとも1つのビデオ部分とそれに対応するオーディオ部分とを生成するステップ(306)から開始する。上記プレゼンテーションのオーディオ部分には、殆どのオーディオ・サウンド・トラックと同様に、相対的無音期間(212)が含まれる。これらの期間は、例えば、対話中の話し言葉相互間に、或いは、脚本上の間(ポーズ)相互間に生じる場合がある。オーディオ・ゲートを使用して、プレゼンテーションのオーディオ部分を選択的にゲーティング制御して(308)、相対的無音期間の少なくとも一部を削除する(312)。最後に、プレゼンテーションの再生すべきオーディオ部分の残留部分を連結して(310)、相対的無音期間の少なくとも一部を削除した後の間隙を取り除く。

Description

本発明は、トリック・モード再生(playback:プレイバック)の改良に関し、詳しくは、通常速度よりも速い速度で再生されるビデオ・セグメントに対応するオーディオ・サウンド・トラックのトリック・モード再生の改良に関する。
DVDのトリック・モードでは、ディスク上の特定位置をサーチするための通常再生の加速が可能であり、或いは、通常速度では見逃してしまう特定シーンの詳細を見るための通常再生の減速が可能である。通常再生速度は、慣習により、1×(1倍)として表記可能である。トリック・モードは、オーディオ(音声)とビデオ(映像)の両方について実行可能であり、市販のDVDプレーヤには、オーディオのトリック・モードとビデオのトリック・モードの両方の機能を備えたものがある。しかし、オーディオを速い速度或いは遅い速度で再生する従来の方法には、問題があることが判っている。一方、現在市販されている種々の製品に使用されるディジタル信号プロセッサ(DSP)、特に、オーディオ・ディジタル信号プロセッサの発展により、リアルタイム処理をより高度化して、オーディオ・トリック・モードを改良できる可能性が出てきている。
ビデオ・トリック・モードを使用する際の問題の1つは、トリック・モード再生のビデオ・セグメントに対応するオーディオの処理に関する。例えば、ユーザがプログラム(番組)のビデオ・セグメントを加速、或いは、減速するとき、対応する再生オーディオ・セグメントが歪んでしまうことがある。一般に、オーディオ・セグメント内のオーディオ・サンプルは、高速(ファスト)トリック・モード時に高い周波数にシフトされ、低速(スロー)トリック・モード時に低い周波数にシフトされる。通常の再生に比べて、約1.5倍から約3倍の倍率で再生速度を上げる高速トリック・モードにより、人の話し声は、ピッチ(音程)が高くなって聞こえがちである。このピッチの高いオーディオ再生、即ち、チップマンク(chipmunk)効果は、聞き苦しく、多くの場合、聞き手にとって不明瞭で理解できないことがある。逆に、周波数の低い低速トリック・モードにより、低周波数の震え(wobble:ウォブル)が生じ、これは、理解できても聴覚的に不快なことがある。
上述のようなビデオ・トリック・モード時に、最も有効なオーディオ再生を得るためには、個々のトリック・モードの性質も考慮する必要がある。例えば、様々な技術を用いて、1.5倍或いは2倍のトリック・モードについて明瞭なオーディオを提供できても、トリック・モードが5倍或いは10倍の再生を伴う場合、そのような技術を用いても満足な結果は得られない。そのような高速再生速度では、オーディオ・コンテンツをビデオ・コンテンツに同期するように再生しようとしても、言葉を再生しようとする速度が非常に速くなって、結果的に理解できない話し声になってしまう。
DVDトリック・モード時に生じる種々のオーディオ(音声)アーティファクトを回避するために、従来のDVDプレーヤは、トリック・モード時に音声を消音(ミュート)することが多い。しかし、これは、そのようなトリック・モード時でも音声が重要である場合があるため、完全に満足できる解決法ではない。従って、DVDプレーヤが、従来技術の限界を解決して、ビデオ・トリック・モード時に所望の音声再生が聴覚的に快いものになるように、音声を再生できるならば、有益である。
(発明の概要)
本発明は、ビデオ・プレゼンテーションの1倍より速い速度のビデオ・トリック・モード再生時に、オーディオ・プログラミング(音声番組)を再生する方法および装置に関する。本発明の方法は、記憶媒体(メディア)から情報を取り出して、あるプレゼンテーションの少なくとも1つのビデオ部分とそれに対応するオーディオ部分とを生成するステップから開始する。上記プレゼンテーションのオーディオ部分には、殆どのオーディオ・サウンド・トラックと同様に、相対的無音(silence:サイレンス)期間が含まれる。これらの期間は、例えば、対話中の話し言葉相互間に、或いは、脚本上の間(ポーズ)相互間に生じる場合がある。オーディオ・ゲートを使用して、プレゼンテーションのオーディオ部分を選択的にゲーティング制御して、各相対的無音期間の少なくとも一部を削除する。最後に、プレゼンテーションの再生すべきオーディオ部分の残留部分を連結して、各相対的無音期間の少なくとも一部を削除した後の間隙を取り除く。
上記ゲーティング制御して削除するステップは、選択されたビデオ・トリック・モード再生速度に基づいて、各相対的無音期間の割合部分を選択的に削除することを含んでいる。本発明の一つの特徴に従えば、上記ゲーティング制御して削除するステップは、更に、各相対的無音期間の削除すべき最適化割合部分を決定して、それにより、連結ステップ後に再生すべきオーディオ部分とビデオ部分とを同期させることを含んでいる。また、上記ゲーティング制御して削除するステップは、各相対的無音期間の削除すべき割合部分を増加して、それにより、より速いビデオ・トリック・モード再生速度を実現することも含んでいる。
上記ゲーティング制御して削除するステップは、更に、選択されたビデオ・トリック・モード再生速度に基づいて、ゲーティング閾値を選択的に設定することを含んでいる。連結ステップ後に再生すべきオーディオ部分とビデオ部分とを同期させるのに必要な最適化ゲーティング閾値が選択できる。一般的に、ゲーティング閾値を増加すると、より速いビデオ・トリック・モード再生速度時のオーディオ再生が容易になる。
本発明は、また、ビデオ・プレゼンテーションの1倍より速い速度のビデオ・トリック・モード再生時にオーディオ・トラックを再生する装置に関する。この装置には、特定の記憶媒体から情報を取り出して、あるプレゼンテーションの少なくとも1つのビデオ部分とそれに対応するオーディオ部分とを生成する記憶媒体読み取り装置が含まれる。前述のように、プレゼンテーションのオーディオ部分には、一般的に、各相対的無音期間が含まれている。オーディオ・ゲートを設けて、プレゼンテーションのオーディオ部分を選択的にゲーティング制御して、各相対的無音期間の少なくとも一部を削除する。各相対的無音期間の少なくとも一部を削除した後、オーディオ・ゲートの出力は、オーディオ・プロセッサに供給されて、連結される。
本発明の装置には、更に、選択されたビデオ・トリック・モード再生速度に基づいて、各相対的無音期間の削除すべき割合部分を選択的に決定するプロセッサが含まれる。本発明の一つの特徴に従えば、このプロセッサは、上記連結後に再生すべきオーディオ部分とビデオ部分とを同期させるのに必要な最適化割合部分を決定できる。一般的に、このプロセッサは、より速いビデオ・トリック・モード再生速度に対して、各相対的無音期間の削除すべき割合部分を選択的に増加する。
また、上記プロセッサは、選択されたビデオ・トリック・モード再生速度に基づいて、ゲーティング閾値を選択的に設定できる。一実施形態に従えば、上記プロセッサは、上記連結後に再生すべきオーディオ部分とビデオ部分とを同期させるのに必要な最適化ゲーティング閾値を選択的に決定する。一般的に、上記プロセッサは、より速いビデオ・トリック・モード再生速度に対して、ゲーティング閾値を選択的に増加する。
本発明は、適切な任意の記憶媒体上に記録された任意の種類のディジタル・ビデオに於けるビデオ・トリック・モード時にオーディオの通常再生を行うために使用できる。説明の便宜上、本発明を、通常のMPEG−1或いはMPEG−2のフォーマット(形式)を用いるDVD媒体について、説明する。しかし、当業者であれば、本発明がこの点に限定されるものでないことが分かるであろう。データ記憶媒体には、相当量のオーディオ・データおよびビデオ・データを記憶し、その後、検索および再生できる任意の媒体が含まれる。ここで述べる記憶媒体には、データ記憶用の光学的、磁気的、および、電子的な手段が含まれるが、これらに限定するものではない。具体的なディジタル記憶媒体の例としては、光学ディジタル多用途ディスク(DVD)、磁気ハードディスク、光磁気ディスク、ビデオCD、通常のCD、或いは、半導体メモリ、例えば、ダイナミック・ランダム・アクセス・メモリ(DRAM)、シンクロナスDRAM(SDRAM)等がある。
図1は、本発明を実施できる例として、DVDビデオ・プレーヤ装置100を示すブロック図である。装置100には、ディジタル記憶媒体から記憶データを読み出す機能が含まれている。図1では、記憶媒体として、例えばDVDタイプである書き換え可能なディスク102が示されている。装置100には、機械的構体104、制御セクション120、および、オーディオ(Audio)/ビデオ(Video)(A/V)出力処理セクション170が含まれている。殆どのブロックについて、どのセクションに割り当てるかは自明であるが、幾つかのブロックについての割り当ては、装置100の動作を理解するための便宜上のものであり、特に重要なものではない。尚、データ記憶媒体が半導体素子である場合、機械的構体104は、本発明を実施する際、必要ない。この場合、記憶媒体に記憶された符号化ディジタル・データは、制御CPU122により直接アクセスでき、トラック・バッファ172内に一時記憶(バッファリング)される。
機械的構体104には、DVD102をスピン回転させるモータ106と、スピン回転するDVD102の上方を移動するように設定されたピックアップ構体108とが含まれている。ピックアップ構体108のレーザ発生部がディスク・トラック上に記憶されているデータに光を当て、ビデオおよび/またはオーディオの番組データが再生される。尚、このDVD102が記録可能であるか否かは、本発明には関係ない。ピックアップ構体108に搭載されたレーザ装置とモータ106は、サーボ110により制御される。サーボ110は、DVD102上の螺旋状トラックから読み出されたデータを表す入力再生信号を受信するように構成されている。この再生信号は、誤り訂正回路130にも入力される。誤り訂正回路130は、制御セクション120の一部、或いは、A/V出力処理セクション170の一部と考えることが出来る。
制御セクション120には、制御中央処理装置(CPU)122が含まれている。サーボ110は、制御セクション120の一部と考えることが出来る。制御CPU122が行う通常動作に適当なソフトウェア或いはファームウェアは、メモリ内に記憶する。更に、制御CPU122には、ここに開示する高機能用プログラム・ルーチンが設けられている。
視聴者が起動できる各機能用の制御バッファ132が、それらの現在利用可能な機能(即ち、通常再生(プレー)、リバース(逆戻し)、早送り、スロー(低速)再生、ポーズ(一時停止)/再生(プレー)、停止)を示すように構成されている。このポーズ機能は、一般的に、殆どのビデオカセット・レコーダ(VCR)にあるポーズ動作によく似ている。ポーズ機能は、例えばコマーシャルのような不所望のセグメントをレコーディングから削除するために、記録済みプレゼンテーションの再生を手動で中断できる。更に、高機能バッファ136が、ここに開示するトリック・モードの制御を含む高再生機能を実施するために、設けられている。再生トリック・モードには、標準の1倍再生速度以外の速度を有する順方向再生と逆方向再生とが含まれている。
出力処理セクション170には、誤り訂正回路130とトラック・バッファ172とが含まれている。このトラック・バッファ172内では、ディスクから読み出されたデータがバッファリング(一時記憶)されて、次の処理用の各パケットに組み立てられる。この各パケットは、条件付きアクセス(限定受信)回路174により処理される。即ち、各パケットは、この回路174の制御によりデマルチプレクサ176を介して各経路を伝播し、ビデオ処理およびオーディオ処理が施される。ビデオは、ビデオ・デコーダ178により例えばMPEG−1或いはMPEG−2のフォーマット(形式)から復号され、次にTVエンコーダ180により従来のテレビジョン信号フォーマット、例えば、ATSC、NTSC、SECAM或いはPALに符号化される。オーディオ・データ・ストリームは、オーディオ・デコーダ182により例えばMPEG−1或いはMPEG−2のフォーマットから復号され、オーディオ・ディジタル/アナログ(D/A)変換器184によりアナログ形式に変換される。このオーディオD/A変換器184は、オーディオ・デコーダ182からのディジタル・オーディオを処理して、アナログ出力信号を生成する。
オーディオ・デコーダ182には、復号する前にオーディオ・データを一時的に記憶するバッファが含まれていることが望ましい。オーディオ・デコーダ182の動作は、システム・バス181を介して、プロセッサ、例えば、制御CPU122により、制御される。オーディオ・デコーダ182からのディジタル・オーディオは、適切なディジタル・アナログ変換装置、例えば、オーディオD/A184により、アナログ形式に変換される。
更に、このシステムには、オーディオ・ゲート183が含まれていることが望ましい。このオーディオ・ゲート183は、オーディオ・デコーダ182により出力されたオーディオ情報内に含まれる相対的無音(relative silence)期間の少なくとも一部を取り除き、オーディオ信号の残りの部分(以下、残留部分という)を連結する。以下、これについて説明する。ディジタル領域に於いてオーディオ・ゲーティング(gating)処理を行う場合、ディジタル形式のオーディオ・ゲート183が、図1に示されるように設けられて、オーディオ・デコーダ182からのディジタル・オーディオ出力を処理することが望ましい。残留オーディオ・サンプルの断続的な発生は、周知のように、読み書き可能なメモリ(read write memory)構成の使用により、円滑に連結される。しかし、本発明はこの点に限定されるものではなく、オーディオ・ゲーティングは、アナログ領域に於いても行うことが出来る。その場合、アナログ形式のオーディオ・ゲートを使用し、このオーディオ・ゲートへの入力は、オーディオD/A184から出力されたアナログ信号であることが望ましい。
更に、以下に説明するオーディオ・ゲートと連結処理は、制御CPU122によっても行うことが出来る。オーディオ・デコーダ182とオーディオD/A184との間の通信は、適切なシステム通信リンク、例えば、システム・バス181により行う。また、システム・バス181により、オーディオ・デコーダ182、ディジタル・オーディオ・ゲート183、183a、183b、および、オーディオD/A184の種々の動作パラメータの制御を行うことができる。説明の便宜上、本発明を、図1の構造を基準にして、説明する。
選択された具体的な構造に拘わらず、オーディオ・ゲーティング・システムは、図2のAおよび図2のBに示すような2つの独持の機能を果たすように構成されることが望ましい。1つの機能は、オーディオ信号から、オーディオのピーク・レベル相互間に生じる各相対的無音期間212および214の少なくとも一部を削除することである。ここで述べる「相対的無音(relative silence)」とは、オーディオ・レベルが、選択されたオーディオ閾値レベル202より低い期間を指している。このような相対的無音期間は、ビデオ・プレゼンテーションに対応する話し言葉の相互間で、即ち、対話中に生じるのが最も一般的である。この相対的無音という用語の使用は、しばしばオーディオ・アトモスフェア(audio atmosphere)と呼ばれる特定量の低レベルの音声208が、一般的にプログラミング時の音響的バックグラウンド(背景)として存在し、オーディオ・プレゼンテーションの話し言葉相互間で、或いは、その他の比較的静かな部分の期間で、識別できることを認識したものである。オーディオが低レベルである期間214も、ここでは相対的無音期間と呼ぶことにする。本発明の目的を達成するために相対的無音と見做すべきオーディオ・レベルは、閾値レベル202により特定される。例えば、ディジタル・システムの実施形態では、相対的無音期間は、ディジタル比較器のような機能により、特定される。このディジタル比較器は、ディジタルの音声の言葉(以下、ディジタル・オーディオ・ワードという)を制御CPU122が設定したディジタル閾値と比較する。その動作時に、ディジタル・オーディオ・ワードは、閾値より大きい場合、「高(high:ハイ)」のフラグが付けられ、逆に、閾値より小さい場合、「低(low:ロー)」のフラグが付けられ、「高」のフラグが付いたディジタル・オーディオ・ワードのみが処理されて、トリック・モード再生のオーディオ出力信号が生成される。閾値を超え、「高」のフラグが付いたディジタル・オーディオ・ワードは、基本的に互いに隣接するように、或いは、効果的に互いに結び付くように連結されて、その結果、相対的無音の間隙が実質的に削除され、それによりオーディオ・コンテンツの存続時間を短くする。「高」のフラグが付いたディジタル・オーディオ・ワードの連結は、MPEGストリームから復号されたディジタル・オーディオの全部または一部を記憶するメモリへのメモリ・アドレス指定(memory addressing)を制御することにより、「高」のフラグが付いたディジタル・オーディオ・ワードのみが、メモリから読み出されて結合され、D/A184でディジタル・アナログ変換されることにより実現される。
相対的無音期間を削除する際、低レベルの期間を含むことが必要とされるオーディオ・コンテンツが、オーディオの読み出しを行わないことを示す「低」のフラグを不用意に付けられることがあり、このようなオーディオ信号コンテンツの削除により、不所望な音響効果が生じることがある。このような不所望のトリック・モード再生のオーディオ歪みを避けるため、閾値を超えないディジタル・オーディオ・ワードに「低」のフラグを付け、その「低」フラグの数を計数し、即ち、合計するようにして、時間に依存した時相閾値を設定する。これにより、低レベルのディジタル・オーディオ・ワードは、その低レベルが所定期間に亘り持続しなければ、抑制されずに、即ち、削除されずに済む。例えば48KHzでサンプリングされるディジタル・オーディオのシステムの場合、例えば20Hzの周波数のオーディオ信号には、相対的無音期間と見做され、従って、「低」のフラグを付けられる低振幅成分が含まれる。従って、前述した不所望のオーディオ歪みを未然に防止するため、「低」のフラグは、20Hzの信号の期間に略等しい期間、即ち、約5ミリ秒の間、存在し続ける必要がある。従って、この5ミリ秒の期間に亘って、48KHzのサンプリング・レートで、この5ミリ秒の時相閾値を超えるには約2400の「低」のフラグが生じる必要があり、そのように継続して「低」のフラグを付けられたディジタル・オーディオ・サンプルが識別されて、トリック・モード再生のオーディオ信号から削除される。
相対的無音期間の特定は、ハード・ワイヤード論理回路(hard wired logic)の使用か、或いは、ソフトウェアに基づくルーチンの使用により、実行できる。オーディオ・ゲート183の構成は、制御CPU122により制御され、相対的無音期間を通過させるか或いは削除するかの閾値レベル202および/または時相閾値が選択されて、大なり小なりのオーディオのゲート通過が許される。即ち、オーディオ信号からオーディオ出力を発生するためのオーディオ閾値レベル202および/または時相閾値の設定が、選択的に制御される。
図2のAおよび図2のBは、アナログ・オーディオ信号の時系列を示しており、図2のAは、再生速度1倍の再生期間に生じる1秒間のオーディオ信号再生を表している。図2のAおよび図2のBは、本発明のゲーティング処理および連結(concatenation)処理の結果を説明するために、アナログ・オーディオ信号を示しているが、本発明のゲーティング処理および連結処理は、アナログ処理構成とディジタル処理構成の何れの場合でも、実行可能である。図2のBは、図2のAと同じオーディオ信号のセグメントを表しているが、このセグメントは、2倍の速度に再編され、本発明の構成により処理されて、図示のようなオーディオ信号が得られる。図2のBに於いて、各オーディオ・コンテンツの存続時間は、1倍の速度で再生されたものと実質的に同じであり、従って、各オーディオ・コンテンツのピッチは、1倍の速度で再生されたものと実質的に同じになる。しかし、セグメント全体の存続時間は、2分の1秒に短縮されている。図2のAでは、バックグランドのオーディオ信号208が、ゲーティング処理により削除され、従って、図2のBには存在しない。更に、図2のAに於けるオーディオ信号210相互間に生じる各相対的無音期間の少なくとも一部が、図2のBに示す如く選択的に削除されて、オーディオ・サウンド・トラックが速度アップされる。図2のBに於いて、ゲート入力に供給された約1.0秒のオーディオ信号は、変更されて、ゲート出力に於いて約0.5秒の存続時間を有するようになる。従って、相対的なオーディオ速度は、オーディオ信号210相互間に生じる各相対的無音期間212および214の一部を削除することにより、1倍から約2倍にまで増加する。この変更されたオーディオ信号は、2倍のビデオ・トリック・モードで再生されるビデオ・コンテンツと略同期して、即ち、実質的に同じレートで、再生される。ビデオ・トリック・モードが別の速度である場合、オーディオ再生速度をそれに対応して調節し、ユーザが選択したビデオ再生速度に略合致させることが出来る。
オーディオ・ゲート183、或いは、その他の関連するオーディオ処理素子、例えば、制御CPU122は、相対的無音の選択された期間が削除された後に、オーディオ・サウンド・トラックの残留部分を連結するように構成されている。この結果得られた信号が、図2のBにゲート出力として示されている。所望の効果は、オーディオ・プレゼンテーションのオーディオ・ワード相互間、或いは、その他の関連部分相互間の各相対的無音期間の少なくとも一部を短縮して、或いは、削除して、オーディオ・プレゼンテーション全体を速度アップすることである。制御CPU122は、オーディオ信号のゲート閾値レベル202と、時相閾値、即ち、ゲートにより削除すべき、各相対的無音期間212および214の割合部分とを制御することにより、オーディオ再生の相対的な速度を決定する。各相対的無音期間の100%を削除すると(即ち、削除すべき割合部分が100%の場合)、オーディオ再生速度は、最大限に増大する。
前述した連結処理の説明では、「高」のフラグが付いたオーディオ・ワードは、全て、メモリから読み出され処理されて出力信号が形成され、「低」のフラグが付いたオーディオ・ワードは、全て、メモリから読み出されなかった。これにより、各相対的無音期間の100%が削除されて、最大限のオーディオ速度アップが行われた。しかし、例えばオーディオ信号210相互間の各相対的無音期間の削除すべき部分を低減すると、オーディオ再生のスピード・アップも低減される。この相対的無音の各被検出期間の削除すべき部分の低減は、相対的無音期間を示す「低」のフラグが付けられたディジタル・オーディオ・ワードの存続時間に従って、或いは、その数に従って、被制御メモリ読み出しアドレス指定を変更することにより、実行できる。前述したように、例えば48KHzでサンプリングされるディジタル・オーディオのシステムの場合、5ミリ秒の時相閾値を、約2400の連続する「低」のフラグを計数するようにして、設定できる。また、合計する「低」のフラグの数を多く設定すると、時相閾値の期間も長く設定できる。例えば、1秒の期間の相対的無音には、48000の「低」のフラグが含まれることになる。このようにして、最小の時相閾値を超える場合、各相対的無音期間の削除の開始は、「低」のフラグの計数値設定を変えることにより、制御可能に決定できる。このように測定された、或いは、定量化された各オーディオ間隙を含めることにより、各相対的無音期間の100%の削除の場合に得られるスピード・アップに比べて、程度の低いスピード・アップが実現される。
若しオーディオ信号210相互間で決定される各相対的無音期間の100%を削除することによっても、オーディオ再生速度を十分に増大できない場合、オーディオ・ゲートの閾値レベル202を増加することにより、オーディオ・ゲート183が選択的に削除するオーディオ信号部分の数および/またはその長さを増加できる。尚、スピード・アップは、再生オーディオ・ピッチ(音程)を変えることなく、行うことができる。しかし、本発明は、この点に限定されるものではなく、本発明の機能と、オーディオ・ピッチを変えるようなその他のオーディオ・スピード・アップ技術とを組み合わせることが望ましい場合もある。
図3は、例えば装置100のようなメディア・プレーヤの例に於いて実施される本発明の構成を理解するのに有効なフローチャートである。図3に示すプロセスを、順方向早送り再生に関して、説明する(これは、逆方向トリック・モードのオーディオ再生は、一般的に望ましくない為である)。尚、本発明は、これに限定されるものではない。ここに開示する本発明の構成は、図3に示す技術と同様の技術を使用して、逆方向再生トリック・モードにも適用可能である。
図3のプロセスは、装置100が再生モードで動作している時に、ステップ300から開始する。ステップ300に於いて、制御CPU122は、高機能バッファ136からのユーザ入力をモニタする。ステップ302に於いて、制御CPU122は、トリック・モードの例えば順方向早送り再生速度が選択されているか否かを判定する。ステップ302に於いてトリック・モードが選択されていない場合、制御CPU122は、ステップ300の処理に戻り、装置100は、DVD記憶媒体102からの符号化ディジタル・データの読み出しを続ける。トリック・モードが選択されている場合、制御CPU122は、トリック・モード再生のためのステップ304乃至316を実行する。
ステップ304に於いて、制御CPU122は、ユーザが選択したビデオ・トリック・モード再生速度を特定する。ステップ306に於いて、制御CPU122は、記憶媒体から次の組のデータを読み出す。ステップ304で特定されたビデオ・トリック・モード再生速度に基づいて、制御CPU122は、基準ゲート閾値レベル202の値と、各相対的無音期間の削除すべき基準割合部分の値とを設定する(ステップ308および310)。
ステップ312に於いて、制御CPU122は、設定されたゲート閾値と各相対的無音期間の削除すべき割合部分とに基づいて得たオーディオ再生速度が、ユーザが選択したビデオ・トリック・モード再生速度に実質的に十分に適合しているか否かを判定する、即ち、処理済みオーディオ再生レートがビデオ再生レートと実質的に等しく、従って、ある程度のオーディオとビデオとの一致が確保されているか否かを判定する。若し平均オーディオ再生レートがビデオ再生コンテンツに適合できていない場合、このシステムは、ステップ314に於いて、ゲート閾値レベルと割合部分の各値を調整できる。本プロセスでは、処理済みオーディオ再生速度と選択されたビデオ・トリック・モード再生速度との間で、オーディオとビデオとの十分な適合が得られるまで、上述の処理が繰り返される。最後に、ステップ316に於いて、プレーヤ装置100は、オーディオD/A184でトリック・モードのオーディオ再生信号を生成して、このオーディオ信号が、ビデオ・トリック・モードのプログラミングと実質的に同期して、再生される。
本発明の構成に従う1つ或いは複数の高度な動作機能を備えたDVD装置のブロック図である。 図1の装置100のようなメディア・プレーヤの例に於いて実施される本発明の構成を理解するのに有効なオーディオ信号の時系列を示す図である。 本発明の構成に従う相対的無音のゲートによる削除を理解するのに有効なフローチャート例である。

Claims (14)

  1. ビデオ・プレゼンテーションの1倍より速い速度のビデオ・トリック・モード再生時にオーディオ・プログラミングを再生する方法であって、
    記憶媒体から情報を取り出して、あるプレゼンテーションの少なくとも1つのビデオ部分とそれに対応し、且つ、相対的無音期間を有するオーディオ部分とを生成するステップ(306)と、
    前記プレゼンテーションの前記オーディオ部分を選択的にゲーティング制御して、前記各相対的無音期間の少なくとも一部を削除するステップ(308)と、
    前記各相対的無音期間の前記少なくとも一部を削除した後、前記プレゼンテーションの前記オーディオ部分の残留部分を再生用に連結するステップ(310)と、を含む前記方法。
  2. 前記ゲーティング制御して削除するステップが、選択されたビデオ・トリック・モード再生速度に基づいて、前記各相対的無音期間の割合部分を選択的に削除することを含む、請求項1記載の方法。
  3. 前記ゲーティング制御して削除するステップが、更に、前記連結するステップ(310)後に再生すべき前記オーディオ部分と前記ビデオ部分とを同期させる(312)のに必要な最適化割合部分を決定する(314)ことを含む、請求項2記載の方法。
  4. 前記ゲーティング制御して削除するステップ(308)が、更に、より速いビデオ・トリック・モード再生速度に対して、前記割合部分を増加することを含む、請求項2記載の方法。
  5. 前記ゲーティング制御して削除するステップ(308)が、選択されたビデオ・トリック・モード再生速度に基づいて、ゲーティング閾値を選択的に設定することを含む、請求項1記載の方法。
  6. 前記ゲーティング制御して削除するステップ(308)が、更に、前記連結するステップ後に再生すべき前記オーディオ部分と前記ビデオ部分とを同期させるのに必要な最適化ゲーティング閾値を決定することを含む、請求項5記載の方法。
  7. 前記ゲーティング制御して削除するステップ(308)が、更に、より速いビデオ・トリック・モード再生速度に対して、前記ゲーティング閾値(202)を増加することを含む、請求項5記載の方法。
  8. ビデオ・プレゼンテーションの1倍より速い速度のビデオ・トリック・モード再生時にオーディオ・トラックを再生する装置であって、
    記憶媒体(102)から情報を取り出して、あるプレゼンテーションの少なくとも1つのビデオ部分とそれに対応し、且つ、相対的無音期間を含むオーディオ部分とを生成する記憶媒体読み取り装置(108)と、
    前記プレゼンテーションの前記オーディオ部分を選択的にゲーティング制御して、前記各相対的無音期間の少なくとも一部を削除するオーディオ・ゲート(183)と、
    前記各相対的無音期間の前記少なくとも一部を削除した後、前記プレゼンテーションの前記オーディオ部分の残留部分を再生用に連結するオーディオ・プロセッサ(183a)と、を含む前記装置。
  9. 選択されたビデオ・トリック・モード再生速度に基づいて、前記各相対的無音期間の削除すべき割合部分を選択的に決定する処理手段(122)を含む、請求項8記載の装置。
  10. 前記処理手段(122)が、前記連結後に再生すべき前記オーディオ部分と前記ビデオ部分とを同期させるのに必要な最適化割合部分を決定する、請求項9記載の装置。
  11. 前記処理手段(122)が、より速いビデオ・トリック・モード再生速度に対して、前記割合部分を選択的に増加する、請求項9記載の装置。
  12. 選択されたビデオ・トリック・モード再生速度に基づいて、ゲーティング閾値(202)を選択的に設定する処理手段(183b)を含む、請求項8記載の装置。
  13. 前記処理手段が、前記連結後に再生すべき前記オーディオ部分と前記ビデオ部分とを同期させるのに必要な最適化ゲーティング閾値を選択的に決定する、請求項12記載の装置。
  14. 前記処理手段が、より速いビデオ・トリック・モード再生速度に対して、前記ゲーティング閾値を選択的に増加する、請求項12記載の装置。
JP2003573870A 2002-03-01 2003-02-21 オーディオ・プログラムを再生する方法およびオーディオ・トラックを再生する装置 Expired - Fee Related JP4322682B2 (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US10/087,183 US6625387B1 (en) 2002-03-01 2002-03-01 Gated silence removal during video trick modes
PCT/US2003/004974 WO2003075566A1 (en) 2002-03-01 2003-02-21 Gated silence removal during video trick modes

Publications (3)

Publication Number Publication Date
JP2005519538A true JP2005519538A (ja) 2005-06-30
JP2005519538A5 JP2005519538A5 (ja) 2006-03-16
JP4322682B2 JP4322682B2 (ja) 2009-09-02

Family

ID=27787528

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2003573870A Expired - Fee Related JP4322682B2 (ja) 2002-03-01 2003-02-21 オーディオ・プログラムを再生する方法およびオーディオ・トラックを再生する装置

Country Status (11)

Country Link
US (1) US6625387B1 (ja)
EP (1) EP1481544B1 (ja)
JP (1) JP4322682B2 (ja)
KR (1) KR100943597B1 (ja)
CN (1) CN100420294C (ja)
AU (1) AU2003213131A1 (ja)
MX (1) MXPA04008426A (ja)
MY (1) MY132102A (ja)
PL (1) PL372220A1 (ja)
TW (1) TWI224468B (ja)
WO (1) WO2003075566A1 (ja)

Families Citing this family (18)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2004056086A2 (en) * 2002-12-16 2004-07-01 Koninklijke Philips Electronics N.V. Method and apparatus for selectable rate playback without speech distortion
EP1578141A1 (en) * 2004-03-19 2005-09-21 Deutsche Thomson-Brandt Gmbh Method and apparatus for adapting the speed or pitch of replayed or received digital audio signals
US7844464B2 (en) * 2005-07-22 2010-11-30 Multimodal Technologies, Inc. Content-based audio playback emphasis
JP4039417B2 (ja) * 2004-10-15 2008-01-30 株式会社日立製作所 記録再生装置
EP1689179A1 (en) * 2005-02-07 2006-08-09 Deutsche Thomson-Brandt Gmbh Method and apparatus for replaying a video signal and one or more audio signals related to audio/video data that are based on a 24Hz frame frequency video signal
WO2006082150A2 (en) * 2005-02-07 2006-08-10 Thomson Licensing METHOD AND APPARATUS FOR REPLAYING A VIDEO SIGNAL AND ONE OR MORE AUDIO SIGNALS RELATED TO AUDIO/VIDEO DATA THAT ARE BASED ON A 24Hz FRAME FREQUENCY VIDEO SIGNAL
EP1720166A1 (en) * 2005-05-04 2006-11-08 Deutsche Thomson-Brandt Gmbh Method and apparatus for authoring a 24p audio/video data stream by supplementing it with additional 50i format data items
US8312492B2 (en) * 2007-03-19 2012-11-13 At&T Intellectual Property I, L.P. Systems and methods of providing modified media content
JP5093648B2 (ja) * 2007-05-07 2012-12-12 国立大学法人電気通信大学 再生装置
CN101785007A (zh) * 2007-08-31 2010-07-21 国际商业机器公司 同步数据流的方法
JP4784583B2 (ja) * 2007-10-09 2011-10-05 ソニー株式会社 2倍速データの出力装置及び出力方法
US8374712B2 (en) * 2008-12-31 2013-02-12 Microsoft Corporation Gapless audio playback
US9813777B1 (en) * 2015-02-27 2017-11-07 Cox Communications, Inc. Time shifting content for network DVR and trick play keys
CN107193841B (zh) * 2016-03-15 2022-07-26 北京三星通信技术研究有限公司 媒体文件加速播放、传输及存储的方法和装置
US10629223B2 (en) 2017-05-31 2020-04-21 International Business Machines Corporation Fast playback in media files with reduced impact to speech quality
US11039177B2 (en) * 2019-03-19 2021-06-15 Rovi Guides, Inc. Systems and methods for varied audio segment compression for accelerated playback of media assets
US11102523B2 (en) 2019-03-19 2021-08-24 Rovi Guides, Inc. Systems and methods for selective audio segment compression for accelerated playback of media assets by service providers
US10708633B1 (en) 2019-03-19 2020-07-07 Rovi Guides, Inc. Systems and methods for selective audio segment compression for accelerated playback of media assets

Family Cites Families (18)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4376874A (en) * 1980-12-15 1983-03-15 Sperry Corporation Real time speech compaction/relay with silence detection
US5623344A (en) * 1992-09-01 1997-04-22 Hitachi America, Ltd. Digital video recording device with trick play capability
DE4404932C2 (de) * 1993-02-16 1995-06-22 Gold Star Co Kurzdarstellungs-Playbackvorrichtung und -verfahren für einen Video-Cassettenrecorder
US5717823A (en) * 1994-04-14 1998-02-10 Lucent Technologies Inc. Speech-rate modification for linear-prediction based analysis-by-synthesis speech coders
US5583652A (en) * 1994-04-28 1996-12-10 International Business Machines Corporation Synchronized, variable-speed playback of digitally recorded audio and video
JP2747251B2 (ja) * 1995-07-24 1998-05-06 日本電気ホームエレクトロニクス株式会社 画像・音声編集システム
CN1145519A (zh) * 1995-09-01 1997-03-19 苏勇 音频信号保真变速处理方法
JPH09198808A (ja) * 1996-01-17 1997-07-31 Sanyo Electric Co Ltd 音声再生回路
US5828994A (en) * 1996-06-05 1998-10-27 Interval Research Corporation Non-uniform time scale modification of recorded audio
KR100257613B1 (ko) * 1996-10-15 2000-06-01 모리시타 요이찌 영상 및 음성 부호화 방법, 부호화 장치 및 부호화 프로그램 기록 매체
US5893062A (en) * 1996-12-05 1999-04-06 Interval Research Corporation Variable rate video playback with synchronized audio
JP2000509932A (ja) * 1997-02-03 2000-08-02 コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ 記録担体上にトリックプレイ信号を記録するための方向識別子
US6154603A (en) * 1997-02-18 2000-11-28 Thomson Licensing S.A. Picture decoding for trick mode operation
US6229951B1 (en) * 1997-02-18 2001-05-08 Thomson Consumer Electronics Digital video picture and ancillary data processing and storage
US6356211B1 (en) * 1997-05-13 2002-03-12 Sony Corporation Encoding method and apparatus and recording medium
JP4006553B2 (ja) * 1998-06-05 2007-11-14 ソニー株式会社 記録再生装置および方法
JP3491533B2 (ja) * 1998-07-24 2004-01-26 ヤマハ株式会社 ディジタルオーディオデータの再生方法及び装置
JP2001298710A (ja) * 2000-04-14 2001-10-26 Nippon Hoso Kyokai <Nhk> 映像処理装置

Also Published As

Publication number Publication date
AU2003213131A1 (en) 2003-09-16
MXPA04008426A (es) 2004-11-26
CN1650619A (zh) 2005-08-03
EP1481544A4 (en) 2008-06-25
PL372220A1 (en) 2005-07-11
KR100943597B1 (ko) 2010-02-24
EP1481544B1 (en) 2019-10-16
US20030165327A1 (en) 2003-09-04
CN100420294C (zh) 2008-09-17
EP1481544A1 (en) 2004-12-01
TWI224468B (en) 2004-11-21
TW200401563A (en) 2004-01-16
WO2003075566A1 (en) 2003-09-12
US6625387B1 (en) 2003-09-23
JP4322682B2 (ja) 2009-09-02
KR20040091680A (ko) 2004-10-28
MY132102A (en) 2007-09-28

Similar Documents

Publication Publication Date Title
JP4322682B2 (ja) オーディオ・プログラムを再生する方法およびオーディオ・トラックを再生する装置
US7130528B2 (en) Audio data deletion and silencing during trick mode replay
US7149412B2 (en) Trick mode audio playback
JP4236589B2 (ja) ビデオ・トリック・モード再生時のオーディオ・トラック再生方法および装置
JP4542805B2 (ja) 変速再生方法及び装置、並びにプログラム
JP4164613B2 (ja) 信号再生方法および信号再生装置
JP2648060B2 (ja) ディスクプレーヤの再生ポーズ回路

Legal Events

Date Code Title Description
A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20060126

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20060126

RD03 Notification of appointment of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7423

Effective date: 20060929

RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7424

Effective date: 20061121

RD05 Notification of revocation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7425

Effective date: 20080318

RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7424

Effective date: 20080415

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20080708

RD02 Notification of acceptance of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7422

Effective date: 20080710

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20081001

A602 Written permission of extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A602

Effective date: 20081008

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20090106

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20090526

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20090603

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120612

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120612

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130612

Year of fee payment: 4

LAPS Cancellation because of no payment of annual fees