JP2004513589A - How to switch from scanning content to playing content - Google Patents

How to switch from scanning content to playing content Download PDF

Info

Publication number
JP2004513589A
JP2004513589A JP2002541682A JP2002541682A JP2004513589A JP 2004513589 A JP2004513589 A JP 2004513589A JP 2002541682 A JP2002541682 A JP 2002541682A JP 2002541682 A JP2002541682 A JP 2002541682A JP 2004513589 A JP2004513589 A JP 2004513589A
Authority
JP
Japan
Prior art keywords
speed
processing
data stream
stream
user
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2002541682A
Other languages
Japanese (ja)
Inventor
ヒューヴェルマン,ジェローン
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Koninklijke Philips NV
Original Assignee
Koninklijke Philips Electronics NV
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Koninklijke Philips Electronics NV filed Critical Koninklijke Philips Electronics NV
Publication of JP2004513589A publication Critical patent/JP2004513589A/en
Pending legal-status Critical Current

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/80Generation or processing of content or additional data by content creator independently of the distribution process; Content per se
    • H04N21/83Generation or processing of protective or descriptive data associated with content; Content structuring
    • H04N21/845Structuring of content, e.g. decomposing content into time segments
    • H04N21/8455Structuring of content, e.g. decomposing content into time segments involving pointers to the content, e.g. pointers to the I-frames of the video stream
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/43Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
    • H04N21/442Monitoring of processes or resources, e.g. detecting the failure of a recording device, monitoring the downstream bandwidth, the number of times a movie has been viewed, the storage space available from the internal hard disk
    • H04N21/44213Monitoring of end-user related data
    • H04N21/44222Analytics of user selections, e.g. selection of programs or purchase activity
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B27/00Editing; Indexing; Addressing; Timing or synchronising; Monitoring; Measuring tape travel
    • G11B27/10Indexing; Addressing; Timing or synchronising; Measuring tape travel
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B27/00Editing; Indexing; Addressing; Timing or synchronising; Monitoring; Measuring tape travel
    • G11B27/005Reproducing at a different information rate from the information rate of recording
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B27/00Editing; Indexing; Addressing; Timing or synchronising; Monitoring; Measuring tape travel
    • G11B27/10Indexing; Addressing; Timing or synchronising; Measuring tape travel
    • G11B27/102Programmed access in sequence to addressed parts of tracks of operating record carriers
    • G11B27/105Programmed access in sequence to addressed parts of tracks of operating record carriers of operating discs
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B27/00Editing; Indexing; Addressing; Timing or synchronising; Monitoring; Measuring tape travel
    • G11B27/10Indexing; Addressing; Timing or synchronising; Measuring tape travel
    • G11B27/102Programmed access in sequence to addressed parts of tracks of operating record carriers
    • G11B27/107Programmed access in sequence to addressed parts of tracks of operating record carriers of operating tapes
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B27/00Editing; Indexing; Addressing; Timing or synchronising; Monitoring; Measuring tape travel
    • G11B27/10Indexing; Addressing; Timing or synchronising; Measuring tape travel
    • G11B27/19Indexing; Addressing; Timing or synchronising; Measuring tape travel by using information detectable on the record carrier
    • G11B27/28Indexing; Addressing; Timing or synchronising; Measuring tape travel by using information detectable on the record carrier by using information signals recorded by the same method as the main recording
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04HBROADCAST COMMUNICATION
    • H04H60/00Arrangements for broadcast applications with a direct linking to broadcast information or broadcast space-time; Broadcast-related systems
    • H04H60/27Arrangements for recording or accumulating broadcast information or broadcast-related information
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04HBROADCAST COMMUNICATION
    • H04H60/00Arrangements for broadcast applications with a direct linking to broadcast information or broadcast space-time; Broadcast-related systems
    • H04H60/35Arrangements for identifying or recognising characteristics with a direct linkage to broadcast information or to broadcast space-time, e.g. for identifying broadcast stations or for identifying users
    • H04H60/37Arrangements for identifying or recognising characteristics with a direct linkage to broadcast information or to broadcast space-time, e.g. for identifying broadcast stations or for identifying users for identifying segments of broadcast information, e.g. scenes or extracting programme ID
    • H04H60/377Scene
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04HBROADCAST COMMUNICATION
    • H04H60/00Arrangements for broadcast applications with a direct linking to broadcast information or broadcast space-time; Broadcast-related systems
    • H04H60/35Arrangements for identifying or recognising characteristics with a direct linkage to broadcast information or to broadcast space-time, e.g. for identifying broadcast stations or for identifying users
    • H04H60/46Arrangements for identifying or recognising characteristics with a direct linkage to broadcast information or to broadcast space-time, e.g. for identifying broadcast stations or for identifying users for recognising users' preferences
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04HBROADCAST COMMUNICATION
    • H04H60/00Arrangements for broadcast applications with a direct linking to broadcast information or broadcast space-time; Broadcast-related systems
    • H04H60/56Arrangements characterised by components specially adapted for monitoring, identification or recognition covered by groups H04H60/29-H04H60/54
    • H04H60/59Arrangements characterised by components specially adapted for monitoring, identification or recognition covered by groups H04H60/29-H04H60/54 of video
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04HBROADCAST COMMUNICATION
    • H04H60/00Arrangements for broadcast applications with a direct linking to broadcast information or broadcast space-time; Broadcast-related systems
    • H04H60/61Arrangements for services using the result of monitoring, identification or recognition covered by groups H04H60/29-H04H60/54
    • H04H60/65Arrangements for services using the result of monitoring, identification or recognition covered by groups H04H60/29-H04H60/54 for using the result on users' side
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04HBROADCAST COMMUNICATION
    • H04H60/00Arrangements for broadcast applications with a direct linking to broadcast information or broadcast space-time; Broadcast-related systems
    • H04H60/68Systems specially adapted for using specific information, e.g. geographical or meteorological information
    • H04H60/73Systems specially adapted for using specific information, e.g. geographical or meteorological information using meta-information
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L65/00Network arrangements, protocols or services for supporting real-time applications in data packet communication
    • H04L65/60Network streaming of media packets
    • H04L65/61Network streaming of media packets for supporting one-way streaming services, e.g. Internet radio
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/2866Architectures; Arrangements
    • H04L67/30Profiles
    • H04L67/306User profiles
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/41Structure of client; Structure of client peripherals
    • H04N21/414Specialised client platforms, e.g. receiver in car or embedded in a mobile appliance
    • H04N21/4147PVR [Personal Video Recorder]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/41Structure of client; Structure of client peripherals
    • H04N21/426Internal components of the client ; Characteristics thereof
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/43Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
    • H04N21/44Processing of video elementary streams, e.g. splicing a video clip retrieved from local storage with an incoming video stream, rendering scenes according to MPEG-4 scene graphs
    • H04N21/44008Processing of video elementary streams, e.g. splicing a video clip retrieved from local storage with an incoming video stream, rendering scenes according to MPEG-4 scene graphs involving operations for analysing video streams, e.g. detecting features or characteristics in the video stream
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/43Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
    • H04N21/44Processing of video elementary streams, e.g. splicing a video clip retrieved from local storage with an incoming video stream, rendering scenes according to MPEG-4 scene graphs
    • H04N21/4402Processing of video elementary streams, e.g. splicing a video clip retrieved from local storage with an incoming video stream, rendering scenes according to MPEG-4 scene graphs involving reformatting operations of video signals for household redistribution, storage or real-time display
    • H04N21/440281Processing of video elementary streams, e.g. splicing a video clip retrieved from local storage with an incoming video stream, rendering scenes according to MPEG-4 scene graphs involving reformatting operations of video signals for household redistribution, storage or real-time display by altering the temporal resolution, e.g. by frame skipping
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/47End-user applications
    • H04N21/472End-user interface for requesting content, additional data or services; End-user interface for interacting with content, e.g. for content reservation or setting reminders, for requesting event notification, for manipulating displayed content
    • H04N21/47202End-user interface for requesting content, additional data or services; End-user interface for interacting with content, e.g. for content reservation or setting reminders, for requesting event notification, for manipulating displayed content for requesting content on demand, e.g. video on demand
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N5/00Details of television systems
    • H04N5/76Television signal recording
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B2220/00Record carriers by type
    • G11B2220/20Disc-shaped record carriers
    • G11B2220/21Disc-shaped record carriers characterised in that the disc is of read-only, rewritable, or recordable type
    • G11B2220/215Recordable discs
    • G11B2220/216Rewritable discs
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B2220/00Record carriers by type
    • G11B2220/20Disc-shaped record carriers
    • G11B2220/25Disc-shaped record carriers characterised in that the disc is based on a specific recording technology
    • G11B2220/2537Optical discs
    • G11B2220/2562DVDs [digital versatile discs]; Digital video discs; MMCDs; HDCDs
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B2220/00Record carriers by type
    • G11B2220/60Solid state media
    • G11B2220/61Solid state media wherein solid state memory is used for storing A/V content
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B2220/00Record carriers by type
    • G11B2220/90Tape-like record carriers
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N5/00Details of television systems
    • H04N5/14Picture signal circuitry for video frequency region
    • H04N5/147Scene change detection
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N5/00Details of television systems
    • H04N5/76Television signal recording
    • H04N5/78Television signal recording using magnetic recording
    • H04N5/781Television signal recording using magnetic recording on disks or drums
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N5/00Details of television systems
    • H04N5/76Television signal recording
    • H04N5/78Television signal recording using magnetic recording
    • H04N5/782Television signal recording using magnetic recording on tape
    • H04N5/783Adaptations for reproducing at a rate different from the recording rate
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N5/00Details of television systems
    • H04N5/76Television signal recording
    • H04N5/84Television signal recording using optical recording
    • H04N5/85Television signal recording using optical recording on discs or drums
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N9/00Details of colour television systems
    • H04N9/79Processing of colour television signals in connection with recording
    • H04N9/80Transformation of the television signal for recording, e.g. modulation, frequency changing; Inverse transformation for playback
    • H04N9/804Transformation of the television signal for recording, e.g. modulation, frequency changing; Inverse transformation for playback involving pulse code modulation of the colour picture signal components
    • H04N9/8042Transformation of the television signal for recording, e.g. modulation, frequency changing; Inverse transformation for playback involving pulse code modulation of the colour picture signal components involving data reduction

Abstract

コンテンツ情報を表わすデータストリームは再生のために処理される。ストリームの処理は、第1の速度での処理から第2の速度での処理へ切り換えられる。第1の速度は第2の速度とは異なる。第1の速度での処理は停止され、第2の速度での処理は第1の速度での処理中に通過されたストリーム中の位置で開始される。位置は再調整可能である。The data stream representing the content information is processed for playback. The processing of the stream is switched from processing at the first speed to processing at the second speed. The first speed is different from the second speed. Processing at the first speed is stopped, and processing at the second speed is started at a position in the stream that was passed during processing at the first speed. The position can be readjusted.

Description

【0001】
[発明の分野]
本発明は、データストリームを処理する方法及び装置に関する。本発明の方法は、例えばデータストリームからコンテンツ情報を再生する場合に使用されうる。
【0002】
[背景技術]
米国特許第4,649,442号は、ビデオテープレコーダの自動番組選択器を開示する。ビデオテープレコーダでは、記録開始信号が検出されるたびに、対応するコンテンツが自動的に再生される。記録開始信号は記録された番組の開始を示す制御信号である。信号の検出と同時にコンテンツを自動再生することにより、再生された番組が所望のものであるか否かをユーザがチェックすることが可能となる。従って、早送り(FF)又は巻戻し(REW)モードのときに信号が検出されると、検出された番組の始まりの部分を所定の時間に亘って再生するために磁気テープは停止される。検出された番組の再生中にユーザがキー操作を行わなければ、FF又はREWモードは自動的に再開される。
【0003】
[発明の概要]
公知の選択器は、記録開始信号に基づいて、ユーザの介在なしに番組の部分を自動的に再生する。本発明は、特に、コンテンツ又は番組のどの部分が再生されるべきかをユーザ自身が決定することを可能とする、予め記録されたコンテンツ情報を制御可能に再現する方法を提供する。本発明は、例えば、予め記録された番組の所望のシーケンス又はシーンを取り出すためのユーザフレンドリーな方法を提供する。本発明は更に、コンテンツ内のユーザによって選択された位置に出来る限り近い位置で開始するコンテンツを再生するオプションをユーザに与える。
【0004】
本発明は、データストリームを処理する方法を提供する。データストリームが第1の速度で処理されているとき、例えばユーザにより、第1の速度での処理を第2の速度での処理に切り換えるためのコマンドが与えられる。第1の速度での処理は停止される。第2の速度での処理は、ストリームが以前に第1の速度で処理されたときに既に通過したデータストリーム中の位置から開始する。第2の速度での処理を開始する位置は、以下に示す例の状況を考慮に入れるために再調整可能である。
【0005】
「データストリーム」という表現は、特に、データの線形の連続の概念を示すものとする。データストリームは、順方向及び逆方向(又は巻戻し)いずれかで処理されうる。データストリームは、異なる速度で処理されうる。
【0006】
本発明は、第2の速度での処理を開始させる所望の開始点を考慮に入れて、第1の速度での処理から第2の速度での処理への切換を可能とする。第2の速度での処理は、必ずしもストリーム中の第1の速度での処理が中断された点から開始されなくともよい。発明者は、第1の速度での処理が実際に停止された時点と、ユーザが第2の速度での処理への切換のためのコマンドを与えユーザが第1の速度での処理を実際に望んだ時点との間に遅延があることを認識した。第2の速度での処理のためのストリーム中の開始点は、一般的には、第1の速度から第2の速度での処理へ変化する間に通過されている。ストリーム中の開始点は、第1の速度での処理の開始点とは反対方向に配置される。本発明は、この遅延を補償しようとするものである。
【0007】
停止点と開始点との間の間隔は、特に、処理装置との対話に関するユーザのプロファイル(又はユーザ履歴)、ユーザの習慣、ユーザの反応時間、第1の速度の大きさ、又はデータストリームを処理する装置の技術的な特徴に依存しうる。停止点と開始点との間の間隔は、適応可能であるか、動的に、又は、リアルタイムに適応可能であり得る。
【0008】
本発明は、例えば、ビデオ又はオーディオテープレコーダ、又は、TiVo又はReplay社のHDDベースのビデオレコーダといった記録装置中のデータストリームの処理から得られるコンテンツ情報の再生のために使用される。例えば、ユーザは高速で順方向に再生される(順方向早送り)コンテンツ情報をスキャンする。ユーザは、順方向早送り中に特定の部分を指定し、その特定の部分から始まる通常速度での再生を再開することを決定する。ユーザは、順方向早送り処理を停止するよう装置にコマンドを送信する。ユーザは、特定の部分の始まりにおいて早送り処理を停止するつもりである。しかしながら、上述の待ち時間を補償する対策が講じられなければ、上述の待ち時間によりこの所望の点を行き過ぎてしまう。本発明では、開始点は上述のように、順方向早送り処理が実際に停止された点よりもさかのぼった点であると決定される。次に、情報コンテンツは、順方向早送り停止点に先行するデータから開始して通常速度で順方向に再生されうる。結果として、情報コンテンツは、ユーザが元々、順方向早送りモードから通常再生モードへ切り換えることを望んだ点の近くから始まって再生される。
【0009】
本発明の実施例では、データストリーム中の1以上の位置は、予め夫々のブックマークポインタによってマークされている。巻戻し又は順方向早送りを行い、次に通常再生で処理を開始するようシステムに命令することは、特定のブックマークポインタによって示される点で開始する。この特定のブックマークポインタは第1の速度での処理が停止された位置に先行する。
【0010】
本願では、「ブックマークポインタ」という用語は、データストリーム中の特定のシーンの始まり、そして可能であれば終わりを示す任意の情報である(「ブックマークポインタ」は「ブックマーク」とも省略される)。ブックマークは、ブックマークであると認識されうるストリーム中に埋め込まれるラベル又はストリーム中のデータ項目である。ブックマークはまた、データストリームとは別に、又は、ストリームと組み合わせて提供されうる。例えば、ブックマークは、コンテンツ情報中のシーン或いはシーケンスの始まりを示すか、又は、ブックマークはユーザが関心を示す、或いは、示した部分を示す。
【0011】
本発明はまた、遠隔サーバがデータネットワークを通じてクライアントにビデオ又はオーディオストリームを供給するビデオ・オン・デマンドシステム又はオーディオ・オン・デマンドシステムに有用である。上述のような問題に加えてクライアント・サーバ間のネットワーク待ち時間の問題があり、本発明はこれについても解決することを目的とする。「待ち時間」という用語は、原因と結果の間のかなりの伝搬遅延を指すものとする。リアルタイム対話では、ネットワーク待ち時間は解決するのが困難な問題である。今日のインターネット環境ではかなりの待ち時間があり、一般的には数秒のオーダの待ち時間がある。高速アナログモデムは、30ミリ秒程度の、即ちエンド・ツー・エンドでは60ミリ秒の遅延をもたらす。待ち時間の影響は、ネットワークの大きさが大きくなり、ネットワーク負荷が増加すると更に深刻となる傾向がある。全てのネットワーク待ち時間を排除するのは不可能である。待ち時間は様々な方法で決定されうる。1つの方法は、ネットワークを通じて通信する装置の間で往復するメッセージを送信し、往復(ラウンドトリップ)時間を2で割ることである。例えば、インターネットに接続されたUnix(R)機で、「ping−s<宛先装置のインターネット名>」を入力し、宛先装置へ多数の往復パッケージを送信し、往復時間を得ることができる。このping操作は、例えば通信を初期化するときに一回行われるか、又はネットワーク輻輳の動的な変化に適応するよう一定の間隔で行われうる。このように決定されるネットワーク待ち時間は、ユーザが命令を発行したときに第1の速度での処理から第2の速度での処理へ切り換えるときのストリームへのジャンプして戻る点を決定するためにシステムによって考慮に入れられる。
[実施例の詳細な説明]
以下、本発明について、例として添付の図面を参照して詳述する。図中、同じ参照番号は同様の又は対応する特徴を示す。図1は、順方向早送りから通常再生へのデータストリーム100の処理の切換を示す図である。ストリーム100は、順方向の処理(順方向早送り及び通常再生)の場合にデータが左から右へ順次に処理される線形配列として示されている。ストリーム100は、最初は順方向早送りモードで第1の速度102で処理される。ユーザが順方向早送りを停止し通常再生を開始するようコマンドを与えると、待ち時間により、順方向早送り処理はデータが通常再生を再開しようとするデータを行き過ぎる。第1の速度102での処理は、実際には停止点108において停止する。停止点108で通常再生モードへ引き継がれるとユーザは行き過ぎ期間110を再生し損なう。ここでは通常再生モードに対応する速度である第2の速度104でのストリーム100の処理は、開始点106で開始する。本発明では、開始点106は停止点108よりもさかのぼった点である。点106と180との間の距離は、行き過ぎ期間110を考慮に入れる。結果として、第1の速度102から第2の速度104へのストリーム100処理の切換において後方へのジャンプが必要である。開始点106は、処理が第2の速度104で開始することをユーザが望む点であるべきである。本発明は、開始点106の決定を含む。後方へのジャンプは行き過ぎ期間110に基づくものであり、特に、ユーザの反応時間及びシステム待ち時間を考慮に入れる。
【0012】
図2は、巻戻しから通常再生へのデータストリーム100の処理の切換を示す図である。ストリーム100は、最初に逆方向早送り又は巻戻しモードで第1の速度102で処理される。ユーザが、速度102での巻戻しから第2の速度104での通常再生へのストリーム100の処理の切換の要求を始めると、待ち時間により、巻戻しモードでの処理は、意図される切換点を行き過ぎ、停止点108において停止する。従って、第2の速度104でのストリーム100の処理は、巻戻しモードでは点108よりもさかのぼった点にある開始点106で開始するべきである。これは、通常再生モードにおいて前方へのジャンプを必要とする。ジャンプは行き過ぎ期間110に基づく。
【0013】
図3は、ブックマークポインタ142、144、146及び148を有するデータストリーム100を示す図である。ポインタ142、144、146及び148は、種々の方法で作成されえ、以下その例について示す。ブックマークポインタは、システム制御信号を与えるためにストリーム100に追加されている。制御信号は、順方向早送り又は巻戻しから通常再生モードへ切り換えるときに、再生を開始する正しい開始点をシステムが見つけることを可能とする。
【0014】
第1の例は、新しいシーン(又は新しいデータ)の開始をストリーム100中で検出することに基づく。データストリーム100が連続する符号化されたフレームを有するビデオストリームを含むとき、ブックマークポインタ412、144、146及び148は、夫々のキーフレームを指しうる。本願では、「キーフレーム」という表現は、一般的にはコンテンツの一部を表わすストリーム100中のフレームを示す。例えば、ここに参照として組み込まれる公開された国際特許出願第WO98/55942号を参照のこと。キーフレームを選択する簡単な方法は、コンテンツ情報中でビデオシーン変化を検出することである。或るシーンを表わすキーフレームは、例えば、シーンの最初のフレームである。シーンは更に、シーンの意味のある表現であるキーフレームを選択するために分析されうる。各シーンは、第1のフレームよりも良いシーンの表現であるキーフレームを見つけるために更に調査される。
【0015】
第2の例は、メタデータが添付されたストリーム100を検出することに基づく。ストリーム100は、例えば、埋込みクロースド・キャプション字幕メタデータを伴うビデオストリームを含むとする。更に、ユーザは、ユーザのプロファイル又は履歴によって示されるようにゴルフに興味を示すと想定する。クロースド・キャプション字幕データ中に「ゴルフ」という単語が見つかると、対応するシーンの開始を指すブックマークポインタが作成される。
【0016】
第3の例は、ストリーム100のコンテンツ情報中で或る対象又は動きを検出することに基づく。例えば、データストリーム100は、人気のあるテレビ番組のエピソードを含む。或る時点において、ゲストのスターがシーンに入る。ビデオストリーム100中のその特定の時点にブックマークが与えられうる。
【0017】
第4の例は、或る音又は単語の検出に基づく。例えば、ストリーム100はあまり会話のない映画を表わすとする。会話の開始に、映画のオーディオデータストリーム中の音声を検出することにより、ブックマークが与えられうる。
【0018】
第5の例は、ユーザが興味を持つ又は持つであろうと予想されるデータストリーム100の一部のコンテンツ情報を示すブックマークに基づく。この文脈では、ここに参照として組み入れられる「Content with bookmarks obtained from an audience’s appreciation」なる名称のEugene Shteynによる6/1/00出願の米国特許出願第09/585,825号を参照のこと。この文献は、ある人が関心を持つであろうコンテンツ情報の要素又は部分を示すためにブックマークを与える方法に関連する。ブックマークの作成は、例えば試験聴衆を監視している間に登録される評価に基づく。
【0019】
第6の例は、GOP(Group Of Pictures)の最初のフレームにブックマークを与えることに基づく。データストリーム100は、ビデオストリームを含み、おそらくMPEG2圧縮されている一連のGOPを含む。GOPの始まりは、一般的にはIフレーム符号化され、参照番号150で示される。例えば、データストリーム100は、例えばMPEG2で圧縮されたビデオストリームである。圧縮されたビデオストリーム中では、新しいシーンの始まり一般的には効率を高めるため、Iフレームとして符号化される。Iフレームは、GOPの最初のフレームである。
【0020】
ブックマークは、特に、データストリームの作成者、データストリームの提供者又は放送者、ユーザ、又は、自動化された方法によって作成されうる。ユーザは、例えば自分がデータストリーム中の所望の要素を指すときに、ブックマークを作成する。ユーザは、所望の要素に対応するデータストリーム中の位置のために、例えば遠隔制御器によって、ブックマークを作成する。再び、待ち時間及び反応時間は、ブックマークをストリームに追加するときにシステムによって考慮に入れられる。
【0021】
開始点106は、停止点108に近いブックマークでありうる。データストリーム100は、望ましくは、例えば光ディスク或いは磁気ディスク、又は、半導体メモリといったランダムアクセスメモリ(RAM)媒体を用いて記憶される。RAMは、ストリームの第1の速度での処理から第2の速度での処理への切換にかかる時間を最小限とする。データストリーム100及び記憶媒体は、例えば、DVDビデオディスク状の圧縮されたムービーのMPEG2−ストリーム、ハードディスクドライブ(例えばTiVoパーソナルTV)上に記憶された圧縮されたテレビ放送、フラッシュメモリ(例えばフィリップスのRush MP3プレーヤ)の中のMP3圧縮されたオーディオファイルである。
【0022】
データストリームは、例えば磁気テープといったランダムアクセスメモリ媒体でないものにも格納されうるが、幾らかのランダムアクセスバッファメモリが利用可能でない限り、第1の処理速度と第2の処理速度との間の切換は平滑でない可能性がある。ブックマークは、データストリーム構造の一部(MPEGストリームの場合はプライベートデータに埋め込まれる)、又は、別のデータ構造(例えばDVDムービーの場合のコンテンツ内容ファイル)でありうる。いずれの場合も、第1の速度での処理から第2の速度での処理までの遷移の前に当該のブックマークが与えられる。当該のブックマークは、一般的には、第1の速度で処理されているデータストリーム中で見つかる最も新しいものである。
【0023】
図4は、エンド・ツー・エンドのコンテンツ配信システム400を示す機能ブロック図である。システム400は、サービス/コンテンツプロバイダ402、STB406、ディスプレイ及びスピーカ408、ネットワーク404を通じたプロバイダ402とSTB406との間のリンク422、STB406とディスプレイ及びスピーカ408との間のリンク424とを含む。
【0024】
プロバイダ402は、そのリンク422への出力を通じてネットワーク404へコンテンツ412を供給しうる。プロバイダ402は、例えば、ブロードバンドケーブル運用者、DirectToHome(DTH)衛星運用者、又はISPである。コンテンツ412は、例えば、ペイ・パー・ビュー映画、テレビジョン放送、又は、リアルネットワークのストリームのメディアクリップである。リンク422は、例えば、TVケーブル、POTS電話/xDSL回線、DTH衛星とパラボラアンテナとの間の無線リンクである。ネットワーク404は、例えば、ケーブルヘッド・エンド配信システム、インターネットといったデータネットワークである。
【0025】
STB406は、マイクロプロセッサ416、ユーザ用の制御インタフェース418、ローカル記憶部420、リンク422用の入力、リンク424への出力を含む。STB406は、例えば、パーソナルテレビジョン機能を有する消費者ディジタルケーブル受像機である。マイクロプロセッサ416は、例えば、Philips Trimediaプロセッサである。このようなプロセッサは、搬送ストリームのデマルチプレックス、及び、MPEG2エンコード又はトランスコードといったタスクを行うことが可能である。ローカル記憶部420は、例えば、HDD、DVD+RW、及び、フラッシュメモリである。ユーザ制御インタフェース418は、ユーザがSTBを通じて制御することを可能とする。記憶部420は、上述においてデータストリーム100について述べた性質を伴うデータを含みうる。マイクロプロセッサ416は、リンク422を介して供給されるデータがデータストリーム100を含む場合は処理速度が制御される。
【0026】
ディスプレイ及びスピーカ408は、例えばテレビ受像機とオーディオ増幅器セットである。
【0027】
STB406とディスプレイ及びスピーカ408とは、一般的にはエンドユーザの宅内にある。
【0028】
STB406とディスプレイ及びスピーカ408とは、物理的に結合されるか、又は、例えば費用或いは便宜上の理由から、その構成要素は分散されうる。
【0029】
例えば、プロバイダ402は、ケーブル網404上で、「Never miss it again」という映画を放送する。ここでは「Never Home」と称されるユーザは、放送中に自宅にいないと予想されるため、「Never miss it again」を記録するために「Philips super TV」と称されるSTB408をプログラムした。マイクロプロセッサ416は、EPGからのデータと内蔵タイマとを用いて、「Never miss it again」がいつ放送されるかを知る。マイクロプロセッサ416は、ここでは100GBのHDDである記憶部420を制御し、生放送の間の「Never miss it again」の記録を制御する。本例では「Never miss it again」であるデータストリーム100は、放送の後に物理的に記憶部420の中にある。「Never Home」は、自宅に戻った後、制御インタフェース418を介して「Never miss it again」のうちの自分が一番好きなシーンのサーチを行うことができる。
【0030】
ユーザ制御418は、記憶部420上の以前に記憶されたデータストリーム100に対するトリック再生制御を提供する。ストリーム100は、例えば、好きなテレビ番組でありうる。例えば、ユーザ制御418は、遠隔制御(RC)コマンドを受信し処理することが可能である。RCコマンドは、テレビ番組の順方向早送り(FF)再生、逆方向早送り(FB)再生、及び、通常(1倍速)再生を含みうる。マイクロプロセッサ416は、処理されたRCコマンドを解釈し、記憶されたストリーム100、従って記憶部からのテレビ番組を処理する。この結果、例えばテレビ受像機への例えばS−ビデオ接続といったリンク42を通じて出力されるベースバンドAV信号が得られる。
【0031】
発明者はまた、「次のブックマークへ」(又は、前のブックマークへ)といったユーザコマンドについて想定する。この命令により、ユーザは、次のブックマークが付された位置以降から予め記録された番組を再生することが可能となる。このコマンドは、以前に記録された番組を速くスキャン使用とする忙しいユーザにとって非常に有用である。例えば、「Never Home」は、先週の野球の決勝戦のホームランにのみ興味があるとする。従って、「Never Home」は、音声制御された入力を用いて「Philips super TV」に対して全てのホームランにブックマークを付すよう命令した。「Philips super TV」は、ホームランにブックマークを付すために決勝戦のクローズドキャプションデータを用いる。「Never Home」は、見損なった決勝戦についての情報を急いで仕入れるために「次のブックマークへ」を用いる。「Never Home」は、これを、パーソナルTVのSTBで提供されるように再生において実施されるような「Quick−skip」(予め記録された番組の中で約一分間前方へジャンプする)といったユーザコマンドに代わるものとして認めるであろう。
【0032】
上述のシステム400の特徴は、STB406のマイクロプロセッサ実行可能なプログラム中に存在しうる。プログラムは、STB406の中に、製造と同時に、又は後の段階において入れられうる。プログラムが後の段階において、例えばインターネットといったネットワークを通じたダウンロードにより、入れられる場合、STB406はプログラムをアップグレードする手段を有することが望ましい。
【0033】
図5は、エンド・ツー・エンドのコンテンツ配信システム500を示す機能ブロック図である。システム500は、サービス/コンテンツプロバイダ502、STB506、ディスプレイ及びスピーカ408、ネットワーク404を通じたプロバイダ502とSTB506との間のリンク422、ネットワーク404を通じたプロバイダ502とSTB506との間の対話型リンク520、及び、STB506とディスプレイ及びスピーカ408との間のリンク424とを含む。リンク422と520は物理的に同じものでありうる。
【0034】
プロバイダ502は、そのリンク422への出力を通じてネットワーク404へコンテンツ512を供給しうる。上述のプロバイダ402についての挙げた例は、プロバイダ502の場合も同じでありうる。コンテンツ412の例は、コンテンツ512と同じである。マイクロプロセッサ510は、プロバイダ502がそのコンテンツを異なる速度で再生することを可能とする。対話型リンク520は、コンテンツ512を再生するために要求される速度をマイクロプロセッサ510へ伝送するために使用されうる。データストリーム100は、コンテンツ512の一部である。
【0035】
STB506は、STB416と同様であるが、いくつかの大きな違いがある。STB506は、データストリーム100が物理的にSTB506の中に配置されていなくとも、データストリーム100の再生速度を制御することができる。代わりに、マイクロプロセッサ516は、データストリーム100の再生速度を遠隔に制御する。マイクロプロセッサ516は、マイクロプロセッサ510に接続するリンク520を用いてこれを通信する。
【0036】
例えば、プロバイダ502は、そのコンテンツの再生速度が遠隔に制御されることを許すインターネットサービスプロバイダ又はビデオ・オン・デマンド(VOD)プロバイダでありうる。プロバイダ502が再生速度の切換についての要求を受信すると、ネットワーク520及び422におけるネットワーク待ち時間が考慮に入れられる。これは、マイクロプロセッサ510、516、又は510と516を組み合わせたものによって行われる。
【0037】
STB506は、空間、電力及び/又は費用制約を有するシン・クライアント(Thin Client)STBでありうる。このSTB506の良い例は、ディスプレイ及びスピーカ408を内蔵したものである場合もあるウェブ−パッド装置のSTBでありうる。ユーザは、自分が望む場所へ装置を運び、自分が望むコンテンツを再生することができる。この場合、プロバイダ502への接続、即ちリンク422及び520は、例えばHome−RF、IEEE802.11又はBluetoothに基づく無線のものでありうる。プロバイダ502は、ユーザの自宅にあるホームサーバでありえ、次に外部コンテンツプロバイダ(図5には図示せず)に接続されうる。また、プロバイダ502は、GSM又はUTMSといった無線公衆網を用いた遠隔サーバでありうる。これらの種類のネットワークを用いる場合、ネットワーク遅延は知られる。STB506は、例えば、ネットワーク遅延を決定するためにプロバイダ502に対して「ping」操作を行いうる。他の方法は、ユーザがデータストリーム100の再生速度の切換を要求したときに、これを要求するためのコマンドにタイムスタンプを付すことである。
【0038】
システム500の上述の特徴は、STB506及び/又はプロバイダ502のマイクロプロセッサ実行可能なプログラム中に存在しうる。プログラムは、製造時点においてSTB506の中に入れられうるか、後の段階において入れられうる。プログラムが後の段階において、例えばインターネットといったネットワークを通じたダウンロードによって入れられる場合、STB506はプログラムをアップグレードする手段を有することが望ましい。
【図面の簡単な説明】
【図1】
順方向早送りから通常再生へのデータストリームの処理の切換を示す図である。
【図2】
逆方向早送り(又は巻戻し)から通常再生へのデータストリームの処理の切換を示す図である。
【図3】
データストリームをブックマークポインタと共に示す図である。
【図4】
エンド・ツー・エンドのコンテンツ配信システムを示す機能ブロック図である。
【図5】
対話型のエンド・ツー・エンドのコンテンツ配信システムを示す機能ブロック図である。
[0001]
[Field of the Invention]
The invention relates to a method and a device for processing a data stream. The method of the invention can be used, for example, when reproducing content information from a data stream.
[0002]
[Background Art]
U.S. Pat. No. 4,649,442 discloses an automatic program selector for a video tape recorder. In the video tape recorder, each time a recording start signal is detected, the corresponding content is automatically reproduced. The recording start signal is a control signal indicating the start of a recorded program. By automatically playing back the content simultaneously with the detection of the signal, the user can check whether or not the played back program is the desired one. Thus, when a signal is detected in the fast forward (FF) or rewind (REW) mode, the magnetic tape is stopped to play back the beginning of the detected program over a predetermined time. If the user does not perform a key operation during the reproduction of the detected program, the FF or REW mode is automatically restarted.
[0003]
[Summary of the Invention]
Known selectors automatically play portions of the program without user intervention based on the recording start signal. The invention provides, inter alia, a method for controllably reproducing pre-recorded content information, which allows the user to determine which part of the content or program is to be played. The present invention provides, for example, a user-friendly method for retrieving a desired sequence or scene of a pre-recorded program. The invention further provides the user with the option of playing the content starting at a location as close as possible to the location selected by the user within the content.
[0004]
The present invention provides a method for processing a data stream. When the data stream is being processed at the first speed, for example, a user is provided with a command to switch from processing at the first speed to processing at the second speed. Processing at the first speed is stopped. Processing at the second speed starts from a position in the data stream that has already passed when the stream was previously processed at the first speed. The position at which to start processing at the second speed can be readjusted to take into account the example situation described below.
[0005]
The expression "data stream" shall in particular denote the concept of a linear continuation of data. The data stream may be processed in either the forward and reverse (or rewind) directions. Data streams can be processed at different rates.
[0006]
The present invention allows for switching from processing at the first speed to processing at the second speed, taking into account a desired starting point for starting processing at the second speed. The processing at the second speed need not necessarily be started from the point at which processing at the first speed in the stream was interrupted. The inventor of the present invention determines when the process at the first speed is actually stopped, and when the user gives a command for switching to the process at the second speed, and the user actually executes the process at the first speed. I realized that there was a delay between when I wanted it. The starting point in the stream for processing at the second speed is generally passed during the transition from the first speed to the processing at the second speed. The starting point in the stream is located in a direction opposite to the starting point of the processing at the first speed. The present invention seeks to compensate for this delay.
[0007]
The interval between the stopping point and the starting point may depend, among other things, on the user's profile (or user history), the user's habits, the user's reaction time, the magnitude of the first speed, or the data stream with respect to the interaction with the processing device. It may depend on the technical characteristics of the processing equipment. The spacing between the stopping point and the starting point may be adaptive, dynamically or in real time.
[0008]
The invention is used for the reproduction of content information obtained from the processing of a data stream in a recording device, for example a video or audio tape recorder, or a TiVo or Replay HDD-based video recorder. For example, the user scans content information that is played forward at high speed (forward fast forward). The user specifies a particular portion during fast forward and decides to resume playback at normal speed starting from that particular portion. The user sends a command to the device to stop the fast forward processing. The user intends to stop the fast forward process at the beginning of a particular part. However, if no measures are taken to compensate for the above-mentioned waiting time, the above-mentioned waiting time will overshoot this desired point. In the present invention, as described above, the start point is determined to be a point that is more advanced than the point at which the forward fast-forward processing was actually stopped. The information content can then be played forward at normal speed starting from the data preceding the fast forward stop. As a result, the information content is played starting near the point where the user originally wanted to switch from the fast forward mode to the normal playback mode.
[0009]
In an embodiment of the present invention, one or more locations in the data stream are previously marked by respective bookmark pointers. Instructing the system to rewind or fast forward and then start the process with normal playback begins at the point indicated by the particular bookmark pointer. This particular bookmark pointer precedes the position where processing at the first speed was stopped.
[0010]
As used herein, the term "bookmark pointer" is any information that indicates the beginning, and possibly the end, of a particular scene in a data stream ("bookmark pointer" is also abbreviated as "bookmark"). A bookmark is a label or a data item in a stream that can be embedded in a stream that can be recognized as a bookmark. Bookmarks may also be provided separately from the data stream or in combination with the stream. For example, a bookmark indicates the beginning of a scene or sequence in the content information, or a bookmark indicates a portion of interest or indicated by the user.
[0011]
The present invention is also useful for video-on-demand or audio-on-demand systems in which a remote server supplies a video or audio stream to a client over a data network. In addition to the above problems, there is a problem of network latency between the client and the server, and the present invention aims to solve this problem. The term "latency" shall refer to a significant propagation delay between cause and effect. In real-time interaction, network latency is a difficult problem to solve. In today's Internet environment, there is considerable latency, typically on the order of seconds. High speed analog modems introduce delays on the order of 30 ms, or 60 ms end-to-end. The effect of latency tends to be more severe as the size of the network increases and the network load increases. It is not possible to eliminate all network latency. The waiting time can be determined in various ways. One way is to send messages back and forth between devices communicating over a network and divide the round trip time by two. For example, on a Unix (R) machine connected to the Internet, "ping-s <Internet name of destination device>" is input, and a large number of round-trip packages are transmitted to the destination device to obtain round-trip time. This ping operation may be performed once, for example, when initializing the communication, or at regular intervals to adapt to dynamic changes in network congestion. The network latency determined in this way determines the point of jumping back to the stream when switching from processing at the first speed to processing at the second speed when the user issues an instruction. Is taken into account by the system.
[Detailed description of embodiments]
Hereinafter, the present invention will be described in detail by way of example with reference to the accompanying drawings. In the figures, same reference numbers indicate similar or corresponding features. FIG. 1 is a diagram showing switching of the processing of the data stream 100 from forward fast-forward to normal reproduction. Stream 100 is shown as a linear array in which data is processed sequentially from left to right for forward processing (forward fast forward and normal playback). Stream 100 is initially processed at a first speed 102 in a fast forward mode. If the user gives a command to stop forward fast-forward and start normal playback, the waiting time causes the forward fast-forward process to overshoot the data in which normal playback is to be resumed. The processing at the first speed 102 actually stops at the stop point 108. If the transition is made to the normal reproduction mode at the stop point 108, the user fails to reproduce the overrun period 110. Here, the processing of the stream 100 at the second speed 104, which is the speed corresponding to the normal playback mode, starts at the start point 106. In the present invention, the start point 106 is a point that goes back beyond the stop point 108. The distance between points 106 and 180 takes into account the overshoot period 110. As a result, a backward jump is required in switching the stream 100 processing from the first speed 102 to the second speed 104. The starting point 106 should be where the user wants the process to start at the second speed 104. The present invention involves determining a starting point 106. The backward jump is based on the overshoot period 110 and takes into account, among other things, the user's reaction time and system latency.
[0012]
FIG. 2 is a diagram showing switching of the processing of the data stream 100 from rewinding to normal reproduction. Stream 100 is first processed at a first speed 102 in a reverse fast forward or rewind mode. When the user initiates a request to switch processing of the stream 100 from rewinding at speed 102 to normal playback at a second speed 104, the processing in rewind mode depends on the waiting time. , And stops at a stop point 108. Accordingly, processing of the stream 100 at the second speed 104 should start at the starting point 106, which is a point beyond point 108 in the rewind mode. This requires a forward jump in normal playback mode. The jump is based on the overshoot period 110.
[0013]
FIG. 3 is a diagram illustrating a data stream 100 having bookmark pointers 142, 144, 146, and 148. Pointers 142, 144, 146 and 148 can be created in various ways, examples of which are described below. A bookmark pointer has been added to stream 100 to provide system control signals. The control signal allows the system to find the correct starting point to start playback when switching from fast forward or rewind to normal playback mode.
[0014]
The first example is based on detecting in a stream 100 the start of a new scene (or new data). When data stream 100 includes a video stream having consecutive encoded frames, bookmark pointers 412, 144, 146, and 148 may point to respective key frames. In this application, the expression "key frame" generally indicates a frame in the stream 100 that represents a portion of the content. See, for example, published international patent application WO 98/55942, which is incorporated herein by reference. A simple way to select keyframes is to detect video scene changes in the content information. A key frame representing a scene is, for example, the first frame of the scene. The scene can be further analyzed to select keyframes that are a meaningful representation of the scene. Each scene is further examined to find a key frame that is a better representation of the scene than the first frame.
[0015]
A second example is based on detecting a stream 100 with metadata attached. It is assumed that stream 100 includes, for example, a video stream with embedded closed caption subtitle metadata. Further assume that the user is interested in golf as indicated by the user's profile or history. When the word "golf" is found in the closed caption caption data, a bookmark pointer is created that points to the start of the corresponding scene.
[0016]
A third example is based on detecting a certain object or motion in the content information of stream 100. For example, data stream 100 includes episodes of popular television programs. At some point, a guest star enters the scene. A bookmark may be provided at that particular point in the video stream 100.
[0017]
A fourth example is based on the detection of certain sounds or words. For example, assume that stream 100 represents a movie with little conversation. At the start of the conversation, a bookmark may be provided by detecting audio in the audio data stream of the movie.
[0018]
A fifth example is based on bookmarks that indicate content information for a portion of the data stream 100 that a user is or will be interested in. In this context, see U.S. patent application Ser. No. 09 / 585,825, filed 6/100 by Eugene Shteyn, entitled "Content with booksmarks obtained from an audition's application," which is incorporated herein by reference. This document relates to a method of providing bookmarks to indicate elements or portions of content information that a person may be interested in. The creation of a bookmark is based, for example, on ratings that are registered while monitoring the test audience.
[0019]
A sixth example is based on providing a bookmark for the first frame of a GOP (Group Of Pictures). The data stream 100 includes a video stream, and possibly a series of GOPs that are MPEG2 compressed. The beginning of a GOP is generally I-frame coded and is indicated by reference numeral 150. For example, the data stream 100 is, for example, a video stream compressed by MPEG2. In a compressed video stream, the beginning of a new scene is generally encoded as an I-frame to increase efficiency. An I frame is the first frame of a GOP.
[0020]
Bookmarks may be created by, among other things, the creator of the data stream, the provider or broadcaster of the data stream, the user, or an automated method. The user creates a bookmark, for example, when he points to a desired element in the data stream. The user creates a bookmark for the position in the data stream corresponding to the desired element, for example, by a remote control. Again, latency and reaction times are taken into account by the system when adding bookmarks to the stream.
[0021]
Start point 106 may be a bookmark that is near stop point 108. The data stream 100 is desirably stored using a random access memory (RAM) medium, for example, an optical or magnetic disk or a semiconductor memory. The RAM minimizes the time it takes to switch from processing the stream at a first rate to processing at a second rate. The data stream 100 and the storage medium may be, for example, an MPEG2-stream of a compressed movie in the form of a DVD video disc, a compressed television broadcast stored on a hard disk drive (eg, TiVo personal TV), a flash memory (eg, Philips Rush). This is an MP3 compressed audio file in the MP3 player.
[0022]
The data stream may be stored on a non-random access memory medium, such as a magnetic tape, but may switch between a first processing speed and a second processing speed unless some random access buffer memory is available. May not be smooth. The bookmark may be part of the data stream structure (embedded in private data in the case of an MPEG stream) or another data structure (eg a content content file in the case of a DVD movie). In either case, the bookmark is provided before the transition from processing at the first speed to processing at the second speed. Such a bookmark is generally the newest found in the data stream being processed at the first rate.
[0023]
FIG. 4 is a functional block diagram showing the end-to-end content distribution system 400. System 400 includes a service / content provider 402, STB 406, display and speakers 408, a link 422 between provider 402 and STB 406 over network 404, and a link 424 between STB 406 and display and speakers 408.
[0024]
Provider 402 may provide content 412 to network 404 through its output on link 422. The provider 402 is, for example, a broadband cable operator, a DirectToHome (DTH) satellite operator, or an ISP. The content 412 is, for example, a media clip of a pay-per-view movie, a television broadcast, or a stream of a real network. The link 422 is, for example, a TV cable, a POTS telephone / xDSL line, a wireless link between a DTH satellite and a parabolic antenna. The network 404 is, for example, a data network such as a cable head end distribution system or the Internet.
[0025]
The STB 406 includes a microprocessor 416, a control interface 418 for the user, a local storage 420, an input for the link 422, and an output to the link 424. The STB 406 is, for example, a consumer digital cable receiver having a personal television function. The microprocessor 416 is, for example, a Philips Trimedia processor. Such a processor can perform such tasks as demultiplexing of the transport stream and MPEG2 encoding or transcoding. The local storage unit 420 is, for example, an HDD, a DVD + RW, and a flash memory. User control interface 418 allows a user to control through the STB. The storage 420 may include data with the properties described above for the data stream 100. The processing speed of the microprocessor 416 is controlled when the data supplied via the link 422 includes the data stream 100.
[0026]
The display and the speaker 408 are, for example, a television receiver and an audio amplifier set.
[0027]
STB 406 and display and speaker 408 are typically located at the end user's premises.
[0028]
The STB 406 and the display and speaker 408 may be physically coupled or their components may be distributed, for example, for cost or convenience reasons.
[0029]
For example, the provider 402 broadcasts a movie “Never miss it again” on the cable network 404. Here, the user referred to as "Never Home" is expected to be away from home during the broadcast, so the STB408 called "Philips super TV" was programmed to record "Never miss it again". Microprocessor 416 uses the data from the EPG and the built-in timer to know when "Never miss it again" will be broadcast. The microprocessor 416 controls the storage unit 420, which is a 100 GB HDD here, and controls recording of “Never miss it again” during live broadcasting. In this example, the data stream 100, which is "Never miss it again", is physically in the storage unit 420 after the broadcast. After returning to home, “Never Home” can search for the scene that he / she likes best among “Never miss it again” via the control interface 418.
[0030]
User control 418 provides trick play control for previously stored data stream 100 on storage 420. Stream 100 may be, for example, a favorite television program. For example, user controls 418 can receive and process remote control (RC) commands. RC commands may include fast forward (FF) playback, fast forward (FB) playback, and normal (1x speed) playback of a television program. Microprocessor 416 interprets the processed RC command and processes the stored stream 100, and thus the television program from storage. The result is a baseband AV signal output over a link 42, for example, an S-video connection to a television set.
[0031]
The inventor also assumes a user command such as "to the next bookmark" (or to the previous bookmark). With this command, the user can reproduce a program recorded in advance from the position after the next bookmark. This command is very useful for busy users who want to quickly scan previously recorded programs. For example, "Never Home" is only interested in the home run of the baseball finals last week. Thus, "Never Home" instructed "Philips super TV" to bookmark all home runs using voice-controlled input. “Philips super TV” uses the closed caption data of the final match to bookmark the home run. "Never Home" uses "go to next bookmark" to quickly procure information about the missing finals. "Never Home" can be used by users such as "Quick-skip" (jump forward for about a minute in pre-recorded programs) as implemented in playback as provided on the STB of personal TV. Will recognize it as an alternative to the command.
[0032]
The features of system 400 described above may reside in a microprocessor-executable program in STB 406. The program may be entered into the STB 406 at the same time as manufacturing or at a later stage. If the program is entered at a later stage, for example, by downloading over a network such as the Internet, the STB 406 preferably has a means to upgrade the program.
[0033]
FIG. 5 is a functional block diagram showing the end-to-end content distribution system 500. System 500 includes service / content provider 502, STB 506, display and speakers 408, link 422 between provider 502 and STB 506 over network 404, interactive link 520 between provider 502 and STB 506 over network 404, and , STB 506 and a link 424 between the display and speaker 408. Links 422 and 520 may be physically the same.
[0034]
Provider 502 may provide content 512 to network 404 through its output on link 422. The example given above for provider 402 may be the same for provider 502. An example of the content 412 is the same as the content 512. Microprocessor 510 allows provider 502 to play the content at different speeds. Interactive link 520 may be used to transmit the required speed to microprocessor 510 to play content 512. Data stream 100 is part of content 512.
[0035]
STB 506 is similar to STB 416, but with some significant differences. The STB 506 can control the playback speed of the data stream 100 even if the data stream 100 is not physically located in the STB 506. Instead, the microprocessor 516 remotely controls the playback speed of the data stream 100. Microprocessor 516 communicates using link 520 which connects to microprocessor 510.
[0036]
For example, provider 502 may be an Internet service provider or a video on demand (VOD) provider that allows the playback speed of its content to be controlled remotely. When the provider 502 receives the request for switching the playback speed, the network latency in the networks 520 and 422 is taken into account. This is done by microprocessors 510, 516 or a combination of 510 and 516.
[0037]
The STB 506 may be a Thin Client STB with space, power and / or cost constraints. A good example of this STB 506 can be a web-pad device STB, which may have a built-in display and speaker 408. The user can carry the device to a desired location and play the desired content. In this case, the connections to the provider 502, ie, the links 422 and 520, may be wireless, for example, based on Home-RF, IEEE 802.11 or Bluetooth. Provider 502 may be a home server at the user's home, which may then be connected to an external content provider (not shown in FIG. 5). The provider 502 may be a remote server using a wireless public network such as GSM or UTMS. When using these types of networks, the network delay is known. STB 506 may perform a “ping” operation on provider 502, for example, to determine network delay. Another method is to time-stamp a command to request the switching of the playback speed of the data stream 100 when the user requests it.
[0038]
The above-described features of system 500 may reside in a microprocessor-executable program of STB 506 and / or provider 502. The program may be entered into the STB 506 at the point of manufacture or at a later stage. If the program is entered at a later stage by downloading over a network, such as the Internet, the STB 506 preferably has a means to upgrade the program.
[Brief description of the drawings]
FIG.
It is a figure which shows switching of the process of the data stream from forward fast forward to normal reproduction | regeneration.
FIG. 2
It is a figure which shows switching of the process of the data stream from reverse fast forward (or rewind) to normal reproduction.
FIG. 3
FIG. 3 shows a data stream with a bookmark pointer.
FIG. 4
FIG. 2 is a functional block diagram illustrating an end-to-end content distribution system.
FIG. 5
1 is a functional block diagram illustrating an interactive end-to-end content distribution system.

Claims (16)

第1の速度でのデータストリームの処理から第2の速度での上記データストリームの処理へ切り換える方法であって、
上記データストリームはコンテンツ情報を表わし、
上記第1の速度は上記第2の速度とは異なり、
上記方法は、
上記第1の速度での処理を停止する段階と、
上記第1の速度での処理中に通過した上記ストリーム中の位置にある開始点で上記第2の速度の処理を開始する段階とを含み、
上記開始点の位置は再調整可能である方法。
A method for switching from processing a data stream at a first rate to processing the data stream at a second rate, the method comprising:
The data stream represents content information,
The first speed is different from the second speed,
The above method
Stopping the processing at the first speed;
Starting the processing at the second speed at a starting point at a position in the stream that has passed during the processing at the first speed;
The method wherein the position of the starting point is readjustable.
上記開始点の位置を決定する段階を含み、上記決定段階は、ユーザの履歴、装置の待ち時間、ネットワーク接続の待ち時間、上記データストリームの情報コンテンツのうちの少なくとも1つのを考慮に入れる、請求項1記載の方法。Determining the location of the starting point, the determining step taking into account at least one of a user's history, device latency, network connection latency, and information content of the data stream. Item 7. The method according to Item 1. 上記開始点はブックマークによって示される、請求項1記載の方法。The method of claim 1, wherein the starting point is indicated by a bookmark. 上記ブックマークはユーザプログラム可能である、請求項3記載の方法。The method of claim 3, wherein the bookmark is user programmable. 上記ブックマークは第三者によって追加されたものである、請求項3記載の方法。4. The method of claim 3, wherein the bookmark has been added by a third party. 上記コンテンツ情報はビデオを含み、
上記ブックマークは上記ビデオ中のシーン変化を示す、請求項3記載の方法。
The content information includes a video,
The method of claim 3, wherein the bookmark indicates a scene change in the video.
上記データストリームは上記コンテンツ情報に関連付けられるメタデータを含み、
上記ブックマークの位置は上記メタデータに依存する、請求項3記載の方法。
The data stream includes metadata associated with the content information;
4. The method of claim 3, wherein the location of the bookmark is dependent on the metadata.
上記コンテンツ情報はビデオを含み、
上記ブックマークはGOPの符号化されたストリームの最初のフレームであるIフレームを表わす、請求項3記載の方法。
The content information includes a video,
The method of claim 3, wherein the bookmark represents an I-frame that is the first frame of a GOP encoded stream.
上記コンテンツ情報はビデオを含み、
上記開始点はユーザプロファイルと、上記ビデオ中で上記処理速度での処理が停止した位置に最も近くGOPの最後のフレームであるIフレームとに依存する、請求項2記載の方法。
The content information includes a video,
3. The method of claim 2, wherein the starting point is dependent on a user profile and an I-frame, which is the last frame of a GOP closest to where the processing at the processing speed stopped in the video.
上記データストリームはデータネットワークを介して与えられる、請求項1記載の方法。The method of claim 1, wherein the data stream is provided over a data network. ユーザが第1の速度でのデータストリームの処理から第2の速度での上記データストリームの処理へ切り換えることを可能とする装置であって、
上記データストリームはコンテンツ情報を表わし、
上記第1の速度は上記第2の速度とは異なり、
上記装置は、
上記第1の速度での処理を停止し、
上記第1の速度での処理中に通過した上記ストリーム中の位置にある開始点で上記第2の速度の処理を開始することによって特定のユーザ入力に応答し、
上記開始点の位置は再調整可能である装置。
An apparatus for enabling a user to switch from processing a data stream at a first rate to processing the data stream at a second rate,
The data stream represents content information,
The first speed is different from the second speed,
The above device
Stopping the processing at the first speed,
Responding to a particular user input by initiating processing at the second speed at a starting point at a position in the stream that has passed during processing at the first speed;
A device wherein the position of the starting point is readjustable.
上記データストリームはメタデータを含み、
上記装置は上記メタデータに依存して上記ストリーム中の位置で上記第2の速度での上記データストリームの処理を開始する、請求項11記載の装置。
The data stream contains metadata,
The apparatus of claim 11, wherein the apparatus begins processing the data stream at the second rate at a location in the stream depending on the metadata.
ユーザが第1の速度でのデータストリームの処理から第1の速度とは異なる第2の速度での上記データストリームの処理へ切り換えることを可能とするようメタデータを伴うデータストリームとしてユーザに供給されるコンテンツ情報であって、上記第2のストリームでの処理は上記第1の速度での処理中に通過され上記メタデータによって決定される上記ストリーム中の位置で開始するコンテンツ情報。Provided to the user as a data stream with metadata to enable the user to switch from processing the data stream at a first rate to processing the data stream at a second rate different from the first rate. Content information, wherein the processing in the second stream is passed during processing at the first speed and starts at a position in the stream determined by the metadata. ユーザがデータネットワークを介してデータストリームを受信することを可能とする方法であって、
ユーザが第1の速度でのデータストリームの処理から第2の速度での上記データストリームの処理への切換えを制御することを可能とする段階を含み、
上記データストリームはコンテンツ情報を表わし、
上記第1の速度は上記第2の速度とは異なり、
上記方法は、
ユーザコマンドが与えられると上記第1の速度での処理を停止し、
上記第1の速度での処理中に通過した上記ストリーム中の位置にある開始点で上記第2の速度の処理を開始し、
上記開始点の位置は再調整可能である方法。
A method for enabling a user to receive a data stream over a data network, the method comprising:
Enabling the user to control switching from processing the data stream at a first rate to processing the data stream at a second rate;
The data stream represents content information,
The first speed is different from the second speed,
The above method
When a user command is given, the processing at the first speed is stopped,
Starting processing at the second speed at a starting point at a position in the stream that has passed during processing at the first speed;
The method wherein the position of the starting point is readjustable.
上記開始点を上記データネットワークにおける待ち時間に基づいて決定する段階を含む、請求項14記載の方法。The method of claim 14, comprising determining the starting point based on latency in the data network. マイクロプロセッサの制御下で実行可能であり、第1の速度でのデータストリームの処理から第2の速度での上記データストリームの処理への切り換える方法のうちの少なくとも1つの段階を実行するために与えられる一組の命令であって、
上記データストリームはコンテンツ情報を表わし、
上記第1の速度は上記第2の速度とは異なり、
上記方法は、
上記第1の速度での処理を停止し、
上記第1の速度での処理中に通過した上記ストリーム中の位置にある開始点で上記第2の速度の処理を開始し、
上記開始点の位置は再調整可能である一組の命令。
Executable under the control of a microprocessor and provided for performing at least one step of a method of switching from processing a data stream at a first speed to processing the data stream at a second speed. A set of instructions,
The data stream represents content information,
The first speed is different from the second speed,
The above method
Stopping the processing at the first speed,
Starting processing at the second speed at a starting point at a position in the stream that has passed during processing at the first speed;
The starting point position is a set of instructions that can be readjusted.
JP2002541682A 2000-11-08 2001-11-06 How to switch from scanning content to playing content Pending JP2004513589A (en)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US71073800A 2000-11-08 2000-11-08
PCT/EP2001/013020 WO2002039450A2 (en) 2000-11-08 2001-11-06 Method for switching from scanning the content to playing the content

Publications (1)

Publication Number Publication Date
JP2004513589A true JP2004513589A (en) 2004-04-30

Family

ID=24855315

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2002541682A Pending JP2004513589A (en) 2000-11-08 2001-11-06 How to switch from scanning content to playing content

Country Status (4)

Country Link
EP (1) EP1336176A2 (en)
JP (1) JP2004513589A (en)
KR (1) KR20020071924A (en)
WO (1) WO2002039450A2 (en)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006033841A (en) * 2004-07-15 2006-02-02 Samsung Electronics Co Ltd Screen searching method and screen searching device for digital reproduction
JP2008159250A (en) * 2006-12-21 2008-07-10 Humax Co Ltd Playback control device and playback control method
JP2022010256A (en) * 2012-03-13 2022-01-14 ティヴォ ソリューションズ インコーポレイテッド Automatic play-back system of commercial

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100413690B1 (en) * 2001-12-07 2004-01-03 삼성전자주식회사 Method for playing optical recoding media
US7849487B1 (en) 2002-05-31 2010-12-07 Microsoft Corporation Review speed adjustment marker
GB0328103D0 (en) * 2003-12-04 2004-01-07 Pace Micro Tech Plc Broadcast data system and broadcast data receiver
US9299388B2 (en) 2007-09-10 2016-03-29 Gvbb Holdings S.A.R.L. Video playback
US9355683B2 (en) 2010-07-30 2016-05-31 Samsung Electronics Co., Ltd. Audio playing method and apparatus
EP2413325A1 (en) * 2010-07-30 2012-02-01 Samsung Electronics Co., Ltd. Audio playing method and apparatus

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS61172238A (en) * 1985-01-26 1986-08-02 Toshiba Corp Automatic program search device of video tape recorder
JPH1040608A (en) * 1996-07-23 1998-02-13 Sony Corp Video signal reproducing device and operating control method therefor
US5848239A (en) * 1996-09-30 1998-12-08 Victory Company Of Japan, Ltd. Variable-speed communication and reproduction system
US6125229A (en) * 1997-06-02 2000-09-26 Philips Electronics North America Corporation Visual indexing system
CN1265386C (en) * 1999-03-30 2006-07-19 提维股份有限公司 System for automatic playback position correction after fast forward or reverse

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006033841A (en) * 2004-07-15 2006-02-02 Samsung Electronics Co Ltd Screen searching method and screen searching device for digital reproduction
US8532458B2 (en) 2004-07-15 2013-09-10 Samsung Electronics Co., Ltd. Picture search method and apparatus for digital reproduction
JP2008159250A (en) * 2006-12-21 2008-07-10 Humax Co Ltd Playback control device and playback control method
JP2022010256A (en) * 2012-03-13 2022-01-14 ティヴォ ソリューションズ インコーポレイテッド Automatic play-back system of commercial

Also Published As

Publication number Publication date
WO2002039450A3 (en) 2002-11-14
WO2002039450A2 (en) 2002-05-16
EP1336176A2 (en) 2003-08-20
KR20020071924A (en) 2002-09-13

Similar Documents

Publication Publication Date Title
US20230360677A1 (en) Method and system for performing non-standard mode operations
US7926080B2 (en) Trick mode support for VOD with long intra-frame intervals
US8452154B2 (en) Transmitting signals to cause replays to be recorded at a plurality of receivers
KR102013088B1 (en) Systems and methods for enhanced trick-play functions
US6848117B1 (en) Video-on-demand system capable of performing a high-speed playback at a correct speed
US6965724B1 (en) Trick-play modes for pre-encoded video
JP2005505204A (en) System and method for reduced playback of recorded video based on video segment priority
JP2007515114A (en) System and method for providing video on demand streaming delivery enhancements
JPH11502987A (en) Trick playback mode for pre-encoded video
KR20030022288A (en) Video playback device with real-time on-line viewer feedback capability and method of operation
JP2002112197A (en) Video signal recorder, video signal reproducing device, and video signal recording and reproducing device
US20230291974A1 (en) Apparatus, systems and methods for song play using a media device having a buffer
JP4315914B2 (en) Image reproducing apparatus and image reproducing method
JP2004513589A (en) How to switch from scanning content to playing content
JP4086477B2 (en) Content encoding method, content distribution method, and content receiving terminal device
JP2002077820A (en) Accumulating/reproducing device and digital broadcast transmitting device
JP5423661B2 (en) Network system, server, playback device, and content playback method
JP5144771B2 (en) Image processing apparatus, image reproducing apparatus, image recording apparatus, image processing method, image reproducing method, and image recording method
JP2006261784A (en) Av distributing device and method for determining distribution processing
JP2002271739A (en) Video device and reproduction control information distribution method

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20041104

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20061222

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20070123

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20070423

A602 Written permission of extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A602

Effective date: 20070501

RD03 Notification of appointment of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7423

Effective date: 20070628

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20071002

A711 Notification of change in applicant

Free format text: JAPANESE INTERMEDIATE CODE: A711

Effective date: 20080425