JP2006140777A - Moving picture reproducing apparatus, moving picture reproducing method, and moving picture reproducing program - Google Patents
Moving picture reproducing apparatus, moving picture reproducing method, and moving picture reproducing program Download PDFInfo
- Publication number
- JP2006140777A JP2006140777A JP2004328659A JP2004328659A JP2006140777A JP 2006140777 A JP2006140777 A JP 2006140777A JP 2004328659 A JP2004328659 A JP 2004328659A JP 2004328659 A JP2004328659 A JP 2004328659A JP 2006140777 A JP2006140777 A JP 2006140777A
- Authority
- JP
- Japan
- Prior art keywords
- key frame
- audio data
- video
- playback
- data
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Abstract
Description
本発明は、動画再生装置、動画再生方法および動画再生プログラムに関する。 The present invention relates to a moving image reproducing apparatus, a moving image reproducing method, and a moving image reproducing program.
近年、動画データを高能率に圧縮してストリーム伝送し、またその伝送された動画データをファイル化して記録、再生する技術が広く利用されている。このような技術において動画ファイルを再生する場合、通常、先頭から再生することを想定しているため、途中から再生しようとすると、映像と音声とに時間ずれが生じる場合がある。そこで、MPEG1方式で圧縮された動画ファイルを途中再生する際に、映像と音声とを同期させる技術が提案されている(例えば特許文献1参照)。
ところで、高圧縮率で画像劣化の少ない技術として、ストリーミング配信データフォーマットであるASF(Advanced Systems Format)形式が知られている。例えば、ハードディスク録画機で録画した番組(動画ファイル)をASF形式の動画ファイルに変換してSDカードなどの記録媒体に保存し、該記録媒体をワイド表示可能な携帯端末などに装着して保存された番組(動画ファイル)を再生するような利用方法が提案されている。 Incidentally, an ASF (Advanced Systems Format) format, which is a streaming distribution data format, is known as a technology with a high compression rate and little image degradation. For example, a program (video file) recorded by a hard disk recorder is converted into an ASF format video file and stored in a recording medium such as an SD card, and the recording medium is stored in a portable terminal capable of wide display. A method of using such a program (video file) has been proposed.
しかしながら、上記ASF形式については、長時間の動画ファイルでは、途中再生や一時停止などを行うことができず、また再生までに時間がかかるという問題があった。 However, the ASF format has a problem that it cannot be played back or paused for a long time movie file, and it takes time to play back.
そこで本発明は、動画ファイルの再生、一時停止、再開などを効率的に行うことができ、かつ映像と音声とを同期させることができる動画再生装置、動画再生方法および動画再生プログラムを提供することを目的とする。 Therefore, the present invention provides a moving image reproducing apparatus, a moving image reproducing method, and a moving image reproducing program capable of efficiently reproducing, pausing, and restarting a moving image file and synchronizing video and audio. With the goal.
上記目的達成のため、請求項1記載の発明による動画再生装置は、複数組の映像データと音声データとからなる動画ファイルを再生する動画再生装置であって、前記動画ファイルを途中から再生するよう指示する再生指示手段と、この再生指示手段により再生が指示されると、複数の映像データから途中再生が指示された再生開始位置に最も近い映像データのキーフレームを取得するキーフレーム取得手段と、このキーフレーム取得手段によって取得されたキーフレーム周辺に最も近い音声データを前記複数の音声データから取得する音声データ取得手段と、前記キーフレーム取得手段によって取得されたキーフレームから映像データの復号化を開始するとともに、前記音声データ取得手段により取得された音声データの復号化を開始して再生する再生制御手段とを具備することを特徴とする。 In order to achieve the above object, a video playback apparatus according to a first aspect of the present invention is a video playback apparatus that plays back a video file composed of a plurality of sets of video data and audio data so that the video file is played back halfway. A playback instruction means for instructing, and when playback is instructed by the playback instruction means, a key frame acquisition means for acquiring a key frame of video data closest to a playback start position instructed to be played halfway from a plurality of video data; Audio data acquisition means for acquiring audio data closest to the periphery of the key frame acquired by the key frame acquisition means from the plurality of audio data, and decoding of video data from the key frame acquired by the key frame acquisition means At the same time, the decoding of the audio data acquired by the audio data acquisition means is started and Characterized by comprising a reproduction control means for.
また、好ましい態様として、例えば請求項2記載のように、請求項1記載の動画再生装置において、前記音声データ取得手段は、前記映像データの再生開始位置と前記音声データの再生開始位置との差が許容時間差以下となるように、音声データを求めるようにしてもよい。
Further, as a preferred aspect, for example, as in
また、好ましい態様として、例えば請求項3記載のように、請求項1または2に記載の動画再生装置において、前記動画ファイルは、ASF(Advanced Systems Format)形式であってもよい。
As a preferred mode, for example, as described in claim 3, in the video playback device according to
また、上記目的達成のため、請求項4記載の発明による動画再生方法は、複数組の映像データと音声データとからなる動画ファイルを再生する動画再生方法であって、前記動画ファイルを途中から再生するよう指示する再生指示ステップと、この再生指示ステップにて再生が指示されると、複数の映像データから途中再生が指示された再生開始位置に最も近い映像データのキーフレームを取得するキーフレーム取得ステップと、このキーフレーム取得ステップにて取得されたキーフレーム周辺に最も近い音声データを前記複数の音声データから取得する音声データ取得ステップと、前記キーフレーム取得ステップにて取得されたキーフレームから映像データの復号化を開始するとともに、前記音声データ取得ステップにより取得された音声データの復号化を開始して再生する再生制御ステップと、からなることを特徴とする。 According to another aspect of the present invention, there is provided a moving image reproducing method for reproducing a moving image file composed of a plurality of sets of video data and audio data, wherein the moving image file is reproduced halfway. A reproduction instruction step for instructing to perform the reproduction, and when reproduction is instructed in the reproduction instruction step, acquisition of a key frame for acquiring a key frame of the video data closest to the reproduction start position where the intermediate reproduction is instructed from a plurality of video data Audio data acquisition step for acquiring audio data closest to the periphery of the key frame acquired in the key frame acquisition step from the plurality of audio data, and video from the key frame acquired in the key frame acquisition step The decoding of the data is started, and the audio data acquired by the audio data acquisition step is Wherein a reproduction control step of reproducing the start of the decoding of the data, in that it consists of.
また、上記目的達成のため、請求項5記載の発明による動画再生プログラムは、複数組の映像データと音声データとからなる動画ファイルを再生する動画再生プログラムであって、前記動画ファイルを途中から再生するよう指示する再生指示ステップと、この再生指示ステップにて再生が指示されると、複数の映像データから途中再生が指示された再生開始位置に最も近い映像データのキーフレームを取得するキーフレーム取得ステップと、このキーフレーム取得ステップにて取得されたキーフレーム周辺に最も近い音声データを前記複数の音声データから取得する音声データ取得ステップと、前記キーフレーム取得ステップにて取得されたキーフレームから映像データの復号化を開始するとともに、前記音声データ取得ステップにより取得された音声データの復号化を開始して再生する再生制御ステップとをコンピュータに実行させることを特徴とする。
In order to achieve the above object, a moving picture reproducing program according to the invention described in
請求項1記載の発明によれば、再生指示手段により前記動画ファイルを途中から再生するよう指示されると、キーフレーム取得手段が複数の映像データから途中再生が指示された再生開始位置に最も近い映像データのキーフレームを取得し、音声データ取得手段が、取得されたキーフレーム周辺に最も近い音声データを複数の音声データから取得する。そして再生制御手段が、取得されたキーフレームから映像データの復号化を開始するとともに、取得された音声データの復号化を開始して再生するので、動画ファイルの再生、一時停止、再開などを効率的に行うことができ、かつ映像と音声とを同期させることができるという利点が得られる。 According to the first aspect of the present invention, when the playback instruction means instructs to play the moving image file halfway, the key frame acquisition means is closest to the playback start position where halfway playback is instructed from a plurality of video data. The key frame of the video data is acquired, and the audio data acquisition unit acquires the audio data closest to the periphery of the acquired key frame from the plurality of audio data. Then, the playback control means starts decoding the video data from the acquired key frame and starts decoding the acquired audio data and plays it back. And the advantage of being able to synchronize video and audio.
また、請求項2記載の発明によれば、前記音声データ取得手段は、映像データの再生開始位置と音声データの再生開始位置との差が許容時間差以下となるように音声データを求めるようにしたので、映像と音声との再生のズレを最小限に抑えることができるという利点が得られる。 According to a second aspect of the present invention, the audio data acquisition means obtains the audio data so that a difference between the reproduction start position of the video data and the reproduction start position of the audio data is equal to or less than an allowable time difference. Therefore, there is an advantage that the deviation between the reproduction of the video and the audio can be minimized.
また、請求項3記載の発明によれば、前記動画ファイルをASF(Advanced Systems Format)形式としたので、動画ファイルがストリーミング配信データフォーマットの動画ファイルの再生、一時停止、再開などを効率的に行うことができ、かつ映像と音声とを同期させることができるという利点が得られる。 According to the third aspect of the present invention, since the moving image file is in the ASF (Advanced Systems Format) format, the moving image file efficiently reproduces, pauses, or resumes the moving image file in the streaming distribution data format. And video and audio can be synchronized.
また、請求項4記載によれば、動画ファイルを途中から再生するよう指示されると、複数の映像データから途中再生が指示された再生開始位置に最も近い映像データのキーフレームを取得し、さらに、この取得されたキーフレーム周辺に最も近い音声データを前記複数の音声データから取得する。そして、取得されたキーフレームから映像データの復号化を開始するとともに、取得された音声データの復号化を開始して再生するようにしたので、動画ファイルの再生、一時停止、再開などを効率的に行うことができ、かつ映像と音声とを同期させることができるという利点が得られる。 According to the fourth aspect of the present invention, when an instruction to play a moving image file from the middle is given, a key frame of the video data closest to the playback start position at which the halfway playback is instructed is obtained from a plurality of video data, The sound data closest to the obtained key frame periphery is acquired from the plurality of sound data. And since the decoding of the video data is started from the acquired key frame and the decoding of the acquired audio data is started and played back, the video file can be played, paused, resumed, etc. efficiently And the advantage that the video and the audio can be synchronized can be obtained.
また、請求項5記載によれば、動画ファイルを途中から再生するよう指示する再生指示ステップと、この再生指示ステップにて再生が指示されると、複数の映像データから途中再生が指示された再生開始位置に最も近い映像データのキーフレームを取得するキーフレーム取得ステップと、このキーフレーム取得ステップにて取得されたキーフレーム周辺に最も近い音声データを複数の音声データから取得する音声データ取得ステップと、前記キーフレーム取得ステップにて取得されたキーフレームから映像データの復号化を開始するとともに、前記音声データ取得ステップにより取得された音声データの復号化を開始して再生する再生制御ステップとをコンピュータに実行させるようにしたので、動画ファイルの再生、一時停止、再開などを効率的に行うことができ、かつ映像と音声とを同期させることができるという利点が得られる。 According to a fifth aspect of the present invention, a reproduction instruction step for instructing to reproduce a moving image file in the middle, and reproduction instructed to be reproduced from a plurality of video data when reproduction is instructed in the reproduction instruction step A key frame acquisition step for acquiring a key frame of video data closest to the start position; an audio data acquisition step for acquiring audio data closest to the periphery of the key frame acquired in the key frame acquisition step from a plurality of audio data; A reproduction control step of starting decoding of the video data from the key frame acquired in the key frame acquisition step and starting decoding of the audio data acquired in the audio data acquisition step To play, pause, resume, etc. Rate manner can be performed, and the advantage is obtained that it is possible to synchronize the video and audio.
以下、本発明の実施の形態を、図面を参照して説明する。 Hereinafter, embodiments of the present invention will be described with reference to the drawings.
A.実施形態の構成
次に、図1は、本実施形態に係る携帯電話1の蓋を開いた状態と閉じた状態の正面図に相当する外観図である。図1(a)は、携帯電話1の蓋を開いた状態を示し、図1(b)は、携帯電話1の蓋を閉じた状態(蓋側)を示し、図1(c)は、携帯電話1の蓋を閉じた状態(裏面側)を示している。
A. Configuration of Embodiment Next, FIG. 1 is an external view corresponding to a front view of a state in which a lid of a
図示のように、蓋部2は、本体部3に対し第1ヒンジ部100を回転軸として開閉可能(矢印α)に配置されているほか、第2ヒンジ部12を回転軸として回転可能(矢印β)になっている。蓋部2は、第1スピーカ5、表示部6、データ通信用の内蔵アンテナ(図示略)を内蔵している。第1スピーカ5は、ダイナミックスピーカであり、蓋部2の内面に配置されている。表示部6は、蓋部2の内面に配置され、16:9のアスペクト比の映像表示が可能な2.7inch(240×400ドット)TFT液晶(QVGAもしくは、HVGA相当の解像度を備える)カラー液晶からなる。
As shown in the figure, the
第1ヒンジ部100は、蓋部2に連繋されて該蓋部2と一体的に回転する可動部101と、本体部3側に固定されるとともに可動部101の両側に設けられた左右一対の固定部102、103とで構成されている。
The
本体部3は、キー入力部8とマイク10とを備える。キー入力部8は、メニュー表示時におけるフォーカス移動のための十字キー81、決定のための決定キー82、アドレス帳データ閲覧のためのアドレス帳キー83、ネットワーク接続を指示するためのネットワーク接続キー84、ムービー再生モードを起動させるためのムービー再生キー85、メールモード(受信、作成、編集、送信)を起動させるためのメールキー86、オフフックキー87、クリアキー88(キャンセル検出)、オンフックキー89(オールクリア:着信待ち状態にジャンプ指示)、電話番号や文字記号を入力するためのテンキー810等からなる。また、本体部の背面には、撮影するための撮像レンズ17、および着信音やアラーム、メロディなどを再生するためのスピーカ7R、7Lが配置されている。
The main body 3 includes a
次に、図2は、本実施形態による携帯電話1の回路構成を示すブロック図である。受信信号処理部18は、データ通信モードの開始指示をスイッチ回路201より受けると、外部の無線基地局とのネゴシエーション(端末認証、回線接続)を開始し、通信帯域幅を一時的に占有する処理を行う。そして、内蔵アンテナ16により受信された無線信号より自機宛に符号変調された信号を抽出して、スイッチ回路201を介して通信データ処理部202に出力する。
Next, FIG. 2 is a block diagram showing a circuit configuration of the
通信信号処理部19は、待受け状態においても、また、データ通信モードにおいても、常に電源供給されており、通信データ処理部202からのデジタル変調信号(送信音声データ、メールデータ、ネットワーク接続情報を含むパケットデータ)を、符号変調してメインアンテナ11より出力する。また、一方で、無線基地局より送信され、メインアンテナ11により受信された無線信号より自機宛に符号変調された信号を抽出して、スイッチ回路201を介して通信データ処理部202に出力する。
The communication
なお、内蔵アンテナ16とメインアンテナ11は、蓋部2を回動させた状態であっても、閉じた状態であっても、スペースダイバーシチ受信を行うのに有効な位置関係にある。
Note that the built-in
第1制御部20は、無線基地局、及びその後段にあたる、通信サービス事業者、インターネット等のネットワークインフラを介して接続されるデータベース等の、情報資源との接続制御を中心とした処理を行う。なお、本実施の形態においては、携帯電話1は、2つの制御部を傭えており、通信処理全般については第1制御部20、その他、撮影処理、画像処理、映像の再生処理に関しては後述の第2制御部22で行う。
The
スイッチ回路201は、通信データ処理部202からの制御信号を受け、受信信号処理部18、通信信号処理部19への電源供給、処理動作開始終了の制御を行う。詳細には、通常電源オン状態、もしくは、受信ONモード状態であれば、通信信号処理部19のみに電源を供給して動作させ、一方で、ユーザがネットワーク接続キー84を操作したか、あるいは、予め設定されたスケジュールに従い、データ通信モードの開始が指示された場合は、受信信号処理部18と通信信号処理部19とを動作させる。
The
通信データ処理部202は、音声処理部205より出力されたCELP系デジタル音声データをPSK系方式に対応する信号に変調、及び拡散符号に変調するとともに、受信信号処理部18、通信信号処理部19にて受信される符号変調された信号をPSK系方式のデジタル信号に復号する処理を行う。
The communication
システムROM203は、通信制御のための制御プログラムを格納する。本実施の形態の特徴としては、通常の通信ネゴシエーションプログラムの他に受信信号処理部18と通信信号処理部19との動作切替制御プログラムを記憶する。これにより、データ通信モードの開始が指示された場合に、メインアンテナ11と内蔵アンテナ16によるスペースダイバーシチ受信を行わせて、一時的に通信帯域幅を占有し、受信信号処理部18、通信信号処理部19の双方より串力される符号変調された信号をほぼ同時にデジタル信号に復号、合成して、インターフェイス処理部204を介してバス200に出カするプログラムを記憶する。
The
音声処理部205は、CELP系の音声変調/復調システムと、動画復調に伴うMPEGオーディオ系の音声復調システムとを備え、通話状態においては、音声処理部205から出カされるアナログ音声を第1スピーカ5から出力させる。スイッチ31は、第2制御部22からの制御により、ムービー再生モードにおいては、ムービーファイルに格納されるオーディオデータがステレオ対応である場合、第2スピーカ7R、第3スピーカ7Lの両方にオーディオ信号を出力する。第2スピーカ7Lは、報知ドライバ26によっても駆動され、着信報知音などを再生出力する。
The
第2制御部22は、ムービー再生モードにおけるデータ通信モードによりダウンロードしたムービーファイルや、カメラモードにおける静止画/動画の再生表示処理、及び、カメラモードにおける撮影処理全般の制御を行う。特に、本実施形態では、第2制御部22は、ASF形式の動画ファイルの途中再生において、映像データの再生開始時間と音声データの再生開始時間とを求め、映像データと音声データとの同期に係る処理を行う。より具体的には、以下の通りである。 The second control unit 22 controls the movie file downloaded in the data communication mode in the movie playback mode, the still image / moving image playback display process in the camera mode, and the overall shooting process in the camera mode. In particular, in the present embodiment, the second control unit 22 obtains the playback start time of the video data and the playback start time of the audio data during the halfway playback of the ASF format moving image file, and synchronizes the video data and the audio data. Perform this process. More specifically, it is as follows.
ASFファイル形式の動画ファイルには、「Simple Index Object」と呼ばれる領域が存在し、その領域には、映像のキーフレーム情報が入っている。そのキーフレーム情報を用いて映像と音声との同期、さらに同期の際の検索方法を考慮することにより高速化を図る。例えば、途中から再生の場合に再生開始時間が指定されて再生を開始するわけであるが、その与えられた再生開始位置と当該ASF形式の動画ファイルの全再生時間と映像符号化を行った際のキーフレーム(参照フレーム、Iフレーム、Iピクチャ)の挿入間隔とから、指定された再生開始位置に最も近いキーフレームを「Simple Index Object」の情報を割り出す。そして、映像については、そのキーフレームから再生を開始する。キーフレームからの再生であるので、最初のフレームは、フレーム内復号化が実施される。音声については、上記キーフレーム周辺で最も再生開始時間に近い音声の再生時間を持つデータを割り出す。キーフレームの周辺に所定の範囲を決め、再生時間と音声の持つ再生時間との差が最小になるようにする。最小値が映像と音声とのずれの許容範囲に収まらない場合には、上記所定の範囲を広げて検索を行い、許容範囲内に収まるようにする。キーフレーム情報を使用することにより、同期のための音声の検索開始位置を絞ることができ、さらに検索範囲を段階的に増加することにより、無駄な検索を行う必要がないという効果も得られる。 A moving image file in the ASF file format has an area called “Simple Index Object”, which contains video key frame information. By using the key frame information, the video and audio are synchronized, and the search method at the time of synchronization is taken into consideration, thereby increasing the speed. For example, in the case of playback from the middle, the playback start time is specified and playback is started, but when the given playback start position and the total playback time of the ASF format video file are encoded. The information of “Simple Index Object” is determined from the key frame (reference frame, I frame, I picture) insertion interval of the key frame closest to the designated reproduction start position. Then, the reproduction of the video starts from the key frame. Since playback is from a key frame, intra-frame decoding is performed on the first frame. For audio, data having an audio reproduction time closest to the reproduction start time around the key frame is determined. A predetermined range is determined around the key frame so that the difference between the playback time and the playback time of the audio is minimized. If the minimum value does not fall within the allowable range of deviation between video and audio, the predetermined range is expanded to perform a search so that it falls within the allowable range. By using the key frame information, it is possible to narrow down the search start position of the voice for synchronization, and further increase the search range step by step, so that there is no need to perform a useless search.
なお、本実施の形態においては、携帯電話機能による着信割り込み時において上述の第1制御部20との並行処理が可能だが、これらの処理に伴うバスへのアドレス/データの割り込み処理については、インターフェイス処理部204が行うものとする。
In the present embodiment, parallel processing with the
プログラムROM23は、ムービー再生モード、カメラモード、動画ファイルの再生、途中再生における映像データと音声データとの同期に関する各処理プログラムを格納する。RAM24は、データ通信処理や、音声通信において必要とされる各種データなどを記憶する。
The
次に、圧縮伸張処理部25は、MPEG−2、−4に対応し、カメラモードにて撮影された静止画/動画を圧縮処理するとともに、ムービー再生モードにおけるデータ通信モードによりダウンロ−ドしたムービーファイルや、カメラモードにおける静止画/動画、SDカードなどのカード媒体331に保存されているASF形式の動画からの映像データの伸張処理する。
Next, the compression / decompression processing unit 25 complies with MPEG-2 and -4, compresses still images / moving images shot in the camera mode, and downloads the movie in the data communication mode in the movie playback mode. Video data is decompressed from a file, a still image / moving image in the camera mode, and an ASF format moving image stored in a
報知ドライバ26は、着信音やアラーム報知音を鳴動せしめるために報知用LED13、第3スピ−カ7Lを動作させる。スイッチ処理部27は、キー入力部8、第1サイドキー90、第2サイドキー91、シャッターキー92からの操作検出に伴う第1制御部20、第2制御部22への制御信号を出カする。
The
なお、カメラレンズ17の後段には、CCD、若しくはCMOS等のイメ−ジセンサと光学ズーム用のステップモータからなる撮像デバイス171と、この撮像デバイスで撮り込まれたアナログ信号をデジタル信号に変換し、イメージデータを生成するためのDSP172とが備えられている。また、本実施の形態におけるイメージセンサーの有効画素領域は4:3のアスペクト比に固定されている。クレイドル用コネクタ32は、クレイドル、すなわち充電台を兼ねた設置台に設置した際に、設置台からの電力で図示しないバッテリを充電するためのものであり、コネクタインターフェース31を介してバスに接続されている。メモリカードスロット330(33)には、SDカードなどの記録媒体331が装着される。
In the subsequent stage of the
ここで、図3は、ASF形式の動画ファイルのデータ構造を示す概念図である。ASF形式の動画ファイルは、先頭が、「Header Object」、次が実際のデータが格納されている「Data Object」である。該「Data Object」は、複数のData Packetから構成されており、各Data Packetは、VideoペイロードとAudioペイロードとから構成されている。最後の「Index Object」がキーフレームなどの情報を含む部分であり、「Simple Index Object」も「Index Object」の1つである。 Here, FIG. 3 is a conceptual diagram showing a data structure of a moving image file in the ASF format. In the ASF format moving image file, the head is “Header Object”, and the next is “Data Object” in which actual data is stored. The “Data Object” is composed of a plurality of Data Packets, and each Data Packet is composed of a Video payload and an Audio payload. The last “Index Object” is a portion including information such as a key frame, and “Simple Index Object” is also one of “Index Objects”.
ここで、図4は、上記「Simple Object」のデータ構造を示す概念図である。「Object ID」は、「Simple Index Object」の識別コードである。また、「Object Size」は、「Simple Index Object」のサイズを示す。「Index Entry Time Interval」は、キーフレームの挿入間隔を示し、「Maximum Packet Count」は、キーフレームが構成される「Data Packet」の最大数を示す。また、「Index Entries Count」は、後に続く「Index Entries」の総数である。そして、「Index Entries」の各要素がキーフレーム情報であり、「Packet Number」は、キーフレームが開始される「Data Packet」の番号であり、「Packet Count」は、いくつの「Data Packet」でキーフレームが構成されているかを示す。 FIG. 4 is a conceptual diagram showing the data structure of the “Simple Object”. “Object ID” is an identification code of “Simple Index Object”. “Object Size” indicates the size of “Simple Index Object”. “Index Entry Time Interval” indicates the key frame insertion interval, and “Maximum Packet Count” indicates the maximum number of “Data Packets” in which the key frame is configured. “Index Entries Count” is the total number of “Index Entries” that follow. Each element of “Index Entries” is key frame information, “Packet Number” is the number of “Data Packet” at which the key frame is started, and “Packet Count” is the number of “Data Packets”. Indicates whether the key frame is configured.
B.実施形態の動作
次に、上述した実施形態の動作について説明する。
B. Operation of Embodiment Next, the operation of the above-described embodiment will be described.
図5は、本実施形態による携帯電話1の動作を説明するためのフローチャートである。まず、ユーザによりASF形式の動画ファイルを読出し、途中からの再生が指示されると(ステップS10)、第2制御部22は、その再生開始位置から「Simple Index Object」の情報に基づいて、キーフレーム情報を取得する(ステップS12)。取得方法は、再生開始位置をキーフレーム挿入間隔である「Simple Index Object」の「Index Entry Time Interval」で割り算することにより、「Index Entries」の何番目の要素であるかを求める。そのキーフレーム情報が、再生開始位置に最も近い映像データのキーフレームの情報となる。
FIG. 5 is a flowchart for explaining the operation of the
次に、検索された映像データとの時間差が生じないタイミングにある音声データを検索する(ステップS14)。ASF形式の動画ファイルでは、図3に示すようなデータ構造を持つので、再生開始時間と最も時間差が小さくなる再生開始のAudioペイロードを求める。 Next, audio data at a timing at which no time difference from the searched video data is generated is searched (step S14). Since the ASF format moving image file has a data structure as shown in FIG. 3, a reproduction start Audio payload having the smallest time difference from the reproduction start time is obtained.
ASF形式の動画ファイルのデータ構造において、VideoペイロードとAudioペイロードとは、それぞれ最初の位置からの経過時間情報を持つ。単位は、msec単位となる。ここで、図6は、音声データの検索の方法を示す概念図である。図6において、細長いブロックは、「Data Object」に相当する。また、矢印100が、先に求めた開始時間に最も近いキーフレームの「Packet Number」の「Data Packet」の位置となる。
In the data structure of the ASF moving image file, the Video payload and the Audio payload each have elapsed time information from the first position. The unit is msec. Here, FIG. 6 is a conceptual diagram showing a method of retrieving voice data. In FIG. 6, the long and narrow block corresponds to “Data Object”. Also, the
この「Data Packet」を中心に再生開始位置に最も近い音声データを含む「Data Packet」を求める。各Audioペイロードは、最初の位置からの経過時間情報を持つので図6のA,Bの所定の範囲内(例えば、前後100のData Packetで合計200個のData Packet)で、「Data Paket」を走査し、その各「Data Packet」に含まれるAudioペイロードから再生開始位置を求め、それが予め設定した許容最低差(例えば、50msec)以下になるか、そうでなければ全走査して最小となる「Data Packet」の位置を求める。その位置、すなわちその「Packet Number」の「Data Packet」から音声データをバッファに転送する。 The “Data Packet” including the audio data closest to the reproduction start position is obtained around this “Data Packet”. Since each Audio payload has elapsed time information from the first position, “Data Packet” is set within a predetermined range of A and B in FIG. 6 (for example, a total of 200 Data Packets with 100 Data Packets before and after). Scan and find the playback start position from the Audio payload included in each “Data Packet”, and it will be less than the preset allowable minimum difference (for example, 50 msec), or otherwise all scans will be minimum The position of “Data Packet” is obtained. The audio data is transferred to the buffer from that position, that is, “Data Packet” of the “Packet Number”.
尚、AB間の走査で再生開始位置の映像データとの差の最小値が1000msec、すなわち1秒以上となってしまった場合には、映像データと音声データの同期が取れたとは言えない場合があるので、さらに範囲を広げて、C,Dの範囲の「Data Packet」も走査し、A〜Dの範囲内で差が最小となるData Packetの位置である「Packet Number」を求めるようにする。このようにすれば、AB間で同期が不十分だった場合もカバーすることができる。 If the minimum value of the difference from the video data at the reproduction start position is 1000 msec, that is, 1 second or more in scanning between AB, it may not be said that the video data and the audio data are synchronized. Therefore, the range is further expanded, and “Data Packet” in the range of C and D is also scanned to obtain “Packet Number” which is the position of the Data Packet where the difference is the smallest within the range of A to D. . In this way, it is possible to cover even when the synchronization between the ABs is insufficient.
また、AB間の範囲の検索で不十分であった場合においてBの範囲で同期の誤差が最小であった場合は、Bにより近いDの方が同期誤差が最小となる可能性が高いので、Dの範囲を先に走査する。この結果、Dの範囲の検索で予め設定した許容最低差(例えば50msec)以下になり、その範囲内の走査のみで検索を終了できる。 In addition, when the search of the range between AB is insufficient, and the synchronization error is the smallest in the range of B, it is more likely that D closer to B has the smallest synchronization error. The range of D is scanned first. As a result, the allowable difference (for example, 50 msec) set in advance in the search of the range D is less than or equal to, and the search can be completed only by scanning within the range.
次に、第2制御部22は、ステップS12で求めた、再生開始位置に最も近い映像データのキーフレームを示すキーフレーム情報に従って、SDカードなどのカード媒体331にアクセスし、該当キーフレームの「Index Entry」である「Packet Number」と「Packet Count」を取得し、映像データについては、その「Packet Number」の「Data Packet」のデータにアクセスして表示バッファ62へ転送する一方、音声データについては、その音声データが含まれるAudioペイロードを含む「Data Packet」を、例えばRAM24に書き込む(ステップS16)。
Next, the second control unit 22 accesses the
次に、圧縮・伸張処理部25は、表示バッファ62の映像データからデコードを開始するとともに、音声処理部105は、RAM24に書き込まれた音声データをデコードして、映像と音声とをそれぞれの再生ブロックである表示部6とスピーカ7R,7Lで再生する(ステップS18)。
Next, the compression / decompression processing unit 25 starts decoding from the video data in the
上述した実施形態によれば、動画ファイルの途中からの再生が指示されると、再生開始位置と動画ファイルを全て再生した場合の全再生時間と映像符号化の際のキーフレーム挿入間隔に基づいて、再生開始位置に最も近いキーフレームを取得し、このキーフレームの情報に基づいて、該再生開始位置に最も近い音声データの再生位置を音声再生開始位置として取得するようにしたので、ASF形式の動画ファイルの再生、一時停止、再開などを効率的に行うことができ、かつ映像と音声とを同期させることができる。 According to the above-described embodiment, when playback from the middle of a video file is instructed, based on the playback start position, the total playback time when all video files are played back, and the key frame insertion interval during video encoding Since the key frame closest to the reproduction start position is obtained, and the reproduction position of the audio data closest to the reproduction start position is obtained as the audio reproduction start position based on the information of the key frame, the ASF format It is possible to efficiently reproduce, pause, resume, etc. a moving image file and to synchronize video and audio.
なお、上述した実施形態では、動画再生装置として携帯電話について説明したが、これに限らず、携帯情報端末(PDA)や、動画や静止画再生に特化した動画再生装置であってもよい。 In the above-described embodiment, the mobile phone has been described as the video playback device. However, the mobile phone is not limited to this, and may be a personal digital assistant (PDA) or a video playback device specialized for video and still image playback.
1 携帯電話
2 蓋部
3 本体部
5 第1スピーカ
6 表示部(表示手段)
7R 第2スピーカ
7L 第3スピーカ
8 キー入力部(再生指示手段)
10 マイク
11 メインアンテナ
12 第2ヒンジ部
13 報知用LED
16 内蔵アンテナ
17 撮像レンズ
18 受信信号処理部
19 通信信号処理部
20 第1制御部
22 第2制御部(キーフレーム取得手段、音声データ取得手段、再生制御手段)
23 プログラムROM
24 RAM
25 圧縮・伸張処理部
26 報知ドライバ
27 スイッチ処理部
30 音声出力系ドライバ
31 スイッチ
61 表示ドライバ
62 表示バッファ
90 第1サイドキー
91 第2サイドキー
92 シャッターキー
100 第1ヒンジ部
201 スイッチ回路
202 通信データ処理部
203 システムROM
205 音声処理部
206 スイッチ回路
207 オーデイオアンプ
330 メモリカードスロット
331 カード媒体
DESCRIPTION OF
10
16 built-in
23 Program ROM
24 RAM
25 Compression /
205 Audio Processing Unit 206 Switch Circuit 207
Claims (5)
前記動画ファイルを途中から再生するよう指示する再生指示手段と、
この再生指示手段により再生が指示されると、複数の映像データから途中再生が指示された再生開始位置に最も近い映像データのキーフレームを取得するキーフレーム取得手段と、
このキーフレーム取得手段によって取得されたキーフレーム周辺に最も近い音声データを前記複数の音声データから取得する音声データ取得手段と、
前記キーフレーム取得手段によって取得されたキーフレームから映像データの復号化を開始するとともに、前記音声データ取得手段により取得された音声データの復号化を開始して再生する再生制御手段と
を具備することを特徴とする動画再生装置。 A video playback device for playing back a video file consisting of a plurality of sets of video data and audio data,
Replay instruction means for instructing to replay the video file from the middle;
When playback is instructed by the playback instruction means, key frame acquisition means for acquiring a key frame of video data closest to the playback start position for which halfway playback is instructed from a plurality of video data;
Audio data acquisition means for acquiring audio data closest to the periphery of the key frame acquired by the key frame acquisition means from the plurality of audio data;
Playback control means for starting decoding of video data from the key frame acquired by the key frame acquisition means and starting decoding of the audio data acquired by the audio data acquisition means and playing back A video playback device characterized by the above.
前記動画ファイルを途中から再生するよう指示する再生指示ステップと、
この再生指示ステップにて再生が指示されると、複数の映像データから途中再生が指示された再生開始位置に最も近い映像データのキーフレームを取得するキーフレーム取得ステップと、
このキーフレーム取得ステップにて取得されたキーフレーム周辺に最も近い音声データを前記複数の音声データから取得する音声データ取得ステップと、
前記キーフレーム取得ステップにて取得されたキーフレームから映像データの復号化を開始するとともに、前記音声データ取得ステップにより取得された音声データの復号化を開始して再生する再生制御ステップと
からなることを特徴とする再生制御方法。 A video playback method for playing back a video file consisting of a plurality of sets of video data and audio data,
A playback instruction step for instructing to play the video file from the middle;
When playback is instructed in this playback instruction step, a key frame acquisition step of acquiring a key frame of video data closest to the playback start position for which halfway playback is instructed from a plurality of video data;
An audio data acquisition step for acquiring audio data closest to the periphery of the key frame acquired in the key frame acquisition step from the plurality of audio data;
A decoding control step of starting decoding of video data from the key frame acquired in the key frame acquisition step and starting decoding of the audio data acquired in the audio data acquisition step and playing back A reproduction control method characterized by the above.
前記動画ファイルを途中から再生するよう指示する再生指示ステップと、
この再生指示ステップにて再生が指示されると、複数の映像データから途中再生が指示された再生開始位置に最も近い映像データのキーフレームを取得するキーフレーム取得ステップと、
このキーフレーム取得ステップにて取得されたキーフレーム周辺に最も近い音声データを前記複数の音声データから取得する音声データ取得ステップと、
前記キーフレーム取得ステップにて取得されたキーフレームから映像データの復号化を開始するとともに、前記音声データ取得ステップにより取得された音声データの復号化を開始して再生する再生制御ステップと
をコンピュータに実行させることを特徴とする動画再生プログラム。 A video playback program for playing back a video file consisting of multiple sets of video data and audio data,
A playback instruction step for instructing to play the video file from the middle;
When playback is instructed in this playback instruction step, a key frame acquisition step of acquiring a key frame of video data closest to the playback start position for which halfway playback is instructed from a plurality of video data;
An audio data acquisition step for acquiring audio data closest to the periphery of the key frame acquired in the key frame acquisition step from the plurality of audio data;
A reproduction control step of starting decoding of video data from the key frame acquired in the key frame acquisition step and starting decoding of the audio data acquired in the audio data acquisition step and playing back to the computer. A video playback program characterized by being executed.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2004328659A JP2006140777A (en) | 2004-11-12 | 2004-11-12 | Moving picture reproducing apparatus, moving picture reproducing method, and moving picture reproducing program |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2004328659A JP2006140777A (en) | 2004-11-12 | 2004-11-12 | Moving picture reproducing apparatus, moving picture reproducing method, and moving picture reproducing program |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2006140777A true JP2006140777A (en) | 2006-06-01 |
Family
ID=36621263
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2004328659A Pending JP2006140777A (en) | 2004-11-12 | 2004-11-12 | Moving picture reproducing apparatus, moving picture reproducing method, and moving picture reproducing program |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2006140777A (en) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108551358A (en) * | 2018-03-16 | 2018-09-18 | 恒玄科技(上海)有限公司 | A kind of method of adjustment of bluetooth headset difference model subaudio frequency data |
-
2004
- 2004-11-12 JP JP2004328659A patent/JP2006140777A/en active Pending
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108551358A (en) * | 2018-03-16 | 2018-09-18 | 恒玄科技(上海)有限公司 | A kind of method of adjustment of bluetooth headset difference model subaudio frequency data |
CN108551358B (en) * | 2018-03-16 | 2021-01-19 | 恒玄科技(上海)股份有限公司 | Method for adjusting audio data of Bluetooth headset under different models |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR100606060B1 (en) | Method and device for outputting data of wireless terminal to external device | |
JP4282201B2 (en) | Encoded data recording device | |
JP4137034B2 (en) | Portable information processing apparatus, slide display activation method, and slide display activation program | |
KR100605935B1 (en) | Method for taking moving picture | |
JP4706278B2 (en) | Information processing system, playback terminal device and playback method, information processing device and method, and program | |
KR20100041108A (en) | Moving picture continuous capturing method using udta information and portable device supporting the same | |
JP2007006148A (en) | Distribution device, terminal device, and media content receiving method | |
WO2009096558A1 (en) | Data processing device as well as a method and electronic apparatus for data playback processing | |
JP4869574B2 (en) | Portable information processing apparatus, information presentation method, and information presentation program | |
JP2006140777A (en) | Moving picture reproducing apparatus, moving picture reproducing method, and moving picture reproducing program | |
JP2010130112A (en) | Editing apparatus, editing method, and image pickup apparatus | |
JP5027553B2 (en) | Electronic device and recording method | |
JP4795187B2 (en) | Still image transmission device, still image reception device, still image transmission / reception device, still image transmission method, still image reception method, still image transmission / reception method, camera device, and portable terminal device | |
JP2006319745A (en) | Recorder, media content input/output system, and media content recording method | |
JP4757468B2 (en) | Portable information processing apparatus, new arrival information presentation method, and new arrival information presentation program | |
JP2006140774A (en) | Moving picture display apparatus, information display method, and information display program | |
JPH0951516A (en) | Device for connection video camera and computer and video conference system using same | |
JP3888182B2 (en) | Recording apparatus and method, display apparatus and method, and program | |
JP4513474B2 (en) | Portable electronic devices | |
JP2008092291A (en) | Still image transmitter, still image receiver, still image transmitter/receiver, still image transmission method, still image reception method, still image transmission/reception method, camera device and portable terminal device | |
JP2004260456A (en) | Image pickup device | |
JP2006319741A (en) | Recorder, data conversion method, data conversion program and media content input/output system | |
KR20070008863A (en) | Mobile phone be able to capture a static picture to use dual chip during displaying a moving picture and method for capturing a static picture to use dual chip during displaying a moving picture | |
JP2008301197A (en) | Reproduction device and reproduction method | |
JP2005277996A (en) | Broadcast receiving device and video image recording/reproducing apparatus |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20070801 |
|
A871 | Explanation of circumstances concerning accelerated examination |
Free format text: JAPANESE INTERMEDIATE CODE: A871 Effective date: 20071211 |
|
A975 | Report on accelerated examination |
Free format text: JAPANESE INTERMEDIATE CODE: A971005 Effective date: 20071217 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20080415 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20080513 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20081212 |