JP2005204003A - Continuous media data fast reproduction method, composite media data fast reproduction method, multichannel continuous media data fast reproduction method, video data fast reproduction method, continuous media data fast reproducing device, composite media data fast reproducing device, multichannel continuous media data fast reproducing device, video data fast reproducing device, program, and recording medium - Google Patents
Continuous media data fast reproduction method, composite media data fast reproduction method, multichannel continuous media data fast reproduction method, video data fast reproduction method, continuous media data fast reproducing device, composite media data fast reproducing device, multichannel continuous media data fast reproducing device, video data fast reproducing device, program, and recording medium Download PDFInfo
- Publication number
- JP2005204003A JP2005204003A JP2004007558A JP2004007558A JP2005204003A JP 2005204003 A JP2005204003 A JP 2005204003A JP 2004007558 A JP2004007558 A JP 2004007558A JP 2004007558 A JP2004007558 A JP 2004007558A JP 2005204003 A JP2005204003 A JP 2005204003A
- Authority
- JP
- Japan
- Prior art keywords
- data
- continuous media
- change
- media data
- amount
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Landscapes
- Television Signal Processing For Recording (AREA)
Abstract
Description
本発明は、連続メディアデータを高速再生する技術に係り、特に、利用者が短時間で連続メディアデータの内容を把握できるようにする技術に関する。 The present invention relates to a technique for reproducing continuous media data at high speed, and more particularly to a technique for enabling a user to grasp the contents of continuous media data in a short time.
映像は画像と音とからなる複合メディアであり、画像は動画と静止画とに分類される。本来、音は音声、音楽、音響等を包含するものであるが、ここでは、音声を音の意味を含むものとして使用する。特に、連続メディアに対する方法を説明するため、映像は動画と音声とからなるものとして説明する。 Video is a composite media composed of images and sounds, and images are classified into moving images and still images. Originally, sound includes sound, music, sound and the like, but here, sound is used as including the meaning of sound. In particular, in order to explain the method for continuous media, the video will be described as consisting of video and audio.
連続メディアの代表例として音声があり、通常のテープレコーダ等の早送りでは、再生音の周波数が高くなり、2倍程度を限界にそれ以上の高速再生では内容を把握することが困難となる。これを改善するために、フレーム単位に分割し等間隔や規則的に間引いたり、ピッチ周期を検出しピッチ区間波形単位で規則的に間引いたりすることにより、原音と同等の周波数で音を再生し、高速再生を可能とする手法が提案されている(例えば、特許文献1、2参照。)。
Audio is a typical example of continuous media. The frequency of the reproduced sound is high when fast-forwarding with a normal tape recorder or the like, and it is difficult to grasp the content at high-speed reproduction beyond the limit of about twice. In order to improve this, sound is played back at the same frequency as the original sound by dividing it into frame units and thinning them out at regular intervals and regularly, or by detecting the pitch period and regularly thinning out pitch unit waveform units. A method that enables high-speed reproduction has been proposed (see, for example,
また、音声特有の情報を用い、有音区間と無音区間とを検出し無音区間削除し、有音区間のみを再生する方法(例えば、特許文献1参照。)や、検出された有音区間を更に母音区間、子音区間、母音区間と子音区間との間の遷移区間、及び雑音区間に分類し圧縮の度合いを変え音声の劣化を少なくする装置(例えば、特許文献3参照。)が提案されている。 In addition, using sound-specific information, a method of detecting a voiced section and a silent section, deleting the silent section, and reproducing only the voiced section (for example, refer to Patent Document 1), or detecting a detected voiced section. Furthermore, an apparatus (for example, see Patent Document 3) that classifies into a vowel section, a consonant section, a transition section between a vowel section and a consonant section, and a noise section to change the degree of compression and reduce speech deterioration has been proposed. Yes.
しかし、これらの手法を用いても、再生速度は2〜3倍程度が限界であり、これ以上の速度では内容を把握することが困難になる。また、音声特有の情報を用いることは他の連続メディアには適用できないため、メディア毎に処理を分ける必要があり、複合メディア(例えば、音声と動画の複合である映像)の高速再生に適用する際等にも、処理が複雑化する欠点を伴っている。 However, even if these methods are used, the reproduction speed is limited to about 2 to 3 times, and it becomes difficult to grasp the contents at a speed higher than this. In addition, using audio-specific information is not applicable to other continuous media, so it is necessary to divide the processing for each media, and it applies to high-speed playback of composite media (for example, video that is a composite of audio and video) In some cases, the processing is complicated.
他の連続メディアの例としては動画があり、通常のビデオレコーダ等の早送りのように再生周波数を上げたり、フレーム単位で等間隔や規則的に間引いたり、縮退させたりすることにより、高速再生を可能とする手法が提案されている。しかし、音声同様、ある速度以上の高速再生では内容を把握することが困難となる。 Another example of continuous media is moving images, which can be played at high speeds by increasing the playback frequency like normal video recorders, fast-forwarding, etc. A possible approach has been proposed. However, as with voice, it is difficult to grasp the content at high speed playback above a certain speed.
また、動画からある物理量(輝度変化量やカット点等)を抽出し、ある条件を満たす部分を取り出して短縮する手法が提案されている(例えば、特許文献4、5参照。)。しかし、動画特有の情報を適用しているため、音声等の他のメディアに適用することができない。 In addition, a method has been proposed in which a certain physical quantity (brightness change amount, cut point, etc.) is extracted from a moving image, and a part that satisfies a certain condition is extracted and shortened (see, for example, Patent Documents 4 and 5). However, since information specific to moving images is applied, it cannot be applied to other media such as audio.
その他、動画と音声との組み合わせによる様々な高速再生、短縮再生技術として、前述の組合せ、もしくは、その拡張した手法が提案されている(例えば、特許文献5、6、7参照。)。しかし、これらも前述の手法と同様の欠点があったり、動画に主眼を置き、音声を部分的にしか再生しないために、全体の流れの把握が困難であったりする。
前記の従来技術は、全体もしくは部分区間毎に均一に高速再生する方式であるための限界を持ち、より短縮するために、各メディア特有の処理を加えることで汎用性をなくす結果となっている。 The above prior art has a limit because it is a method of reproducing at high speed uniformly in whole or in a partial section, and in order to shorten it further, it results in eliminating versatility by adding processing specific to each medium. .
本発明は、以上のような従来技術の実情に鑑みてなされたもので、その目的は、使用者が短時間で内容を把握できるように了解性をできるだけ保持したまま、より高速な再生を可能にすると共に、音声や動画に特化せず、他の連続メディアや複合メディアにも適用できる連続メディア高速再生技術を提供することにある。 The present invention has been made in view of the above-described prior art, and the purpose of the present invention is to enable higher-speed playback while maintaining as much intelligibility as possible so that the user can grasp the contents in a short time. In addition, it is intended to provide a continuous media high-speed playback technology that can be applied to other continuous media and composite media without specializing in audio and video.
そこで前記課題を解決するために、請求項1に記載の発明は、連続メディアデータを短縮して再生する連続メディアデータ高速再生方法であって、連続メディアデータをフレーム区間に分割し、各フレーム区間の特徴パラメータの変化量を計算する過程と、特徴パラメータの変化量の大きなフレームのみを連結してデータを再構成する過程と、連結された再構成データを再生する過程と、を有することを特徴とする。
Accordingly, in order to solve the above problem, the invention according to
また、請求項2に記載の発明は、請求項1において、前記連続メディアデータが音声データまたは動画データであることを特徴とする。 According to a second aspect of the present invention, in the first aspect, the continuous media data is audio data or moving image data.
また、請求項3に記載の発明は、複数の連続メディアデータからなる複合メディアデータを短縮して再生する複合メディアデータ高速再生方法であって、各連続メディアデータをフレーム区間に分割し、各フレーム区間の特徴パラメータの変化量を計算する過程と、各連続メディアデータの特徴パラメータの変化量から、統合した特徴パラメータの変化量を計算する過程と、統合した特徴パラメータの変化量の大きなフレームのみを連結して各連続メディアデータごとに再構成データを生成する過程と、この再構成データを再生する過程と、を有することを特徴とする。 According to a third aspect of the present invention, there is provided a composite media data high-speed playback method for shortening and playing back composite media data comprising a plurality of continuous media data, wherein each continuous media data is divided into frame sections. The process of calculating the change amount of the feature parameter of the section, the process of calculating the change amount of the integrated feature parameter from the change amount of the feature parameter of each continuous media data, and only the frame with the large change amount of the integrated feature parameter It has a process of generating reconstructed data for each piece of continuous media data and a process of reproducing the reconstructed data.
また、請求項4に記載の発明は、多チャンネルの連続メディアデータを短縮して再生する多チャンネル連続メディアデータ高速再生方法であって、各チャンネルの連続メディアデータをフレーム区間に分割し、各フレーム区間の特徴パラメータの変化量を計算する過程と、各チャンネルの連続メディアデータの特徴パラメータの変化量から、統合した特徴パラメータの変化量を計算する過程と、統合した特徴パラメータの変化量の大きなフレームのみを連結して各チャンネルごとに再構成データを生成する過程と、この再構成データを再生する過程と、を有することを特徴とする。 According to a fourth aspect of the present invention, there is provided a multi-channel continuous media data high-speed reproduction method for reproducing multi-channel continuous media data by shortening the multi-channel continuous media data. The process of calculating the amount of change of the feature parameter of the section, the process of calculating the amount of change of the integrated feature parameter from the amount of change of the feature parameter of the continuous media data of each channel, and the frame with the large amount of change of the integrated feature parameter And a process of generating reconstruction data for each channel and a process of reproducing the reconstruction data.
また、請求項5に記載の発明は、動画データと音声データとからなる映像データを短縮して再生する映像データ高速再生方法であって、映像データを動画データと音声データとに分割する過程と、動画データをフレーム区間に分割し、各フレーム区間の特徴パラメータの変化量を計算する過程と、音声データをフレーム区間に分割し、各フレーム区間の特徴パラメータの変化量を計算する過程と、動画データの特徴パラメータの変化量と音声データの特徴パラメータの変化量とから映像データの特徴パラメータの変化量を計算する過程と、映像データの特徴パラメータの変化量の大きい動画データのフレームのみを連結して再構成動画データを生成する過程と、映像データの特徴パラメータの変化量の大きい音声データのフレームのみを連結して再構成音声データを生成する過程と、再構成動画データと再構成音声データとを合成し、再構成映像データを生成する過程と、生成した再構成映像データを再生する過程と、を有することを特徴とする。 According to a fifth aspect of the present invention, there is provided a video data high-speed reproduction method for reproducing video data composed of video data and audio data by shortening the video data, wherein the video data is divided into video data and audio data. Dividing the moving image data into frame sections and calculating the amount of change in the feature parameters in each frame section; dividing the audio data into frame sections and calculating the amount of change in the feature parameters in each frame section; The process of calculating the change amount of the feature parameter of the video data from the change amount of the feature parameter of the data and the change amount of the feature parameter of the audio data, and only the frame of the moving image data having the large change amount of the feature parameter of the video data is connected. The process of generating reconstructed video data and connecting only frames of audio data with large changes in video data feature parameters Generating reconstructed audio data, synthesizing the reconstructed video data and reconstructed audio data to generate reconstructed video data, and reproducing the generated reconstructed video data. It is characterized by.
また、請求項6に記載の発明は、連続メディアデータを短縮して再生する連続メディアデータ高速再生装置であって、連続メディアデータをフレーム区間に分割し、各フレーム区間の特徴パラメータの変化量を計算する手段と、特徴パラメータの変化量の大きなフレームのみを連結してデータを再構成する手段と、連結された再構成データを再生する手段と、を有することを特徴とする。 According to a sixth aspect of the present invention, there is provided a continuous media data high-speed playback device that shortens and plays back continuous media data. The continuous media data is divided into frame sections, and the amount of change in the characteristic parameter of each frame section is determined. It is characterized by comprising means for calculating, means for reconstructing data by concatenating only frames with a large amount of change in characteristic parameters, and means for reconstructing the concatenated reconstructed data.
また、請求項7に記載の発明は、請求項6において、前記連続メディアデータが音声データまたは動画データであることを特徴とする。 According to a seventh aspect of the present invention, in the sixth aspect, the continuous media data is audio data or moving image data.
また、請求項8に記載の発明は、複数の連続メディアデータからなる複合メディアデータを短縮して再生する複合メディアデータ高速再生装置であって、各連続メディアデータをフレーム区間に分割し、各フレーム区間の特徴パラメータの変化量を計算する手段と、各連続メディアデータの特徴パラメータの変化量から、統合した特徴パラメータの変化量を計算する手段と、統合した特徴パラメータの変化量の大きなフレームのみを連結して各連続メディアデータごとに再構成データを生成する手段と、この再構成データを再生する手段と、を有することを特徴とする。 The invention according to claim 8 is a composite media data high-speed playback device that shortens and plays back composite media data composed of a plurality of continuous media data, and divides each continuous media data into frame sections. A means for calculating the change amount of the feature parameter of the section, a means for calculating the change amount of the integrated feature parameter from the change amount of the feature parameter of each continuous media data, and only a frame having a large change amount of the integrated feature parameter. It is characterized by having means for connecting and generating reconstructed data for each continuous media data and means for reproducing the reconstructed data.
また、請求項9に記載の発明は、多チャンネルの連続メディアデータを短縮して再生する多チャンネル連続メディアデータ高速再生装置であって、各チャンネルの連続メディアデータをフレーム区間に分割し、各フレーム区間の特徴パラメータの変化量を計算する手段と、各チャンネルの連続メディアデータの特徴パラメータの変化量から、統合した特徴パラメータの変化量を計算する手段と、統合した特徴パラメータの変化量の大きなフレームのみを連結して各チャンネルごとに再構成データを生成する手段と、この再構成データを再生する手段と、を有することを特徴とする。 According to a ninth aspect of the present invention, there is provided a multi-channel continuous media data high-speed playback device for reproducing multi-channel continuous media data by shortening the multi-channel continuous media data. Means for calculating the amount of change of the feature parameter of the section, means for calculating the amount of change of the integrated feature parameter from the amount of change of the feature parameter of the continuous media data of each channel, and a frame with a large amount of change of the integrated feature parameter And a means for generating reconstructed data for each channel and a means for reproducing the reconstructed data.
また、請求項10に記載の発明は、動画データと音声データとからなる映像データを短縮して再生する映像データ高速再生装置であって、映像データを動画データと音声データとに分割する手段と、動画データをフレーム区間に分割し、各フレーム区間の特徴パラメータの変化量を計算する手段と、音声データをフレーム区間に分割し、各フレーム区間の特徴パラメータの変化量を計算する手段と、動画データの特徴パラメータの変化量と音声データの特徴パラメータの変化量とから映像データの特徴パラメータの変化量を計算する手段と、映像データの特徴パラメータの変化量の大きい動画データのフレームのみを連結して再構成動画データを生成する手段と、映像データの特徴パラメータの変化量の大きい音声データのフレームのみを連結して再構成音声データを生成する手段と、再構成動画データと再構成音声データとを合成し、再構成映像データを生成する手段と、生成した再構成映像データを再生する手段と、を有することを特徴とする。 According to a tenth aspect of the present invention, there is provided a video data high-speed playback device that shortens and plays back video data composed of video data and audio data, and means for dividing the video data into video data and audio data; Means for dividing the moving image data into frame sections and calculating the amount of change in the feature parameter in each frame section; means for dividing the audio data into frame sections and calculating the amount of change in the feature parameter in each frame section; A means for calculating the amount of change of the feature parameter of the video data from the amount of change of the feature parameter of the data and the amount of change of the feature parameter of the audio data is connected to only the frame of the video data having a large amount of change of the feature parameter of the video data. Only the frame of the audio data having a large amount of change in the feature parameter of the video data is connected. Generating reconstructed audio data, synthesizing the reconstructed video data and reconstructed audio data, generating reconstructed video data, and reproducing the generated reconstructed video data It is characterized by that.
また、請求項11に記載の発明は、プログラムであって上記の請求項1〜10のいずれか1項に記載の方法または装置を、コンピュータプログラムで記載してそれを実行可能にしたことを特徴とする。
The invention described in claim 11 is a program, characterized in that the method or apparatus according to any one of
また、請求項12に記載の発明は、記録媒体であって上記の請求項1〜10のいずれか1項に記載の方法または装置を、コンピュータで実行可能に記載したプログラムを記録したことを特徴とする。
The invention described in claim 12 is a recording medium in which a program which records the method or apparatus described in any one of
なお、特許請求の範囲にいう、特徴パラメータの変化量の大きなフレームは、閾値を設定しこの閾値より大きいものを採用する等の方法により決定することができるがこれに限定されるものではなく、データの了解性の高い部分のみを抽出できるものあればよい。 It should be noted that a frame with a large amount of change in the characteristic parameter referred to in the claims can be determined by a method such as setting a threshold and adopting a larger one than this threshold, but is not limited thereto. What can extract only the part with high intelligibility of data is sufficient.
また、特許請求の範囲にいう、多チャンネルの連続メディアデータとは、例えば、2カ国語音声、多地点音声、多地点動画などの同じ種類のメディアの多重化を意味するものである。 The multi-channel continuous media data referred to in the claims means multiplexing of the same type of media such as bilingual audio, multi-point audio, and multi-point video.
本発明では、全体、もしくは部分区間毎に均一に線形的に圧縮し高速再生するのではなく、了解性の高い部分のみを抽出し非線形に圧縮することにより、従来技術より圧縮率が高く、再生時間を短縮した高速な再生が可能になる。 In the present invention, the compression rate is higher than that of the prior art by extracting only highly intelligible parts and compressing them non-linearly, instead of compressing them uniformly and linearly for the whole or partial sections and performing non-linear compression. High-speed playback with reduced time becomes possible.
了解性の高い部分の計算方法は、データを、データの内容の特徴を表現するような時系列パラメータに変換し、そのパラメータの大きい部分が、特徴をよく表わしていることに相当し、了解性が高い部分であるとみることができる。そのパラメータの変化量の大きい部分に対応する部分データ(フレーム)を連結して再生することにより、データの内容の特徴をできるだけ残したまま、了解性の高い高速再生を可能にする。 The method of calculating the highly intelligible part corresponds to the fact that the data is converted into time-series parameters that express the characteristics of the data content, and the large part of the parameters expresses the characteristics well. Can be seen as a high part. By concatenating and reproducing partial data (frames) corresponding to a part with a large change amount of the parameter, it is possible to perform high-speed reproduction with high intelligibility while retaining the characteristics of the data contents as much as possible.
本発明によれば、時間軸に対し非線形な高速再生が可能となり、線形的な高速再生よりメディアの内容の特徴を多く残すため了解性が高く、かつ、圧縮率が高いという利点がある。 According to the present invention, it is possible to perform high-speed playback that is non-linear with respect to the time axis, and there are advantages in that the intelligibility is high and the compression rate is high because many features of the contents of the media are left as compared with linear high-speed playback.
また、本発明で用いている特徴パラメータの変化量という指標は汎用的であり、どんな連続メディアのパラメータにも適用できる点、パラメータの選択により様々な特徴を優先した高速再生が可能となる点、異なるメデイアでも統一的に扱える点、多チャンネルのメディアを統合した高速再生が可能となる点などの利点がある。 In addition, the feature parameter change amount used in the present invention is general-purpose and can be applied to any continuous media parameter, and high-speed playback giving priority to various features by selecting parameters is possible. There are advantages such as being able to handle different media in a unified manner and enabling high-speed playback that integrates multi-channel media.
特に、連続メディアとして音声に適用した場合、従来の線形的な高速再生より了解性が高く、圧縮率も高い高遠再生が可能である。了解性を保つ圧縮率の上限は、音声の内容によって異なるが、一般的に、従来の線形的な高速再生では2〜3倍程度であったのに対し、本発明では5倍程度の高速再生が可能である。 In particular, when applied to audio as continuous media, high-distance reproduction with higher intelligibility and higher compression rate than conventional linear high-speed reproduction is possible. The upper limit of the compression rate that maintains intelligibility varies depending on the content of the audio, but in general, it was about 2 to 3 times in the conventional linear high speed playback, but in the present invention, it is about 5 times high speed playback. Is possible.
また、複合メディアである映像に適用した場合、動画と音声の両方の特徴を残しながら、同期した高速再生が可能である。 In addition, when applied to video that is a composite media, synchronized high-speed playback is possible while retaining both video and audio features.
本発明の実施の形態について図面を用いて説明する。 Embodiments of the present invention will be described with reference to the drawings.
(第1実施形態)
図1は本発明の連続メディア高速再生装置の一例を示すブロック構成図である。図1示すように、連続メディア高速再生装置は、連続メディア入力部1と変化量パラメータ抽出部2と変化量パラメータ解析・再生フレーム選択部3と再生速度指示部4と連続メディア再構成部5と連続メディア出力部6とから構成される。なお、音声高速再生装置は、上述の装置において連続メディアとして音声メディアを適用した場合のものである。
(First embodiment)
FIG. 1 is a block diagram showing an example of a continuous media high-speed playback device of the present invention. As shown in FIG. 1, the continuous media high-speed playback apparatus includes a continuous
連続メディア入力部1と変化量パラメータ抽出部2とで構成される部分は、連続メディアデータをフレーム区間に分割し、それぞれのフレーム区間の特徴パラメータの変化量を計算する手段に相当する。
The portion constituted by the continuous
変化量パラメータ解析・再生フレーム選択部3と再生速度指示部4と連続メディア再構成部5とで構成される部分は、変化量の大きなフレームのみを連結する手段に相当する。
The part constituted by the change amount parameter analysis / playback
連続メディア出力部6は、連結された再構成データを再生する手段に相当する。 The continuous media output unit 6 corresponds to means for reproducing the connected reconstructed data.
連続メディア入力部1は、入力された連続メディアデータをバッファに読み込んで、変化量パラメータ抽出部2に送る。例えば、連続メディア入力部1の入力は、入力されるデータがアナログデータである場合にはこれをデジタルデータに変換しながら読み込んでもよいし、直接デジタルデータとして、ファイル形式の連続メディアデータを読み込んでもよいし、メモリに蓄積された連続メディアデータを読み込んでもよい。
The continuous
読み込むデータ量は、全体を一括で読み込んでもよいし、一定単位の量を周期的に読み込んでもよいし、動的に任意の量を読み込んでもよい。 As for the amount of data to be read, the entire data may be read at once, a fixed amount of data may be read periodically, or an arbitrary amount may be dynamically read.
また必要に応じて、バッファに読み込む前、もしくは、バッファから変化量パラメータ抽出部2へ出力する時に、入力された連続メディアのデジタルデータを変化量パラメータ抽出部2に合わせてフォーマット変換する処理を加えてもよい。
In addition, if necessary, before the data is read into the buffer or when it is output from the buffer to the change amount
また、読み込んだバッファから変化量パラメータ抽出部2へ出力するデータ量は、連続メディアデータの全体を一括で渡してもよいし、一定単位の量に分割して周期的に渡してもよいし、動的に任意の量を逐次渡してもよい。出力するデータ量は、読み込むデータ量と同じ量でもよいし、異なってもよい(異なる場合は、連続メディア入力部1でバッファリングすることになる。)。
The amount of data to be output from the read buffer to the change amount
入力される連続メディアデータが、変化量パラメータ抽出部2が必要とするフォーマットであり、データを全て変化量パラメータ抽出部2に一括で渡す等する場合には、連続メディア入力部1の機能を変化量パラメータ抽出部2を含めた構成にすることも可能である。
If the input continuous media data is in the format required by the variation
変化量パラメータ抽出部2は、連続メディア入力部1からの連続メディアデータを一定周期の小区間(フレーム区間)に分割し、それぞれのフレーム区間の代表となる特徴パラメータの変化量を計算する。例えば連続メディアデータから一旦フレーム区間の代表となる特徴パラメータを計算した後、その特徴パラメータの時系列から変化量を計算してもよいし、連続メディアデータから直接フレーム区間の代表となる特徴パラメータの変化量を計算してもよい。
The change amount
フレーム区間の代表となる特徴パラメータや特徴パラメータの変化量の計算には、フレーム区間内のデータのみから計算してもよいし、フレーム区間外のデータを含めて計算してもよい。 The calculation of the feature parameter representing the frame section and the amount of change of the feature parameter may be calculated from only the data in the frame section, or may be calculated including data outside the frame section.
特徴パラメータは、スカラーでもよいし、2次元以上のベクトルでもよい。特徴パラメータの変化量は計算するフレームの特徴パラメータと前フレームもしくは後フレームの特徴パラメータとの2値の距離(数学でいう距離の公理を満たす距離関数で定義できるもの。例えば、マンハッタン距離、ユークリッド距離、べき乗距離、チェビシェフ距離、マハラノビス距離等を用いることができる。)でもよいし、計算するフレームの前フレームの特徴パラメータと後フレームの特徴パラメータとの2値の距離の2分の1でもよいし、計算するフレームの前後複数フレームを含めた特徴パラメータn値から距離等を用いて計算される値でもよい。 The feature parameter may be a scalar or a vector of two or more dimensions. The change amount of the feature parameter is a binary distance between the feature parameter of the frame to be calculated and the feature parameter of the previous frame or the subsequent frame (which can be defined by a distance function that satisfies the mathematical distance axiom. For example, Manhattan distance, Euclidean distance , Power distance, Chebyshev distance, Mahalanobis distance, etc. may be used.) Or may be a half of the binary distance between the feature parameter of the previous frame and the feature parameter of the subsequent frame of the frame to be calculated. A value calculated using a distance or the like from the characteristic parameter n value including a plurality of frames before and after the frame to be calculated may be used.
再生速度指示部4は、高速再生する時の再生速度を変化量パラメータ解析・再生フレーム選択部3に指示する。そして、
The reproduction speed instruction unit 4 instructs the change amount parameter analysis / reproduction
により変化量パラメータ解析・再生フレーム選択部3で選択する再生フレーム数を計算する。
To calculate the number of playback frames to be selected by the change amount parameter analysis / playback
また、例えば、一括で連続メディアデータを処理する場合に、再生速度の代わりに再生時間を指示してもよい。このときは、 Further, for example, when continuous media data is processed at once, a playback time may be indicated instead of the playback speed. At this time,
から再生フレーム数を計算することができる。 From this, the number of playback frames can be calculated.
変化量パラメータ解析・再生フレーム選択部3は、変化量パラメータ抽出部2で計算した特徴パラメータの変化量の大きい方から、再生速度指示部4から指示された再生フレーム数だけ選択する。
The variation parameter analysis / reproduction
連続メディア再構成部5は、変化量パラメータ解析・再生フレーム選択部3で選択された再生フレーム数のフレームに対応する連続メディアデータのフレーム区間データを順序関係を維持しながら連結し再構成する。
The continuous
例えば、連結する際に、連結する前後のデータの不連続性を軽減するため連結する前後のデータに平滑化処理を加えてもよい。対応する連続メディアデータは、連続メディア入力部1から変化量パラメータ抽出部2、変化量パラメータ解析・再生フレーム選択部3を経由して受け取ってもよいし、連続メディア入力部1から直接受け取ってもよい。
For example, when connecting, smoothing processing may be added to the data before and after the connection in order to reduce the discontinuity of the data before and after the connection. Corresponding continuous media data may be received from the continuous
連続メディア出力部6は、連続メディア再構成部5で再構成した連続メディアデータを出力する。例えば、出力は、外部出力デバイスに随時出力してもよいし、後で再生することを目的として、記録媒体にファイルとして出力してもよいし、メモリ等の記憶媒体に出力し別の装置、アプリケーションが逐次利用できるようにしてもよい。
The continuous media output unit 6 outputs the continuous media data reconstructed by the continuous
(第2実施形態)
図2は本発明による複合メディア高速再生装置の一例を示すブロック構成図である。図2に示すように複合メディア高速再生装置は、連続メディア1入力部21−1から連続メディアn入力部21−nのn個の連続メディア入力部とパラメータ1抽出部22−1からパラメータn抽出部22−nのn個の変化量パラメータ抽出部とパラメータ合成部23と変化量パラメータ解析・再生フレーム選択部24と再生速度指示部25と連続メディア1再構成部26−1から連続メディアn再構成部26−nのn個の連続メディア再構成部と連続メディア1出力部27−1から連続メディアn出力部27−nのn個の連続メディア出力部とから成る。
(Second embodiment)
FIG. 2 is a block diagram showing an example of a composite media high-speed playback apparatus according to the present invention. As shown in FIG. 2, the composite media high-speed playback apparatus extracts n continuous media input units from
なお、多チャンネル連続メディア高速再生装置は、上述の複合メディア高速再生装置において、n種類のメディアで構成された複合メディアではなくnチャンネルで構成された多チャンネル連続メディアを適用した場合のものである。 Note that the multi-channel continuous media high-speed playback device is a case where the multi-channel continuous media configured with n channels is applied to the above-described composite media high-speed playback device instead of the composite media configured with n types of media. .
連続メディア1入力部21−1から連続メディアn入力部21−nのn個の連続メディア入力部とパラメータ1抽出部22−1からパラメータn抽出部22−nのn個の変化量パラメータ抽出部とで構成される部分は、複合メディア高速再生装置のそれぞれの連続メディアデータをフレーム区間に分割し、それぞれのフレーム区間のそれぞれの連続メディアデータの特徴パラメータの変化量を計算する手段に相当する。
N continuous media input units from
パラメータ合成部23は、複合メデイア高速再生装置の複数の連続メディアデータの特徴パラメータの変化量から統合した連続メディアデータの特徴パラメータの変化量を計算する手段に相当する。
The
変化量パラメータ解析・再生フレーム選択部24と再生速度指示部25と連続メデイア1再構成部26−1から連続メデイアn再構成部26−nのn個の連続メディア再構成部とで構成される部分は、複合メディア高速再生装置の統合した特徴パラメータの変化量の大きなフレームのみを連結する手段に相当する。
It is composed of a change parameter analysis / playback
連続メディア1出力部27−1から連続メディアn出力部27−nのn個の連続メディア出力部は、複合メディア高速再生装置の連結された再構成データを再生する手段に相当する。
The n continuous media output units from the
連続メディア1入力部21−1から連続メディアn入力部21−nは、それぞれ対応する入力された連続メディアデータ1から連続メディアデータnをそれぞれのバッファに読み込んで、それぞれに対応するパラメータ1抽出部22−1からパラメータn抽出部22−nに同期をとって送る。
The
各連続メディア入力部は連続メディア高速再生装置の連続メディア入力部1と同様の処理に加え、各連続メディア入力部間で各パラメータ抽出部に送るデータ量を同じ時間、分(サイズが同じとは限らず、再生した場合に同じ時間となる量等)に合わせ、同じタイミング(厳密に動作時間を合わせる必要はないがデータの処理位置、順序を同一にする)に同期して送る。
In addition to the same processing as the continuous
各連続メディア入力部間で各連続メディアデータを読み込むデータ量、タイミングについては同期してもよいが、同期しなくてもよい。 The data amount and timing for reading each continuous media data between the continuous media input units may be synchronized, but may not be synchronized.
パラメータ1抽出部22−1からパラメータn抽出部22−nは、それぞれに対応する連続メディア入力部から受信したそれぞれの連続メディアデータを一定周期の小区間(フレーム区間)に分割し、それぞれのフレーム区間の代表となる特徴パラメータの変化量を計算する。
The
各パラメータ抽出部のフレーム区間長(フレーム周期)が共通である他は、各パラメータ抽出部は連続メディア高速再生装置の変化量パラメータ抽出部2と同様の処理を行う。
Each parameter extraction unit performs the same process as the change amount
パラメータ合成部23は、パラメータ1抽出部22−1からパラメータn抽出部22−nのn個のパラメータ抽出部からそれぞれの特徴パラメータの変化量を取得する。それぞれの特徴パラメータの変化量は、同一フレーム数の時系列データであり、加重平均により、1つの変化量の時系列データに変換し、統合した特徴パラメータ変化量を求める(加重平均は、それぞれの特徴パラメータの変化量の単位が異なる場合の正規化やそれぞれの連続メディアに対して重み付けを行う場合を含み、平均方法についても算術平均や幾何平均等の場合を含む。正規化方法も例えば、それぞれの特徴パラメータの変化量の最大値でそれぞれの特徴パラメータの変化量の値を割ることにより、0から1の値に正規化してもよいし、それぞれの特徴パラメータの変化量の平均値で割ることにより正規化してもよいし、それぞれの特徴パラメータの変化量の分散で割ることにより正規化してもよい。)。
The
再生速度指示部25は、連続メディア高速再生装置の再生速度指示部4と同様の処理を行う。
The playback
変化量パラメータ解析・再生フレーム選択部24は、パラメータ合成部23で計算した、統合した特徴パラメータの変化量の大きい方から、再生速度指示部25から指示された再生フレーム数だけ選択する。
The variation parameter analysis / reproduction
連続メデイア1再構成部26−1から連続メディアn再構成部26−nは、変化量パラメータ解析・再生フレーム選択部24で選択された再生フレーム数のフレームに対応するそれぞれの連続メディアデータのフレーム区間データを順序関係を維持しながらそれぞれ連結しそれぞれ再構成する。
The
例えば、連結する際に、連結する前後のデータの不連続性を軽減するため連結する前後のデータに平滑化処理を加えてもよい。平滑化処理を加えるのは、全ての連続メデイア再構成部でもよいし、一部の連続メディア再構成部でもよい。 For example, when connecting, smoothing processing may be added to the data before and after the connection in order to reduce the discontinuity of the data before and after the connection. The smoothing process may be applied to all continuous media reconstruction units or a part of continuous media reconstruction units.
対応するそれぞれの連続メディアデータは、それぞれの連続メデイア入力部からそれぞれのパラメータ抽出部、パラメータ合成部23、変化量パラメータ解析・再構成フレーム選択部24を経由して受け取ってもよいし、それぞれの連続メディア入力部から直接受け取ってもよい。
Each corresponding continuous media data may be received from each continuous media input unit via each parameter extraction unit,
連続メディア1出力部27−1から連続メディアn出力部27−nは、それぞれ対応するそれぞれの連続メディア再構成部で再構成した連続メディアデータをそれぞれ出力する。
The
各連続メディア出力部は、同期をとって出力してもよいし、しなくてもよい。例えば、外部出力デバイスに随時出力する場合に同期をとって出力してもよいし、後で再生することを目的として、記録媒体にファイルとして出力したり、メモリ等の記憶媒体に出力し別の装置、アプリケーションが逐次利用できるようにする場合は、同期をとらなくてもよい。 Each continuous media output unit may or may not output in synchronization. For example, when outputting to an external output device at any time, it may be output in synchronization, or for later playback, it may be output as a file on a recording medium or output to a storage medium such as a memory. When devices and applications can be used sequentially, there is no need to synchronize.
(第3実施形態)
図3は本発明による映像高速再生装置の実施形態の一例を示すブロック構成図である。図3に示すように、映像高速再生装置は、映像入力部31と動画・音声分離部32と動画パラメータ抽出部33と音声パラメータ抽出部34とパラメータ合成部35と変化量パラメータ解析・再生フレーム選択部36と再生速度指示部37と動画再構成部38と音声再構成部39と動画・音声合成部40と映像出力部41とから構成される。
(Third embodiment)
FIG. 3 is a block diagram showing an example of an embodiment of a high-speed video playback apparatus according to the present invention. As shown in FIG. 3, the high-speed video playback apparatus includes a
映像入力部31と動画・音声分離部32とで構成される部分は、映像高速再生装置の映像データを動画データと音声データとに分離する手段に相当する。
The part constituted by the
動画パラメータ抽出部33は、映像高速再生装置の動画データをフレーム区間に分割し、それぞれのフレーム区間の特徴パラメータの変化量を計算する手段に相当する。 The moving image parameter extraction unit 33 corresponds to a unit that divides moving image data of the video high-speed playback device into frame sections and calculates the amount of change in the characteristic parameter in each frame section.
音声パラメータ抽出部34は、映像高速再生装置の音声データをフレーム区間に分割し、それぞれのフレーム区間の特徴パラメータの変化量を計算する手段に相当する。
The audio
パラメータ合成部35は、映像高速再生装置の動画データの特徴パラメータの変化量と音声データの特徴パラメータの変化量とから映像データとしての特徴パラメータの変化量を計算する手段に相当する。
The
変化量パラメータ解析・再生フレーム選択部36と再生速度指示部37と動画再構成部38とで構成される部分は、映像高速再生装置の映像データの特徴パラメータの変化量の大きな動画データのフレームのみを連結する手段に相当する。
The portion constituted by the change parameter analysis / playback
変化量パラメータ解析・再生フレーム選択部36と再生速度指示部37と音声再構成部39とで構成される部分は、映像高速再生装置の映像データの特徴パラメータの変化量の大きな音声データのフレームのみを連結する手段に相当する。
The portion constituted by the change parameter analysis / reproduction
動画・音声合成部40は、映像高速再生装置の連結された再構成動画データと再構成音声データとを合成し、再構成映像データを生成する手段に相当する。
The moving image /
映像出力部41は、映像高速再生装置の生成された再構成映像データを再生する手段に相当する。
The
映像入力部31は、連続メディア高速再生装置の連続メディア入力部1の連続メディアデータが映像データである場合であり、変化量パラメータ抽出部2の代わりに、動画・音声分離部32にデータを出力する。
The
動画・音声分離部32は、映像入力部31からの映像データを、動画データと音声データとに分離し、それぞれ動画データを動画パラメータ抽出部33に、音声データを音声パラメータ抽出部34に出力する。
The video /
動画パラメータ抽出部33は、連続メディア高速再生装置の変化量パラメータ抽出部2の連続メディアデータが動画データである場合のものである。
The moving image parameter extraction unit 33 is for the case where the continuous media data of the variation
音声パラメータ抽出部34は、連続メディア高速再生装置の変化量パラメータ抽出部2の連続メディアデータが音声データである場合のものである。
The audio
パラメータ合成部35は、複合メデイア高速再生装置のパラメータ合成部23と同様の処理を行い、動画パラメータ抽出部33で計算した動画特徴パラメータの変化量と音声パラメータ抽出部34で計算した音声特徴パラメータの変化量とから、統合した映像特徴パラメータの変化量を計算する。
The
再生速度指示部37は、連続メディア高速再生装置の再生速度指示部4と同様の処理を行う。
The playback
変化量パラメータ解析・再生フレーム選択部36は複合メディア高速再生装置の変化量パラメータ解析・再生フレーム選択部24と同様の処理を行う。
The change parameter analysis / playback
動画再構成部38は、複合メデイア高速再生装置の連続メディア再構成部の1つとして、連続メディアデータが動画データである場合のものである。
The moving
音声再構成部39は、複合メディア高速再生装置の連続メディア再構成部の1つとして、連続メデイアデータが音声データである場合のものである。
The
動画・音声合成部40は、動画再構成部38からの再構成した動画データと音声再構成部39からの再構成した音声データとを、同期をとって映像データに合成する。
The moving image /
映像出力部41は、連続メディア高速再生装置の連続メディア出力部6と同様の処理を行い、動画・音声合成部40からの再構成した映像データを出力する。
The
なお、本発明の第1〜第3実施形態は、図1、図2および図3に示したものに限定されるものではなく、それらの組合せ、例えば、複合メデイアを多チャンネル処理したり、あるいは、映像を多チャンネル処理する等の変更が可能である。 The first to third embodiments of the present invention are not limited to those shown in FIG. 1, FIG. 2, and FIG. 3, and combinations thereof, for example, composite media are processed in multiple channels, or Changes such as multi-channel processing of video can be made.
また、本発明の連続メディア高速再生装置、音声高速再生装置、複合メディア高速再生装置、多チャンネル連続メデイア高速再生装置および映像高速再生装置は、論理回路等を用いたハードウェアのみによって実現することも可能であるとともに、コンピュータとそれによって実行されるソフトウェアとを用いて実現することも可能である。また、このソフトウェアは、コンピュータ読み取り可能な記録媒体、あるいは通信回線を介して配布することが可能である。 Also, the continuous media high-speed playback device, audio high-speed playback device, composite media high-speed playback device, multi-channel continuous media high-speed playback device, and video high-speed playback device of the present invention may be realized only by hardware using a logic circuit or the like. It is possible to realize this using a computer and software executed thereby. The software can be distributed via a computer-readable recording medium or a communication line.
音声高速再生装置の実施例を図1、図4〜図7を用いて説明する。 An embodiment of a high-speed audio playback device will be described with reference to FIGS. 1 and 4 to 7.
連続メディア入力部で入力された「あき(音素記号「aki」)」と発話した音声データ(例えば、10kHzサンプリング、16ビットリニアPCMで本実施例の説明を行うが、10kHz以外のサンプリング周波数や他の音声符号を用いてもよい。)の音声波形の例を図4に示す。音素記号はそれぞれ発音された音素の区間を示す。 Voice data (for example, 10 kHz sampling, 16-bit linear PCM, which is spoken with “Aki (phoneme symbol“ aki ”)” input at the continuous media input unit will be described in this embodiment. An example of a speech waveform is shown in FIG. Each phoneme symbol indicates a section of the phoneme that is pronounced.
変化量パラメータ抽出部2では、音声データのフレーム区間(例えば、フレーム区間長を10msとして本実施例の説明を行うと、100ポイントの音声データがフレーム区間長の音声データとなる。フレーム区間長は10ms以外でもよい。)に分割し、その代表となる音声パラメータとして音声パワーを計算する。音声パワーの計算には、例えば、フレーム区間を中心にフレーム区間外の音声データを含めた256ポイント(25.6msの音声データ)を用い、窓長256ポイントのブラックマン窓をかけた後、音声パワーの計算を行い、フレーム区間の代表値とすることができる(窓長は256ポイント以外でもよいし、窓の形もブラックマン窓以外を用いてもよいし、窓かけ計算を必ずしも行わなくてもよい。)。
In the variation
ここで図4の音声波形に対応した音声パワーの例を図5に示す。音声パワーの場合はスカラーの時系列であるが、音声パワーの他、△(デルタ)パワー、FFT係数、LPC係数、ケプストラム、△ケプストラム、これらに類する各種音声分析パラメータやそれらの組合せを用いることもでき、スカラーだけでなくベクトルでもよい。 Here, an example of the voice power corresponding to the voice waveform of FIG. 4 is shown in FIG. In the case of voice power, it is a scalar time series. In addition to voice power, Δ (delta) power, FFT coefficient, LPC coefficient, cepstrum, Δ cepstrum, various voice analysis parameters similar to these, and combinations thereof may be used. It can be a vector as well as a scalar.
音声パラメータの変化量は、例えば、音声パワーのフレーム間の差分の絶対値を計算する。当該フレームと前フレームとの音声パワーの差分の絶対値でもよいし、当該フレームと後フレームとの音声パワーの差分の絶対値でもよいし、前フレームと後フレームとの音声パワーの差分の2分の1の絶対値でもよいし、前後複数フレームの音声パワーを組み合わせて計算してもよい。また、音声データから直接△パワーの絶対値を計算してもよい。 For the change amount of the audio parameter, for example, the absolute value of the difference between frames of the audio power is calculated. It may be the absolute value of the difference in audio power between the current frame and the previous frame, the absolute value of the audio power difference between the current frame and the subsequent frame, or two minutes of the audio power difference between the previous frame and the subsequent frame. The absolute value of 1 may be used, or may be calculated by combining the audio power of a plurality of frames before and after. Alternatively, the absolute value of Δ power may be calculated directly from the audio data.
ここで図5の音声パワーに対応した、音声パワーの変化量の例を図6に示す。音声パワーはスカラーであり、差分計算の例を示したが、ベクトルの場合を含めて一般化すると2値の距離計算で置き換えることができる。 Here, FIG. 6 shows an example of the amount of change in audio power corresponding to the audio power in FIG. The voice power is a scalar, and an example of the difference calculation has been shown. However, when generalized including the case of a vector, it can be replaced with a binary distance calculation.
変化量パラメータ解析・再生フレーム選択部3では、音声パワーの変化量の大きいものから再生時間(総時間/再生速度)に対応する個数のフレームを選択する(再生速度は、再生速度指示部4から得る。再生速度ではなく、再生時間を直接指定してもよい。)。
The change parameter analysis / playback
これは図7の音声パワーの変化量のグラフの閾値を設定することに相当し、閾値より上に値がくる網掛けされた部分が選択されたフレームを示す。 This corresponds to setting a threshold value in the graph of the amount of change in audio power in FIG. 7, and shows a frame in which a shaded portion whose value is above the threshold value is selected.
連続メディア再構成部5は、変化量パラメータ解析・再生フレーム選択部3で選択したフレームに対応する音声データを抽出し、順序関係を維持しながら連結して再構成する。
The continuous
この音声データを連結する時に、連結部分に平滑化処理を施してもよい。音声断片データをそのまま連結すると不連続性により再生時にノイズとして知覚されるが、平滑化処理によって、その不連続性を解消し、ノイズを軽減することができる。 When the audio data is connected, a smoothing process may be applied to the connected part. If the audio fragment data are connected as they are, they are perceived as noise during reproduction due to discontinuity, but the discontinuity can be eliminated and noise can be reduced by smoothing processing.
この平滑化処理の例としては、連結する前後一定区間の音声データの移動平均をとる方法がある。例えば、前後の計5ポイントのデータの移動平均をとってもよいし、5ポイント以外の数でもよい。また、移動平均以外の平滑化方法でもよい。 As an example of this smoothing process, there is a method of taking a moving average of audio data in a fixed section before and after connecting. For example, a moving average of data of a total of 5 points before and after may be taken, or a number other than 5 points may be taken. A smoothing method other than moving average may be used.
図7の音声パワーの変化量のグラフ(c)の網掛けされた部分に対応する音声波形のグラフ(a)の網掛けされた部分が選択されたフレームの音声データの例であり、(d)に示すグラフが再構成した音声データの例である。これによれば無音区間が削除されるだけでなく、音韻の変化の少ない定常部が削除され、音声の了解性に寄与する部分が残るため、発話内容「あき(音素記号「aki」)」も短時間に圧縮されることの例示となっている。これにより全ての音韻が残る保証はないが、再生音のピッチが変化することもなく、従来技術より了解度を保持した任意の再生時間(再生速度)の高速再生が実現できる例である。 The shaded portion of the speech waveform graph (a) corresponding to the shaded portion of the speech power change graph (c) in FIG. 7 is an example of speech data of a selected frame (d ) Is an example of reconstructed audio data. According to this, not only the silent section is deleted, but also the stationary part with a small change in phoneme is deleted and the part contributing to the intelligibility of the speech remains, so the utterance content “Aki (phoneme symbol“ aki ”)” is also included. It is an example of being compressed in a short time. Thus, there is no guarantee that all phonemes remain, but this is an example in which high-speed playback of an arbitrary playback time (playback speed) that maintains intelligibility compared to the prior art can be realized without changing the pitch of the playback sound.
連続メディア出力部6は、例えば、スピーカやヘッドホン等のオーディオ出力デバイスに随時出力し再生してもよいし、後で再生することを目的に、ファイル出力してもよい。 For example, the continuous media output unit 6 may output to and reproduce from an audio output device such as a speaker or headphones as needed, or may output a file for the purpose of reproduction later.
動画を対象とした連続メディア高速再生装置の実施例を図1を用いて説明する。 An embodiment of a continuous media high-speed playback device for moving images will be described with reference to FIG.
連続メディア入力部1に動画データ(例えば、30フレーム/秒(fps)で本実施例の説明を行うが、30fps以外でもよい。)が入力される。
Moving image data (for example, the present embodiment is described at 30 frames / second (fps), but may be other than 30 fps) is input to the continuous
変化量パラメータ抽出部2では、動画データからフレーム画像(静止画)を抽出し、例えば、1フレーム画像を変化量パラメータを計算するフレーム区間(1/30秒)とする。また、複数のフレーム画像単位でフレーム区間としてもよい。
The change amount
変化量パラメータ(動画データの特徴パラメータの変化量)は、例えば、計算するフレーム区間のフレーム画像と前のフレーム区間のフレーム画像との画素単位の輝度変化量を計算する。 As the change amount parameter (change amount of the feature parameter of the moving image data), for example, the amount of change in luminance between the frame image of the frame interval to be calculated and the frame image of the previous frame interval is calculated.
また、計算するフレーム区間のフレーム画像と後のフレーム区間のフレーム画像との画素単位の輝度変化量を計算してもよいし、前フレーム区間のフレーム画像と後フレーム区間のフレーム画像との画素単位の輝度変化量の1/2を計算してもよいし、前後複数フレーム区間のフレーム画像を組み合わせて計算してもよい。 Further, the luminance change amount in pixel units of the frame image of the frame section to be calculated and the frame image of the subsequent frame section may be calculated, or the pixel unit of the frame image of the previous frame section and the frame image of the subsequent frame section May be calculated by combining the frame images of the preceding and succeeding plural frame sections.
複数のフレーム画像単位でフレーム区間とした場合は、フレーム区間内のフレーム画像間の画素単位の輝度変化量から当該フレーム区間の変化量パラメータを計算してもよい。 When a frame section is formed in units of a plurality of frame images, a change amount parameter of the frame section may be calculated from a luminance change amount in pixel units between frame images in the frame section.
また、画素単位の輝度変化量ではなく、他の特徴量を用いてもよく、フレーム画像から画素情報を抽出しなくても、符号化された動画データから直接、フレーム画像の変化量を抽出し計算してもよい(MPEG符号等のフレーム間の差分データを保持する画像符号の場合に、差分データから変化量を直接計算してもよい。)。 Also, other feature values may be used instead of the luminance change amount in pixel units, and the change amount of the frame image is extracted directly from the encoded moving image data without extracting the pixel information from the frame image. The amount of change may be calculated directly from the difference data in the case of an image code that holds difference data between frames such as MPEG code.
変化量パラメータ解析・再生フレーム選択部3は、変化量パラメータの値の大きいものから再生時間(総時間/再生速度)に対応する個数のフレーム区間を選択する(再生速度は、再生速度指示部4から得る。再生速度ではなく再生時間を直接指定してもよい。)。
The change parameter analysis / playback
連続メディア再構成部5は、変化量パラメータ解析・再生フレーム選択部3で選択したフレーム区間に対応するフレーム画像を抽出し、順序関係を維持しながら連結して動画データに再構成する。
The continuous
連続メディア出力部6は、例えば、ディスプレイ等の表示デバイスに随時出力し再生してもよいし後で再生することを目的に、ファイル出力してもよい。 For example, the continuous media output unit 6 may output to a display device such as a display and reproduce it at any time, or may output a file for the purpose of reproducing later.
映像高速再生装置の実施例を図3を用いて説明する。 An embodiment of the high-speed video playback apparatus will be described with reference to FIG.
映像入力部31に、映像データ(例えば、30fpsの動画と44.1kHzサンプリングの音声で本実施例の説明を行うが、30fps、44.1kHz以外の条件でもよい。)が入力される。
Video data (for example, the present embodiment will be described with a moving image of 30 fps and audio of 44.1 kHz sampling, but conditions other than 30 fps and 44.1 kHz may be used) are input to the
動画・音声分離部32は、映像データから動画データと音声データとを分離する。
The moving image /
動画パラメータ抽出部33と音声パラメータ抽出部34は、フレーム区間長を共通に、例えば1/30秒(1/30秒以外でもよい)として、それぞれの特徴パラメータの変化量を計算する。動画パラメータ抽出部33は、フレ−ム画像1枚をフレーム区間として変化量パラメータを計算する。音声パラメータ抽出部34は、音声データのフレーム区間長を1/30秒に相当する1470ポイントの音声データに分割し、音声パラメータの変化量を計算する。
The moving image parameter extraction unit 33 and the audio
パラメータ合成部35は、動画の変化量パラメータと音声の変化量パラメータとを受け取り、それぞれの変化量パラメータの加重平均をとり、統合された映像の変化量パラメータとする。
The
例えば、動画の変化量パラメータは、動画の変化量パラメータの平均値で正規化し、音声の変化量パラメータは、音声の変化量パラメータの平均値で正規化し、それぞれ正規化された動画と音声との変化量パラメータの2乗平均を計算し、統合された映像の変化量パラメータとしてもよい。これにより、動画と音声とのどちらかが変化した地点を強調した再生となり、動画と音声との両方の変化に対応し、同期の取れた高速再生が可能となる。 For example, the video change parameter is normalized by the average value of the video change parameter, and the audio change parameter is normalized by the average value of the audio change parameter. A mean square of the change amount parameter may be calculated and used as an integrated image change amount parameter. As a result, the reproduction is performed with emphasis on the point where either the moving image or the sound is changed, and the synchronized high speed reproduction is possible corresponding to the change of both the moving image and the sound.
また、それぞれの変化量パラメータを正規化し、それぞれの連続メディアに応じた重み付けパラメータを掛け、平均計算し、統合された映像の変化量パラメータとしてもよい。これにより、動画の動き重視の高速再生、音声重視の高速再生する等、それぞれのバランスを変化させることが可能となり、映像コンテンツの種類や利用目的等に応じた調整、選択の幅を実現する。また、重み付けパラメータに0を許容することにより、動画パラメータのみを用いた映像の高速再生、音声パラメータのみを用いた映像の高速再生も可能となる。 Alternatively, each change parameter may be normalized, multiplied by a weighting parameter corresponding to each continuous medium, averaged, and used as an integrated video change parameter. Accordingly, it is possible to change the balance of each of the moving image-oriented high-speed reproduction and the audio-oriented high-speed reproduction, thereby realizing a range of adjustment and selection according to the type of video content and the purpose of use. Also, by allowing 0 as the weighting parameter, it is possible to perform high-speed video playback using only moving image parameters and high-speed video playback using only audio parameters.
変化量パラメータ解析・再生フレーム選択部36は、映像の変化量パラメータの値の大きいものから再生時間(総時間/再生速度)に対応する個数のフレーム区間を選択する(再生速度は、再生速度指示部37から得る。再生速度ではなく、再生時間を直接指定してもよい。)。
The change parameter analysis / playback
動画再構成部38は、変化量パラメータ解析・再生フレーム選択部36で選択したフレーム区間に対応する動画データを抽出し、順序関係を維持しながら連結して再構成する。
The moving
音声再構成部39は、変化量パラメータ解析・再生フレーム選択部36で選択したフレーム区間に対応する音声データを抽出し、順序関係を維持しながら連結して再構成する。
The
動画・音声合成部40は、再構成した動画データと音声データとから映像データを合成する。動画再構成部38と音声再構成部39とにおいて、同一のフレーム区間のデータを選択するため、元の映像データと再構成後の映像データの動画と音声との同期が保持される。
The moving image /
映像出力部41は、例えば、スピーカやヘッドホン等のオーディオ出力デバイスとディスプレイ等の表示デバイスとに随時出力し再生してもよいし、後で再生することを目的に、ファイル出力してもよい。
For example, the
多地点映像を対象とした複合メディア高速再生装置(もしくは、映像高速再生装置と多チャンネル連続メディア高速再生装置の組み合わせ)の例を図2、図3を用いて説明する。 An example of a composite media high-speed playback device (or a combination of a video high-speed playback device and a multi-channel continuous media high-speed playback device) for multi-point video will be described with reference to FIGS.
図2の各連続メディア入力部をそれぞれ図3の映像入力部31、動画・音声分離部32で構成し、各連続メディア出力部をそれぞれ図3の動画・音声合成部40、映像出力部41で構成することにより、N地点映像を2Nの連続メディアを複合した複合メディア高速再生装置と解釈することができる。これにより、いずれかの地点での変化、かつ、動画および音声のいずれかの変化を強調した同期がとれた多地点映像の高速再生が可能となる。
Each continuous media input unit in FIG. 2 includes the
1…連続メディア入力部
2…変化量パラメータ抽出部
3…変化量パラメータ解析・再生フレーム選択部
4…再生速度指示部
5…連続メディア再構成部
6…連続メディア出力部
21…連続メディア入力部
22…パラメータ抽出部
23…パラメータ合成部
24…変化量パラメータ解析・再生フレーム選択部
25…再生速度指示部
26…連続メディア再構成部
27…連続メディア出力部
31…映像入力部
32…動画・音声分離部
33…動画パラメータ抽出部
34…音声パラメータ抽出部
35…パラメータ合成部
36…変化量パラメータ解析・再生フレーム選択部
37…再生速度指示部
38…動画再構成部
39…音声再構成部
40…動画・音声合成部
41…映像出力部
DESCRIPTION OF
Claims (12)
連続メディアデータをフレーム区間に分割し、各フレーム区間の特徴パラメータの変化量を計算する過程と、
特徴パラメータの変化量の大きなフレームのみを連結してデータを再構成する過程と、
連結された再構成データを再生する過程と、を有することを特徴とする連続メディアデータ高速再生方法。 A continuous media data high-speed playback method for shortening and playing back continuous media data,
A process of dividing continuous media data into frame sections and calculating a change amount of a feature parameter in each frame section;
The process of reconstructing data by concatenating only frames with large feature parameter variations,
And a step of reproducing the concatenated reconstructed data. A method of rapidly reproducing continuous media data.
各連続メディアデータをフレーム区間に分割し、各フレーム区間の特徴パラメータの変化量を計算する過程と、
各連続メディアデータの特徴パラメータの変化量から、統合した特徴パラメータの変化量を計算する過程と、
統合した特徴パラメータの変化量の大きなフレームのみを連結して各連続メディアデータごとに再構成データを生成する過程と、
この再構成データを再生する過程と、を有することを特徴とする複合メディアデータ高速再生方法。 A composite media data high-speed playback method for shortening and playing back composite media data composed of a plurality of continuous media data,
A process of dividing each continuous media data into frame sections and calculating a change amount of a characteristic parameter of each frame section;
The process of calculating the amount of change of the integrated feature parameter from the amount of change of the feature parameter of each continuous media data,
A process of generating reconstructed data for each continuous media data by concatenating only the frames with a large amount of change of the integrated feature parameters,
A method of reproducing the reconstructed data; and a method of reproducing the composite media data at a high speed.
各チャンネルの連続メディアデータをフレーム区間に分割し、各フレーム区間の特徴パラメータの変化量を計算する過程と、
各チャンネルの連続メディアデータの特徴パラメータの変化量から、統合した特徴パラメータの変化量を計算する過程と、
統合した特徴パラメータの変化量の大きなフレームのみを連結して各チャンネルごとに再構成データを生成する過程と、
この再構成データを再生する過程と、を有することを特徴とする多チャンネル連続メディアデータ高速再生方法。 A multi-channel continuous media data high-speed playback method that shortens and plays back multi-channel continuous media data,
A process of dividing continuous media data of each channel into frame sections and calculating a change amount of a feature parameter of each frame section;
The process of calculating the amount of change of the integrated feature parameter from the amount of change of the feature parameter of the continuous media data of each channel,
A process of generating reconstructed data for each channel by concatenating only the frames with a large amount of change of the integrated feature parameters,
And a step of reproducing the reconstructed data, and a multi-channel continuous media data high-speed reproduction method.
映像データを動画データと音声データとに分割する過程と、
動画データをフレーム区間に分割し、各フレーム区間の特徴パラメータの変化量を計算する過程と、
音声データをフレーム区間に分割し、各フレーム区間の特徴パラメータの変化量を計算する過程と、
動画データの特徴パラメータの変化量と音声データの特徴パラメータの変化量とから映像データの特徴パラメータの変化量を計算する過程と、
映像データの特徴パラメータの変化量の大きい動画データのフレームのみを連結して再構成動画データを生成する過程と、
映像データの特徴パラメータの変化量の大きい音声データのフレームのみを連結して再構成音声データを生成する過程と、
再構成動画データと再構成音声データとを合成し、再構成映像データを生成する過程と、
生成した再構成映像データを再生する過程と、を有することを特徴とする映像データ高速再生方法。 A video data high-speed playback method for shortening and playing back video data consisting of video data and audio data,
Dividing video data into video data and audio data;
The process of dividing the video data into frame sections and calculating the amount of change in the feature parameter in each frame section;
Dividing audio data into frame sections and calculating the amount of change in feature parameters in each frame section;
Calculating the amount of change of the feature parameter of the video data from the amount of change of the feature parameter of the video data and the amount of change of the feature parameter of the audio data;
A process of generating reconstructed video data by concatenating only video data frames having a large amount of change in the feature parameter of the video data,
A process of generating reconstructed audio data by concatenating only frames of audio data having a large amount of change in the feature parameter of the video data;
A process of synthesizing the reconstructed video data and the reconstructed audio data to generate reconstructed video data,
And a step of playing back the generated reconstructed video data.
連続メディアデータをフレーム区間に分割し、各フレーム区間の特徴パラメータの変化量を計算する手段と、
特徴パラメータの変化量の大きなフレームのみを連結してデータを再構成する手段と、
連結された再構成データを再生する手段と、を有することを特徴とする連続メディアデータ高速再生装置。 A continuous media data high-speed playback device that shortens and plays back continuous media data,
Means for dividing continuous media data into frame sections, and calculating a change amount of a characteristic parameter of each frame section;
Means for reconstructing data by concatenating only frames with a large amount of change in feature parameters;
A continuous media data high-speed playback device comprising: means for playing back the reconstructed data linked together.
各連続メディアデータをフレーム区間に分割し、各フレーム区間の特徴パラメータの変化量を計算する手段と、
各連続メディアデータの特徴パラメータの変化量から、統合した特徴パラメータの変化量を計算する手段と、
統合した特徴パラメータの変化量の大きなフレームのみを連結して各連続メディアデータごとに再構成データを生成する手段と、
この再構成データを再生する手段と、を有することを特徴とする複合メディアデータ高速再生装置。 A composite media data high-speed playback device that shortens and plays back composite media data composed of a plurality of continuous media data,
Means for dividing each continuous media data into frame sections and calculating a change amount of a characteristic parameter of each frame section;
Means for calculating the amount of change of the integrated feature parameter from the amount of change of the feature parameter of each continuous media data;
Means for generating reconstructed data for each continuous media data by concatenating only frames with a large amount of change in the integrated feature parameters;
Means for reproducing the reconstructed data, and a high speed playback apparatus for composite media data.
各チャンネルの連続メディアデータをフレーム区間に分割し、各フレーム区間の特徴パラメータの変化量を計算する手段と、
各チャンネルの連続メディアデータの特徴パラメータの変化量から、統合した特徴パラメータの変化量を計算する手段と、
統合した特徴パラメータの変化量の大きなフレームのみを連結して各チャンネルごとに再構成データを生成する手段と、
この再構成データを再生する手段と、を有することを特徴とする多チャンネル連続メディアデータ高速再生装置。 A multi-channel continuous media data high-speed playback device that shortens and plays back multi-channel continuous media data,
Means for dividing continuous media data of each channel into frame sections, and calculating a change amount of a characteristic parameter of each frame section;
Means for calculating the amount of change of the integrated feature parameter from the amount of change of the feature parameter of the continuous media data of each channel;
Means for generating reconstructed data for each channel by concatenating only frames with a large amount of change in the integrated feature parameters;
Means for reproducing the reconstructed data, and a multi-channel continuous media data high-speed reproducing device.
映像データを動画データと音声データとに分割する手段と、
動画データをフレーム区間に分割し、各フレーム区間の特徴パラメータの変化量を計算する手段と、
音声データをフレーム区間に分割し、各フレーム区間の特徴パラメータの変化量を計算する手段と、
動画データの特徴パラメータの変化量と音声データの特徴パラメータの変化量とから映像データの特徴パラメータの変化量を計算する手段と、
映像データの特徴パラメータの変化量の大きい動画データのフレームのみを連結して再構成動画データを生成する手段と、
映像データの特徴パラメータの変化量の大きい音声データのフレームのみを連結して再構成音声データを生成する手段と、
再構成動画データと再構成音声データとを合成し、再構成映像データを生成する手段と、
生成した再構成映像データを再生する手段と、を有することを特徴とする映像データ高速再生装置。 A video data high-speed playback device that shortens and plays back video data consisting of video data and audio data,
Means for dividing video data into video data and audio data;
Means for dividing the moving image data into frame sections and calculating the amount of change in the feature parameter of each frame section;
Means for dividing the audio data into frame sections and calculating the amount of change in the feature parameter of each frame section;
Means for calculating the change amount of the feature parameter of the video data from the change amount of the feature parameter of the video data and the change amount of the feature parameter of the audio data;
Means for generating reconstructed video data by concatenating only frames of video data having a large amount of change in the characteristic parameter of the video data;
Means for generating reconstructed audio data by concatenating only frames of audio data having a large amount of change in the characteristic parameter of the video data;
Means for synthesizing the reconstructed video data and the reconstructed audio data to generate reconstructed video data;
And a means for reproducing the generated reconstructed video data.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2004007558A JP2005204003A (en) | 2004-01-15 | 2004-01-15 | Continuous media data fast reproduction method, composite media data fast reproduction method, multichannel continuous media data fast reproduction method, video data fast reproduction method, continuous media data fast reproducing device, composite media data fast reproducing device, multichannel continuous media data fast reproducing device, video data fast reproducing device, program, and recording medium |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2004007558A JP2005204003A (en) | 2004-01-15 | 2004-01-15 | Continuous media data fast reproduction method, composite media data fast reproduction method, multichannel continuous media data fast reproduction method, video data fast reproduction method, continuous media data fast reproducing device, composite media data fast reproducing device, multichannel continuous media data fast reproducing device, video data fast reproducing device, program, and recording medium |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2005204003A true JP2005204003A (en) | 2005-07-28 |
Family
ID=34821153
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2004007558A Pending JP2005204003A (en) | 2004-01-15 | 2004-01-15 | Continuous media data fast reproduction method, composite media data fast reproduction method, multichannel continuous media data fast reproduction method, video data fast reproduction method, continuous media data fast reproducing device, composite media data fast reproducing device, multichannel continuous media data fast reproducing device, video data fast reproducing device, program, and recording medium |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2005204003A (en) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2007171267A (en) * | 2005-12-19 | 2007-07-05 | Nippon Telegr & Teleph Corp <Ntt> | Abbreviated reproducing method of continuous media data, abbreviated reproducing method and apparatus of composite media data, program, and computer readable recording medium |
WO2016125362A1 (en) * | 2015-02-03 | 2016-08-11 | ソニー株式会社 | Information processing device, information processing system, information processing method, and program |
WO2018117099A1 (en) * | 2016-12-20 | 2018-06-28 | 国立大学法人 東京大学 | Image processing device and program |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2001197425A (en) * | 2000-01-05 | 2001-07-19 | Matsushita Electric Ind Co Ltd | Video signal processing unit |
JP2002142189A (en) * | 2000-11-06 | 2002-05-17 | Canon Inc | Image processor, image processing method, and storage medium |
-
2004
- 2004-01-15 JP JP2004007558A patent/JP2005204003A/en active Pending
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2001197425A (en) * | 2000-01-05 | 2001-07-19 | Matsushita Electric Ind Co Ltd | Video signal processing unit |
JP2002142189A (en) * | 2000-11-06 | 2002-05-17 | Canon Inc | Image processor, image processing method, and storage medium |
Cited By (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2007171267A (en) * | 2005-12-19 | 2007-07-05 | Nippon Telegr & Teleph Corp <Ntt> | Abbreviated reproducing method of continuous media data, abbreviated reproducing method and apparatus of composite media data, program, and computer readable recording medium |
JP4648183B2 (en) * | 2005-12-19 | 2011-03-09 | 日本電信電話株式会社 | Continuous media data shortening reproduction method, composite media data shortening reproduction method and apparatus, program, and computer-readable recording medium |
WO2016125362A1 (en) * | 2015-02-03 | 2016-08-11 | ソニー株式会社 | Information processing device, information processing system, information processing method, and program |
US10504554B2 (en) | 2015-02-03 | 2019-12-10 | Sony Corporation | Information processing device, information processing system, and information processing method |
WO2018117099A1 (en) * | 2016-12-20 | 2018-06-28 | 国立大学法人 東京大学 | Image processing device and program |
CN110366848A (en) * | 2016-12-20 | 2019-10-22 | 国立大学法人东京大学 | Image processing apparatus and program |
JPWO2018117099A1 (en) * | 2016-12-20 | 2019-10-24 | 国立大学法人 東京大学 | Image processing apparatus and program |
JP7164873B2 (en) | 2016-12-20 | 2022-11-02 | 国立大学法人 東京大学 | Image processing device and program |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5032314B2 (en) | Audio encoding apparatus, audio decoding apparatus, and audio encoded information transmission apparatus | |
KR101334366B1 (en) | Method and apparatus for varying audio playback speed | |
KR101582358B1 (en) | Method for time scaling of a sequence of input signal values | |
JP2010283605A (en) | Video processing device and method | |
US8538244B2 (en) | Recording/reproduction apparatus and recording/reproduction method | |
JP2007249075A (en) | Audio reproducing device and high-frequency interpolation processing method | |
JP2006033811A (en) | Electronic watermarking method and storage medium for storing electronic watermarking program | |
JP2007010855A (en) | Voice reproducing apparatus | |
JP2005204003A (en) | Continuous media data fast reproduction method, composite media data fast reproduction method, multichannel continuous media data fast reproduction method, video data fast reproduction method, continuous media data fast reproducing device, composite media data fast reproducing device, multichannel continuous media data fast reproducing device, video data fast reproducing device, program, and recording medium | |
US20150104158A1 (en) | Digital signal reproduction device | |
JPWO2009090705A1 (en) | Recording / playback device | |
JP2009075280A (en) | Content playback device | |
JP4648183B2 (en) | Continuous media data shortening reproduction method, composite media data shortening reproduction method and apparatus, program, and computer-readable recording medium | |
JP2822940B2 (en) | Video and audio data editing device | |
JP6313619B2 (en) | Audio signal processing apparatus and program | |
JP2002297200A (en) | Speaking speed converting device | |
KR20070008232A (en) | Apparatus and method of reproducing digital multimedia slow or fast | |
JPH0854895A (en) | Reproducing device | |
JP4529859B2 (en) | Audio playback device | |
JP4665550B2 (en) | Playback apparatus and playback method | |
JP2008145841A (en) | Reproduction device, reproduction method, signal processing device and signal processing method | |
JP3766534B2 (en) | VISUAL HEARING AID SYSTEM AND METHOD AND RECORDING MEDIUM CONTAINING CONTROL PROGRAM FOR VISUAL HEARING AID | |
JP2010123225A (en) | Record reproducing apparatus and record reproducing method | |
JP4155990B2 (en) | Synchronous reconstruction method and apparatus for acoustic data and moving image data | |
JPH11311997A (en) | Sound reproducing speed converting device and method therefor |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20060411 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20080623 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20080708 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20080903 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20090203 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20090406 |
|
RD02 | Notification of acceptance of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7422 Effective date: 20090522 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20100105 |