JP2005204003A - Continuous media data fast reproduction method, composite media data fast reproduction method, multichannel continuous media data fast reproduction method, video data fast reproduction method, continuous media data fast reproducing device, composite media data fast reproducing device, multichannel continuous media data fast reproducing device, video data fast reproducing device, program, and recording medium - Google Patents

Continuous media data fast reproduction method, composite media data fast reproduction method, multichannel continuous media data fast reproduction method, video data fast reproduction method, continuous media data fast reproducing device, composite media data fast reproducing device, multichannel continuous media data fast reproducing device, video data fast reproducing device, program, and recording medium Download PDF

Info

Publication number
JP2005204003A
JP2005204003A JP2004007558A JP2004007558A JP2005204003A JP 2005204003 A JP2005204003 A JP 2005204003A JP 2004007558 A JP2004007558 A JP 2004007558A JP 2004007558 A JP2004007558 A JP 2004007558A JP 2005204003 A JP2005204003 A JP 2005204003A
Authority
JP
Japan
Prior art keywords
data
continuous media
change
media data
amount
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2004007558A
Other languages
Japanese (ja)
Inventor
Hiroshi Konishi
宏志 小西
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP2004007558A priority Critical patent/JP2005204003A/en
Publication of JP2005204003A publication Critical patent/JP2005204003A/en
Pending legal-status Critical Current

Links

Images

Landscapes

  • Television Signal Processing For Recording (AREA)

Abstract

<P>PROBLEM TO BE SOLVED: To provide a continuous media fast reproduction technique that realizes faster reproduction while holding comprehension as much as possible so that a user can grasp contents in a short period of time and is not limited to audio and a moving picture, but applicable to other continuous media and composite media. <P>SOLUTION: A continuous media data fast reproducing device comprises a means of dividing continuous media data into frame sections and calculating variation quantities of feature parameters in each of the frame sections, a means of reconstituting data by connecting only frames which are large in variation quantity of feature parameters, and a means of reproducing the connected reconstituted data. <P>COPYRIGHT: (C)2005,JPO&NCIPI

Description

本発明は、連続メディアデータを高速再生する技術に係り、特に、利用者が短時間で連続メディアデータの内容を把握できるようにする技術に関する。   The present invention relates to a technique for reproducing continuous media data at high speed, and more particularly to a technique for enabling a user to grasp the contents of continuous media data in a short time.

映像は画像と音とからなる複合メディアであり、画像は動画と静止画とに分類される。本来、音は音声、音楽、音響等を包含するものであるが、ここでは、音声を音の意味を含むものとして使用する。特に、連続メディアに対する方法を説明するため、映像は動画と音声とからなるものとして説明する。   Video is a composite media composed of images and sounds, and images are classified into moving images and still images. Originally, sound includes sound, music, sound and the like, but here, sound is used as including the meaning of sound. In particular, in order to explain the method for continuous media, the video will be described as consisting of video and audio.

連続メディアの代表例として音声があり、通常のテープレコーダ等の早送りでは、再生音の周波数が高くなり、2倍程度を限界にそれ以上の高速再生では内容を把握することが困難となる。これを改善するために、フレーム単位に分割し等間隔や規則的に間引いたり、ピッチ周期を検出しピッチ区間波形単位で規則的に間引いたりすることにより、原音と同等の周波数で音を再生し、高速再生を可能とする手法が提案されている(例えば、特許文献1、2参照。)。   Audio is a typical example of continuous media. The frequency of the reproduced sound is high when fast-forwarding with a normal tape recorder or the like, and it is difficult to grasp the content at high-speed reproduction beyond the limit of about twice. In order to improve this, sound is played back at the same frequency as the original sound by dividing it into frame units and thinning them out at regular intervals and regularly, or by detecting the pitch period and regularly thinning out pitch unit waveform units. A method that enables high-speed reproduction has been proposed (see, for example, Patent Documents 1 and 2).

また、音声特有の情報を用い、有音区間と無音区間とを検出し無音区間削除し、有音区間のみを再生する方法(例えば、特許文献1参照。)や、検出された有音区間を更に母音区間、子音区間、母音区間と子音区間との間の遷移区間、及び雑音区間に分類し圧縮の度合いを変え音声の劣化を少なくする装置(例えば、特許文献3参照。)が提案されている。   In addition, using sound-specific information, a method of detecting a voiced section and a silent section, deleting the silent section, and reproducing only the voiced section (for example, refer to Patent Document 1), or detecting a detected voiced section. Furthermore, an apparatus (for example, see Patent Document 3) that classifies into a vowel section, a consonant section, a transition section between a vowel section and a consonant section, and a noise section to change the degree of compression and reduce speech deterioration has been proposed. Yes.

しかし、これらの手法を用いても、再生速度は2〜3倍程度が限界であり、これ以上の速度では内容を把握することが困難になる。また、音声特有の情報を用いることは他の連続メディアには適用できないため、メディア毎に処理を分ける必要があり、複合メディア(例えば、音声と動画の複合である映像)の高速再生に適用する際等にも、処理が複雑化する欠点を伴っている。   However, even if these methods are used, the reproduction speed is limited to about 2 to 3 times, and it becomes difficult to grasp the contents at a speed higher than this. In addition, using audio-specific information is not applicable to other continuous media, so it is necessary to divide the processing for each media, and it applies to high-speed playback of composite media (for example, video that is a composite of audio and video) In some cases, the processing is complicated.

他の連続メディアの例としては動画があり、通常のビデオレコーダ等の早送りのように再生周波数を上げたり、フレーム単位で等間隔や規則的に間引いたり、縮退させたりすることにより、高速再生を可能とする手法が提案されている。しかし、音声同様、ある速度以上の高速再生では内容を把握することが困難となる。   Another example of continuous media is moving images, which can be played at high speeds by increasing the playback frequency like normal video recorders, fast-forwarding, etc. A possible approach has been proposed. However, as with voice, it is difficult to grasp the content at high speed playback above a certain speed.

また、動画からある物理量(輝度変化量やカット点等)を抽出し、ある条件を満たす部分を取り出して短縮する手法が提案されている(例えば、特許文献4、5参照。)。しかし、動画特有の情報を適用しているため、音声等の他のメディアに適用することができない。   In addition, a method has been proposed in which a certain physical quantity (brightness change amount, cut point, etc.) is extracted from a moving image, and a part that satisfies a certain condition is extracted and shortened (see, for example, Patent Documents 4 and 5). However, since information specific to moving images is applied, it cannot be applied to other media such as audio.

その他、動画と音声との組み合わせによる様々な高速再生、短縮再生技術として、前述の組合せ、もしくは、その拡張した手法が提案されている(例えば、特許文献5、6、7参照。)。しかし、これらも前述の手法と同様の欠点があったり、動画に主眼を置き、音声を部分的にしか再生しないために、全体の流れの把握が困難であったりする。
特開平6−202691号公報 特開2000−259200号公報 特開平9−152889号公報 特開平4−237284号公報 特開平6−233227号公報 特開平8−116514号公報 特開2003−169298号公報
In addition, as the various high-speed playback and shortened playback technologies based on combinations of moving images and sounds, the above-described combinations or extended methods thereof have been proposed (see, for example, Patent Documents 5, 6, and 7). However, these also have the same drawbacks as the above-mentioned method, and focus on the moving image, and the sound is only partially reproduced, so that it is difficult to grasp the entire flow.
JP-A-6-202691 JP 2000-259200 A Japanese Patent Laid-Open No. 9-152889 JP-A-4-237284 JP-A-6-233227 JP-A-8-116514 JP 2003-169298 A

前記の従来技術は、全体もしくは部分区間毎に均一に高速再生する方式であるための限界を持ち、より短縮するために、各メディア特有の処理を加えることで汎用性をなくす結果となっている。   The above prior art has a limit because it is a method of reproducing at high speed uniformly in whole or in a partial section, and in order to shorten it further, it results in eliminating versatility by adding processing specific to each medium. .

本発明は、以上のような従来技術の実情に鑑みてなされたもので、その目的は、使用者が短時間で内容を把握できるように了解性をできるだけ保持したまま、より高速な再生を可能にすると共に、音声や動画に特化せず、他の連続メディアや複合メディアにも適用できる連続メディア高速再生技術を提供することにある。   The present invention has been made in view of the above-described prior art, and the purpose of the present invention is to enable higher-speed playback while maintaining as much intelligibility as possible so that the user can grasp the contents in a short time. In addition, it is intended to provide a continuous media high-speed playback technology that can be applied to other continuous media and composite media without specializing in audio and video.

そこで前記課題を解決するために、請求項1に記載の発明は、連続メディアデータを短縮して再生する連続メディアデータ高速再生方法であって、連続メディアデータをフレーム区間に分割し、各フレーム区間の特徴パラメータの変化量を計算する過程と、特徴パラメータの変化量の大きなフレームのみを連結してデータを再構成する過程と、連結された再構成データを再生する過程と、を有することを特徴とする。   Accordingly, in order to solve the above problem, the invention according to claim 1 is a continuous media data high-speed reproduction method for reproducing continuous media data by shortening the continuous media data, and dividing the continuous media data into frame segments. A process for calculating a feature parameter change amount, a process for reconstructing data by concatenating only frames having a large feature parameter change quantity, and a process for reproducing the connected reconstructed data. And

また、請求項2に記載の発明は、請求項1において、前記連続メディアデータが音声データまたは動画データであることを特徴とする。   According to a second aspect of the present invention, in the first aspect, the continuous media data is audio data or moving image data.

また、請求項3に記載の発明は、複数の連続メディアデータからなる複合メディアデータを短縮して再生する複合メディアデータ高速再生方法であって、各連続メディアデータをフレーム区間に分割し、各フレーム区間の特徴パラメータの変化量を計算する過程と、各連続メディアデータの特徴パラメータの変化量から、統合した特徴パラメータの変化量を計算する過程と、統合した特徴パラメータの変化量の大きなフレームのみを連結して各連続メディアデータごとに再構成データを生成する過程と、この再構成データを再生する過程と、を有することを特徴とする。   According to a third aspect of the present invention, there is provided a composite media data high-speed playback method for shortening and playing back composite media data comprising a plurality of continuous media data, wherein each continuous media data is divided into frame sections. The process of calculating the change amount of the feature parameter of the section, the process of calculating the change amount of the integrated feature parameter from the change amount of the feature parameter of each continuous media data, and only the frame with the large change amount of the integrated feature parameter It has a process of generating reconstructed data for each piece of continuous media data and a process of reproducing the reconstructed data.

また、請求項4に記載の発明は、多チャンネルの連続メディアデータを短縮して再生する多チャンネル連続メディアデータ高速再生方法であって、各チャンネルの連続メディアデータをフレーム区間に分割し、各フレーム区間の特徴パラメータの変化量を計算する過程と、各チャンネルの連続メディアデータの特徴パラメータの変化量から、統合した特徴パラメータの変化量を計算する過程と、統合した特徴パラメータの変化量の大きなフレームのみを連結して各チャンネルごとに再構成データを生成する過程と、この再構成データを再生する過程と、を有することを特徴とする。   According to a fourth aspect of the present invention, there is provided a multi-channel continuous media data high-speed reproduction method for reproducing multi-channel continuous media data by shortening the multi-channel continuous media data. The process of calculating the amount of change of the feature parameter of the section, the process of calculating the amount of change of the integrated feature parameter from the amount of change of the feature parameter of the continuous media data of each channel, and the frame with the large amount of change of the integrated feature parameter And a process of generating reconstruction data for each channel and a process of reproducing the reconstruction data.

また、請求項5に記載の発明は、動画データと音声データとからなる映像データを短縮して再生する映像データ高速再生方法であって、映像データを動画データと音声データとに分割する過程と、動画データをフレーム区間に分割し、各フレーム区間の特徴パラメータの変化量を計算する過程と、音声データをフレーム区間に分割し、各フレーム区間の特徴パラメータの変化量を計算する過程と、動画データの特徴パラメータの変化量と音声データの特徴パラメータの変化量とから映像データの特徴パラメータの変化量を計算する過程と、映像データの特徴パラメータの変化量の大きい動画データのフレームのみを連結して再構成動画データを生成する過程と、映像データの特徴パラメータの変化量の大きい音声データのフレームのみを連結して再構成音声データを生成する過程と、再構成動画データと再構成音声データとを合成し、再構成映像データを生成する過程と、生成した再構成映像データを再生する過程と、を有することを特徴とする。   According to a fifth aspect of the present invention, there is provided a video data high-speed reproduction method for reproducing video data composed of video data and audio data by shortening the video data, wherein the video data is divided into video data and audio data. Dividing the moving image data into frame sections and calculating the amount of change in the feature parameters in each frame section; dividing the audio data into frame sections and calculating the amount of change in the feature parameters in each frame section; The process of calculating the change amount of the feature parameter of the video data from the change amount of the feature parameter of the data and the change amount of the feature parameter of the audio data, and only the frame of the moving image data having the large change amount of the feature parameter of the video data is connected. The process of generating reconstructed video data and connecting only frames of audio data with large changes in video data feature parameters Generating reconstructed audio data, synthesizing the reconstructed video data and reconstructed audio data to generate reconstructed video data, and reproducing the generated reconstructed video data. It is characterized by.

また、請求項6に記載の発明は、連続メディアデータを短縮して再生する連続メディアデータ高速再生装置であって、連続メディアデータをフレーム区間に分割し、各フレーム区間の特徴パラメータの変化量を計算する手段と、特徴パラメータの変化量の大きなフレームのみを連結してデータを再構成する手段と、連結された再構成データを再生する手段と、を有することを特徴とする。   According to a sixth aspect of the present invention, there is provided a continuous media data high-speed playback device that shortens and plays back continuous media data. The continuous media data is divided into frame sections, and the amount of change in the characteristic parameter of each frame section is determined. It is characterized by comprising means for calculating, means for reconstructing data by concatenating only frames with a large amount of change in characteristic parameters, and means for reconstructing the concatenated reconstructed data.

また、請求項7に記載の発明は、請求項6において、前記連続メディアデータが音声データまたは動画データであることを特徴とする。   According to a seventh aspect of the present invention, in the sixth aspect, the continuous media data is audio data or moving image data.

また、請求項8に記載の発明は、複数の連続メディアデータからなる複合メディアデータを短縮して再生する複合メディアデータ高速再生装置であって、各連続メディアデータをフレーム区間に分割し、各フレーム区間の特徴パラメータの変化量を計算する手段と、各連続メディアデータの特徴パラメータの変化量から、統合した特徴パラメータの変化量を計算する手段と、統合した特徴パラメータの変化量の大きなフレームのみを連結して各連続メディアデータごとに再構成データを生成する手段と、この再構成データを再生する手段と、を有することを特徴とする。   The invention according to claim 8 is a composite media data high-speed playback device that shortens and plays back composite media data composed of a plurality of continuous media data, and divides each continuous media data into frame sections. A means for calculating the change amount of the feature parameter of the section, a means for calculating the change amount of the integrated feature parameter from the change amount of the feature parameter of each continuous media data, and only a frame having a large change amount of the integrated feature parameter. It is characterized by having means for connecting and generating reconstructed data for each continuous media data and means for reproducing the reconstructed data.

また、請求項9に記載の発明は、多チャンネルの連続メディアデータを短縮して再生する多チャンネル連続メディアデータ高速再生装置であって、各チャンネルの連続メディアデータをフレーム区間に分割し、各フレーム区間の特徴パラメータの変化量を計算する手段と、各チャンネルの連続メディアデータの特徴パラメータの変化量から、統合した特徴パラメータの変化量を計算する手段と、統合した特徴パラメータの変化量の大きなフレームのみを連結して各チャンネルごとに再構成データを生成する手段と、この再構成データを再生する手段と、を有することを特徴とする。   According to a ninth aspect of the present invention, there is provided a multi-channel continuous media data high-speed playback device for reproducing multi-channel continuous media data by shortening the multi-channel continuous media data. Means for calculating the amount of change of the feature parameter of the section, means for calculating the amount of change of the integrated feature parameter from the amount of change of the feature parameter of the continuous media data of each channel, and a frame with a large amount of change of the integrated feature parameter And a means for generating reconstructed data for each channel and a means for reproducing the reconstructed data.

また、請求項10に記載の発明は、動画データと音声データとからなる映像データを短縮して再生する映像データ高速再生装置であって、映像データを動画データと音声データとに分割する手段と、動画データをフレーム区間に分割し、各フレーム区間の特徴パラメータの変化量を計算する手段と、音声データをフレーム区間に分割し、各フレーム区間の特徴パラメータの変化量を計算する手段と、動画データの特徴パラメータの変化量と音声データの特徴パラメータの変化量とから映像データの特徴パラメータの変化量を計算する手段と、映像データの特徴パラメータの変化量の大きい動画データのフレームのみを連結して再構成動画データを生成する手段と、映像データの特徴パラメータの変化量の大きい音声データのフレームのみを連結して再構成音声データを生成する手段と、再構成動画データと再構成音声データとを合成し、再構成映像データを生成する手段と、生成した再構成映像データを再生する手段と、を有することを特徴とする。   According to a tenth aspect of the present invention, there is provided a video data high-speed playback device that shortens and plays back video data composed of video data and audio data, and means for dividing the video data into video data and audio data; Means for dividing the moving image data into frame sections and calculating the amount of change in the feature parameter in each frame section; means for dividing the audio data into frame sections and calculating the amount of change in the feature parameter in each frame section; A means for calculating the amount of change of the feature parameter of the video data from the amount of change of the feature parameter of the data and the amount of change of the feature parameter of the audio data is connected to only the frame of the video data having a large amount of change of the feature parameter of the video data. Only the frame of the audio data having a large amount of change in the feature parameter of the video data is connected. Generating reconstructed audio data, synthesizing the reconstructed video data and reconstructed audio data, generating reconstructed video data, and reproducing the generated reconstructed video data It is characterized by that.

また、請求項11に記載の発明は、プログラムであって上記の請求項1〜10のいずれか1項に記載の方法または装置を、コンピュータプログラムで記載してそれを実行可能にしたことを特徴とする。   The invention described in claim 11 is a program, characterized in that the method or apparatus according to any one of claims 1 to 10 described above is described as a computer program and can be executed. And

また、請求項12に記載の発明は、記録媒体であって上記の請求項1〜10のいずれか1項に記載の方法または装置を、コンピュータで実行可能に記載したプログラムを記録したことを特徴とする。   The invention described in claim 12 is a recording medium in which a program which records the method or apparatus described in any one of claims 1 to 10 so as to be executable by a computer is recorded. And

なお、特許請求の範囲にいう、特徴パラメータの変化量の大きなフレームは、閾値を設定しこの閾値より大きいものを採用する等の方法により決定することができるがこれに限定されるものではなく、データの了解性の高い部分のみを抽出できるものあればよい。   It should be noted that a frame with a large amount of change in the characteristic parameter referred to in the claims can be determined by a method such as setting a threshold and adopting a larger one than this threshold, but is not limited thereto. What can extract only the part with high intelligibility of data is sufficient.

また、特許請求の範囲にいう、多チャンネルの連続メディアデータとは、例えば、2カ国語音声、多地点音声、多地点動画などの同じ種類のメディアの多重化を意味するものである。   The multi-channel continuous media data referred to in the claims means multiplexing of the same type of media such as bilingual audio, multi-point audio, and multi-point video.

本発明では、全体、もしくは部分区間毎に均一に線形的に圧縮し高速再生するのではなく、了解性の高い部分のみを抽出し非線形に圧縮することにより、従来技術より圧縮率が高く、再生時間を短縮した高速な再生が可能になる。   In the present invention, the compression rate is higher than that of the prior art by extracting only highly intelligible parts and compressing them non-linearly, instead of compressing them uniformly and linearly for the whole or partial sections and performing non-linear compression. High-speed playback with reduced time becomes possible.

了解性の高い部分の計算方法は、データを、データの内容の特徴を表現するような時系列パラメータに変換し、そのパラメータの大きい部分が、特徴をよく表わしていることに相当し、了解性が高い部分であるとみることができる。そのパラメータの変化量の大きい部分に対応する部分データ(フレーム)を連結して再生することにより、データの内容の特徴をできるだけ残したまま、了解性の高い高速再生を可能にする。   The method of calculating the highly intelligible part corresponds to the fact that the data is converted into time-series parameters that express the characteristics of the data content, and the large part of the parameters expresses the characteristics well. Can be seen as a high part. By concatenating and reproducing partial data (frames) corresponding to a part with a large change amount of the parameter, it is possible to perform high-speed reproduction with high intelligibility while retaining the characteristics of the data contents as much as possible.

本発明によれば、時間軸に対し非線形な高速再生が可能となり、線形的な高速再生よりメディアの内容の特徴を多く残すため了解性が高く、かつ、圧縮率が高いという利点がある。   According to the present invention, it is possible to perform high-speed playback that is non-linear with respect to the time axis, and there are advantages in that the intelligibility is high and the compression rate is high because many features of the contents of the media are left as compared with linear high-speed playback.

また、本発明で用いている特徴パラメータの変化量という指標は汎用的であり、どんな連続メディアのパラメータにも適用できる点、パラメータの選択により様々な特徴を優先した高速再生が可能となる点、異なるメデイアでも統一的に扱える点、多チャンネルのメディアを統合した高速再生が可能となる点などの利点がある。   In addition, the feature parameter change amount used in the present invention is general-purpose and can be applied to any continuous media parameter, and high-speed playback giving priority to various features by selecting parameters is possible. There are advantages such as being able to handle different media in a unified manner and enabling high-speed playback that integrates multi-channel media.

特に、連続メディアとして音声に適用した場合、従来の線形的な高速再生より了解性が高く、圧縮率も高い高遠再生が可能である。了解性を保つ圧縮率の上限は、音声の内容によって異なるが、一般的に、従来の線形的な高速再生では2〜3倍程度であったのに対し、本発明では5倍程度の高速再生が可能である。   In particular, when applied to audio as continuous media, high-distance reproduction with higher intelligibility and higher compression rate than conventional linear high-speed reproduction is possible. The upper limit of the compression rate that maintains intelligibility varies depending on the content of the audio, but in general, it was about 2 to 3 times in the conventional linear high speed playback, but in the present invention, it is about 5 times high speed playback. Is possible.

また、複合メディアである映像に適用した場合、動画と音声の両方の特徴を残しながら、同期した高速再生が可能である。   In addition, when applied to video that is a composite media, synchronized high-speed playback is possible while retaining both video and audio features.

本発明の実施の形態について図面を用いて説明する。   Embodiments of the present invention will be described with reference to the drawings.

(第1実施形態)
図1は本発明の連続メディア高速再生装置の一例を示すブロック構成図である。図1示すように、連続メディア高速再生装置は、連続メディア入力部1と変化量パラメータ抽出部2と変化量パラメータ解析・再生フレーム選択部3と再生速度指示部4と連続メディア再構成部5と連続メディア出力部6とから構成される。なお、音声高速再生装置は、上述の装置において連続メディアとして音声メディアを適用した場合のものである。
(First embodiment)
FIG. 1 is a block diagram showing an example of a continuous media high-speed playback device of the present invention. As shown in FIG. 1, the continuous media high-speed playback apparatus includes a continuous media input unit 1, a change parameter extraction unit 2, a change parameter analysis / playback frame selection unit 3, a playback speed instruction unit 4, and a continuous media reconstruction unit 5. And a continuous media output unit 6. Note that the high-speed audio playback device is one in which audio media is applied as continuous media in the above-described device.

連続メディア入力部1と変化量パラメータ抽出部2とで構成される部分は、連続メディアデータをフレーム区間に分割し、それぞれのフレーム区間の特徴パラメータの変化量を計算する手段に相当する。   The portion constituted by the continuous media input unit 1 and the change amount parameter extraction unit 2 corresponds to means for dividing the continuous media data into frame sections and calculating the change amount of the characteristic parameter in each frame section.

変化量パラメータ解析・再生フレーム選択部3と再生速度指示部4と連続メディア再構成部5とで構成される部分は、変化量の大きなフレームのみを連結する手段に相当する。   The part constituted by the change amount parameter analysis / playback frame selection unit 3, the playback speed instruction unit 4, and the continuous media reconstruction unit 5 corresponds to means for connecting only frames having a large change amount.

連続メディア出力部6は、連結された再構成データを再生する手段に相当する。   The continuous media output unit 6 corresponds to means for reproducing the connected reconstructed data.

連続メディア入力部1は、入力された連続メディアデータをバッファに読み込んで、変化量パラメータ抽出部2に送る。例えば、連続メディア入力部1の入力は、入力されるデータがアナログデータである場合にはこれをデジタルデータに変換しながら読み込んでもよいし、直接デジタルデータとして、ファイル形式の連続メディアデータを読み込んでもよいし、メモリに蓄積された連続メディアデータを読み込んでもよい。   The continuous media input unit 1 reads the input continuous media data into a buffer and sends it to the change amount parameter extraction unit 2. For example, when the input data is analog data, the input of the continuous media input unit 1 may be read while being converted into digital data, or may be read directly as file format continuous media data. Alternatively, continuous media data stored in the memory may be read.

読み込むデータ量は、全体を一括で読み込んでもよいし、一定単位の量を周期的に読み込んでもよいし、動的に任意の量を読み込んでもよい。   As for the amount of data to be read, the entire data may be read at once, a fixed amount of data may be read periodically, or an arbitrary amount may be dynamically read.

また必要に応じて、バッファに読み込む前、もしくは、バッファから変化量パラメータ抽出部2へ出力する時に、入力された連続メディアのデジタルデータを変化量パラメータ抽出部2に合わせてフォーマット変換する処理を加えてもよい。   In addition, if necessary, before the data is read into the buffer or when it is output from the buffer to the change amount parameter extraction unit 2, processing for converting the format of the input digital data of the continuous media according to the change amount parameter extraction unit 2 is added. May be.

また、読み込んだバッファから変化量パラメータ抽出部2へ出力するデータ量は、連続メディアデータの全体を一括で渡してもよいし、一定単位の量に分割して周期的に渡してもよいし、動的に任意の量を逐次渡してもよい。出力するデータ量は、読み込むデータ量と同じ量でもよいし、異なってもよい(異なる場合は、連続メディア入力部1でバッファリングすることになる。)。   The amount of data to be output from the read buffer to the change amount parameter extraction unit 2 may be transferred as a whole of the continuous media data in a lump, or may be periodically divided and transferred in a fixed unit amount. Any amount may be sequentially passed dynamically. The amount of data to be output may be the same as or different from the amount of data to be read (if different, buffering is performed by the continuous media input unit 1).

入力される連続メディアデータが、変化量パラメータ抽出部2が必要とするフォーマットであり、データを全て変化量パラメータ抽出部2に一括で渡す等する場合には、連続メディア入力部1の機能を変化量パラメータ抽出部2を含めた構成にすることも可能である。   If the input continuous media data is in the format required by the variation parameter extraction unit 2 and all the data is transferred to the variation parameter extraction unit 2 at once, the function of the continuous media input unit 1 is changed. A configuration including the quantity parameter extraction unit 2 is also possible.

変化量パラメータ抽出部2は、連続メディア入力部1からの連続メディアデータを一定周期の小区間(フレーム区間)に分割し、それぞれのフレーム区間の代表となる特徴パラメータの変化量を計算する。例えば連続メディアデータから一旦フレーム区間の代表となる特徴パラメータを計算した後、その特徴パラメータの時系列から変化量を計算してもよいし、連続メディアデータから直接フレーム区間の代表となる特徴パラメータの変化量を計算してもよい。   The change amount parameter extraction unit 2 divides the continuous media data from the continuous media input unit 1 into small sections (frame sections) having a fixed period, and calculates a change amount of a characteristic parameter representing each frame section. For example, after calculating a feature parameter representative of a frame section from continuous media data, the amount of change may be calculated from the time series of the feature parameter, or a feature parameter representative of a frame section may be directly calculated from continuous media data. The amount of change may be calculated.

フレーム区間の代表となる特徴パラメータや特徴パラメータの変化量の計算には、フレーム区間内のデータのみから計算してもよいし、フレーム区間外のデータを含めて計算してもよい。   The calculation of the feature parameter representing the frame section and the amount of change of the feature parameter may be calculated from only the data in the frame section, or may be calculated including data outside the frame section.

特徴パラメータは、スカラーでもよいし、2次元以上のベクトルでもよい。特徴パラメータの変化量は計算するフレームの特徴パラメータと前フレームもしくは後フレームの特徴パラメータとの2値の距離(数学でいう距離の公理を満たす距離関数で定義できるもの。例えば、マンハッタン距離、ユークリッド距離、べき乗距離、チェビシェフ距離、マハラノビス距離等を用いることができる。)でもよいし、計算するフレームの前フレームの特徴パラメータと後フレームの特徴パラメータとの2値の距離の2分の1でもよいし、計算するフレームの前後複数フレームを含めた特徴パラメータn値から距離等を用いて計算される値でもよい。   The feature parameter may be a scalar or a vector of two or more dimensions. The change amount of the feature parameter is a binary distance between the feature parameter of the frame to be calculated and the feature parameter of the previous frame or the subsequent frame (which can be defined by a distance function that satisfies the mathematical distance axiom. For example, Manhattan distance, Euclidean distance , Power distance, Chebyshev distance, Mahalanobis distance, etc. may be used.) Or may be a half of the binary distance between the feature parameter of the previous frame and the feature parameter of the subsequent frame of the frame to be calculated. A value calculated using a distance or the like from the characteristic parameter n value including a plurality of frames before and after the frame to be calculated may be used.

再生速度指示部4は、高速再生する時の再生速度を変化量パラメータ解析・再生フレーム選択部3に指示する。そして、   The reproduction speed instruction unit 4 instructs the change amount parameter analysis / reproduction frame selection unit 3 on the reproduction speed for high-speed reproduction. And

Figure 2005204003
Figure 2005204003

により変化量パラメータ解析・再生フレーム選択部3で選択する再生フレーム数を計算する。 To calculate the number of playback frames to be selected by the change amount parameter analysis / playback frame selection unit 3.

また、例えば、一括で連続メディアデータを処理する場合に、再生速度の代わりに再生時間を指示してもよい。このときは、   Further, for example, when continuous media data is processed at once, a playback time may be indicated instead of the playback speed. At this time,

Figure 2005204003
Figure 2005204003

から再生フレーム数を計算することができる。 From this, the number of playback frames can be calculated.

変化量パラメータ解析・再生フレーム選択部3は、変化量パラメータ抽出部2で計算した特徴パラメータの変化量の大きい方から、再生速度指示部4から指示された再生フレーム数だけ選択する。   The variation parameter analysis / reproduction frame selection unit 3 selects the number of reproduction frames instructed by the reproduction speed instruction unit 4 from the larger one of the characteristic parameter variation calculated by the variation parameter extraction unit 2.

連続メディア再構成部5は、変化量パラメータ解析・再生フレーム選択部3で選択された再生フレーム数のフレームに対応する連続メディアデータのフレーム区間データを順序関係を維持しながら連結し再構成する。   The continuous media reconstruction unit 5 concatenates and reconstructs the frame section data of the continuous media data corresponding to the number of playback frames selected by the variation parameter analysis / playback frame selection unit 3 while maintaining the order relation.

例えば、連結する際に、連結する前後のデータの不連続性を軽減するため連結する前後のデータに平滑化処理を加えてもよい。対応する連続メディアデータは、連続メディア入力部1から変化量パラメータ抽出部2、変化量パラメータ解析・再生フレーム選択部3を経由して受け取ってもよいし、連続メディア入力部1から直接受け取ってもよい。   For example, when connecting, smoothing processing may be added to the data before and after the connection in order to reduce the discontinuity of the data before and after the connection. Corresponding continuous media data may be received from the continuous media input unit 1 via the variation parameter extraction unit 2, the variation parameter analysis / playback frame selection unit 3, or may be received directly from the continuous media input unit 1. Good.

連続メディア出力部6は、連続メディア再構成部5で再構成した連続メディアデータを出力する。例えば、出力は、外部出力デバイスに随時出力してもよいし、後で再生することを目的として、記録媒体にファイルとして出力してもよいし、メモリ等の記憶媒体に出力し別の装置、アプリケーションが逐次利用できるようにしてもよい。   The continuous media output unit 6 outputs the continuous media data reconstructed by the continuous media reconstruction unit 5. For example, the output may be output to an external output device as needed, or may be output as a file on a recording medium for the purpose of later reproduction, or output to a storage medium such as a memory and another device, Applications may be used sequentially.

(第2実施形態)
図2は本発明による複合メディア高速再生装置の一例を示すブロック構成図である。図2に示すように複合メディア高速再生装置は、連続メディア1入力部21−1から連続メディアn入力部21−nのn個の連続メディア入力部とパラメータ1抽出部22−1からパラメータn抽出部22−nのn個の変化量パラメータ抽出部とパラメータ合成部23と変化量パラメータ解析・再生フレーム選択部24と再生速度指示部25と連続メディア1再構成部26−1から連続メディアn再構成部26−nのn個の連続メディア再構成部と連続メディア1出力部27−1から連続メディアn出力部27−nのn個の連続メディア出力部とから成る。
(Second embodiment)
FIG. 2 is a block diagram showing an example of a composite media high-speed playback apparatus according to the present invention. As shown in FIG. 2, the composite media high-speed playback apparatus extracts n continuous media input units from continuous media 1 input unit 21-1 to continuous media n input unit 21-n and parameter n extraction from parameter 1 extraction unit 22-1. N-variation parameter extraction unit, parameter synthesis unit 23, variation parameter analysis / reproduction frame selection unit 24, reproduction speed instruction unit 25, and continuous medium 1 reconstruction unit 26-1 The configuration unit 26-n includes n continuous media reconstruction units and the continuous media 1 output unit 27-1 to n continuous media output units 27-n.

なお、多チャンネル連続メディア高速再生装置は、上述の複合メディア高速再生装置において、n種類のメディアで構成された複合メディアではなくnチャンネルで構成された多チャンネル連続メディアを適用した場合のものである。   Note that the multi-channel continuous media high-speed playback device is a case where the multi-channel continuous media configured with n channels is applied to the above-described composite media high-speed playback device instead of the composite media configured with n types of media. .

連続メディア1入力部21−1から連続メディアn入力部21−nのn個の連続メディア入力部とパラメータ1抽出部22−1からパラメータn抽出部22−nのn個の変化量パラメータ抽出部とで構成される部分は、複合メディア高速再生装置のそれぞれの連続メディアデータをフレーム区間に分割し、それぞれのフレーム区間のそれぞれの連続メディアデータの特徴パラメータの変化量を計算する手段に相当する。   N continuous media input units from continuous media 1 input unit 21-1 to continuous media n input unit 21-n and n change parameter extraction units from parameter 1 extraction unit 22-1 to parameter n extraction unit 22-n The part constituted by and corresponds to means for dividing each continuous media data of the composite media high-speed playback device into frame sections, and calculating a change amount of a characteristic parameter of each continuous media data in each frame section.

パラメータ合成部23は、複合メデイア高速再生装置の複数の連続メディアデータの特徴パラメータの変化量から統合した連続メディアデータの特徴パラメータの変化量を計算する手段に相当する。   The parameter synthesizing unit 23 corresponds to means for calculating the amount of change of the feature parameter of the continuous media data integrated from the amount of change of the feature parameter of the plurality of continuous media data of the composite media high-speed playback device.

変化量パラメータ解析・再生フレーム選択部24と再生速度指示部25と連続メデイア1再構成部26−1から連続メデイアn再構成部26−nのn個の連続メディア再構成部とで構成される部分は、複合メディア高速再生装置の統合した特徴パラメータの変化量の大きなフレームのみを連結する手段に相当する。   It is composed of a change parameter analysis / playback frame selection unit 24, a playback speed instruction unit 25, and a continuous media 1 reconstruction unit 26-1 to n continuous media reconstruction units 26-n. The portion corresponds to means for connecting only frames with a large amount of change in the characteristic parameters integrated in the composite media high-speed playback apparatus.

連続メディア1出力部27−1から連続メディアn出力部27−nのn個の連続メディア出力部は、複合メディア高速再生装置の連結された再構成データを再生する手段に相当する。   The n continuous media output units from the continuous media 1 output unit 27-1 to the continuous media n output unit 27-n correspond to means for reproducing the connected reconstructed data of the composite media high-speed playback device.

連続メディア1入力部21−1から連続メディアn入力部21−nは、それぞれ対応する入力された連続メディアデータ1から連続メディアデータnをそれぞれのバッファに読み込んで、それぞれに対応するパラメータ1抽出部22−1からパラメータn抽出部22−nに同期をとって送る。   The continuous media 1 input unit 21-1 to the continuous media n input unit 21-n respectively read the corresponding continuous media data 1 from the continuous media data 1 read into the respective buffers, and corresponding parameter 1 extraction units. The data is sent from 22-1 to the parameter n extraction unit 22-n in synchronization.

各連続メディア入力部は連続メディア高速再生装置の連続メディア入力部1と同様の処理に加え、各連続メディア入力部間で各パラメータ抽出部に送るデータ量を同じ時間、分(サイズが同じとは限らず、再生した場合に同じ時間となる量等)に合わせ、同じタイミング(厳密に動作時間を合わせる必要はないがデータの処理位置、順序を同一にする)に同期して送る。   In addition to the same processing as the continuous media input unit 1 of the continuous media high-speed playback device, each continuous media input unit sets the same amount of data to be sent to each parameter extraction unit between the continuous media input units. It is not limited to this, and is sent in synchronism with the same timing (the amount of processing time and the order of data is the same, although it is not strictly necessary to match the operation time) in accordance with the amount of time that is the same when reproduced.

各連続メディア入力部間で各連続メディアデータを読み込むデータ量、タイミングについては同期してもよいが、同期しなくてもよい。   The data amount and timing for reading each continuous media data between the continuous media input units may be synchronized, but may not be synchronized.

パラメータ1抽出部22−1からパラメータn抽出部22−nは、それぞれに対応する連続メディア入力部から受信したそれぞれの連続メディアデータを一定周期の小区間(フレーム区間)に分割し、それぞれのフレーム区間の代表となる特徴パラメータの変化量を計算する。   The parameter 1 extraction unit 22-1 to the parameter n extraction unit 22-n divide each piece of continuous media data received from the corresponding continuous media input unit into small sections (frame sections) having a fixed period, and The amount of change of the characteristic parameter that represents the section is calculated.

各パラメータ抽出部のフレーム区間長(フレーム周期)が共通である他は、各パラメータ抽出部は連続メディア高速再生装置の変化量パラメータ抽出部2と同様の処理を行う。   Each parameter extraction unit performs the same process as the change amount parameter extraction unit 2 of the continuous media high-speed playback device, except that the frame length (frame period) of each parameter extraction unit is common.

パラメータ合成部23は、パラメータ1抽出部22−1からパラメータn抽出部22−nのn個のパラメータ抽出部からそれぞれの特徴パラメータの変化量を取得する。それぞれの特徴パラメータの変化量は、同一フレーム数の時系列データであり、加重平均により、1つの変化量の時系列データに変換し、統合した特徴パラメータ変化量を求める(加重平均は、それぞれの特徴パラメータの変化量の単位が異なる場合の正規化やそれぞれの連続メディアに対して重み付けを行う場合を含み、平均方法についても算術平均や幾何平均等の場合を含む。正規化方法も例えば、それぞれの特徴パラメータの変化量の最大値でそれぞれの特徴パラメータの変化量の値を割ることにより、0から1の値に正規化してもよいし、それぞれの特徴パラメータの変化量の平均値で割ることにより正規化してもよいし、それぞれの特徴パラメータの変化量の分散で割ることにより正規化してもよい。)。   The parameter synthesizing unit 23 acquires the amount of change of each feature parameter from the n parameter extracting units of the parameter 1 extracting unit 22-1 to the parameter n extracting unit 22-n. The amount of change of each feature parameter is time-series data of the same number of frames, and is converted into time-series data of one change amount by weighted average to obtain an integrated feature parameter change amount (weighted average This includes normalization when the unit of change amount of the characteristic parameter is different and weighting each continuous media, and also includes the case of arithmetic average, geometric average, etc. By dividing the value of the change amount of each feature parameter by the maximum value of the change amount of the feature parameter, normalization from 0 to 1 may be performed, or dividing by the average value of the change amount of each feature parameter. Or may be normalized by dividing by the variance of the amount of change of each feature parameter.

再生速度指示部25は、連続メディア高速再生装置の再生速度指示部4と同様の処理を行う。   The playback speed instruction unit 25 performs the same processing as the playback speed instruction unit 4 of the continuous media high speed playback device.

変化量パラメータ解析・再生フレーム選択部24は、パラメータ合成部23で計算した、統合した特徴パラメータの変化量の大きい方から、再生速度指示部25から指示された再生フレーム数だけ選択する。   The variation parameter analysis / reproduction frame selection unit 24 selects the number of reproduction frames instructed from the reproduction speed instruction unit 25 from the larger variation amount of the integrated feature parameter calculated by the parameter synthesis unit 23.

連続メデイア1再構成部26−1から連続メディアn再構成部26−nは、変化量パラメータ解析・再生フレーム選択部24で選択された再生フレーム数のフレームに対応するそれぞれの連続メディアデータのフレーム区間データを順序関係を維持しながらそれぞれ連結しそれぞれ再構成する。   The continuous media 1 reconstructing unit 26-1 to the continuous media n reconfiguring unit 26-n are frames of the respective continuous media data corresponding to the frames of the number of playback frames selected by the change parameter analysis / playback frame selection unit 24. The section data is connected and reconfigured while maintaining the order relation.

例えば、連結する際に、連結する前後のデータの不連続性を軽減するため連結する前後のデータに平滑化処理を加えてもよい。平滑化処理を加えるのは、全ての連続メデイア再構成部でもよいし、一部の連続メディア再構成部でもよい。   For example, when connecting, smoothing processing may be added to the data before and after the connection in order to reduce the discontinuity of the data before and after the connection. The smoothing process may be applied to all continuous media reconstruction units or a part of continuous media reconstruction units.

対応するそれぞれの連続メディアデータは、それぞれの連続メデイア入力部からそれぞれのパラメータ抽出部、パラメータ合成部23、変化量パラメータ解析・再構成フレーム選択部24を経由して受け取ってもよいし、それぞれの連続メディア入力部から直接受け取ってもよい。   Each corresponding continuous media data may be received from each continuous media input unit via each parameter extraction unit, parameter synthesis unit 23, change parameter analysis / reconstruction frame selection unit 24, You may receive directly from a continuous media input part.

連続メディア1出力部27−1から連続メディアn出力部27−nは、それぞれ対応するそれぞれの連続メディア再構成部で再構成した連続メディアデータをそれぞれ出力する。   The continuous media 1 output unit 27-1 to the continuous media n output unit 27-n respectively output the continuous media data reconstructed by the corresponding continuous media reconstruction unit.

各連続メディア出力部は、同期をとって出力してもよいし、しなくてもよい。例えば、外部出力デバイスに随時出力する場合に同期をとって出力してもよいし、後で再生することを目的として、記録媒体にファイルとして出力したり、メモリ等の記憶媒体に出力し別の装置、アプリケーションが逐次利用できるようにする場合は、同期をとらなくてもよい。   Each continuous media output unit may or may not output in synchronization. For example, when outputting to an external output device at any time, it may be output in synchronization, or for later playback, it may be output as a file on a recording medium or output to a storage medium such as a memory. When devices and applications can be used sequentially, there is no need to synchronize.

(第3実施形態)
図3は本発明による映像高速再生装置の実施形態の一例を示すブロック構成図である。図3に示すように、映像高速再生装置は、映像入力部31と動画・音声分離部32と動画パラメータ抽出部33と音声パラメータ抽出部34とパラメータ合成部35と変化量パラメータ解析・再生フレーム選択部36と再生速度指示部37と動画再構成部38と音声再構成部39と動画・音声合成部40と映像出力部41とから構成される。
(Third embodiment)
FIG. 3 is a block diagram showing an example of an embodiment of a high-speed video playback apparatus according to the present invention. As shown in FIG. 3, the high-speed video playback apparatus includes a video input unit 31, a video / audio separation unit 32, a video parameter extraction unit 33, an audio parameter extraction unit 34, a parameter synthesis unit 35, a change parameter analysis / playback frame selection. A unit 36, a playback speed instruction unit 37, a moving image reconstruction unit 38, an audio reconstruction unit 39, a moving image / sound synthesis unit 40, and a video output unit 41.

映像入力部31と動画・音声分離部32とで構成される部分は、映像高速再生装置の映像データを動画データと音声データとに分離する手段に相当する。   The part constituted by the video input unit 31 and the moving image / audio separating unit 32 corresponds to means for separating the video data of the video high-speed playback device into moving image data and audio data.

動画パラメータ抽出部33は、映像高速再生装置の動画データをフレーム区間に分割し、それぞれのフレーム区間の特徴パラメータの変化量を計算する手段に相当する。   The moving image parameter extraction unit 33 corresponds to a unit that divides moving image data of the video high-speed playback device into frame sections and calculates the amount of change in the characteristic parameter in each frame section.

音声パラメータ抽出部34は、映像高速再生装置の音声データをフレーム区間に分割し、それぞれのフレーム区間の特徴パラメータの変化量を計算する手段に相当する。   The audio parameter extraction unit 34 corresponds to means for dividing the audio data of the video high-speed playback device into frame sections and calculating the amount of change in the characteristic parameter in each frame section.

パラメータ合成部35は、映像高速再生装置の動画データの特徴パラメータの変化量と音声データの特徴パラメータの変化量とから映像データとしての特徴パラメータの変化量を計算する手段に相当する。   The parameter synthesizer 35 corresponds to means for calculating the amount of change of the feature parameter as the video data from the amount of change of the feature parameter of the moving image data and the amount of change of the feature parameter of the audio data of the video high-speed playback device.

変化量パラメータ解析・再生フレーム選択部36と再生速度指示部37と動画再構成部38とで構成される部分は、映像高速再生装置の映像データの特徴パラメータの変化量の大きな動画データのフレームのみを連結する手段に相当する。   The portion constituted by the change parameter analysis / playback frame selection unit 36, the playback speed instruction unit 37, and the moving image reconstruction unit 38 is only a frame of moving image data having a large amount of change in the characteristic parameter of the video data of the video high speed playback device. It corresponds to a means for connecting the two.

変化量パラメータ解析・再生フレーム選択部36と再生速度指示部37と音声再構成部39とで構成される部分は、映像高速再生装置の映像データの特徴パラメータの変化量の大きな音声データのフレームのみを連結する手段に相当する。   The portion constituted by the change parameter analysis / reproduction frame selection unit 36, the reproduction speed instruction unit 37, and the audio reconstruction unit 39 is only a frame of audio data having a large amount of change in the characteristic parameter of the video data of the high-speed video reproduction apparatus. It corresponds to a means for connecting the two.

動画・音声合成部40は、映像高速再生装置の連結された再構成動画データと再構成音声データとを合成し、再構成映像データを生成する手段に相当する。   The moving image / audio synthesizing unit 40 corresponds to a unit that synthesizes the reconstructed moving image data and the reconstructed audio data that are connected by the high-speed video playback device, and generates reconstructed video data.

映像出力部41は、映像高速再生装置の生成された再構成映像データを再生する手段に相当する。   The video output unit 41 corresponds to means for playing back the reconstructed video data generated by the video high-speed playback device.

映像入力部31は、連続メディア高速再生装置の連続メディア入力部1の連続メディアデータが映像データである場合であり、変化量パラメータ抽出部2の代わりに、動画・音声分離部32にデータを出力する。   The video input unit 31 is a case where the continuous media data of the continuous media input unit 1 of the continuous media high-speed playback device is video data, and outputs the data to the video / audio separation unit 32 instead of the variation parameter extraction unit 2 To do.

動画・音声分離部32は、映像入力部31からの映像データを、動画データと音声データとに分離し、それぞれ動画データを動画パラメータ抽出部33に、音声データを音声パラメータ抽出部34に出力する。   The video / audio separation unit 32 separates the video data from the video input unit 31 into video data and audio data, and outputs the video data to the video parameter extraction unit 33 and the audio data to the audio parameter extraction unit 34, respectively. .

動画パラメータ抽出部33は、連続メディア高速再生装置の変化量パラメータ抽出部2の連続メディアデータが動画データである場合のものである。   The moving image parameter extraction unit 33 is for the case where the continuous media data of the variation parameter extraction unit 2 of the continuous media high-speed playback device is moving image data.

音声パラメータ抽出部34は、連続メディア高速再生装置の変化量パラメータ抽出部2の連続メディアデータが音声データである場合のものである。   The audio parameter extraction unit 34 is used when the continuous media data of the variation parameter extraction unit 2 of the continuous media high-speed playback device is audio data.

パラメータ合成部35は、複合メデイア高速再生装置のパラメータ合成部23と同様の処理を行い、動画パラメータ抽出部33で計算した動画特徴パラメータの変化量と音声パラメータ抽出部34で計算した音声特徴パラメータの変化量とから、統合した映像特徴パラメータの変化量を計算する。   The parameter synthesizing unit 35 performs the same processing as the parameter synthesizing unit 23 of the composite media high-speed playback device, and the amount of change of the moving image feature parameter calculated by the moving image parameter extracting unit 33 and the sound feature parameter calculated by the audio parameter extracting unit 34. The change amount of the integrated video feature parameter is calculated from the change amount.

再生速度指示部37は、連続メディア高速再生装置の再生速度指示部4と同様の処理を行う。   The playback speed instruction unit 37 performs the same processing as the playback speed instruction unit 4 of the continuous media high speed playback device.

変化量パラメータ解析・再生フレーム選択部36は複合メディア高速再生装置の変化量パラメータ解析・再生フレーム選択部24と同様の処理を行う。   The change parameter analysis / playback frame selection unit 36 performs the same processing as the change parameter analysis / playback frame selection unit 24 of the composite media high-speed playback device.

動画再構成部38は、複合メデイア高速再生装置の連続メディア再構成部の1つとして、連続メディアデータが動画データである場合のものである。   The moving image reconstruction unit 38 is one in which continuous media data is moving image data as one of the continuous media reconstruction units of the composite media high-speed playback device.

音声再構成部39は、複合メディア高速再生装置の連続メディア再構成部の1つとして、連続メデイアデータが音声データである場合のものである。   The audio reconstruction unit 39 is one of continuous media reconstruction units of the composite media high-speed playback device, and is used when the continuous media data is audio data.

動画・音声合成部40は、動画再構成部38からの再構成した動画データと音声再構成部39からの再構成した音声データとを、同期をとって映像データに合成する。   The moving image / sound synthesis unit 40 synthesizes the reconstructed moving image data from the moving image reconstruction unit 38 and the reconstructed audio data from the sound reconstruction unit 39 into video data in synchronization.

映像出力部41は、連続メディア高速再生装置の連続メディア出力部6と同様の処理を行い、動画・音声合成部40からの再構成した映像データを出力する。   The video output unit 41 performs the same processing as the continuous media output unit 6 of the continuous media high-speed playback device, and outputs the reconstructed video data from the moving image / sound synthesis unit 40.

なお、本発明の第1〜第3実施形態は、図1、図2および図3に示したものに限定されるものではなく、それらの組合せ、例えば、複合メデイアを多チャンネル処理したり、あるいは、映像を多チャンネル処理する等の変更が可能である。   The first to third embodiments of the present invention are not limited to those shown in FIG. 1, FIG. 2, and FIG. 3, and combinations thereof, for example, composite media are processed in multiple channels, or Changes such as multi-channel processing of video can be made.

また、本発明の連続メディア高速再生装置、音声高速再生装置、複合メディア高速再生装置、多チャンネル連続メデイア高速再生装置および映像高速再生装置は、論理回路等を用いたハードウェアのみによって実現することも可能であるとともに、コンピュータとそれによって実行されるソフトウェアとを用いて実現することも可能である。また、このソフトウェアは、コンピュータ読み取り可能な記録媒体、あるいは通信回線を介して配布することが可能である。   Also, the continuous media high-speed playback device, audio high-speed playback device, composite media high-speed playback device, multi-channel continuous media high-speed playback device, and video high-speed playback device of the present invention may be realized only by hardware using a logic circuit or the like. It is possible to realize this using a computer and software executed thereby. The software can be distributed via a computer-readable recording medium or a communication line.

音声高速再生装置の実施例を図1、図4〜図7を用いて説明する。   An embodiment of a high-speed audio playback device will be described with reference to FIGS. 1 and 4 to 7.

連続メディア入力部で入力された「あき(音素記号「aki」)」と発話した音声データ(例えば、10kHzサンプリング、16ビットリニアPCMで本実施例の説明を行うが、10kHz以外のサンプリング周波数や他の音声符号を用いてもよい。)の音声波形の例を図4に示す。音素記号はそれぞれ発音された音素の区間を示す。   Voice data (for example, 10 kHz sampling, 16-bit linear PCM, which is spoken with “Aki (phoneme symbol“ aki ”)” input at the continuous media input unit will be described in this embodiment. An example of a speech waveform is shown in FIG. Each phoneme symbol indicates a section of the phoneme that is pronounced.

変化量パラメータ抽出部2では、音声データのフレーム区間(例えば、フレーム区間長を10msとして本実施例の説明を行うと、100ポイントの音声データがフレーム区間長の音声データとなる。フレーム区間長は10ms以外でもよい。)に分割し、その代表となる音声パラメータとして音声パワーを計算する。音声パワーの計算には、例えば、フレーム区間を中心にフレーム区間外の音声データを含めた256ポイント(25.6msの音声データ)を用い、窓長256ポイントのブラックマン窓をかけた後、音声パワーの計算を行い、フレーム区間の代表値とすることができる(窓長は256ポイント以外でもよいし、窓の形もブラックマン窓以外を用いてもよいし、窓かけ計算を必ずしも行わなくてもよい。)。   In the variation parameter extraction unit 2, when the present embodiment is described assuming that the frame section of the audio data (for example, the frame section length is 10 ms), the sound data of 100 points becomes the voice data of the frame section length. The voice power may be calculated as a representative voice parameter. For the calculation of the audio power, for example, 256 points (25.6 ms of audio data) including the audio data outside the frame interval centered on the frame interval are used, and after applying the Blackman window with a window length of 256 points, the audio power is calculated. Power can be calculated and used as a representative value for the frame interval (the window length may be other than 256 points, the window shape may be other than the Blackman window, and the windowing calculation is not necessarily performed). It is good.)

ここで図4の音声波形に対応した音声パワーの例を図5に示す。音声パワーの場合はスカラーの時系列であるが、音声パワーの他、△(デルタ)パワー、FFT係数、LPC係数、ケプストラム、△ケプストラム、これらに類する各種音声分析パラメータやそれらの組合せを用いることもでき、スカラーだけでなくベクトルでもよい。   Here, an example of the voice power corresponding to the voice waveform of FIG. 4 is shown in FIG. In the case of voice power, it is a scalar time series. In addition to voice power, Δ (delta) power, FFT coefficient, LPC coefficient, cepstrum, Δ cepstrum, various voice analysis parameters similar to these, and combinations thereof may be used. It can be a vector as well as a scalar.

音声パラメータの変化量は、例えば、音声パワーのフレーム間の差分の絶対値を計算する。当該フレームと前フレームとの音声パワーの差分の絶対値でもよいし、当該フレームと後フレームとの音声パワーの差分の絶対値でもよいし、前フレームと後フレームとの音声パワーの差分の2分の1の絶対値でもよいし、前後複数フレームの音声パワーを組み合わせて計算してもよい。また、音声データから直接△パワーの絶対値を計算してもよい。   For the change amount of the audio parameter, for example, the absolute value of the difference between frames of the audio power is calculated. It may be the absolute value of the difference in audio power between the current frame and the previous frame, the absolute value of the audio power difference between the current frame and the subsequent frame, or two minutes of the audio power difference between the previous frame and the subsequent frame. The absolute value of 1 may be used, or may be calculated by combining the audio power of a plurality of frames before and after. Alternatively, the absolute value of Δ power may be calculated directly from the audio data.

ここで図5の音声パワーに対応した、音声パワーの変化量の例を図6に示す。音声パワーはスカラーであり、差分計算の例を示したが、ベクトルの場合を含めて一般化すると2値の距離計算で置き換えることができる。   Here, FIG. 6 shows an example of the amount of change in audio power corresponding to the audio power in FIG. The voice power is a scalar, and an example of the difference calculation has been shown. However, when generalized including the case of a vector, it can be replaced with a binary distance calculation.

変化量パラメータ解析・再生フレーム選択部3では、音声パワーの変化量の大きいものから再生時間(総時間/再生速度)に対応する個数のフレームを選択する(再生速度は、再生速度指示部4から得る。再生速度ではなく、再生時間を直接指定してもよい。)。   The change parameter analysis / playback frame selection unit 3 selects the number of frames corresponding to the playback time (total time / playback speed) from the one with the large amount of change in the audio power (the playback speed is selected from the playback speed instruction unit 4). (You can specify the playback time directly instead of the playback speed.)

これは図7の音声パワーの変化量のグラフの閾値を設定することに相当し、閾値より上に値がくる網掛けされた部分が選択されたフレームを示す。   This corresponds to setting a threshold value in the graph of the amount of change in audio power in FIG. 7, and shows a frame in which a shaded portion whose value is above the threshold value is selected.

連続メディア再構成部5は、変化量パラメータ解析・再生フレーム選択部3で選択したフレームに対応する音声データを抽出し、順序関係を維持しながら連結して再構成する。   The continuous media reconstruction unit 5 extracts audio data corresponding to the frame selected by the change amount parameter analysis / playback frame selection unit 3, and connects and reconstructs the data while maintaining the order relationship.

この音声データを連結する時に、連結部分に平滑化処理を施してもよい。音声断片データをそのまま連結すると不連続性により再生時にノイズとして知覚されるが、平滑化処理によって、その不連続性を解消し、ノイズを軽減することができる。   When the audio data is connected, a smoothing process may be applied to the connected part. If the audio fragment data are connected as they are, they are perceived as noise during reproduction due to discontinuity, but the discontinuity can be eliminated and noise can be reduced by smoothing processing.

この平滑化処理の例としては、連結する前後一定区間の音声データの移動平均をとる方法がある。例えば、前後の計5ポイントのデータの移動平均をとってもよいし、5ポイント以外の数でもよい。また、移動平均以外の平滑化方法でもよい。   As an example of this smoothing process, there is a method of taking a moving average of audio data in a fixed section before and after connecting. For example, a moving average of data of a total of 5 points before and after may be taken, or a number other than 5 points may be taken. A smoothing method other than moving average may be used.

図7の音声パワーの変化量のグラフ(c)の網掛けされた部分に対応する音声波形のグラフ(a)の網掛けされた部分が選択されたフレームの音声データの例であり、(d)に示すグラフが再構成した音声データの例である。これによれば無音区間が削除されるだけでなく、音韻の変化の少ない定常部が削除され、音声の了解性に寄与する部分が残るため、発話内容「あき(音素記号「aki」)」も短時間に圧縮されることの例示となっている。これにより全ての音韻が残る保証はないが、再生音のピッチが変化することもなく、従来技術より了解度を保持した任意の再生時間(再生速度)の高速再生が実現できる例である。   The shaded portion of the speech waveform graph (a) corresponding to the shaded portion of the speech power change graph (c) in FIG. 7 is an example of speech data of a selected frame (d ) Is an example of reconstructed audio data. According to this, not only the silent section is deleted, but also the stationary part with a small change in phoneme is deleted and the part contributing to the intelligibility of the speech remains, so the utterance content “Aki (phoneme symbol“ aki ”)” is also included. It is an example of being compressed in a short time. Thus, there is no guarantee that all phonemes remain, but this is an example in which high-speed playback of an arbitrary playback time (playback speed) that maintains intelligibility compared to the prior art can be realized without changing the pitch of the playback sound.

連続メディア出力部6は、例えば、スピーカやヘッドホン等のオーディオ出力デバイスに随時出力し再生してもよいし、後で再生することを目的に、ファイル出力してもよい。   For example, the continuous media output unit 6 may output to and reproduce from an audio output device such as a speaker or headphones as needed, or may output a file for the purpose of reproduction later.

動画を対象とした連続メディア高速再生装置の実施例を図1を用いて説明する。   An embodiment of a continuous media high-speed playback device for moving images will be described with reference to FIG.

連続メディア入力部1に動画データ(例えば、30フレーム/秒(fps)で本実施例の説明を行うが、30fps以外でもよい。)が入力される。   Moving image data (for example, the present embodiment is described at 30 frames / second (fps), but may be other than 30 fps) is input to the continuous media input unit 1.

変化量パラメータ抽出部2では、動画データからフレーム画像(静止画)を抽出し、例えば、1フレーム画像を変化量パラメータを計算するフレーム区間(1/30秒)とする。また、複数のフレーム画像単位でフレーム区間としてもよい。   The change amount parameter extraction unit 2 extracts a frame image (still image) from the moving image data, and for example, sets one frame image as a frame section (1/30 second) in which the change amount parameter is calculated. Moreover, it is good also as a frame area in the some frame image unit.

変化量パラメータ(動画データの特徴パラメータの変化量)は、例えば、計算するフレーム区間のフレーム画像と前のフレーム区間のフレーム画像との画素単位の輝度変化量を計算する。   As the change amount parameter (change amount of the feature parameter of the moving image data), for example, the amount of change in luminance between the frame image of the frame interval to be calculated and the frame image of the previous frame interval is calculated.

また、計算するフレーム区間のフレーム画像と後のフレーム区間のフレーム画像との画素単位の輝度変化量を計算してもよいし、前フレーム区間のフレーム画像と後フレーム区間のフレーム画像との画素単位の輝度変化量の1/2を計算してもよいし、前後複数フレーム区間のフレーム画像を組み合わせて計算してもよい。   Further, the luminance change amount in pixel units of the frame image of the frame section to be calculated and the frame image of the subsequent frame section may be calculated, or the pixel unit of the frame image of the previous frame section and the frame image of the subsequent frame section May be calculated by combining the frame images of the preceding and succeeding plural frame sections.

複数のフレーム画像単位でフレーム区間とした場合は、フレーム区間内のフレーム画像間の画素単位の輝度変化量から当該フレーム区間の変化量パラメータを計算してもよい。   When a frame section is formed in units of a plurality of frame images, a change amount parameter of the frame section may be calculated from a luminance change amount in pixel units between frame images in the frame section.

また、画素単位の輝度変化量ではなく、他の特徴量を用いてもよく、フレーム画像から画素情報を抽出しなくても、符号化された動画データから直接、フレーム画像の変化量を抽出し計算してもよい(MPEG符号等のフレーム間の差分データを保持する画像符号の場合に、差分データから変化量を直接計算してもよい。)。   Also, other feature values may be used instead of the luminance change amount in pixel units, and the change amount of the frame image is extracted directly from the encoded moving image data without extracting the pixel information from the frame image. The amount of change may be calculated directly from the difference data in the case of an image code that holds difference data between frames such as MPEG code.

変化量パラメータ解析・再生フレーム選択部3は、変化量パラメータの値の大きいものから再生時間(総時間/再生速度)に対応する個数のフレーム区間を選択する(再生速度は、再生速度指示部4から得る。再生速度ではなく再生時間を直接指定してもよい。)。   The change parameter analysis / playback frame selection unit 3 selects the number of frame sections corresponding to the playback time (total time / playback speed) from the one with the large value of the change amount parameter (the playback speed is the playback speed instruction unit 4). (You can specify the playback time directly instead of the playback speed.)

連続メディア再構成部5は、変化量パラメータ解析・再生フレーム選択部3で選択したフレーム区間に対応するフレーム画像を抽出し、順序関係を維持しながら連結して動画データに再構成する。   The continuous media reconstruction unit 5 extracts a frame image corresponding to the frame section selected by the variation parameter analysis / playback frame selection unit 3, and connects them while maintaining the order relation to reconstruct the moving image data.

連続メディア出力部6は、例えば、ディスプレイ等の表示デバイスに随時出力し再生してもよいし後で再生することを目的に、ファイル出力してもよい。   For example, the continuous media output unit 6 may output to a display device such as a display and reproduce it at any time, or may output a file for the purpose of reproducing later.

映像高速再生装置の実施例を図3を用いて説明する。   An embodiment of the high-speed video playback apparatus will be described with reference to FIG.

映像入力部31に、映像データ(例えば、30fpsの動画と44.1kHzサンプリングの音声で本実施例の説明を行うが、30fps、44.1kHz以外の条件でもよい。)が入力される。   Video data (for example, the present embodiment will be described with a moving image of 30 fps and audio of 44.1 kHz sampling, but conditions other than 30 fps and 44.1 kHz may be used) are input to the video input unit 31.

動画・音声分離部32は、映像データから動画データと音声データとを分離する。   The moving image / audio separation unit 32 separates moving image data and audio data from the video data.

動画パラメータ抽出部33と音声パラメータ抽出部34は、フレーム区間長を共通に、例えば1/30秒(1/30秒以外でもよい)として、それぞれの特徴パラメータの変化量を計算する。動画パラメータ抽出部33は、フレ−ム画像1枚をフレーム区間として変化量パラメータを計算する。音声パラメータ抽出部34は、音声データのフレーム区間長を1/30秒に相当する1470ポイントの音声データに分割し、音声パラメータの変化量を計算する。   The moving image parameter extraction unit 33 and the audio parameter extraction unit 34 calculate the amount of change of each feature parameter by setting the frame section length in common, for example, 1/30 seconds (may be other than 1/30 seconds). The moving image parameter extraction unit 33 calculates a change amount parameter using one frame image as a frame section. The audio parameter extraction unit 34 divides the frame interval length of the audio data into 1470 points of audio data corresponding to 1/30 seconds, and calculates the amount of change in the audio parameters.

パラメータ合成部35は、動画の変化量パラメータと音声の変化量パラメータとを受け取り、それぞれの変化量パラメータの加重平均をとり、統合された映像の変化量パラメータとする。   The parameter synthesizing unit 35 receives the moving image variation parameter and the audio variation parameter, takes a weighted average of the respective variation parameters, and sets them as an integrated video variation parameter.

例えば、動画の変化量パラメータは、動画の変化量パラメータの平均値で正規化し、音声の変化量パラメータは、音声の変化量パラメータの平均値で正規化し、それぞれ正規化された動画と音声との変化量パラメータの2乗平均を計算し、統合された映像の変化量パラメータとしてもよい。これにより、動画と音声とのどちらかが変化した地点を強調した再生となり、動画と音声との両方の変化に対応し、同期の取れた高速再生が可能となる。   For example, the video change parameter is normalized by the average value of the video change parameter, and the audio change parameter is normalized by the average value of the audio change parameter. A mean square of the change amount parameter may be calculated and used as an integrated image change amount parameter. As a result, the reproduction is performed with emphasis on the point where either the moving image or the sound is changed, and the synchronized high speed reproduction is possible corresponding to the change of both the moving image and the sound.

また、それぞれの変化量パラメータを正規化し、それぞれの連続メディアに応じた重み付けパラメータを掛け、平均計算し、統合された映像の変化量パラメータとしてもよい。これにより、動画の動き重視の高速再生、音声重視の高速再生する等、それぞれのバランスを変化させることが可能となり、映像コンテンツの種類や利用目的等に応じた調整、選択の幅を実現する。また、重み付けパラメータに0を許容することにより、動画パラメータのみを用いた映像の高速再生、音声パラメータのみを用いた映像の高速再生も可能となる。   Alternatively, each change parameter may be normalized, multiplied by a weighting parameter corresponding to each continuous medium, averaged, and used as an integrated video change parameter. Accordingly, it is possible to change the balance of each of the moving image-oriented high-speed reproduction and the audio-oriented high-speed reproduction, thereby realizing a range of adjustment and selection according to the type of video content and the purpose of use. Also, by allowing 0 as the weighting parameter, it is possible to perform high-speed video playback using only moving image parameters and high-speed video playback using only audio parameters.

変化量パラメータ解析・再生フレーム選択部36は、映像の変化量パラメータの値の大きいものから再生時間(総時間/再生速度)に対応する個数のフレーム区間を選択する(再生速度は、再生速度指示部37から得る。再生速度ではなく、再生時間を直接指定してもよい。)。   The change parameter analysis / playback frame selection unit 36 selects the number of frame sections corresponding to the playback time (total time / playback speed) from the video having the largest value of the change amount parameter (the playback speed is a playback speed instruction). Obtained from the section 37. The playback time may be directly specified instead of the playback speed).

動画再構成部38は、変化量パラメータ解析・再生フレーム選択部36で選択したフレーム区間に対応する動画データを抽出し、順序関係を維持しながら連結して再構成する。   The moving image reconstructing unit 38 extracts moving image data corresponding to the frame section selected by the change amount parameter analyzing / reproducing frame selecting unit 36, and connects and reconstructs the images while maintaining the order relation.

音声再構成部39は、変化量パラメータ解析・再生フレーム選択部36で選択したフレーム区間に対応する音声データを抽出し、順序関係を維持しながら連結して再構成する。   The audio reconstruction unit 39 extracts audio data corresponding to the frame section selected by the change amount parameter analysis / reproduction frame selection unit 36, and concatenates and reconfigures while maintaining the order relationship.

動画・音声合成部40は、再構成した動画データと音声データとから映像データを合成する。動画再構成部38と音声再構成部39とにおいて、同一のフレーム区間のデータを選択するため、元の映像データと再構成後の映像データの動画と音声との同期が保持される。   The moving image / sound synthesis unit 40 synthesizes video data from the reconstructed moving image data and audio data. Since the video reconstruction unit 38 and the audio reconstruction unit 39 select data in the same frame section, the synchronization between the original video data and the video and audio of the reconstructed video data is maintained.

映像出力部41は、例えば、スピーカやヘッドホン等のオーディオ出力デバイスとディスプレイ等の表示デバイスとに随時出力し再生してもよいし、後で再生することを目的に、ファイル出力してもよい。   For example, the video output unit 41 may output and reproduce an audio output device such as a speaker or headphones and a display device such as a display as needed, or may output a file for the purpose of reproduction later.

多地点映像を対象とした複合メディア高速再生装置(もしくは、映像高速再生装置と多チャンネル連続メディア高速再生装置の組み合わせ)の例を図2、図3を用いて説明する。   An example of a composite media high-speed playback device (or a combination of a video high-speed playback device and a multi-channel continuous media high-speed playback device) for multi-point video will be described with reference to FIGS.

図2の各連続メディア入力部をそれぞれ図3の映像入力部31、動画・音声分離部32で構成し、各連続メディア出力部をそれぞれ図3の動画・音声合成部40、映像出力部41で構成することにより、N地点映像を2Nの連続メディアを複合した複合メディア高速再生装置と解釈することができる。これにより、いずれかの地点での変化、かつ、動画および音声のいずれかの変化を強調した同期がとれた多地点映像の高速再生が可能となる。   Each continuous media input unit in FIG. 2 includes the video input unit 31 and the moving image / sound separation unit 32 in FIG. 3, and each continuous media output unit includes the moving image / sound synthesis unit 40 and the video output unit 41 in FIG. By configuring, the N-point video can be interpreted as a composite media high-speed playback device that combines 2N continuous media. As a result, it is possible to perform high-speed playback of synchronized multi-point video that emphasizes changes at any point and changes in either moving images or audio.

連続メディア高速再生装置の一例を示すブロック構成図。The block block diagram which shows an example of a continuous media high-speed reproduction apparatus. 複合メディア高速再生装置の一例を示すブロック構成図。The block block diagram which shows an example of a composite media high-speed reproduction apparatus. 映像高速再生装置の実施形態の一例を示すブロック構成図。The block block diagram which shows an example of embodiment of a video high-speed reproduction apparatus. 音声データの音声波形の一例を示す図。The figure which shows an example of the audio | voice waveform of audio | voice data. 音声波形に対応した音声パワーの一例を示す図。The figure which shows an example of the audio | voice power corresponding to an audio | voice waveform. 音声パワーの変化量の一例を示す図。The figure which shows an example of the variation | change_quantity of audio | voice power. 再構成した音声データの一例を示す図。The figure which shows an example of the audio | voice data which were reconfigure | reconstructed.

符号の説明Explanation of symbols

1…連続メディア入力部
2…変化量パラメータ抽出部
3…変化量パラメータ解析・再生フレーム選択部
4…再生速度指示部
5…連続メディア再構成部
6…連続メディア出力部
21…連続メディア入力部
22…パラメータ抽出部
23…パラメータ合成部
24…変化量パラメータ解析・再生フレーム選択部
25…再生速度指示部
26…連続メディア再構成部
27…連続メディア出力部
31…映像入力部
32…動画・音声分離部
33…動画パラメータ抽出部
34…音声パラメータ抽出部
35…パラメータ合成部
36…変化量パラメータ解析・再生フレーム選択部
37…再生速度指示部
38…動画再構成部
39…音声再構成部
40…動画・音声合成部
41…映像出力部
DESCRIPTION OF SYMBOLS 1 ... Continuous media input part 2 ... Change amount parameter extraction part 3 ... Change amount parameter analysis / reproduction | regeneration frame selection part 4 ... Play speed instruction | indication part 5 ... Continuous media reconstruction part 6 ... Continuous media output part 21 ... Continuous media input part 22 ... parameter extraction unit 23 ... parameter synthesis unit 24 ... change parameter analysis / playback frame selection unit 25 ... playback speed instruction unit 26 ... continuous media reconstruction unit 27 ... continuous media output unit 31 ... video input unit 32 ... video / audio separation Unit 33 ... Video parameter extraction unit 34 ... Audio parameter extraction unit 35 ... Parameter synthesis unit 36 ... Change amount parameter analysis / reproduction frame selection unit 37 ... Playback speed instruction unit 38 ... Video reconstruction unit 39 ... Audio reconstruction unit 40 ... Video・ Speech synthesis unit 41 ... Video output unit

Claims (12)

連続メディアデータを短縮して再生する連続メディアデータ高速再生方法であって、
連続メディアデータをフレーム区間に分割し、各フレーム区間の特徴パラメータの変化量を計算する過程と、
特徴パラメータの変化量の大きなフレームのみを連結してデータを再構成する過程と、
連結された再構成データを再生する過程と、を有することを特徴とする連続メディアデータ高速再生方法。
A continuous media data high-speed playback method for shortening and playing back continuous media data,
A process of dividing continuous media data into frame sections and calculating a change amount of a feature parameter in each frame section;
The process of reconstructing data by concatenating only frames with large feature parameter variations,
And a step of reproducing the concatenated reconstructed data. A method of rapidly reproducing continuous media data.
前記連続メディアデータが音声データまたは動画データであることを特徴とする請求項1に記載の連続メディアデータ高速再生方法。   2. The continuous media data high-speed playback method according to claim 1, wherein the continuous media data is audio data or moving image data. 複数の連続メディアデータからなる複合メディアデータを短縮して再生する複合メディアデータ高速再生方法であって、
各連続メディアデータをフレーム区間に分割し、各フレーム区間の特徴パラメータの変化量を計算する過程と、
各連続メディアデータの特徴パラメータの変化量から、統合した特徴パラメータの変化量を計算する過程と、
統合した特徴パラメータの変化量の大きなフレームのみを連結して各連続メディアデータごとに再構成データを生成する過程と、
この再構成データを再生する過程と、を有することを特徴とする複合メディアデータ高速再生方法。
A composite media data high-speed playback method for shortening and playing back composite media data composed of a plurality of continuous media data,
A process of dividing each continuous media data into frame sections and calculating a change amount of a characteristic parameter of each frame section;
The process of calculating the amount of change of the integrated feature parameter from the amount of change of the feature parameter of each continuous media data,
A process of generating reconstructed data for each continuous media data by concatenating only the frames with a large amount of change of the integrated feature parameters,
A method of reproducing the reconstructed data; and a method of reproducing the composite media data at a high speed.
多チャンネルの連続メディアデータを短縮して再生する多チャンネル連続メディアデータ高速再生方法であって、
各チャンネルの連続メディアデータをフレーム区間に分割し、各フレーム区間の特徴パラメータの変化量を計算する過程と、
各チャンネルの連続メディアデータの特徴パラメータの変化量から、統合した特徴パラメータの変化量を計算する過程と、
統合した特徴パラメータの変化量の大きなフレームのみを連結して各チャンネルごとに再構成データを生成する過程と、
この再構成データを再生する過程と、を有することを特徴とする多チャンネル連続メディアデータ高速再生方法。
A multi-channel continuous media data high-speed playback method that shortens and plays back multi-channel continuous media data,
A process of dividing continuous media data of each channel into frame sections and calculating a change amount of a feature parameter of each frame section;
The process of calculating the amount of change of the integrated feature parameter from the amount of change of the feature parameter of the continuous media data of each channel,
A process of generating reconstructed data for each channel by concatenating only the frames with a large amount of change of the integrated feature parameters,
And a step of reproducing the reconstructed data, and a multi-channel continuous media data high-speed reproduction method.
動画データと音声データとからなる映像データを短縮して再生する映像データ高速再生方法であって、
映像データを動画データと音声データとに分割する過程と、
動画データをフレーム区間に分割し、各フレーム区間の特徴パラメータの変化量を計算する過程と、
音声データをフレーム区間に分割し、各フレーム区間の特徴パラメータの変化量を計算する過程と、
動画データの特徴パラメータの変化量と音声データの特徴パラメータの変化量とから映像データの特徴パラメータの変化量を計算する過程と、
映像データの特徴パラメータの変化量の大きい動画データのフレームのみを連結して再構成動画データを生成する過程と、
映像データの特徴パラメータの変化量の大きい音声データのフレームのみを連結して再構成音声データを生成する過程と、
再構成動画データと再構成音声データとを合成し、再構成映像データを生成する過程と、
生成した再構成映像データを再生する過程と、を有することを特徴とする映像データ高速再生方法。
A video data high-speed playback method for shortening and playing back video data consisting of video data and audio data,
Dividing video data into video data and audio data;
The process of dividing the video data into frame sections and calculating the amount of change in the feature parameter in each frame section;
Dividing audio data into frame sections and calculating the amount of change in feature parameters in each frame section;
Calculating the amount of change of the feature parameter of the video data from the amount of change of the feature parameter of the video data and the amount of change of the feature parameter of the audio data;
A process of generating reconstructed video data by concatenating only video data frames having a large amount of change in the feature parameter of the video data,
A process of generating reconstructed audio data by concatenating only frames of audio data having a large amount of change in the feature parameter of the video data;
A process of synthesizing the reconstructed video data and the reconstructed audio data to generate reconstructed video data,
And a step of playing back the generated reconstructed video data.
連続メディアデータを短縮して再生する連続メディアデータ高速再生装置であって、
連続メディアデータをフレーム区間に分割し、各フレーム区間の特徴パラメータの変化量を計算する手段と、
特徴パラメータの変化量の大きなフレームのみを連結してデータを再構成する手段と、
連結された再構成データを再生する手段と、を有することを特徴とする連続メディアデータ高速再生装置。
A continuous media data high-speed playback device that shortens and plays back continuous media data,
Means for dividing continuous media data into frame sections, and calculating a change amount of a characteristic parameter of each frame section;
Means for reconstructing data by concatenating only frames with a large amount of change in feature parameters;
A continuous media data high-speed playback device comprising: means for playing back the reconstructed data linked together.
前記連続メディアデータが音声データまたは動画データであることを特徴とする請求項6に記載の連続メディアデータ高速再生装置。   7. The continuous media data high-speed playback device according to claim 6, wherein the continuous media data is audio data or moving image data. 複数の連続メディアデータからなる複合メディアデータを短縮して再生する複合メディアデータ高速再生装置であって、
各連続メディアデータをフレーム区間に分割し、各フレーム区間の特徴パラメータの変化量を計算する手段と、
各連続メディアデータの特徴パラメータの変化量から、統合した特徴パラメータの変化量を計算する手段と、
統合した特徴パラメータの変化量の大きなフレームのみを連結して各連続メディアデータごとに再構成データを生成する手段と、
この再構成データを再生する手段と、を有することを特徴とする複合メディアデータ高速再生装置。
A composite media data high-speed playback device that shortens and plays back composite media data composed of a plurality of continuous media data,
Means for dividing each continuous media data into frame sections and calculating a change amount of a characteristic parameter of each frame section;
Means for calculating the amount of change of the integrated feature parameter from the amount of change of the feature parameter of each continuous media data;
Means for generating reconstructed data for each continuous media data by concatenating only frames with a large amount of change in the integrated feature parameters;
Means for reproducing the reconstructed data, and a high speed playback apparatus for composite media data.
多チャンネルの連続メディアデータを短縮して再生する多チャンネル連続メディアデータ高速再生装置であって、
各チャンネルの連続メディアデータをフレーム区間に分割し、各フレーム区間の特徴パラメータの変化量を計算する手段と、
各チャンネルの連続メディアデータの特徴パラメータの変化量から、統合した特徴パラメータの変化量を計算する手段と、
統合した特徴パラメータの変化量の大きなフレームのみを連結して各チャンネルごとに再構成データを生成する手段と、
この再構成データを再生する手段と、を有することを特徴とする多チャンネル連続メディアデータ高速再生装置。
A multi-channel continuous media data high-speed playback device that shortens and plays back multi-channel continuous media data,
Means for dividing continuous media data of each channel into frame sections, and calculating a change amount of a characteristic parameter of each frame section;
Means for calculating the amount of change of the integrated feature parameter from the amount of change of the feature parameter of the continuous media data of each channel;
Means for generating reconstructed data for each channel by concatenating only frames with a large amount of change in the integrated feature parameters;
Means for reproducing the reconstructed data, and a multi-channel continuous media data high-speed reproducing device.
動画データと音声データとからなる映像データを短縮して再生する映像データ高速再生装置であって、
映像データを動画データと音声データとに分割する手段と、
動画データをフレーム区間に分割し、各フレーム区間の特徴パラメータの変化量を計算する手段と、
音声データをフレーム区間に分割し、各フレーム区間の特徴パラメータの変化量を計算する手段と、
動画データの特徴パラメータの変化量と音声データの特徴パラメータの変化量とから映像データの特徴パラメータの変化量を計算する手段と、
映像データの特徴パラメータの変化量の大きい動画データのフレームのみを連結して再構成動画データを生成する手段と、
映像データの特徴パラメータの変化量の大きい音声データのフレームのみを連結して再構成音声データを生成する手段と、
再構成動画データと再構成音声データとを合成し、再構成映像データを生成する手段と、
生成した再構成映像データを再生する手段と、を有することを特徴とする映像データ高速再生装置。
A video data high-speed playback device that shortens and plays back video data consisting of video data and audio data,
Means for dividing video data into video data and audio data;
Means for dividing the moving image data into frame sections and calculating the amount of change in the feature parameter of each frame section;
Means for dividing the audio data into frame sections and calculating the amount of change in the feature parameter of each frame section;
Means for calculating the change amount of the feature parameter of the video data from the change amount of the feature parameter of the video data and the change amount of the feature parameter of the audio data;
Means for generating reconstructed video data by concatenating only frames of video data having a large amount of change in the characteristic parameter of the video data;
Means for generating reconstructed audio data by concatenating only frames of audio data having a large amount of change in the characteristic parameter of the video data;
Means for synthesizing the reconstructed video data and the reconstructed audio data to generate reconstructed video data;
And a means for reproducing the generated reconstructed video data.
上記の請求項1〜10のいずれか1項に記載の方法または装置を、コンピュータプログラムで記載してそれを実行可能にしたことを特徴とするプログラム。 A program according to any one of claims 1 to 10, wherein the method or apparatus according to any one of claims 1 to 10 is written in a computer program so as to be executable. 上記の請求項1〜10のいずれか1項に記載の方法または装置を、コンピュータで実行可能に記載したプログラムを記録したことを特徴とする記録媒体。 A recording medium having recorded thereon a program in which the method or apparatus according to any one of claims 1 to 10 is executable by a computer.
JP2004007558A 2004-01-15 2004-01-15 Continuous media data fast reproduction method, composite media data fast reproduction method, multichannel continuous media data fast reproduction method, video data fast reproduction method, continuous media data fast reproducing device, composite media data fast reproducing device, multichannel continuous media data fast reproducing device, video data fast reproducing device, program, and recording medium Pending JP2005204003A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2004007558A JP2005204003A (en) 2004-01-15 2004-01-15 Continuous media data fast reproduction method, composite media data fast reproduction method, multichannel continuous media data fast reproduction method, video data fast reproduction method, continuous media data fast reproducing device, composite media data fast reproducing device, multichannel continuous media data fast reproducing device, video data fast reproducing device, program, and recording medium

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2004007558A JP2005204003A (en) 2004-01-15 2004-01-15 Continuous media data fast reproduction method, composite media data fast reproduction method, multichannel continuous media data fast reproduction method, video data fast reproduction method, continuous media data fast reproducing device, composite media data fast reproducing device, multichannel continuous media data fast reproducing device, video data fast reproducing device, program, and recording medium

Publications (1)

Publication Number Publication Date
JP2005204003A true JP2005204003A (en) 2005-07-28

Family

ID=34821153

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2004007558A Pending JP2005204003A (en) 2004-01-15 2004-01-15 Continuous media data fast reproduction method, composite media data fast reproduction method, multichannel continuous media data fast reproduction method, video data fast reproduction method, continuous media data fast reproducing device, composite media data fast reproducing device, multichannel continuous media data fast reproducing device, video data fast reproducing device, program, and recording medium

Country Status (1)

Country Link
JP (1) JP2005204003A (en)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007171267A (en) * 2005-12-19 2007-07-05 Nippon Telegr & Teleph Corp <Ntt> Abbreviated reproducing method of continuous media data, abbreviated reproducing method and apparatus of composite media data, program, and computer readable recording medium
WO2016125362A1 (en) * 2015-02-03 2016-08-11 ソニー株式会社 Information processing device, information processing system, information processing method, and program
WO2018117099A1 (en) * 2016-12-20 2018-06-28 国立大学法人 東京大学 Image processing device and program

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2001197425A (en) * 2000-01-05 2001-07-19 Matsushita Electric Ind Co Ltd Video signal processing unit
JP2002142189A (en) * 2000-11-06 2002-05-17 Canon Inc Image processor, image processing method, and storage medium

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2001197425A (en) * 2000-01-05 2001-07-19 Matsushita Electric Ind Co Ltd Video signal processing unit
JP2002142189A (en) * 2000-11-06 2002-05-17 Canon Inc Image processor, image processing method, and storage medium

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007171267A (en) * 2005-12-19 2007-07-05 Nippon Telegr & Teleph Corp <Ntt> Abbreviated reproducing method of continuous media data, abbreviated reproducing method and apparatus of composite media data, program, and computer readable recording medium
JP4648183B2 (en) * 2005-12-19 2011-03-09 日本電信電話株式会社 Continuous media data shortening reproduction method, composite media data shortening reproduction method and apparatus, program, and computer-readable recording medium
WO2016125362A1 (en) * 2015-02-03 2016-08-11 ソニー株式会社 Information processing device, information processing system, information processing method, and program
US10504554B2 (en) 2015-02-03 2019-12-10 Sony Corporation Information processing device, information processing system, and information processing method
WO2018117099A1 (en) * 2016-12-20 2018-06-28 国立大学法人 東京大学 Image processing device and program
CN110366848A (en) * 2016-12-20 2019-10-22 国立大学法人东京大学 Image processing apparatus and program
JPWO2018117099A1 (en) * 2016-12-20 2019-10-24 国立大学法人 東京大学 Image processing apparatus and program
JP7164873B2 (en) 2016-12-20 2022-11-02 国立大学法人 東京大学 Image processing device and program

Similar Documents

Publication Publication Date Title
JP5032314B2 (en) Audio encoding apparatus, audio decoding apparatus, and audio encoded information transmission apparatus
KR101334366B1 (en) Method and apparatus for varying audio playback speed
KR101582358B1 (en) Method for time scaling of a sequence of input signal values
JP2010283605A (en) Video processing device and method
US8538244B2 (en) Recording/reproduction apparatus and recording/reproduction method
JP2007249075A (en) Audio reproducing device and high-frequency interpolation processing method
JP2006033811A (en) Electronic watermarking method and storage medium for storing electronic watermarking program
JP2007010855A (en) Voice reproducing apparatus
JP2005204003A (en) Continuous media data fast reproduction method, composite media data fast reproduction method, multichannel continuous media data fast reproduction method, video data fast reproduction method, continuous media data fast reproducing device, composite media data fast reproducing device, multichannel continuous media data fast reproducing device, video data fast reproducing device, program, and recording medium
US20150104158A1 (en) Digital signal reproduction device
JPWO2009090705A1 (en) Recording / playback device
JP2009075280A (en) Content playback device
JP4648183B2 (en) Continuous media data shortening reproduction method, composite media data shortening reproduction method and apparatus, program, and computer-readable recording medium
JP2822940B2 (en) Video and audio data editing device
JP6313619B2 (en) Audio signal processing apparatus and program
JP2002297200A (en) Speaking speed converting device
KR20070008232A (en) Apparatus and method of reproducing digital multimedia slow or fast
JPH0854895A (en) Reproducing device
JP4529859B2 (en) Audio playback device
JP4665550B2 (en) Playback apparatus and playback method
JP2008145841A (en) Reproduction device, reproduction method, signal processing device and signal processing method
JP3766534B2 (en) VISUAL HEARING AID SYSTEM AND METHOD AND RECORDING MEDIUM CONTAINING CONTROL PROGRAM FOR VISUAL HEARING AID
JP2010123225A (en) Record reproducing apparatus and record reproducing method
JP4155990B2 (en) Synchronous reconstruction method and apparatus for acoustic data and moving image data
JPH11311997A (en) Sound reproducing speed converting device and method therefor

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20060411

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20080623

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20080708

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20080903

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20090203

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20090406

RD02 Notification of acceptance of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7422

Effective date: 20090522

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20100105