JP2007094234A - データ記録再生装置、データ記録再生方法及びそのプログラム - Google Patents

データ記録再生装置、データ記録再生方法及びそのプログラム Download PDF

Info

Publication number
JP2007094234A
JP2007094234A JP2005285997A JP2005285997A JP2007094234A JP 2007094234 A JP2007094234 A JP 2007094234A JP 2005285997 A JP2005285997 A JP 2005285997A JP 2005285997 A JP2005285997 A JP 2005285997A JP 2007094234 A JP2007094234 A JP 2007094234A
Authority
JP
Japan
Prior art keywords
data
feature point
point information
audio
sound signal
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2005285997A
Other languages
English (en)
Inventor
Makoto Kono
誠 光野
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sony Corp
Original Assignee
Sony Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sony Corp filed Critical Sony Corp
Priority to JP2005285997A priority Critical patent/JP2007094234A/ja
Priority to EP06255034A priority patent/EP1770704A3/en
Priority to KR1020060094763A priority patent/KR101291474B1/ko
Priority to US11/529,868 priority patent/US8275473B2/en
Priority to CN2006101463843A priority patent/CN1941144B/zh
Publication of JP2007094234A publication Critical patent/JP2007094234A/ja
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B27/00Editing; Indexing; Addressing; Timing or synchronising; Monitoring; Measuring tape travel
    • G11B27/10Indexing; Addressing; Timing or synchronising; Measuring tape travel
    • G11B27/19Indexing; Addressing; Timing or synchronising; Measuring tape travel by using information detectable on the record carrier
    • G11B27/28Indexing; Addressing; Timing or synchronising; Measuring tape travel by using information detectable on the record carrier by using information signals recorded by the same method as the main recording
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B20/00Signal processing not specific to the method of recording or reproducing; Circuits therefor
    • G11B20/10Digital recording or reproducing
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Processing of the speech or voice signal to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/04Time compression or expansion
    • G10L21/043Time compression or expansion by changing speed
    • G10L21/045Time compression or expansion by changing speed using thinning out or insertion of a waveform
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B20/00Signal processing not specific to the method of recording or reproducing; Circuits therefor
    • G11B20/10Digital recording or reproducing
    • G11B20/10527Audio or video recording; Data buffering arrangements
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B27/00Editing; Indexing; Addressing; Timing or synchronising; Monitoring; Measuring tape travel
    • G11B27/005Reproducing at a different information rate from the information rate of recording
    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03MCODING; DECODING; CODE CONVERSION IN GENERAL
    • H03M7/00Conversion of a code where information is represented by a given sequence or number of digits to a code where the same, similar or subset of information is represented by a different sequence or number of digits
    • H03M7/30Compression; Expansion; Suppression of unnecessary data, e.g. redundancy reduction
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N5/00Details of television systems
    • H04N5/76Television signal recording
    • H04N5/78Television signal recording using magnetic recording
    • H04N5/782Television signal recording using magnetic recording on tape
    • H04N5/783Adaptations for reproducing at a rate different from the recording rate
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B20/00Signal processing not specific to the method of recording or reproducing; Circuits therefor
    • G11B20/10Digital recording or reproducing
    • G11B20/10527Audio or video recording; Data buffering arrangements
    • G11B2020/10537Audio or video recording
    • G11B2020/10546Audio or video recording specifically adapted for audio data
    • G11B2020/10555Audio or video recording specifically adapted for audio data wherein the frequency, the amplitude, or other characteristics of the audio signal is taken into account
    • G11B2020/10574Audio or video recording specifically adapted for audio data wherein the frequency, the amplitude, or other characteristics of the audio signal is taken into account volume or amplitude
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B20/00Signal processing not specific to the method of recording or reproducing; Circuits therefor
    • G11B20/10Digital recording or reproducing
    • G11B20/10527Audio or video recording; Data buffering arrangements
    • G11B2020/1062Data buffering arrangements, e.g. recording or playback buffers
    • G11B2020/10675Data buffering arrangements, e.g. recording or playback buffers aspects of buffer control
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B20/00Signal processing not specific to the method of recording or reproducing; Circuits therefor
    • G11B20/10Digital recording or reproducing
    • G11B2020/10935Digital recording or reproducing wherein a time constraint must be met
    • G11B2020/10953Concurrent recording or playback of different streams or files
    • G11B2020/10962Concurrent recording or playback of different streams or files wherein both recording and playback take place simultaneously
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B2220/00Record carriers by type
    • G11B2220/20Disc-shaped record carriers
    • G11B2220/25Disc-shaped record carriers characterised in that the disc is based on a specific recording technology
    • G11B2220/2504Holographic discs; Holographic digital data storage [HDDS]
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B2220/00Record carriers by type
    • G11B2220/20Disc-shaped record carriers
    • G11B2220/25Disc-shaped record carriers characterised in that the disc is based on a specific recording technology
    • G11B2220/2508Magnetic discs
    • G11B2220/2516Hard disks
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B2220/00Record carriers by type
    • G11B2220/20Disc-shaped record carriers
    • G11B2220/25Disc-shaped record carriers characterised in that the disc is based on a specific recording technology
    • G11B2220/2525Magneto-optical [MO] discs
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B2220/00Record carriers by type
    • G11B2220/20Disc-shaped record carriers
    • G11B2220/25Disc-shaped record carriers characterised in that the disc is based on a specific recording technology
    • G11B2220/2537Optical discs
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N5/00Details of television systems
    • H04N5/76Television signal recording
    • H04N5/765Interface circuits between an apparatus for recording and another apparatus
    • H04N5/775Interface circuits between an apparatus for recording and another apparatus between a recording apparatus and a television receiver
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N5/00Details of television systems
    • H04N5/76Television signal recording
    • H04N5/78Television signal recording using magnetic recording
    • H04N5/781Television signal recording using magnetic recording on disks or drums
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N5/00Details of television systems
    • H04N5/76Television signal recording
    • H04N5/84Television signal recording using optical recording
    • H04N5/85Television signal recording using optical recording on discs or drums
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N9/00Details of colour television systems
    • H04N9/79Processing of colour television signals in connection with recording
    • H04N9/7921Processing of colour television signals in connection with recording for more than one processing mode
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N9/00Details of colour television systems
    • H04N9/79Processing of colour television signals in connection with recording
    • H04N9/80Transformation of the television signal for recording, e.g. modulation, frequency changing; Inverse transformation for playback
    • H04N9/804Transformation of the television signal for recording, e.g. modulation, frequency changing; Inverse transformation for playback involving pulse code modulation of the colour picture signal components
    • H04N9/8042Transformation of the television signal for recording, e.g. modulation, frequency changing; Inverse transformation for playback involving pulse code modulation of the colour picture signal components involving data reduction
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N9/00Details of colour television systems
    • H04N9/79Processing of colour television signals in connection with recording
    • H04N9/80Transformation of the television signal for recording, e.g. modulation, frequency changing; Inverse transformation for playback
    • H04N9/804Transformation of the television signal for recording, e.g. modulation, frequency changing; Inverse transformation for playback involving pulse code modulation of the colour picture signal components
    • H04N9/806Transformation of the television signal for recording, e.g. modulation, frequency changing; Inverse transformation for playback involving pulse code modulation of the colour picture signal components with processing of the sound signal
    • H04N9/8063Transformation of the television signal for recording, e.g. modulation, frequency changing; Inverse transformation for playback involving pulse code modulation of the colour picture signal components with processing of the sound signal using time division multiplex of the PCM audio and PCM video signals
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N9/00Details of colour television systems
    • H04N9/79Processing of colour television signals in connection with recording
    • H04N9/80Transformation of the television signal for recording, e.g. modulation, frequency changing; Inverse transformation for playback
    • H04N9/82Transformation of the television signal for recording, e.g. modulation, frequency changing; Inverse transformation for playback the individual colour picture signal components being recorded simultaneously only
    • H04N9/8205Transformation of the television signal for recording, e.g. modulation, frequency changing; Inverse transformation for playback the individual colour picture signal components being recorded simultaneously only involving the multiplexing of an additional signal and the colour video signal

Abstract

【課題】
演算処理量を増やすことなく、データのコンテンツの特徴点を抽出することができるデータ記録再生装置、データ記録再生方法及びそのプログラムを提供すること。
【解決手段】
圧縮符号化された音声データの中からSF(原音信号の音の特性情報)がSF抽出回路35により抽出され、MPEGオーディオ/ビデオデコーダ28での復号処理を要することなく、抽出されたSFに基づいて特徴点ファイルが生成される。これにより、復号処理した後にサブバンドデータが生成され、そのサブバンドが持つエネルギーを観測して小区間が持つ特徴を分類する従来の方法に比べ、本発明では演算処理量を減らすことができる。また、既に過去に記録された別の番組(別のタイトル)の再生途中であっても、現在記録中のタイトルのコンテンツのSFを抽出することが可能となる。
【選択図】図1

Description

本発明は、原音信号が符号化されて生成された音声データを元の原音信号に復号して再生することが可能なデータ記録再生装置、データ記録再生方法及びそのプログラムに関する。
近年のデジタル家電やパーソナルコンピュータの普及により、アナログテレビ放送やデジタルテレビ放送、ラジオ放送等をディスクやカード状の記録媒体へ記録して再生する使い方が広く利用されつつある。そういった背景の中、記録したコンテンツをより短時間で視聴したいという需要が増えてきている。この需要に応じて、例えば、単純な一定間隔で映像や音声のデータを間引き処理する方法、あるいは、映像や音声のコンテンツが持つ特徴に応じて不均一な時間間隔で間引き処理する方法等、各種変速再生方法が考案されている。
例えば、再生コンテンツの音が持つ特徴に応じて、再生タイトル(再生データ)内を、例えば無音区間、音楽信号区間、音声信号区間の3種に分類して、音声信号区間を優先的に選択して高速にダイジェスト再生する、といった技術が開示されている(例えば、特許文献1参照。)。この特許文献1では、音声入力信号を圧縮符号化する前にFFT(Fast Fourier Transform)処理を施して周波数帯域ごとのエネルギーを観測して小区間の特徴を分類する手法が提案されている。さらに、特許文献1では、MPEG(Moving Picture Experts Group)オーディオ方式で符号化されたデータを復号してサブバンドデータを作成し、サブバンドが持つエネルギーを観測して小区間が持つ特徴を分類する手法も提案されている。
かかる特許文献1に記載の方法では、例えば、単にアナログ音声入力信号を符号化し、映像信号と多重化してハードディスク等の記録媒体へ記録する際に、コンテンツの特徴点を抽出しておき、後にダイジェスト再生する際にその特徴点情報を利用することができる。あるいは、例えばデジタル放送で送られてくるデジタル多重化ストリームを一旦分離して復号したデータを再符号化及び再多重化した後に記録媒体に記録する際に、上記同様にコンテンツの特徴点を抽出して記憶しておき、後にダイジェスト再生する際にその特徴点の情報を利用することも可能である。
特開平10−247093号公報(段落[0008]、[0009])
しかしながら、上記特許文献1の方法では、デジタル放送で送られてくるデジタル多重化ストリームを一旦分離して復号したデータを再符号化及び再多重化した後に記録媒体に記録する場合は、次のような問題がある。つまり、符号化された音声データから音声の特徴を分類する場合、そのデータを復号してサブバンドデータを作成しているため演算量が多くなり、機器の負担が増大する。
また、特許文献1の方法では、例えばデジタル放送から送られてくるデジタル多重化ストリームをそのままの形態で記録媒体に記録しながら、並行して記録媒体上の別のデータ(例えば、別のテレビ番組等)を再生するといった場合には不都合を生じる。特許文献1の方法では、特徴点抽出のためにストリームの復号処理を行うが、再生中には当該別のデータのストリームの復号処理でデコーダが占有されてしまうため、現在記録中のコンテンツが持つ特徴点を実時間で抽出することができない。その結果、その記録されたデータがダイジェスト再生される場合、そのコンテンツが持つ特徴に応じたダイジェスト再生ができないという問題がある。
なお、以上の説明中、「ダイジェスト再生」というのは、データのコンテンツが要約されて再生される意味の他にも、コンテンツの途中が省略して再生されたりして通常の時間より短い時間で再生される意味も含まれる。
以上のような事情に鑑み、本発明の目的は、演算処理量を増やすことなく、データのコンテンツの特徴点を抽出することができるデータ記録再生装置、データ記録再生方法及びそのプログラムを提供することにある。
本発明のさらなる目的は、音声データの記録中に別のデータが再生されている場合であっても、その記録中のデータのコンテンツの特徴点を抽出することができる技術を提供することにある。
上記目的を達成するため、本発明に係るデータ記録再生装置は、原音信号が符号化されて生成された音声データを前記原音信号に復号して再生するデータ記録再生装置であって、前記音声データを記憶するデータ記憶手段と、前記データ記憶手段に記憶された音声データの中から前記原音信号の音の特性情報を抽出し、前記抽出した特性情報に基づいて特徴点情報を生成する特徴点情報生成手段と、前記音声データを復号し、前記復号した復号データに前記特徴点情報に基づいて間引き処理を施すことで、前記原音信号を変速再生する変速再生手段とを具備する。
本発明では、符号化された音声データの中から原音信号の音の特性情報が抽出され、復号処理を要することなく、抽出された特性情報に基づいて特徴点情報が生成される。これにより、従来に比べて演算処理量が減るとともに、既に過去に記録された別のデータの再生途中であっても、現在記録中のデータコンテンツの特徴点を抽出することが可能となる。
具体的には、符号化のコーデックがMPEG1、2等の場合、各周波数帯域ごとの音圧レベルを表す「特徴点情報」は、「スケールファクタ」(以下、SFという。)である。コーデックがドルビーデジタル(AC(Audio Code)−3)方式では、各周波数帯域ごとの音圧レベルを表す「特徴点情報」は、「exponents」である。「音の特性情報」とは、例えば音圧レベル、周波数、位相等である。
「原音信号」とは、人間が認識することのできるアナログ的な信号、またはそのアナログ信号がPCM(Pulse Code Modulation)まで符号化されたデジタル信号を意味する。この原音信号が符号化(圧縮符号化)される処理は、必ずしも本データ記録再生装置により行われなくてもよい。例えば、外部の機器で予め符号化されている場合や、デジタル放送等のコンテンツのように予め符号化されている場合も考えられる。
また、具体的には、データ記録再生装置は、前記データ記憶手段から前記音声データを読み出し、前記音声データを復号しながら前記原音信号を通常速度で再生する再生手段と、前記音声データの読み出し制御と、前記特徴点情報を記憶制御とを並行して行うバッファコントローラとをさらに具備すればよい。
変速再生手段により原音信号が変速再生されるときに、特徴点情報生成手段によりリアルタイムで特徴点情報が生成されてもよい。あるいは、後述するように特徴点情報が特徴点情報記憶手段により記憶され、その後、変速再生時にその記憶された特徴点情報が用いられてもよい。
本発明では原音信号が再生されるとき、あくまで人間が元の原音を聴き取ることができるように再生されればよく、復号化により完全に元の原音が復元されない場合も、もちろん本発明の概念に含まれる。つまり、本発明によるコーデックは、可逆性であってもよいし、不可逆であってもよい。また、そのコーデックの種類としては、原音信号が符号化された音声データの中に、復号しなくても原音信号の音の特性情報が残るようなコーデックであれば何でもよい。
「データ記憶手段」は、記憶できる媒体であれば何でもよい。例えば、ハードディスク等の磁気ディスク、半導体や誘電体等を用いた固体メモリ、CD(Compact Disc)、DVD(Digital Versatile Disc)、ブルーレイディスク、その他ホログラム等の光学的な方法でデータ記録が可能な光ディスク、MO(Magneto Optical disk)やMD(Mini-Disk)等の光磁気ディスク等が挙げられる。これ以降に説明するあらゆる記憶デバイスについても同様である。
特徴点情報生成手段は、もちろん、アナログ信号及びデジタル信号のどちらからも特性情報を抽出し、特徴点情報を生成することができるものを想定している。
本発明において、前記特徴点情報生成手段は、前記音声の有無の情報を前記特徴点情報として生成する。この場合、変速再生手段は、例えば音声がある部分を優先的にピックアップして変速再生することができる。特徴点情報には、人間の声音の有無の情報も含まれるようにしてもよい。これにより、変速再生手段は、例えば人間の声音のみがピックアップされるように変速再生することができる。
本発明において、前記特徴点情報生成手段は、所定の時間ごとに前記特徴点情報を生成する。本発明では、例えば映像とともに音声が再生される場合は、「所定の時間」が短いほど、ユーザにとって変速再生時に映像と音声との同期が取れているように見え、ユーザに違和感を与えることが少なくなるという利点がある。逆に言うと、例えば10秒、30秒、1分というようにある程度短い時間であれば、映像と音声とが同期が取れていなくもユーザに違和感を与えることは少ない。つまり、音声は途中で途切れると違和感があるが、映像については常に変化があることがほとんどであり、所定の時間ごとに映像と音声とがある程度同期していればよい。また、逆に言うと、音声についてはユーザがはっきり聴こえるようにピックアップされ、映像についてはその音声に同期させないでその区間の映像がまんべんなく表示された方がユーザにとって見やすい場合もある。
本発明において、データ記録再生装置は、前記生成された特徴点情報を、該特徴点情報に対応する前記特性情報を持つ前記音声データと対応付けて記憶する特徴点情報記憶手段をさらに具備する。特徴点情報生成手段は、符号化された音声データがデータ記憶手段に記憶される前に、特徴点情報を生成してもよい。あるいは、特徴点情報生成手段は、符号化された音声データがデータ記憶手段に記憶された後、その音声データをデータ記憶手段から読み出しながら、特徴点情報を生成することも可能である。その場合、その後、特徴点情報が特徴点情報記憶手段に記憶されればよい。
「特徴点情報記憶手段」としては、上記データ記憶手段と物理的に同じ記憶媒体が利用されてもよいし、別体の記憶媒体であってもよい。
本発明に係るデータ記録再生方法は、前記音声データを記憶するステップと、前記記憶された音声データの中から前記原音信号の音の特性情報を抽出するステップと、前記抽出された特性情報に基づいて特徴点情報を生成するステップと、前記音声データを復号するステップと、前記復号した復号データに前記特徴点情報に基づいて間引き処理を施すことで、前記生成された特徴点情報を用いながら前記原音信号を変速再生するステップとを具備する。
以上のように、本発明によれば、演算処理量を増やすことなく、また、音声データの記録中に別のデータが再生されている場合であっても、その記録中のデータのコンテンツの特徴点を抽出することができる。
以下、本発明の実施の形態を図面に基づき説明する。
図1は、本発明の一実施の形態に係るデータ記録再生装置の構成を示すブロック図である。このデータ記録再生装置100は、アナログテレビ放送やデジタルテレビ放送等を記録し、また、記録したデータを再生することが可能な機器である。
システムコントローラ10は、このデータ記録再生装置100の各ブロックの制御を司っている。システムコントローラ10は、必要に応じてホストバスを介してROM(Read Only Memory)11及びRAM(Random Access Memory)12にアクセスし、全体を制御する。
以下、アナログチューナ14を介してアナログ放送信号が供給される場合において、そのアナログ放送を記録する場合に用いられるブロック及びその機能を説明する。
アナログチューナ14は、アンテナ13を介して入力された映像信号及び音声信号を入力切換回路15に供給する。この入力切換回路15には、外部からのコンポジット映像信号及び音声信号も供給される。入力切換回路15は、システムコントローラ10の制御に応じて、コンポジット映像信号をY/C分離回路16に供給すると共に、音声信号を音声A/D(Analogue/Digital)変換器22に供給する。
Y/C分離回路16は、コンポジット映像信号をY/C分離して切換回路17に供給する。切換回路17は、システムコントローラ10の制御に応じて、外部からのS映像信号とY/C分離回路16からの出力との何れかを選択し、選択した映像信号をNTSC(National Television System Committee)デコーダ18に供給する。
NTSCデコーダ18は、供給された映像信号に対してA/D変換、クロマエンコードの処理を施してデジタルコンポーネント映像データ(以下、映像データという。)に変換し、この映像データをプリ映像信号処理回路20に供給する。また、NTSCデコーダ18は、供給された映像信号の水平同期信号を基準に生成したクロックと、同期分離して得た水平同期信号、垂直同期信号及びフィールド判別信号とを同期制御回路19に供給する。同期制御回路19は、これらの信号を基準として、後述する各ブロックに必要なタイミングに変換したクロック及び同期信号を生成し、各ブロックに供給する。
プリ映像信号処理回路20は、供給された映像データにプリフィルタ処理等の各種映像処理を施し、映像処理後の映像データをMPEG(Moving Picture Experts Group)ビデオエンコーダ21及びポスト映像信号処理回路29に供給する。
MPEGビデオエンコーダ21は、プリ映像信号処理回路20からの映像データに対してブロックDCT(Discrete Cosine Transform)等の符号化処理を施して映像エレメンタリーストリーム(Elementary Stream;ES)を生成し、このビデオESを多重・分離回路25に供給する。なお、本実施の形態ではMPEG方式の圧縮としているが、他の圧縮方式であっても構わない。
一方、音声A/D変換器22は、入力切換回路15で選択された音声信号をデジタル音声データに変換し、MPEGオーディオエンコーダ23及び切換回路32に供給する。MPEGオーディオエンコーダ23は、音声A/D変換器22からの音声データをMPEGフォーマットに従って圧縮した後、オーディオESを生成し、このオーディオESを多重・分離回路25に供給する。
なお、本実施の形態では、映像データ及び音声データをMPEGフォーマットに従って圧縮するものとして説明したが、他の圧縮フォーマットに従って圧縮するようにしてもよく、あるいは圧縮しなくてもよい。
多重・分離回路25は、ビデオES、オーディオES及び各種制御信号を多重化してトランスポートストリーム(Transport Stream;TS)を生成し、バッファ制御回路26に供給する。バッファ制御回路26は、連続的に入力されるTSを、後段のHDD(Hard Disc Drive)27に断続的に送るための制御を行う。例えば、HDD27がシーク動作を行っている際にはTSの書き込みができないため、バッファ制御回路26は、図示しないバッファにTSを一時的に蓄え、書き込みが可能な場合には、入力レートよりも高いレートでHDD27に対して書き込ませる。これにより、連続的に入力されるTSを途切れることなくHDD27に記録することができる。HDD27は、システムコントローラ10の制御に応じて、所定のアドレスにTSを記録する。
SF(スケールファクタ)抽出回路35は、バッファ制御回路26を介して多重・分離回路25からHDD27へ伝送されるTSをパース(parse)して、MPEGオーディオES中のSFを抽出し、特徴点ファイル(特徴点情報)を生成する。生成した特徴点ファイルはシステムコントローラ10の制御に応じて、バッファ制御回路26を介してHDD27上の所定のアドレスへ記録される。SF抽出回路35については、後に詳述する。
なお、本実施の形態では、バッファ制御回路26及びHDD27のプロトコルとしてIDE(Intelligent Drive Electronics)を用いているが、これに限定されるものではない。また、本実施の形態では、記録媒体の例としてHDDを用いて説明したが、光ディスク、光磁気ディスク、固体メモリ等の他の記録媒体を用いることも可能である。
次に、再生時に用いられるブロック及びその機能を説明する。HDD27は、システムコントローラ10の制御に応じて、所定のアドレスにシークし、TSを読み出してバッファ制御回路26に供給する。バッファ制御回路26は、断続的に入力されるTSが連続的になるようバッファ制御し、TSを多重・分離回路25に供給する。多重・分離回路25は、TSからパケット化ES(Packetized Elementary Stream;PES)を抽出し、MPEGオーディオ/ビデオデコーダ28に供給する。
MPEGオーディオ/ビデオデコーダ28は、供給されたパケット化ESをビデオESとオーディオESとに分離し、それぞれ図示しないMPEGビデオデコーダ及びMPEGオーディオデコーダに供給して復号処理を施す。この結果、ベースバンドの映像データ及び音声データが得られ、MPEGオーディオ/ビデオデコーダ28は、この映像データ及び音声データをそれぞれポスト映像信号処理回路29及び切換回路32に供給する。また、MPEGオーディオ/ビデオデコーダ28は、後述するように、上記特徴点ファイルを用いた変速再生のために、復号した後のデータを間引き処理する。
ポスト映像信号処理回路29は、MPEGオーディオ/ビデオデコーダ28からの映像データとプリ映像信号処理回路20からの映像データとの切換え、合成や、フィルタ処理を施し、オンスクリーンディスプレイ(On Screen Display;OSD)30に映像データを供給する。OSD30は、画面表示用のグラフィックス等を生成して映像データに重ねたり部分的に表示したりする等の処理を施し、処理後の映像データをNTSCエンコーダ31に供給する。NTSCエンコーダ31は、供給された映像データ(デジタルコンポーネント映像データ)をY/C信号に変換した後、D/A変換を行い、アナログのコンポジット映像信号とS映像信号とを得る。
一方、切換回路32は、MPEGオーディオ/ビデオデコーダ28からの音声データと音声A/D変換器22からの音声データとの何れか一方を選択して音声D/A変換器33に供給し、音声D/A変換器33は、供給された音声データをアナログ音声信号に変換する。
次に、デジタルIN/OUT39から供給される外部のデジタル信号、デジタルIN/OUT39から外部へ出力されるデジタル信号について説明する。
例えば、外部のIRD(Integrated Receiver Decoder)から、IEEE1394のようなデジタルインターフェイスを介して入力されたデジタルデータを記録する場合、デジタルデータはデジタルインターフェイス回路24に入力される。デジタルインターフェイス回路24は、本方式に適合するよう、デジタルデータに対してフォーマット変換等の処理を施してTSを生成し、このTSを多重・分離回路25に供給する。多重・分離回路25は、さらに制御信号等の解析や生成を行い、本方式に適応するTSに変換し、バッファ制御回路26に供給する。以降の処理は上述と同様であるため省略する。
再生時についても、多重・分離回路25までの処理は、上述と同様であるため省略する。多重・分離回路25は、必要に応じて制御信号の解析、生成を行い、TSをデジタルインターフェイス回路24に供給する。デジタルインターフェイス回路24は、記録時と逆の変換を行って外部のIRDに適合するデジタルデータに変換し、出力する。また、これと同時に多重・分離回路25にて分離処理を行い、MPEGオーディオ/ビデオデコーダ28にパケット化ESを供給することにより、アナログの映像信号及び音声信号を得ることができる。
なお、本実施の形態では、IRDとの接続について説明したが、テレビジョン機器等のAV機器や、パーソナルコンピュータと接続することも可能である。
次に、デジタルチューナ36を用いたデジタル放送の記録及び再生時の機能について説明する。
デジタル放送で送られてきたTS及びESがそのままHDD27に記録されるのではなく、MPEGビデオエンコーダ21やMPEGオーディオエンコーダ23で再エンコードして記録される場合、デジタルチューナ36からのTS出力はバッファ制御回路26を介して、SF抽出回路35及び多重・分離回路25へと供給される。このように、デジタル放送で送られてきたTS及びESが再エンコードされて記録される理由は、例えばデジタル放送のストリーム形式であるTSを、DVD等のフォーマットで用いられるPS(Program Stream)に変換するためである。これにより、デジタル放送のストリームをDVDに記録することが可能となる。
SF抽出回路35は、上述したようにTSをパースしてオーディオES中のSFを抽出し、特徴点ファイルを生成する。生成した特徴点ファイルはシステムコントローラ10の制御に応じて、バッファ制御回路26を介してHDD27上の所定のアドレスへ記録される。SF抽出や特徴点ファイルの生成等については後述する。このSF抽出や特徴点ファイルの生成等については、上述のデジタルIN/OUT39から入力される外部のIRD等による記録時の場合に説明を省略している。しかし、その場合も、上記アナログチューナ14による場合や、デジタルチューナ36等による場合と同様な動作である。
説明を戻し、多重・分離回路25は、バッファ制御回路26から供給されるTSからPES(Packetized Elementary Stream)を抽出し、MPEGオーディオ/ビデオデコーダ28に供給する。
MPEGオーディオ/ビデオデコーダ28は、入力されたPESを、ビデオESとオーディオESに分離し、それぞれをMPEGビデオデコーダ及びMPEGオーディオデコーダに供給し、デジタル放送で用いられている符号化方式に見合った復号処理を施す。本実施の形態では、デジタル放送のオーディオESの種類として、MPEG音声を例に説明しているが、他の圧縮方式でも構わない。その結果、ベースバンドの画像データと音声データが得られ、それぞれMPEGビデオエンコーダ21とMPEGオーディオエンコーダ23へと供給される。
MPEGビデオエンコーダ21は、MPEGビデオ方式の符号化処理を施し、映像のESを生成し、多重・分離回路25に供給する。MPEGオーディオエンコーダ23は、MPEGオーディオ方式の符号化処理を施し、音声のESを生成し、多重・分離回路25に供給する。
多重・分離回路25は、入力されたMPEGビデオESと、MPEGオーディオESを合わせて、多重化処理を施し、MPEGシステムのTSを生成して、バッファ制御回路26に供給する。
バッファ制御回路26は、多重・分離回路25から連続的に入力されるTSを、後段のHDD27に断続的に送るための制御を施し、HDD27へ記録する。
一方、再エンコードせず、デジタル放送で送信されてきたTS及びESをそのままHDD27へ記録する場合、デジタルチューナ36からのTS形式の出力はバッファ制御回路26を介して、SF抽出回路35及びHDD27へと供給される。
この場合も同様に、SF抽出回路35は、TSをパースして、デジタル放送で使われている圧縮方式のオーディオES中のSFを抽出し、特徴点ファイルを生成する。生成した特徴点ファイルはシステムコントローラ10の制御に応じて、バッファ制御回路26を介してHDD27上の所定のアドレスへ記録される。HDD27は、バッファ制御回路26から断続的に入力されるTS及び特徴点ファイルをHDD27上へ記録する。
図2は、SF抽出回路35の構成を示すブロック図である。
分離回路43は、バッファ制御回路26から入力されたTSを分離して、MPEGオーディオのPESを抽出し、MPEGオーディオパーサ44に供給する。分離回路43は、つまり多重・分離回路25の一部の機能を有する。
MPEGオーディオパーサ44は、分離回路43から入力されたMPEGオーディオのPESをパースして、PESの中から再生時刻を表すPTS(Presentation Time Stamp)及びMPEGオーディオES中のサブバンドごとのSFを抽出し、これを特徴点ファイル生成回路45へ供給する。
特徴点ファイル生成回路45は、MPEGオーディオパーサ44から入力されたPTSとSFから、例えば人の声である声音帯域成分が含まれる期間、人の声以外の音である非声音帯域成分が含まれる有音区間 及び 音が何もない無音区間等のオーディオコンテンツの特徴をまとめた特徴点ファイルを生成する。生成した特徴点ファイルはシステムコントローラ10の制御に応じて、バッファ制御回路26を介してHDD27上の所定のアドレスへ記録される。
なお、本実施の形態では特徴点ファイルの中身として、音声成分が含まれる期間や無音区間等を表す形態で格納しているが、例えばMPEGオーディオES中のSFをそのまま格納する形態も考えられる。また特徴点ファイルの中身としては、本実施の形態で述べたオーディオコンテンツの特徴だけではなく、例えばビデオコンテンツの特徴や二ヶ国語放送の有無等の特徴も一緒に格納する形態も考えられる。
図3は、SF抽出回路35が扱うMPEGオーディオES中のSFと特徴点ファイルの関係性を説明するための図である。
図3の中段に記した3次元棒グラフは、ある再生時間(図3中の2T)分のMPEGオーディオESに含まれる、ある特定のサブバンド(周波数帯域)ごとのSF値を一例として表した図である。その横軸は時間、縦軸はSFが示す音圧レベル、左手前から右奥へ斜めに伸びる軸はサブバンドを表す。つまり9個のオーディオフレーム分の時間内にある特定の3つのサブバンドが持つ各SF値を3次元でプロットした図である。
図3では、サブバンドは、3つの帯域が示されているが、MPEG方式では実際には32個ある。しかし、サブバンドはこれらの個数に限られない。図中の2Tは、例えば10秒〜3分程度、より好ましくは、30秒〜2分程度、さらに好ましくは1分程度である。しかし、2Tはこれらの値に限られない。
図3の上段は、中段に示したSF値を算出する元となった、つまりMPEGオーディオエンコード処理を施す前の時間軸での音波形を、中段のSFと時間軸を合わせて示している。図中に示した時間範囲のうち、前半には比較的高い周波数成分を持つ音が存在し、後半には比較的低い周波数成分が存在している。SFは各サブバンドが持つ周波数帯域内の最大音圧レベルを示すものとして捉えられるため、前半の比較的高い周波数成分を持つ時間軸音波形は、図3中段の3次元棒グラフ中の奥側、つまり比較的高い周波数帯域を受け持つサブバンドのSF値として積み上げられる。一方、後半の比較的低い周波数成分を持つ時間軸波形は、図3中段の3次元棒グラフ中の手前側、つまり比較的低い周波数帯域を受け持つサブバンドのSF値として積み上げられる。なお、図3上段の時間軸波形を見ると前半及び後半共に同様の波形振幅を持つような例となっているため、図3中段のSFを示す棒の高さ(長さ)も前半及び後半共に同様の値になっている。
図3下段には、特徴点ファイル生成回路45が、図3中段に示したMPEGオーディオES中のSFから、どのように特徴点を抜き出し、特徴点ファイルとしてどのようにHDD27に記憶するのかを表した図である。図3上段及び中段同様、下段も同じスケールの時間軸を持っているが、前半は比較的高い周波数成分を受け持つサブバンドのSF値が大きくなっている。したがって、コンテンツとして比較的高い音が存在するが、特徴点ファイル生成回路45は、これらのSF値を人間の声音が持つ周波数帯域よりも高い音である「非声音有」として、この「非声音有」の情報を特徴点ファイル内の該当再生区間に相当する場所に格納する。
比較的高い周波数成分を持った信号を含む前半と、比較的低い周波数成分を持つ信号を含む後半の間に、どのサブバンドのSFも振幅を持たない(棒の高さが無い)2オーディオフレーム分の区間が存在する。そのため、特徴点ファイル生成回路45は、その区間を「無音」として特徴点ファイル内の該当再生区間に相当する場所へ格納する。
後半は、比較的低い周波数成分を持つサブバンドのSF値(例えば4オーディオフレーム分)が大きくなっており、ちょうど人間の声音が持つ周波数帯域と合致する。したがって、特徴点ファイル生成回路45は、その区間を「声音有」として特徴点ファイル内の該当再生区間に相当する場所へ格納する。
本実施の形態では、人間の「声音」は、例えば基本周波数で70〜350Hz程度、より具体的には100〜300Hz程度とする。その「声音」より低い周波数及び高い周波数が「非声音」とされる。しかし、これらの範囲に限られず、適宜設定可能である。システムコントローラ10は、これらの周波数帯域を閾値として、「非声音有」、「非声音有」及び「無音」を判別する。それらの周波数帯域を閾値は、HDD27、RAM12、またはROM11等に格納されていればよい。
このように所定の時間(上記2T)ごとに生成された「非声音有」、「非声音有」及び「無音」の情報が、当該所定の時間ごとに特徴点ファイルとしてHDD27に記憶される。その場合、各特徴点ファイルと、その特徴点ファイルの元になる、符号化された音声データとは、図示しないテーブルにより対応付けされてHDD27に記憶される。
なお、本実施の形態では、特徴点ファイルはPESから抽出したPTSを利用して抽出した特徴点ファイルと再生コンテンツの時間的な関係を保っているが、他の時刻情報を用いた管理手法を用いても構わない。
また、本実施の形態では特徴点ファイルに格納する情報の分類方法として、コンテンツ内に含まれる人間の声音を優先して再生することを目的として、音声の有無を1つの基準として用いているが、別の観点で分類することも可能である。
図4は、MPEGオーディオ/ビデオデコーダ28の構成を示すブロック図である。
例えば2倍速の変速再生の場合、分離回路37には、2倍の供給レートでPESが入力される。この場合、分離回路37は、通常再生(1倍速再生)時と比べて2倍の処理速度で、ビデオESとオーディオESに分離処理し、2倍の供給レートで、ビデオESをMPEGビデオデコーダ40へ、オーディオESをMPEGオーディオデコーダ41へ供給する。もしMPEGビデオデコーダ40が通常再生でなく、また2倍速で動作しない場合は、分離回路37は、システムコントローラ10の制御に応じて、ビデオESの中から2倍速変速再生に用いる部分だけを抜き出してMPEGビデオデコーダ40へ供給する。MPEGビデオデコーダ40で復号処理を施されたベースバンドの映像データは、2倍速の変速再生として見合った映像データとして、MPEGオーディオ/ビデオデコーダ28の出力としてポスト映像信号処理回路29へ供給される。MPEGオーディオデコーダ41で2倍速で復号されたPCMデータは、通常再生と比べて2倍の供給レートで間引き処理回路42へと供給される。間引き処理回路42は、システムコントローラ10によってHDD27から読み出された特徴点ファイルを利用しながら、入力されてきた音声データを半分のレートへ間引く処理を行う。間引き処理回路42は、間引き処理した音声データをMPEGオーディオ/ビデオデコーダ28の出力として切換回路32へ供給する。
なお、通常再生時においては、間引き処理回路42は、MPEGオーディオデコーダ41から供給されるPCMデータに間引き処理を施さず、通常速度でMPEGオーディオ/ビデオデコーダ28の出力として切換回路32へ供給する。
図5は、間引き処理回路42が、記録時に作成してHDD27に保管された特徴点ファイルを利用し、音声が含まれる区間を優先的に再生するようにして2倍速再生を実現する方法を説明するための図である。
図5の上段は、あるタイトル(例えば、ある1つのテレビ番組)を1倍速で再生した場合のある一定期間(図中の2T)分の時間軸音波形を表したものである。図5の中段は、図3の下段と同じ、あるタイトルが記録される際に生成されHDD27上で保管されていた特徴点ファイルの内容を、上段の時間軸波形の時間軸に合わせて並べて示した図である。その特徴点ファイルの中身「非声音有」、「無音」及び「声音有」は、図3で示した方法で生成されたものであり、図5の上段と中段を結ぶ4本の垂直の破線により、復号して得られた図5上段の時間軸音波形とも相関関係を持つことを示している。
図5の下段は、間引き処理回路42が、特徴点ファイルを利用し、「声音有」の区間を優先して2倍速で再生したときの再生音波形を表す。図5上段の2T時間分のコンテンツが2倍速再生されることで、再生時間は図5下段中のT時間分に半減したことになる。図5上段の2T時間分のコンテンツの中身は、間引き処理回路42は、図5中段の特徴点ファイルを参照することでその2T時間分のコンテンツの特徴が分かる。これにより、間引き処理回路42は、「無音」の区間及び「非声音有」の区間を除去して、後半の「声音有」の区間だけを再生することで、2倍速という再生要求速度に対応しつつ、人の声音が含まれる重要と思われるシーンを優先的に再生することができる。
特に、記録されるコンテンツが、バラエティ番組、ニュース番組、英会話番組等、人の声音の内容がその番組の要旨となるような番組に、特に本実施の形態は有効である。しかし、これらの番組に限定されないことは言うまでもない。テレビ放送に限らず、もちろんラジオ番組でもよい。
以上のように、本実施の形態によれば、圧縮符号化された音声データの中からSF(原音信号の音の特性情報)が抽出され、MPEGオーディオ/ビデオデコーダ28での復号処理を要することなく、抽出されたSFに基づいて特徴点ファイルが生成される。これにより、復号処理した後にサブバンドデータが生成され、そのサブバンドが持つエネルギーを観測して小区間が持つ特徴を分類する従来の方法に比べ、本実施の形態では演算処理量を減らすことができる。また、既に過去に記録された別の番組(別のタイトル)の再生途中であっても、現在記録中のタイトルのコンテンツのSFを抽出することが可能となる。
本発明は以上説明した実施の形態には限定されるものではなく、種々の変形が可能である。
上記の説明では、2倍の速度の変速再生を例に挙げた。しかし、2倍だけに限定されるものではなく、例えば1.5倍速、4倍速、8倍速、10倍速、あるいはそれ以上であってもよい。あるいは、ユーザの設定により段階的に再生速度が変化するような形態であってもよい。さらには、再生速度が自動で変化するような形態でもよい。
上記実施の形態では、例えば図3上段に示すように、説明を分かりやすくするため、たまたま「声音有」の区間が、特徴点ファイルの全時間(2T)の半分の時間で、2倍速再生に合うような例を挙げた。しかし、2T分のほとんどが「声音有」であった場合、例えば2倍速再生する場合には、その特徴点ファイルの「声音有」のSFの中でもより音圧レベルの高いSFを抽出して間引き処理することにより実現される。その音圧レベルの閾値は、1つだけ設定されていてもよいし、複数段階的に設定されていてもよい。
例えば、上記実施の形態のように、声音が含まれる区間を優先して再生することに限定されない。例えば声音を問わず、有音区間を優先的に再生して、無音区間だけを除去するような変速再生方法が考えられる。あるいは、ビデオのコンテンツが持つ特徴を加味して間引き処理を行う変速再生方法への適用も考えられる。
また、特徴点ファイルの生成タイミングも、記録時だけに限定されるものではなく、一旦記録が完了した後にHDD上のTSを読み出してパースする方法が考えられる。あるいは、高速な読出しレートを持つ記録媒体と高速な演算能力を持つSF抽出回路やシステムコントローラ等が用いられれば、変速再生するときにリアルタイムで特徴点ファイルを瞬時に生成して変速再生時の間引き処理に利用する方法等も考えられる。
本発明の一実施の形態に係るデータ記録再生装置の構成を示すブロック図である。 SF抽出回路の構成を示すブロック図である。 SF抽出回路が扱うMPEGオーディオES中のSFと特徴点ファイルの関係性を説明するための図である。 MPEGオーディオ/ビデオデコーダの構成を示すブロック図である。 図4に示す間引き処理回路が、記録時に作成してHDDに保管された特徴点ファイルを利用し、音声が含まれる区間を優先的に再生するようにして2倍速再生を実現する方法を説明するための図である。
符号の説明
10…システムコントローラ
21…MPEGビデオエンコーダ
23…MPEGオーディオエンコーダ
25…多重・分離回路
26…バッファ制御回路
27…HDD
28…MPEGオーディオ/ビデオデコーダ
35…SF抽出回路
37…分離回路
40…MPEGビデオデコーダ
41…MPEGオーディオデコーダ
42…間引き処理回路
43…分離回路
44…MPEGオーディオパーサ
45…特徴点ファイル生成回路
100…データ記録再生装置

Claims (6)

  1. 原音信号が符号化されて生成された音声データを前記原音信号に復号して再生するデータ記録再生装置であって、
    前記音声データを記憶するデータ記憶手段と、
    前記データ記憶手段に記憶された音声データの中から前記原音信号の音の特性情報を抽出し、前記抽出した特性情報に基づいて特徴点情報を生成する特徴点情報生成手段と、
    前記音声データを復号し、前記復号した復号データに前記特徴点情報に基づいて間引き処理を施すことで、前記原音信号を変速再生する変速再生手段と
    を具備することを特徴とするデータ記録再生装置。
  2. 請求項1に記載のデータ記録再生装置であって、
    前記特徴点情報生成手段は、前記音声の有無の情報を前記特徴点情報として生成することを特徴とするデータ記録再生装置。
  3. 請求項1に記載のデータ記録再生装置であって、
    前記特徴点情報生成手段は、所定の時間ごとに前記特徴点情報を生成することを特徴とするデータ記録再生装置。
  4. 請求項1に記載のデータ記録再生装置であって、
    前記生成された特徴点情報を、該特徴点情報に対応する前記特性情報を持つ前記音声データと対応付けて記憶する特徴点情報記憶手段をさらに具備することを特徴とするデータ記録再生装置。
  5. 原音信号が符号化されて生成された音声データを前記原音信号に復号して再生するデータ記録再生方法であって、
    前記音声データを記憶するステップと、
    前記記憶された音声データの中から前記原音信号の音の特性情報を抽出するステップと、
    前記抽出された特性情報に基づいて特徴点情報を生成するステップと、
    前記音声データを復号するステップと、
    前記復号した復号データに前記特徴点情報に基づいて間引き処理を施すことで、前記生成された特徴点情報を用いながら前記原音信号を変速再生するステップと
    を具備することを特徴とするデータ記録再生方法。
  6. 原音信号が符号化されて生成された音声データを前記原音信号に復号して再生するためのプログラムであって、
    前記音声データをデータ記憶手段に記憶させるステップと、
    前記記憶された音声データの中から前記原音信号の音の特性情報を抽出するステップと、
    前記抽出された特性情報に基づいて特徴点情報を生成するステップと、
    前記音声データを復号するステップと、
    前記復号した復号データに前記特徴点情報に基づいて間引き処理を施すことで、前記生成された特徴点情報を用いながら前記原音信号を変速再生するステップと
    をコンピュータに実行させるプログラム。
JP2005285997A 2005-09-30 2005-09-30 データ記録再生装置、データ記録再生方法及びそのプログラム Pending JP2007094234A (ja)

Priority Applications (5)

Application Number Priority Date Filing Date Title
JP2005285997A JP2007094234A (ja) 2005-09-30 2005-09-30 データ記録再生装置、データ記録再生方法及びそのプログラム
EP06255034A EP1770704A3 (en) 2005-09-30 2006-09-28 Data recording and reproducing apparatus, method, and program therefor
KR1020060094763A KR101291474B1 (ko) 2005-09-30 2006-09-28 데이터 기록 재생 장치, 데이터 기록 재생 방법 및 그 프로그램이 기록된 기록매체
US11/529,868 US8275473B2 (en) 2005-09-30 2006-09-29 Data recording and reproducing apparatus, method of recording and reproducing data, and program therefor
CN2006101463843A CN1941144B (zh) 2005-09-30 2006-09-30 数据记录和再现设备及方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2005285997A JP2007094234A (ja) 2005-09-30 2005-09-30 データ記録再生装置、データ記録再生方法及びそのプログラム

Publications (1)

Publication Number Publication Date
JP2007094234A true JP2007094234A (ja) 2007-04-12

Family

ID=37649426

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2005285997A Pending JP2007094234A (ja) 2005-09-30 2005-09-30 データ記録再生装置、データ記録再生方法及びそのプログラム

Country Status (5)

Country Link
US (1) US8275473B2 (ja)
EP (1) EP1770704A3 (ja)
JP (1) JP2007094234A (ja)
KR (1) KR101291474B1 (ja)
CN (1) CN1941144B (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009075280A (ja) * 2007-09-20 2009-04-09 Nippon Hoso Kyokai <Nhk> コンテンツ再生装置
JP2014048477A (ja) * 2012-08-31 2014-03-17 Toshiba Alpine Automotive Technology Corp 音声再生装置および音声再生方法

Families Citing this family (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE102007006995A1 (de) * 2007-02-14 2008-08-21 Robert Bosch Gmbh Korrektureinrichtung für audiovisuelle Daten
US20090202227A1 (en) * 2008-02-13 2009-08-13 Samsung Electronics Co., Ltd. Method and apparatus for recording data, method and apparatus for reproducing data, and recording medium for recording data
JP2010074823A (ja) * 2008-08-22 2010-04-02 Panasonic Corp 録画編集装置
US20100228736A1 (en) * 2009-02-20 2010-09-09 All Media Guide, Llc Recognizing a disc
WO2010121262A1 (en) * 2009-04-17 2010-10-21 Maxlinear, Inc. Wideband personal-radio recorder
US8526898B2 (en) * 2009-04-17 2013-09-03 Maxlinear, Inc. Wideband tuner architecture
WO2011072893A1 (en) * 2009-12-16 2011-06-23 International Business Machines Corporation Video coding using pixel-streams

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH10285046A (ja) * 1997-04-08 1998-10-23 Sony Corp 情報信号処理装置、情報信号記録装置及び情報信号再生装置
JP2000100072A (ja) * 1998-09-24 2000-04-07 Sony Corp 情報信号処理方法及び装置
JP2001344905A (ja) * 2000-05-26 2001-12-14 Fujitsu Ltd データ再生装置、その方法及び記録媒体
JP2003242717A (ja) * 2002-02-19 2003-08-29 Sanyo Electric Co Ltd 記録再生装置

Family Cites Families (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3555224B2 (ja) 1995-03-14 2004-08-18 ソニー株式会社 オーディオ信号表示装置
EP0756267A1 (en) * 1995-07-24 1997-01-29 International Business Machines Corporation Method and system for silence removal in voice communication
US5995153A (en) * 1995-11-02 1999-11-30 Prime Image, Inc. Video processing system with real time program duration compression and expansion
JP3607450B2 (ja) 1997-03-05 2005-01-05 Kddi株式会社 オーディオ情報分類装置
JP3546755B2 (ja) * 1999-05-06 2004-07-28 ヤマハ株式会社 リズム音源信号の時間軸圧伸方法及び装置
JP3947352B2 (ja) * 2000-11-30 2007-07-18 沖電気工業株式会社 再生装置
JP2002215192A (ja) 2001-01-17 2002-07-31 Nec Corp オーディオ情報処理装置及び処理方法
RU2287864C2 (ru) * 2001-04-20 2006-11-20 Конинклейке Филипс Электроникс Н.В. Специальные возможности воспроизведения мр3
JP4546682B2 (ja) * 2001-06-26 2010-09-15 パイオニア株式会社 映像情報要約装置、映像情報要約方法および映像情報要約処理プログラム
US7260439B2 (en) * 2001-11-01 2007-08-21 Fuji Xerox Co., Ltd. Systems and methods for the automatic extraction of audio excerpts
US7079905B2 (en) * 2001-12-05 2006-07-18 Ssi Corporation Time scaling of stereo audio
US7149412B2 (en) * 2002-03-01 2006-12-12 Thomson Licensing Trick mode audio playback
US7189913B2 (en) * 2003-04-04 2007-03-13 Apple Computer, Inc. Method and apparatus for time compression and expansion of audio data with dynamic tempo change during playback
JP2005174397A (ja) * 2003-12-08 2005-06-30 Ricoh Co Ltd 情報記録装置と情報記録方法とプログラム
EP1578141A1 (en) * 2004-03-19 2005-09-21 Deutsche Thomson-Brandt Gmbh Method and apparatus for adapting the speed or pitch of replayed or received digital audio signals
WO2005122141A1 (en) * 2004-06-09 2005-12-22 Canon Kabushiki Kaisha Effective audio segmentation and classification
JP4229041B2 (ja) 2004-10-08 2009-02-25 ソニー株式会社 信号再生装置及び方法

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH10285046A (ja) * 1997-04-08 1998-10-23 Sony Corp 情報信号処理装置、情報信号記録装置及び情報信号再生装置
JP2000100072A (ja) * 1998-09-24 2000-04-07 Sony Corp 情報信号処理方法及び装置
JP2001344905A (ja) * 2000-05-26 2001-12-14 Fujitsu Ltd データ再生装置、その方法及び記録媒体
JP2003242717A (ja) * 2002-02-19 2003-08-29 Sanyo Electric Co Ltd 記録再生装置

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009075280A (ja) * 2007-09-20 2009-04-09 Nippon Hoso Kyokai <Nhk> コンテンツ再生装置
JP2014048477A (ja) * 2012-08-31 2014-03-17 Toshiba Alpine Automotive Technology Corp 音声再生装置および音声再生方法

Also Published As

Publication number Publication date
US8275473B2 (en) 2012-09-25
CN1941144B (zh) 2011-07-13
KR101291474B1 (ko) 2013-07-30
KR20070037355A (ko) 2007-04-04
CN1941144A (zh) 2007-04-04
EP1770704A3 (en) 2012-04-25
EP1770704A2 (en) 2007-04-04
US20070179649A1 (en) 2007-08-02

Similar Documents

Publication Publication Date Title
KR101291474B1 (ko) 데이터 기록 재생 장치, 데이터 기록 재생 방법 및 그 프로그램이 기록된 기록매체
US20150104158A1 (en) Digital signal reproduction device
JP4013800B2 (ja) データ作成方法及びデータ記録装置
JP4600236B2 (ja) 再生装置、記録再生装置、データ処理方法及びそのプログラム
US6816444B1 (en) Method and apparatus for digital information processing
JP2005012499A (ja) データ再生方法及びデータ再生装置
JPWO2006075457A1 (ja) 記録装置
JP3926102B2 (ja) Mpeg方式の映像・音声データ記録システム及びその編集システム
JP4703733B2 (ja) 映像・音声再生装置
JP2008166973A (ja) 記録再生装置および再生装置
JP4391450B2 (ja) 再生装置、コンテンツ記録媒体、再生装置の制御方法、制御プログラムおよび記録媒体
JP2008262000A (ja) オーディオ信号特徴検出装置及び特徴検出方法
JP4229041B2 (ja) 信号再生装置及び方法
JPH11134814A (ja) 音声記録媒体および音声再生装置
KR20050041603A (ko) 비디오 데이터를 포함하는 오디오 컨텐츠 제작방법 및비디오 데이터가 포함된 오디오 컨텐츠 재생장치
JP4053449B2 (ja) 再生速度変換装置
US20080162899A1 (en) Compressed data transfer apparatus and method for transferring compressed data
JP4196475B2 (ja) 再生装置及び方法並びに記録及び/又は再生装置及び方法
JPH09154093A (ja) 映像・音声再生装置
KR100839695B1 (ko) 디지털 레코더의 리핑장치 및 방법
JP2009199678A (ja) 情報処理置および方法、並びにプログラム
JP2006333340A (ja) 情報再生装置、情報再生方法及びコンピュータプログラム
KR20040079690A (ko) 사용자 지향적 자막 재생 장치 및 그 자막 재생 방법
JP2005128132A (ja) 話速変換方法及び話速変換装置
JP2003249026A (ja) 再生装置および再生方法

Legal Events

Date Code Title Description
A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20090813

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20090818

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20091013

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20100413

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20100510

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20110125