JP2008209903A - 再生装置、再生方法及び再生プログラム - Google Patents

再生装置、再生方法及び再生プログラム Download PDF

Info

Publication number
JP2008209903A
JP2008209903A JP2007337815A JP2007337815A JP2008209903A JP 2008209903 A JP2008209903 A JP 2008209903A JP 2007337815 A JP2007337815 A JP 2007337815A JP 2007337815 A JP2007337815 A JP 2007337815A JP 2008209903 A JP2008209903 A JP 2008209903A
Authority
JP
Japan
Prior art keywords
music data
reproduction
start position
end position
amplitude level
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2007337815A
Other languages
English (en)
Other versions
JP4973492B2 (ja
Inventor
Taiyo Matsuhashi
太陽 松橋
Harumi Kumasaka
春美 熊坂
Yoshihiro Sagawa
賀宏 佐川
Hiromasa Ishiyama
弘将 石山
Takeshi Kogure
岳史 木暮
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Victor Company of Japan Ltd
Original Assignee
Victor Company of Japan Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Victor Company of Japan Ltd filed Critical Victor Company of Japan Ltd
Priority to JP2007337815A priority Critical patent/JP4973492B2/ja
Priority to US12/010,685 priority patent/US7714223B2/en
Priority to EP08001663A priority patent/EP1953751A3/en
Priority to KR1020080009437A priority patent/KR100924731B1/ko
Publication of JP2008209903A publication Critical patent/JP2008209903A/ja
Application granted granted Critical
Publication of JP4973492B2 publication Critical patent/JP4973492B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B20/00Signal processing not specific to the method of recording or reproducing; Circuits therefor
    • G11B20/10Digital recording or reproducing
    • G11B20/10527Audio or video recording; Data buffering arrangements
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B20/00Signal processing not specific to the method of recording or reproducing; Circuits therefor
    • G11B20/10Digital recording or reproducing
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/26Pre-filtering or post-filtering
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B20/00Signal processing not specific to the method of recording or reproducing; Circuits therefor
    • G11B20/10Digital recording or reproducing
    • G11B20/12Formatting, e.g. arrangement of data block or words on the record carriers
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B20/00Signal processing not specific to the method of recording or reproducing; Circuits therefor
    • G11B20/10Digital recording or reproducing
    • G11B20/14Digital recording or reproducing using self-clocking codes
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B27/00Editing; Indexing; Addressing; Timing or synchronising; Monitoring; Measuring tape travel
    • G11B27/10Indexing; Addressing; Timing or synchronising; Measuring tape travel
    • G11B27/102Programmed access in sequence to addressed parts of tracks of operating record carriers
    • G11B27/105Programmed access in sequence to addressed parts of tracks of operating record carriers of operating discs
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B27/00Editing; Indexing; Addressing; Timing or synchronising; Monitoring; Measuring tape travel
    • G11B27/10Indexing; Addressing; Timing or synchronising; Measuring tape travel
    • G11B27/19Indexing; Addressing; Timing or synchronising; Measuring tape travel by using information detectable on the record carrier
    • G11B27/28Indexing; Addressing; Timing or synchronising; Measuring tape travel by using information detectable on the record carrier by using information signals recorded by the same method as the main recording
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/022Blocking, i.e. grouping of samples in time; Choice of analysis windows; Overlap factoring
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B20/00Signal processing not specific to the method of recording or reproducing; Circuits therefor
    • G11B20/10Digital recording or reproducing
    • G11B20/10527Audio or video recording; Data buffering arrangements
    • G11B2020/10537Audio or video recording
    • G11B2020/10546Audio or video recording specifically adapted for audio data
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B20/00Signal processing not specific to the method of recording or reproducing; Circuits therefor
    • G11B20/10Digital recording or reproducing
    • G11B20/10527Audio or video recording; Data buffering arrangements
    • G11B2020/10537Audio or video recording
    • G11B2020/10546Audio or video recording specifically adapted for audio data
    • G11B2020/10555Audio or video recording specifically adapted for audio data wherein the frequency, the amplitude, or other characteristics of the audio signal is taken into account
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B20/00Signal processing not specific to the method of recording or reproducing; Circuits therefor
    • G11B20/10Digital recording or reproducing
    • G11B20/10527Audio or video recording; Data buffering arrangements
    • G11B2020/10537Audio or video recording
    • G11B2020/10546Audio or video recording specifically adapted for audio data
    • G11B2020/10555Audio or video recording specifically adapted for audio data wherein the frequency, the amplitude, or other characteristics of the audio signal is taken into account
    • G11B2020/10574Audio or video recording specifically adapted for audio data wherein the frequency, the amplitude, or other characteristics of the audio signal is taken into account volume or amplitude

Landscapes

  • Engineering & Computer Science (AREA)
  • Signal Processing (AREA)
  • Multimedia (AREA)
  • Physics & Mathematics (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Health & Medical Sciences (AREA)
  • Acoustics & Sound (AREA)
  • Computational Linguistics (AREA)
  • Electrophonic Musical Instruments (AREA)
  • Reverberation, Karaoke And Other Acoustics (AREA)
  • Signal Processing For Digital Recording And Reproducing (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Indexing, Searching, Synchronizing, And The Amount Of Synchronization Travel Of Record Carriers (AREA)

Abstract

【課題】ライブ盤等の曲間に無音のない音楽ソースをエンコードした音楽ファイルを再生する際に、曲間において発生する無音部を取り除いてギャップの発生を抑制する再生装置、再生方法及び再生プログラムを提供する。
【解決手段】 デコード処理部23より得られた第1の音楽データの終了位置からその末尾部分の所定区間の平均振幅レベルを算出し、算出した平均振幅レベルに基づいて、第1の音楽データの末尾部分の無音部を検出するための閾値を算出する閾値算出部27と、閾値以上で第1の音楽データの末尾位置に最も近い位置を再生終了位置とし、閾値以上で第2の音楽データの先頭位置に最も近い位置を再生開始位置として曲間の無音部を取り除いて再生する音楽データ出力部30とを備える。
【選択図】図5

Description

本発明は、圧縮された音楽データをデコード処理し、曲間において音が途切れるギャップの発生を抑制して再生する再生装置、再生方法及び再生プログラムに関する。
携帯型のデジタルオーディオプレーヤ(DAP:Digital Audio Player)の普及によって、MP3(MPEG-1 Audio LayerIII)、AAC(Advanced Audio Coding)等の種々の音楽データ圧縮方式が規格化されている。
これらの圧縮方式では、1曲分のデータは1つの音楽ソースとして管理され、1つの音楽ソースはフレーム単位に分割されて圧縮(エンコード)処理される。そして、音楽ソースから圧縮音楽データを得るエンコード処理の過程で、変形離散コサイン変換(MDCT:Modified Discrete Cosine Transform)が用いられる。このMDCT変換は、隣接したフレームを重複させて行うので、隣接したフレームの境界において、ノイズの発生を防ぐ利点がある。
一方、フレームを重複させる変換のため、伸張(デコード)処理する際には直前のフレームのデータが必要となる。そこで、MDCT変換を用いたエンコード処理では、音楽データの先頭位置より前に無音部を付加した先頭フレームが作成される。同様に、音楽データの末尾位置よりも後ろに無音部を付加した末尾フレームも作成される。
図14は、エンコード処理前の音楽ソース及びエンコード処理後の圧縮音楽データの先頭部分における波形の一例を示す図である。図14に示すように、エンコード処理後の圧縮音楽データはフレーム単位に分割されて、先頭部分に無音部が付加される。図14のエンコード処理後の圧縮音楽データは、先頭部分への無音部の付加により、エンコード処理前の音楽データと比較して音の出だしが遅れることになる。図15は、エンコード処理前の音楽ソース及びエンコード処理後の圧縮音楽データの末尾部分における波形の一例を示す図である。図15に示すように、エンコード処理後の圧縮音楽データの末尾部分にも無音部が付加される。
ところで、音楽CD(Compact Disk)として、曲同士が繋がっている生演奏を記録した、いわゆるライブ盤が存在する。上述のMDCT変換を用いた圧縮方式によって、このライブ盤を再生して得られる1曲分の音楽ソース毎にエンコード処理して圧縮音楽データを生成し、この圧縮音楽データをデコード処理して再生する場合、前の曲の末尾部分と次の曲の先頭部分との曲間においてギャップが発生する。このギャップが発生することにより、音が一瞬途切れてしまい、不自然な再生音が生じてしまう。
このような曲間のギャップを解消する技術として次のようなものが知られている。(1)曲が切り替わる際に、前の再生曲の末尾部分の音を次第に小さく(フェードアウト)し、同時に次に再生する曲(次の再生曲)の音の先頭部分を次第に大きく(フェードイン)するクロスフェードを数秒間行うことによって、曲間のギャップが目立たないように曲を再生する。図16は、破線にて示す前の再生曲と実線にて示す次の再生曲をクロスフェードさせた波形の一例を示している。(2)音楽ソースのエンコード処理時に音楽ソースの長さ情報を保存しておいて、その情報をもとにして曲間のギャップを取り除くことによって、曲間のギャップを生じさせることなく曲を再生する。(3)ライブ盤等の曲間に無音部のない複数曲の音楽ソースを1つのファイルに保存することによって、曲間のギャップを生じさせることなく再生する。この方法は特許文献1に開示されている。
特開2004−93729号公報
しかしながら、上記(1)の方法の場合、図16に示すように曲が連続して繋がらないので、再生音は不自然となってしまう。また、上記(2)の方法の場合、曲間のギャップを取り除いて再生するプレーヤは、エンコード処理を行う装置(エンコーダ)に対応しているものに限定される。すなわち、プレーヤは、どのようなエンコード処理が行われたかを予め知っていることが必要となる。また、上記(3)の方法の場合も上記(2)と同様に、プレーヤはエンコーダに対応しているものに限定される。また、複数曲の音楽ソース全体で1つのファイルに保存するため、所望の曲を即時再生することが困難となる。
本発明は以上の点に鑑みなされたもので、ライブ盤から得られる1曲分の音楽ソース毎にエンコード処理された圧縮音楽データを再生する際に、圧縮方式によることなく、曲間において音が途切れるギャップの発生を抑制して曲を再生することができる再生装置、再生方法及び再生プログラムを提供することを目的とする。
本発明は、前述した従来の技術の課題を解決するため、再生装置、再生方法及び再生プログラムを提供するものである。
再生対象曲の圧縮音楽データを順次デコード処理するデコード手段と、デコード手段によって第1の圧縮音楽データをデコード処理した第1の音楽データの末尾部分の所定区間における平均振幅レベルを算出し、算出した平均振幅レベルに基づいて、第1の音楽データの末尾部分における無音部を検出するための閾値を算出する閾値算出手段と、第1の音楽データに対して、閾値算出手段によって得られた閾値以上の振幅レベルで、第1の音楽データの末尾位置に最も近い位置を第1の音楽データを再生する際の再生終了位置として検出する再生終了位置検出手段と、デコード手段によって第1の圧縮音楽データの次の再生対象曲である第2の圧縮音楽データをデコード処理した第2の音楽データに対して、閾値以上の振幅レベルで、第2の音楽データの先頭位置の近傍位置を第2の音楽データを再生する際の再生開始位置として検出する再生開始位置検出手段と、第1の音楽データの再生終了位置まで再生した後、第2の音楽データの再生開始位置から再生を行う再生手段とを備える再生装置である。
また、再生開始位置検出手段は、第2の音楽データにおける第1の音楽データの再生終了位置の振幅の増減方向と同一方向のデータ部分で、且つ振幅レベルが第1の音楽データの再生終了位置の振幅レベルに対して予め定めた範囲内にあって、第2の音楽データの先頭位置に最も近い位置を第2の音楽データの再生開始位置として検出する再生装置である。
また、再生開始位置検出手段は、第2の音楽データの波形の傾きが第1の音楽データの波形の傾きに対して予め定めた範囲内にあって、第2の音楽データの先頭位置に最も近い位置を第2の音楽データの再生開始位置として検出する再生装置である。
また、閾値が所定の値以下であるか否かを判別する判別手段を備え、再生終了位置検出手段は、判別手段によって閾値が所定の値以下であると判別された場合、第1の音楽データの末尾位置を第1の音楽データを再生する際の再生終了位置として検出し、再生開始位置検出手段は、判別手段によって閾値が所定の値以下であると判別された場合、第2の音楽データの先頭位置を第2の音楽データを再生する際の再生開始位置として検出する再生装置である。
また、第1の音楽データの再生終了位置と第2の音楽データの再生開始位置とが連続的に繋がるように、第1の音楽データにおける再生終了位置以前の所定区間と、第2の音楽データにおける再生開始位置以後の所定区間の波形を整形する波形整形手段を備える再生装置である。
また、波形整形手段は、第1の音楽データと第2の音楽データとを繋ぐ位置での振幅レベルを無音として波形を整形する再生装置である。
また、再生対象曲の圧縮音楽データを順次デコード処理するステップと、デコード処理するステップによって第1の圧縮音楽データをデコード処理した第1の音楽データの末尾部分の所定区間における平均振幅レベルを算出し、算出した平均振幅レベルに基づいて、第1の音楽データの末尾部分における無音部を検出するための閾値を算出するステップと、第1の音楽データに対して、閾値を算出するステップによって得られた閾値以上の振幅レベルで、第1の音楽データの末尾位置に最も近い位置を第1の音楽データを再生する際の再生終了位置として終了位置を検出するステップと、デコード処理するステップによって第1の圧縮音楽データの次の再生対象曲である第2の圧縮音楽データをデコード処理した第2の音楽データに対して、閾値以上の振幅レベルで、第2の音楽データの先頭位置の近傍位置を第2の音楽データを再生する際の再生開始位置として開始位置を検出するステップと、第1の音楽データの再生終了位置まで再生した後、第2の音楽データの再生開始位置から再生を行う再生するステップとを含む再生方法である。
また、開始位置を検出するステップは、第2の音楽データにおける第1の音楽データの再生終了位置の振幅の増減方向と同一方向のデータ部分で、且つ振幅レベルが第1の音楽データの再生終了位置の振幅レベルに対して予め定めた範囲内にあって、第2の音楽データの先頭位置に最も近い位置を第2の音楽データの再生開始位置として検出する再生方法である。
また、開始位置を検出するステップは、第2の音楽データの波形の傾きが第1の音楽データの波形の傾きに対して予め定めた範囲内にあって、第2の音楽データの先頭位置に最も近い位置を第2の音楽データの再生開始位置として検出する再生方法である。
また、閾値が所定の値以下であるか否かを判別するステップを含み、終了位置を検出するステップは、判別するステップによって閾値が所定の値以下であると判別された場合、第1の音楽データの末尾位置を第1の音楽データを再生する際の再生終了位置として検出し、開始位置を検出するステップは、判別するステップによって閾値が所定の値以下であると判別された場合、第2の音楽データの先頭位置を第2の音楽データを再生する際の再生開始位置として検出する再生方法である。
また、第1の音楽データの再生終了位置と第2の音楽データの再生開始位置とが連続的に繋がるように、第1の音楽データにおける再生終了位置以前の所定区間と、第2の音楽データにおける再生開始位置以後の所定区間の波形を整形するステップを含む再生方法である。
また、波形を整形するステップは、第1の音楽データと第2の音楽データとを繋ぐ位置での振幅レベルを無音として波形を整形する再生方法である。
また、再生対象曲の圧縮音楽データを順次デコード処理するステップと、デコード処理するステップによって第1の圧縮音楽データをデコード処理した第1の音楽データの末尾部分の所定区間における平均振幅レベルを算出し、算出した平均振幅レベルに基づいて、第1の音楽データの末尾部分における無音部を検出するための閾値を算出するステップと、第1の音楽データに対して、閾値を算出するステップによって得られた閾値以上の振幅レベルで、第1の音楽データの末尾位置に最も近い位置を第1の音楽データを再生する際の再生終了位置として終了位置を検出するステップと、デコード処理するステップによって第1の圧縮音楽データの次の再生対象曲である第2の圧縮音楽データをデコード処理した第2の音楽データに対して、閾値以上の振幅レベルで、第2の音楽データの先頭位置の近傍位置を第2の音楽データを再生する際の再生開始位置として開始位置を検出するステップと、第1の音楽データの再生終了位置まで再生した後、第2の音楽データの再生開始位置から再生を行う再生するステップとをコンピュータに実行させる再生プログラムである。
また、開始位置を検出するステップは、第2の音楽データにおける第1の音楽データの再生終了位置の振幅の増減方向と同一方向のデータ部分で、且つ振幅レベルが第1の音楽データの再生終了位置の振幅レベルに対して予め定めた範囲内にあって、第2の音楽データの先頭位置に最も近い位置を第2の音楽データの再生開始位置として検出する再生プログラムである。
また、開始位置を検出するステップは、第2の音楽データの波形の傾きが第1の音楽データの波形の傾きに対して予め定めた範囲内にあって、第2の音楽データの先頭位置に最も近い位置を第2の音楽データの再生開始位置として検出する再生プログラムである。
また、閾値が所定の値以下であるか否かを判別するステップを含み、終了位置を検出するステップは、判別するステップによって閾値が所定の値以下であると判別された場合、第1の音楽データの末尾位置を第1の音楽データを再生する際の再生終了位置として検出し、開始位置を検出するステップは、判別するステップによって閾値が所定の値以下であると判別された場合、第2の音楽データの先頭位置を第2の音楽データを再生する際の再生開始位置として検出する再生プログラムである。
また、第1の音楽データの再生終了位置と第2の音楽データの再生開始位置とが連続的に繋がるように、第1の音楽データにおける再生終了位置以前の所定区間と、第2の音楽データにおける再生開始位置以後の所定区間の波形を整形するステップを含む再生プログラムである。
また、波形を整形するステップは、第1の音楽データと第2の音楽データとを繋ぐ位置での振幅レベルを無音として波形を整形する再生プログラムである。
本発明によれば、ライブ盤を再生して得られる圧縮音楽データをデコード処理して再生する場合に、どのような音楽データあっても、曲間において音が途切れるギャップの発生を抑制することができる。
以下、本発明の実施形態を説明するにあたり記録装置について図1から図4を用いて説明する。
図1は記録装置の構成例を示すブロック図である。図1に示すように、記録装置1は、音楽ソース入力部11と、エンコード処理部12と、圧縮音楽データ記録部13と、記録制御部14と、記録操作部15と、USB端子16と、半導体メモリ部17と、クレードル部18とを備える。
音楽ソース入力部11には、CD等の記録媒体またはサーバ等に記録されている音楽ソースがその媒体またはサーバ等から入力される。そして、音楽ソース入力部11は、記録制御部14の制御に基づいて、1曲分に相当する音楽ソース毎にエンコード処理部12へ供給する。エンコード処理部12は、記録制御部14の制御により、音楽ソースを上述のMDCT変換を用いた圧縮方式によりエンコード処理して、エンコード処理された圧縮音楽データを圧縮音楽データ記録部13に供給する。
記録操作部15は、ユーザの選択操作により圧縮音楽データを出力する媒体が選択された場合に、記録制御部14を介して、圧縮音楽データ記録部13へ選択指示信号を供給する。圧縮音楽データ記録部13は、エンコード処理部12から供給された圧縮音楽データを記録保持する。また、上述の選択指示信号に基づいて、圧縮音楽データをUSB端子16、半導体メモリ部17またはクレードル部18に供給する。USB端子16は、接続されたUSBケーブルを介して、圧縮音楽データを後述する再生装置に供給するためのものである。半導体メモリ部17は、着脱自在な半導体メモリに、圧縮音楽データを供給するためのものである。クレードル部18は、接続ケーブルを必要としないスタンド型の接続機器であり、圧縮音楽データを再生装置に供給するためのものである。クレードル部18は、接続された再生装置とのデータの送受信ができ、またその再生装置の充電も可能である。
図2は、図1に示す記録装置においてエンコード処理を行う手順の一例を示すフローチャートである。図3は、図1に示す記録装置においてエンコード処理前後の音楽ソースの先頭部分における波形の一例を示す図である。図4は、図1に示す記録装置においてエンコード処理前後の音楽ソースの末尾部分における波形の一例を示す図である。
エンコード処理部12及び記録制御部14は、音楽ソース入力部11から供給された音楽データを以下の手順でエンコード処理する。最初に、記録制御部14は、音楽ソースの先頭位置より前の所定数のサンプルに対して、図3に示すように無音部を付加するようにエンコード処理部12を制御する(図2、ステップS01)。無音部の付加は、データ領域の所定数のサンプルに対して無効データ(ゼロ)をパディングする方法で行われる。また、この無音部は一般的にエンコーダディレイと呼ばれるものである。
例えば、図3に示すように、音楽ソースを分割して管理する1つのフレームは1152個のサンプルを含む。また、CDから供給されたデータの場合には、44100個のサンプルが1秒間のデータに相当する。記録制御部14は、1フレームの半分の576個のサンプルに対してゼロをパディングするようにエンコード処理部12を制御する。よって、エンコード処理後の先頭のフレーム1には、先頭位置からフレーム単位の半分の無音部が形成される。そして、記録制御部14は、図3に示すように、フレーム単位の半分の576個のサンプルを重複させてフレーム1,2,3…と順に分割するようにエンコード処理部12を制御する(図2、ステップS02)。
記録制御部14は、ステップS02で分割されたフレームの中に、音楽ソースの末尾位置が存在するかを判定する(図2、ステップS03)。音楽ソースの末尾位置が検出されない場合(NO)、ステップS02に戻って音楽データをフレームに分割する。音楽データの末尾位置が検出された場合(YES)、記録制御部14は、音楽ソースの末尾位置からフレーム1個分に満たない残りのサンプルに対して、ゼロをパディングするようにエンコード処理部12を制御する(図2、ステップS04)。更に、記録制御部14は、音楽ソースの最後部に1フレームを追加して、その1フレームのサンプルにゼロをパディングするようにエンコード処理部12を制御する(図2、ステップS05)。
図4に示すように、ステップS04及びステップS05のエンコード処理の後、無音部が付加された波形データとなる。例えば、図4に示すフレーム(M)(Mは1以上の整数)において、音楽データの末尾位置が検出された場合について説明する。フレーム(M)の有効データを含むサンプル数が864個である場合、ステップS04において、記録制御部14は、1フレーム分の残りの288個のサンプルに対して、ゼロをパディングするようにエンコード処理部12を制御する。更に、ステップS05において、記録制御部14は、1フレーム分の1152個のサンプルに対して、ゼロをパディングするようにエンコード処理部12を制御する。よって、次のフレーム(M+1)は、有効データを含むサンプルが288個、無効データを含むサンプルが864個となる。また、最終フレーム(M+2)はすべて無効データとなる。最終フレーム(M+2)に有効データが全く含まれないことで、隣接したフレームを用いたMDCT変換による圧縮方式によってエンコード処理する方法でも問題が発生しないようにすることができる。
上述のように、フレーム単位に分割して所定の無音部を付加した後、記録制御部14は、MDCTの圧縮方式により音楽ソースをエンコード処理するようにエンコード処理部12を制御する(図2、ステップS06)。ステップS06の後、エンコード処理を終了して、圧縮音楽データが生成される。この圧縮音楽データは、後述するデコード処理機能を備えた再生装置で再生される。なお、上述の1つのフレームに含まれるサンプル数やゼロをパディングする個数等は異なってもよいものである。
次に、本発明の実施形態に係る再生装置について図5から図12を用いて説明する。図5は、本発明の実施形態に係る再生装置の構成例を示すブロック図である。図5に示すように本実施形態に係る再生装置2は、USB端子21と、圧縮音楽データ格納部22と、デコード処理部23と、再生制御部24と、再生操作部25と、バッファ管理部26と、閾値算出部27と、波形整形部28と、バッファ29と、音楽データ出力部30とを備える。
USB端子21は、図1に示した記録装置1等でエンコード処理された圧縮音楽データを保持している装置と、USBケーブルを介して接続するためのものである。圧縮音楽データ格納部22は、USB端子21を介して転送される圧縮音楽データを格納する。また、圧縮音楽データ格納部22は、再生制御部24を介して再生操作部25より供給される再生指示信号に基づいて、再生対象曲の圧縮音楽データをデコード処理部23に供給する。なお、再生操作部25は、ユーザの指示により音楽再生が選択された場合に、再生制御部24を介して再生指示信号を圧縮音楽データ格納部22に供給する。
デコード処理部23は、再生制御部24の制御により、圧縮音楽データ格納部22から供給された圧縮音楽データのデコード処理を行い、復号化された音楽データ(以後、単に音楽データという)を生成して、この音楽データをバッファ管理部24に供給する。また、デコード処理部23は、現在の再生対象曲の圧縮音楽データ(以後、第1の圧縮音楽データという)のデコード処理が終了すると、デコード処理した現在の再生対象曲の音楽データ(以後、第1の音楽データという)の再生が終了する前に、次の再生対象曲の圧縮音楽データ(以後、第2の圧縮音楽データという)のデコード処理を開始して、次の再生対象曲の音楽データ(以後、第2の音楽データという)を生成する。
バッファ管理部26は、再生制御部24の制御により、デコード処理部23から供給された音楽データ、後述する閾値算出部27と波形整形部28により所定の処理がされた後の音楽データをバッファ29に格納するともに、バッファ29に格納された音楽データを音楽データ出力部30に供給する。
閾値算出部27は、再生制御部24の制御及びバッファ管理部26の管理により、第1の音楽データの末尾位置からその末尾位置より前の所定区間における平均振幅レベルを算出する。そして、この平均振幅レベルに基づいて、第1の音楽データの末尾部分に含まれる無音部を検出するための閾値を算出する。
波形整形部28は、再生制御部24の制御及びバッファ管理部26の管理により、後述する第1の音楽データの再生終了位置と、第2の音楽データの再生開始位置とが連続的に繋がるように、第1の音楽データ及び第2の音楽データの波形を整形する。
バッファ29は、バッファ管理部26の管理により、デコード処理部23から供給された音楽データ、及び無音部の検出や波形整形等の処理後の音楽データを格納する。音楽データ出力部30は、再生制御部24及びバッファ管理部26の制御により、バッファ29に格納されている音楽データをアナログ信号に変換して、図示しないスピーカ等の出力装置に供給する。
次に、本実施形態に係る再生装置2で無音部を検出して再生する手順の一例を図6に示すフローチャートを参照して説明する。
記録装置1に記録されている圧縮音楽データは、USB端子21を介して圧縮音楽データ格納部22に供給される。圧縮音楽データ格納部22は、供給された圧縮音楽データを格納する。なお、USB端子21に代わってクレードルや半導体メモリ等を介して、圧縮音楽データ格納部22に圧縮音楽データを格納する再生装置であってもよい。圧縮音楽データ格納部22は、ユーザの再生指示により再生操作部25から再生制御部24を介して、再生指示信号が供給されると、その再生指示信号に基づいて圧縮音楽データ格納部22に格納されている第1の圧縮音楽データを、デコード処理部23に供給する(図6、ステップS11)。
次に、再生制御部24は、供給された第1の圧縮音楽データをデコード処理するようにデコード処理部23を制御する(図6、ステップS12)。デコード処理部23は、第1の圧縮音楽データをデコード処理して第1の音楽データを生成する。再生制御部24は、デコード処理により生成された第1の音楽データをバッファ管理部26に供給するようにデコード処理部23を制御する。バッファ29は、バッファ管理部26より供給された第1の音楽データを格納する。
再生制御部24は、第1の圧縮音楽データのデコード処理が終了したか否かを判断する(図6、ステップS13)。デコード処理が終了していない場合(NO)、ステップS12に戻る。ステップS13でデコード処理が終了した場合(YES)、再生制御部24は、次の再生対象曲となる第2の圧縮音楽データがあるか否かを判断する(図6、ステップS14)。第2の圧縮音楽データが存在しない場合(NO)、第1の音楽データの再生が終了した後、再生処理を終了する。
ステップS14で、第2の圧縮音楽データが存在する場合(YES)、再生制御部24は、圧縮音楽データ格納部22に格納されている第2の圧縮音楽データを、デコード処理部23に供給するように圧縮音楽データ格納部22を制御する。(図6、ステップS15)。再生制御部24は、第2の圧縮音楽データのデコード処理を開始するようにデコード処理部23を制御する(図6、ステップS16)。デコード処理部23は、第2の圧縮音楽データをデコード処理して第2の音楽データを生成する。そして、上述の第1の音楽データと同様に、バッファ29は、この第2の音楽データを順次格納する。
次に、再生制御部24は、閾値算出部27において、閾値を算出したか否かを判断する(図6、ステップS17)。閾値を算出している場合(YES)、ステップS21に進む。閾値を算出していない場合(NO)、再生制御部24の制御及びバッファ管理部26の管理により、閾値算出部27は第1の音楽データの末尾部分の無音部を検出するための閾値を算出する(図6、ステップS18)。
図7(a)は、第1の音楽データがライブ盤である場合、第1の音楽データの末尾部分において閾値を算出するための平均振幅レベル分析区間と無音部の関係の一例を示している。ステップS18において、閾値は次のように算出される。再生制御部24は、バッファ管理部26を介して、バッファ29に格納されている第1の音楽データを読み出す。次に、再生制御部24は、第1の音楽データの末尾位置からその末尾位置より前の所定区間、すなわち図7(a)に示す平均振幅レベル分析区間において、平均振幅レベルを算出する。なお、平均振幅レベルは振幅値の絶対値を平均して算出する。再生制御部24は、この平均振幅レベルに基づいて、閾値を算出するように、バッファ管理部26を介して閾値算出部27を制御する。
なお、図7(a)に示しているライブ盤の場合の無音部は、図2のMDCT変換を用いたエンコード処理で付加されるものであるが、この無音部の振幅はMDCT変換の影響で微小なノイズ成分を持っている場合がある。しかし、この無音部の振幅値の絶対値を示す振幅レベルは、有効データを有する部分の振幅レベルよりは十分に小さいと考えられる。そのため、閾値算出部27は、例えば平均振幅レベル分析区間において算出された平均振幅レベルの1/3の値を求めて閾値とする。また、この無音部のサンプル数は、フレーム1個から2個程度分であるので、時間幅にして数十ミリ秒程度である。よって、平均振幅レベル分析区間は、数十ミリ秒以上必要である。
図7(b)は、第1の音楽データが通常盤である場合、第1の音楽データの末尾部分において閾値を算出するための平均振幅レベル分析区間と無音部の関係の一例を示している。なお、通常盤とは、通常の1曲ごとに記録されたアルバムCDを指している。図7(b)に示すように、通常盤の音楽データの末尾部分は、図2のMDCT変換を用いたエンコード処理により付加された無音部の他に、元々の音楽ソース自体に数ミリ秒程度の無音部を有している。
後述するように、ライブ盤の音楽データは、MDCT変換を用いたエンコード処理により付加された無音部を取り除いてギャップの発生を抑制する必要があり、通常盤の音楽データは、無音部を取り除いて再生音が不自然となることがないようにする必要がある。よって、再生制御部24は平均振幅レベルが有音とみなせる所定の値以下であるか否かを判別してライブ盤と通常盤の音楽データを識別する。そのため、平均振幅レベル分析区間は、ライブ盤の音楽データの場合には末尾部分の有効データを有する部分が必要且つ十分に含まれて、通常盤の音楽データの場合には無音部のみが含まれる時間幅とする必要があり、数百ミリ秒程度とするのが望ましい。よって、ライブ盤の音楽データより得られる閾値は図7(a)に示すように所定の値を有し、一方、通常盤の音楽データより得られる閾値は図7(b)に示すようにほぼゼロとなる。なお、閾値は絶対値なので、図7(a)に示すように振幅値が正の方向と負の方向に表される。
次に、再生制御部24は、閾値算出部27で算出された閾値が所定の値以下であるか否かを判断する(図6、ステップS19)。閾値が所定の値以下でない場合(NO)、すなわちライブ盤の音楽データと考えられる場合、再生制御部24は、第1の音楽データの末尾位置から先頭位置へ向かって、振幅レベルが閾値以上で、最も末尾位置に近い位置を第1の音楽データを再生する際の再生終了位置として検出する(図6、ステップS20)。なお、振幅レベルと閾値は共に絶対値であるので、振幅レベルが閾値以上の場合とは、振幅値が正の方向と負の方向の両者を含む。また、無音部とは、振幅レベルが閾値以下である場合を意味する。よって、図7(a)に示すように、第1の音楽データの末尾部分の無音部を検出して、この無音部を取り除いて再生終了位置とすることになる。そして、再生制御部24は、バッファ管理部26を介して、この検出された第1の音楽データの再生終了位置を示す情報や再生終了位置での振幅レベル等の情報をバッファ29に格納するように制御する。
一方、ステップS19において、閾値が所定の値以下である場合(YES)、すなわち通常盤の音楽データと考えられる場合、図7(b)に示した第1の音楽データの末尾部分の無音部を検出して取り除くと不自然な再生音となる。よって、再生制御部24は、第1の音楽データの再生終了位置は、第1の音楽データの末尾位置とみなして、後述するステップS21に進む。
再び図6のフローチャートに戻ると、再生制御部24は、第2の音楽データのデコード処理が所定時間進んでいるか否かを判断する(図6、ステップS21)。所定時間進んでいない場合(NO)、ステップS17に戻る。所定時間進んでいる場合(YES)、閾値が所定の値以下あるか否かを判断する(図6、ステップS22)。閾値が所定の値以下でない場合(NO)、すなわちライブ盤の音楽データと考えられる場合、第2の音楽データを再生する際の再生開始位置を検出する(図6、ステップS23)。なお、第2の音楽データの再生開始位置は、再生制御部24によって、後述するように第1の音楽データの再生終了位置と連続的に繋げて再生できる位置として検出される。
ステップS23において、閾値が所定の値以下である場合(YES)、すなわち通常盤の音楽データと考えられる場合、前述と同様に第2の音楽データの先頭部分の無音部を検出する必要はないので、第2の音楽データの再生開始位置は、第2の音楽データの先頭位置として、ステップS25に進む。なお、通常盤の音楽データの先頭部分の無音部も、末尾部分の無音部と同様に、MDCT変換を用いたエンコード処理により付加された無音部と元々の音楽ソース自体にある無音部とで構成されている。
ステップS23は、ステップS21のデコード処理が所定時間分進んだ後に行う。この理由は、第2の音楽データの先頭部分に無音部が付加されているので、デコード処理が一定時間進んでいなければ、第2の音楽データを再生する際の再生開始位置を検出することができないためである。
ステップS23において、再生制御部24は、バッファ管理部26を介して、バッファ29に格納されている第2の音楽データのデコード処理済の部分を読み出す。そして、ステップS18で算出した閾値を用いて、第2の音楽データの先頭部分の無音部を検出する。第1の音楽データの末尾部分と第2の音楽データの先頭部分は、本来波形が繋がっているので振幅レベルに大きな差はないと考えられる。そのため、ステップS23においても末尾部分で算出した値と同じ閾値を用いる。
再生制御部24は、第2の音楽データの先頭部分において、以下の条件を満たす第2の音楽データの位置を再生開始位置として検出する。第1の条件は、振幅レベルが閾値以上である。第1の条件により、MDCTを用いたエンコード処理により付加された第2の音楽データの先頭部分の無音部が検出されて取り除かれる。第2の条件は、第1の音楽データの再生終了位置の振幅の増減方向と同一方向である。第3の条件は、振幅レベルが第1の音楽データの再生終了位置の振幅レベルに対して予め定めた範囲内である。第2、第3の条件を満たすことが望ましいが、必要に応じて条件としなくてもよい。
前述の条件を満たし第2の音楽データの先頭部分の先頭位置に最も近いデータ内の位置を第2の音楽データを再生する際の再生開始位置として検出する。なお、第2の音楽データの再生開始位置の検出には、前述のようにバッファ29に格納されている第1の音楽データの再生終了位置の振幅レベルや振幅の増減方向の情報が用いられる。
図8(a)は、第1の音楽データの再生終了位置の振幅情報の一例を示している。図8(b)は、第2の音楽データの再生開始位置の振幅情報の一例を示している。図8(b)は、第2の音楽データにおいて、第1〜第3の条件を満たし、先頭位置に最も近い位置を再生する際の再生開始位置とした場合を示している。
図8に示すように、振幅値が負から正となる振幅の増減方向を(+)、振幅値が正から負となる振幅の増減方向を(−)とする。図8において、第1の音楽データの再生終了位置での振幅の増減方向は(−)である。よって、再生制御部24は、第2の音楽データにおいて、振幅レベルが閾値以下の無音部を除き、振幅の増減方向が(−)であり、且つ振幅レベルが予め定めた範囲内にあって、先頭位置に最も近い位置を再生開始位置として検出する。
両者の振幅レベルが完全に一致する位置を検出するのは難しいので、例えば、第2の音楽データの振幅レベルが、予め定めた第1の音楽データの再生終了位置における振幅レベルの1/2倍〜2倍の範囲内にあれば、再生制御部24は両者を同じとみなす。再生制御部24は、この検出された第2の音楽データの再生開始位置を示す情報を、バッファ管理部26を介して、バッファ29に格納するように制御する。また、振幅レベルを同じとみなす条件は、他の方法であってもよい。
第2の音楽データにおいて、前述の第1〜第3の条件に加えて、以下の第4の条件を満たし、先頭位置に最も近いデータ内の位置を再生する際の再生開始位置としてもよい。第4の条件は、第2の音楽データの先頭部分における波形の傾きが、第1の音楽データの再生終了位置の波形の傾きに対して予め定めた範囲内である。
図9(a)は、第1の音楽データの末尾部分の波形の別の一例を示している。図9(b)は、第2の音楽データの先頭部分の波形の別の一例を示している。図9において、第1の音楽データの再生終了位置での振幅の増減方向は(−)であり、波形の傾きの値は(a)である。よって、再生制御部24は、第2の音楽データにおいて、閾値以下の無音部を除き、振幅の増減方向が(−)であり、振幅レベルが予め定めた範囲内にあり、且つ振幅の増減の傾きの値(b)が予め定めた範囲内にあって、先頭位置に最も近い位置を再生開始位置として検出する。
波形の傾きについても、振幅レベルと同様に、例えば、第2の音楽データにおける任意の位置での波形の傾きの値(b)が、予め定めた第1の音楽データにおける再生終了位置の波形の傾きの値(a)の範囲内にあれば、再生制御部24は両者を同じとみなす。なお、任意の位置における波形の傾きとは、その位置と前の位置の2点間の増減の傾きであってもよいし、所定数のサンプル間での増減の傾きとしてもよい。
前述のように、ステップS23により検出された第2の音楽データの再生開始位置における振幅レベルと、第1の音楽データの再生終了位置における振幅レベルは完全には一致しない可能性が高い。また、実際は音楽データ内の有効データを有する部分を誤って無音部と判断する可能性もある。そのため、ステップS23の処理後、再生制御部24は、第1の音楽データの再生終了位置と第2の音楽データの再生開始位置が連続的に繋がるように、第1の音楽データと第2の音楽データの曲間の波形整形処理を行うように、バッファ管理部26を介して波形整形部28を制御する(ステップS24)。
図10(a)は、第1の音楽データと第2の音楽データの波形整形処理後の波形の一例を示す図、図10(b)は、第1の音楽データと第2の音楽データの波形整形処理後の波形の別の一例を示す図を示している。ステップS24において、再生制御部24は、バッファ管理部26から第1の音楽データの再生終了位置と第2の音楽データの再生開始位置の振幅レベル等の情報を受け取る。
図10(a)に示すように、第1の音楽データの再生終了位置と第2の音楽データの再生開始位置を繋ぎ目の位置として、第1の音楽データの末尾部分をフェードアウトさせ、第2の音楽データの先頭部分をフェードインさせる。聴覚上自然となるように、フェードアウト、フェードイン共に数ミリ秒の範囲で行うのが望ましい。図10(a)において、フェードアウト及びフェードインは共に50個のサンプルについて行っている。
また、図10(b)に示すように、フェードアウトとフェードインの繋ぎ目の振幅レベルは無音を示すレベル(ゼロ)とするのが望ましい。これは、繋ぎ目で不自然な再生音が発生するのを抑制するためである。再生制御部24は、ステップS24における波形整形処理後のフェードアウト及びフェードインの波形データを、バッファ管理部26を介してバッファ29に格納するように制御する。そして、第1の音楽データの末尾部分と第2の音楽データの先頭部分を再生する際には、ステップS24で波形整形処理をしたデータを用いる。
ステップS24の処理後、第1の音楽データの再生終了位置まで再生が終了したか否かを判定する(図6、ステップS25)。第1の音楽データの再生終了位置まで再生が終了していない場合(NO)、再びステップS24に戻る。第1の音楽データの再生終了位置まで再生が終了した場合(YES)、再生制御部24は、バッファ管理部26を介して、バッファ29に格納されている第2の音楽データを順に読み出して音楽データ出力部30に供給するように制御する。音楽データ出力部は、第2の音楽データをスピーカ等の出力装置に供給して再生する(図6、ステップS26)。以後、再生制御部24は、ステップS12に戻って、第2の音楽データを第1の音楽データに置き換えて再生し、圧縮音楽データのデコード処理が済んでいない部分をデコード処理して、同様の処理を繰り返す。
図11は、図6に示したフローチャートに従って、ライブ盤の第1及び第2の音楽データの曲間の無音部を取り除いた波形を示している。図12は、第1の音楽データ及び第2の音楽データを単純に繋げた場合の波形を示している。図12と比較して、図11は曲間の無音部が取り除かれていることが分かる。再生装置2は、ライブ盤の音楽データを再生する際に、無音部を検出して取り除くことによって、ギャップの発生を抑制して再生音が不自然とならないようにすることができる。
図13は、本発明の実施形態に係る記録再生装置の構成例を示すブロック図である。図13に示すように、記録再生装置51は、図1に示す記録装置1と、図5に示す再生装置2を一体化したものである。図13において、図1または図5と同一符号が付されている構成要素は、図1または図5で説明した構成要素と同じであるので省略する。操作部52は、図1に示す記録操作部15と、図5に示す再生操作部25の両者の機能を併せもつ。制御部53は、図1に示す記録制御部14と図5に示す再生制御部24の両者の機能を併せもつ。図13に示す記録再生装置51のように、記録装置1、再生装置2を一体化しても前述のような図6に示したフローチャートによって、曲間において音が途切れるギャップの発生を抑制して再生することができる。
以上のように、第1の音楽データの末尾位置より前の所定区間における平均振幅レベルを用いて、第1の音楽データの末尾部分及び第2の先頭部分の無音部を検出する。曲同士が繋がっているライブ盤の音楽ソースの場合は、この無音部を取り除いて再生することにより、曲間における音の途切れを抑制して再生できる。また、曲毎に構成された通常盤の音楽ソースの場合は、この無音部を取り除くことなく、通常の自然な音で再生できる。そして、本発明の再生装置は、ライブ盤と通常盤の違いを手動で切り替えることなく自動的に判別できるので、ユーザの負担が少ない装置である。
本発明に係る再生装置、再生方法及び再生プログラムは、デジタルオーディオディスクプレーヤ、パーソナルコンピュータや外部サーバ等の記録装置と有線または無線により接続した場合に、音楽データを受信できるよう構成された携帯用デジタルオーディオディスクプレーヤ、携帯電話やパーソナルコンピュータ等に適用可能である。
記録装置の構成例を示すブロック図である。 図1に示す記録装置においてエンコード処理を行う手順の一例を示すフローチャートである。 図1に示す記録装置においてエンコード処理前後の圧縮音楽データの先頭部分における波形の一例を示す図である。 図1に示す記録装置においてエンコード処理前後の圧縮音楽データの末尾部分における波形の一例を示す図である。 本発明の実施形態に係る再生装置の構成例を示すブロック図である。 図5に示す再生装置において無音部を取り除いて再生する手順の一例を示すフローチャートである。 (a)は、第1の音楽データがライブ盤である場合の末尾部分において、閾値を算出するための平均振幅レベル分析区間と無音部の関係の一例を示す図である。(b)は、第1の音楽データが通常盤である場合の末尾部分において、閾値を算出するための平均振幅レベル分析区間と無音部の関係の一例を示す図である。 (a)は第1の音楽データの再生終了位置の振幅情報の一例を示す図、(b)は第2の音楽データの再生開始位置の振幅情報の一例を示す図である。 (a)は第1の音楽データの再生終了位置の振幅情報の一例を示す図、(b)は第2の音楽データの再生開始位置の振幅情報の一例を示す図である。 (a)は第1及び第2の音楽データの波形整形処理後の波形の一例を示す図、(b)は第1及び第2の音楽データの波形整形処理後の波形の別の一例を示す図である。 図5に示す再生装置において、図6に示したフローチャートに従って、ライブ盤より得られる第1及び第2の音楽データの曲間の無音部を取り除いた波形の一例を示す図である。 図5に示す再生装置において、ライブ盤の第1及び第2の音楽データを単純に繋げた波形を示す図である。 本発明の実施形態に係る記録再生装置の構成例を示すブロック図である。 エンコード処理前後の音楽ソースの先頭部分における波形の一例を示す図である。 エンコード処理前後の音楽ソースの末尾部分における波形の一例を示す図である。 前の再生曲と次の再生曲をクロスフェードさせた波形の一例を示したものである。
符号の説明
1 記録装置
2 再生装置
12 エンコード処理部
13 圧縮音楽データ記録部
23 デコード処理部
24 再生制御部
26 バッファ管理部
27 閾値算出部
28 波形整形部
30 音楽データ出力部
51 記録再生装置
53 制御部

Claims (18)

  1. 再生対象曲の圧縮音楽データを順次デコード処理するデコード手段と、
    前記デコード手段によって第1の圧縮音楽データをデコード処理した第1の音楽データの末尾部分の所定区間における平均振幅レベルを算出し、算出した前記平均振幅レベルに基づいて、前記第1の音楽データの末尾部分における無音部を検出するための閾値を算出する閾値算出手段と、
    前記第1の音楽データに対して、前記閾値算出手段によって得られた閾値以上の振幅レベルで、前記第1の音楽データの末尾位置に最も近い位置を前記第1の音楽データを再生する際の再生終了位置として検出する再生終了位置検出手段と、
    前記デコード手段によって前記第1の圧縮音楽データの次の再生対象曲である第2の圧縮音楽データをデコード処理した第2の音楽データに対して、前記閾値以上の振幅レベルで、前記第2の音楽データの先頭位置の近傍位置を前記第2の音楽データを再生する際の再生開始位置として検出する再生開始位置検出手段と、
    前記第1の音楽データの前記再生終了位置まで再生した後、前記第2の音楽データの前記再生開始位置から再生を行う再生手段と
    を備えることを特徴とする再生装置。
  2. 前記再生開始位置検出手段は、前記第2の音楽データにおける前記第1の音楽データの前記再生終了位置の振幅の増減方向と同一方向のデータ部分で、且つ振幅レベルが前記第1の音楽データの前記再生終了位置の振幅レベルに対して予め定めた範囲内にあって、前記第2の音楽データの先頭位置に最も近い位置を前記第2の音楽データの再生開始位置として検出することを特徴とする請求項1記載の再生装置。
  3. 前記再生開始位置検出手段は、前記第2の音楽データの波形の傾きが前記第1の音楽データの波形の傾きに対して予め定めた範囲内にあって、前記第2の音楽データの先頭位置に最も近い位置を前記第2の音楽データの再生開始位置として検出することを特徴とする請求項2記載の再生装置。
  4. 前記閾値が所定の値以下であるか否かを判別する判別手段を備え、
    前記再生終了位置検出手段は、前記判別手段によって前記閾値が前記所定の値以下であると判別された場合、前記第1の音楽データの末尾位置を前記第1の音楽データを再生する際の再生終了位置として検出し、
    前記再生開始位置検出手段は、前記判別手段によって前記閾値が前記所定の値以下であると判別された場合、前記第2の音楽データの先頭位置を前記第2の音楽データを再生する際の再生開始位置として検出することを特徴とする請求項1記載の再生装置。
  5. 前記第1の音楽データの前記再生終了位置と前記第2の音楽データの前記再生開始位置とが連続的に繋がるように、前記第1の音楽データにおける前記再生終了位置以前の所定区間と、前記第2の音楽データにおける前記再生開始位置以後の所定区間の波形を整形する波形整形手段を備えることを特徴とする請求項1ないし3のいずれか1項に記載の再生装置。
  6. 前記波形整形手段は、前記第1の音楽データと前記第2の音楽データとを繋ぐ位置での振幅レベルを無音を示すレベルとして波形を整形することを特徴とする請求項5記載の再生装置。
  7. 再生対象曲の圧縮音楽データを順次デコード処理するステップと、
    前記デコード処理するステップによって第1の圧縮音楽データをデコード処理した第1の音楽データの末尾部分の所定区間における平均振幅レベルを算出し、算出した前記平均振幅レベルに基づいて、前記第1の音楽データの末尾部分における無音部を検出するための閾値を算出するステップと、
    前記第1の音楽データに対して、前記閾値を算出するステップによって得られた閾値以上の振幅レベルで、前記第1の音楽データの末尾位置に最も近い位置を前記第1の音楽データを再生する際の再生終了位置として終了位置を検出するステップと、
    前記デコード処理するステップによって前記第1の圧縮音楽データの次の再生対象曲である第2の圧縮音楽データをデコード処理した第2の音楽データに対して、前記閾値以上の振幅レベルで、前記第2の音楽データの先頭位置の近傍位置を前記第2の音楽データを再生する際の再生開始位置として開始位置を検出するステップと、
    前記第1の音楽データの前記再生終了位置まで再生した後、前記第2の音楽データの前記再生開始位置から再生を行う再生するステップと
    を含むことを特徴とする再生方法。
  8. 前記開始位置を検出するステップは、前記第2の音楽データにおける前記第1の音楽データの前記再生終了位置の振幅の増減方向と同一方向のデータ部分で、且つ振幅レベルが前記第1の音楽データの前記再生終了位置の振幅レベルに対して予め定めた範囲内にあって、前記第2の音楽データの先頭位置に最も近い位置を前記第2の音楽データの再生開始位置として検出することを特徴とする請求項7記載の再生方法。
  9. 前記開始位置を検出するステップは、前記第2の音楽データの波形の傾きが前記第1の音楽データの波形の傾きに対して予め定めた範囲内にあって、前記第2の音楽データの先頭位置に最も近い位置を前記第2の音楽データの再生開始位置として検出することを特徴とする請求項8記載の再生方法。
  10. 前記閾値が所定の値以下であるか否かを判別するステップを含み、
    前記終了位置を検出するステップは、前記判別するステップによって前記閾値が前記所定の値以下であると判別された場合、前記第1の音楽データの末尾位置を前記第1の音楽データを再生する際の再生終了位置として検出し、
    前記開始位置を検出するステップは、前記判別するステップによって前記閾値が前記所定の値以下であると判別された場合、前記第2の音楽データの先頭位置を前記第2の音楽データを再生する際の再生開始位置として検出することを特徴とする請求項7記載の再生方法。
  11. 前記第1の音楽データの前記再生終了位置と前記第2の音楽データの前記再生開始位置とが連続的に繋がるように、前記第1の音楽データにおける前記再生終了位置以前の所定区間と、前記第2の音楽データにおける前記再生開始位置以後の所定区間の波形を整形するステップを含むことを特徴とする請求項7ないし9のいずれか1項に記載の再生方法。
  12. 前記波形を整形するステップは、前記第1の音楽データと前記第2の音楽データとを繋ぐ位置での振幅レベルを無音を示すレベルとして波形を整形することを特徴とする請求項11記載の再生方法。
  13. 再生対象曲の圧縮音楽データを順次デコード処理するステップと、
    前記デコード処理するステップによって第1の圧縮音楽データをデコード処理した第1の音楽データの末尾部分の所定区間における平均振幅レベルを算出し、算出した前記平均振幅レベルに基づいて、前記第1の音楽データの末尾部分における無音部を検出するための閾値を算出するステップと、
    前記第1の音楽データに対して、前記閾値を算出するステップによって得られた閾値以上の振幅レベルで、前記第1の音楽データの末尾位置に最も近い位置を前記第1の音楽データを再生する際の再生終了位置として終了位置を検出するステップと、
    前記デコード処理するステップによって前記第1の圧縮音楽データの次の再生対象曲である第2の圧縮音楽データをデコード処理した第2の音楽データに対して、前記閾値以上の振幅レベルで、前記第2の音楽データの先頭位置の近傍位置を前記第2の音楽データを再生する際の再生開始位置として開始位置を検出するステップと、
    前記第1の音楽データの前記再生終了位置まで再生した後、前記第2の音楽データの前記再生開始位置から再生を行う再生するステップと
    をコンピュータに実行させる再生プログラム。
  14. 前記開始位置を検出するステップは、前記第2の音楽データにおける前記第1の音楽データの前記再生終了位置の振幅の増減方向と同一方向のデータ部分で、且つ振幅レベルが前記第1の音楽データの前記再生終了位置の振幅レベルに対して予め定めた範囲内にあって、前記第2の音楽データの先頭位置に最も近い位置を前記第2の音楽データの再生開始位置として検出することを特徴とする請求項13記載の再生プログラム。
  15. 前記開始位置を検出するステップは、前記第2の音楽データの波形の傾きが前記第1の音楽データの波形の傾きに対して予め定めた範囲内にあって、前記第2の音楽データの先頭位置に最も近い位置を前記第2の音楽データの再生開始位置として検出することを特徴とする請求項14記載の再生プログラム。
  16. 前記閾値が所定の値以下であるか否かを判別するステップを含み、
    前記終了位置を検出するステップは、前記判別するステップによって前記閾値が前記所定の値以下であると判別された場合、前記第1の音楽データの末尾位置を前記第1の音楽データを再生する際の再生終了位置として検出し、
    前記開始位置を検出するステップは、前記判別するステップによって前記閾値が前記所定の値以下であると判別された場合、前記第2の音楽データの先頭位置を前記第2の音楽データを再生する際の再生開始位置として検出することを特徴とする請求項13記載の再生プログラム。
  17. 前記第1の音楽データの前記再生終了位置と前記第2の音楽データの前記再生開始位置とが連続的に繋がるように、前記第1の音楽データにおける前記再生終了位置以前の所定区間と、前記第2の音楽データにおける前記再生開始位置以後の所定区間の波形を整形するステップを含むことを特徴とする請求項13ないし15のいずれか1項に記載の再生プログラム。
  18. 前記波形を整形するステップは、前記第1の音楽データと前記第2の音楽データとを繋ぐ位置での振幅レベルを無音を示すレベルとして波形を整形することを特徴とする請求項13記載の再生プログラム。
JP2007337815A 2007-01-30 2007-12-27 再生装置、再生方法及び再生プログラム Expired - Fee Related JP4973492B2 (ja)

Priority Applications (4)

Application Number Priority Date Filing Date Title
JP2007337815A JP4973492B2 (ja) 2007-01-30 2007-12-27 再生装置、再生方法及び再生プログラム
US12/010,685 US7714223B2 (en) 2007-01-30 2008-01-29 Reproduction device, reproduction method and computer usable medium having computer readable reproduction program emodied therein
EP08001663A EP1953751A3 (en) 2007-01-30 2008-01-29 Reproduction device, reproduction method and computer usable medium having computer readable reproduction embodied therein
KR1020080009437A KR100924731B1 (ko) 2007-01-30 2008-01-30 재생 장치, 재생 방법 및 재생 프로그램이 기록된 컴퓨터판독 가능한 기록 매체

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
JP2007019419 2007-01-30
JP2007019419 2007-01-30
JP2007337815A JP4973492B2 (ja) 2007-01-30 2007-12-27 再生装置、再生方法及び再生プログラム

Publications (2)

Publication Number Publication Date
JP2008209903A true JP2008209903A (ja) 2008-09-11
JP4973492B2 JP4973492B2 (ja) 2012-07-11

Family

ID=39786211

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2007337815A Expired - Fee Related JP4973492B2 (ja) 2007-01-30 2007-12-27 再生装置、再生方法及び再生プログラム

Country Status (4)

Country Link
US (1) US7714223B2 (ja)
EP (1) EP1953751A3 (ja)
JP (1) JP4973492B2 (ja)
KR (1) KR100924731B1 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2016065897A (ja) * 2014-09-22 2016-04-28 カシオ計算機株式会社 楽音制御装置、楽音制御方法及びプログラム

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7723601B2 (en) * 2007-03-22 2010-05-25 Qualcomm Incorporated Shared buffer management for processing audio files
US20100063825A1 (en) * 2008-09-05 2010-03-11 Apple Inc. Systems and Methods for Memory Management and Crossfading in an Electronic Device
US8553504B2 (en) * 2008-12-08 2013-10-08 Apple Inc. Crossfading of audio signals
US9942593B2 (en) * 2011-02-10 2018-04-10 Intel Corporation Producing decoded audio at graphics engine of host processing platform
JP6005910B2 (ja) * 2011-05-17 2016-10-12 富士通テン株式会社 音響装置
US10417279B1 (en) * 2015-12-07 2019-09-17 Amazon Technologies, Inc. Customized cross fades for continuous and seamless playback

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS5797599A (en) * 1980-12-10 1982-06-17 Matsushita Electric Ind Co Ltd System of detecting final end of each voice section
JPS6146999A (ja) * 1984-08-10 1986-03-07 ブラザー工業株式会社 音声始端決定装置
JPH06236195A (ja) * 1993-02-12 1994-08-23 Sony Corp 音声区間検出方法
JPH11306737A (ja) * 1998-04-17 1999-11-05 Nippon Columbia Co Ltd 音響再生装置
JP2003015681A (ja) * 2001-07-02 2003-01-17 Kenwood Corp 信号結合装置、信号結合方法及びプログラム
JP2003058192A (ja) * 2001-08-10 2003-02-28 Fujitsu Ten Ltd 音楽データ再生装置

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4376874A (en) * 1980-12-15 1983-03-15 Sperry Corporation Real time speech compaction/relay with silence detection
JP2838159B2 (ja) * 1993-12-28 1998-12-16 株式会社アドバンス 音声信号処理装置
US6600874B1 (en) 1997-03-19 2003-07-29 Hitachi, Ltd. Method and device for detecting starting and ending points of sound segment in video
US7161887B2 (en) 2001-11-13 2007-01-09 Digeo, Inc. Method and apparatus for extracting digital data from a medium
JP2003157664A (ja) * 2001-11-20 2003-05-30 Kenwood Corp 曲間検出方法および装置
JP2004093729A (ja) 2002-08-30 2004-03-25 Alpine Electronics Inc 音楽データの記録装置及び再生装置

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS5797599A (en) * 1980-12-10 1982-06-17 Matsushita Electric Ind Co Ltd System of detecting final end of each voice section
JPS6146999A (ja) * 1984-08-10 1986-03-07 ブラザー工業株式会社 音声始端決定装置
JPH06236195A (ja) * 1993-02-12 1994-08-23 Sony Corp 音声区間検出方法
JPH11306737A (ja) * 1998-04-17 1999-11-05 Nippon Columbia Co Ltd 音響再生装置
JP2003015681A (ja) * 2001-07-02 2003-01-17 Kenwood Corp 信号結合装置、信号結合方法及びプログラム
JP2003058192A (ja) * 2001-08-10 2003-02-28 Fujitsu Ten Ltd 音楽データ再生装置

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2016065897A (ja) * 2014-09-22 2016-04-28 カシオ計算機株式会社 楽音制御装置、楽音制御方法及びプログラム

Also Published As

Publication number Publication date
US7714223B2 (en) 2010-05-11
KR100924731B1 (ko) 2009-11-04
US20080289479A1 (en) 2008-11-27
EP1953751A2 (en) 2008-08-06
EP1953751A3 (en) 2008-12-17
JP4973492B2 (ja) 2012-07-11
KR20080071516A (ko) 2008-08-04

Similar Documents

Publication Publication Date Title
JP4973492B2 (ja) 再生装置、再生方法及び再生プログラム
CN1312664C (zh) 特技模式的音频播放
JP2009015119A (ja) サビ位置検出装置
JP2006221714A (ja) 符号化ディジタルオーディオ再生装置
TW200304123A (en) Audio frequency scaling during video trick modes utilizing digital signal processing
JP2006153907A (ja) 音声データエンコード装置および音声データデコード装置
JP4990375B2 (ja) 記録再生装置
JP2004093729A (ja) 音楽データの記録装置及び再生装置
JP2005044409A (ja) 情報再生装置、情報再生方法および情報再生プログラム
JP4588626B2 (ja) 楽曲再生装置、再生制御方法、および、プログラム
JP4934990B2 (ja) 音声信号記録再生装置
JP4739598B2 (ja) 音楽データ再生装置
JP2008027552A (ja) 音楽再生装置
JP4765460B2 (ja) 音声符号化装置および音声符号化方法
JP2010123225A (ja) 記録再生装置及び記録再生方法
KR101744912B1 (ko) 라디오 녹음 모듈 및 방법
JP4254960B2 (ja) 音声データエンコード装置および音声データ再生装置
JP2011209412A (ja) 圧縮装置、圧縮方法、再生装置および再生方法
JP2007101772A (ja) 再生装置及び再生方法
JP6105779B2 (ja) 記録装置、記録方法、及び記録制御用のコンピュータプログラム
JP2010039122A (ja) 記録再生装置
JP2008112494A (ja) オーディオ再生装置、並びにオーディオ再生方法及びプログラム、オーディオ記録装置、オーディオ記録方法
JP2013050596A (ja) 音声再生装置、音声再生方法、プログラム
JP2005241796A (ja) 電子透かしの埋め込み方法および音響信号の再生装置
JP2017139514A (ja) 音楽再生装置

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20100617

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20100909

A711 Notification of change in applicant

Free format text: JAPANESE INTERMEDIATE CODE: A712

Effective date: 20111012

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20111130

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20111220

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20120217

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20120313

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20120326

R150 Certificate of patent or registration of utility model

Ref document number: 4973492

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20150420

Year of fee payment: 3

LAPS Cancellation because of no payment of annual fees