JPWO2018198788A1 - 信号処理装置、信号処理方法、およびプログラム - Google Patents

信号処理装置、信号処理方法、およびプログラム Download PDF

Info

Publication number
JPWO2018198788A1
JPWO2018198788A1 JP2019514366A JP2019514366A JPWO2018198788A1 JP WO2018198788 A1 JPWO2018198788 A1 JP WO2018198788A1 JP 2019514366 A JP2019514366 A JP 2019514366A JP 2019514366 A JP2019514366 A JP 2019514366A JP WO2018198788 A1 JPWO2018198788 A1 JP WO2018198788A1
Authority
JP
Japan
Prior art keywords
signal
dsd
unit
pcm
data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2019514366A
Other languages
English (en)
Other versions
JP7099447B2 (ja
Inventor
福井 隆郎
隆郎 福井
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sony Corp
Original Assignee
Sony Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sony Corp filed Critical Sony Corp
Publication of JPWO2018198788A1 publication Critical patent/JPWO2018198788A1/ja
Application granted granted Critical
Publication of JP7099447B2 publication Critical patent/JP7099447B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04BTRANSMISSION
    • H04B14/00Transmission systems not characterised by the medium used for transmission
    • H04B14/02Transmission systems not characterised by the medium used for transmission characterised by the use of pulse modulation
    • H04B14/04Transmission systems not characterised by the medium used for transmission characterised by the use of pulse modulation using pulse code modulation
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/0017Lossless audio signal coding; Perfect reconstruction of coded audio signal by transmission of coding error
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/16Sound input; Sound output
    • G06F3/165Management of the audio stream, e.g. setting of volume, audio stream path
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B20/00Signal processing not specific to the method of recording or reproducing; Circuits therefor
    • G11B20/02Analogue recording or reproducing
    • G11B20/08Pulse-modulation recording or reproducing
    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03MCODING; DECODING; CODE CONVERSION IN GENERAL
    • H03M3/00Conversion of analogue values to or from differential modulation
    • H03M3/30Delta-sigma modulation
    • H03M3/458Analogue/digital converters using delta-sigma modulation as an intermediate step
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/167Audio streaming, i.e. formatting and decoding of an encoded audio signal representation into a data stream for transmission or storage purposes

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Signal Processing (AREA)
  • Multimedia (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Health & Medical Sciences (AREA)
  • Acoustics & Sound (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Transmission Systems Not Characterized By The Medium Used For Transmission (AREA)

Abstract

本技術は、DSD信号とPCM信号をスムーズに切り替えて再生することができるようにする信号処理装置、信号処理方法、およびプログラムに関する。通信部は、PCM信号とDSD信号を取得する。PCMアップサンプリング部は、PCM信号をDSD信号のサンプリング周波数にアップサンプリングする。LPFは、DSD信号の高域成分を除去する。相関分析部は、高域成分を除去したDSD信号と、アップサンプリング後のPCM信号の相関を分析し、ディレイ量を検出する。クロスフェード部は、検出されたディレイ量を用いて、DSD信号とアップサンプリング後のPCM信号のタイミングを調整し、DSD信号とアップサンプリング後のPCM信号をクロスフェードする。本技術は、例えば、オーディオデータを取得して再生するシステム等に適用できる。

Description

本技術は、信号処理装置、信号処理方法、およびプログラムに関し、特に、DSD信号とPCM信号をスムーズに切り替えて再生することができるようにした信号処理装置、信号処理方法、およびプログラムに関する。
近年、音楽用CD(CD-DA)を超える音質のオーディオデータであるハイレゾリューション音源による音楽配信が行われるようになってきている。
1bit信号でデルタシグマ変調されたデジタル信号(以下、DSD(Direct Stream Digital)信号ともいう。)を用いた音楽配信では、スーパーオーディオCD(SACD)で用いられているCDのサンプリング周波数44.1kHzの64倍のDSD信号(64DSD信号)だけでなく、128倍のDSD信号(128DSD信号)や、256倍のDSD信号(256DSD信号)の配信も実験的に行われている。
DSD信号は、サンプリング周波数がPCM(Pulse Code Modulation)信号よりも高いため、ストリーミング配信を行う場合の通信容量はPCM信号と比較して大きくなる。例えば、ステレオ(2チャンネル)の信号で1フレームを3秒としたときの64DSD信号のデータ容量は、2.8Mbit/フレーム程度になる。
そこで、本出願人は、特許文献1において、DSD信号を可逆圧縮して送信する圧縮方式を先に提案している。
一方で、通信路の状況に応じた対処方法としては、例えば、MPEG-DASH(Moving Picture Experts Group - Dynamic Adaptive Streaming over HTTP)のように、同一コンテンツを異なるビットレートで表現した複数の符号化データをコンテンツサーバに格納しておき、クライアント装置が、ネットワークの通信容量に応じて複数の符号化データのなかから、所望の符号化データをストリーミング受信する技術がある。
本出願人は、特許文献2において、DSD信号を用いた音楽配信において、MPEG-DASHのようなストリーミング方式を用いて、同一コンテンツで異なるビットレートの信号、例えば、64DSD信号、128DSD信号、256DSD信号のなかから、通信回線容量に合わせて、より良い品質のDSD信号を動的に選択視聴する方法を提案している。
国際公開第2016/140071号 国際公開第2016/199596号
しかしながら、DSD信号は、特許文献1の圧縮方式などを用いて圧縮しても、PCM信号と比べると、ビットレートが大きくなる。
例えば、スーパーオーディオCD(SACD)で用いられているCDのサンプリング周波数44.1kHzの64倍のサンプリング周波数(2.8MHz)のDSDデータを、所定の圧縮方式を用いて50%の圧縮ができたとしても、ステレオ(2チャンネル)の信号で、ビットレートは2.8Mbpsとなる。
これに対して、CD音質のPCM信号をそのまま伝送する場合は、44.1kHzのサンプリング周波数で量子化ビット16bitのオーディオデータが2ch分あるとすると、ビットレートは1.4Mbpsとなり、上記50%の圧縮率のDSDデータのビットレートの半分程度になる。さらに、PCM信号にAAC等の圧縮符号化を用いると、320kbps程度の遙かに小さいビットレートで通信することができる。
したがって、DSD信号では通信回線容量が厳しくなる場合を想定して、PCM信号も選択できることが望ましい。
本技術は、このような状況に鑑みてなされたものであり、DSD信号とPCM信号をスムーズに切り替えて再生することができるようにするものである。
本技術の一側面の信号処理装置は、PCM信号とDSD信号を取得する取得部と、前記PCM信号を前記DSD信号のサンプリング周波数にアップサンプリングするPCMアップサンプリング部と、前記DSD信号の高域成分を除去するDSDフィルタと、高域成分を除去した前記DSD信号と、アップサンプリング後の前記PCM信号の相関を分析し、ディレイ量を検出するディレイ量検出部と、検出された前記ディレイ量を用いて、前記DSD信号とアップサンプリング後の前記PCM信号のタイミングを調整し、前記DSD信号とアップサンプリング後の前記PCM信号をクロスフェードするクロスフェード部とを備える。
本技術の一側面の信号処理方法は、信号処理装置が、PCM信号とDSD信号を取得し、前記PCM信号を前記DSD信号のサンプリング周波数にアップサンプリングし、前記DSD信号の高域成分を除去し、高域成分を除去した前記DSD信号と、アップサンプリング後の前記PCM信号の相関を分析して、ディレイ量を検出し、検出された前記ディレイ量を用いて、前記DSD信号とアップサンプリング後の前記PCM信号のタイミングを調整し、前記DSD信号とアップサンプリング後の前記PCM信号をクロスフェードするステップを含む。
本技術の一側面のプログラムは、コンピュータを、PCM信号とDSD信号を取得する取得部と、前記PCM信号を前記DSD信号のサンプリング周波数にアップサンプリングするPCMアップサンプリング部と、前記DSD信号の高域成分を除去するDSDフィルタと、高域成分を除去した前記DSD信号と、アップサンプリング後の前記PCM信号の相関を分析し、ディレイ量を検出するディレイ量検出部と、検出された前記ディレイ量を用いて、前記DSD信号とアップサンプリング後の前記PCM信号のタイミングを調整し、前記DSD信号とアップサンプリング後の前記PCM信号をクロスフェードするクロスフェード部として機能させるためのものである。
本技術の一側面においては、PCM信号とDSD信号が取得され、前記PCM信号が前記DSD信号のサンプリング周波数にアップサンプリングされ、前記DSD信号の高域成分が除去され、高域成分を除去した前記DSD信号と、アップサンプリング後の前記PCM信号の相関が分析されて、ディレイ量が検出される。検出された前記ディレイ量を用いて、前記DSD信号とアップサンプリング後の前記PCM信号のタイミングが調整され、前記DSD信号とアップサンプリング後の前記PCM信号がクロスフェードされる。
なお、プログラムは、伝送媒体を介して伝送することにより、又は、記録媒体に記録して、提供することができる。
なお、本技術の一側面の信号処理装置は、コンピュータにプログラムを実行させることにより実現することができる。
また、本技術の一側面の信号処理装置を実現するために、コンピュータに実行させるプログラムは、伝送媒体を介して伝送することにより、又は、記録媒体に記録して、提供することができる。
信号処理装置は、独立した装置であっても良いし、1つの装置を構成している内部ブロックであっても良い。
本技術の一側面によれば、DSD信号とPCM信号をスムーズに切り替えて再生することができる。
なお、ここに記載された効果は必ずしも限定されるものではなく、本開示中に記載されたいずれかの効果であってもよい。
本技術を適用した再生システムの一実施の形態の構成例を示すブロック図である。 図1の再生装置の詳細構成例を示すブロック図である。 DSDアップサンプリング処理を説明する図である。 相関分析部によるディレイ量N3の検出を説明する図である。 信号一致検出部による信号一致検出処理を説明する図である。 信号一致検出部による信号一致検出処理を説明する図である。 信号一致検出部による信号一致検出処理を説明する図である。 信号一致検出部による信号一致検出処理を説明する図である。 信号一致検出部による信号一致検出処理を説明する図である。 信号一致検出部による信号一致検出処理を説明する図である。 信号一致検出部による信号一致検出処理を説明する図である。 DSDデータ再生処理について説明するフローチャートである。 AACデータ再生処理について説明するフローチャートである。 再生切替え処理について説明するフローチャートである。 DSDデータの最高ビットレートが5.6Mbpsである場合の再生装置の詳細構成例を示すブロック図である。 DSDデータの最高ビットレートが2.8Mbpsである場合の再生装置の詳細構成例を示すブロック図である。 複数のPCMデータを切替える場合の再生装置の詳細構成例を示すブロック図である。 本技術を適用したコンピュータの一実施の形態の構成例を示すブロック図である。
以下、本技術を実施するための形態(以下、実施の形態という)について説明する。なお、説明は以下の順序で行う。
1.再生システムの構成例
2.再生装置の詳細構成例
3.信号一致検出部の処理例
4.DSDデータ再生処理
5.AACデータ再生処理
6.再生切替え処理
7.最高ビットレートが5.6Mbpsである場合の再生装置の詳細構成例
8.最高ビットレートが2.8Mbpsである場合の再生装置の詳細構成例
9.ビットレートが異なる複数のPCMデータを切替える場合の再生装置の詳細構成例
10.コンピュータへの適用例
<1.再生システムの構成例>
図1は、本技術を適用した再生システムの一実施の形態の構成例を示すブロック図である。
図1の再生システム1は、再生装置11とサーバ装置12を少なくとも含み、再生装置11がサーバ装置12に格納されているオーディオデータを取得して再生するシステムである。
サーバ装置12には、マイクロホン21で収音した1つの音源(コンテンツ)を、異なるサンプリング周波数でAD変換した複数のオーディオデータが格納されている。
具体的には、マイクロホン21によって収音された所定の音源(例えば、コンテンツA)のオーディオ信号が、増幅器(AMP)22によって増幅され、複数のデルタシグマ(ΔΣ)変調器23と、1つのPCM変換器24に供給される。本実施の形態では、デルタシグマ変調器23の個数は、3個となっているが、3個に限定されるものではない。
デルタシグマ変調器23は、デルタシグマ変調により、入力されたアナログのオーディオ信号をデジタル信号に変換(AD変換)する。
複数のデルタシグマ変調器23それぞれは、デルタシグマ変調する場合のサンプリング周波数が異なる。
例えば、デルタシグマ変調器23Aは、入力されたアナログのオーディオ信号を、CD(Compact Disc)のサンプリング周波数44.1kHzの256倍のサンプリング周波数でデルタシグマ変調し、その結果得られるDSD信号をサーバ装置12に記憶させる。このサンプリング周波数44.1kHzの256倍のサンプリング周波数でデルタシグマ変調して得られたDSD信号は、11.2Mbpsのビットレートとなるので、以下では、11.2M DSDデータとも称する。
デルタシグマ変調器23Bは、入力されたアナログのオーディオ信号を、CDのサンプリング周波数44.1kHzの128倍のサンプリング周波数でデルタシグマ変調し、その結果得られるDSD信号をサーバ装置12に記憶させる。このサンプリング周波数44.1kHzの128倍のサンプリング周波数でデルタシグマ変調して得られたDSD信号は、5.6Mbpsのビットレートとなるので、以下では、5.6M DSDデータとも称する。
デルタシグマ変調器23Cは、入力されたアナログのオーディオ信号を、CDのサンプリング周波数44.1kHzの64倍のサンプリング周波数でデルタシグマ変調し、その結果得られるDSD信号をサーバ装置12に記憶させる。このサンプリング周波数44.1kHzの64倍のサンプリング周波数でデルタシグマ変調して得られたDSD信号は、2.8Mbpsのビットレートとなるので、以下では、2.8M DSDデータとも称する。
PCM変換器24は、入力されたアナログのオーディオ信号を、CDのサンプリング周波数44.1kHz、量子化ビット16bitのPCM(Pulse Code Modulation)信号に変換(AD変換)し、AAC符号化部25に供給する。
AAC符号化部25は、PCM変換器24から供給されたPCM信号を、AAC(Advanced Audio Coding)の符号化方式で圧縮符号化し、その結果得られるAAC信号(AACデータともいう。)を、サーバ装置12に記憶させる。
デルタシグマ変調器23A乃至23CとPCM変換器24は、AD変換する際、1つのクロック信号CLK1を基準に、それぞれが同期してAD変換を行う。例えば、デルタシグマ変調器23A乃至23C及びPCM変換器24のうちの1つである、デルタシグマ変調器23Cが、自ら生成したクロック信号CLK1をデルタシグマ変調器23A及び23B並びにPCM変換器24へ供給し、デルタシグマ変調器23A乃至23C及びPCM変換器24は、デルタシグマ変調器23Cが生成したクロック信号CLK1に基づいてAD変換を行う。
デルタシグマ変調器23A乃至23Cそれぞれのサンプリング周波数は、CDのサンプリング周波数44.1kHzを基本周波数fbとすると、基本周波数fbの2のべき乗で計算される周波数となっている。なお、デルタシグマ変調器23A乃至23Cそれぞれのサンプリング周波数は、互いに、2のべき乗の関係、即ち、2のべき乗倍または2のべき乗分の1の関係にある周波数となっていればよく、基本周波数fbがCDのサンプリング周波数に相当する44.1kHzである必要はない。
サーバ装置12には、以上のような、1つの音源(コンテンツ)から生成された、サンプリング周波数が異なる複数のオーディオデータが格納されている。
再生装置11は、サーバ装置12へアクセスする際のネットワーク26の通信容量に合わせて、同一コンテンツのビットレートが異なる複数種類のオーディオデータ、即ち、11.2M DSDデータ、5.6M DSDデータ、2.8M DSDデータ、及び、AACデータのなかから、いずれか1つを選択して取得し、再生する。
再生装置11は、1つのコンテンツの途中においても、ビットレートが異なる同一コンテンツのオーディオデータを、必要に応じて切り替えるが、再生装置11は、切り替えの際、ノイズを発生させずに、シームレスにビットレートが異なるオーディオデータを切り替える構成とされている。
同一コンテンツを異なるビットレートで表現した複数の符号化データをコンテンツサーバに格納しておき、クライアント装置が、格納された複数の符号化データのなかから、ネットワークの通信容量に応じて、所望の符号化データをストリーミング受信する方式の規格として、MPEG-DASH(Moving Picture Experts Group - Dynamic Adaptive Streaming over HTTP)がある。
サーバ装置12は、このMPEG-DASHの規格に準拠した形式により、1つのコンテンツに対してサンプリング周波数の異なる複数のオーディオデータを格納している。
MPEG-DASHは、MPD(Media Presentation Description)と呼ばれるメタファイルと、そこに記述されるチャンク化されたオーディオ、ビデオ、又は字幕等のメディアデータのアドレス(URL:Uniform Resource Locator)に従い、ストリーミングデータを取得して再生するものである。
本実施の形態では、チャンク化されたオーディオデータとして、例えば、1フレーム3秒の音源をファイル(セグメントファイル)単位とするオーディオデータが、サーバ装置12に格納されている。
なお、本実施の形態では、1つの音源(コンテンツ)に対して、11.2M DSDデータ、5.6M DSDデータ、2.8M DSDデータ、及び、AACデータの4種類のオーディオデータが、サーバ装置12に格納されているものとして説明するが、1つの音源(コンテンツ)に対して作成するオーディオデータの種類は、4種類に限られない。
また、サーバ装置12には、コンテンツA、コンテンツB、コンテンツC、・・・・など、複数のコンテンツそれぞれに対して、サンプリング周波数の異なる複数のDSDデータとAACデータが格納されている。
再生装置11は、サーバ装置12から送信されてきたデジタルのオーディオデータを受信し、アナログ信号に変換して、アナログLPF27に出力する。
アナログLPF(low pass filter)27は、高周波成分を除去するフィルタ処理を施し、フィルタ処理後の信号をパワーアンプ28に出力する。
パワーアンプ28は、アナログLPF27から出力されるアナログのオーディオ信号を増幅して、スピーカ29に出力する。スピーカ29は、パワーアンプ28から供給されるオーディオ信号を音として出力する。
アナログLPF27、パワーアンプ28、及び、スピーカ29のアナログ出力部は、再生装置11の一部として組み込まれてもよい。
<2.再生装置の詳細構成例>
図2は、図1の再生装置11の詳細構成例を示すブロック図である。
再生装置11は、制御部50、通信部51、DSDアップサンプリング部52、復号部53、PCMアップサンプリング部54、及び、ディレイ量検出部55を備える。
また、再生装置11は、遅延部56及び57、クロスフェード部58、デルタシグマ(ΔΣ)変調部59、遅延部60、信号一致検出部61、切替え部62、クロック供給部63、及び、デルタシグマ復調器64を備える。
制御部50は、再生装置11全体の動作を制御する。例えば、制御部50は、不図示の操作部において、サーバ装置12に格納されている所定コンテンツの再生がユーザによって指示されたとき、再生指示されたコンテンツに対応するビットレートの異なる複数種類のオーディオデータ(DSDデータ及びAACデータ)のなかから、ネットワーク26の通信容量に合わせて、いずれか1つのオーディオデータを選択し、通信部51を介して、サーバ装置12に要求する。制御部50は、複数のビットレートの異なる複数種類のオーディオデータを切替える場合、フェードインするオーディオデータと、フェードアウトするオーディオデータを特定する情報を、遅延部56及び57並びにクロスフェード部58に供給する。なお、図2では、制御部50から各部への制御信号の図示が省略されている。
制御部50は、コンテンツのストリーミングデータとして、オーディオデータをMPEG-DASHに従って取得する場合、MPDファイルを先に取得し、取得したMPDファイルに基づいて、サーバ装置12の所定アドレスに通信部51にアクセスさせることにより、通信部51に所望のオーディオデータを取得させる。
通信部51は、制御部50の指示に基づき、再生指示されたコンテンツに対応するビットレートの異なる複数種類のオーディオデータ(DSDデータ及びAACデータ)の1つまたは2つを、サーバ装置12に要求する。ビットレートの異なる第1のオーディオデータから第2のオーディオデータに切替える場合、通信部51は、第1及び第2のオーディオデータの2つのオーディオデータを同時に取得し、切替える必要がない場合には、1つのオーディオデータを取得する。
通信部51は、サーバ装置12から送信されてきたデジタルのオーディオデータを取得し、取得したオーディオデータを、DSDアップサンプリング部52または復号部53に供給する。
より具体的には、通信部51は、オーディオデータとして、11.2M DSDデータ、5.6M DSDデータ、または、2.8M DSDデータを取得した場合には、取得したDSDデータを、DSDアップサンプリング部52に供給する。一方、通信部51は、オーディオデータとして、AACデータを取得した場合には、取得したAACデータを、復号部53に供給する。
DSDアップサンプリング部52は、通信部51から供給される所定のビットレートのDSDデータを、再生装置11が再生可能な最高ビットレートのDSDデータにアップサンプリングし、アップサンプリング処理後のDSDデータを、ディレイ量検出部55及び遅延部56に供給する。
本実施の形態では、サーバ装置12から取得できるDSDデータは、11.2M DSDデータ、5.6M DSDデータ、及び、2.8M DSDデータのいずれかであり、再生装置11が再生可能なDSDデータの最高ビットレートは、11.2Mbpsである。したがって、DSDアップサンプリング部52は、取得したDSDデータを、11.2M DSDデータにアップサンプリングして、ディレイ量検出部55及び遅延部56に出力する。
<DSDアップサンプリング処理>
図3を参照して、DSDアップサンプリング部52が行うDSDアップサンプリング処理を説明する。
例えば、サーバ装置12に格納されている所定期間の11.2M DSDデータが、図3に示されるように「0010101001101010」の16ビットで表される場合、5.6M DSDデータは、例えば「01101010」のような8ビットデータで表され、2.8M DSDデータは、例えば「0110」のような4ビットデータで表される。なお、図3に示した11.2M DSDデータ、5.6M DSDデータ、及び、2.8M DSDデータは、ビット数の違いを説明するものであり、同一のオーディオ信号をデジタル化したデータではない。
DSDアップサンプリング部52は、通信部51から供給されたDSDデータが、再生装置11が再生可能な最高ビットレート以外のDSDデータである場合に、通信部51から供給されたDSDデータを、最高ビットレートのDSDデータのデータ長となるように変換する。
具体的には、通信部51から供給されたDSDデータが5.6M DSDデータである場合、そのデータ長は、最高ビットレートのDSDデータ(11.2M DSDデータ)の1/2であるから、DSDアップサンプリング部52は、通信部51から供給された5.6M DSDデータの各ビット値を2回ずつ出力する。
また、通信部51から供給されたDSDデータが2.8M DSDデータである場合、そのデータ長は、最高ビットレートのDSDデータ(11.2M DSDデータ)の1/4であるから、DSDアップサンプリング部52は、通信部51から供給された2.8M DSDデータの各ビット値を4回ずつ出力する。
以上のように、DSDアップサンプリング部52は、通信部51から供給されたDSDデータを、最高ビットレートのDSDデータとの比率で前置補間して、遅延部56に出力する。通信部51から供給されたDSDデータが最高ビットレートのDSDデータである場合には、DSDアップサンプリング部52は、供給されたDSDデータをそのまま出力する。
図2に戻り、復号部53は、通信部51から供給されるAACデータを、符号化方式に対応する復号方式で復号し、復号後して得られたPCM信号をPCMアップサンプリング部54に出力する。
PCMアップサンプリング部54は、復号部53から供給されるPCM信号を、DSDアップサンプリング部52が出力するDSDデータのサンプリング周波数と同じ周波数にアップサンプリングして、ディレイ量検出部55及び遅延部57に出力する。
本実施の形態では、AACデータとして格納されるPCM信号のサンプリング周波数は、サンプリング周波数44.1kHzである。したがって、PCMアップサンプリング部54は、サンプリング周波数44.1kHzのPCM信号を、サンプリング周波数11.2MHzのPCM信号にアップサンプリングして、ディレイ量検出部55及び遅延部57に出力する。以下では、サンプリング周波数11.2MHzのPCM信号を、11.2M PCMデータとも称する。
ディレイ量検出部55は、DSDアップサンプリング部52から供給される11.2M DSDデータと、PCMアップサンプリング部54から供給される11.2M PCMデータの相関を分析し、信号間のディレイ量Dを検出して、遅延部56及び57に出力する。
ディレイ量検出部55は、LPF71及び72、DSDバッファ73、PCMバッファ74、相関分析部75、並びに、ディレイ制御部76を備える。
LPF71は、DSDアップサンプリング部52から供給される11.2M DSDデータの高域成分を除去し、高域除去後の11.2M DSDデータを、DSDバッファ73に出力する。LPF71のタップ数は、N1であるとする。高域除去後の11.2M DSDデータを、LF_DSDデータと称する。
LPF72は、PCMアップサンプリング部54から供給される11.2M PCMデータの高域成分を除去し、高域除去後の11.2M PCMデータを、PCMバッファ74に出力する。LPF72のタップ数は、N2であるとする。高域除去後の11.2M PCMデータを、LF_PCMデータと称する。
11.2M DSDデータと11.2M PCMデータは、高域の信号が違うので、単純に位相比較はできない。そのため、LPF71及び72を用いて、所定の周波数以下の信号に絞って、11.2M DSDデータと11.2M PCMデータの位相が比較される。例えば、LPF71及び72は、PCM信号のサンプリング周波数44.1kHzの1/2以下の周波数帯域の信号に絞るフィルタ処理を行う。
DSDバッファ73は、LPF71から供給されるLF_DSDデータを、所定時間の長さだけバッファリングし、所要のデータを相関分析部75に出力する。PCMバッファ74は、LPF72から供給されるLF_PCMデータを、所定時間の長さだけバッファリングし、所要のデータを相関分析部75に出力する。DSDバッファ73とPCMバッファ74のバッファリング期間は、任意の時間に設定することができるが、例えば、プロセスディレイ、AACデコードディレイ等を考慮して、1秒程度に設定される。
相関分析部75は、DSDバッファ73に格納されているLF_DSDデータと、PCMバッファ74に格納されているLF_PCMデータの相関を分析し、LF_PCMデータとLF_PCMデータのディレイ量N3を検出する。
DSDバッファ73に格納されているLF_DSDデータをx1、PCMバッファ74に格納されているLF_PCMデータをx2とすると、相関分析部75は、以下の式(1)を計算する処理を実行し、ディレイ量N3を検出する。
Figure 2018198788
式(1)は、LF_DSDデータx1とLF_PCMデータx2の相関関数φ1,2(τ)どうしの積が、最大となるようなずれ量τを検出する式である。
<ディレイ量N3の検出>
図4を参照して、相関分析部75によるディレイ量N3の検出について説明する。
LF_DSDデータx1とLF_PCMデータx2を比較する際の比較長が所定の長さに予め決定される。例えば、比較長は、AACのフレーム長と同じ20msecとされる。
図4において、各バッファに格納されるLF_DSDデータx1とLF_PCMデータx2のサンプル数はNであり、比較長のサンプル数はmである。
初めに、相関分析部75は、LF_DSDデータx1の先頭サンプル(1)から比較長(サンプル数m)分のLF_DSDデータを抽出し、その抽出したLF_DSDデータ(1)と、LF_PCMデータ(1)乃至LF_PCMデータ(N-m+1)それぞれとの積和(Σx1(k)x2(k+τ))を計算する。ここで、LF_PCMデータ(1)乃至LF_PCMデータ(N-m+1)は、LF_PCMデータx2から、先頭のサンプルをサンプル(1)からサンプル(N-m+1)まで1サンプルずつずらしながら、比較長だけ抽出したデータである。
次に、相関分析部75は、抽出する先頭のサンプルを1サンプルずらしたLF_DSDデータx1の2番目のサンプル(2)から比較長(サンプル数m)のLF_DSDデータを抽出し、その抽出したLF_DSDデータ(2)と、LF_PCMデータ(1)乃至LF_PCMデータ(N-m+1)それぞれとの積和(Σx1(k)x2(k+τ))を計算する。
同様に、抽出したLF_DSDデータの先頭のサンプルが(N-m+1)番目のサンプル(N-m+1)となるまでLF_DSDデータx1を1サンプルずつずらしながら、抽出した比較長のLF_DSDデータとLF_PCMデータ(1)乃至LF_PCMデータ(N-m+1)それぞれとの積和(Σx1(k)x2(k+τ))が計算される。
以上の計算のなかで、積和(Σx1(k)x2(k+τ))が最大となるずれ量τが、補正すべきディレイ量N3となる。
図2に戻り、相関分析部75は、検出したディレイ量N3を、ディレイ制御部76に供給する。
ディレイ制御部76は、相関分析部75から供給されるディレイ量N3に、LPF71とLPF72のフィルタ処理の時間差分(N1/2−N2/2)を加えた下記の式(2)を計算して、信号間のディレイ量Dを検出し、遅延部56及び57に出力する。
Figure 2018198788
遅延部56及び57は、クロスフェード部58で11.2M DSDデータと11.2M PCMデータのクロスフェード処理を行うために、11.2M DSDデータと11.2M PCMデータのタイミングを調整する。
具体的には、遅延部56及び57は、それぞれ、供給される11.2M DSDデータ及び11.2M PCMデータに対して共通に所定量だけ遅延させる。また、遅延部56及び57のうち、フェードインする側のオーディオデータが入力される一方は、ディレイ制御部76から供給されるディレイ量Dの調整も行う。ディレイ量Dの調整を行う指示は、制御部50から供給される。
遅延部56は、第1の遅延量だけ遅延させた11.2M DSDデータを、順次、クロスフェード部58及び遅延部60に出力する。遅延部57は、第2の遅延量だけ遅延させた11.2M PCMデータを、順次、クロスフェード部58に出力する。
クロスフェード部58は、11.2M DSDデータと11.2M PCMデータのクロスフェード処理を行う。第1のオーディオデータから第2のオーディオデータに切替える場合、クロスフェード部58は、第1のオーディオデータの信号レベルを時間とともに徐々に低下させるフェードアウト処理を施し、第2のオーディオデータの信号レベルをゼロレベルから時間とともに徐々に上昇させるフェードイン処理を施し、フェードアウト処理後の第1のオーディオデータと、フェードイン処理後の第2のオーディオデータを混合する。混合した結果得られるクロスフェード信号は、デルタシグマ変調部59に出力される。遅延部56または遅延部57のいずれか一方からのみオーディオデータが入力される場合には、クロスフェード部58は、そのオーディオデータを、そのままデルタシグマ変調部59に出力する。
デルタシグマ変調部59は、クロスフェード部58の出力であるオーディオデータ(クロスフェード信号)を、デルタシグマ変調して、11.2M DSDデータを生成し、信号一致検出部61及び切替え部62に出力する。
遅延部60は、クロスフェード部58のクロスフェード処理と、デルタシグマ変調部59のデルタシグマ変調処理の処理時間に応じた時間だけ、遅延部56から供給される11.2M DSDデータを遅延させ、遅延後の11.2M DSDデータを、信号一致検出部61及び切替え部62に出力する。
信号一致検出部61は、クロスフェード部58へ入力したものと同じDSDデータで、遅延部60の出力である11.2M DSDデータと、デルタシグマ変調部59により変調されたクロスフェード信号である11.2M DSDデータの一致を検出する。11.2M DSDデータの一致が検出された場合、信号一致検出部61は、データが一致したことを示す一致検出信号を切替え部62に出力する。
切替え部62は、信号一致検出部61からの制御にしたがい、後段のデルタシグマ復調器64へ入力する信号を切り替える。切替え部62は、遅延部60の出力である11.2M DSDデータか、または、デルタシグマ変調部59の出力である11.2M DSDデータのいずれか一方を選択し、選択した11.2M DSDデータを、後段のデルタシグマ復調器64に出力する。
クロスフェード部58がクロスフェード処理を実行している期間、及び、再生装置11がAACデータを取得して再生している期間は、切替え部62は、デルタシグマ変調部59の出力である11.2M DSDデータを選択して、デルタシグマ復調器64に出力する。
一方、再生装置11が、11.2M DSDデータ、5.6M DSDデータ、または、2.8M DSDデータのいずれかを取得して再生している期間は、取得しているオーディオデータがDSDデータであるのでデルタシグマ変調する必要がなく、切替え部62は、遅延部60の出力である11.2M DSDデータを選択して、デルタシグマ復調器64に出力する。
切替え部62は、信号一致検出部61から一致検出信号が供給された場合、後段のデルタシグマ復調器64に出力するオーディオデータの取得先を、デルタシグマ変調部59側から、遅延部60側へ切り替える。
一方、切替え部62は、デルタシグマ変調部59側を選択する指示が制御部50から供給された場合、デルタシグマ復調器64に出力するオーディオデータの取得先を、遅延部60側から、デルタシグマ変調部59側へ切り替える。制御部50は、AACデータを取得して再生する場合(クロスフェード期間中も含む)、切替え部62へ、デルタシグマ変調部59側を選択する指示を供給する。
クロック供給部63は、再生装置11が再生可能な最高ビットレートのDSDデータに対応したクロック信号CLK2をデルタシグマ復調器64に供給する。本実施の形態では、再生装置11が再生可能な最高ビットレートは、11.2Mbpsであるので、クロック供給部63は、約11.2MHzのクロック信号CLK2を生成し、デルタシグマ復調器64に供給する。
デルタシグマ復調器64は、切替え部62から供給される11.2M DSDデータを、クロック供給部34から供給されるクロック信号CLK2を用いて復調(デルタシグマ復調)し、復調結果を、後段のアナログLPF27(図1)に出力する。デルタシグマ復調器64は、例えば、FIR(finite impulse response)のデジタルフィルタで構成することができる。
再生装置11は、以上の構成を有する。
<3.信号一致検出部の処理例>
図5乃至図11を参照して、信号一致検出部61が行う、2つの11.2M DSDデータの一致を検出する処理について説明する。
図5乃至図11では、信号一致検出部61が比較を行う2つの11.2M DSDデータのうち、遅延部60の出力である11.2M DSDデータをオリジナルDSDデータSAと称し、デルタシグマ変調部59の出力である11.2M DSDデータをPCM変換DSDデータSBと称する。
信号一致検出部61は、オリジナルDSDデータSAとPCM変換DSDデータSBとを、所定のサンプル数の間サンプリングタイミング毎に監視し、例えば4サンプル分の連続データ一致を検出したら、データ一致を検出したことを示す一致検出信号STを切替え部62に出力する。
また、信号一致検出部61は、オリジナルDSDデータSAとPCM変換DSDデータSBとを、所定のサンプル数の間サンプリングタイミング毎に監視し、例えば4サンプル分の連続データ一致を検出できなかった場合には、次の所定のサンプル数の間、サンプリングタイミング毎に再度監視し、例えば4サンプル分のレベル一致を検出したら、データ一致を検出したことを示す一致検出信号STを切替え部62に出力する。
図5は、1ビット信号のレベルを説明するための図である。
1ビット信号の振幅はサンプル値1が+1、サンプル値0が−1であるから、例えば図5に示した表の第1列に示すような4サンプルの1ビット信号に対して、図5に示した表の第3列に示すように信号レベルを計算することができる。
また例えば、4サンプル分のレベル一致を検出するのではなく、例えば4サンプル分のサンプル値0とサンプル値1の出現頻度の一致を検出しても、検出結果は等価である。これは図5に示した表の第2列に示すように、1ビット信号4サンプル中のサンプル値0とサンプル値1の出現頻度である。
本実施形態において、信号一致検出部61は、まず所定のサンプル数の間に、オリジナルDSDデータSAとPCM変換DSDデータSBとの、複数サンプルにわたるデータ一致の検出を行い、連続データ一致を検出したら、データ一致を検出したことを示す一致検出信号STを発生させる。所定のサンプル数の間にオリジナルDSDデータSAとPCM変換DSDデータSBとの複数サンプルにわたる一致を検出できなかった場合には、次に信号一致検出部61は、所定のサンプル数の間にオリジナルDSDデータSAとPCM変換DSDデータSBとの複数サンプルにわたるレベル一致の検出を行い、レベル一致を検出したら、レベル一致を検出したことを示す一致検出信号STを発生させる。
信号一致検出部61の動作について、図面を参照しながら詳細に説明する。
図6乃至図11は、信号一致検出部61の動作を説明するための図である。
図6乃至図11では、簡単のため、所定のサンプル数の間に、例えば4サンプル分の連続データ一致、および4サンプル分の信号レベル一致を、4サンプル前進で監視し検出を行う。コンピュータ上で1ビット信号を記録する際のフォーマットは、8サンプルの1ビット信号をまとめて1バイトデータとして扱うケースが多い。コンピュータのデータアクセスは通常バイト単位であり、信号一致検出部61は、所定のサンプル数の間に、例えば、4サンプル分の連続データ一致、および4サンプル分の信号レベル一致を、4サンプル前進で監視し検出を行う。信号一致検出部61は、4サンプル前進で監視し検出を行うことにより、バイト境界を跨ぐことなく、バイトデータのMSB4ビットとLSB4ビットを参照することで効率的に処理を行うことができる。
信号一致検出部61は、図6に示すようなオリジナルDSDデータSAとPCM変換DSDデータSBとを、所定のサンプル数の間に4サンプル前進のサンプリングタイミング毎に監視する。信号一致検出部61は、左から4個目の1ビット信号4サンプル(1010)のタイミングで4サンプル分の連続データ一致を検出すると、データ一致を検出したことを示す一致検出信号STを発生し、切替え部62に供給する。
しかし、信号一致検出部61は、4サンプル分の連続データ一致を検出できないような信号を比較する場合がある。例えば信号一致検出部61は、図7に示すようなオリジナルDSDデータSAとPCM変換DSDデータSBとを、所定のサンプル数の間に4サンプル前進のサンプリングタイミング毎に監視した結果、4サンプル分の連続データ一致を検出できなかったとする。
この場合、信号一致検出部61は、図8に示すようなオリジナルDSDデータSAとPCM変換DSDデータSBとを、所定のサンプル数の間に4サンプル前進のサンプリングタイミング毎に再度監視する。信号一致検出部61は、左から3個目の1ビット信号4サンプル(信号レベル−2)のタイミングで信号レベル一致を検出すると、レベル一致を検出したことを示す一致検出信号STを発生し、切替え部62に供給する。
信号一致検出部61の信号レベル一致の検出タイミングは、最初に一致を検出した、図8の左から3個目の1ビット信号4サンプルのタイミングでもよく、信号レベル一致が連続する、図8の左から6個目の1ビット信号4サンプルまでのいずれのタイミングでもよい。より効果的に切り換えを行うためには、最も信号レベル一致が連続する1ビット信号4サンプルの中央付近が安全であり、図8の場合には、信号一致検出部61は、例えば左から4個目の1ビット信号4サンプルのタイミングで信号レベル一致検出とすることが望ましい。なぜならば、信号をアナログに戻した場合に、境界に近くなる程に違うデータになっている可能性があり、信号レベル一致の検出タイミングを中央付近にすれば、切換前後の信号の差が少ないと考えられるからである。
また、信号一致検出部61は、信号レベル一致の検出タイミングを、同じ信号レベル一致が連続する1ビット信号4サンプルの中から選択してもよい。図9に示した例では、左から4個目から6個目で、信号レベルが0で一致し続けている。この場合に、信号一致検出部61の信号レベル一致の検出タイミングは、最初に一致を検出した図9の左から4個目の1ビット信号4サンプルのタイミングでもよく、信号レベル一致が連続する図9の左から6個目の1ビット信号4サンプルまでのいずれのタイミングでもよい。より効果的に切り換えを行うためには、最も一致が連続する1ビット信号4サンプルの中央付近が安全であり、図9の場合には、信号一致検出部61は、例えば左から5個目の1ビット信号4サンプルのタイミングで信号レベル一致検出とすることが望ましい。なぜならば、上記の最も信号レベル一致が連続する1ビット信号の中央付近で切り換える場合と同様に、信号をアナログに戻した場合に、境界に近くなる程に違うデータになっている可能性があり、信号レベル一致の検出タイミングを中央付近にすれば、切換前後の信号の差が少ないと考えられるからである。
あるいはまた、信号一致検出部61は、オリジナルDSDデータSAとPCM変換DSDデータSBとの複数サンプルにわたるレベル一致の検出を行う代わりに、4サンプル分のサンプル値0とサンプル値1の出現頻度の一致を検出してもよい。
例えば、信号一致検出部61は、図10に示すようなオリジナルDSDデータSAとPCM変換DSDデータSBとを、所定のサンプル数の間に4サンプル前進のサンプリングタイミング毎に監視する。そして、信号一致検出部61は、左から3個目の1ビット信号4サンプル(0及び1の出現回数である0/1出現頻度が3/1)のタイミングで信号レベル一致を検出すると、出現頻度が一致したことを示す一致検出信号STを発生し、切替え部62に供給する。
信号一致検出部61は、0/1出現頻度一致の検出タイミングを、最初に一致を検出した図10の左から3個目の1ビット信号4サンプルのタイミングでもよく、0/1出現頻度一致が連続する図10の左から6個目の1ビット信号4サンプルまでのいずれのタイミングでもよい。より効果的に切り換えを行うためには、最も一致が連続する1ビット信号4サンプルの中央付近が安全であり、図10の場合には、信号一致検出部61は、例えば左から4個目の1ビット信号4サンプルのタイミングで0/1出現頻度一致検出とすることが望ましい。
また、信号一致検出部61は、0/1出現頻度一致の検出タイミングを、同じ0/1出現頻度一致が連続する1ビット信号4サンプルの中から選択してもよい。図11に示した例では、左から4個目から6個目で、0/1出現頻度が2/2で一致し続けている。この場合に、信号一致検出部61の0/1出現頻度一致の検出タイミングは、最初に一致を検出した左から4個目の1ビット信号4サンプルのタイミングでもよく、0/1出現頻度一致が連続する左から6個目の1ビット信号4サンプルまでのいずれのタイミングでもよい。より効果的に切り換えを行うためには、最も一致が連続する1ビット信号4サンプルの中央付近が安全であり、図11の場合には、信号一致検出部61は、例えば左から5個目の1ビット信号4サンプルのタイミングで0/1出現頻度一致の検出とすることが望ましい。
なお、例えば図8に示したようなパターンと図9に示したようなパターンとが連続しているようなサンプルを検出対象とする場合、信号一致検出部61はどちらを一致サンプルとして選択しても良く、一番長く一致が連続している箇所を一致サンプルとして選択しても良い。
<4.DSDデータ再生処理>
次に、図12のフローチャートを参照して、再生装置11がDSDデータを取得して再生するDSDデータ再生処理について説明する。図12の処理は、例えば、再生装置11の操作部において、サーバ装置12に格納されている所定コンテンツの再生がユーザによって指示されたとき実行される。図12の再生処理では、再生指示されたコンテンツのAACデータとDSDデータとの切替え処理は含まない。
初めに、ステップS1において、制御部50は、再生指示されたコンテンツに対応するビットレートの異なる複数種類のオーディオデータのなかから、取得オーディオデータとして、所定のビットレートのDSDデータを決定し、通信部51に取得を指示する。本実施の形態では、11.2M DSDデータ、5.6M DSDデータ、または、2.8M DSDデータのいずれかの取得が決定され、制御部50から通信部51に指示される。
ステップS2において、通信部51は、制御部50の制御にしたがい、所定のビットレートのDSDデータを要求するリクエストをサーバ装置12に送信する。また、通信部51は、要求に応じてサーバ装置12から送信されてくるDSDデータを受信(取得)し、DSDアップサンプリング部52に供給する。
ステップS3において、DSDアップサンプリング部52は、通信部51から供給された所定のビットレートのDSDデータを、再生装置11が再生可能な最高ビットレートのDSDデータにアップサンプリングし、アップサンプリング処理後のDSDデータを、ディレイ量検出部55及び遅延部56に供給する。
本実施の形態において再生装置11が再生可能な最高ビットレートは、11.2Mbpsである。したがって、DSDアップサンプリング部52は、通信部51から供給された所定のビットレートのDSDデータを、11.2MbpsのDSDデータにアップサンプリングする。通信部51から供給されたDSDデータが11.2M DSDデータである場合、DSDアップサンプリング部52は、供給されたDSDデータをそのまま出力する。
ステップS4において、デルタシグマ復調器64は、遅延部56及び60、切替え部62を経由して供給された11.2M DSDデータを、クロック供給部63から供給されたクロック信号CLK2を用いてデルタシグマ復調して出力する。
出力されたアナログのオーディオ信号は、アナログLPF27に供給され、アナログLPF27により高域成分が除去された後、パワーアンプ28によって電力増幅される。そして、電力増幅されたアナログのオーディオ信号に基づいて、スピーカ29から、再生指示されたコンテンツの音が出力される。
再生装置11がDSDデータのみを取得して再生する場合には、以上の処理が実行される。
<5.AACデータ再生処理>
次に、図13のフローチャートを参照して、再生装置11がAACデータを取得して再生するAACデータ再生処理について説明する。図13の処理は、例えば、再生装置11の操作部において、サーバ装置12に格納されている所定コンテンツの再生がユーザによって指示されたとき実行される。図13の再生処理では、再生指示されたコンテンツのAACデータとDSDデータとの切替え処理は含まない。
初めに、ステップS21において、制御部50は、再生指示されたコンテンツに対応するビットレートの異なる複数種類のオーディオデータのなかから、取得オーディオデータとして、AACデータを決定し、通信部51に取得を指示する。
ステップS22において、通信部51は、制御部50の制御にしたがい、AACデータを要求するリクエストをサーバ装置12に送信する。また、通信部51は、要求に応じてサーバ装置12から送信されてくるAACデータを受信(取得)し、復号部53に供給する。
ステップS23において、復号部53は、通信部51から供給されたAACデータを、符号化方式に対応する復号方式で復号し、復号して得られたPCM信号をPCMアップサンプリング部54に出力する。
PCMアップサンプリング部54は、復号部53から供給されたPCM信号を、DSDアップサンプリング部52が出力するDSDデータのサンプリング周波数と同じ周波数にアップサンプリングして、ディレイ量検出部55及び遅延部57に出力する。より具体的には、PCMアップサンプリング部54は、サンプリング周波数11.2MHzのPCM信号にアップサンプリングして、ディレイ量検出部55及び遅延部57に出力する。
ステップS24において、デルタシグマ変調部59は、遅延部57、クロスフェード部58を経由して供給されたサンプリング周波数11.2MHzのPCM信号をデルタシグマ変調して、11.2M DSDデータを生成し、信号一致検出部61及び切替え部62に出力する。制御部50は、AACデータのみを取得して再生している場合、デルタシグマ変調部59の出力を選択する指示を切替え部62に供給する。切替え部62は、デルタシグマ変調部59の出力を選択して、デルタシグマ変調部59から供給された11.2M DSDデータを、デルタシグマ復調器64に出力する。
ステップS25において、デルタシグマ復調器64は、クロスフェード部58を経由して供給された11.2M DSDデータを、クロック供給部34から供給されたクロック信号CLK2を用いて復調(デルタシグマ復調)し、復調結果を、後段のアナログLPF27(図1)に出力する。
出力されたアナログのオーディオ信号は、アナログLPF27に供給され、アナログLPF27により高域成分が除去された後、パワーアンプ28によって電力増幅される。そして、電力増幅されたアナログのオーディオ信号に基づいて、スピーカ29から、再生指示されたコンテンツの音が出力される。
再生装置11がAACデータのみを取得して再生する場合には、以上の処理が実行される。
<6.再生切替え処理>
次に、図14のフローチャートを参照して、再生指示されたコンテンツに対応するオーディオデータとして、ネットワーク26の通信容量に合わせて、AACデータから、所定のビットレートのDSDデータへ再生データを切り替える再生切替え処理について説明する。
図14の処理は、例えば、制御部50が、ネットワーク26の通信容量に合わせて、AACデータから所定のビットレートのDSDデータへ切替えを決定したとき実行される。なお、図14の例では、制御部50が、AACデータから2.8M DSDデータへ切替えを決定したとして説明する。
初めに、ステップS41において、制御部50は、取得オーディオデータとして、それまで取得しているAACデータに加えて、2.8M DSDデータを決定し、通信部51に取得を指示する。
ステップS42において、通信部51は、制御部50の制御にしたがい、AACデータと2.8M DSDデータを要求するリクエストをサーバ装置12に送信する。また、通信部51は、要求に応じてサーバ装置12から送信されてくるAACデータと2.8M DSDデータを受信(取得)する。取得した2.8M DSDデータは、DSDアップサンプリング部52に供給され、AACデータは、復号部53に供給される。
ステップS43において、DSDアップサンプリング部52は、通信部51から供給された2.8M DSDデータを、11.2M DSDデータにアップサンプリングし、アップサンプリング処理後の11.2M DSDデータを、ディレイ量検出部55及び遅延部56に供給する。
ステップS44において、復号部53は、通信部51から供給されたAACデータを、符号化方式に対応する復号方式で復号し、復号して得られたPCM信号をPCMアップサンプリング部54に出力する。また、ステップS44において、PCMアップサンプリング部54は、復号部53から供給されたPCM信号を、サンプリング周波数11.2MHzのPCM信号にアップサンプリングして、ディレイ量検出部55及び遅延部57に出力する。
ステップS43とステップS44の処理は並行して実行することができる。また、ステップS43とステップS44の処理の順番は逆でもよい。
ステップS45において、LPF71及び72は、供給されたデータの高域成分を除去し、バッファに格納する。より具体的には、LPF71は、DSDアップサンプリング部52から供給された11.2M DSDデータの高域成分を除去し、高域除去後の11.2M DSDデータ(LF_DSDデータ)を、DSDバッファ73に格納する。LPF72は、PCMアップサンプリング部54から供給された11.2M PCMデータの高域成分を除去し、高域除去後の11.2M PCMデータ(LF_PCMデータ)を、PCMバッファ74に格納する。
ステップS46において、相関分析部75は、DSDバッファ73に格納されているLF_DSDデータと、PCMバッファ74に格納されているLF_PCMデータの相関を分析し、LF_PCMデータとLF_PCMデータのディレイ量N3を検出する。検出されたディレイ量N3は、ディレイ制御部76に供給される。
ステップS47において、ディレイ制御部76は、LPF71とLPF72のフィルタ処理の時間差分(N1/2−N2/2)と、相関分析部75で検出されたディレイ量N3とから、信号間のディレイ量Dを検出し、遅延部56及び57に出力する。
ステップS48において、遅延部56及び57は、11.2M DSDデータと11.2M PCMデータを所定量だけ遅延させる。より具体的には、遅延部56及び57は、それぞれ、供給される11.2M DSDデータ及び11.2M PCMデータに対して共通に所定量だけ遅延させる。また、フェードインする側の遅延部56は、さらに、ディレイ制御部76から供給されたディレイ量Dの調整も行う。ディレイ量Dの調整を行う指示は、制御部50から供給される。
ステップS49において、クロスフェード部58は、11.2M DSDデータと11.2M PCMデータのクロスフェード処理を行い、処理後のクロスフェード信号を、デルタシグマ変調部59に出力する。
ステップS50において、デルタシグマ変調部59は、クロスフェード部58から入力されたクロスフェード処理後のクロスフェード信号をデルタシグマ変調して、11.2M DSDデータを生成し、信号一致検出部61及び切替え部62に出力する。
ステップS51において、信号一致検出部61は、遅延部60を介して遅延部56から供給された11.2M DSDデータであるオリジナルDSDデータと、デルタシグマ変調部59から供給された11.2M DSDデータであるPCM変換DSDデータの一致を検出する処理を実行し、一致を検出したかを判定する。
ステップS51で、オリジナルDSDデータとPCM変換DSDデータの一致を検出していないと判定された場合、ステップS51の処理が再度繰り返される。
一方、ステップS51で、オリジナルDSDデータとPCM変換DSDデータの一致を検出したと判定された場合、処理はステップS52に進み、信号一致検出部61は、データが一致したことを示す一致検出信号を切替え部62に出力する。
ステップS53において、切替え部62は、後段のデルタシグマ復調器64に出力するオーディオデータの入力を、デルタシグマ変調部59の出力から、遅延部60の出力へ切替える。切替え部62は、遅延部60から供給された11.2M DSDデータを、デルタシグマ復調器64へ出力する。
ステップS54において、デルタシグマ復調器64は、切替え部62から供給された11.2M DSDデータを、クロック信号CLK2を用いて復調(デルタシグマ復調)し、復調結果を、装置外のアナログLPF27に出力する。
以上で、再生切替え処理が終了する。
上述した例は、AACデータから2.8M DSDデータへ切替える例で説明したが、2.8M DSDデータからAACデータへ切替える場合も同様に実行することができる。また、サーバ装置12から取得するDSDデータが、2.8M DSDデータ以外のDSDデータである場合も同様である。
再生装置11の再生切替え処理によれば、ネットワーク26の通信容量に合わせて、データ容量の異なるDSDデータ及びPCMデータ(AACデータ)を適宜切り替えて取得し、コンテンツの音として再生出力することができる。
再生装置11によれば、サーバ装置12に格納されている、同一コンテンツのビットレートの異なる複数のDSDデータ及びPCMデータのなかの、最高ビットレートのDSDデータに対応したクロック信号CLK2でデルタシグマ復調を実行するのみで、異なるビットレートのDSDデータ及びPCMデータを適宜切り替えて受信した場合であっても、ノイズを発生させることなく、コンテンツのスムーズな切替え再生(シームレスな再生)が可能となる。
<変形例>
上述した実施の形態では、ディレイ量検出部55において、DSDアップサンプリング部52から供給される11.2M DSDデータと、PCMアップサンプリング部54から供給される11.2M PCMデータの両方を、LPF71及び72を用いて、最初から所定の周波数以下の信号に絞って、11.2M DSDデータと11.2M PCMデータの位相が比較された。
しかしながら、11.2M DSDデータと11.2M PCMデータの位相を比較する際の周波数帯域を、何段階かに分けて、徐々に周波数帯域を絞りながら、位相を比較することも可能である。
DSDデータは、デルタシグマ変調器の特性として、量子化ノイズが高域に押し出された特性をもっている。したがって、最初は、LPF72による11.2M PCMデータの高域成分除去処理を省略し、LPF71による11.2M DSDデータの高域成分除去のみを行って、11.2M DSDデータと11.2M PCMデータの位相を比較してもよい。
具体的には、例えば、LPF71は、DSDアップサンプリング部52から供給される11.2M DSDデータを、PCM信号のサンプリング周波数44.1kHzの1/2以下の周波数帯域の信号に絞る。相関分析部75は、高域除去後の11.2M PCMデータと、高域が除去されていない11.2M PCMデータの相関を分析し、ディレイ量N3を検出する。
そして、一定以上の相関が得られなかった場合に、次に、LPF72も使って、LPF71とLPF72が、それぞれのデータを、サンプリング周波数44.1kHzの1/2よりさらに低い周波数帯(例えば、2kHz)以下に絞って、相関分析部75は、高域除去後の11.2M DSDデータと高域除去後の11.2M PCMデータの位相を比較する。
このように何段階かに分けて、徐々に周波数帯域を絞りながら、位相を比較することで、1フレーム内で、ディレイ量N3を検出しやすくさせることができる。
<7.最高ビットレートが5.6Mbpsである場合の再生装置の詳細構成例>
図15は、再生可能なDSDデータの最高ビットレートが5.6Mbpsである場合の再生装置11の詳細構成例を示すブロック図である。
図15乃至図17において、図3と対応する部分については同一の符号を付してあり、図15乃至図17の説明では、図3と異なる部分に着目して説明する。
再生可能なDSDデータの最高ビットレートが5.6Mbpsである場合、図15の再生装置11の各部は、取得するオーディオデータを5.6Mbpsに変換して再生処理する。
通信部51は、オーディオデータとして、5.6M DSDデータ、または、2.8M DSDデータを取得し、DSDアップサンプリング部52に供給する。一方、通信部51は、オーディオデータとして、AACデータを取得した場合には、取得したAACデータを、復号部53に供給する。
DSDアップサンプリング部52は、通信部51から供給された所定のビットレートのDSDデータを、5.6MbpsのDSDデータにアップサンプリングし、アップサンプリング処理後の5.6M DSDデータを、ディレイ量検出部55及び遅延部56に供給する。
PCMアップサンプリング部54は、復号部53から供給されるサンプリング周波数44.1kHz、量子化ビット16bitのPCM信号を、サンプリング周波数5.6MHzにアップサンプリングして、ディレイ量検出部55及び遅延部57に出力する。
相関分析部75は、5.6MbpsのDSDデータと、サンプリング周波数5.6MHzのPCMデータの相関を分析し、ディレイ量N3を検出する。
クロスフェード部58は、5.6M DSDデータと5.6M PCMデータのクロスフェード処理を行う。
デルタシグマ変調部59は、クロスフェード部58から入力されるオーディオデータを、デルタシグマ変調して、5.6M DSDデータを生成し、信号一致検出部61及び切替え部62に出力する。
信号一致検出部61は、遅延部60の出力である5.6M DSDデータと、デルタシグマ変調部59の出力である5.6M DSDデータの一致を検出し、データが一致したことを示す一致検出信号を切替え部62に出力する。
切替え部62は、信号一致検出部61からの制御にしたがい、遅延部60の出力である5.6M DSDデータか、または、デルタシグマ変調部59の出力である5.6M DSDデータのいずれか一方を選択し、選択した5.6M DSDデータを、後段のデルタシグマ復調器64に出力する。
デルタシグマ復調器64は、切替え部62から供給される5.6M DSDデータを、クロック供給部34から供給される5.6MHzのクロック信号CLK2を用いてデルタシグマ復調し、復調結果を出力する。
<8.最高ビットレートが2.8Mbpsである場合の再生装置の詳細構成例>
図16は、再生可能なDSDデータが2.8Mbpsのみである場合の再生装置11の詳細構成例を示すブロック図である。
再生可能なDSDデータの最高ビットレートが2.8Mbpsのみである場合、図16の再生装置11の各部は、取得するオーディオデータを2.8Mbpsに変換して再生処理する。
通信部51は、オーディオデータとして、2.8M DSDデータまたはAACデータを取得し、2.8M DSDデータについてはディレイ量検出部55及び遅延部56に供給し、AACデータについては復号部53に供給する。取得するDSDデータのビットレートは1種類のみであるので、DSDアップサンプリング部52は省略される。
PCMアップサンプリング部54は、復号部53から供給されるサンプリング周波数44.1kHz、量子化ビット16bitのPCM信号を、サンプリング周波数2.8MHzにアップサンプリングして、ディレイ量検出部55及び遅延部57に出力する。
相関分析部75は、2.8MbpsのDSDデータと、サンプリング周波数2.8MHzのPCMデータの相関を分析し、ディレイ量N3を検出する。
クロスフェード部58は、2.8M DSDデータと2.8M PCMデータのクロスフェード処理を行う。
デルタシグマ変調部59は、クロスフェード部58から入力されるオーディオデータを、デルタシグマ変調して、2.8M DSDデータを生成し、信号一致検出部61及び切替え部62に出力する。
信号一致検出部61は、遅延部60の出力である2.8M DSDデータと、デルタシグマ変調部59の出力である2.8M DSDデータの一致を検出し、データが一致したことを示す一致検出信号を切替え部62に出力する。
切替え部62は、信号一致検出部61からの制御にしたがい、遅延部60の出力である2.8M DSDデータか、または、デルタシグマ変調部59の出力である2.8M DSDデータのいずれか一方を選択し、選択した2.8M DSDデータを、後段のデルタシグマ復調器64に出力する。
デルタシグマ復調器64は、切替え部62から供給される2.8M DSDデータを、クロック供給部34から供給される2.8MHzのクロック信号CLK2を用いてデルタシグマ復調し、復調結果を出力する。
<9.ビットレートが異なる複数のPCMデータを切替える場合の再生装置の詳細構成例>
上述した実施の形態は、再生装置11が、1以上のDSDデータとAACデータとの切替えを行う例であったが、本技術は、ビットレートが異なる複数のPCMデータのみの切替えにも適用することができる。
図17は、ビットレートが異なる複数のPCMデータを切替える場合の再生装置11の詳細構成例を示すブロック図である。
図17の再生装置11は、再生指示されたコンテンツに対応するPCMデータであって、サンプリング周波数88.2kHzのPCMデータをAACで圧縮符号化したAACデータと、サンプリング周波数44.1kHzのPCMデータをAACで圧縮符号化したAACデータとを、必要に応じて切替えて、再生する。
以下では、簡単のため、サンプリング周波数88.2kHzのPCMデータをAACで圧縮符号化したAACデータを、Hi_AACデータと称し、サンプリング周波数44.1kHzのPCMデータをAACで圧縮符号化したAACデータを、Lo_AACデータと称する。
再生装置11の各部は、取得するAACデータをサンプリング周波数88.2kHzのPCMデータに変換して再生処理する。
通信部51は、オーディオデータとして、Hi_AACデータまたはLo_AACデータを取得する。通信部51は、取得したHi_AACデータを、復号部53Aに供給し、取得したLo_AACデータを、復号部53Bに供給する。
復号部53A及び53Bは、上述した復号部53と同一であり、AACデータを復号する。復号部53Aは、Hi_AACデータを復号し、その結果得られるサンプリング周波数88.2kHzのPCMデータを、ディレイ量検出部55及び遅延部56に出力する。復号部53Bは、Lo_AACデータを復号し、その結果得られるサンプリング周波数44.1kHzのPCMデータを、PCMアップサンプリング部54に出力する。
PCMアップサンプリング部54は、復号部53から供給されるサンプリング周波数44.1kHzのPCM信号を、サンプリング周波数88.2kHzのPCM信号にアップサンプリングして、ディレイ量検出部55及び遅延部57に出力する。
LPF71は、サンプリング周波数88.2kHzのPCMデータの高域成分を除去し、除去後のPCMデータ(LF_PCM)をバッファに格納する。LPF72は、アップサンプリングされたサンプリング周波数88.2kHzのPCMデータの高域成分を除去し、除去後のPCMデータ(LF_PCM)バッファに格納する。図17では、上述した実施の形態におけるDSDバッファ73が、PCMデータを格納するPCMバッファ73Pに変更されている。
相関分析部75は、復号部53Aから供給されるサンプリング周波数88.2kHzのPCMデータ(以下、アップサンプリング無し88.2kPCMデータと称する。)と、PCMアップサンプリング部54から供給されるサンプリング周波数88.2MHzのPCMデータ(以下、アップサンプリング有り88.2kPCMデータと称する。)の相関を分析し、ディレイ量N3を検出する。
クロスフェード部58は、アップサンプリング無し88.2kPCMデータとアップサンプリング有り88.2kPCMデータのクロスフェード処理を行う。
デルタシグマ復調器64は、クロスフェード部58から供給される88.2kPCMデータを、クロック供給部34から供給される88.2kHzのクロック信号CLK2を用いてデルタシグマ復調し、復調結果を出力する。
ビットレートが異なる複数のPCMデータどうしの切替えの場合、デルタシグマ変調部59、信号一致検出部61、及び、切替え部62は不要となる。
以上のように、本技術は、ビットレートが異なる複数のPCMデータのみの切替えを行ってコンテンツを再生する再生装置にも適用することができる。
<10.コンピュータへの適用例>
上述した一連の処理は、ハードウェアにより実行することもできるし、ソフトウェアにより実行することもできる。上述した一連の処理をソフトウェアにより実行する場合には、そのソフトウェアを構成するプログラムが、コンピュータにインストールされる。ここで、コンピュータには、専用のハードウェアに組み込まれているコンピュータや、各種のプログラムをインストールすることで、各種の機能を実行することが可能な、例えば汎用のパーソナルコンピュータなどが含まれる。
図18は、上述した一連の処理をプログラムにより実行するコンピュータのハードウェアの構成例を示すブロック図である。
コンピュータにおいて、CPU101,ROM(Read Only Memory)102,RAM(Random Access Memory)103は、バス104により相互に接続されている。
バス104には、さらに、入出力インタフェース105が接続されている。入出力インタフェース105には、入力部106、出力部107、記憶部108、通信部109、及びドライブ110が接続されている。
入力部106は、キーボード、マウス、マイクロホンなどよりなる。出力部107は、ディスプレイ、スピーカなどよりなる。記憶部108は、ハードディスクや不揮発性のメモリなどよりなる。通信部109は、ネットワークインタフェースなどよりなる。ドライブ110は、磁気ディスク、光ディスク、光磁気ディスク、或いは半導体メモリなどのリムーバブル記録媒体111を駆動する。
以上のように構成されるコンピュータでは、CPU101が、例えば、記憶部108に記憶されているプログラムを、入出力インタフェース105及びバス104を介して、RAM103にロードして実行することにより、上述したDSDデータ再生処理やAACデータ再生処理、再生切替え処理などの処理が行われる。
コンピュータでは、プログラムは、リムーバブル記録媒体111をドライブ110に装着することにより、入出力インタフェース105を介して、記憶部108にインストールすることができる。また、プログラムは、ローカルエリアネットワーク、インターネット、デジタル衛星放送といった、有線または無線の伝送媒体を介して、通信部109で受信し、記憶部108にインストールすることができる。その他、プログラムは、ROM102や記憶部108に、あらかじめインストールしておくことができる。
なお、コンピュータが実行するプログラムは、本明細書で説明する順序に沿って時系列に処理が行われるプログラムであっても良いし、並列に、あるいは呼び出しが行われたとき等の必要なタイミングで処理が行われるプログラムであっても良い。
本技術の実施の形態は、上述した実施の形態に限定されるものではなく、本技術の要旨を逸脱しない範囲において種々の変更が可能である。
上述した実施の形態では、サンプリング周波数の異なる複数のオーディオデータの受信方式として、MPEG-DASHの規格に準拠した方式を採用したが、勿論、その他の方式を採用してもよい。
また、上述した実施の形態では、サーバ装置12に格納された同一コンテンツのビットレートの異なる複数のオーディオデータは、同期して生成されたデータであるとして説明した。しかし、同期していないことにより、仮にノイズが発生したとしても、そのノイズは人間の可聴帯域で無視できるレベルである場合には、サンプリング周波数が同一であれば、必ずしも同期している必要はない。
本技術を適用した構成として、1つの機能をネットワークを介して複数の装置で分担、共同して処理するクラウドコンピューティングの構成をとることができる。
上述のフローチャートで説明した各ステップは、1つの装置で実行する他、複数の装置で分担して実行することができる。さらに、1つのステップに複数の処理が含まれる場合には、その1つのステップに含まれる複数の処理は、1つの装置で実行する他、複数の装置で分担して実行することができる。
本明細書に記載された効果はあくまで例示であって限定されるものではなく、本明細書に記載されたもの以外の効果があってもよい。
なお、本技術は以下のような構成も取ることができる。
(1)
PCM信号とDSD信号を取得する取得部と、
前記PCM信号を前記DSD信号のサンプリング周波数にアップサンプリングするPCMアップサンプリング部と、
前記DSD信号の高域成分を除去するDSDフィルタと、
高域成分を除去した前記DSD信号と、アップサンプリング後の前記PCM信号の相関を分析し、ディレイ量を検出するディレイ量検出部と、
検出された前記ディレイ量を用いて、前記DSD信号とアップサンプリング後の前記PCM信号のタイミングを調整し、前記DSD信号とアップサンプリング後の前記PCM信号をクロスフェードするクロスフェード部と
を備える信号処理装置。
(2)
アップサンプリング後の前記PCM信号の高域成分を除去するPCMフィルタをさらに備え、
前記ディレイ量検出部は、高域成分を除去した前記DSD信号と、高域成分を除去したアップサンプリング後の前記PCM信号の相関を分析し、ディレイ量を検出する
前記(1)に記載の信号処理装置。
(3)
前記取得部が取得した前記DSD信号が、前記信号処理装置が信号処理することができる最高ビットレートのDSD信号ではない場合、前記取得部が取得した前記DSD信号を、前記最高ビットレートのDSD信号にアップサンプリングするDSDアップサンプリング部をさらに備え、
前記PCMアップサンプリング部は、前記PCM信号を、アップサンプリング後の前記DSD信号のサンプリング周波数にアップサンプリングする
前記(1)または(2)に記載の信号処理装置。
(4)
前記クロスフェード部の出力であるクロスフェード信号を、デルタシグマ変調するデルタシグマ変調部をさらに備える
前記(1)乃至(3)のいずれかに記載の信号処理装置。
(5)
前記クロスフェード部へ入力した前記DSD信号と、前記デルタシグマ変調部により変調された前記クロスフェード信号の一致を検出する信号一致検出部と、
前記信号一致検出部によって一致が検出された場合、前記デルタシグマ変調部により変調された前記クロスフェード信号から、前記クロスフェード部へ入力した前記DSD信号へ、デルタシグマ復調器へ入力する信号を切り替える切替え部と
をさらに備える
前記(4)に記載の信号処理装置。
(6)
所定の圧縮符号化方式により圧縮符号化された前記PCM信号を復号する復号部をさらに備え、
前記PCMアップサンプリング部は、前記復号部によって復号された前記PCM信号を、前記DSD信号のサンプリング周波数にアップサンプリングする
前記(1)乃至(5)のいずれかに記載の信号処理装置。
(7)
前記ディレイ量検出部は、高域成分を除去した前記DSD信号と、アップサンプリング後の前記PCM信号の相関を分析する際の比較長を、前記圧縮符号化方式のフレーム長として、前記相関を分析する
前記(6)に記載の信号処理装置。
(8)
信号処理装置が、
PCM信号とDSD信号を取得し、
前記PCM信号を前記DSD信号のサンプリング周波数にアップサンプリングし、
前記DSD信号の高域成分を除去し、
高域成分を除去した前記DSD信号と、アップサンプリング後の前記PCM信号の相関を分析して、ディレイ量を検出し、
検出された前記ディレイ量を用いて、前記DSD信号とアップサンプリング後の前記PCM信号のタイミングを調整し、前記DSD信号とアップサンプリング後の前記PCM信号をクロスフェードする
ステップを含む信号処理方法。
(9)
コンピュータを、
PCM信号とDSD信号を取得する取得部と、
前記PCM信号を前記DSD信号のサンプリング周波数にアップサンプリングするPCMアップサンプリング部と、
前記DSD信号の高域成分を除去するDSDフィルタと、
高域成分を除去した前記DSD信号と、アップサンプリング後の前記PCM信号の相関を分析し、ディレイ量を検出するディレイ量検出部と、
検出された前記ディレイ量を用いて、前記DSD信号とアップサンプリング後の前記PCM信号のタイミングを調整し、前記DSD信号とアップサンプリング後の前記PCM信号をクロスフェードするクロスフェード部
として機能させるためのプログラム。
1 再生システム, 11 再生装置, 50 制御部, 51 通信部, 52 DSDアップサンプリング部, 53 復号部, 54 PCMアップサンプリング部, 55 ディレイ量検出部, 56,57 遅延部, 58 クロスフェード部, 59 デルタシグマ変調部, 60 遅延部, 61 信号一致検出部, 62 切替え部, 64 デルタシグマ復調器, 71,72 LPF, 75 相関分析部, 76 ディレイ制御部, 101 CPU, 102 ROM, 103 RAM, 106 入力部, 107 出力部, 108 記憶部, 109 通信部, 110 ドライブ

Claims (9)

  1. PCM信号とDSD信号を取得する取得部と、
    前記PCM信号を前記DSD信号のサンプリング周波数にアップサンプリングするPCMアップサンプリング部と、
    前記DSD信号の高域成分を除去するDSDフィルタと、
    高域成分を除去した前記DSD信号と、アップサンプリング後の前記PCM信号の相関を分析し、ディレイ量を検出するディレイ量検出部と、
    検出された前記ディレイ量を用いて、前記DSD信号とアップサンプリング後の前記PCM信号のタイミングを調整し、前記DSD信号とアップサンプリング後の前記PCM信号をクロスフェードするクロスフェード部と
    を備える信号処理装置。
  2. アップサンプリング後の前記PCM信号の高域成分を除去するPCMフィルタをさらに備え、
    前記ディレイ量検出部は、高域成分を除去した前記DSD信号と、高域成分を除去したアップサンプリング後の前記PCM信号の相関を分析し、ディレイ量を検出する
    請求項1に記載の信号処理装置。
  3. 前記取得部が取得した前記DSD信号が、前記信号処理装置が信号処理することができる最高ビットレートのDSD信号ではない場合、前記取得部が取得した前記DSD信号を、前記最高ビットレートのDSD信号にアップサンプリングするDSDアップサンプリング部をさらに備え、
    前記PCMアップサンプリング部は、前記PCM信号を、アップサンプリング後の前記DSD信号のサンプリング周波数にアップサンプリングする
    請求項1に記載の信号処理装置。
  4. 前記クロスフェード部の出力であるクロスフェード信号を、デルタシグマ変調するデルタシグマ変調部をさらに備える
    請求項1に記載の信号処理装置。
  5. 前記クロスフェード部へ入力した前記DSD信号と、前記デルタシグマ変調部により変調された前記クロスフェード信号の一致を検出する信号一致検出部と、
    前記信号一致検出部によって一致が検出された場合、前記デルタシグマ変調部により変調された前記クロスフェード信号から、前記クロスフェード部へ入力した前記DSD信号へ、デルタシグマ復調器へ入力する信号を切り替える切替え部と
    をさらに備える
    請求項4に記載の信号処理装置。
  6. 所定の圧縮符号化方式により圧縮符号化された前記PCM信号を復号する復号部をさらに備え、
    前記PCMアップサンプリング部は、前記復号部によって復号された前記PCM信号を、前記DSD信号のサンプリング周波数にアップサンプリングする
    請求項1に記載の信号処理装置。
  7. 前記ディレイ量検出部は、高域成分を除去した前記DSD信号と、アップサンプリング後の前記PCM信号の相関を分析する際の比較長を、前記圧縮符号化方式のフレーム長として、前記相関を分析する
    請求項6に記載の信号処理装置。
  8. 信号処理装置が、
    PCM信号とDSD信号を取得し、
    前記PCM信号を前記DSD信号のサンプリング周波数にアップサンプリングし、
    前記DSD信号の高域成分を除去し、
    高域成分を除去した前記DSD信号と、アップサンプリング後の前記PCM信号の相関を分析して、ディレイ量を検出し、
    検出された前記ディレイ量を用いて、前記DSD信号とアップサンプリング後の前記PCM信号のタイミングを調整し、前記DSD信号とアップサンプリング後の前記PCM信号をクロスフェードする
    ステップを含む信号処理方法。
  9. コンピュータを、
    PCM信号とDSD信号を取得する取得部と、
    前記PCM信号を前記DSD信号のサンプリング周波数にアップサンプリングするPCMアップサンプリング部と、
    前記DSD信号の高域成分を除去するDSDフィルタと、
    高域成分を除去した前記DSD信号と、アップサンプリング後の前記PCM信号の相関を分析し、ディレイ量を検出するディレイ量検出部と、
    検出された前記ディレイ量を用いて、前記DSD信号とアップサンプリング後の前記PCM信号のタイミングを調整し、前記DSD信号とアップサンプリング後の前記PCM信号をクロスフェードするクロスフェード部
    として機能させるためのプログラム。
JP2019514366A 2017-04-26 2018-04-12 信号処理装置、信号処理方法、およびプログラム Active JP7099447B2 (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
JP2017087207 2017-04-26
JP2017087207 2017-04-26
PCT/JP2018/015351 WO2018198788A1 (ja) 2017-04-26 2018-04-12 信号処理装置、信号処理方法、およびプログラム

Publications (2)

Publication Number Publication Date
JPWO2018198788A1 true JPWO2018198788A1 (ja) 2020-03-05
JP7099447B2 JP7099447B2 (ja) 2022-07-12

Family

ID=63919602

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2019514366A Active JP7099447B2 (ja) 2017-04-26 2018-04-12 信号処理装置、信号処理方法、およびプログラム

Country Status (4)

Country Link
US (1) US20200051576A1 (ja)
EP (1) EP3618312B9 (ja)
JP (1) JP7099447B2 (ja)
WO (1) WO2018198788A1 (ja)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10878536B1 (en) 2017-12-29 2020-12-29 Gopro, Inc. Apparatus and methods for non-uniform downsampling of captured panoramic images

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH09282800A (ja) * 1996-04-11 1997-10-31 Sony Corp ディジタルオーディオ信号の再生方法およびそれを使用した再生装置
JP2006079742A (ja) * 2004-09-10 2006-03-23 Sony Corp 情報処理装置および方法、並びにプログラム
US20090287493A1 (en) * 2005-05-30 2009-11-19 Koninklijke Philips Electronics, N.V. Direct stream digital audio with minimal storage requirement
JP5737357B2 (ja) * 2013-10-18 2015-06-17 オンキヨー株式会社 音楽再生装置及び音楽再生プログラム
EP3267587B1 (en) 2015-03-03 2021-05-19 Sony Corporation Compression encoding device, compression encoding method, decoding device, decoding method and program
JP6807031B2 (ja) 2015-06-10 2021-01-06 ソニー株式会社 信号処理装置、信号処理方法、およびプログラム

Also Published As

Publication number Publication date
EP3618312A4 (en) 2020-03-11
EP3618312B1 (en) 2021-02-17
US20200051576A1 (en) 2020-02-13
WO2018198788A1 (ja) 2018-11-01
JP7099447B2 (ja) 2022-07-12
EP3618312B9 (en) 2021-08-18
EP3618312A1 (en) 2020-03-04

Similar Documents

Publication Publication Date Title
JP6887461B2 (ja) メディア信号を復号化する復号器及び、一次メディアデータについてのメタデータ又は制御データを含む二次メディアデータを符号化する符号器
JP6807031B2 (ja) 信号処理装置、信号処理方法、およびプログラム
US10244271B2 (en) Audio recording device, audio recording system, and audio recording method
JP4760278B2 (ja) 補間装置、オーディオ再生装置、補間方法および補間プログラム
JP7099447B2 (ja) 信号処理装置、信号処理方法、およびプログラム
KR100601748B1 (ko) 디지털 음성 데이터의 부호화 방법 및 복호화 방법
JPWO2005057550A1 (ja) 音声圧縮伸張装置
JP2005122664A (ja) オーディオデータ記録装置、オーディオデータ再生装置、及びオーディオデータ記録再生装置、並びにオーディオデータ記録方法、オーディオデータ再生方法及びオーディオデータ記録再生方法
JP7140119B2 (ja) 信号処理装置、信号処理方法、および、プログラム
JP3765413B2 (ja) 情報符号化装置および方法、情報復号装置および方法、記録媒体、並びにプログラム
JP2004138789A (ja) ディジタル信号符号化方法、復号化方法、符号器、復号器及びこれらのプログラム
JP4715385B2 (ja) 補間装置、オーディオ再生装置、補間方法および補間プログラム
JP2010123225A (ja) 記録再生装置及び記録再生方法
JP3778739B2 (ja) オーディオ信号再生装置およびオーディオ信号再生方法
JP2015099964A (ja) 信号処理装置、信号処理方法及びコンピュータプログラム
JP2011209412A (ja) 圧縮装置、圧縮方法、再生装置および再生方法
JP2004233901A (ja) オーディオ信号処理装置及びオーディオ信号処理方法
JP2004140569A (ja) ディジタル信号符号化方法、復号化方法、これらの符号器、復号器及びこれらのプログラム
JP2006079740A (ja) 情報処理装置および方法、並びにプログラム
JPH11501785A (ja) ディジタル・アナログ・コンバータ
JP2008225233A (ja) 信号処理装置

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20210305

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20220531

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20220613

R151 Written notification of patent or utility model registration

Ref document number: 7099447

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R151