WO2016199596A1 - 信号処理装置、信号処理方法、およびプログラム - Google Patents

信号処理装置、信号処理方法、およびプログラム Download PDF

Info

Publication number
WO2016199596A1
WO2016199596A1 PCT/JP2016/065680 JP2016065680W WO2016199596A1 WO 2016199596 A1 WO2016199596 A1 WO 2016199596A1 JP 2016065680 W JP2016065680 W JP 2016065680W WO 2016199596 A1 WO2016199596 A1 WO 2016199596A1
Authority
WO
WIPO (PCT)
Prior art keywords
digital audio
audio signal
signal
delta
data
Prior art date
Application number
PCT/JP2016/065680
Other languages
English (en)
French (fr)
Inventor
福井 隆郎
Original Assignee
ソニー株式会社
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by ソニー株式会社 filed Critical ソニー株式会社
Priority to US15/578,406 priority Critical patent/US10861471B2/en
Priority to CN201680032203.6A priority patent/CN107615379B/zh
Priority to EP16807303.9A priority patent/EP3309781B1/en
Priority to JP2017523577A priority patent/JP6807031B2/ja
Publication of WO2016199596A1 publication Critical patent/WO2016199596A1/ja

Links

Images

Classifications

    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03MCODING; DECODING; CODE CONVERSION IN GENERAL
    • H03M7/00Conversion of a code where information is represented by a given sequence or number of digits to a code where the same, similar or subset of information is represented by a different sequence or number of digits
    • H03M7/30Compression; Expansion; Suppression of unnecessary data, e.g. redundancy reduction
    • H03M7/3002Conversion to or from differential modulation
    • H03M7/3004Digital delta-sigma modulation
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03MCODING; DECODING; CODE CONVERSION IN GENERAL
    • H03M3/00Conversion of analogue values to or from differential modulation
    • H03M3/02Delta modulation, i.e. one-bit differential modulation
    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03KPULSE TECHNIQUE
    • H03K11/00Transforming types of modulations, e.g. position-modulated pulses into duration-modulated pulses

Definitions

  • the present technology relates to a signal processing device, a signal processing method, and a program, and in particular, a signal processing device, a signal processing method, and a signal processing device that can switch a plurality of DSD signals having different sampling frequencies with a simple configuration, and Regarding the program.
  • DSD Direct Stream Digital signals
  • SACD Super Audio CD
  • the communication capacity for streaming delivery is larger than that of the PCM signal.
  • the data capacity of a 64 DSD signal is about 2.8 Mbit / frame when one frame is 3 seconds for a stereo (2 channel) signal.
  • MPEG-DASH Moving
  • the encoding apparatus which expressed the same content with different bit rates is stored in a content server
  • a client apparatus is There is a technique for streaming receiving desired encoded data from a plurality of encoded data according to the communication capacity of the network (for example, Non-Patent Document 1).
  • Patent Document 1 proposes a technique for switching smoothly when a desired one is selected from a plurality of DSD signals having different sampling frequencies.
  • Patent Document 1 is a method of converting to a PCM signal once at the time of switching, switching by applying a cross fade, and performing delta sigma modulation again, and cannot handle a delta sigma modulated digital signal as it is.
  • signal processing is heavy, it is difficult to process with a general embedded CPU. Furthermore, a delay due to crossfading also occurs.
  • the present technology has been made in view of such a situation, and enables a plurality of DSD signals having different sampling frequencies to be switched with a simple configuration.
  • the signal processing device provides the digital signal having a predetermined sampling frequency selected from a plurality of digital audio signals obtained by performing delta-sigma modulation on a single audio signal at a plurality of sampling frequencies.
  • An acquisition unit that acquires an audio signal, and an interpolation unit that performs pre-interpolation processing on the acquired digital audio signal when a sampling frequency of the acquired digital audio signal is lower than an operation clock of a delta-sigma demodulator With.
  • a signal processing method in which a signal processing device is selected from a plurality of digital audio signals obtained by performing delta-sigma modulation on a single audio signal at a plurality of sampling frequencies.
  • the digital audio signal having a sampling frequency is acquired, and when the sampling frequency of the acquired digital audio signal is lower than the operation clock of the delta-sigma demodulator, a pre-interpolation process is performed on the acquired digital audio signal. Includes steps.
  • the program according to one aspect of the present technology allows a computer to select a predetermined sampling frequency selected from a plurality of digital audio signals obtained by performing delta-sigma modulation on a single audio signal at a plurality of sampling frequencies.
  • a process including a step of acquiring a digital audio signal and performing a pre-interpolation process on the acquired digital audio signal when a sampling frequency of the acquired digital audio signal is lower than an operation clock of a delta-sigma demodulator Is to execute.
  • the digital audio signal having a predetermined sampling frequency selected from a plurality of digital audio signals obtained by performing delta-sigma modulation on a single audio signal at a plurality of sampling frequencies.
  • the sampling frequency of the acquired digital audio signal is lower than the operation clock of the delta-sigma demodulator, pre-interpolation processing is performed on the acquired digital audio signal.
  • the program can be provided by being transmitted through a transmission medium or by being recorded on a recording medium.
  • the signal processing device may be an independent device, or may be an internal block constituting one device.
  • a plurality of DSD signals having different sampling frequencies can be switched with a simple configuration.
  • FIG. 18 is a block diagram which shows the structural example of one Embodiment of the reproducing
  • FIG. 1 is a block diagram illustrating a configuration example of an embodiment of a reproduction system to which the present technology is applied.
  • 1 is a system that includes at least a playback device 11 and a server device 12, and the playback device 11 acquires and plays back audio data stored in the server device 12.
  • the server device 12 stores a plurality of audio data obtained by AD-converting one sound source (content) collected by the microphone 21 at different sampling frequencies.
  • an audio signal of a predetermined sound source (for example, content A) collected by the microphone 21 is amplified by an amplifier (AMP) 22 and supplied to a plurality of delta-sigma ( ⁇ ) modulators 23.
  • the delta sigma modulator 23 converts an input analog audio signal into a digital signal (AD conversion) by delta sigma modulation.
  • Each of the plurality of delta-sigma modulators 23 has a different sampling frequency when performing delta-sigma modulation.
  • the delta sigma modulator 23A performs delta sigma modulation on the input analog audio signal at a sampling frequency that is 256 times the sampling frequency 44.1 kHz of CD (Compact Disc), and the resulting DSD signal (hereinafter referred to as 256DSD). (Also referred to as data) is stored in the server device 12.
  • the delta-sigma modulator 23B performs delta-sigma modulation on the input analog audio signal at a sampling frequency 128 times the CD sampling frequency 44.1 kHz, and the resulting DSD signal (hereinafter also referred to as 128 DSD data).
  • the data is stored in the server device 12.
  • the delta-sigma modulator 23C delta-sigma-modulates the input analog audio signal at a sampling frequency that is 64 times the CD sampling frequency 44.1 kHz, and the resulting DSD signal (hereinafter also referred to as 64DSD data).
  • the data is stored in the server device 12.
  • Delta sigma modulators 23A to 23C each sampling frequency, the sampling frequency 44.1kHz for CD and the fundamental frequency f b, and has a frequency that is calculated by a power of two of the fundamental frequency f b. Note that the sampling frequencies of the delta sigma modulators 23A to 23C are only required to be in a power-of-two relationship, that is, a frequency that is a power-of-two multiple or a power-of-two power relationship. f b need not be 44.1 kHz, which corresponds to the sampling frequency of CD.
  • the delta sigma modulators 23A to 23C When each of the delta sigma modulators 23A to 23C performs AD conversion, the delta sigma modulators 23A to 23C perform AD conversion in synchronization with each other based on one clock signal CLK1. For example, the delta sigma modulator 23C supplies the clock signal CLK1 generated by itself to the delta sigma modulators 23A and 23B, and each of the delta sigma modulators 23A to 23C is based on the clock signal CLK1 generated by the delta sigma modulator 23C. To perform AD conversion.
  • the server device 12 stores a plurality of pieces of audio data generated from one sound source (content) as described above and having different sampling frequencies.
  • the playback device 11 has a plurality of audio data with different sampling frequencies of the same content, that is, 256 DSD data, 128 DSD data, and 64 DSD according to the communication capacity of the network 24 when accessing the server device 12. One of the data is selected and acquired and reproduced.
  • a plurality of pieces of encoded data representing the same content at different bit rates are stored in a content server, and the client device selects a desired code from the stored pieces of encoded data according to the network communication capacity.
  • MPEG-DASH Moving / Picture / Experts / Group / Dynamic / Adaptive / Streaming / over / HTTP
  • MPEG-DASH is available as a standard for streaming reception of digitized data.
  • the server device 12 stores a plurality of audio data having different sampling frequencies for one content in a format compliant with the MPEG-DASH standard.
  • MPEG-DASH uses a meta file called MPD (Media Presentation Description) and media data address (URL: Uniform Resource Locator) such as chunked audio, video, or subtitles described in the meta file. It is acquired and played back.
  • MPD Media Presentation Description
  • URL Uniform Resource Locator
  • chunked audio data for example, audio data having a sound source of 3 seconds per frame as a file (segment file) unit is stored in the server device 12.
  • DSD data having three types of sampling frequencies of 256 DSD data, 128 DSD data, and 64 DSD data is stored in the server device 12 for one sound source (content).
  • the types of sampling frequencies of DSD data created for one sound source (content) are not limited to three, and may be two or four or more.
  • the server device 12 stores a plurality of DSD data having different sampling frequencies for a plurality of contents such as contents A, contents B, contents C,.
  • the playback device 11 includes a control unit 31, a communication unit 32, an interpolation unit 33, a clock supply unit 34, a delta-sigma demodulator 35, an analog LPF 36, a power amplifier 37, and a speaker 38.
  • the control unit 31 When an operation unit (not shown) instructs the reproduction of the predetermined content stored in the server device 12 by the user, the control unit 31 includes a plurality of DSD data corresponding to the content instructed to be reproduced (a plurality of sampling frequencies having different sampling frequencies).
  • the DSD data is selected from among the DSD data in accordance with the communication capacity of the network 24, and requested to the server device 12 via the communication unit 32.
  • control unit 31 supplies sampling frequency information indicating the sampling frequency of the DSD data requested to the server device 12 to the interpolation unit 33.
  • the communication unit 32 transmits a request for requesting DSD data having a predetermined sampling frequency to the server device 12 under the control of the control unit 31. Further, the communication unit 32 receives the DSD data transmitted from the server device 12 in response to the request and supplies the DSD data to the interpolation unit 33.
  • the communication unit 32 acquires an MPD file first, and accesses a predetermined address of the server device 12 based on the acquired MPD file to obtain a desired content. Get DSD data of sampling frequency.
  • the interpolation unit 33 Based on the sampling frequency information supplied from the control unit 31, the interpolation unit 33 performs interpolation processing on the DSD data supplied from the communication unit 32 as necessary, and the DSD data after the interpolation processing is This is supplied to the delta sigma demodulator 35.
  • the interpolation unit 33 is configured to match the DSD data having the highest sampling frequency (hereinafter referred to as DSD data having the highest bit rate) among the plurality of DSD data having different sampling frequencies that can be acquired from the server device 12. DSD data supplied from 32 is pre-interpolated.
  • the 128 DSD data is, for example, 8-bit data such as “01101010”.
  • the 64DSD data is represented by 4-bit data such as “0110”, for example. Note that the 256DSD data, 128DSD data, and 128DSD data shown in FIG. 2 explain the difference in the number of bits, and are not data obtained by digitizing the same audio signal.
  • the interpolation unit 33 converts the DSD data supplied from the communication unit 32 into the data of the DSD data having the highest bit rate. Interpolate to be long.
  • the data length is 1 ⁇ 2 of the maximum bit rate DSD data (256 DSD data).
  • Each bit value of the 128 DSD data supplied from the unit 32 is output twice.
  • the data length is 1 ⁇ 4 of the maximum bit rate DSD data (256 DSD data).
  • Each bit value of the supplied 128DSD data is output four times.
  • the interpolation unit 33 pre-interpolates the DSD data supplied from the communication unit 32 at a ratio with the DSD data of the highest bit rate, and outputs the result to the delta-sigma demodulator 35.
  • the interpolation unit 33 outputs the supplied DSD data as it is.
  • the interpolation unit 33 is necessary when the AD conversion processing (delta-sigma demodulation processing) of a plurality of DSD data having different sampling frequencies is realized by software implementation, but is not required when realized by hardware. Become.
  • the signal of DSD data selected and received is a signal in which the same data is held until the next value is received as shown in FIG. It has become. Therefore, the delta sigma demodulator 35 may perform delta sigma demodulation processing on the selected and received DSD data signal as it is based on the clock signal CLK2 corresponding to the DSD data (256 DSD data) of the highest bit rate. In this case, the delta-sigma demodulator 35 reads the signal holding the same data once for 256 DSD data, four times for 64 DSD data and twice for 128 DSD data. .
  • the communication unit 32 that selectively receives a signal of DSD data and supplies the signal to the delta-sigma demodulator 35 converts the received DSD data into the DSD of the highest bit rate. It also functions as an interpolating unit 33 that performs pre-interpolation according to data.
  • the clock supply unit 34 supplies the delta-sigma demodulator 35 with the clock signal CLK2 corresponding to the DSD data of the highest bit rate.
  • the clock supply unit 34 generates a clock signal CLK 2 corresponding to the bit rate of 256 DSD data, and supplies the clock signal CLK 2 to the delta sigma demodulator 35.
  • the clock frequency of the clock signal CLK2 corresponding to the bit rate of 256DSD data is about 11.2 MHz.
  • the delta-sigma demodulator 35 demodulates (delta-sigma demodulation) the 256DSD data, 128DSD data, or 64DSD data supplied from the interpolation unit 33 using the clock signal CLK2 supplied from the clock supply unit 34, and the demodulation result.
  • the analog LPF 36 is supplied.
  • the DSD data supplied from the interpolating unit 33 is any data of 256 DSD data, 128 DSD data, or 64 DSD data that has been converted to the data length of 256 DSD data by the interpolating unit 33.
  • the delta-sigma demodulator 35 can be configured by, for example, a digital filter of FIR (finite impulse response).
  • Analog LPF (low-pass filter) 36 performs a filtering process to remove high-frequency components, and outputs the filtered signal to power amplifier 37.
  • the power amplifier 37 amplifies the analog audio signal output from the analog LPF 36 and outputs it to the speaker 38.
  • the speaker 38 outputs the audio signal supplied from the power amplifier 37 as sound.
  • the client-side device configuration for selectively controlling content data stored in the server device 12 includes an analog output unit such as an analog LPF 36, a power amplifier 37, and a speaker 38.
  • the analog output unit may be configured separately from the delta-sigma demodulation processing unit.
  • the playback device 11 of FIG. 1 selects and receives content data stored in the server device 12 and receives it, and performs a delta-sigma demodulation process, and the signal processing device And an analog output device that outputs sound based on the output signal.
  • step S1 the control unit 31 determines DSD data to be acquired from a plurality of DSD data having different sampling frequencies, which is DSD data of the content instructed to be reproduced, and the communication unit 32 acquires the DSD data. Instruct. Further, the control unit 31 supplies sampling frequency information of the DSD data to be acquired to the interpolation unit 33.
  • step S1 is repeatedly executed, but in the first process of step S1, the control unit 31 determines DSD data having a predetermined sampling frequency as DSD data to be acquired.
  • DSD data to be acquired is determined based on a bit rate selection control process described later with reference to FIG.
  • step S ⁇ b> 2 the communication unit 32 transmits a request for requesting DSD data having a predetermined sampling frequency to the server device 12 under the control of the control unit 31. Further, the communication unit 32 receives (acquires) DSD data transmitted from the server device 12 in response to a request, and supplies the DSD data to the interpolation unit 33.
  • step S3 the interpolation unit 33 determines whether the DSD data received by the communication unit 32 is DSD data having the highest bit rate based on the sampling frequency information of the DSD data supplied from the control unit 31.
  • step S3 If it is determined in step S3 that the received DSD data is not the DSD data of the highest bit rate, the process proceeds to step S4, and the interpolation unit 33 converts the DSD data supplied from the communication unit 32 by pre-interpolation. Interpolate to the data length of DSD data at the highest bit rate.
  • step S3 If it is determined in step S3 that the received DSD data is DSD data of the highest bit rate, the process proceeds to step S5, and the interpolation unit 33 outputs the DSD data supplied from the communication unit 32 as it is.
  • step S6 the delta sigma demodulator 35 demodulates the DSD data supplied from the interpolation unit 33 using the clock signal CLK2 supplied from the clock supply unit 34.
  • the demodulation result is supplied to the analog LPF 36.
  • step S7 the speaker 38 outputs a sound based on the analog audio signal from which the high frequency component is removed by the analog LPF 36 and the power is amplified by the power amplifier 37.
  • steps S1 to S7 described above are repeatedly executed for each segment file corresponding to a sound source of 3 frames per second, for example.
  • bit rate selection control process executed as part of step S1 of FIG. 4 will be described with reference to the flowchart of FIG.
  • step S31 the control unit 31 estimates the communication capacity of the network 24 when the DSD data is acquired from the server device 12.
  • step S32 the control unit 31 determines whether to change the bit rate of the DSD data to be acquired. For example, the control unit 31 sets the threshold of the communication capacity of the network 24 for each of a plurality of audio data having different sampling frequencies, that is, 256 DSD data, 128 DSD data, and 64 DSD data, and is now receiving it. It is determined whether or not to change the bit rate of the acquired DSD data by comparing the threshold of the communication capacity corresponding to the DSD data of the bit rate and the communication capacity estimated by the process of step S31.
  • step S32 If it is determined in step S32 that the bit rate of the DSD data to be acquired is not changed, the bit rate selection control process ends.
  • step S32 when it is determined in step S32 that the bit rate of the DSD data to be acquired is changed, the process proceeds to step S33, and the control unit 31 changes the DSD data to be acquired to DSD data having a different bit rate and performs communication.
  • the unit 32 is instructed to acquire.
  • the control unit 31 supplies the sampling frequency information of the changed DSD data to the interpolation unit 33, and ends the bit rate selection control process.
  • the playback device 11 executes the above-described bit rate selection control process as part of step S1 in FIG. As a result, DSD data having different data capacities can be appropriately switched and acquired in accordance with the communication capacity of the network 24, and can be reproduced and output as content sounds.
  • the playback device 11 uses the clock signal CLK2 corresponding to the DSD data having the highest bit rate among the plurality of DSD data stored in the server device 12 and having different bit rates, to perform delta-sigma demodulation. Even when DSD data having different bit rates is switched and received as appropriate, the content can be smoothly reproduced. The reason why the content can be reproduced smoothly even when DSD data of different bit rates is appropriately switched by this simple method will be described below.
  • FIG. 6 is a diagram illustrating frequency characteristics of a 64DSD signal.
  • the DSD signal has a characteristic in which quantization noise, which is a characteristic of a delta-sigma modulator, is pushed out to a high frequency. Further, since the DSD signal has a high sampling frequency, the signal band thereof is 1.2 MHz in the case of the 64 DSD signal.
  • the bandwidth of the audio signal is at most 100 kHz. Therefore, as shown in FIG. 6, the band of the audio signal is only a small band near DC with respect to the 1.2 MHz band of the entire DSD signal.
  • FIG. 7 is a diagram showing the frequency characteristics of the 128 DSD signal after the processing in which the pre-value interpolation processing for adjusting the data length to the 256 DSD signal is performed on the 128 DSD signal.
  • the frequency characteristic of the 128 DSD signal after the pre-interpolation process is a frequency characteristic that drops near the Nyquist frequency due to the aperture effect, as shown in the upper graph of FIG.
  • the characteristic is about 0. 0 as shown in the lower graph of FIG.
  • the level of about 0.005 dB is much smaller than the variation in the analog characteristics generated in the analog processing unit subsequent to the delta sigma demodulator 35. Therefore, it can be seen that there is almost no influence on the reproduction of the DSD signal.
  • the characteristic of the graph of FIG. 7 is generally the characteristic when the previous value interpolation is performed.
  • the frequency component is originally the upper part of FIG. The bandwidth is half that of the graph.
  • the reproduction apparatus 11 is generally provided with an analog LPF 36 to protect the power amplifier 37 and the speaker 38 at the subsequent stage. It is.
  • the analog LPF 36 filters high frequency components after about 100 kHz. Therefore, even from the point of having the analog LPF 36, the characteristics of the high frequency band of 100 kHz or higher do not affect the sound output.
  • FIG. 8 is a diagram showing the frequency characteristics of the 64DSD signal after the process of performing the pre-value interpolation process for matching the data length to the 256DSD signal for the 64DSD signal.
  • the frequency characteristic of the 64DSD signal after the pre-interpolation process is a frequency characteristic that drops in the vicinity of half the Nyquist frequency, as shown in the upper graph of FIG.
  • the level of about 0.002 dB is much smaller than the variation in the analog characteristics generated in the analog processing unit subsequent to the delta-sigma demodulator 35.
  • the characteristic of the graph of FIG. 8 is generally the characteristic when the previous value interpolation is performed.
  • the frequency component is originally shown in the upper part of FIG. The bandwidth is 1/4 of the graph.
  • the analog LPF 36 removes high frequency components of about 100 kHz and later, as in the case of the 128 DSD signal described above, and the characteristics of the high frequency band of 100 kHz or higher do not affect the sound output.
  • the signal degradation in the human audible band of the DSD signal interpolated by the same value as the 256DSD signal is negligible. Therefore, no noise is generated even if the DSD signals having different sampling frequencies are appropriately switched. That is, even if the DSD signals having different sampling frequencies are appropriately switched, they can be reproduced with continuity, and the content can be reproduced smoothly.
  • PCM streaming data with a sampling frequency of 44.1 kHz
  • PCM data with twice that sampling frequency of 88.2 kHz PCM data with four times the sampling frequency of 176.4 kHz.
  • PCMDAC 71 performs DA conversion at the maximum frequency of 176.4 kHz with the PCMDAC 71 selected as appropriate according to the communication capacity of the network 24.
  • FIG. 10 shows the frequency characteristics of the PCM signal after the pre-interpolation process, similar to the frequency characteristics of the DSD signal after the pre-interpolation process shown in FIGS.
  • the frequency characteristic becomes a characteristic that decreases at a high frequency due to the aperture effect, like the DSD signal.
  • the sampling frequency is lower than that of the DSD signal, a level drop that cannot be ignored occurs even at 20 kHz or less, which is the signal band of a normal audio signal. Accordingly, when PCM data having different sampling frequencies of the same content are switched, even if the signals are AD-converted synchronously, there is a case where continuity is lost and noise is generated. Also, since the characteristics of the audio band differ depending on the signal, the sound quality when switching is also changed.
  • the ADC of the PCM signal is generally generated by filtering a signal that is delta-sigma modulated at the first stage. Due to the difference in ADC filter characteristics, delay values are often different for signals with a sampling frequency of 44.1 kHz, 88.2 kHz, or 176.4 kHz. It is not a signal of. Therefore, the continuity of signals cannot be maintained before and after switching.
  • DSD data having the highest sampling frequency among a plurality of DSD data having different sampling frequencies prepared in advance for one content (same content).
  • pre-interpolation processing and delta-sigma demodulation processing according to (maximum bit rate DSD data)
  • no noise is generated even when switching to DSD data having a different sampling frequency.
  • the series of processes described above can be executed by hardware or can be executed by software.
  • a program constituting the software is installed in the computer.
  • the computer includes, for example, a general-purpose personal computer capable of executing various functions by installing a computer incorporated in dedicated hardware and various programs.
  • FIG. 11 is a block diagram showing an example of a hardware configuration of a computer that executes the above-described series of processing by a program.
  • a CPU 101 In the computer, a CPU 101, a ROM (Read Only Memory) 102, and a RAM (Random Access Memory) 103 are connected to each other via a bus 104.
  • ROM Read Only Memory
  • RAM Random Access Memory
  • An input / output interface 105 is further connected to the bus 104.
  • An input unit 106, an output unit 107, a storage unit 108, a communication unit 109, and a drive 110 are connected to the input / output interface 105.
  • the input unit 106 includes a keyboard, a mouse, a microphone, and the like.
  • the output unit 107 includes a display, a speaker, and the like.
  • the storage unit 108 includes a hard disk, a nonvolatile memory, and the like.
  • the communication unit 109 includes a network interface or the like.
  • the drive 110 drives a removable recording medium 111 such as a magnetic disk, an optical disk, a magneto-optical disk, or a semiconductor memory.
  • the CPU 101 loads the program stored in the storage unit 108 to the RAM 103 via the input / output interface 105 and the bus 104 and executes the program. Processing such as rate selection control processing and delta-sigma demodulation processing is performed.
  • the program can be installed in the storage unit 108 via the input / output interface 105 by attaching the removable recording medium 111 to the drive 110. Further, the program can be received by the communication unit 109 and installed in the storage unit 108 via a wired or wireless transmission medium such as a local area network, the Internet, or digital satellite broadcasting. In addition, the program can be installed in the ROM 102 or the storage unit 108 in advance.
  • the program executed by the computer may be a program that is processed in time series in the order described in this specification, or in parallel or at a necessary timing such as when a call is made. It may be a program for processing.
  • Embodiments of the present technology are not limited to the above-described embodiments, and various modifications can be made without departing from the gist of the present technology.
  • a method conforming to the MPEG-DASH standard is adopted as a transmission / reception method of a plurality of DSD data having different sampling frequencies, but other methods may be adopted as a matter of course.
  • a plurality of DSD data having different sampling frequencies stored in the server device 12 are described as data generated in synchronization. However, even if noise occurs due to non-synchronization, it is considered that the noise is at a level that can be ignored in the human audible band. Absent.
  • the operation clock of the delta sigma demodulator 35 is uniformly operated at the clock frequency corresponding to the maximum bit rate.
  • DSD data having a bit rate lower than the maximum bit rate is delta sigma demodulated.
  • the demodulating process can be performed by reducing the operation clock of the delta-sigma demodulator 35 to 1/2 or 1/4.
  • the interpolation unit 33 outputs the input DSD data as it is to the delta-sigma demodulator 35 without performing pre-interpolation.
  • the delta sigma demodulator 35 may operate with a lower operating clock for the purpose of reducing power consumption.
  • Each step described in the above flowchart can be executed by one device or can be shared by a plurality of devices. Further, when a plurality of processes are included in one step, the plurality of processes included in the one step can be executed by being shared by a plurality of apparatuses in addition to being executed by one apparatus.
  • the present technology can also have the following configurations.
  • a signal processing apparatus comprising: an interpolation unit that performs a pre-interpolation process on the acquired digital audio signal when a sampling frequency of the acquired digital audio signal is lower than an operation clock of a delta-sigma demodulator.
  • each of the plurality of sampling frequencies is a frequency that is a power of two with respect to another sampling frequency of the plurality of sampling frequencies.
  • the signal processing apparatus further including the delta sigma demodulator that performs delta sigma demodulation with an operation clock corresponding to the highest sampling frequency among the plurality of sampling frequencies.
  • the interpolation unit performs pre-interpolation processing on the acquired digital audio signal at a ratio of a sampling frequency of the acquired digital audio signal and a highest sampling frequency among the plurality of sampling frequencies.
  • the signal processing apparatus acquires the digital audio signal compliant with an MPEG-DASH standard.
  • the digital audio signal acquired by the acquisition unit is further provided with an acquisition control unit that determines the digital audio signal from the plurality of digital audio signals having different sampling frequencies according to the communication capacity of the network.
  • the signal processing device obtaining the digital audio signal having a predetermined sampling frequency selected from a plurality of digital audio signals obtained by performing delta-sigma modulation on a single audio signal at a plurality of sampling frequencies;
  • a signal processing method including a step of performing a pre-interpolation process on the acquired digital audio signal when a sampling frequency of the acquired digital audio signal is lower than an operation clock of a delta-sigma demodulator.
  • 1 playback system 11 playback device, 12 server device, 31 control unit, 32 communication unit, 33 interpolation unit, 34 clock supply unit, 35 delta-sigma ( ⁇ ) demodulator, 101 CPU, 102 ROM, 103 RAM, 106 inputs Part, 107 output part, 108 storage part, 109 communication part, 110 drive

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Theoretical Computer Science (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

 本技術は、簡単な構成で、サンプリング周波数の異なる複数のDSD信号の切り替えを行うことができるようにする信号処理装置、信号処理方法、およびプログラムに関する。 取得部は、1つのオーディオ信号に対して複数のサンプリング周波数でデルタシグマ変調して得られた複数のデジタルオーディオ信号のなかから選択された、所定のサンプリング周波数のデジタルオーディオ信号を取得する。補間部は、取得したデジタルオーディオ信号のサンプリング周波数が、デルタシグマ復調器の動作クロックより低い周波数のとき、取得したデジタルオーディオ信号に対して前置補間処理を行う。本技術は、例えば、信号処理装置等に適用できる。

Description

信号処理装置、信号処理方法、およびプログラム
 本技術は、信号処理装置、信号処理方法、およびプログラムに関し、特に、簡単な構成で、サンプリング周波数の異なる複数のDSD信号の切り替えを行うことができるようにする信号処理装置、信号処理方法、およびプログラムに関する。
 近年、音楽用CD(CD-DA)を超える音質のオーディオデータであるハイレゾリューション音源による音楽配信が行われるようになってきている。
 1bit信号でデルタシグマ変調されたデジタル信号(以下、DSD(Direct Stream Digital)信号ともいう。)を用いた音楽配信では、スーパーオーディオCD(SACD)で用いられているCDのサンプリング周波数44.1kHzの64倍のDSD信号(64DSD信号)だけでなく、128倍のDSD信号(128DSD信号)や、256倍のDSD信号(256DSD信号)の配信も実験的に行われている。
 DSD信号は、サンプリング周波数がPCM(Pulse Code Modulation)信号よりも高いため、ストリーミング配信を行う場合の通信容量はPCM信号と比較して大きくなる。例えば、ステレオ(2チャンネル)の信号で1フレームを3秒としたときの64DSD信号のデータ容量は、2.8Mbit/フレーム程度になる。
 一方で、例えば、MPEG-DASH(Moving Picture Experts Group - Dynamic Adaptive Streaming over HTTP)のように、同一コンテンツを異なるビットレートで表現した複数の符号化データをコンテンツサーバに格納しておき、クライアント装置が、ネットワークの通信容量に応じて複数の符号化データのなかから、所望の符号化データをストリーミング受信する技術がある(例えば、非特許文献1)。
 DSD信号を用いた音楽配信においても、MPEG-DASHのようなストリーミング方式を用いることで、同一コンテンツで異なるビットレートの信号、例えば、64DSD信号、128DSD信号、256DSD信号のなかから、通信回線容量に合わせて、より良い品質のDSD信号を動的に選択視聴することが可能になる。
 サンプリング周波数の異なる複数のDSD信号のなかから所望の一つを選択して切り替える際に、スムーズに切り替えるようにするための手法が、例えば、特許文献1で提案されている。
特開平10-51311号公報
ISO/IEC 23009-1:2012 Information technology Dynamic adaptive streaming over HTTP (DASH)
 しかしながら、特許文献1の手法は、切り替え時に一度PCM信号に変換し、クロスフェードをかけることで切り替え、再度デルタシグマ変調する方式であり、デルタシグマ変調されたデジタル信号をそのまま扱うことができない。また、信号処理が重いため、一般的な組み込み系CPUで処理することは難しい。さらに、クロスフェードによる遅延も発生する。
 本技術は、このような状況に鑑みてなされたものであり、簡単な構成で、サンプリング周波数の異なる複数のDSD信号の切り替えを行うことができるようにするものである。
 本技術の一側面の信号処理装置は、1つのオーディオ信号に対して複数のサンプリング周波数でデルタシグマ変調して得られた複数のデジタルオーディオ信号のなかから選択された、所定のサンプリング周波数の前記デジタルオーディオ信号を取得する取得部と、取得した前記デジタルオーディオ信号のサンプリング周波数が、デルタシグマ復調器の動作クロックより低い周波数のとき、取得した前記デジタルオーディオ信号に対して前置補間処理を行う補間部とを備える。
 本技術の一側面の信号処理方法は、信号処理装置が、1つのオーディオ信号に対して複数のサンプリング周波数でデルタシグマ変調して得られた複数のデジタルオーディオ信号のなかから選択された、所定のサンプリング周波数の前記デジタルオーディオ信号を取得し、取得した前記デジタルオーディオ信号のサンプリング周波数が、デルタシグマ復調器の動作クロックより低い周波数のとき、取得した前記デジタルオーディオ信号に対して前置補間処理を行うステップを含む。
 本技術の一側面のプログラムは、コンピュータに、1つのオーディオ信号に対して複数のサンプリング周波数でデルタシグマ変調して得られた複数のデジタルオーディオ信号のなかから選択された、所定のサンプリング周波数の前記デジタルオーディオ信号を取得し、取得した前記デジタルオーディオ信号のサンプリング周波数が、デルタシグマ復調器の動作クロックより低い周波数のとき、取得した前記デジタルオーディオ信号に対して前置補間処理を行うステップを含む処理を実行させるためのものである。
 本技術の一側面においては、1つのオーディオ信号に対して複数のサンプリング周波数でデルタシグマ変調して得られた複数のデジタルオーディオ信号のなかから選択された、所定のサンプリング周波数の前記デジタルオーディオ信号が取得され、取得された前記デジタルオーディオ信号のサンプリング周波数が、デルタシグマ復調器の動作クロックより低い周波数のとき、取得した前記デジタルオーディオ信号に対して前置補間処理が行われる。
 プログラムは、伝送媒体を介して伝送することにより、又は、記録媒体に記録して、提供することができる。
 信号処理装置は、独立した装置であっても良いし、1つの装置を構成している内部ブロックであっても良い。
 本技術の一側面によれば、簡単な構成で、サンプリング周波数の異なる複数のDSD信号の切り替えを行うことができる。
 なお、ここに記載された効果は必ずしも限定されるものではなく、本開示中に記載されたいずれかの効果であってもよい。
本技術を適用した再生システムの一実施の形態の構成例を示すブロック図である。 補間処理を説明する図である。 補間処理を説明する図である。 再生処理を説明するフローチャートである。 ビットレート選択制御処理を説明するフローチャートである。 DSD信号の特徴について説明する図である。 前値補間処理後の128DSD信号の周波数特性を示す図である。 前値補間処理後の64DSD信号の周波数特性を示す図である。 オーディオデータがPCMデータである場合について説明する図である。 前置補間処理後のPCM信号の周波数特性を示す図である。 本技術を適用したコンピュータの一実施の形態の構成例を示すブロック図である。
<再生システムの構成例>
 図1は、本技術を適用した再生システムの一実施の形態の構成例を示すブロック図である。
 図1の再生システム1は、再生装置11とサーバ装置12を少なくとも含み、再生装置11がサーバ装置12に格納されているオーディオデータを取得して再生するシステムである。
 サーバ装置12には、マイクロホン21で収音した1つの音源(コンテンツ)を、異なるサンプリング周波数でAD変換した複数のオーディオデータが格納されている。
 具体的には、マイクロホン21によって収音された所定の音源(例えば、コンテンツA)のオーディオ信号が、増幅器(AMP)22によって増幅され、複数のデルタシグマ(△Σ)変調器23に供給される。デルタシグマ変調器23は、デルタシグマ変調により、入力されたアナログのオーディオ信号をデジタル信号に変換(AD変換)する。
 複数のデルタシグマ変調器23それぞれは、デルタシグマ変調する場合のサンプリング周波数が異なる。
 例えば、デルタシグマ変調器23Aは、入力されたアナログのオーディオ信号を、CD(Compact Disc)のサンプリング周波数44.1kHzの256倍のサンプリング周波数でデルタシグマ変調し、その結果得られるDSD信号(以下、256DSDデータともいう。)をサーバ装置12に記憶させる。
 デルタシグマ変調器23Bは、入力されたアナログのオーディオ信号を、CDのサンプリング周波数44.1kHzの128倍のサンプリング周波数でデルタシグマ変調し、その結果得られるDSD信号(以下、128DSDデータともいう。)をサーバ装置12に記憶させる。
 デルタシグマ変調器23Cは、入力されたアナログのオーディオ信号を、CDのサンプリング周波数44.1kHzの64倍のサンプリング周波数でデルタシグマ変調し、その結果得られるDSD信号(以下、64DSDデータともいう。)をサーバ装置12に記憶させる。
 デルタシグマ変調器23A乃至23Cそれぞれのサンプリング周波数は、CDのサンプリング周波数44.1kHzを基本周波数fbとすると、基本周波数fbの2のべき乗で計算される周波数となっている。なお、デルタシグマ変調器23A乃至23Cそれぞれのサンプリング周波数は、互いに、2のべき乗の関係、即ち、2のべき乗倍または2のべき乗分の1の関係にある周波数となっていればよく、基本周波数fbがCDのサンプリング周波数に相当する44.1kHzである必要はない。
 デルタシグマ変調器23A乃至23Cそれぞれは、AD変換する際、1つのクロック信号CLK1を基準に、デルタシグマ変調器23A乃至23Cそれぞれが同期してAD変換を行う。例えば、デルタシグマ変調器23Cが、自ら生成したクロック信号CLK1をデルタシグマ変調器23Aと23Bへ供給し、デルタシグマ変調器23A乃至23Cそれぞれは、デルタシグマ変調器23Cが生成したクロック信号CLK1に基づいてAD変換を行う。
 サーバ装置12には、以上のような、1つの音源(コンテンツ)から生成された、サンプリング周波数が異なる複数のオーディオデータが格納されている。
 再生装置11は、後述するように、サーバ装置12へアクセスする際のネットワーク24の通信容量に合わせて、同一コンテンツのサンプリング周波数が異なる複数のオーディオデータ、即ち、256DSDデータ、128DSDデータ、及び、64DSDデータのなかから、いずれか1つを選択して取得し、再生する。
 同一コンテンツを異なるビットレートで表現した複数の符号化データをコンテンツサーバに格納しておき、クライアント装置が、格納された複数の符号化データのなかから、ネットワークの通信容量に応じて、所望の符号化データをストリーミング受信する方式の規格として、MPEG-DASH(Moving Picture Experts Group - Dynamic Adaptive Streaming over HTTP)がある。
 サーバ装置12は、このMPEG-DASHの規格に準拠した形式により、1つのコンテンツに対してサンプリング周波数の異なる複数のオーディオデータを格納している。
 MPEG-DASHは、MPD(Media Presentation Description)と呼ばれるメタファイルと、そこに記述されるチャンク化されたオーディオ、ビデオ、又は字幕等のメディアデータのアドレス(URL:Uniform Resource Locator)に従い、ストリーミングデータを取得して再生するものである。
 本実施の形態では、チャンク化されたオーディオデータとして、例えば、1フレーム3秒の音源をファイル(セグメントファイル)単位とするオーディオデータが、サーバ装置12に格納されている。
 なお、本実施の形態では、1つの音源(コンテンツ)に対して、256DSDデータ、128DSDデータ、及び、64DSDデータの3種類のサンプリング周波数のDSDデータが、サーバ装置12に格納されているものとして説明するが、1つの音源(コンテンツ)に対して作成するDSDデータのサンプリング周波数の種類は、3種類に限らず、2種類でも、4種類以上でもよい。
 また、サーバ装置12には、コンテンツA、コンテンツB、コンテンツC、・・・・など、複数のコンテンツそれぞれに対して、サンプリング周波数の異なる複数のDSDデータが格納されている。
 再生装置11は、制御部31、通信部32、補間部33、クロック供給部34、デルタシグマ復調器35、アナログLPF36、パワーアンプ37、及びスピーカ38により構成されている。
 制御部31は、不図示の操作部において、サーバ装置12に格納されている所定コンテンツの再生がユーザによって指示されたとき、再生指示されたコンテンツに対応する複数のDSDデータ(サンプリング周波数が異なる複数のDSDデータ)のなかから、ネットワーク24の通信容量に合わせて、いずれか1つのDSDデータを選択し、通信部32を介して、サーバ装置12に要求する。
 また、制御部31は、サーバ装置12に要求したDSDデータのサンプリング周波数を表すサンプリング周波数情報を補間部33に供給する。
 通信部32は、制御部31の制御にしたがい、所定のサンプリング周波数のDSDデータを要求するリクエストをサーバ装置12に送信する。また、通信部32は、リクエストに応じてサーバ装置12から送信されてくるDSDデータを受信し、補間部33に供給する。通信部32は、コンテンツのストリーミングデータとして、DSDデータをMPEG-DASHに従って取得する場合、MPDファイルを先に取得し、取得したMPDファイルに基づくサーバ装置12の所定アドレスにアクセスすることにより、所望のサンプリング周波数のDSDデータを取得する。
 補間部33は、制御部31から供給されるサンプリング周波数情報に基づいて、通信部32から供給されるDSDデータに対して、必要に応じて補間処理を実行し、補間処理後のDSDデータを、デルタシグマ復調器35に供給する。
 図2を参照して、補間部33が行う補間処理を説明する。
 補間部33は、サーバ装置12から取得可能な、サンプリング周波数が異なる複数のDSDデータのうち、サンプリング周波数が最も高いDSDデータ(以下、最高ビットレートのDSDデータという。)に合わせるように、通信部32から供給されたDSDデータを前置補間する。
 例えば、サーバ装置12に格納されている所定期間の256DSDデータが、図2に示されるように「0010101001101010」の16ビットで表される場合、128DSDデータは、例えば「01101010」のような8ビットデータで表され、64DSDデータは、例えば「0110」のような4ビットデータで表される。なお、図2に示した256DSDデータ、128DSDデータ、及び128DSDデータは、ビット数の違いを説明するものであり、同一のオーディオ信号をデジタル化したデータではない。
 補間部33は、通信部32から供給されるDSDデータが、最高ビットレートのDSDデータ以外のDSDデータである場合に、通信部32から供給されたDSDデータを、最高ビットレートのDSDデータのデータ長となるように補間する。
 具体的には、通信部32から供給されたDSDデータが128DSDデータである場合、そのデータ長は、最高ビットレートのDSDデータ(256DSDデータ)の1/2であるから、補間部33は、通信部32から供給された128DSDデータの各ビット値を2回ずつ出力する。
 また、通信部32から供給されたDSDデータが64DSDデータである場合、そのデータ長は、最高ビットレートのDSDデータ(256DSDデータ)の1/4であるから、補間部33は、通信部32から供給された128DSDデータの各ビット値を4回ずつ出力する。
 以上のように、補間部33は、通信部32から供給されたDSDデータを、最高ビットレートのDSDデータとの比率で前置補間して、デルタシグマ復調器35に出力する。通信部32から供給されたDSDデータが最高ビットレートのDSDデータである場合には、補間部33は、供給されたDSDデータをそのまま出力する。
 なお、補間部33は、サンプリング周波数の異なる複数のDSDデータのAD変換処理(デルタシグマ復調処理)を、ソフトウェア実装により実現する場合には必要となるが、ハードウェアにより実現する場合には不要となる。
 DSDデータのAD変換処理をハードウェア実装により実現する場合、選択して受信したDSDデータの信号は、図3に示されるように、次の値が受信されるまで同一データがホールドされる信号となっている。そのため、デルタシグマ復調器35は、選択して受信したDSDデータの信号を、そのまま最高ビットレートのDSDデータ(256DSDデータ)に対応するクロック信号CLK2に基づいてデルタシグマ復調処理すればよい。この場合、デルタシグマ復調器35は、同一データがホールドされた信号を、256DSDデータの場合の1回に対して、64DSDデータであれば4回、128DSDデータであれば2回、読むことになる。
 換言すれば、AD変換処理をハードウェア実装により実現する場合、選択してDSDデータの信号を受信し、デルタシグマ復調器35へ供給する通信部32が、受信したDSDデータを最高ビットレートのDSDデータに合わせる前置補間を行う補間部33としても機能する。
 図1に戻り、クロック供給部34は、最高ビットレートのDSDデータに対応したクロック信号CLK2をデルタシグマ復調器35に供給する。本実施の形態では、クロック供給部34は、256DSDデータのビットレートに対応するクロック信号CLK2を生成し、デルタシグマ復調器35に供給する。256DSDデータのビットレートに対応するクロック信号CLK2のクロック周波数は、約11.2MHzとなる。
 デルタシグマ復調器35は、補間部33から供給される256DSDデータ、128DSDデータ、または64DSDデータを、クロック供給部34から供給されるクロック信号CLK2を用いて復調(デルタシグマ復調)し、復調結果をアナログLPF36に供給する。補間部33から供給されるDSDデータは、256DSDデータ、128DSDデータ、または64DSDデータのいずれであっても、補間部33により256DSDデータのデータ長に変換されたデータとなっている。デルタシグマ復調器35は、例えば、FIR(finite impulse response)のデジタルフィルタで構成することができる。
 アナログLPF(low pass filter)36は、高周波成分を除去するフィルタ処理を施し、フィルタ処理後の信号をパワーアンプ37に出力する。
 パワーアンプ37は、アナログLPF36から出力されるアナログのオーディオ信号を増幅して、スピーカ38に出力する。スピーカ38は、パワーアンプ37から供給されるオーディオ信号を音として出力する。
 図1に示したシステム構成では、サーバ装置12に格納されたコンテンツデータを選択制御して受信するクライアント側の装置構成として、アナログLPF36、パワーアンプ37、スピーカ38などのアナログ出力部も含む構成としているが、アナログ出力部は、デルタシグマ復調処理部と分けて構成してもよい。換言すれば、クライアント側の装置構成として、図1の再生装置11を、サーバ装置12に格納されたコンテンツデータを選択制御して受信し、デルタシグマ復調処理する信号処理装置と、その信号処理装置の出力信号に基づいて音を出力するアナログ出力装置とに分けた構成とすることができる。
<再生処理>
 次に、図4のフローチャートを参照して、再生装置11による再生処理について説明する。図4の処理は、例えば、再生装置11の操作部において、サーバ装置12に格納されている所定コンテンツの再生がユーザによって指示されたとき実行される。
 初めに、ステップS1において、制御部31は、再生指示されたコンテンツのDSDデータであって、サンプリング周波数が異なる複数のDSDデータのなかから、取得するDSDデータを決定し、通信部32に取得を指示する。また、制御部31は、取得するDSDデータのサンプリング周波数情報を補間部33に供給する。
 後述するように、ステップS1の処理は繰り返し実行されるが、ステップS1の初回の処理では、制御部31は、予め定めたサンプリング周波数のDSDデータを、取得するDSDデータとして決定する。そして、ステップS1の2回目以降の処理では、図5を参照して後述するビットレート選択制御処理に基づいて、取得するDSDデータが決定される。
 ステップS2において、通信部32は、制御部31の制御にしたがい、所定のサンプリング周波数のDSDデータを要求するリクエストをサーバ装置12に送信する。また、通信部32は、要求に応じてサーバ装置12から送信されてくるDSDデータを受信(取得)し、補間部33に供給する。
 ステップS3において、補間部33は、制御部31から供給されたDSDデータのサンプリング周波数情報に基づいて、通信部32が受信したDSDデータが、最高ビットレートのDSDデータであるかを判定する。
 ステップS3で、受信したDSDデータが最高ビットレートのDSDデータではないと判定された場合、処理はステップS4に進み、補間部33は、通信部32から供給されたDSDデータを、前置補間により、最高ビットレートのDSDデータのデータ長に補間する。
 ステップS3で、受信したDSDデータが最高ビットレートのDSDデータであると判定された場合、処理はステップS5に進み、補間部33は、通信部32から供給されたDSDデータを、そのまま出力する。
 ステップS6において、デルタシグマ復調器35は、補間部33から供給されたDSDデータを、クロック供給部34から供給されたクロック信号CLK2を用いてデルタシグマ復調する。復調結果は、アナログLPF36に供給される。
 ステップS7において、スピーカ38は、アナログLPF36により高域成分が除去され、パワーアンプ37によって電力増幅されたアナログのオーディオ信号に基づく音を出力する。
 上述したステップS1乃至S7の処理は、例えば、1フレーム3秒の音源に相当するセグメントファイル単位で繰り返し実行される。
<ビットレート選択制御処理>
 次に、図5のフローチャートを参照して、図4のステップS1の一部として実行されるビットレート選択制御処理について説明する。
 初めに、ステップS31において、制御部31は、サーバ装置12からDSDデータを取得した際のネットワーク24の通信容量を推定する。
 ステップS32において、制御部31は、取得するDSDデータのビットレートを変更するかを判定する。例えば、制御部31は、サンプリング周波数が異なる複数のオーディオデータ、即ち、256DSDデータ、128DSDデータ、及び、64DSDデータのそれぞれについて、ネットワーク24の通信容量の閾値を設定しておき、いま受信しているビットレートのDSDデータに対応する通信容量の閾値と、ステップS31の処理により推定された通信容量とを比較することにより、取得するDSDデータのビットレートを変更するかを判定する。
 ステップS32で、取得するDSDデータのビットレートを変更しないと判定された場合、ビットレート選択制御処理は終了する。
 一方、ステップS32で、取得するDSDデータのビットレートを変更すると判定された場合、処理はステップS33に進み、制御部31は、取得するDSDデータを、異なるビットレートのDSDデータに変更し、通信部32に取得を指示する。また、制御部31は、変更後のDSDデータのサンプリング周波数情報を補間部33に供給して、ビットレート選択制御処理を終了する。
 再生装置11は、上述したビットレート選択制御処理を、図4のステップS1の一部として実行する。これにより、ネットワーク24の通信容量に合わせて、データ容量の異なるDSDデータを適宜切り替えて取得し、コンテンツの音として再生出力することができる。
<再生装置によるデルタシグマ復調処理の説明>
 本実施の形態の再生装置11は、サーバ装置12に格納されている、同一コンテンツのビットレートの異なる複数のDSDデータのなかの、最高ビットレートのDSDデータに対応したクロック信号CLK2でデルタシグマ復調を実行するのみで、異なるビットレートのDSDデータを適宜切り替えて受信した場合であっても、コンテンツのスムーズな再生を可能とするものである。この簡潔な手法で、異なるビットレートのDSDデータを適宜切り替えても、コンテンツのスムーズな再生が可能である理由について以下で説明する。
 初めに、図6を参照してDSD信号の特徴について説明する。図6は、64DSD信号の周波数特性を示す図である。
 DSD信号は、デルタシグマ変調器の特性である、量子化ノイズが高域に押し出された特性をもっている。また、DSD信号はサンプリング周波数が高いため、その信号帯域は、64DSD信号の場合で1.2MHzの帯域がある。
 一方、ハイレゾリューション音源のオーディオ信号と言っても、オーディオ信号の帯域は、せいぜい100kHzである。したがって、オーディオ信号の帯域は、図6に示すように、DSD信号全体の1.2MHzの帯域に対しては、DC付近のわずかな帯域に過ぎない。
 図7は、128DSD信号に対して、256DSD信号にデータ長を合わせる前値補間処理を行った処理後の128DSD信号の周波数特性を示す図である。
 前値補間処理を行った処理後の128DSD信号の周波数特性は、図7上側のグラフに示すように、アパーチャ効果により、ナイキスト周波数付近で特性が落ちる周波数特性となる。
 しかしながら、オーディオ信号の帯域を上述したように100kHzまでとして、DSD信号全体のなかから、100kHzまでの帯域を拡大してみると、図7下側のグラフに示すように、その特性は約0.005dBの低下しかない。約0.005dBというレベルは、デルタシグマ復調器35より後段のアナログ処理部で発生するアナログ特性のバラつきよりはるかに小さい。したがって、DSD信号の再生においては、ほとんど影響がないことがわかる。
 また、図7のグラフの特性は一般的に前値補間した場合の特性であるが、128DSD信号を、256DSD信号同等に前値補間してアップサンプリングする場合は、周波数成分はそもそも図7上側のグラフの半分の帯域になる。
 デルタシグマ変調は、図6に示したように、量子化ノイズが高域に大きく押し出されるため、再生装置11では、アナログLPF36を設け、後段のパワーアンプ37やスピーカ38を保護する構成が一般的である。アナログLPF36は、100kHz程度以降の高周波成分をフィルタリングする。したがって、アナログLPF36を有する点から言っても、100kHz以上の高域帯域の特性は、音出力に影響を及ぼすことはない。
 図8は、64DSD信号に対して、256DSD信号にデータ長を合わせる前値補間処理を行った処理後の64DSD信号の周波数特性を示す図である。
 前値補間処理を行った処理後の64DSD信号の周波数特性は、図8上側のグラフに示すように、ナイキスト周波数の半分の周波数付近で特性が落ちる周波数特性となる。
 しかしながら、図7に示した128DSD信号の場合と同様に、100kHzまでの帯域を拡大してみると、図8下側のグラフに示すように、特性は約0.002dBの低下しかない。したがって、この約0.002dBというレベルは、デルタシグマ復調器35より後段のアナログ処理部で発生するアナログ特性のバラつきよりはるかに小さい。
 また、図8のグラフの特性は一般的に前値補間した場合の特性であるが、64DSD信号を、256DSD信号同等に前値補間してアップサンプリングする場合は、周波数成分はそもそも図8上側のグラフの1/4の帯域になる。
 また、アナログLPF36により、100kHz程度以降の高周波成分が除去される点も、上述した128DSD信号における場合と同様であり、100kHz以上の高域帯域の特性は、音出力に影響を及ぼすことはない。
 以上より、64DSD信号及び128DSD信号のいずれにおいても、256DSD信号同等に前値補間したDSD信号の、人間の可聴帯域における信号劣化は無視できるレベルである。したがって、サンプリング周波数の異なるDSD信号を適宜切り替えたとしても、ノイズは発生しない。即ち、サンプリング周波数の異なるDSD信号を適宜切り替えたとしても、連続性をもったまま再生することができ、コンテンツのスムーズな再生が可能となる。
<PCMのオーディオデータとの比較>
 次に、比較のため、PCMのオーディオデータに対して同様の処理を行った場合について説明する。
 図9に示されるように、サンプリング周波数が44.1kHzのPCMデータと、その2倍のサンプリング周波数88.2kHzのPCMデータ、及び、4倍のサンプリング周波数176.4kHzのPCMデータの3種類のPCMストリーミングデータを、ネットワーク24の通信容量に応じて適宜選択し、PCMDAC71が、選択入力されたPCMストリーミングデータを、最高周波数176.4kHzでDA変換する場合について説明する。
 図10は、図7及び図8で示した前置補間処理後のDSD信号の周波数特性と同様の、前置補間処理後のPCM信号の周波数特性を示している。
 前置補間後のPCM信号においても、その周波数特性は、DSD信号と同様に、アパーチャ効果により、高域で低下する特性となる。ただし、PCM信号の場合は、サンプリング周波数がDSD信号と比較して低いため、通常のオーディオ信号の信号帯域である20kHz以下でも無視できないレベル低下が発生する。従って、同一コンテンツのサンプリング周波数が異なるPCMデータを切り替えた場合に、それらが同期してAD変換された信号どうしであっても連続性が無くなりノイズを発生させる場合がある。また、オーディオ帯域の特性が信号によって異なるため切り替えた時の音質も変化してしまう。さらに、PCM信号のADCは、初段でデルタシグマ変調された信号をフィルタリングして生成する手法が一般的である。このADCのフィルタ特性の違いにより、サンプリング周波数が44.1kHz、88.2kHz、または、176.4kHzの信号ではディレイ値が異なる場合が多いので、信号を同期してAD変換したとしても、通常、正しく同時刻の信号にはならない。そのため、切替え前後で信号の連続性が維持できない。
 以上のように、PCMのオーディオデータに対して同様の処理を行った場合には、コンテンツのスムーズな再生は出来ない。
 これに対して、本技術を適用した再生装置11によれば、1つのコンテンツ(同一コンテンツ)に対して予め用意された、サンプリング周波数の異なる複数のDSDデータのうちのサンプリング周波数が最も高いDSDデータ(最高ビットレートのDSDデータ)に合わせて、前置補間処理とデルタシグマ復調処理を行うだけで、サンプリング周波数の異なるDSDデータに切り替えたとしても、ノイズを発生させることがない。また、クロスフェード等による遅延も発生しない。
 従って、簡単な構成で、サンプリング周波数の異なる複数のDSD信号の切り替えを行うことができる。
<コンピュータへの適用例>
 上述した一連の処理は、ハードウェアにより実行することもできるし、ソフトウェアにより実行することもできる。上述した一連の処理をソフトウェアにより実行する場合には、そのソフトウェアを構成するプログラムが、コンピュータにインストールされる。ここで、コンピュータには、専用のハードウェアに組み込まれているコンピュータや、各種のプログラムをインストールすることで、各種の機能を実行することが可能な、例えば汎用のパーソナルコンピュータなどが含まれる。
 図11は、上述した一連の処理をプログラムにより実行するコンピュータのハードウェアの構成例を示すブロック図である。
 コンピュータにおいて、CPU101,ROM(Read Only Memory)102,RAM(Random Access Memory)103は、バス104により相互に接続されている。
 バス104には、さらに、入出力インタフェース105が接続されている。入出力インタフェース105には、入力部106、出力部107、記憶部108、通信部109、及びドライブ110が接続されている。
 入力部106は、キーボード、マウス、マイクロホンなどよりなる。出力部107は、ディスプレイ、スピーカなどよりなる。記憶部108は、ハードディスクや不揮発性のメモリなどよりなる。通信部109は、ネットワークインタフェースなどよりなる。ドライブ110は、磁気ディスク、光ディスク、光磁気ディスク、或いは半導体メモリなどのリムーバブル記録媒体111を駆動する。
 以上のように構成されるコンピュータでは、CPU101が、例えば、記憶部108に記憶されているプログラムを、入出力インタフェース105及びバス104を介して、RAM103にロードして実行することにより、上述したビットレート選択制御処理やデルタシグマ復調処理などの処理が行われる。
 コンピュータでは、プログラムは、リムーバブル記録媒体111をドライブ110に装着することにより、入出力インタフェース105を介して、記憶部108にインストールすることができる。また、プログラムは、ローカルエリアネットワーク、インターネット、デジタル衛星放送といった、有線または無線の伝送媒体を介して、通信部109で受信し、記憶部108にインストールすることができる。その他、プログラムは、ROM102や記憶部108に、あらかじめインストールしておくことができる。
 なお、コンピュータが実行するプログラムは、本明細書で説明する順序に沿って時系列に処理が行われるプログラムであっても良いし、並列に、あるいは呼び出しが行われたとき等の必要なタイミングで処理が行われるプログラムであっても良い。
 本技術の実施の形態は、上述した実施の形態に限定されるものではなく、本技術の要旨を逸脱しない範囲において種々の変更が可能である。
 上述した実施の形態では、サンプリング周波数の異なる複数のDSDデータの送受信方式として、MPEG-DASHの規格に準拠した方式を採用したが、勿論、その他の方式を採用してもよい。
 また、上述した実施の形態では、サーバ装置12に格納されたサンプリング周波数の異なる複数のDSDデータは、同期して生成されたデータであるとして説明した。しかし、同期していないことにより、仮にノイズが発生したとしても、そのノイズは人間の可聴帯域で無視できるレベルであると考えられるため、サンプリング周波数が同一であれば、必ずしも同期している必要はない。
 上述した実施の形態では、デルタシグマ復調器35の動作クロックを最高ビットレートに対応するクロック周波数で統一的に動作させるようにしたが、最高ビットレートより低いビットレートのDSDデータをデルタシグマ復調する場合は、デルタシグマ復調器35の動作クロックを1/2、1/4に下げて復調処理を行うこともできる。この場合、補間部33は、入力されたDSDデータを前置補間せずに、そのままデルタシグマ復調器35に出力する。
 また、デルタシグマ復調器35は、消費電力の低減を目的として、動作クロックを下げて動作する場合もある。
 本技術を適用した構成として、1つの機能をネットワークを介して複数の装置で分担、共同して処理するクラウドコンピューティングの構成をとることができる。
 上述のフローチャートで説明した各ステップは、1つの装置で実行する他、複数の装置で分担して実行することができる。さらに、1つのステップに複数の処理が含まれる場合には、その1つのステップに含まれる複数の処理は、1つの装置で実行する他、複数の装置で分担して実行することができる。
 本明細書に記載された効果はあくまで例示であって限定されるものではなく、本明細書に記載されたもの以外の効果があってもよい。
 本技術は以下のような構成も取ることができる。
(1)
 1つのオーディオ信号に対して複数のサンプリング周波数でデルタシグマ変調して得られた複数のデジタルオーディオ信号のなかから選択された、所定のサンプリング周波数の前記デジタルオーディオ信号を取得する取得部と、
 取得した前記デジタルオーディオ信号のサンプリング周波数が、デルタシグマ復調器の動作クロックより低い周波数のとき、取得した前記デジタルオーディオ信号に対して前置補間処理を行う補間部と
 を備える信号処理装置。
(2)
 前記複数のサンプリング周波数それぞれは、前記複数のサンプリング周波数の他のサンプリング周波数に対し、2のべき乗の関係にある周波数である
 前記(1)に記載の信号処理装置。
(3)
 前記複数のサンプリング周波数のなかの最高サンプリング周波数に対応する動作クロックでデルタシグマ復調する前記デルタシグマ復調器をさらに備える
 前記(1)または(2)に記載の信号処理装置。
(4)
 前記補間部は、取得した前記デジタルオーディオ信号のサンプリング周波数と、前記複数のサンプリング周波数のなかの最高サンプリング周波数との比率で、取得した前記デジタルオーディオ信号に対して前置補間処理を行う
 前記(1)乃至(3)のいずれかに記載の信号処理装置。
(5)
 前記取得部は、MPEG-DASHの規格に準拠した前記デジタルオーディオ信号を取得する
 前記(1)乃至(4)のいずれかに記載の信号処理装置。
(6)
 前記取得部が取得する前記デジタルオーディオ信号を、サンプリング周波数が異なる前記複数のデジタルオーディオ信号のなかから、ネットワークの通信容量に応じて決定する取得制御部をさらに備える
 前記(1)乃至(5)のいずれかに記載の信号処理装置。
(7)
 信号処理装置が、
 1つのオーディオ信号に対して複数のサンプリング周波数でデルタシグマ変調して得られた複数のデジタルオーディオ信号のなかから選択された、所定のサンプリング周波数の前記デジタルオーディオ信号を取得し、
 取得した前記デジタルオーディオ信号のサンプリング周波数が、デルタシグマ復調器の動作クロックより低い周波数のとき、取得した前記デジタルオーディオ信号に対して前置補間処理を行う
 ステップを含む信号処理方法。
(8)
 コンピュータに、
 1つのオーディオ信号に対して複数のサンプリング周波数でデルタシグマ変調して得られた複数のデジタルオーディオ信号のなかから選択された、所定のサンプリング周波数の前記デジタルオーディオ信号を取得し、
 取得した前記デジタルオーディオ信号のサンプリング周波数が、デルタシグマ復調器の動作クロックより低い周波数のとき、取得した前記デジタルオーディオ信号に対して前置補間処理を行う
 ステップを含む処理を実行させるためのプログラム。
 1 再生システム, 11 再生装置, 12 サーバ装置, 31 制御部, 32 通信部, 33 補間部, 34 クロック供給部, 35 デルタシグマ(△Σ)復調器, 101 CPU, 102 ROM, 103 RAM, 106 入力部, 107 出力部, 108 記憶部, 109 通信部, 110 ドライブ

Claims (8)

  1.  1つのオーディオ信号に対して複数のサンプリング周波数でデルタシグマ変調して得られた複数のデジタルオーディオ信号のなかから選択された、所定のサンプリング周波数の前記デジタルオーディオ信号を取得する取得部と、
     取得した前記デジタルオーディオ信号のサンプリング周波数が、デルタシグマ復調器の動作クロックより低い周波数のとき、取得した前記デジタルオーディオ信号に対して前置補間処理を行う補間部と
     を備える信号処理装置。
  2.  前記複数のサンプリング周波数それぞれは、前記複数のサンプリング周波数の他のサンプリング周波数に対し、2のべき乗の関係にある周波数である
     請求項1に記載の信号処理装置。
  3.  前記複数のサンプリング周波数のなかの最高サンプリング周波数に対応する動作クロックでデルタシグマ復調する前記デルタシグマ復調器をさらに備える
     請求項1に記載の信号処理装置。
  4.  前記補間部は、取得した前記デジタルオーディオ信号のサンプリング周波数と、前記複数のサンプリング周波数のなかの最高サンプリング周波数との比率で、取得した前記デジタルオーディオ信号に対して前置補間処理を行う
     請求項1に記載の信号処理装置。
  5.  前記取得部は、MPEG-DASHの規格に準拠した前記デジタルオーディオ信号を取得する
     請求項1に記載の信号処理装置。
  6.  前記取得部が取得する前記デジタルオーディオ信号を、サンプリング周波数が異なる前記複数のデジタルオーディオ信号のなかから、ネットワークの通信容量に応じて決定する取得制御部をさらに備える
     請求項1に記載の信号処理装置。
  7.  信号処理装置が、
     1つのオーディオ信号に対して複数のサンプリング周波数でデルタシグマ変調して得られた複数のデジタルオーディオ信号のなかから選択された、所定のサンプリング周波数の前記デジタルオーディオ信号を取得し、
     取得した前記デジタルオーディオ信号のサンプリング周波数が、デルタシグマ復調器の動作クロックより低い周波数のとき、取得した前記デジタルオーディオ信号に対して前置補間処理を行う
     ステップを含む信号処理方法。
  8.  コンピュータに、
     1つのオーディオ信号に対して複数のサンプリング周波数でデルタシグマ変調して得られた複数のデジタルオーディオ信号のなかから選択された、所定のサンプリング周波数の前記デジタルオーディオ信号を取得し、
     取得した前記デジタルオーディオ信号のサンプリング周波数が、デルタシグマ復調器の動作クロックより低い周波数のとき、取得した前記デジタルオーディオ信号に対して前置補間処理を行う
     ステップを含む処理を実行させるためのプログラム。
PCT/JP2016/065680 2015-06-10 2016-05-27 信号処理装置、信号処理方法、およびプログラム WO2016199596A1 (ja)

Priority Applications (4)

Application Number Priority Date Filing Date Title
US15/578,406 US10861471B2 (en) 2015-06-10 2016-05-27 Signal processing apparatus, signal processing method, and program
CN201680032203.6A CN107615379B (zh) 2015-06-10 2016-05-27 信号处理装置、信号处理方法和程序
EP16807303.9A EP3309781B1 (en) 2015-06-10 2016-05-27 Signal processing device, signal processing method, and program
JP2017523577A JP6807031B2 (ja) 2015-06-10 2016-05-27 信号処理装置、信号処理方法、およびプログラム

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP2015117627 2015-06-10
JP2015-117627 2015-06-10

Publications (1)

Publication Number Publication Date
WO2016199596A1 true WO2016199596A1 (ja) 2016-12-15

Family

ID=57503536

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/JP2016/065680 WO2016199596A1 (ja) 2015-06-10 2016-05-27 信号処理装置、信号処理方法、およびプログラム

Country Status (5)

Country Link
US (1) US10861471B2 (ja)
EP (1) EP3309781B1 (ja)
JP (1) JP6807031B2 (ja)
CN (1) CN107615379B (ja)
WO (1) WO2016199596A1 (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2018198788A1 (ja) 2017-04-26 2018-11-01 ソニー株式会社 信号処理装置、信号処理方法、およびプログラム
WO2019009082A1 (ja) 2017-07-05 2019-01-10 ソニー株式会社 信号処理装置、信号処理方法、および、プログラム

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP3309781B1 (en) * 2015-06-10 2023-10-04 Sony Group Corporation Signal processing device, signal processing method, and program
CN109459612A (zh) * 2019-01-09 2019-03-12 上海艾为电子技术股份有限公司 数字音频信号的采样频率的检测方法及装置
CN110941461B (zh) * 2019-11-26 2023-08-04 杭州皓智天诚信息科技有限公司 一种业务处理软件的参数配置终端
US11295758B2 (en) * 2020-03-20 2022-04-05 Seagate Technology Llc Trusted listening

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH06180599A (ja) * 1992-10-02 1994-06-28 Hudson Soft Co Ltd コンピュータ装置
JPH1065544A (ja) * 1996-08-22 1998-03-06 Sony Corp ディジタル信号処理装置
JP2000174633A (ja) * 1998-12-01 2000-06-23 Matsushita Electric Ind Co Ltd 音声制御装置、音声制御方法、記録媒体、それを用いたナビゲーションシステムおよびナビゲーション装置、並びにそれを搭載した車輌
JP2002064384A (ja) * 2000-08-22 2002-02-28 Sony Corp デルタシグマ変調器、デジタル信号処理装置及び方法

Family Cites Families (49)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4626827A (en) * 1982-03-16 1986-12-02 Victor Company Of Japan, Limited Method and system for data compression by variable frequency sampling
NL8203599A (nl) * 1982-09-17 1984-04-16 Philips Nv Hoofdeinde en ontvanger voor een signaaldistributiesysteem.
US5034962A (en) * 1988-07-01 1991-07-23 Oki Electric Industry Co., Ltd. Voice-band signal processor
DE69116167D1 (de) * 1990-11-27 1996-02-15 Gordon M Jacobs Digitaler datenumsetzer
US5196850A (en) * 1991-11-13 1993-03-23 Crystal Semiconductor Fourth order digital delta-sigma modulator
JP2842725B2 (ja) * 1992-02-17 1999-01-06 日本電気株式会社 ディジタル・アナログ変換器
CA2107314C (en) 1992-09-30 2001-04-17 Katsunori Takahashi Computer system
US5963160A (en) 1993-09-13 1999-10-05 Analog Devices, Inc. Analog to digital conversion using nonuniform sample rates
US5712635A (en) * 1993-09-13 1998-01-27 Analog Devices Inc Digital to analog conversion using nonuniform sample rates
US5424739A (en) * 1993-12-21 1995-06-13 At&T Corp. Device and method for digitally shaping the quantization noise of an N-bit digital signal, such as for digital-to-analog conversion
JP3339315B2 (ja) 1996-07-31 2002-10-28 ソニー株式会社 ディジタル信号処理装置、記録装置及び再生装置
US5903872A (en) * 1997-10-17 1999-05-11 Dolby Laboratories Licensing Corporation Frame-based audio coding with additional filterbank to attenuate spectral splatter at frame boundaries
US6317468B1 (en) * 1998-06-17 2001-11-13 Rockwell Collins IF exciter for radio transmitter
JP4209035B2 (ja) * 1999-05-28 2009-01-14 株式会社ルネサステクノロジ Δςモジュレータ、daコンバータ、および、adコンバータ
US6701297B2 (en) * 2001-03-02 2004-03-02 Geoffrey Layton Main Direct intermediate frequency sampling wavelet-based analog-to-digital and digital-to-analog converter
JP2003060509A (ja) * 2001-08-10 2003-02-28 Teac Corp ディジタル信号のエラー補償装置及び方法
US7225135B2 (en) * 2002-04-05 2007-05-29 Lectrosonics, Inc. Signal-predictive audio transmission system
US7305483B2 (en) * 2002-04-25 2007-12-04 Yahoo! Inc. Method for the real-time distribution of streaming data on a network
US7136430B2 (en) 2003-03-31 2006-11-14 Nortel Networks Limited Digital receiver and method
TW595113B (en) * 2003-05-28 2004-06-21 Realtek Semiconductor Corp Sample rate converting device and method, and application thereof
US6992606B2 (en) * 2003-07-09 2006-01-31 Texas Instruments Incorporated Method and circuit for multi-standard sigma-delta modulator
WO2006012493A1 (en) * 2004-07-22 2006-02-02 Auburn University High-order delta-sigma noise shaping in direct digital frequency synthesis
US7243068B2 (en) * 2004-09-10 2007-07-10 Soliloquy Learning, Inc. Microphone setup and testing in voice recognition software
WO2006070566A1 (ja) * 2004-12-28 2006-07-06 Matsushita Electric Industrial Co., Ltd. 音声合成方法および情報提供装置
US7109906B1 (en) * 2005-04-29 2006-09-19 Freescale Semiconductor, Inc. NICAM encoder featuring synchronization of a NICAM processor with front-end input and output sections
US7183956B1 (en) * 2005-08-10 2007-02-27 Northrop Grumman Corporation High speed digital delta-sigma modulator with integrated upsampler
JP2007150737A (ja) * 2005-11-28 2007-06-14 Sony Corp 音声信号ノイズ低減装置及び方法
US7688687B2 (en) * 2005-11-28 2010-03-30 Panasonic Corporation Timing extractor, and information playback apparatus and DVD device using the timing extractor
CN101089951B (zh) * 2006-06-16 2011-08-31 北京天籁传音数字技术有限公司 频带扩展编码方法及装置和解码方法及装置
CN101097716A (zh) * 2006-06-26 2008-01-02 索尼株式会社 数字信号处理设备、处理方法和再现设备
KR100789784B1 (ko) * 2006-10-11 2007-12-28 한국전자통신연구원 스케일러블 대역폭을 지원하는 수신 장치 및 그 방법
US7463170B2 (en) 2006-11-30 2008-12-09 Broadcom Corporation Method and system for processing multi-rate audio from a plurality of audio processing sources
US7912728B2 (en) * 2006-11-30 2011-03-22 Broadcom Corporation Method and system for handling the processing of bluetooth data during multi-path multi-rate audio processing
US8094046B2 (en) * 2007-03-02 2012-01-10 Sony Corporation Signal processing apparatus and signal processing method
US8212700B2 (en) * 2009-07-09 2012-07-03 Stellamar Llc Delta-sigma-delta modulator
US7978113B2 (en) * 2009-09-10 2011-07-12 National Semiconductor Corporation Analog-to-digital converter having output data with reduced bit-width and related system and method
KR101826331B1 (ko) * 2010-09-15 2018-03-22 삼성전자주식회사 고주파수 대역폭 확장을 위한 부호화/복호화 장치 및 방법
US8965545B2 (en) * 2010-09-30 2015-02-24 Google Inc. Progressive encoding of audio
US10263628B2 (en) * 2011-06-27 2019-04-16 Syntropy Systems, Llc Apparatuses and methods for converting fluctuations in periodicity of an input signal into fluctuations in amplitude of an output signal
WO2013088173A1 (en) * 2011-12-14 2013-06-20 Wolfson Microelectronics Plc Data transfer
US8773296B1 (en) * 2012-09-21 2014-07-08 Pmc-Sierra Us, Inc. Interleaved digital to analog conversion
US8952837B2 (en) * 2013-02-28 2015-02-10 Broadcom Corporation Multi-rate sigma delta digital-to-analog converter
US20140280784A1 (en) * 2013-03-15 2014-09-18 General Instrument Corporation File Transfer Based Upon Streaming Format
US9134952B2 (en) * 2013-04-03 2015-09-15 Lg Electronics Inc. Terminal and control method thereof
KR101922108B1 (ko) * 2013-04-22 2018-11-26 삼성전자주식회사 병렬 구조의 디지털 무선 송신기 및 이를 포함하는 무선 통신 시스템
US20180082703A1 (en) * 2015-04-30 2018-03-22 Longsand Limited Suitability score based on attribute scores
EP3309781B1 (en) * 2015-06-10 2023-10-04 Sony Group Corporation Signal processing device, signal processing method, and program
KR20170034154A (ko) * 2015-09-18 2017-03-28 삼성전자주식회사 콘텐츠 제공 방법 및 이를 수행하는 전자 장치
US10367522B2 (en) * 2016-11-21 2019-07-30 MY Tech, LLC High efficiency power amplifier architectures for RF applications

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH06180599A (ja) * 1992-10-02 1994-06-28 Hudson Soft Co Ltd コンピュータ装置
JPH1065544A (ja) * 1996-08-22 1998-03-06 Sony Corp ディジタル信号処理装置
JP2000174633A (ja) * 1998-12-01 2000-06-23 Matsushita Electric Ind Co Ltd 音声制御装置、音声制御方法、記録媒体、それを用いたナビゲーションシステムおよびナビゲーション装置、並びにそれを搭載した車輌
JP2002064384A (ja) * 2000-08-22 2002-02-28 Sony Corp デルタシグマ変調器、デジタル信号処理装置及び方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
MITSUHIRO HIRABAYASHI: "Web Rendo no Media Gijutsu 4 Jisedai Doga Haishin Gijutsu 'MPEG- DASH' Gijutsu Gaiyo to Hyojunka.Kanren Gijutsu Doko", THE JOURNAL OF THE INSTITUTE OF IMAGE INFORMATION AND TELEVISION ENGINEERS, vol. 67, no. 2, 1 February 2013 (2013-02-01), pages 109 - 115, XP055503325 *

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2018198788A1 (ja) 2017-04-26 2018-11-01 ソニー株式会社 信号処理装置、信号処理方法、およびプログラム
WO2019009082A1 (ja) 2017-07-05 2019-01-10 ソニー株式会社 信号処理装置、信号処理方法、および、プログラム
KR20200026815A (ko) 2017-07-05 2020-03-11 소니 주식회사 신호 처리 장치, 신호 처리 방법, 및 프로그램
US10917108B2 (en) 2017-07-05 2021-02-09 Sony Corporation Signal processing apparatus and signal processing method

Also Published As

Publication number Publication date
CN107615379B (zh) 2021-12-24
EP3309781A1 (en) 2018-04-18
EP3309781B1 (en) 2023-10-04
US10861471B2 (en) 2020-12-08
US20180211675A1 (en) 2018-07-26
CN107615379A (zh) 2018-01-19
JP6807031B2 (ja) 2021-01-06
EP3309781A4 (en) 2018-12-05
JPWO2016199596A1 (ja) 2018-03-29

Similar Documents

Publication Publication Date Title
JP6807031B2 (ja) 信号処理装置、信号処理方法、およびプログラム
JP5092580B2 (ja) デジタル信号処理装置、デジタル信号処理方法及びデジタル信号処理プログラム
KR20060125678A (ko) 버퍼 관리 시스템, 디지털 오디오 수신기, 헤드폰들,확성기, 버퍼 관리 방법
US20180218745A1 (en) Direct Mapping
JP4567412B2 (ja) 音声再生機および音声再生方法
WO2018198788A1 (ja) 信号処理装置、信号処理方法、およびプログラム
JP3327116B2 (ja) 信号処理装置、信号記録装置及び信号再生装置
US10200053B2 (en) Magnitude compensation technique for processing single-bit wide data
CN107112979B (zh) 具有在高解析音频的前响应频率下的群延迟的非线性滤波器
JP7140119B2 (ja) 信号処理装置、信号処理方法、および、プログラム
JP2988894B2 (ja) Dvd−ビデオ標準に互換するディジタルオーディオ処理システム
JP4984178B2 (ja) 高域信号補間装置及び高域信号補間方法
JP2005135562A (ja) データ再生装置
US20180217807A1 (en) Single-bit volume control
JP2003208186A (ja) 信号処理装置、信号処理方法
JP3765413B2 (ja) 情報符号化装置および方法、情報復号装置および方法、記録媒体、並びにプログラム
JPH1051311A (ja) ディジタル信号処理装置、記録装置及び再生装置
JP2015099964A (ja) 信号処理装置、信号処理方法及びコンピュータプログラム
JP3821151B2 (ja) 1ビットオーディオ信号生成装置及び1ビットオーディオ信号生成方法
Dawson The magic of DACs
JP2002093055A (ja) 信号処理装置、信号処理方法、及び光ディスク再生装置
JP2005100598A (ja) 信号処理方法及び装置
JP2010128316A (ja) オーディオ信号処理装置

Legal Events

Date Code Title Description
121 Ep: the epo has been informed by wipo that ep was designated in this application

Ref document number: 16807303

Country of ref document: EP

Kind code of ref document: A1

ENP Entry into the national phase

Ref document number: 2017523577

Country of ref document: JP

Kind code of ref document: A

WWE Wipo information: entry into national phase

Ref document number: 15578406

Country of ref document: US

NENP Non-entry into the national phase

Ref country code: DE