WO2011004687A1 - 音声信号処理装置、当該音声信号処理装置を備えたオーディオ装置、オーディオビジュアル装置、映像表示装置、情報処理装置、音声信号処理方法、プログラム、及び、当該プログラムを記録した記録媒体 - Google Patents

音声信号処理装置、当該音声信号処理装置を備えたオーディオ装置、オーディオビジュアル装置、映像表示装置、情報処理装置、音声信号処理方法、プログラム、及び、当該プログラムを記録した記録媒体 Download PDF

Info

Publication number
WO2011004687A1
WO2011004687A1 PCT/JP2010/060265 JP2010060265W WO2011004687A1 WO 2011004687 A1 WO2011004687 A1 WO 2011004687A1 JP 2010060265 W JP2010060265 W JP 2010060265W WO 2011004687 A1 WO2011004687 A1 WO 2011004687A1
Authority
WO
WIPO (PCT)
Prior art keywords
audio signal
digital audio
audio
signal processing
digital
Prior art date
Application number
PCT/JP2010/060265
Other languages
English (en)
French (fr)
Inventor
善光 村橋
Original Assignee
シャープ株式会社
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by シャープ株式会社 filed Critical シャープ株式会社
Publication of WO2011004687A1 publication Critical patent/WO2011004687A1/ja

Links

Images

Classifications

    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03GCONTROL OF AMPLIFICATION
    • H03G7/00Volume compression or expansion in amplifiers
    • H03G7/007Volume compression or expansion in amplifiers of digital or coded signals
    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03GCONTROL OF AMPLIFICATION
    • H03G11/00Limiting amplitude; Limiting rate of change of amplitude ; Clipping in general
    • H03G11/008Limiting amplitude; Limiting rate of change of amplitude ; Clipping in general of digital or coded signals
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B20/00Signal processing not specific to the method of recording or reproducing; Circuits therefor
    • G11B20/00007Time or data compression or expansion
    • G11B2020/00014Time or data compression or expansion the compressed signal being an audio signal

Definitions

  • the present invention relates to an audio signal processing device capable of suppressing abnormal noise caused by aliasing distortion that occurs when a digital audio signal is clipped, an audio device including the audio signal processing device, an audio visual device, a video display device, an information processing device, The present invention relates to an audio signal processing method, a program, and a recording medium on which the program is recorded.
  • Patent Document 1 discloses a signal processing device that can suppress abnormal noise generated when various processing is performed on an audio signal and output as audio.
  • the signal processing apparatus of Patent Document 1 includes a digital limiter that limits the amplitude after sampling and digitizing the analog signal S1, and a digital filter that blocks the harmonic component of the output signal S2 from the digital limiter.
  • the applicant of Patent Document 1 suppresses the generation of abnormal noise due to so-called aliasing distortion by setting the sampling frequency F2 of the digital filter to a frequency more than twice the sampling frequency F1 of the preceding digital limiter. Insist.
  • FIG. 6 is a functional block diagram for explaining an example of a digital audio signal processing system in a television apparatus compatible with digital terrestrial broadcasting.
  • the digital audio signal processing system 100 performs various processes on an input digital audio signal and outputs audio.
  • the digital audio signal processing system 100 includes a digital audio signal processing unit 101, a digital clipper (limiter) 102, a class D amplification unit 103, an LPF (low-pass filter) 104, and a speaker 105.
  • the digital audio signal processing unit 101 performs volume adjustment processing and speaker frequency correction processing on the input digital audio signal and outputs the result to the digital clipper 102.
  • the digital clipper 102 is a simple circuit that limits (suppresses) the output amplitude so as not to output more than necessary amplitude, or performs adjustment to obtain a predetermined output with a predetermined distortion rate.
  • the digital clipper 102 clips (limits) the amplitude (value) of the digital audio signal that has been subjected to various types of processing to a first threshold value or more and a second threshold value or less, and outputs the result to the class D amplification unit 103.
  • the class D amplification unit 103 amplifies the digital audio signal clipped by the digital clipper 102 and outputs the amplified signal to the LPF 104.
  • the LPF 104 attenuates and blocks a frequency component equal to or higher than a predetermined value of the digital audio signal amplified by the class D amplification unit 103 and outputs the attenuated frequency component to the speaker 105.
  • the digital audio signal processing system 100 of full digital processing when the digital clipper 102 clips, for example, a sinusoidal digital audio signal, abnormal noise peculiar to digital processing, that is, abnormal noise due to so-called aliasing distortion of the digital audio signal is heard.
  • the digital audio signal processing system 100 outputs a digital audio signal (frequency sweep) whose frequency is continuously changed from a low frequency to a high frequency, the output audio frequency changes from a low frequency to a high frequency.
  • an abnormal sound in which the frequency of the output sound changes from a high frequency to a low frequency may be heard.
  • FIG. 7A is a diagram schematically showing a waveform (sine wave) of a digital audio signal having a sampling frequency f s clipped by the digital clipper 102.
  • the digital clipper 102 clips the amplitude of the digital audio signal between the first threshold value and the second threshold value.
  • FIG. 7 (B) shows a digital clipper 102 is illustrated FIG frequency spectrum in the case of clipping the digital audio signal having the sampling frequency f s.
  • the digital clipper 102 clips the digital audio signal having the sampling frequency f s
  • the frequency spectrum of the harmonic component appears.
  • X1 represents a frequency spectrum of the fundamental wave component of the digital audio signal having the sampling frequency f s
  • X2 indicates the frequency spectrum of the harmonic component.
  • these frequency spectra X1 and X2 are indicated by dotted lines generated by folding like a mirror with the sampling frequency f s / 2 of the digital audio signal as the center.
  • a frequency spectrum (frequency spectrum due to aliasing) Y appears.
  • FIG. 7B it is assumed that the frequency band below the sampling frequency f s / 2 (Nyquist frequency) of the digital audio signal is the audible band.
  • the frequency spectrum Y folded around the sampling frequency f s / 2 is used. Is mixed in a frequency band (audible band) below the Nyquist frequency (see dotted circle).
  • the frequency spectrum indicated by the solid line see X1 and X2
  • the folded frequency spectrum Y indicated by the dotted line shifts to the left side (enters due to the audible band).
  • the digital limiter that limits (clips) the amplitude after sampling and digitizing the analog signal S1 executes the amplitude limitation of the input signal S1, and after the clipping, Output the digital signal to the digital filter.
  • the digital filter samples the digital signal from the digital limiter at a frequency that is at least twice the sampling frequency of the digital limiter.
  • clipping is performed by the digital limiter, a frequency spectrum generated by folding harmonic components may be mixed in the audible band. Therefore, the digital signal processing device of Patent Document 1 cannot suppress the generation of abnormal noise due to aliasing distortion.
  • the present invention has been made in view of such circumstances, and an audio signal processing device capable of suppressing abnormal noise caused by aliasing distortion that occurs when a digital audio signal is clipped by a digital clipper, and an audio including the audio signal processing device.
  • An object is to provide a device, an audiovisual device, a video display device, an information processing device, an audio signal processing method, a program, and a recording medium on which the program is recorded.
  • the first technical means includes an oversampling converter that generates and outputs a digital audio signal having a sampling frequency higher than the sampling frequency of the digital audio signal based on the input digital audio signal, and the digital audio output by the oversampling converter
  • An audio signal processing apparatus comprising a waveform limiter for limiting a signal value.
  • the second technical means is characterized in that the waveform limiter of the first technical means limits the value of the digital audio signal output from the oversampling converter to a value not less than a first threshold value and not more than a second threshold value.
  • the third technical means is characterized in that the sampling frequency of the digital audio signal generated by the oversampling converter of the first or second technical means is at least twice the maximum frequency of the audible band.
  • the fourth technical means is an audio apparatus comprising the audio signal processing device of any one of the first to third technical means.
  • the fifth technical means is an audiovisual apparatus comprising the audio signal processing device of any one of the first to third technical means.
  • the sixth technical means is a video display device comprising the audio signal processing device of any one of the first to third technical means.
  • the seventh technical means is an information processing apparatus comprising the audio signal processing device of any one of the first to third technical means.
  • the eighth technical means generates a digital audio signal having a sampling frequency higher than the sampling frequency of the digital audio signal based on the input digital audio signal, and limits the value of the generated digital audio signal
  • the ninth technical means is characterized in that the step of limiting the value of the generated digital audio signal of the eighth technical means limits the value to a first threshold value or more and a second threshold value or less.
  • the tenth technical means is a program that causes a computer to execute the audio signal processing method of the eighth or ninth technical means.
  • the eleventh technical means is a computer-readable recording medium recording the program of the tenth technical means.
  • FIG. 1 is a diagram for explaining a aliasing suppression method by an audio signal processing device according to the present invention.
  • the audio signal processing apparatus according to the present invention generates (upsampling) a digital audio signal having a sampling frequency f os higher than the sampling frequency f s of the digital audio signal based on the input digital audio signal. Then, the amplitude (value) of the digital audio signal after upsampling is limited (clipped) to a value not less than the first threshold value and not more than the second threshold value.
  • the frequency spectrum of the digital audio signal after up-sampling appears as shown by the solid line in FIG. 1 by the clip of the digital audio signal after up-sampling, as described in FIG. Note that the sampling frequency f os / 2 of the digital audio signal after upsampling is on the right side of the sampling frequency f s / 2 of the digital audio signal before upsampling.
  • the frequency spectrum of the digital audio signal after upsampling indicated by a solid line is folded back like a matching mirror around the sampling frequency f os / 2 (see the two-dot chain line in the figure).
  • the frequency spectrum generated by the folded distortion shown by the two-dot chain line does not enter the frequency band (audible band) of the sampling frequency f s / 2 or less, so that no abnormal noise can be heard.
  • FIG. 2 is a functional block diagram illustrating an example of a digital audio signal processing system provided in a terrestrial digital broadcast-compatible television device to which the audio signal processing device according to the present invention is applied.
  • the digital audio signal processing system 1 includes a preprocessing unit 10, a full digital amplifier 20, and an audio output unit 30.
  • the preprocessing unit 10 includes an antenna 11, a reception demodulation unit 12, a digital audio signal processing unit 13, and an I2S (Inter-IC Sound) interface 14.
  • I2S Inter-IC Sound
  • the reception demodulation unit 12 receives a terrestrial digital broadcast signal via the antenna 11 and executes demodulation processing. Then, the reception demodulation unit 12 outputs the digital audio signal included in the terrestrial digital broadcast signal to the digital audio signal processing unit 13.
  • the digital audio signal processing unit 13 performs volume adjustment processing and speaker frequency correction processing on the received digital audio signal, and outputs the result to the I2S interface 14.
  • the I2S interface 14 has a connection interface function with the full digital amplifier 20 and executes three-wire serial transmission of LRCK, BCK, and DATA.
  • LRCK is a clock frequency of 48 kHz. LRCK oscillates at the same frequency as the sampling frequency f s (sampling rate) of the digital audio signal. Actually, jitter due to broadcast waves and the state of the receiver is included in the LRCK, and therefore an error component ( ⁇ ⁇ ) is included around 48 kHz.
  • BCK is a clock frequency that is a constant multiple of LRCK, and a clock frequency such as 64 times, 48 times, or 32 times may be selected.
  • the full digital amplifier 20 includes an I2S interface 21, an asynchronous SRC 22, an oversampling converter (OSC) 23, a clipper 24, a ⁇ modulator 25, a class D amplification unit 26, and a clock generator 27.
  • the audio signal processing apparatus X according to the present invention includes an oversampling converter 23 and a clipper 24.
  • the I2S interface 21 has a connection interface function with the preprocessing unit 10, receives a digital audio signal or the like output from the I2S interface 14 of the preprocessing unit 10, and outputs it to the asynchronous SRC 22.
  • Asynchronous SRC (Sampling Rate Converter) 22 converts a digital audio signal having an error in sampling frequency into a digital audio signal without error, and outputs the digital audio signal to oversampling converter 23.
  • the asynchronous SRC 22 converts the frequency of the digital audio signal into a frequency of 48 kHz, specifically, a frequency 1/256 of the oscillation frequency (12.288 MHz) of the clock generator 27.
  • the digital audio signal includes Lch and Rch audio signals.
  • the oversampling converter 23 is also called an interpolator.
  • the oversampling converter 23 generates a digital audio signal having a sampling frequency f os higher than the sampling frequency f s of the digital audio signal based on the digital audio signal output from the asynchronous SRC 22 (upsampling), and outputs the digital audio signal to the clipper 24.
  • a digital audio signal having a sampling frequency of 256 times 48 kHz (12.288 MHz) is generated from a digital audio signal having a sampling frequency of 48 kHz.
  • the change of the sampling frequency fos is arbitrary. Details of the oversampling converter 23 will be described later.
  • the clipper 24 is a waveform limiter also called a limiter or a slicer.
  • the clipper 24 is a simple circuit for limiting the value (amplitude) of the digital audio signal output from the oversampling converter 23.
  • the amplitude (value) of the digital audio signal output from the oversampling converter 23 is clipped (restricted) to a value equal to or higher than the first threshold value and equal to or lower than the second threshold value, and is output to the ⁇ modulator 25.
  • the first threshold value and the second threshold value can be freely adjusted. Note that the first threshold value ⁇ the second threshold value.
  • the ⁇ modulator 25 performs a delta sigma modulation process on the digital audio signal output from the clipper 24 to generate a 1-bit digital audio signal, and outputs the 1-bit digital audio signal to the class D amplification unit 26.
  • the class D amplification unit 26 performs high-efficiency amplification by performing power amplification by a switching circuit using pulse width modulation or the like.
  • the class D amplifier 26 amplifies the digital audio signal output from the ⁇ modulator 25 and outputs it to the LPF 31 of the audio output unit 30.
  • the LPF 31 attenuates and blocks the frequency component of the digital audio signal amplified by the class D amplification unit 26 to a predetermined value or more and outputs it to the speaker 32.
  • the functional blocks (21 to 25) of the full digital amplifier 20 operate based on the reference clock (12.288 MHz) output from the clock generator 27.
  • FIG. 3A is a detailed functional block diagram of the oversampling converter 23
  • FIGS. 3B to 3D are schematic views of changes in the signal waveform and frequency spectrum of the digital audio signal in the oversampling converter 23.
  • FIG. 3A is a detailed functional block diagram of the oversampling converter 23
  • FIGS. 3B to 3D are schematic views of changes in the signal waveform and frequency spectrum of the digital audio signal in the oversampling converter 23.
  • the oversampling converter 23 includes an upsampler (U ⁇ ) 23a and an LPF 23b whose pass band is set to 0 [Hz] to sampling frequency f s / 2 [Hz].
  • FIG. 3B shows the signal waveform and frequency spectrum of the digital audio signal input to the upsampler 23a, but the frequency spectrum shows only the fundamental wave component of the digital audio signal for simplification.
  • the upsampler 23a interpolates N (positive integer) -1 zero values between the input digital audio signals (original signals) shown in FIG. 3 (B), as shown in FIG. 3 (C). To do.
  • N 4. That is, the sampling frequency f s ⁇ 4 of the input digital audio signal becomes the sampling frequency f os of the digital audio signal after upsampling.
  • the frequency spectrum diagram of FIG. 3B shows the frequency spectrum (fundamental wave component) Z1 of the input digital audio signal, and the frequency spectrum Z2 obtained by folding the frequency spectrum Z1 around the sampling frequency f s / 2, frequency spectrum Z2 indicates the frequency spectrum Z3 folded back around the sampling frequency f s. The same applies to the frequency spectrum in the vicinity of 2f s , 3f s , and 4f s , and a description thereof will be omitted.
  • the LPF 23b in which the pass band is set to 0 [Hz] to the sampling frequency f s / 2 [Hz] is converted into a digital audio signal after zero value interpolation (see the signal waveform diagram of FIG. 3C).
  • digital low-pass filter processing By applying digital low-pass filter processing to the output, only frequency components having a sampling frequency f s / 2 or less are output based on the above setting.
  • the interpolated zero value rises as a result, as shown in the signal waveform diagram of FIG.
  • the frequency spectrum shown in the frequency spectrum diagram of FIG. 3C is basically the same as the frequency spectrum diagram of FIG.
  • the sampling frequency of the digital audio signal becomes 4 fs .
  • it is not a problem because it is suppressed by the LPF immediately before the speaker or out of the range of human auditory characteristics.
  • sampling frequency f os of the digital audio signal generated by the oversampling converter 23 may be, for example, at least twice the maximum frequency of the audible band.
  • the oversampling converter 23 outputs the digital audio signal thus upsampled to the clipper 24.
  • first threshold value ⁇ second threshold value
  • the folded harmonic components for example, depending on various conditions such as the frequency of the input fundamental wave component, the same output value, the oversampling magnification, etc., for example, the 3rd harmonic, 5th harmonic, 7
  • the second harmonic has a frequency component higher than f s / 2, but the higher harmonic than the ninth harmonic is in the audible band.
  • higher harmonics than the ninth harmonic are in the audible band, but are sufficiently small and can be reduced to a level that is difficult to hear.
  • the output value (spectrum value) of the fundamental wave component and the output value of the harmonic component indicated by the solid line in the figure in accordance with the change in the amplitude of the digital audio signal.
  • Ratio that is, the distortion rate of the digital audio signal changes, but when a digital signal having a predetermined amplitude value is input, the predetermined distortion rate is obtained as shown by the arrows in the figure, as shown by the arrows in the figure.
  • Hardware for adjusting the distortion rate of the digital audio signal may be provided.
  • the audio signal processing apparatus includes an audio apparatus such as a digital amplifier and a music reproduction apparatus, an audio visual apparatus capable of reproducing video and audio, a video display apparatus such as a television apparatus and a portable terminal equipped with a one-segment function, and an external tuner. It can be installed in a connected information processing device.
  • the upsampling and clipping processing of the present invention may be realized by a program (software) that causes a computer to execute. Examples of a program recording medium used to make the program executable by a computer include a CD-ROM (Compact Disc Read Only Memory), a CD-R (Compact Disc-Recordable), and a CD-RW (Compact Disc). -Rewriterble), DVD (Digital Versatile Disc) and other package media, as well as semiconductor memory, magnetic disk, magneto-optical disk, etc. in which programs are temporarily or permanently stored can be used.
  • SYMBOLS 1 Digital audio

Abstract

 デジタル音声信号をデジタルクリッパでクリップする際に発生する折り返し歪みによる異音発生を抑制できる音声信号処理装置、当該音声信号処理装置を備えたオーディオ装置、オーディオビジュアル装置、映像表示装置、情報処理装置、音声信号処理方法、プログラム、及び、当該プログラムを記録した記録媒体を提供する。オーバサンプリングコンバータ23は、非同期SRC22が出力したデジタル音声信号に基づき当該デジタル音声信号のサンプリング周波数fよりも高いサンプリング周波数fosのデジタル音声信号を生成し(アップサンプリング)、クリッパ24に出力する。クリッパ24は、オーバサンプリングコンバータ23が出力したデジタル音声信号の振幅(値)を第1閾値以上、第2閾値以下にクリップ(制限)し、ΔΣ変調器25に出力する。

Description

音声信号処理装置、当該音声信号処理装置を備えたオーディオ装置、オーディオビジュアル装置、映像表示装置、情報処理装置、音声信号処理方法、プログラム、及び、当該プログラムを記録した記録媒体
 本発明は、デジタル音声信号をクリップする際に発生する折り返し歪みによる異音を抑制できる音声信号処理装置、当該音声信号処理装置を備えたオーディオ装置、オーディオビジュアル装置、映像表示装置、情報処理装置、音声信号処理方法、プログラム、及び、当該プログラムを記録した記録媒体に関する。
 音声信号に各種処理を施し音声出力する際に発生する異音を抑えることができる信号処理装置が特許文献1に開示されている。
 特許文献1の信号処理装置は、アナログ信号S1を標本化してデジタル化した後に振幅を制限するデジタルリミッタと、当該デジタルリミッタからの出力信号S2の高調波成分を遮断するデジタルフィルタを有する。特許文献1の出願人は、前記信号処理装置は、デジタルフィルタの標本化周波数F2を前段のデジタルリミッタの標本化周波数F1の二倍以上の周波数として、いわゆる折り返し歪みによる異音発生を抑えていると主張している。
 ところで、地上デジタル放送の開始に伴い、テレビ内の殆どの電子回路がデジタル化されている。テレビ内の音声信号処理システム(回路)も例外ではなく、スピーカ補正処理、ボリューム制御処理などを実行する電子回路がDSP(Digital Signal Processor)によってデジタル化されている。さらに、最近では、スピーカを駆動するアンプ回路までもがデジタル化されている。メーカ各社は、音声信号処理システムをフルデジタル化することにより、音声信号処理システムの高品位化、開発の簡易化、低コスト化に努めている。
 図6は、地上デジタル放送対応テレビ装置内のデジタル音声信号処理システムの一例を説明する機能ブロック図である。デジタル音声信号処理システム100は、入力されるデジタル音声信号に各種処理を施して音声出力を行う。デジタル音声信号処理システム100は、デジタル音声信号処理部101、デジタルクリッパ(リミッタ)102、D級増幅部103、LPF(ローパスフィルタ)104、スピーカ105を有する。
 デジタル音声信号処理部101は、入力されるデジタル音声信号に対してボリューム調整処理・スピーカ周波数補正処理を施し、デジタルクリッパ102に出力する。デジタルクリッパ102は、必要以上の振幅が出力されないように出力振幅を制限(抑制)したり、所定の歪率で所定の出力を得るための調整をする簡易的な回路である。デジタルクリッパ102は、各種処理が施されたデジタル音声信号の振幅(値)を第1閾値以上、第2閾値以下にクリップ(制限)し、D級増幅部103に出力する。D級増幅部103は、デジタルクリッパ102によってクリップされたデジタル音声信号を増幅し、LPF104に出力する。LPF104は、D級増幅部103によって増幅されたデジタル音声信号の所定値以上の周波数成分を減衰させて遮断し、スピーカ105に出力する。
特開平1-95618号公報
 ところで、フルデジタル処理のデジタル音声信号処理システム100において、デジタルクリッパ102が、例えば正弦波状のデジタル音声信号をクリップすると、デジタル処理特有の異音、いわゆるデジタル音声信号の折り返し歪みによる異音が聞こえることがある。例えば、デジタル音声信号処理システム100が、低周波数から高周波数に連続的に周波数を変化させたデジタル音声信号(周波数スイープ)を音声出力すると、出力音声の周波数が低周波から高周波に変化するのにあわせて、出力音声の周波数が高周波から低周波に変化する異音が聞こえることがある。
 以下に、図7を用いて前記異音が聞こえる理由を説明する。
 図7(A)は、デジタルクリッパ102がクリップするサンプリング周波数fのデジタル音声信号の波形(正弦波)を模式的に示した図である。デジタルクリッパ102は、当該デジタル音声信号の振幅を第1閾値以上、第2閾値以下にクリップする。
 図7(B)は、デジタルクリッパ102が、サンプリング周波数fのデジタル音声信号をクリップした場合の周波数スペクトルを例示した図である。デジタルクリッパ102が、サンプリング周波数fのデジタル音声信号をクリップすると、高調波成分の周波数スペクトルが現れる。図7(B)においては、X1がサンプリング周波数fのデジタル音声信号の基本波成分の周波数スペクトルを示し、X2が前記高調波成分の周波数スペクトルを示している。また、音声信号は、サンプリングされたデジタル信号であるので、これらの周波数スペクトルX1、X2が、デジタル音声信号のサンプリング周波数f/2を中心に合わせ鏡のように折り返すことにより生じる、点線で示す周波数スペクトル(折り返し歪みによる周波数スペクトル)Yが現れる。
 以下の説明では、図7(B)中、デジタル音声信号のサンプリング周波数f/2(ナイキスト周波数)以下の周波数帯域が可聴帯域であるとする。
 前述したように、デジタルクリッパ102が、サンプリング周波数fの正弦波状のデジタル音声信号をクリップすると、図7(B)に示したように、サンプリング周波数f/2を中心に折り返した周波数スペクトルYの一部がナイキスト周波数以下の周波数帯域(可聴帯域)に混じる(点線丸囲み参照)。また、周波数スイープすると、実線で示した周波数スペクトル(X1、X2参照)が、右側にシフトするのにあわせて、点線で示した折り返し周波数スペクトルYが左側にシフトする(可聴帯域により入り込む)。
 以上が、周波数スイープを音声出力すると、出力音声の周波数が低周波から高周波に変化するのにあわせて、出力音声の周波数が高周波から低周波に変化する異音が聞こえる理由である。
 上記特許文献1のデジタル信号処理装置は、前述したように、アナログ信号S1を標本化してデジタル化した後に振幅を制限(クリップ)するデジタルリミッタが入力信号S1の振幅制限を実行し、クリップ後のデジタル信号をデジタルフィルタに出力する。そして、デジタルフィルタは、デジタルリミッタからのデジタル信号を当該デジタルリミッタの標本化周波数の2倍以上の周波数でサンプリングする。
 しかし、前記デジタルリミッタでクリップを実行した時点で高調波成分の折り返しにより生じた周波数スペクトルが可聴帯域に混じることがある。それ故、特許文献1のデジタル信号処理装置は、折り返し歪みによる異音発生を抑制することができない。
 本発明は、かかる実情に鑑みてなされたものであり、デジタル音声信号をデジタルクリッパでクリップする際に発生する折り返し歪みによる異音を抑制できる音声信号処理装置、当該音声信号処理装置を備えたオーディオ装置、オーディオビジュアル装置、映像表示装置、情報処理装置、音声信号処理方法、プログラム、及び、当該プログラムを記録した記録媒体を提供することを目的とする。
 第1の技術手段は、入力されるデジタル音声信号に基づき当該デジタル音声信号のサンプリング周波数よりも高いサンプリング周波数のデジタル音声信号を生成・出力するオーバサンプリングコンバータと、前記オーバサンプリングコンバータが出力したデジタル音声信号の値を制限する波形制限器を備えたことを特徴とする音声信号処理装置である。
 第2の技術手段は、第1の技術手段の前記波形制限器は、前記オーバサンプリングコンバータが出力したデジタル音声信号の値を第1閾値以上、第2閾値以下に制限することを特徴とする。
 第3の技術手段は、第1又は第2の技術手段の前記オーバサンプリングコンバータが生成した前記デジタル音声信号のサンプリング周波数が、可聴帯域の最大周波数の2倍以上であることを特徴とする。
 第4の技術手段は、第1~第3の何れかの技術手段の音声信号処理装置を備えたことを特徴とするオーディオ装置である。
 第5の技術手段は、第1~第3の何れかの技術手段の音声信号処理装置を備えたことを特徴とするオーディオビジュアル装置である。
 第6の技術手段は、第1~第3の何れかの技術手段の音声信号処理装置を備えたことを特徴とする映像表示装置である。
 第7の技術手段は、第1~第3の何れかの技術手段の音声信号処理装置を備えたことを特徴とする情報処理装置である。
 第8の技術手段は、入力されるデジタル音声信号に基づき当該デジタル音声信号のサンプリング周波数よりも高いサンプリング周波数のデジタル音声信号を生成するステップと、前記生成されたデジタル音声信号の値を制限するステップを有することを特徴とする音声信号処理方法である。
 第9の技術手段は、第8の技術手段の前記生成されたデジタル音声信号の値を制限するステップは、当該値を第1閾値以上、第2閾値以下に制限することを特徴とする。
 第10の技術手段は、第8又は第9の技術手段の音声信号処理方法をコンピュータに実行させることを特徴とするプログラムである。
 第11の技術手段は、第10の技術手段のプログラムを記録したコンピュータ読み取り可能な記録媒体である。
 本発明により、単純かつ安価な構成で、デジタル音声信号をクリップする際に発生する折り返し歪みによる異音を抑制できる。
本発明による折り返し歪み抑制を説明するための図である。 本発明に係る音声信号処理装置が適用される地上デジタル放送対応テレビ装置に設けられたデジタル音声信号処理システムの一例を説明する機能ブロック図である。 オーバサンプリングコンバータについて詳細に説明するための図である。 クリッピングについて説明するための図である。 振幅の変化と歪率の変化との関係を説明するための図である。 地上デジタル放送対応テレビ装置内のデジタル音声信号処理システムの機能ブロック図である。 異音が聞こえる理由を説明するための図である。
 図1は、本発明に係る音声信号処理装置による折り返し歪み抑制手法を説明する図である。
 本発明に係る音声信号処理装置は、入力されるデジタル音声信号に基づき、当該デジタル音声信号のサンプリング周波数fよりも高いサンプリング周波数fosのデジタル音声信号を生成(アップサンプリング)する。そして、アップサンプリング後のデジタル音声信号の振幅(値)を、第1閾値以上、第2閾値以下に制限(クリップ)する。
 アップサンプリング後のデジタル音声信号のクリップにより、図7で説明したように、アップサンプリング後のデジタル音声信号の周波数スペクトルが、図1の実線のように現れるとする。なお、アップサンプリング後のデジタル音声信号のサンプリング周波数fos/2は、アップサンプリング前のデジタル音声信号のサンプリング周波数f/2の右側になる。
 また、サンプリング周波数fos/2を中心に、実線で示したアップサンプリング後のデジタル音声信号の周波数スペクトルが合わせ鏡のように折り返す(図中2点鎖線参照)。
 このように折り返すと、サンプリング周波数f/2以下の周波数帯域(可聴帯域)に2点鎖線で示す折り返し歪みにより生じた周波数スペクトルが入り込まなくなるので、異音が聞こえなくなる。
 図2は、本発明に係る音声信号処理装置が適用される地上デジタル放送対応テレビ装置に設けられたデジタル音声信号処理システムの一例を説明する機能ブロック図である。
 デジタル音声信号処理システム1は、前処理部10、フルデジタルアンプ20、音声出力部30から構成される。
 前処理部10は、アンテナ11、受信復調部12、デジタル音声信号処理部13、I2S(Inter-IC Sound)インターフェイス14から構成される。
 受信復調部12は、地上デジタル放送信号を、アンテナ11を介して受信し、復調処理を実行する。そして、受信復調部12は、地上デジタル放送信号に含まれるデジタル音声信号をデジタル音声信号処理部13に出力する。
 デジタル音声信号処理部13は、受信したデジタル音声信号に対してボリューム調整処理・スピーカ周波数補正処理を施し、I2Sインターフェイス14に出力する。
 I2Sインターフェイス14は、フルデジタルアンプ20との接続インターフェイス機能を有し、LRCK、BCK、DATAの3線シリアル伝送を実行する。
 LRCKは、48kHzのクロック周波数である。LRCKは、デジタル音声信号のサンプリング周波数f(サンプリングレート)と同じ周波数で発振される。実際には、放送波や受信機の状態によるジッタがLRCKに含まれるため、48kHzを中心として誤差成分(±α)が含まれる。BCKは、LRCKの定数倍のクロック周波数であり、64倍、48倍、32倍等のクロック周波数が選択される場合がある。DATAは、デジタル音声信号である。LRCK=L(0)のときにはLchデジタル音声信号、LRCK=H(1)のときにはRchデジタル音声信号が、MSB(Most Significant Bit)から順番に、BCKに同期して、フルデジタルアンプ20に出力される。
 フルデジタルアンプ20は、I2Sインターフェイス21、非同期SRC22、オーバサンプリングコンバータ(OSC:Over Sampling Converter)23、クリッパ24、ΔΣ変調器25、D級増幅部26、クロック発生器27から構成される。また、本発明の音声信号処理装置Xは、オーバサンプリングコンバータ23及びクリッパ24から構成される。
 I2Sインターフェイス21は、前処理部10との接続インターフェイス機能を有し、前処理部10のI2Sインターフェイス14が出力したデジタル音声信号等を受信し、非同期SRC22に出力する。
 非同期SRC(Sampling Rate Converter)22は、サンプリング周波数に誤差があるデジタル音声信号を誤差のないデジタル音声信号に変換し、オーバサンプリングコンバータ23に出力する。ここでは、非同期SRC22は、前記デジタル音声信号の周波数を、48kHzの周波数、詳しくは、クロック発生器27の発振周波数(12.288MHz)の1/256の周波数に変換する。なお、デジタル音声信号にはLch、Rchの音声信号が含まれている。
 オーバサンプリングコンバータ23は、インターポーレータとも呼ばれる。オーバサンプリングコンバータ23は、非同期SRC22が出力したデジタル音声信号に基づき当該デジタル音声信号のサンプリング周波数fよりも高いサンプリング周波数fosのデジタル音声信号を生成し(アップサンプリング)、クリッパ24に出力する。ここでは、サンプリング周波数が48kHzのデジタル音声信号から、48kHzの256倍(12.288MHz)のサンプリング周波数のデジタル音声信号を生成する。サンプリング周波数fosの変更は任意である。なお、オーバサンプリングコンバータ23の詳細については後述する。
 クリッパ24は、リミッタ、スライサとも呼ばれる波形制限器である。クリッパ24は、オーバサンプリングコンバータ23が出力したデジタル音声信号の値(振幅)を制限するための簡易的な回路である。ここでは、オーバサンプリングコンバータ23が出力したデジタル音声信号の振幅(値)を第1閾値以上、第2閾値以下にクリップ(制限)し、ΔΣ変調器25に出力する。この第1閾値、第2閾値は自由に調整することができる。なお、第1閾値<第2閾値である。
 ΔΣ変調器25は、クリッパ24が出力したデジタル音声信号に対してデルタシグマ変調処理を施して1ビットデジタル音声信号を生成し、D級増幅部26に出力する。
 D級増幅部26は、パルス幅変調等を利用しスイッチング回路によって電力増幅を行うことで高効率の増幅を行う。D級増幅部26は、ΔΣ変調器25が出力したデジタル音声信号を増幅し、音声出力部30のLPF31に出力する。LPF31は、D級増幅部26によって増幅されたデジタル音声信号の所定値以上の周波数成分を減衰させて遮断し、スピーカ32に出力する。
 なお、フルデジタルアンプ20の機能ブロック(21~25)は、クロック発生器27が出力する基準クロック(12.288MHz)に基づき動作する。
 ここで、オーバサンプリングコンバータ23について、図3を用いて詳細に説明する。
 図3(A)は、オーバサンプリングコンバータ23の詳細機能ブロック図、図3(B)~図3(D)は、オーバサンプリングコンバータ23におけるデジタル音声信号の信号波形及び周波数スペクトルの変化の様子を模式的に示した図である。
 オーバサンプリングコンバータ23は、アップサンプラ(U↑)23a、通過帯域を0[Hz]~サンプリング周波数f/2[Hz]に設定しているLPF23bから構成される。
 図3(B)は、アップサンプラ23aに入力されるデジタル音声信号の信号波形及び周波数スペクトルを示しているが周波数スペクトルは簡略化のためデジタル音声信号の基本波成分のみを図示している。
 アップサンプラ23aは、図3(B)に示す、入力されるデジタル音声信号(オリジナル信号)間に、図3(C)に示すように、N(正整数)-1個のゼロ値を内挿する。ここでは、説明の簡略化のためN=4とする。つまり、入力されるデジタル音声信号のサンプリング周波数f×4がアップサンプリング後のデジタル音声信号のサンプリング周波数fosとなる。
 図3(B)の周波数スペクトル図は、入力されるデジタル音声信号の周波数スペクトル(基本波成分)Z1、及び、当該周波数スペクトルZ1がサンプリング周波数f/2を中心に折り返した周波数スペクトルZ2、当該周波数スペクトルZ2がサンプリング周波数fを中心に折り返した周波数スペクトルZ3を示している。なお、2f、3f、4f近傍の周波数スペクトルについても同様であるので、説明を省略する。
 次に、通過帯域を0[Hz]~サンプリング周波数f/2[Hz]に設定しているLPF23bは、ゼロ値内挿後のデジタル音声信号(図3(C)の信号波形図参照)に対してデジタルローパスフィルタ処理を施すことにより、前記設定に基づきサンプリング周波数f/2以下の周波数成分のみを出力する。この処理を施すと、図3(D)の信号波形図に示すように、結果として、内挿したゼロ値が立ち上がる。
 なお、図3(C)の周波数スペクトル図に示した周波数スペクトルについては、図3(B)の周波数スペクトル図と基本的に同じなので説明を省略する。
 アップサンプリングとデジタルローパスフィルタ処理を施すことにより、前記デジタル音声信号のサンプリング周波数は、4fとなる。また、図3(D)の周波数スペクトル図で示したように、基本波成分の周波数スペクトルが4f/2(=2f)を中心に折り返すことにより生じた周波数スペクトルのみが4f近傍に現れるが、スピーカ直前のLPFで抑圧されたり、人間の聴覚特性の範囲から外れるので、問題とならない。
 なお、オーバサンプリングコンバータ23が生成するデジタル音声信号のサンプリング周波数fosは、例えば、可聴帯域の最大周波数の2倍以上であればよい。
 オーバサンプリングコンバータ23の後にダウンサンプリングコンバータを設けることによって、有理数比のサンプリング周波数変換を行うことも可能である。
 オーバサンプリングコンバータ23は、このようにしてアップサンプリングしたデジタル音声信号をクリッパ24に出力する。前述のように、クリッパ24がデジタル音声信号をクリップすることにより、クリッパ24の第1閾値と第2閾値の絶対値が等しい場合(第1閾値=-第2閾値)、奇数次高調波成分が発生するが、この奇数次高調波成分は、オーバサンプリング後のサンプリング周波数fos(=4f)の1/2で折り返される。
 この折り返した高調波成分のうち、入力基本波成分の周波数、同出力値、オーバサンプリングの倍率などの各種条件により異なるが、例えば、比較的レベルの大きい3次高調波・5次高調波・7次高調波はf/2より高い周波数成分を持つが、9次高調波より高い高調波は可聴帯域内にある。しかし、この9次高調波より高い高調波は可聴帯域内にあるものの十分に小さく、聴覚しにくいレベルまで低減することができる。
 クリッパ24が実行するデジタル音声信号の制限処理(クリッピング)では、様々な手法を採用することができる。例えば、図4に示すように、デジタル音声信号の振幅を第1閾値、第2閾値付近で急峻にカットするいわゆるハードクリップ(図中:H)を実行してもよいし、第1閾値、第2閾値付近で緩やかにカットするいわゆるソフトクリップ(図中:S)を実行してもよい。
 また、一般的に、図5に示すように、クリッピングを実行するとデジタル音声信号の振幅の変化に伴い、図中実線で示す、基本波成分の出力値(スペクトル値)と高調波成分の出力値との比率、すなわち、デジタル音声信号の歪率が変化するが、所定の振幅値を有するデジタル信号が入力されたときに、所定の歪率が得られるよう、図中矢印に示すように、前記デジタル音声信号の歪率を調整するハードウェアを設けてもよい。
 本発明の音声信号処理装置を、デジタルアンプ、音楽再生装置などのオーディオ装置や、映像音声を再生できるオーディオビジュアル装置や、テレビ装置、ワンセグ機能搭載型携帯端末などの映像表示装置や、外部チューナと接続した情報処理装置に搭載できる。
 また、本発明のアップサンプリング及びクリッピング処理をコンピュータに実行させるプログラム(ソフトウェア)によって実現してもよい。
 前記プログラムをコンピュータによって実行可能な状態とするために用いられるプログラム記録媒体としては、例えば、CD-ROM(Compact Disc Read Only Memory)、CD-R(Compact Disc-Recordable)、CD-RW(Compact Disc-Rewriterble)、DVD(Digital Versatile Disc)などのパッケージメディアのみならず、プログラムが一時的若しくは永続的に格納される半導体メモリ、磁気ディスクあるいは光磁気ディスクなどを用いることができる。
1…デジタル音声信号処理システム、10…前処理部、11…アンテナ、12…受信復調部、13…デジタル音声信号処理部、14…I2Sインターフェイス、20…フルデジタルアンプ、21…I2Sインターフェイス、22…非同期SRC、23…オーバサンプリングコンバータ、23a…アップサンプラ、23b…LPF、24…クリッパ、25…変調器、26…D級増幅部、27…クロック発生器、30…音声出力部、31…LPF、32…スピーカ、X…音声信号処理装置、100…デジタル音声信号処理システム、101…デジタル音声信号処理部、102…デジタルクリッパ、103…D級増幅部、104…LPF、105…スピーカ。

Claims (11)

  1.  入力されるデジタル音声信号に基づき当該デジタル音声信号のサンプリング周波数よりも高いサンプリング周波数のデジタル音声信号を生成・出力するオーバサンプリングコンバータと、
     前記オーバサンプリングコンバータが出力したデジタル音声信号の値を制限する波形制限器を備えたことを特徴とする音声信号処理装置。
  2.  前記波形制限器は、前記オーバサンプリングコンバータが出力したデジタル音声信号の値を第1閾値以上、第2閾値以下に制限することを特徴とする請求項1に記載の音声信号処理装置。
  3.  前記オーバサンプリングコンバータが生成した前記デジタル音声信号のサンプリング周波数は、可聴帯域の最大周波数の2倍以上であることを特徴とする請求項1又は2に記載の音声信号処理装置。
  4.  請求項1~3の何れかに記載の音声信号処理装置を備えたことを特徴とするオーディオ装置。
  5.  請求項1~3の何れかに記載の音声信号処理装置を備えたことを特徴とするオーディオビジュアル装置。
  6.  請求項1~3の何れかに記載の音声信号処理装置を備えたことを特徴とする映像表示装置。
  7.  請求項1~3の何れかに記載の音声信号処理装置を備えたことを特徴とする情報処理装置。
  8.  入力されるデジタル音声信号に基づき当該デジタル音声信号のサンプリング周波数よりも高いサンプリング周波数のデジタル音声信号を生成するステップと、
     前記生成されたデジタル音声信号の値を制限するステップを有することを特徴とする音声信号処理方法。
  9.  前記生成されたデジタル音声信号の値を制限するステップは、当該値を第1閾値以上、第2閾値以下に制限することを特徴とする請求項8に記載の音声信号処理方法。
  10.  請求項8又は9に記載の音声信号処理方法をコンピュータに実行させることを特徴とするプログラム。
  11.  請求項10に記載のプログラムを記録したコンピュータ読み取り可能な記録媒体。
PCT/JP2010/060265 2009-07-07 2010-06-17 音声信号処理装置、当該音声信号処理装置を備えたオーディオ装置、オーディオビジュアル装置、映像表示装置、情報処理装置、音声信号処理方法、プログラム、及び、当該プログラムを記録した記録媒体 WO2011004687A1 (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP2009-160516 2009-07-07
JP2009160516 2009-07-07

Publications (1)

Publication Number Publication Date
WO2011004687A1 true WO2011004687A1 (ja) 2011-01-13

Family

ID=43429111

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/JP2010/060265 WO2011004687A1 (ja) 2009-07-07 2010-06-17 音声信号処理装置、当該音声信号処理装置を備えたオーディオ装置、オーディオビジュアル装置、映像表示装置、情報処理装置、音声信号処理方法、プログラム、及び、当該プログラムを記録した記録媒体

Country Status (1)

Country Link
WO (1) WO2011004687A1 (ja)

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH01103013A (ja) * 1987-10-15 1989-04-20 Sony Corp ディジタルクリップ回路
JPH09289437A (ja) * 1996-04-22 1997-11-04 Sony Corp デジタルリミッタ装置

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH01103013A (ja) * 1987-10-15 1989-04-20 Sony Corp ディジタルクリップ回路
JPH09289437A (ja) * 1996-04-22 1997-11-04 Sony Corp デジタルリミッタ装置

Similar Documents

Publication Publication Date Title
JP5409377B2 (ja) 高域補間装置および高域補間方法
RU2440692C2 (ru) Система и способ для компенсации безынерционного нелинейного искажения в аудиопреобразователе
KR20080041585A (ko) 디지털 필터 회로, 디지털 필터 프로그램 및 노이즈 캔슬링시스템
US8180002B2 (en) Digital signal processing device, digital signal processing method, and digital signal processing program
JP3137995B2 (ja) Pcmディジタルオーディオ信号再生装置
US8666732B2 (en) High frequency signal interpolating apparatus
US20090259476A1 (en) Device and computer program product for high frequency signal interpolation
Valimaki et al. Giant FFTs for Sample Rate Conversion
JP3327116B2 (ja) 信号処理装置、信号記録装置及び信号再生装置
WO2011004687A1 (ja) 音声信号処理装置、当該音声信号処理装置を備えたオーディオ装置、オーディオビジュアル装置、映像表示装置、情報処理装置、音声信号処理方法、プログラム、及び、当該プログラムを記録した記録媒体
CN107112979B (zh) 具有在高解析音频的前响应频率下的群延迟的非线性滤波器
JP4984178B2 (ja) 高域信号補間装置及び高域信号補間方法
JP2007282089A (ja) オーディオ信号処理装置,オーディオ信号処理方法,プログラムおよび記憶媒体
JP3297792B2 (ja) 信号伸張装置及び方法
JP4715385B2 (ja) 補間装置、オーディオ再生装置、補間方法および補間プログラム
JP4872086B2 (ja) 高域信号補間装置
JP2011197598A (ja) 高調波生成方法、高調波生成装置、及び、プログラム
JP2007272057A (ja) オーディオ信号処理装置,オーディオ信号処理方法,プログラムおよび記憶媒体
JP4815986B2 (ja) 補間装置、オーディオ再生装置、補間方法および補間プログラム
EP3029674B1 (en) Mastering improvements to audio signals
JPH1011898A (ja) ディジタル録音装置
JPH11234788A (ja) オーディオ装置
JPH1098353A (ja) ディジタル信号処理装置
JP6032703B2 (ja) 音響信号処理装置及び音響信号処理方法
JP2009094836A (ja) デジタル音声処理装置及びデジタル音声処理プログラム

Legal Events

Date Code Title Description
121 Ep: the epo has been informed by wipo that ep was designated in this application

Ref document number: 10796998

Country of ref document: EP

Kind code of ref document: A1

NENP Non-entry into the national phase

Ref country code: DE

122 Ep: pct application non-entry in european phase

Ref document number: 10796998

Country of ref document: EP

Kind code of ref document: A1

NENP Non-entry into the national phase

Ref country code: JP