JP2570603B2 - Audio signal transmission device and noise suppression device - Google Patents

Audio signal transmission device and noise suppression device

Info

Publication number
JP2570603B2
JP2570603B2 JP5293623A JP29362393A JP2570603B2 JP 2570603 B2 JP2570603 B2 JP 2570603B2 JP 5293623 A JP5293623 A JP 5293623A JP 29362393 A JP29362393 A JP 29362393A JP 2570603 B2 JP2570603 B2 JP 2570603B2
Authority
JP
Japan
Prior art keywords
signal
analog
frequency
band
digital
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP5293623A
Other languages
Japanese (ja)
Other versions
JPH07147566A (en
Inventor
泰祐 佐々田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Priority to JP5293623A priority Critical patent/JP2570603B2/en
Publication of JPH07147566A publication Critical patent/JPH07147566A/en
Application granted granted Critical
Publication of JP2570603B2 publication Critical patent/JP2570603B2/en
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Landscapes

  • Reduction Or Emphasis Of Bandwidth Of Signals (AREA)
  • Detection And Prevention Of Errors In Transmission (AREA)
  • Transmission Systems Not Characterized By The Medium Used For Transmission (AREA)

Description

【発明の詳細な説明】DETAILED DESCRIPTION OF THE INVENTION

【0001】[0001]

【産業上の利用分野】本発明は、音声信号伝送装置の送
信装置に利用する。特に、ノイズ重畳された広帯域音声
信号を音声帯域の回線を介して送信する送信装置の高域
に重畳されたノイズを抑圧するノイズ抑圧装置に関する
ものである。
BACKGROUND OF THE INVENTION 1. Field of the Invention The present invention is used for a transmitting device of a voice signal transmitting device. In particular, the present invention relates to a noise suppression device that suppresses noise superimposed on a high frequency band of a transmission device that transmits a broadband audio signal on which noise is superimposed via a line in an audio band.

【0002】[0002]

【従来の技術】従来、音声信号伝送装置は、広帯域音声
信号に重畳されたノイズを除去することなく伝送してい
た。
2. Description of the Related Art Conventionally, an audio signal transmission apparatus has transmitted without removing noise superimposed on a wideband audio signal.

【0003】[0003]

【発明が解決しようとする課題】しかし、このような従
来の音声信号伝送装置では、音声信号に重畳されたノイ
ズを除去することなく伝送していたために、音声の通話
品質が劣化する問題点があった。
However, in such a conventional audio signal transmitting apparatus, since the noise superimposed on the audio signal is transmitted without being removed, the voice communication quality deteriorates. there were.

【0004】ここで、音声信号をディジタル信号処理し
てピッチを得、音声信号の雑音重畳区間をピッチで区切
って同期加算し、こうして得た雑音除去音声で音声信号
の雑音重畳区間を補間する提案があるが(特開昭63−
26123号公報)、広帯域音声信号の高域周波数成分
の雑音を抑圧するものではない。
Here, a pitch is proposed by digitally processing a speech signal to obtain a pitch, a noise superimposed section of the speech signal is divided by the pitch, synchronously added, and the noise superimposed section of the speech signal is interpolated with the noise-removed speech thus obtained. There is (Japanese
No. 26123) does not suppress the noise of the high frequency component of the wideband audio signal.

【0005】本発明は前記の問題点を解決するもので、
広帯域音声信号に重畳されたノイズを除去し音声の品質
劣化を防止できる音声信号伝送装置を提供することを目
的とする。
The present invention solves the above problems,
It is an object of the present invention to provide an audio signal transmission device capable of removing noise superimposed on a wideband audio signal and preventing deterioration of audio quality.

【0006】[0006]

【課題を解決するための手段】本発明は、送信すべき広
帯域音声を回線に送信する送信装置と、この回線からこ
の送信装置の送信信号を受信する受信装置とを備えた音
声信号伝送装置において、前記送信装置は、前記広帯域
音声を時系列的なディジタル信号に変換するアナログデ
ィジタル変換器、このアナログディジタル変換器の出力
ディジタル信号を周波数分割された信号に変換する変換
手段、この変換手段の出力信号の高域周波数成分を間引
きして帯域圧縮する圧縮手段、この圧縮手段の出力信号
を時系列的なディジタル信号に変換する逆変換手段、お
よびこの逆変換手段の出力信号をアナログ信号に変換す
るディジタルアナログ変換器を含むノイズ抑圧装置を備
えたことを特徴とする。
According to the present invention, there is provided an audio signal transmitting apparatus comprising: a transmitting apparatus for transmitting a wideband voice to be transmitted to a line; and a receiving apparatus for receiving a transmission signal of the transmitting apparatus from the line. An analog-to-digital converter for converting the wideband voice into a time-series digital signal, a conversion unit for converting a digital signal output from the analog-to-digital converter into a frequency-divided signal, and an output of the conversion unit. Compression means for thinning out the high frequency components of the signal and band-compressing the signal; inverse conversion means for converting the output signal of the compression means into a time-series digital signal; and conversion of the output signal of the inverse conversion means into an analog signal A noise suppression device including a digital-to-analog converter is provided.

【0007】また、本発明は、前記変換手段は、前記ア
ナログディジタル変換器からのディジタル信号から有限
個のデータを取り出しフレーム処理および窓かけ処理を
行いこの処理されたフレーム内のデータに対する周波数
領域への変換を高速フーリエ変換により行う高速フーリ
エ変換演算回路を含み、前記逆変換手段は、前記高速フ
ーリエ変換演算回路の出力信号を逆高速フーリエ変換に
より時系列的なディジタル信号に変換しオーバラップ処
理を行う逆高速フーリエ変換演算回路を含むことができ
る。
Further, according to the present invention, the conversion means takes out a finite number of data from the digital signal from the analog-to-digital converter, performs frame processing and windowing processing, and converts the data into a frequency domain for data in the processed frame. The fast Fourier transform operation circuit for performing the conversion by the fast Fourier transform, the inverse transform means converts the output signal of the fast Fourier transform operation circuit into a time-series digital signal by an inverse fast Fourier transform, and performs overlap processing. It may include an inverse fast Fourier transform operation circuit for performing the operation.

【0008】さらに、本発明は、前記圧縮手段は、高い
周波数の間引く区間は間引き率を高くし、その区間の最
大パワーの周波数成分を残すべき有効成分として選択し
帯域を圧縮する手段を含むことができる。
Further, the present invention includes a compression means for increasing a thinning rate in a section where high frequency is thinned out, selecting a frequency component having a maximum power in the section as an effective component to be left, and compressing a band. Can be.

【0009】また、本発明の別の観点は、前記音声信号
伝送装置に利用するノイズ抑圧装置である。この装置は
前記音声信号伝送装置とは別に個別に商品として取り引
きすることができる。
[0009] Another aspect of the present invention is a noise suppression device used in the audio signal transmission device. This device can be separately traded separately from the audio signal transmission device.

【0010】[0010]

【作用】ノイズが重畳された広帯域音声をアナログディ
ジタル変換して広帯域音声の時系列信号に変換し、高速
フーリエ変換でこの時系列信号から周波数軸中の信号に
変換して高域周波数成分に対して間引きを施す。さら
に、逆高速フーリエ変換で周波数成分信号を時系列信号
に逆変換してディジタルアナログ変換することにより、
広帯域音声信号に重畳されたノイズを除去し音声の品質
劣化を防止できる。
[Function] A wide-band sound on which noise is superimposed is converted from analog to digital to a time-series signal of a wide-band sound, and the time-series signal is converted into a signal in the frequency axis by a fast Fourier transform to remove a high frequency component. Thin out. Furthermore, by inversely transforming the frequency component signal into a time-series signal by inverse fast Fourier transform and performing digital-to-analog conversion,
It is possible to remove noise superimposed on the wideband audio signal and prevent deterioration of audio quality.

【0011】[0011]

【実施例】本発明の実施例について図面を参照して説明
する。
Embodiments of the present invention will be described with reference to the drawings.

【0012】図1は本発明一実施例音声信号伝送装置の
ブロック構成図である。
FIG. 1 is a block diagram of an audio signal transmission apparatus according to one embodiment of the present invention.

【0013】図1において、音声信号伝送装置は、送信
すべき広帯域音声を入力する入力手段20およびこの入
力手段20の出力を回線に送信する送信手段30を含む
送信装置40と、この回線から送信装置40の送信信号
(ノイズ抑圧信号)を受信する受信装置50とを備え
る。
In FIG. 1, an audio signal transmitting apparatus includes a transmitting apparatus 40 including input means 20 for inputting broadband audio to be transmitted, and transmitting means 30 for transmitting an output of the input means 20 to a line, and transmitting from the line. A receiving device 50 that receives the transmission signal (noise suppression signal) of the device 40.

【0014】ここで本発明の特徴とするとろは、送信
装置40は、入力手段20からの広帯域音声を時系列的
なディジタル信号に変換するアナログディジタル変換器
11、アナログディジタル変換器11の出力ディジタル
信号を周波数分割された信号に変換する変換手段、この
変換手段の出力信号の高域周波数成分を間引きして帯域
圧縮する圧縮手段13、圧縮手段13の出力信号を時系
列的なディジタル信号に変換する逆変換手段、およびこ
の逆変換手段の出力信号をアナログ信号に変換して送信
手段30に出力するディジタルアナログ変換器51を含
むノイズ抑圧装置10を備えたことにある。
[0014] The filtrate come when the feature of the present invention herein, the transmission device 40, an analog-digital converter 11 for converting a wideband speech from the input unit 20 in a time-series digital signal, the output of the analog-digital converter 11 Conversion means for converting a digital signal into a frequency-divided signal; compression means 13 for thinning out a high-frequency component of the output signal of the conversion means and band-compressing the signal; converting the output signal of the compression means 13 into a time-series digital signal There is provided a noise suppressing device 10 including an inverse conversion means for converting, and a digital / analog converter 51 for converting an output signal of the inverse conversion means into an analog signal and outputting the analog signal to the transmitting means 30.

【0015】また、前記変換手段は、アナログディジタ
ル変換器11からのディジタル信号から有限個のデータ
を取り出しフレーム処理および窓かけ処理を行いこの処
理されたフレーム内のデータに対する周波数領域への変
換を高速フーリエ変換により行う高速フーリエ変換演算
回路としてFFT演算回路12を含み、前記逆変換手段
は、FFT変換演算回路12の出力信号を逆高速フーリ
エ変換により時系列的なディジタル信号に変換しオーバ
ラップ処理を行う逆高速フーリエ変換演算回路として逆
FFT演算回路14を含む。
The conversion means takes out a finite number of data from the digital signal from the analog-to-digital converter 11 and performs frame processing and windowing processing to convert the data in the processed frame into the frequency domain at high speed. An FFT operation circuit 12 is included as a fast Fourier transform operation circuit for performing a Fourier transform, and the inverse transform means converts an output signal of the FFT transform operation circuit 12 into a time-series digital signal by an inverse fast Fourier transform to perform overlap processing. An inverse FFT operation circuit 14 is included as an inverse fast Fourier transform operation circuit to be performed.

【0016】さらに、圧縮手段13は、高い周波数の間
引く区間は間引き率を高くし、その区間の最大パワーの
周波数成分を残すべき有効成分として選択し帯域を圧縮
する手段を含む。
Further, the compression means 13 includes means for increasing a thinning rate in a section where high frequency is thinned out, selecting a frequency component having a maximum power in the section as an effective component to be left, and compressing the band.

【0017】このような構成の音声信号伝送装置の動作
について説明する。
The operation of the audio signal transmitting apparatus having such a configuration will be described.

【0018】図2は本発明の音声信号伝送装置の広帯域
音声のスペクトルを示す図であり、横軸は周波数を示
し、縦軸は信号パワーを示す。また、図2(a)はノイ
ズ付加の広帯域音声のスペクトルを示し、図2(b)は
ノイズ抑圧を施した広帯域音声のスペクトルを示す。
FIG. 2 is a diagram showing a spectrum of a wideband voice of the voice signal transmitting apparatus according to the present invention. The horizontal axis indicates frequency, and the vertical axis indicates signal power. FIG. 2A shows the spectrum of a broadband speech with noise added, and FIG. 2B shows the spectrum of the wideband speech with noise suppression.

【0019】図1において、ノイズが付加された広帯域
音声信号をアナログディジタル変換器11にて時系列の
ディジタル信号に変換し、その信号をFFT演算回路1
2で周波数軸上の信号に変換する。この時点でのスペク
トルは、図2(a)に示す。この周波数成分の内、高域
周波数成分に対しては周波数を間引く。周波数を間引く
区間は、図2(a)に示すように、間引く率が2:1の
区間から間引く率が4:1の区間へと周波数が高くなる
につれ間引く率を上げている。
In FIG. 1, a wideband audio signal to which noise has been added is converted into a time-series digital signal by an analog-to-digital converter 11 and the signal is converted to an FFT operation circuit 1
In step 2, the signal is converted into a signal on the frequency axis. The spectrum at this point is shown in FIG. Of these frequency components, the frequency is thinned out for high frequency components. As shown in FIG. 2A, in the section where the frequency is thinned, the thinning rate is increased as the frequency increases from the section where the thinning rate is 2: 1 to the section where the thinning rate is 4: 1.

【0020】有効成分として残すべき周波数成分の設定
は、間引く区間の最大パワーを選択するものとする。図
中の黒で示した周波数成分は有効成分として残す成分、
白で示す成分は、間引きにより削除する成分である。す
なわち削除される周波数成分は、削除しても広帯域音声
信号に大きく影響を与えない部分であり、ノイズ成分の
比重が大きい信号であると見なしている。これらの間引
き処理を圧縮手段13で行う。さらに、この圧縮した周
波数信号を逆FFT演算回路14にて、時系列信号に戻
した後に、ディジタルアナログ変換器15にてアナログ
信号に変換し、ノイズ抑圧した広帯域音声として出力す
る。
The setting of the frequency component to be left as the effective component is to select the maximum power of the section to be thinned out. Frequency components shown in black in the figure are components to be left as effective components,
Components shown in white are components to be deleted by thinning. That is, the frequency component to be deleted is a portion that does not significantly affect the wideband audio signal even if the frequency component is deleted, and is regarded as a signal having a large specific gravity of the noise component. These thinning processes are performed by the compression means 13. Further, after the compressed frequency signal is returned to a time-series signal by the inverse FFT operation circuit 14, it is converted to an analog signal by the digital-to-analog converter 15 and output as a noise-suppressed wideband sound.

【0021】実施例の内でノイズ抑圧装置に関しては本
実施例の対象として市場で個別に商品として取り引きす
ることができ、利用者は音声信号伝送装置の送信装置に
組み込んで使用することができる。
Among the embodiments, the noise suppressing device can be individually traded in the market as a target of the present embodiment, and the user can use it incorporated in the transmitting device of the voice signal transmitting device.

【0022】次に、本発明のノイズ抑圧装置を使用して
帯域圧縮して送信し、その送信信号を受信し帯域伸張す
る広帯域音声信号のアナログ伝送方式について説明す
る。
Next, a description will be given of an analog transmission system of a wideband audio signal in which the band is compressed and transmitted using the noise suppressing apparatus of the present invention, the transmission signal is received, and the band is extended.

【0023】このアナログ伝送方式では、広帯域音声を
電話帯域に帯域圧縮してアナログ伝送し、受信側の帯域
伸張により広帯域音声を再生する。帯域圧縮は、広帯域
音声の中高域周波数成分を間引くことにより電話帯域内
に圧縮する。帯域伸張は、圧縮音声の低域成分からピッ
チ検出を行い、ピッチの整数倍に近い周波数位置に中高
域成分を再配置して伸張する。12kHz帯域音声を用
いた計算機シミュレーションに基づく5段階MOS値
(Mean Opinion Score)の主観評価結果を用いて、電話
帯域音声2.4より評価の高い3.1が得られることを
示す。この方式により、既存のアナログ電話回線を用い
て、より肉声に近い通話のできる広帯域音声会議端末を
実現できる。
In this analog transmission system, a wideband voice is band-compressed into a telephone band and transmitted analog, and the wideband voice is reproduced by band expansion on the receiving side. In the band compression, broadband speech is compressed into the telephone band by thinning out middle and high frequency components. In band expansion, pitch detection is performed from the low-frequency component of the compressed voice, and the middle-high frequency component is rearranged and expanded at a frequency position close to an integral multiple of the pitch. Using a subjective evaluation result of a five-stage MOS value (Mean Opinion Score) based on a computer simulation using a 12 kHz band voice, it is shown that 3.1 having a higher evaluation than the telephone band voice 2.4 can be obtained. According to this method, it is possible to realize a broadband audio conference terminal capable of making a call closer to the real voice using an existing analog telephone line.

【0024】通信での使用を主とした約4kHz帯域の
電話帯域音声符号化では、回線使用の効率化をはかるべ
く従来の64kbpsのPCM伝送から32kbpsの
ADPCM、16kbpsのMPC(Multi Pulse Code
c)、8kbpsのCELP(Codebook Excited LPC) 方
式等の符号化技術へと低ビットレート化が進んでいる
(丸善発行のマルチメディア符号化の国際標準、1991.
5、安田浩編著)。また、電話帯域より広い帯域を対象
とする符号化では、7kHz帯域を64kbpsで伝送
するSBADPCM(Sub-band ADPCM) が代表的であ
る。さらに、最近では約20kHzのオーディオ帯域を
約1/6〜1/12に圧縮符号化できるMPEG(Moti
on Picture Expert Group)方式もISOで標準化され
(テレビジョン学会誌、Vol.46,No.9,pp.1072-1075,199
2)、伝送端末での実用化も検討されつつある。音声通信
の分野においても、電話帯域より広い帯域を伝送するシ
ステムへの要求が高まっている。
In the telephone band voice coding of about 4 kHz band mainly for use in communication, in order to improve the efficiency of line use, 32 kbps ADPCM and 16 kbps MPC (Multi Pulse Code) are used from conventional 64 kbps PCM transmission.
c), encoding techniques such as the 8 kbps CELP (Codebook Excited LPC) scheme are being reduced in bit rate (International standard for multimedia encoding published by Maruzen, 1991.
5, edited by Hiroshi Yasuda). In coding for a band wider than the telephone band, SBADPCM (Sub-band ADPCM) for transmitting a 7 kHz band at 64 kbps is typical. Furthermore, recently, MPEG (Moti) capable of compressing and encoding an audio band of about 20 kHz to about 1/6 to 1/12 is used.
on Picture Expert Group) standardized by ISO (Television Society of Japan, Vol. 46, No. 9, pp. 1072-1075, 199).
2) Practical use in transmission terminals is also being studied. In the field of voice communication, there is an increasing demand for a system that transmits a band wider than the telephone band.

【0025】これらの圧縮技術は、すべてディジタル符
号化技術であり、加入者伝送路に適用するには、ISD
N等のディジタル回線が対象となる。しかし、現在の加
入者線路におけるディジタル回線の普及率は高いとは言
えず、従来からのアナログ電話回線での通信が大半を占
めている。一方、アナログ電話回線で広帯域音声を伝送
する場合、ディジタル符号化された広帯域音声を、高速
モデムで用いて伝送する方式が考えられる。しかし、現
在の最高速モデムは約20kbps程度の通信スピード
であるため、実現性は低い。
All of these compression techniques are digital encoding techniques, and to be applied to a subscriber transmission path, an ISD
Digital networks such as N are targeted. However, it cannot be said that the penetration rate of the digital line in the current subscriber line is high, and the communication through the conventional analog telephone line occupies most. On the other hand, when transmitting broadband voice over an analog telephone line, a method of transmitting digitally coded broadband voice using a high-speed modem is conceivable. However, since the current highest speed modem has a communication speed of about 20 kbps, its feasibility is low.

【0026】ここでは、通常約4kHz以下の帯域しか
伝送できない既存のアナログ電話回線を対象とした広帯
域の音声通話を可能とする伝送方式について説明する。
まず、この伝送方式の原理を説明し、次にシミュレーシ
ョンによる再生音声の主観評価結果を用いてこのアナロ
グ伝送方式の有効性を示す。
Here, a description will be given of a transmission system which enables a wideband voice call for an existing analog telephone line which can normally transmit only a band of about 4 kHz or less.
First, the principle of this transmission system will be described, and then, the effectiveness of this analog transmission system will be shown using subjective evaluation results of reproduced sound by simulation.

【0027】(A)アナログ伝送方式の構成 図3はアナログ伝送方式のブロック構成図であり、二線
式伝送装置に適用した例を示す。図3において、送信側
では、アナログディジタル変換器11で広帯域音声のア
ナログ信号をディジタル信号に変換しFFT演算回路1
2でこの時系列信号を周波数領域に変換する。次に、圧
縮手段13で周波数領域上の広帯域信号を後述する帯域
圧縮処理により電話帯域まで圧縮する。さらに、逆FF
T演算回路14で再び時間領域に戻したあと、ディジタ
ルアナログ変換器15でディジタル信号からアナログ信
号に変換し、アナログの圧縮音声として伝送する。
(A) Configuration of Analog Transmission System FIG. 3 is a block diagram of the analog transmission system, showing an example applied to a two-wire transmission device. In FIG. 3, on the transmitting side, an analog-to-digital converter 11 converts an analog signal of a wideband voice into a digital signal, and converts the analog signal into a digital signal.
In step 2, the time series signal is converted to the frequency domain. Next, the compression means 13 compresses the wideband signal in the frequency domain to the telephone band by a band compression process described later. Furthermore, inverse FF
After returning to the time domain again by the T operation circuit 14, the digital-to-analog converter 15 converts the digital signal into an analog signal and transmits it as analog compressed voice.

【0028】受信側では、到来する圧縮音声をアナログ
ディジタル変換し、EQL(回線損失補償)回路52で
回線の周波数損失性を補償した後に、FFT演算回路5
3で周波数領域への変換を行う。伸張手段55ではこの
信号から、ピッチ検出回路54で検出されるピッチの値
に基づいて、後述する帯域伸張処理を施す。さらに、逆
FFT演算回路56で再び時間領域に戻し、ディジタル
アナログ変換器57で伸張音声として再生する。
On the receiving side, the incoming compressed sound is converted from analog to digital, and the frequency loss of the line is compensated by an EQL (line loss compensation) circuit 52.
In step 3, conversion to the frequency domain is performed. The expansion unit 55 performs a band expansion process described later based on the pitch value detected by the pitch detection circuit 54 from this signal. Further, the signal is returned to the time domain again by the inverse FFT operation circuit 56, and is reproduced by the digital-to-analog converter 57 as expanded voice.

【0029】(B)帯域圧縮処理 図4はアナログ伝送方式の帯域圧縮処理を示すフローチ
ャートである。図5はアナログ伝送方式の帯域圧縮処理
における分割区間と間引き率とを示す図である。図4に
おいて、帯域圧縮処理は、フレーム処理、窓かけ処理、
DFT(Discrete Fourier Transform、離散フーリェ変
換)間引き処理、IDFT(逆DFT)、オーバラップ
処理からなる。
(B) Band Compression Processing FIG. 4 is a flowchart showing band compression processing of the analog transmission system. FIG. 5 is a diagram showing a divided section and a thinning rate in the band compression processing of the analog transmission method. In FIG. 4, band compression processing includes frame processing, windowing processing,
It comprises DFT (Discrete Fourier Transform, Discrete Fourier Transform) thinning processing, IDFT (Inverse DFT), and overlap processing.

【0030】まず、時系列データから有限個のデータを
抜き出すフレーム処理を行い取り出されたフレーム内の
データに対する周波数領域への変換をDFTにより行
う。DFTを行うにあたり、連続周期性を欠如しないよ
う時間窓関数を乗じる必要がある(窓欠け処理)。時間
窓関数には多々の窓関数があり目的に即した窓関数を選
択しなければならない(Prentice-Hall,1975、Theory a
nd applications of digital signal processing、L.R.
Rabiner and B.Gold) 。このアナログ伝送方式では、フ
レーム境界歪を軽減するオーバラップ処理を単純な加算
で実現するため、台形窓あるいは三角窓を用いる。
First, frame processing for extracting a finite number of data from the time-series data is performed, and the data in the extracted frame is converted into the frequency domain by DFT. In performing DFT, it is necessary to multiply by a time window function so as not to lack continuous periodicity (window missing processing). There are many window functions in the time window function, and it is necessary to select a window function suitable for the purpose (Prentice-Hall, 1975, Theory a
nd applications of digital signal processing, LR
Rabiner and B. Gold). In this analog transmission system, a trapezoidal window or a triangular window is used in order to realize an overlap process for reducing frame boundary distortion by simple addition.

【0031】また、帯域圧縮および帯域伸張を行うにあ
たり、音声の周波数特性を考慮した周波数間引き区間と
間引き率とを送受信の端末間で取り決めておく必要があ
る。音声の長時間平均周波数スペクトルは通常、800
Hzまでほぼ平坦で、800Hz以上はオクターブ当た
り−10dBの傾斜を持つ周波数特性で近似されること
が多い(研究実用化報告、Vol.4 、No.2,pp.245-262,19
55.1、音声の瞬時レベル分布およびスペクトル、三浦種
敏、越川常治)。この高域減衰特性を適用し、図5に示
されるような分割区間毎の間引き率を用いる。図5中の
横軸は周波数を示し、記されている分数は間引き率を表
している。例えば、1/4が記されている分割区分で
は、周波数領域のサンプル数を1/4に間引き、1/4
の圧縮音声サンプルを得る。この操作は、1/4の帯域
幅に圧縮することを示している。1/1が記されている
低域の分割区間は間引きを行わず、中域から高域にかけ
て間引き率を上げていく。
Further, when performing band compression and band expansion, it is necessary to determine a frequency thinning section and a thinning rate in consideration of the frequency characteristics of voice between the transmitting and receiving terminals. The long-term average frequency spectrum of speech is typically 800
Hz is almost flat, and 800 Hz or more is often approximated by frequency characteristics having a slope of -10 dB per octave (Research and practical use report, Vol.4, No.2, pp.245-262,19).
55.1, Instantaneous level distribution and spectrum of speech, T. Miura, J. Koshikawa). Applying this high-frequency attenuation characteristic, a thinning rate for each divided section as shown in FIG. 5 is used. The horizontal axis in FIG. 5 indicates the frequency, and the indicated fraction indicates the thinning rate. For example, in a division section in which 1/4 is described, the number of samples in the frequency domain is thinned out to 1/4, and 1/4
To obtain a compressed audio sample of. This operation indicates compression to 1/4 of the bandwidth. In the low-frequency divided section in which 1/1 is described, the thinning rate is increased from the middle range to the high range without thinning.

【0032】このような分割区分および間引き率によ
り、帯域圧縮における周波数成分毎の移動位置が送受信
間で定められる。例えば、間引き率1/4の分割区間で
は、伸張帯域における4サンプル幅の周波数範囲に対し
て、圧縮帯域内の一つの周波数位置が定められている。
このアナログ伝送方式では、周波数成分の移動で周波数
値を逆転させることのない昇順の配置とした。
The moving position for each frequency component in the band compression is determined between the transmission and the reception by the division and the thinning rate. For example, in a division section with a thinning rate of 1/4, one frequency position in the compression band is determined for a frequency range of 4 sample widths in the extension band.
In this analog transmission system, the arrangement is performed in an ascending order without inverting the frequency value by moving the frequency component.

【0033】間引き処理では、まずDFT演算により得
られた実部および虚部の値から、その2乗和をとり周波
数成分毎のスペクトルパワーを求め、最大パワーとなっ
た成分を、伝送すべき有効な周波数成分として選び出
す。次に、その有効成分を後述する位相補正を行った後
に、送受信間で定められた電話帯域内へ移動される。例
えば、DFT演算の周波数成分数で32サンプルとなる
帯域幅をもつ分割区間において、8サンプルの周波数成
分となる帯域に圧縮する場合を考える。まず、4サンプ
ルごとにスペクトルパワーを求め、最大パワーとなった
1サンプルの周波数成分を有効とし、定められた電話帯
域内の周波数位置に移動させる。これを8回繰り返し、
8サンプルの有効成分を取り出すことで、1/4の帯域
圧縮を行うことになる。また、2/3の圧縮を行う分割
区間では、3サンプルごとにパワーを求め、最小パワー
でない成分の2サンプルを有効成分として圧縮を行う。
In the decimation process, first, from the values of the real part and the imaginary part obtained by the DFT operation, the sum of the squares is calculated to obtain the spectral power for each frequency component. Frequency components. Next, after the effective component is subjected to a phase correction, which will be described later, the effective component is moved into a telephone band determined between transmission and reception. For example, let us consider a case in which a divided section having a bandwidth of 32 samples in the number of frequency components of the DFT operation is compressed to a frequency component of 8 samples. First, the spectrum power is obtained for every four samples, the frequency component of one sample having the maximum power is made valid, and the spectrum component is moved to a frequency position within a predetermined telephone band. Repeat this eight times,
By extracting the effective components of eight samples, the band is compressed by 1/4. In a divided section where 2/3 compression is performed, power is obtained for every three samples, and compression is performed using two samples of components that are not the minimum power as effective components.

【0034】このような周波数成分の間引きにより帯域
を圧縮した信号をIDFTにより時系列信号に戻した
後、オーバラップ処理で隣接したフレームが重なり合う
区間データをそれぞれ加算し、連続的な圧縮信号を得
る。
After the signal whose band has been compressed by thinning out such frequency components is returned to a time-series signal by IDFT, section data in which adjacent frames overlap by an overlap process are added to obtain a continuous compressed signal. .

【0035】(C)帯域伸張処理 図6はアナログ伝送方式の帯域伸張処理を示すフローチ
ャートである。図6において、帯域伸張処理も帯域圧縮
処理と同様に、有限個のデータを抜き出すフローチャー
ト処理および時間窓関数を乗じる窓かけ処理を施した後
に、DFT演算を行う。帯域伸張は、帯域圧縮処理で移
動した周波数成分を、フレーム内のピッチ検出結果に基
づき、その整数倍の値に最も近い周波数位置へ移動させ
る。なお、周波数成分の移動においては、圧縮時と同様
に後述の位相補正を施す必要がある。ピッチ検出は、フ
レームデータに対するローパスフィルタ(LPF)を介
して、自己相関法(オーム社発行の音声情報処理の基
礎、1981、斎藤收三、中田和男)により求められ
る。さらに、帯域圧縮処理と同様に、時系列信号に戻す
IDFT演算とオーバラップ処理を施すことで、連続的
な伸張信号を得られる。
(C) Band Expansion Processing FIG. 6 is a flowchart showing the band expansion processing of the analog transmission system. In FIG. 6, similarly to the band compression process, the band expansion process performs a DFT operation after performing a flowchart process for extracting a finite number of data and a windowing process for multiplying by a time window function. In the band expansion, the frequency component moved in the band compression process is moved to a frequency position closest to an integer multiple of the frequency component based on the pitch detection result in the frame. In the movement of the frequency component, it is necessary to perform the phase correction described later, as in the compression. Pitch detection is obtained by an autocorrelation method (Basics of speech information processing issued by Ohmsha, 1981, Shozo Saito, Kazuo Nakada) via a low-pass filter (LPF) for frame data. Further, similarly to the band compression processing, a continuous expanded signal can be obtained by performing an IDFT operation for returning to a time-series signal and an overlap processing.

【0036】(D)周波数成分の移動とオーバラップ処
理における位相補正 図7はアナログ伝送方式の周波数成分移動による位相ず
れを示す図である。
(D) Movement of Frequency Components and Phase Correction in Overlap Processing FIG. 7 is a diagram showing a phase shift due to movement of frequency components in the analog transmission system.

【0037】帯域圧縮および伸張処理時に必要な周波数
成分の移動において、フレームオーバラップ処理を加算
とする場合には、周波数成分毎の位相補正処理が必要と
なる。位相補正を行わない最悪のケースでは、オーバラ
ップ区間の加算フレームで移動された周波数成分の位相
差がπとなった場合に、それらのフレームを加算するこ
とでオーバラップ区間内の周波数成分を0にすることに
なる。図7に1/2フレームオーバラップの場合におけ
る位相ずれの様子を示す。J番目フレームと(J+1)
番目のフレーム内で周波数成分を移動した場合の信号波
形であり、オーバラップ区間において、図7(a)はπ
の位相差を生じる周波数成分の移動の例、図7(b)は
位相差を生じない周波数成分の移動の例である。図7中
のF(2)、FJ (3)、FJ+1 (4)等は、DFT演
算における周波数成分であり、その周波数位置を2、
3、4のインデックスで示している。図7(a)では周
波数位置2の周波数成分F(2)を、各フレーム内でそ
のまま周波数位置3に移動させた時に再生される波形を
表している。J番目と(J+1)番目フレームにおける
処理で再生される波形FJ (3)とFJ+1 (3)のオー
バラップ区間に位相ずれπが表されている。図7(b)
では、同様にF(4)への移動であるがオーバラップ区
間の位置ずれはない。
In the case of adding the frame overlap processing to the movement of the frequency components required for the band compression and expansion processing, a phase correction processing for each frequency component is required. In the worst case where the phase correction is not performed, when the phase difference between the frequency components shifted in the addition frame in the overlap section becomes π, the frequency components in the overlap section are reduced to 0 by adding those frames. It will be. FIG. 7 shows a state of a phase shift in the case of 1/2 frame overlap. J-th frame and (J + 1)
FIG. 7A shows a signal waveform when a frequency component is moved in the フ レ ー ム th frame, and FIG.
FIG. 7B shows an example of the movement of a frequency component that does not cause a phase difference. F (2), F J (3), F J + 1 (4) and the like in FIG. 7 are frequency components in the DFT operation, and the frequency position is 2,
Indicated by 3 and 4 indices. FIG. 7A shows a waveform reproduced when the frequency component F (2) at the frequency position 2 is directly moved to the frequency position 3 in each frame. A phase shift π is shown in the overlap section between the waveforms F J (3) and F J + 1 (3) reproduced in the processing in the J-th and (J + 1) -th frames. FIG. 7 (b)
Then, the movement is similarly to F (4), but there is no displacement in the overlap section.

【0038】位相差は、オーバラップ幅と周波数軸上で
の移動距離に関係しており、次のように求めることがで
きる。
The phase difference is related to the overlap width and the moving distance on the frequency axis, and can be obtained as follows.

【0039】まず、N個のデータf(n)、(n=0、
…、N−1)とN個の周波数成分F(κ)、(κ=0、
…、N−1)におけるDFTおよびIDFTの定義式
は、
First, N pieces of data f (n), (n = 0,
.., N−1) and N frequency components F (κ), (κ = 0,
, N-1) are defined as:

【0040】[0040]

【数1】 である。(Equation 1) It is.

【0041】いま、フレームとして切り出す前の時間領
域i、(i=0、…、∞)における入力信号g(i)
を、周波数位置を示す整数uの位置に複素数G(u)の
周波数成分のみをもつものと仮定すればIDFTの定義
から、
Now, the input signal g (i) in the time domain i, (i = 0,..., ∞) before being cut out as a frame.
Is assumed to have only the frequency component of the complex number G (u) at the position of the integer u indicating the frequency position, from the definition of IDFT,

【0042】[0042]

【数2】 となる。これはスペクトル1本に相当する。(Equation 2) Becomes This corresponds to one spectrum.

【0043】時間領域iにおける入力信号の0からNサ
ンプル切り出した信号を第1フレームとして、フレーム
内の時間領域nにおけるF1 (n)とすれば、 f1 (n)=g(i), (n=i:0≦n<N) (5) と表される。これをDFTすると、式(6)に示される
ように周波数位置uにG(u)の成分をもち、他の周波
数位置の成分は0となる。
Assuming that a signal obtained by cutting out N samples of the input signal from 0 in the time domain i is the first frame and F 1 (n) in the time domain n in the frame, f 1 (n) = g (i), (N = i: 0 ≦ n <N) (5) When this is subjected to DFT, a component of G (u) is present at a frequency position u as shown in Expression (6), and components at other frequency positions become zero.

【0044】[0044]

【数3】 ここで、位置uの代わりに、位置γに成分G(u)を有
する信号をF1 '(κ) とすると、
(Equation 3) Here, assuming that a signal having a component G (u) at a position γ is F 1 ′ (κ) instead of the position u,

【0045】[0045]

【数4】 となる。F1 '(κ) に対して、IDFTを行いその信号
をf1 '(n) で表すと、
(Equation 4) Becomes IDFT is performed on F 1 ′ (κ), and the signal is represented by f 1 ′ (n).

【0046】[0046]

【数5】 となる。これを式(5)の条件式n=iを用いて、もと
の時間領域iに戻し、第1フレームでの再生信号g1 '
(i) が式(9)のとおり得られる。
(Equation 5) Becomes This is returned to the original time domain i by using the conditional expression n = i in Expression (5), and the reproduced signal g 1 ′ in the first frame is obtained.
(i) is obtained as in equation (9).

【0047】[0047]

【数6】 次に、第1フレームに対してMサンプル(0<M<N)
ずれた点からを第2フレームとし、入力信号g(i)か
らNサンプル切出したものをf2 (n) として表すと次
式を得る。
(Equation 6) Next, M samples (0 <M <N) for the first frame
The following equation is obtained when the shifted point is defined as the second frame, and a signal obtained by cutting out N samples from the input signal g (i) is represented as f 2 (n).

【0048】 f2 (n),(n=i−M:0≦n≦N) (10) f2 (n)をDFTし、式(4)および式(10)を適
用すると、
F 2 (n), (n = i−M: 0 ≦ n ≦ N) (10) By performing DFT on f 2 (n) and applying equations (4) and (10),

【0049】[0049]

【数7】 となる。周波数u以外の成分は0であり、f2 (u) だ
けが周波数成分をもつ。ここで、式(7)と同様に、次
式でF2 '(κ) を表す。
(Equation 7) Becomes Components other than the frequency u are 0, and only f 2 (u) has a frequency component. Here, similarly to the equation (7), F 2 ′ (κ) is represented by the following equation.

【0050】[0050]

【数8】 2 '(κ) に対して、IDFTを行うその信号をF2 '
(n) で表すと、
(Equation 8) For F 2 ′ (κ), the signal for performing IDFT is given by F 2
Expressed by (n),

【0051】[0051]

【数9】 となる。これを式(10)の条件式n=i−Mを用い
て、もとの時間領域iに戻し、第2フレームでの再生信
号g2 '(i) が得られる。
(Equation 9) Becomes This is returned to the original time domain i by using the conditional expression n = i−M in Expression (10), and a reproduced signal g 2 ′ (i) in the second frame is obtained.

【0052】[0052]

【数10】 第一フレームでの再生信号g1 '(i) と第2フレームで
の再生信号g2 '(i) との位相差θは、式(9)と式
(14)から、
(Equation 10) The phase difference θ between the reproduced signal g 1 ′ (i) in the first frame and the reproduced signal g 2 ′ (i) in the second frame is given by Expression (9) and Expression (14).

【0053】[0053]

【数11】 となる。ただしargは複素数から位相角をとりだす関
数である。位相差θはMに依存するオーバラップ幅と周
波数成分の移動距離(γ−u)とによるものであること
がわかる。例えば、M=N3/4となる1/4フレーム
オーバラップの位相差θ1/4 は、 θ1/4 =−3π(γ−u)/2 (16) となる。周波数成分の移動距離0、1、2、3、4、
5、…に対しては、θ1/4が0、π/2、π、3π/
2、0、π/2、…となる。すなわち、理想的な位相差
0を実現するためには、移動距離に対して4の剰余で処
理される位相補正が必要となる。また、M=N/2とな
る1/2フレームオーバラップでの位相差θ1/2 は、 θ1/2 =−π(γ−u) (17) となり、周波数成分の移動距離0、1、2、3、…に対
して、θ1/2 =0、π、0、π、…が得られる。これ
は、DFTの演算結果における周波数位置を示すインデ
ックス(uおよびγ)の値が、奇数値と偶数値との間の
移動にあたる時のみπの位相差を生じると解釈できる。
[Equation 11] Becomes Here, arg is a function that extracts a phase angle from a complex number. It can be seen that the phase difference θ is due to the overlap width depending on M and the moving distance (γ-u) of the frequency component. For example, the phase difference θ 1/4 of 1 / frame overlap where M = N3 / 4 is θ 1/4 = −3π (γ−u) / 2 (16). Moving distances of frequency components 0, 1, 2, 3, 4,
For..., Θ 1/4 is 0, π / 2, π, 3π /
2, 0, π / 2,... That is, in order to realize an ideal phase difference of 0, it is necessary to perform a phase correction that is processed with a remainder of 4 with respect to the moving distance. The phase difference θ 1/2 at 1/2 frame overlap where M = N / 2 is θ 1/2 = −π (γ−u) (17), and the moving distance of the frequency component is 0, 1 , 2, 3,..., Θ 1/2 = 0, π, 0, π,. This can be interpreted as that a phase difference of π occurs only when the value of the index (u and γ) indicating the frequency position in the DFT operation result corresponds to the movement between the odd value and the even value.

【0054】これらの位相補正は、基本的には、毎フレ
ーム行うことが必要である。いま、隣接するフレーム間
での位相差がθで、(J−1)番目フレームとJ番目の
フレームとの加算に対する位相補正をJ番目のフレーム
で行うことを考える。ただし、JはJ>1の自然数とす
る。ここで、(J+1)番目フレームにおいてはJ番目
フレームに対する位相差θを補正するが、J番目フレー
ム自体既に(J−1)番目フレームに対する位相差θが
補正されていることに着目すると、(J+1)番目フレ
ームにおける位相補正は2θとなる。すなわち、(J−
1)番目フレームに対する(J+1)番目フレームにお
ける位相補正は、1=0、1、2、3、4、…、Lに対
してθ、2θ、3θ、4θ、5θ、…、(L+1)θと
累積されることになる。
These phase corrections basically need to be performed for each frame. Now, it is assumed that the phase difference between adjacent frames is θ, and the phase correction for the addition of the (J−1) th frame and the Jth frame is performed in the Jth frame. Here, J is a natural number satisfying J> 1. Here, in the (J + 1) -th frame, the phase difference θ with respect to the J-th frame is corrected, but if the J-th frame itself is already corrected for the phase difference θ with respect to the (J−1) -th frame, (J + 1) The phase correction in the ()) th frame is 2θ. That is, (J-
The phase correction in the (J + 1) -th frame with respect to the 1) -th frame is as follows: 1 = 0, 1, 2, 3, 4,..., L, θ, 2θ, 3θ, 4θ, 5θ,. Will be cumulative.

【0055】例えば、周波数上の移動距離が1で、1/
4フレームオーバラップの場合には、θ1/4 =π/2で
あるため、θ、2θ、3θ、4θ、5θ、…と累積する
位相補正量は、π/2、π、3π/2、0、π/2、3
π/2、…となる。同様に、1/2フレームオーバラッ
プの場合には、θ1/2 =πであるため、θ、2θ、3
θ、4θ、5θ、…と累積する位相補正量は、π、0、
π、0、π、…となる。これは、1/2フレームオーバ
ラップの場合には1フレームおき毎に位相補正を行えば
良いことを表しており、1/4フレームオーバラップの
場合より簡単な処理で位相補正を行うことができる。
For example, if the moving distance on the frequency is 1, 1 /
In the case of 4-frame overlap, since θ 1/4 = π / 2, the phase correction amounts accumulated as θ, 2θ, 3θ, 4θ, 5θ,... Are π / 2, π, 3π / 2,. 0, π / 2, 3
π / 2, ... Similarly, in the case of 1/2 frame overlap, since θ 1/2 = π, θ, 2θ, 3
.., 0,...
π, 0, π,... This means that phase correction should be performed every other frame in the case of 1/2 frame overlap, and the phase correction can be performed with simpler processing than in the case of 1/4 frame overlap. .

【0056】(E)シミュレーション シミュレーション設定条件 図8はアナログ伝送方式の12kHz帯域の広帯域音声
と電話帯域(3.4kHz帯域)音声との間で帯域圧縮
および帯域伸張を行ったシミュレーションの設定条件を
示す図である。
(E) Simulation Simulation Setting Conditions FIG. 8 shows simulation setting conditions in which band compression and band expansion are performed between a 12-kHz wideband voice and a telephone-band (3.4 kHz) voice in the analog transmission system. FIG.

【0057】図9はアナログ伝送方式のシミュレーショ
ンに用いた分割帯域と間引き率との関係を示す図であ
る。(B)節で述べた周波数成分の移動位置は、図9に
より定められている。例えば、1/4の間引き率の区間
では、広帯域音声の周波数位置96、97、98、99
の四つに対して圧縮音声の周波数位置69、また10
0、101、102、103に対して70が定められて
いることを示している。
FIG. 9 is a diagram showing the relationship between the divided bands used in the simulation of the analog transmission system and the thinning rate. The moving position of the frequency component described in the section (B) is determined by FIG. For example, in the section of the の 間 thinning rate, the frequency positions 96, 97, 98, 99
Frequency positions 69 and 10 for the compressed voice for the four
This indicates that 70 is defined for 0, 101, 102, and 103.

【0058】(F)主観評価結果 図10はアナログ伝送方式の伸張音声の主観評価結果を
示す図である。
(F) Subjective Evaluation Results FIG. 10 is a diagram showing the subjective evaluation results of the expanded voice of the analog transmission system.

【0059】シミュレーションにより帯域圧縮・帯域伸
張を施された音声を5段階評価のMOS値(Mean Opini
on Score) を用いて主観評価を行った。入力信号とし
て、単独音声および、音声会議を想定した音声と背景雑
音またはBGM(Back GroundMusic)の加算信号を用い
た。背景雑音には一般的な事務所の周囲雑音を、BGM
には弦楽四重奏の楽曲を使用している。評定者には、評
価点5の基準信号として12kHz帯域の信号を視聴さ
せた。また評価は、ダブルブラインド方式(Swedish Br
oadcasting Corporation(SR)Research and Development
Department,1991.5、The SR Report on The MPEG/Audi
o Subjective Listening Test 、Sten Bergman,Christe
r Grewin,Thomas Ryden)を用い、CCIR Rec.5
62(International Radio Consultative Committee
C.C.I.R. Recommendation No.562,1990) のグレードス
ケールにより行った。音声評価に関してエキスパートで
はない一般の評定者14名による主観評価結果をMOS
値にて図10に示す。
The voice which has been subjected to the band compression / band expansion by the simulation is evaluated with a MOS value (Mean Opini
on Score). As an input signal, a single voice and, voice conference was speech and background noise or that assumes was using the added signal of the BGM (Back GroundMusic). Background noise includes general office ambient noise, BGM
Uses string quartet music. The evaluator watched a signal in a 12 kHz band as a reference signal of evaluation point 5. The evaluation was based on the double blind method (Swedish Br
oadcasting Corporation (SR) Research and Development
Department, 1991.5, The SR Report on The MPEG / Audi
o Subjective Listening Test, Sten Bergman, Christe
r Grewin, Thomas Ryden) using CCIR Rec. 5
62 (International Radio Consultative Committee
(CCIR Recommendation No.562,1990). MOS based on subjective evaluation results by 14 general raters who are not experts in voice evaluation
The values are shown in FIG.

【0060】このアナログ伝送方式による伸張音声で
は、それぞれのサンプルにおいて、既存の電話帯域音声
よりも高い評価が得られている。また、サンプル自体に
高域周波数成分が少なかった男声サンプルでの評価結果
は、女声サンプルに比較するとやや低く、電話帯域音声
との差が縮まっている。しかし、帯域の広い楽曲を付加
した男声+BGMのサンプルでは、このアナログ伝送方
式のMOS値が3.0と電話帯域音声2.2より高くな
っており、帯域を広げた本方式の優位性が認められる。
In the expanded voice according to the analog transmission system, higher evaluation is obtained in each sample than in the existing telephone band voice. In addition, the evaluation result of the male voice sample in which the sample itself has few high frequency components is slightly lower than that of the female voice sample, and the difference from the telephone band voice is reduced. However, in the sample of male voice + BGM to which a song with a wide band is added, the MOS value of this analog transmission system is 3.0, which is higher than the telephone band voice 2.2, and the superiority of this system with an expanded band is recognized. Can be

【0061】前述のように、本アナログ伝送方式は、広
帯域音声を電話帯域に帯域圧縮してアナログ伝送し、受
信側の帯域伸張により広帯域音声を再生する。帯域圧縮
では、広帯域音声の中高域周波数成分を間引くことによ
り電話帯域内に圧縮する。帯域伸張では、圧縮音声の低
域成分からピッチ検出を行い、ピッチの整数倍に近い周
波数位置に中高域成分を再配置して伸張する。
As described above, in the present analog transmission system, a wideband voice is band-compressed into a telephone band and transmitted analog, and the wideband voice is reproduced by expanding the band on the receiving side. In band compression, broadband speech is compressed into the telephone band by thinning out middle and high frequency components. In the band expansion, pitch detection is performed from the low-frequency component of the compressed voice, and the mid-high frequency component is rearranged and expanded at a frequency position close to an integral multiple of the pitch.

【0062】12kHz帯域音声を用いた計算機シミュ
レーションに基づく5段階MOS値の主観評価結果を用
いて、電話帯域音声の評価2.4より評価の高い3.1
が得られることを示した。このアナログ伝送方式により
既存のアナログ電話回線を用いて、より肉声に近い通話
のできる広帯域音声会議端末が実現できる。
Using a subjective evaluation result of a five-stage MOS value based on a computer simulation using a 12 kHz band voice, 3.1 which is higher in evaluation than a telephone band voice evaluation 2.4.
Was obtained. With this analog transmission system, a wideband audio conference terminal capable of making a call closer to the real voice can be realized using an existing analog telephone line.

【0063】[0063]

【発明の効果】以上説明したように、本発明は、音声信
号に付加されたノイズを除去し音声の品質劣化を防止で
きる優れた効果がある。
As described above, the present invention has an excellent effect of removing noise added to a voice signal and preventing voice quality deterioration.

【図面の簡単な説明】[Brief description of the drawings]

【図1】本発明一実施例音声信号伝送装置のブロック構
成図。
FIG. 1 is a block diagram of an audio signal transmission apparatus according to an embodiment of the present invention.

【図2】本発明の音声信号伝送装置の送信装置の広帯域
音声信号のスペクトルを示す図。
FIG. 2 is a diagram showing a spectrum of a wideband audio signal of a transmission device of the audio signal transmission device of the present invention.

【図3】アナログ伝送方式のブロック構成図。FIG. 3 is a block diagram of an analog transmission system.

【図4】アナログ伝送方式の帯域圧縮処理を示すフロー
チャート。
FIG. 4 is a flowchart showing band compression processing of the analog transmission system.

【図5】アナログ伝送方式の帯域圧縮処理における分割
区間と間引き率とを示す図。
FIG. 5 is a diagram showing a division section and a thinning rate in a band compression process of an analog transmission system.

【図6】アナログ伝送方式の帯域伸張処理を示すフロー
チャート。
FIG. 6 is a flowchart showing band extension processing of the analog transmission system.

【図7】アナログ伝送方式の周波数成分移動による位相
ずれを示す図。
FIG. 7 is a diagram showing a phase shift due to frequency component movement in the analog transmission system.

【図8】アナログ伝送方式の12kHz帯域の広帯域音
声と電話帯域(3.4kHz帯域)音声との間で帯域圧
縮および帯域伸張を行ったシミュレーションの設定条件
を示す図。
FIG. 8 is a diagram showing setting conditions of a simulation in which band compression and band expansion are performed between a 12-kHz band wide band voice and a telephone band (3.4 kHz band) voice of the analog transmission system.

【図9】アナログ伝送方式のシミュレーションに用いた
分割帯域と間引き率との関係を示す図。
FIG. 9 is a diagram illustrating a relationship between a divided band and a thinning rate used in a simulation of the analog transmission scheme.

【図10】アナログ伝送方式の伸張音声の主観評価結果
を示す図。
FIG. 10 is a diagram showing a subjective evaluation result of an expanded voice in the analog transmission system.

【符号の説明】[Explanation of symbols]

10 ノイズ抑圧装置 11、51 アナログディジタル変換器 12、53 FFT演算回路 13 圧縮手段 14、56 逆FFT演算回路 15、57 ディジタルアナログ変換器 20 入力手段 30 送信手段 40 送信装置 50 受信装置 52 EQL回路 54 ピッチ検出回路 55 伸張手段 60 二線四線変換器 REFERENCE SIGNS LIST 10 noise suppression device 11, 51 analog-to-digital converter 12, 53 FFT operation circuit 13 compression means 14, 56 inverse FFT operation circuit 15, 57 digital-analog converter 20 input means 30 transmission means 40 transmission apparatus 50 reception apparatus 52 EQL circuit 54 Pitch detection circuit 55 Decompression means 60 Two-wire to four-wire converter

Claims (2)

(57)【特許請求の範囲】(57) [Claims] 【請求項1】 送信すべき広帯域音声を回線に送信する
送信装置と、この回線からこの送信装置の送信信号を受
信する受信装置とを備えた音声信号伝送装置において、 前記送信装置は、前記広帯域音声を時系列的なディジタ
ル信号に変換するアナログディジタル変換器、このアナ
ログディジタル変換器の出力ディジタル信号を周波数分
割された信号に変換する変換手段、この変換手段の出力
信号の高域周波数成分を間引きして帯域圧縮する圧縮手
段、この圧縮手段の出力信号を時系列的なディジタル信
号に変換する逆変換手段、およびこの逆変換手段の出力
信号をアナログ信号に変換するディジタルアナログ変換
器を含むノイズ抑圧装置を備え 前記変換手段は、前記アナログディジタル変換器からの
ディジタル信号から有限個のデータを取り出しフレーム
処理および窓かけ処理を行いこの処理されたフレーム内
のデータに対する周波数領域への変換を高速フーリエ変
換により行う高速フーリエ変換演算回路を含み、 前記逆変換手段は、前記高速フーリエ変換演算回路の出
力信号を逆高速フーリエ変換により時系列的なディジタ
ル信号に変換しオーバラップ処理を行う逆高速フーリエ
変換演算回路を含み、 前記圧縮手段は、高い周波数の間引く区間は間引き率を
高くし、その区間の最大パワーの周波数成分を残すべき
有効成分として選択し帯域を圧縮する手段を含む ことを
特徴とする音声信号伝送装置。
1. Broadband voice to be transmitted is transmitted to a line.
A transmitting device, and receiving a transmission signal of the transmitting device from this line.
An audio signal transmission device comprising: a reception device that transmits the wideband audio in a time-series digital format.
Analog-to-digital converter that converts
The output digital signal of the log digital converter is divided by frequency
Conversion means for converting the signal into divided signals, the output of the conversion means
A compression method that thins out the high-frequency components of a signal and compresses the band
Stage, the output signal of this compression means is converted into a time-series digital signal.
Conversion means for converting to a signal, and the output of the inverse conversion means
Digital-to-analog conversion that converts signals to analog signals
Equipped with a noise suppression device, The conversion means is configured to output the analog-to-digital converter
Extraction of finite number of data from digital signal
Processing and windowing processing, and within this processed frame
Fast Fourier transform of the frequency domain
Including a fast Fourier transform operation circuit performed by The inverse transform means outputs the fast Fourier transform operation circuit.
Time-series digitization of force signal by inverse fast Fourier transform
Inverse fast Fourier to convert to overlapped signal
Including a conversion operation circuit, The compression means sets a thinning rate in a section where the high frequency is thinned.
High and leave the frequency component with the highest power in that section
Includes means to select as active ingredient and compress bandwidth That
Characteristic audio signal transmission device.
【請求項2】 広帯域音声を時系列的なディジタル信号
に変換するアナログディジタル変換器、このアナログデ
ィジタル変換器の出力ディジタル信号を周波数分割され
た信号に変換する変換手段、この変換手段の出力信号の
高域周波数成分を間引きして帯域圧縮する圧縮手段、こ
の圧縮手段の出力信号を時系列的なディジタル信号に変
換する逆変換手段、およびこの逆変換手段の出力信号を
アナログ信号に変換するディジタルアナログ変換器を含
むノイズ抑圧装置において、 前記変換手段は、前記アナログディジタル変換器からの
ディジタル信号から有限個のデータを取り出しフレーム
処理および窓かけ処理を行いこの処理されたフレーム内
のデータに対する周波数領域への変換を高速フーリエ変
換により行う高速フーリエ変換演算回路を含み、 前記逆変換手段は、前記高速フーリエ変換演算回路の出
力信号を逆高速フーリエ変換により時系列的なディジタ
ル信号に変換しオーバラップ処理を行う逆高速フーリエ
変換演算回路を含み、 前記圧縮手段は、高い周波数の間引く区間は間引き率を
高くし、その区間の最大パワーの周波数成分を残すべき
有効成分として選択し帯域を圧縮する手段を含むことを
特徴とするノイズ抑圧装置。
2. An analog-to-digital converter for converting a wideband voice into a time-series digital signal, a conversion unit for converting an output digital signal of the analog-to-digital converter into a frequency-divided signal, and an output signal of the conversion unit. Compression means for thinning out the high-frequency components and compressing the band, inverse conversion means for converting the output signal of the compression means into a time-series digital signal, and digital analog for converting the output signal of the inverse conversion means to an analog signal In a noise suppression device including a converter, the conversion means takes out a finite number of data from the digital signal from the analog-to-digital converter, performs frame processing and windowing processing, and performs frequency processing on the data in the processed frame. A fast Fourier transform operation circuit that performs the The inverse transform unit includes an inverse fast Fourier transform operation circuit that converts an output signal of the fast Fourier transform operation circuit into a time-series digital signal by inverse fast Fourier transform and performs an overlap process, and the compression unit includes: A noise suppression device comprising: means for increasing a thinning rate in a section where high frequency is thinned, selecting a frequency component having a maximum power in the section as an effective component to be left, and compressing a band.
JP5293623A 1993-11-24 1993-11-24 Audio signal transmission device and noise suppression device Expired - Lifetime JP2570603B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP5293623A JP2570603B2 (en) 1993-11-24 1993-11-24 Audio signal transmission device and noise suppression device

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP5293623A JP2570603B2 (en) 1993-11-24 1993-11-24 Audio signal transmission device and noise suppression device

Publications (2)

Publication Number Publication Date
JPH07147566A JPH07147566A (en) 1995-06-06
JP2570603B2 true JP2570603B2 (en) 1997-01-08

Family

ID=17797113

Family Applications (1)

Application Number Title Priority Date Filing Date
JP5293623A Expired - Lifetime JP2570603B2 (en) 1993-11-24 1993-11-24 Audio signal transmission device and noise suppression device

Country Status (1)

Country Link
JP (1) JP2570603B2 (en)

Families Citing this family (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5839098A (en) 1996-12-19 1998-11-17 Lucent Technologies Inc. Speech coder methods and systems
JP4645869B2 (en) * 2000-08-02 2011-03-09 ソニー株式会社 DIGITAL SIGNAL PROCESSING METHOD, LEARNING METHOD, DEVICE THEREOF, AND PROGRAM STORAGE MEDIUM
JP2004029674A (en) * 2002-06-28 2004-01-29 Matsushita Electric Ind Co Ltd Noise signal encoding device and noise signal decoding device
JP4630956B2 (en) * 2004-03-30 2011-02-09 学校法人早稲田大学 Howling frequency component enhancement method and apparatus, howling detection method and apparatus, howling suppression method and apparatus, peak frequency component enhancement method and apparatus
US7813931B2 (en) * 2005-04-20 2010-10-12 QNX Software Systems, Co. System for improving speech quality and intelligibility with bandwidth compression/expansion
US8086451B2 (en) 2005-04-20 2011-12-27 Qnx Software Systems Co. System for improving speech intelligibility through high frequency compression
US8249861B2 (en) 2005-04-20 2012-08-21 Qnx Software Systems Limited High frequency compression integration
ES2753228T3 (en) 2012-11-05 2020-04-07 Panasonic Ip Corp America Voice Audio Coding Device, Voice Audio Decoding Device, Voice Audio Coding Procedure and Voice Audio Decoding Procedure
JP6976898B2 (en) 2018-04-06 2021-12-08 株式会社日立製作所 Monitoring system

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
ATE92690T1 (en) * 1989-05-17 1993-08-15 Telefunken Fernseh & Rundfunk METHOD OF TRANSMITTING A SIGNAL.

Also Published As

Publication number Publication date
JPH07147566A (en) 1995-06-06

Similar Documents

Publication Publication Date Title
CN100557687C (en) Be used to improve the system of voice quality and intelligibility
RU2585987C2 (en) Device and method of processing speech/audio signal
US8195471B2 (en) Sampling rate conversion apparatus, coding apparatus, decoding apparatus and methods thereof
EP0154381B1 (en) Digital speech coder with baseband residual coding
EP1356454B1 (en) Wideband signal transmission system
US5068899A (en) Transmission of wideband speech signals
Crochiere On the Design of Sub‐band Coders for Low‐Bit‐Rate Speech Communication
EP0929891B1 (en) Methods and devices for noise conditioning signals representative of audio information in compressed and digitized form
JPH08237132A (en) Signal coding method and device, signal decoding method and device, and information recording medium and information transmission method
CN1254221A (en) Method and device for producing wide-band signal based on narrow-band signal and its technical equipment
JP6073456B2 (en) Speech enhancement device
CA2399253C (en) Speech decoder and method of decoding speech involving frequency expansion
JP3219762B2 (en) Signal transmission method
US20070213976A1 (en) Method and apparatus for transmitting wideband speech signals
JP2570603B2 (en) Audio signal transmission device and noise suppression device
JPS63142399A (en) Voice analysis/synthesization method and apparatus
US5781885A (en) Compression/expansion method of time-scale of sound signal
JPH0946233A (en) Sound encoding method/device and sound decoding method/ device
US5899966A (en) Speech decoding method and apparatus to control the reproduction speed by changing the number of transform coefficients
US5687243A (en) Noise suppression apparatus and method
JP2958726B2 (en) Apparatus for coding and decoding a sampled analog signal with repeatability
JP2005114814A (en) Method, device, and program for speech encoding and decoding, and recording medium where same is recorded
RU2144222C1 (en) Method for compressing sound information and device which implements said method
JP3998281B2 (en) Band division encoding method and decoding method for digital audio signal
JP3842187B2 (en) Compression / decompression method and compression / decompression apparatus