JPH0236628A - Transmission system and transmission/reception system for voice signal - Google Patents
Transmission system and transmission/reception system for voice signalInfo
- Publication number
- JPH0236628A JPH0236628A JP63187521A JP18752188A JPH0236628A JP H0236628 A JPH0236628 A JP H0236628A JP 63187521 A JP63187521 A JP 63187521A JP 18752188 A JP18752188 A JP 18752188A JP H0236628 A JPH0236628 A JP H0236628A
- Authority
- JP
- Japan
- Prior art keywords
- noise
- voice
- frame
- code block
- speech
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 230000005540 biological transmission Effects 0.000 title claims description 16
- 230000005236 sound signal Effects 0.000 claims description 18
- 238000000034 method Methods 0.000 claims description 12
- 238000000926 separation method Methods 0.000 claims description 3
- 238000010586 diagram Methods 0.000 description 8
- 238000009499 grossing Methods 0.000 description 5
- 230000003044 adaptive effect Effects 0.000 description 2
- 238000013139 quantization Methods 0.000 description 2
- 230000006835 compression Effects 0.000 description 1
- 238000007906 compression Methods 0.000 description 1
- 238000007796 conventional method Methods 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
Landscapes
- Transmission Systems Not Characterized By The Medium Used For Transmission (AREA)
- Time-Division Multiplex Systems (AREA)
Abstract
Description
【発明の詳細な説明】
[発明の目的]
(産業上の利用分野)
本発明は、音声信号を有音区間と背景雑音のある無音区
間の存在を考慮して送信することにより、回線の釘効利
用と自然性に優れた音声の再生を可能とした音声信号の
送信方式及び送受信方式に関する。[Detailed Description of the Invention] [Objective of the Invention] (Industrial Application Field) The present invention eliminates the problem of line congestion by transmitting audio signals taking into account the presence of sound sections and silent sections with background noise. The present invention relates to an audio signal transmission method and a transmission/reception method that enable reproduction of audio with excellent efficiency and naturalness.
(従来の技術)
音声信号、特に会話音声の信号は有音区間と無音区間と
で構成されており、会話音声としての情報は有音区間の
みに含まれている。そこで、音声信号を符号化して送信
する場合、従来では有音区間の符号のみを送信すること
により、回線の有効利用が図る方式がとられている。(Prior Art) An audio signal, particularly a conversational audio signal, consists of a sound section and a silent section, and information about the conversational sound is included only in the sound section. Therefore, when a voice signal is encoded and transmitted, a conventional method has been adopted in which only the codes of the voiced sections are transmitted, thereby making effective use of the line.
第6図及び第7図はこのような方式に基づ〈従来の音声
信号送受信システムを示したものであり、第6図は送信
側、第7図は受信側の構成をそれぞれ示す。送信側にお
いては、有音検出器61で入力された音声信号を有音区
間と無音区間とに区別し、符号器62により有音区間の
みを符号化して送信する。FIGS. 6 and 7 show conventional audio signal transmitting and receiving systems based on such a system, with FIG. 6 showing the configuration of the transmitting side and FIG. 7 showing the configuration of the receiving side, respectively. On the transmitting side, a speech detector 61 distinguishes the input audio signal into a speech section and a silent section, and an encoder 62 encodes and transmits only the speech section.
一方、受信側では受信した符号を復号器71(;より音
声に復号する。受信側にはさらに白色雑音発生器からな
る雑音合成器72が備えられている。On the other hand, on the receiving side, the received code is decoded into speech by a decoder 71 (;). The receiving side is further equipped with a noise synthesizer 72 consisting of a white noise generator.
切替器73は復号器71からの有音区間の音声信号があ
る時は、それをそのまま出力するが、有音区間の音声信
号がない時、すなわち無音区間では雑音合成器72から
の白色雑音を無音区間の背景雑音として出力する。The switch 73 outputs the voice signal from the decoder 71 as it is when there is a voice signal in a voice zone, but when there is no voice signal in a voice zone, that is, in a silent zone, it outputs the white noise from the noise synthesizer 72. Output as background noise during silent periods.
しかしながら、この方式では受信側において無音区間に
背景雑音として出力される雑音発生器72からの白色雑
音は、有音区間に音声信号とともに聞こえる実際の背景
雑音とは異なっているため、有音区間と無音区間とで背
景雑音が大きく変化し、非常に不自然な音声となってし
まう。However, in this method, the white noise from the noise generator 72 that is output as background noise during the silent period on the receiving side is different from the actual background noise that is heard together with the audio signal during the sound period. The background noise changes greatly between silent sections, resulting in extremely unnatural sound.
(発明が解決しようとする課題)
このように従来の技術では、送信側から雑音情報を送信
せず、受信側において無音区間に白色雑音を背景雑音と
して出力しているため、有音区間と無音区間の背景雑音
が大きく異なって聞こえてしまうという問題があった。(Problem to be Solved by the Invention) In this way, in the conventional technology, the transmitting side does not transmit noise information, and the receiving side outputs white noise as background noise in the silent section. There was a problem in that the background noise between sections sounded very different.
本発明はこのような問題点を解決し、送信側からの伝送
情報量をあまり増大させることなく、受信側において有
音区間と無音区間との間で背景雑音の変化の少ない再生
音声が得られる音声信号の送信方式及び送受信方式を提
供することを目的とする。The present invention solves these problems, and allows the receiving side to obtain reproduced audio with little change in background noise between the sound section and the silent section without significantly increasing the amount of information transmitted from the transmitting side. The purpose of this invention is to provide a method for transmitting and receiving audio signals.
[発明の構成]
(課題を解決するための手段)
本発明に係る音声信号の送信方式は、有音・無音判定手
段において音声信号を所定長のフレームに区切り、フレ
ーム毎に有音部か無音部かを判定し、有音部と判定され
た有音フレームは有音符号化手段へ、また無音部と判定
された雑音フレームはバッファ手段へそれぞれ出力する
。有音符号化手段では、有音フレームを符号化して符号
ブロックを生成するとともに、各符号ブロックにそれが
有名の符号ブロックであることを示す識別情報を付加す
る。バッファ手段は所定数Tの雑音フレ−ムを蓄積する
と、そのT個の21音フレームを雑音符号化手段へ転送
する。雑音符号化手段では、T個の雑音フレームについ
て所定の基準で選んだ所定のフレームについて符号化を
行なってに個の符号ブロックを生成し、各々の符号ブロ
ックに雑音の符号ブロックであることを示す識別情報を
付加する。そして、有音符号化手段及び雑音符号化手段
により得られた有音及び雑音の符号ブロックを送信する
。[Structure of the Invention] (Means for Solving the Problems) The audio signal transmission method according to the present invention divides the audio signal into frames of a predetermined length in the voice/silence determining means, and determines whether there is a voice portion or a silent portion for each frame. A sound frame determined to be a sound part is outputted to a sound encoding means, and a noise frame determined to be a silent part is outputted to a buffer means. The voice encoding means encodes the voice frame to generate code blocks, and adds identification information to each code block indicating that it is a famous code block. When the buffer means accumulates a predetermined number T of noise frames, it transfers the T 21-tone frames to the noise encoding means. The noise encoding means encodes a predetermined frame selected based on a predetermined criterion among the T noise frames to generate T code blocks, and indicates to each code block that it is a noise code block. Add identification information. Then, the speech and noise code blocks obtained by the speech encoding means and the noise encoding means are transmitted.
また、本発明に係る音声信号の送受信方式では、上述の
ようにして送信側から有音及び雑音の符号ブロックを送
信する。これを受信する受信側では、まず符号ブロック
分離手段により各符号ブロックを該符号ブロックに付加
されている識別情報に基づいて有音の符号ブロックか雑
音の符号ブロックか判定し、有音の符号ブロックは有音
復号手段へ、2i音の符号ブロックは雑音復号手段へ出
力する。Furthermore, in the audio signal transmission/reception system according to the present invention, code blocks of voice and noise are transmitted from the transmitting side as described above. On the receiving side that receives this, the code block separation means first determines whether each code block is a voice code block or a noise code block based on the identification information added to the code block, and then is output to the voice decoding means, and the code block of 2i tones is output to the noise decoding means.
そして、これら有音復号手段及び雑音復号手段により得
られた自゛音信号及び雑音信号を連結して出力する。Then, the natural sound signal and the noise signal obtained by the sound decoding means and the noise decoding means are concatenated and output.
(作 用)
本発明では送信側よりを音区間の情報のみでなく、無音
区間における背景雑音の情報も送信されることにより、
受信側において有音区間と無音区間とで背景雑音の変化
のほとんどない自然な再生音声が得られる。(Function) In the present invention, the transmitting side not only transmits information on sound intervals but also information on background noise in silent intervals.
On the receiving side, natural reproduced audio with almost no change in background noise between the sound section and the silent section can be obtained.
また、送信側において有音フレームはフレーム毎に符号
化されて送信されるが、雑音フレームはバッファ手段に
T個のフレームが蓄積された時点でまとめて符号化され
、フレーム数より少ないに個の符号ブロックとして送信
される。すなわち、雑音フレームは有音フレームよりも
高い圧縮率で符号化される。Furthermore, on the transmitting side, sound frames are encoded frame by frame and transmitted, but noise frames are encoded all at once when T frames have been accumulated in the buffer means, and T frames are encoded at the same time as the number of frames is less than the number of frames. Sent as a code block. That is, noise frames are encoded at a higher compression rate than speech frames.
有音区間の情報は会話の自然性を保ち、円滑な会話を進
めるためにも、伝送遅延時間は極力短い方がよいが、本
発明によると有音フレームはフレーム毎に符号化される
ため、伝送遅延時間は極めて少ない。In order to maintain the naturalness of the conversation and to proceed with smooth conversation, it is better for the transmission delay time of the information in the voiced section to be as short as possible, but according to the present invention, since the voiced frame is encoded frame by frame, Transmission delay time is extremely small.
一方、無音区間の背景雑音は会話内容の情報伝達に重要
な意味を持つわけではないが、自然な会話を行なうため
には必要である。しかし、背景雑音はその雑音の特徴が
受信側で再現できればよいため、本発明のように有音区
間より情報量を圧縮して伝送することが=1能である。On the other hand, background noise during silent periods does not have an important meaning in transmitting information about the conversation content, but is necessary for natural conversation. However, since it is only necessary that the characteristics of background noise can be reproduced on the receiving side, it is possible to compress the amount of information from the sound interval and transmit it as in the present invention.
また、本発明では雑音フレームはTフレーム分の伝送遅
延を伴なって受信側に伝達されるが、背景雑音は定常的
なものがほとんどであることから、多少の伝送遅延があ
っても自然性を損なうことはない。In addition, in the present invention, noise frames are transmitted to the receiving side with a transmission delay of T frames, but since most background noises are stationary, even if there is some transmission delay, it is natural. It will not damage.
(実施例) 以下、図面を参照して本発明の詳細な説明する。(Example) Hereinafter, the present invention will be described in detail with reference to the drawings.
第1図は本発明の一実施例に係る送信側の構成を示すブ
ロックである。同図において、送信すべき音声信号は入
力端子1を介して有音・無音判定器2に入力される。有
音・無音判定器2は入力された音声信号を所定の長さの
フレームに区切り、フレーム毎に有音部か無音部かを判
定して、有音部と判定した有音フレームと無音部と判定
した雑音フレームとを分離して出力する。FIG. 1 is a block diagram showing the configuration of a transmitting side according to an embodiment of the present invention. In the figure, an audio signal to be transmitted is input to a voice/silence determiner 2 via an input terminal 1. The sound/silence determiner 2 divides the input audio signal into frames of a predetermined length, determines whether each frame is a sound part or a silent part, and separates the sound frame determined to be a sound part and the silent part. and the determined noise frame are separated and output.
有音・無音判定器2から出力された有音フレームは、6
− g符号器3に入力される。この4音符号器3は入力
された有音フレームを例えばAPC−MLQ (最大量
子化付適応予測符号化)。The sound frames output from the sound/silence determiner 2 are 6
- input to g encoder 3; The four-tone encoder 3 converts the input voice frame into, for example, APC-MLQ (adaptive predictive coding with maximum quantization).
ATC−VQ (ベクトル量子化付適応変換符号化)等
の符号化法により符号化し、ある長さの符号列を符号ブ
ロックとするとともに、その符号ブロックの先頭に有音
の符号ブロックであることを示す識別情報を付加して出
力する。また、この符号ブロックを送信回路6を介して
送信する際には、各71号ブロックの始まりと終わりを
示す情報も付加してもよい。ここで、有音フレームと符
号ブロックとは1;1で対応している必要はなく、例え
ばいくつかのを音フレームを1個の符号ブロックに対応
させてもよいし、1個の4客フレームを複数の符号ブロ
ックに対応させてもよい。また、符号ブロックの長さは
一定でなくともよく、可変長ブロックであってもよい。It is encoded using a coding method such as ATC-VQ (adaptive transform coding with vector quantization), and a code string of a certain length is used as a code block, and the beginning of the code block is marked as a voice code block. The identification information shown is added and output. Furthermore, when transmitting this code block via the transmitting circuit 6, information indicating the start and end of each No. 71 block may also be added. Here, there is no need for a 1:1 correspondence between a voice frame and a code block; for example, several sound frames may correspond to one code block, or one four-person frame may correspond to one code block. may correspond to multiple code blocks. Further, the length of the code block does not need to be constant and may be a variable length block.
一方、有音・無音判定器2から出力された雑音フレーム
は、バッファ4に入力される。バッファ4は入力された
雑音フレームを所定の複数フレ−ム分保持する。バッフ
ァ4には雑音符号器5が接続されている。雑音符号器5
はバッファ4にT個の雑音フレームが蓄積された時、バ
ッファ4に転送指令を出し、それによって転送されてき
たT個の雑音フレームをまとめて符号化し、k個の符号
ブロックを出力する。なお、T、には必ずしも一定であ
る必要はない。On the other hand, the noise frame output from the voice/silence determiner 2 is input to the buffer 4. The buffer 4 holds a predetermined number of input noise frames. A noise encoder 5 is connected to the buffer 4. noise encoder 5
When T noise frames are accumulated in the buffer 4, it issues a transfer command to the buffer 4, collectively encodes the T noise frames transferred, and outputs k code blocks. Note that T does not necessarily have to be constant.
有音符号器3及び無音符号器5から得られた有音及び無
音の符号ブロックは、送信部6より出力端子7を経て伝
送路に送出され、送信される。The sound and silence code blocks obtained from the sound coder 3 and the soundless coder 5 are sent from the transmitter 6 to the transmission path via the output terminal 7 and are transmitted.
第2図は雑音符号器5の具体的な構成例を示すブロック
図である。第1図のバッファ4からの雑音フレームは、
端子11を介してフレーム内特徴検出器12に人力され
る。この特徴検出器12は雑音フレーム内の特徴を分析
・検出し、フレーム内時微量を出力する。このフレーム
内時微量は、バッファ13へ転送されて蓄積される。フ
レーム間特徴検出器14はバッファ13に蓄積されたフ
レーム内時微量より、フレーム間特徴量を検出する。判
定器15はバッファ13に蓄積されたフレーム内時微量
と、フレーム間特徴検出器14によって検出されたフレ
ーム開時微量に基づいて、T個の雑音フレームのうちj
個のフレームを符号化することを決定する。この判定器
15の判定結果は、バッファ13を介してフレーム内特
徴検出器12の出力が入力されている符号器16に与え
られる。符号器16は判定器15の判定結果に従って、
j個の雑音フレームのフレーム内時微量を符号化し、端
子17を経て第1図の送信部6へ出力する。FIG. 2 is a block diagram showing a specific example of the configuration of the noise encoder 5. As shown in FIG. The noise frame from buffer 4 in FIG.
The intra-frame feature detector 12 is inputted via a terminal 11 . This feature detector 12 analyzes and detects features within the noise frame and outputs a trace amount within the frame. This intra-frame time trace amount is transferred to the buffer 13 and accumulated. The inter-frame feature detector 14 detects inter-frame feature amounts from the intra-frame time traces accumulated in the buffer 13. Based on the intra-frame time trace amount accumulated in the buffer 13 and the frame opening time trace amount detected by the inter-frame feature detector 14, the determiner 15 selects j of the T noise frames.
Decide to encode frames. The determination result of the determiner 15 is applied via the buffer 13 to the encoder 16 to which the output of the intra-frame feature detector 12 is input. According to the determination result of the determiner 15, the encoder 16
The intra-frame time traces of j noise frames are encoded and output to the transmitter 6 in FIG. 1 via the terminal 17.
第2図に示した雑音符号器5の各部をさらに具体的に説
明すると、まずフレーム内特徴検出器12は例えば1フ
レーム毎に雑音フレーム内のサンプルの電力の和、フー
リエ係数、自己相関係数。More specifically, each part of the noise encoder 5 shown in FIG. .
線形予ul係数等の1個の特徴量を計算する。m番目の
雑音フレームにおけるi番目の特徴】をCAI(m)(
m−1,2,−、T%i−1,2,−■)とする。こう
して計算されたフレーム内時微量CAi(m)は、バッ
ファ13によりm−1〜Tまで保持される。One feature such as a linear pre-ul coefficient is calculated. i-th feature in m-th noise frame] is defined as CAI(m)(
m-1,2,-, T%i-1,2,-■). The intra-frame time minute amount CAi(m) thus calculated is held by the buffer 13 from m-1 to T.
フレーム間特徴検出器14ではバッファ13にフレーム
開時mf;kc Ai(i) (m −1〜T)が蓄積
された時点で、T個のフレーム間での相関CI i(m
、n)を検出する。例えばCAi(a+)をm番目の雑
音フレーム内のフーリエ変換とすると、その第1成分C
A if)はm番目のフレームの電力となる。フレーム
間相関としては、例えばCA i(m)(m−1〜T)
とCA I(11)との相関CI i(m、n)(m−
1〜T s n−1〜T)等を用いることができる。In the interframe feature detector 14, when the frame opening time mf;kc Ai(i) (m -1~T) is accumulated in the buffer 13, the correlation CI i(m
, n) is detected. For example, if CAi(a+) is the Fourier transform in the m-th noise frame, its first component C
A if) is the power of the m-th frame. As the interframe correlation, for example, CA i(m)(m-1~T)
and CA I (11) correlation CI i (m, n) (m-
1 to T s n-1 to T), etc. can be used.
判定器15ではバッファ13に蓄積されているフレーム
内特徴隘CA 1(i)と、フレーム間特徴検出器14
からのフレーム間特徴ゴ(フレーム間相関) CI l
(i、n)より、T個の雑音フレームのうちの符号化す
べきフレーム数jを決定する。例えば判定の閾値T h
l、 T h2とすると、CA 1(1)≧Tblな
らば、
j =a+In [n l CI l(1,n) l
>Th2] ・=(1)CA 1(1)< T
hlならば、
j−0・・・(2)
のようにしてjを決定する。但し、(1)式は[]内の
条件を満たす最小のnを表わす。The determiner 15 uses the intra-frame feature CA 1(i) stored in the buffer 13 and the inter-frame feature detector 14.
Inter-frame features (inter-frame correlation) from CI l
From (i, n), the number j of frames to be encoded among the T noise frames is determined. For example, the determination threshold T h
l, T h2, if CA 1(1)≧Tbl, then j = a+In [n l CI l(1, n) l
>Th2] ・=(1)CA 1(1)<T
If hl, determine j as follows: j-0...(2). However, formula (1) represents the minimum n that satisfies the conditions in [ ].
符号器16では、判定器15で計算されたjに基づいて
、バッチ13内の先頭からj個の雑音フレームの特徴量
をに個の符号プロ、ツクとして符号化し、各符号ブロッ
クの先頭に雑音の符号ブロックであることを示す識別情
報を付加して出力する。The encoder 16 encodes the features of the j noise frames from the beginning in the batch 13 as j code blocks based on j calculated by the determiner 15, and adds noise at the beginning of each code block. The code block is output with identification information indicating that it is a code block.
また、この符号ブロックを送信回路6を介して送信する
際には、各符号ブロックの始まりと終わりを示す情報も
付加する。このように無音区間の雑音フレームは、雑音
の有意性が大きい場合、換言すれば背景雑音として認識
されるレベル以上の場合のみ符号化されて送信される。Furthermore, when transmitting this code block via the transmission circuit 6, information indicating the start and end of each code block is also added. In this way, a noise frame in a silent section is encoded and transmitted only when the significance of the noise is large, in other words, when the noise is at a level equal to or higher than that recognized as background noise.
第3図は受信側の構成を示すブロック図である。FIG. 3 is a block diagram showing the configuration of the receiving side.
同図において、第1図の送信側から送信された信号は入
力端子20より受信部21に人力される。In the same figure, a signal transmitted from the transmitting side shown in FIG.
受信部21で受信された信号は符号ブロック分離器22
に入力される。符号ブロック分離器22は人力された符
号ブロックに付加されている識別情報に基づいて何台符
号ブロックと雑音符号ブロックとの識別を行ない、有音
符号ブロックは有音復号器23へ、無音符号ブロックは
バッファ24へそれぞれ転送する。有音復号器23では
、第1図の有音符号器3と逆のプロセスで有音符号ブロ
ックを復号する。The signal received by the receiving unit 21 is sent to the code block separator 22
is input. The code block separator 22 distinguishes between code blocks and noise code blocks based on the identification information added to the manually input code blocks, and sends the voice code blocks to the voice decoder 23, and sends the voice code blocks to the voice decoder 23. are transferred to the buffer 24, respectively. The sound decoder 23 decodes the sound code block in a process reverse to that of the sound encoder 3 in FIG.
バッファ24は入力された無音符号ブロックを一時蓄積
し、バッファ監視器26の指示により蓄積した雑音符号
ブロックをもう一つのバッファ25へ転送する。バッフ
ァ25は雑音復号器27が復号すべき雑音符号ブロック
を蓄積し、バ・ソファ監視器26の指示により雑音復号
器27へ転送する。The buffer 24 temporarily stores input silence code blocks and transfers the stored noise code blocks to another buffer 25 according to instructions from the buffer monitor 26 . The buffer 25 stores noise code blocks to be decoded by the noise decoder 27, and transfers them to the noise decoder 27 according to instructions from the bus monitor 26.
バッファ監視器26では、バッファ24にk。The buffer monitor 26 stores k in the buffer 24.
番目の雑音符号ブロックが入った後、ある時間Tb待っ
ても次の雑音符号ブロックが到来しなかった場合、バッ
ファ24内のに個の雑音符号ブロックをバッファ25へ
転送する。この時バッファ25内に蓄積されている雑音
符号ブロックの数をk”とする。バッファ25内のi番
目の雑音符号ブロックが復号された後、バッファ24内
のi番目の雑音符号ブロックをi−1〜に゛の順序でバ
ッファ25へ転送する。ここで、k’ >k”であって
、バッファ25内の最後の雑音ブロックを復号し終わっ
てもバッファ24内に雑音符号ブロックがまだ残ってい
る場合、バッファ24内の残りの雑音符号ブロックを直
ちにバッファ25へ転送する。逆に、k’ <k”の場
合は、バッファ24内の雑音符号ブロックを全てバッフ
ァ25へ転送し終わってもバッファ25内に前の雑音符
号ブロックが残っているので、それは消去する。その後
、k ”−k ’ とする。If the next noise code block does not arrive even after waiting for a certain period of time Tb after the th noise code block has entered, the noise code blocks in the buffer 24 are transferred to the buffer 25. The number of noise code blocks stored in the buffer 25 at this time is k''. After the i-th noise code block in the buffer 25 is decoded, the i-th noise code block in the buffer 24 is They are transferred to the buffer 25 in the order of 1 to 2. Here, if k'>k'', and even after the last noise block in the buffer 25 has been decoded, there are still noise code blocks remaining in the buffer 24. If so, the remaining noise code blocks in the buffer 24 are immediately transferred to the buffer 25. Conversely, if k'<k'', even after all the noise code blocks in the buffer 24 have been transferred to the buffer 25, the previous noise code block remains in the buffer 25, so it is deleted. After that, Let k ”−k ′.
雑音復号器27ではバッファ25に蓄積された雑音符号
ブロックについて、先頭から第2図の符号器16と逆の
プロセスで復号を行なうとともに、バッファ監視器26
からk”の情報を知り、k番目の雑音符号ブロックを復
号したら、再び先頭の雑音符号ブロックから復号を行な
う。The noise decoder 27 decodes the noise code blocks accumulated in the buffer 25 from the beginning in a process reverse to that of the encoder 16 in FIG.
When the kth noise code block is decoded, decoding is performed again starting from the first noise code block.
有音復号器23及び雑音復号器27によりそれぞれ得ら
れた復号結果である有音信号及び雑音信号は、切替器2
8に入力される。切替器28では有音復号器23からの
有音信号が入かされている場合は、それをそのまま出力
し、有音復号器23からの復号結果の入力がない場合は
、雑音復号器27からの雑音信号を出力する。すなわち
、切替器28では有音復号器23の出力と雑音復号器2
7の出力とを連結して出力する。この切替器28の出力
は、スムージングフィルタ29に人力される。スムジン
グフィルタ29では符号器からの1(°°番目の符号ブ
ロックの出力と1番目の符号ブロックの出力との連結部
、及びq音復号′a23の出力と雑音復号器27の出力
との連結部をスムージングの操作により滑らかにする。The voice signal and the noise signal, which are the decoding results obtained by the voice decoder 23 and the noise decoder 27, respectively, are sent to the switch 2.
8 is input. If the switcher 28 receives a voice signal from the voice decoder 23, it is output as is, and if the decoding result from the voice decoder 23 is not input, it is output from the noise decoder 27. outputs a noise signal. That is, the switch 28 outputs the output of the voice decoder 23 and the noise decoder 2.
7 is connected and output. The output of this switch 28 is input to a smoothing filter 29 . The smoothing filter 29 connects the output of the 1 (°° code block) and the output of the 1st code block from the encoder, and connects the output of the q-tone decoder 'a23 and the output of the noise decoder 27. Smooth the area using the smoothing operation.
このスムージングフィルタ2つの出力は、出力端子30
より再生音声として出力される。The outputs of these two smoothing filters are output from output terminal 30.
It is output as playback audio.
次に、第4図及び第5図を参照して、第1図における雑
音符号器5の他の構成例を説明する。Next, another example of the configuration of the noise encoder 5 in FIG. 1 will be described with reference to FIGS. 4 and 5.
第2図に示した例では、符号器16にフレーム内特徴検
出器12の出力がバッファ13を介して入力されている
が、第4図の例では第1図のバッファ4からの雑音フレ
ームが端子11より直接符号器16に入力されている。In the example shown in FIG. 2, the output of the intraframe feature detector 12 is input to the encoder 16 via the buffer 13, but in the example shown in FIG. The signal is directly input to the encoder 16 from the terminal 11.
この場合、符号器16は人力された雑音フレームの先頭
からjフレーム分をDPCMや直交変換符号化等の方法
により符号化し、その初号をに個の符号ブロックに分け
る。そして、前述と同様に各符号ブロックの先頭に雑音
の符号ブロックであることを示す識別情報を付加して出
力する。In this case, the encoder 16 encodes j frames from the beginning of the human-generated noise frame using a method such as DPCM or orthogonal transform encoding, and divides the initial code into code blocks. Then, as described above, identification information indicating that the code block is a noise code block is added to the beginning of each code block and output.
また、第2図ではフレーム間特徴検出器14にフレーム
内特徴検出器12の出力がバンファ13を介して人力さ
れているが、第5図では端子11を介して雑音フレーム
が直接フレーム間特徴検出器14に人力され、フレーム
内特徴の検出とフレーム間特徴の検出が・lk行して行
なわれるようになっている。In addition, in FIG. 2, the output of the intra-frame feature detector 12 is manually inputted to the inter-frame feature detector 14 via the bumper 13, but in FIG. Detection of intra-frame features and inter-frame features are performed in 1k steps.
その他、本発明は要旨を逸脱しない範囲で種々変形して
実施が可能である。In addition, the present invention can be implemented with various modifications without departing from the scope of the invention.
[発明の効果]
以上述べたように、本発明によれば無音区間においても
背景雑音に関する符号化データを送信し、受信側でそれ
に猛づいて背景雑音を再生して無音区間に出力すること
により、有音区間と無音区間とで定常的な背景背景雑音
についてはほとんど変化がなくなるため、自然性に優れ
た再生音声が得られる。[Effects of the Invention] As described above, according to the present invention, encoded data related to background noise is transmitted even during a silent section, and the receiving side uses it to reproduce the background noise and output it during the silent section. Since there is almost no change in the stationary background noise between the sound section and the silent section, reproduced speech with excellent naturalness can be obtained.
また、背景雑音の情報は有音区間の情報と異なり、あま
り正確な再現は必要なく、しかも時間的に遅れがあって
も定常的な成分がほとんどであるために不自然さを与え
ないという点に着目して、T個の雑音フレームをまとめ
て、H音フレームより少ない符号ブロックにして送信す
るため、伝送情報量が増大することがなく、伝送効率の
低下を最少限に止どめるとかできる。Additionally, background noise information differs from the information of voiced sections in that it does not require very accurate reproduction, and even if there is a time delay, it does not cause any unnaturalness because it is mostly composed of stationary components. By focusing on T noise frames and transmitting them as code blocks smaller than H sound frames, the amount of transmitted information does not increase and the decrease in transmission efficiency is kept to a minimum. can.
第1図は本発明の一実施例における送信側の構成を示す
ブロック図、第2図は第1図における雑音符号器の具体
的な構成例を示すブロック図、第3図は本発明の一実施
例における受信側の構成を示すブロック図、第4図及び
第5図は本発明における雑音符号器の他の構成例を示す
ブロック図、第6図及び第7図は従来の音声信号の送受
信方式を説明するためのブロック図である。
1・・・音声信号入力端子、2・・・有音・無音判定器
、3・・・有音符号器、4・・・バッファ、5・・・雑
音符号器、6・・・送信部、7・・・送信出力端子、2
0・・・受信入力端子、21・・・受信部、22・・・
符号ブロック分離器、23・・・有音復号器、27・・
・雑音復号器、28・・・切替器、29・・・スムージ
ングフィルタ、30・・・再生音声出力端子。
出願人代理人 弁理士 鈴江武彦
第1図
第5図
第6図
第2図
第7図FIG. 1 is a block diagram showing the configuration of the transmitting side in one embodiment of the present invention, FIG. 2 is a block diagram showing a specific configuration example of the noise encoder in FIG. 1, and FIG. FIGS. 4 and 5 are block diagrams showing other configuration examples of the noise encoder according to the present invention. FIGS. 6 and 7 are diagrams showing the conventional transmission and reception of audio signals. FIG. 2 is a block diagram for explaining the method. DESCRIPTION OF SYMBOLS 1... Audio signal input terminal, 2... Speech/no-speech determiner, 3... Speech encoder, 4... Buffer, 5... Noise encoder, 6... Transmitter, 7... Transmission output terminal, 2
0... Reception input terminal, 21... Receiving section, 22...
Code block separator, 23...Speech decoder, 27...
- Noise decoder, 28... Switcher, 29... Smoothing filter, 30... Playback audio output terminal. Applicant's Representative Patent Attorney Takehiko Suzue Figure 1 Figure 5 Figure 6 Figure 2 Figure 7
Claims (2)
毎に有音部か無音部かを判定し、有音部と判定された有
音フレーム及び無音部と判定された雑音フレームを分離
出力する有音・無音判定手段と、 この有音・無音判定手段により得られた有音フレームを
符号化して符号ブロックを生成するとともに、各符号ブ
ロックに有音の符号ブロックであることを示す識別情報
を付加する有音符号化手段と、 前記有音・無音判定手段により得られた雑音フレームを
保持するバッファ手段と、 前記バッファ手段に所定数Tの雑音フレームが蓄積され
た時、そのT個の雑音フレームに対してk個の符号ブロ
ックを生成し、各々の符号ブロックに雑音の符号ブロッ
クであることを示す識別情報を付加する雑音符号化手段
と、 前記有音符号化手段及び雑音符号化手段により得られた
有音及び雑音の符号ブロックを送信する手段とを備えた
ことを特徴とする音声信号の送信方式。(1) Divide the audio signal into frames of a predetermined length, determine whether each frame is a voiced portion or a silent portion, and separate and output the voiced frame determined to be a voiced portion and the noise frame determined to be a silent portion. A speech/non-speech determination means; a speech frame obtained by the speech/non-speech determination means is encoded to generate a code block, and each code block is provided with identification information indicating that it is a speech code block. a voice encoding means for adding; a buffer means for holding the noise frames obtained by the voice/non-speech determining means; and when a predetermined number T of noise frames are accumulated in the buffer means, the T noise frames are noise encoding means for generating k code blocks for a frame and adding identification information to each code block indicating that it is a noise code block; and means for transmitting the obtained voiced and noise code blocks.
毎に有音部か無音部かを判定し、有音部と判定された有
音フレーム及び無音部と判定された雑音フレームを分離
出力する有音・無音判定手段と、 この有音・無音判定手段により得られた有音フレームを
符号化して符号ブロックを生成するとともに、各符号ブ
ロックに有音の符号ブロックであることを示す識別情報
を付加する有音符号化手段と、 前記有音・無音判定手段により得られた雑音フレームを
保持するバッファ手段と、 前記バッファ手段に所定数Tの雑音フレームが蓄積され
た時、そのT個の雑音フレームに対してk個の符号ブロ
ックを生成し、各々の符号ブロックに雑音の符号ブロッ
クであることを示す識別情報を付加する雑音符号化手段
と、 前記有音符号化手段及び雑音符号化手段により得られた
有音及び雑音の符号ブロックを送信する手段と、 この手段により送信された各符号ブロックを該符号ブロ
ックに付加されている識別情報に基づいて有音の符号ブ
ロックか雑音の符号ブロックか判定し、有音及び無音の
符号ブロックを分離して出力する符号ブロック分離手段
と、 この手段により得られた有音の符号ブロックを復号する
有音復号手段と、 前記符号ブロック分離手段により得られた雑音の符号ブ
ロックを復号する雑音復号手段と、前記有音復号手段及
び雑音復号手段により得られた有音信号及び雑音信号を
連結して出力する手段とを備えたことを特徴とする音声
信号の送受信方式。(2) Divide the audio signal into frames of a predetermined length, determine whether each frame is a voiced portion or a silent portion, and separate and output the voiced frame determined to be a voiced portion and the noise frame determined to be a silent portion. A speech/non-speech determination means; a speech frame obtained by the speech/non-speech determination means is encoded to generate a code block, and each code block is provided with identification information indicating that it is a speech code block. a voice encoding means for adding; a buffer means for holding the noise frames obtained by the voice/non-speech determining means; and when a predetermined number T of noise frames are accumulated in the buffer means, the T noise frames are noise encoding means for generating k code blocks for a frame and adding identification information to each code block indicating that it is a noise code block; means for transmitting the obtained voiced and noise code blocks; and a method for determining whether each code block transmitted by the means is a voiced code block or a noise code block based on identification information added to the code block. code block separation means for determining and separating and outputting voiced and silent code blocks; voice decoding means for decoding the voiced code blocks obtained by this means; and code block separation means for decoding the voiced code blocks obtained by this means; a noise decoding means for decoding a code block of noise; and a means for concatenating and outputting a voice signal and a noise signal obtained by the voice decoding means and the noise decoding means. transmission and reception method.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP63187521A JPH0236628A (en) | 1988-07-27 | 1988-07-27 | Transmission system and transmission/reception system for voice signal |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP63187521A JPH0236628A (en) | 1988-07-27 | 1988-07-27 | Transmission system and transmission/reception system for voice signal |
Publications (1)
Publication Number | Publication Date |
---|---|
JPH0236628A true JPH0236628A (en) | 1990-02-06 |
Family
ID=16207535
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP63187521A Pending JPH0236628A (en) | 1988-07-27 | 1988-07-27 | Transmission system and transmission/reception system for voice signal |
Country Status (1)
Country | Link |
---|---|
JP (1) | JPH0236628A (en) |
Cited By (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5234526A (en) * | 1991-05-24 | 1993-08-10 | Lam Research Corporation | Window for microwave plasma processing device |
US5687283A (en) * | 1995-05-23 | 1997-11-11 | Nec Corporation | Pause compressing speech coding/decoding apparatus |
KR100357254B1 (en) * | 1995-10-13 | 2003-01-10 | 프랑스 뗄레꽁(소시에떼 아노님) | Method and Apparatus for Generating Comfort Noise in Voice Numerical Transmission System |
JP2003018114A (en) * | 2001-06-29 | 2003-01-17 | Nec Corp | Aural signal transmission equipment |
US6658645B1 (en) | 1999-01-28 | 2003-12-02 | Fujitsu Limited | Method for automatically generating corrected program inherited program, automatic program generation apparatus, and storage medium storing program for automatically generating corrected program inherited program |
WO2006008932A1 (en) * | 2004-07-23 | 2006-01-26 | Matsushita Electric Industrial Co., Ltd. | Audio encoding device and audio encoding method |
JP2006242979A (en) * | 2005-02-28 | 2006-09-14 | Nec Corp | Device and method for supplying sound source |
JP2019152710A (en) * | 2018-03-01 | 2019-09-12 | 株式会社コルグ | One-bit audio signal generation device and program |
-
1988
- 1988-07-27 JP JP63187521A patent/JPH0236628A/en active Pending
Cited By (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5234526A (en) * | 1991-05-24 | 1993-08-10 | Lam Research Corporation | Window for microwave plasma processing device |
US5687283A (en) * | 1995-05-23 | 1997-11-11 | Nec Corporation | Pause compressing speech coding/decoding apparatus |
KR100357254B1 (en) * | 1995-10-13 | 2003-01-10 | 프랑스 뗄레꽁(소시에떼 아노님) | Method and Apparatus for Generating Comfort Noise in Voice Numerical Transmission System |
US6658645B1 (en) | 1999-01-28 | 2003-12-02 | Fujitsu Limited | Method for automatically generating corrected program inherited program, automatic program generation apparatus, and storage medium storing program for automatically generating corrected program inherited program |
JP2003018114A (en) * | 2001-06-29 | 2003-01-17 | Nec Corp | Aural signal transmission equipment |
WO2006008932A1 (en) * | 2004-07-23 | 2006-01-26 | Matsushita Electric Industrial Co., Ltd. | Audio encoding device and audio encoding method |
JPWO2006008932A1 (en) * | 2004-07-23 | 2008-05-01 | 松下電器産業株式会社 | Speech coding apparatus and speech coding method |
US8670988B2 (en) | 2004-07-23 | 2014-03-11 | Panasonic Corporation | Audio encoding/decoding apparatus and method providing multiple coding scheme interoperability |
JP2006242979A (en) * | 2005-02-28 | 2006-09-14 | Nec Corp | Device and method for supplying sound source |
JP4572123B2 (en) * | 2005-02-28 | 2010-10-27 | 日本電気株式会社 | Sound source supply apparatus and sound source supply method |
US8271110B2 (en) | 2005-02-28 | 2012-09-18 | Nec Corporation | Sound source supply apparatus and sound source supply method |
JP2019152710A (en) * | 2018-03-01 | 2019-09-12 | 株式会社コルグ | One-bit audio signal generation device and program |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US5978756A (en) | Encoding audio signals using precomputed silence | |
JP3781495B2 (en) | Method and apparatus for creating comfortable noise in digital audio transmission systems. | |
JP4146489B2 (en) | Audio packet reproduction method, audio packet reproduction apparatus, audio packet reproduction program, and recording medium | |
JP3182032B2 (en) | Voice coded communication system and apparatus therefor | |
JP2697642B2 (en) | ATM speech encoder | |
JP2003076394A (en) | Method and device for sound code conversion | |
JP2010170142A (en) | Method and device for generating bit rate scalable audio data stream | |
WO2007140724A1 (en) | A method and apparatus for transmitting and receiving background noise and a silence compressing system | |
US5890109A (en) | Re-initializing adaptive parameters for encoding audio signals | |
JPH0236628A (en) | Transmission system and transmission/reception system for voice signal | |
JPH1049199A (en) | Silence compressed voice coding and decoding device | |
JP2728122B2 (en) | Silence compressed speech coding / decoding device | |
JP2900987B2 (en) | Silence compressed speech coding / decoding device | |
JP3487158B2 (en) | Audio coding transmission system | |
JP2982637B2 (en) | Speech signal transmission system using spectrum parameters, and speech parameter encoding device and decoding device used therefor | |
JP2002252644A (en) | Apparatus and method for communicating voice packet | |
JP4597360B2 (en) | Speech decoding apparatus and speech decoding method | |
JP3001584B2 (en) | Audio signal transmission method | |
KR100590769B1 (en) | Transcoding Appratus and method | |
JP3055608B2 (en) | Voice coding method and apparatus | |
JPH08279811A (en) | Voice data converter | |
JPH11259099A (en) | Speech encoding/decoding device | |
JP3149562B2 (en) | Digital audio transmission equipment | |
JPH0526376B2 (en) | ||
JP2885225B2 (en) | Audio encoding / decoding device |