JP2010160496A - Signal processing device and signal processing method - Google Patents
Signal processing device and signal processing method Download PDFInfo
- Publication number
- JP2010160496A JP2010160496A JP2010030698A JP2010030698A JP2010160496A JP 2010160496 A JP2010160496 A JP 2010160496A JP 2010030698 A JP2010030698 A JP 2010030698A JP 2010030698 A JP2010030698 A JP 2010030698A JP 2010160496 A JP2010160496 A JP 2010160496A
- Authority
- JP
- Japan
- Prior art keywords
- noise
- encoding
- unit
- noise suppression
- suppression
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Abstract
Description
この発明は、ディジタル携帯電話システムなどをはじめ、種々のディジタル通信方式の無線通信機器に用いられ、送受話音声に重畳される雑音を軽減するノイズサプレッサ(ノイズキャンセラ)に関する。 The present invention relates to a noise suppressor (noise canceller) which is used in various digital communication system wireless communication devices such as a digital cellular phone system and reduces noise superimposed on transmitted / received speech.
移動通信の基本サービスとして、音声通信による電話サービスがある。携帯電話システムでは、当初アナログ方式で始まったが、現在では日本のPDC(Personal Digital Cellar)方式などディジタル方式が主流となってきている。 As a basic mobile communication service, there is a telephone service using voice communication. The mobile phone system originally started with an analog system, but nowadays digital systems such as the Japanese PDC (Personal Digital Cellar) system have become mainstream.
ディジタル方式では、アナログ音声信号をディジタル信号に変換するために、A/D変換器が必要となるが、ただ、A/D変換しただけでは100kbpsほどの符号化レートを必要とし、少ない電波資源を考えるとこれを1/10〜1/20に圧縮する必要がある。この要求に対し、一般には音声圧縮とよばれる音声の高能率符号化方式が用いられ、音声コーデックとして具現化されている。 In the digital system, an A / D converter is required to convert an analog voice signal into a digital signal. However, only A / D conversion requires a coding rate of about 100 kbps and uses less radio resources. Considering this, it is necessary to compress this to 1/10 to 1/20. In response to this requirement, a high-efficiency encoding method for speech called speech compression is generally used and embodied as a speech codec.
現在、移動通信では、3.5kbps〜32kbps程度の符号化レートの音声コーデックが使われているが、低レートのコーデックは、音声信号の特徴を最大限に活用して符号化レートの削減をはかっているため、音声に関しては十分な音質が得られても、音声以外の「音」に関しては再現性、音質が悪くなる傾向がある。 Currently, voice communication codecs with a coding rate of about 3.5 kbps to 32 kbps are used in mobile communications, but low-rate codecs can reduce the coding rate by making the most of the characteristics of voice signals. Therefore, even if sufficient sound quality is obtained with respect to sound, reproducibility and sound quality tend to be poor with respect to “sound” other than sound.
屋外で使用されることが多い携帯電話は、低レートの音声コーデックがアプリケーションとして使われ、かつ、背景雑音が大きな環境下で使用されることも少なくない。 Mobile phones that are often used outdoors often use low-rate audio codecs as applications and are used in environments with high background noise.
このように「音声」に的を絞った低レート音声コーデックに背景雑音を入力すると、音が変質してしまい、背景雑音環境での音声はその明瞭度や音質が劣化してしまう。 If background noise is input to a low-rate speech codec focused on “speech” in this way, the sound will be altered, and the clarity and sound quality of speech in the background noise environment will deteriorate.
この対策として、マイクから取り込まれた背景雑音を抑圧し、音声のみを音声コーデックに入力する目的で、近年注目されているのが、ノイズサプレッサ(あるいは、ノイズキャンセラ)と呼ばれる技術である。 As a countermeasure against this, a technique called a noise suppressor (or noise canceller) has been attracting attention in recent years for the purpose of suppressing background noise taken in from a microphone and inputting only speech into the speech codec.
具体例としては、(社)電波波産業会(ARIB)の「ディジタル自動車電話システム標準規格RCR STD−27」の「ハーフレート音声コーデック」の章に、ノイズキャンセラについての記述がある。 As a specific example, there is a description of a noise canceller in the “half-rate speech codec” chapter of “Digital Car Telephone System Standard RCR STD-27” of the Radio Wave Industry Association (ARIB).
ところで近時、技術革新により新たな音声コーデックが開発されており、システムに新たな音声コーデックを導入し、2モード切替(2つの音声コーデックを切り替えられる)、3モード切替(3つの音声コーデックを切り替えられる)というように、マルチモード化の流れがある。 Recently, new audio codecs have been developed due to technological innovations. New audio codecs have been introduced into the system, switching between 2 modes (switching between 2 audio codecs), switching between 3 modes (switching between 3 audio codecs) There is a flow of multi-mode.
また、その一方で、TIA IS−127の規格で知られるEVRC(Enhanced Variable Rate Codec)やAMR(Adaptive Multi Rate)のように、音声コーデックは1つであるが、複数の異なる符号化レートをサポートしているマルチレート化の方向や、さらには、ユーザの利便を考えて、端末を手に持たず通話できるハンズフリー機能の取り込みも行われてきている。 On the other hand, there is only one audio codec, such as EVRC (Enhanced Variable Rate Codec) and AMR (Adaptive Multi Rate), which are known in the TIA IS-127 standard, but it supports multiple different coding rates. In consideration of the direction of multirate and the convenience of the user, a hands-free function that allows a user to talk without holding a terminal has also been taken in.
しかしながら、このようなマルチモード化、あるいはマルチレート化を行った従来の通信機器では、音声コーデックとノイズサプレッサの相性により、選択したモードあるいはレートによっては、ノイズサプレッサが十分な機能を果たさず、高品質な送話音声あるいは受話音声が得られないという問題があった。 However, in conventional communication devices that have been multimode or multirate, the noise suppressor does not perform sufficiently depending on the selected mode or rate due to the compatibility of the voice codec and the noise suppressor. There was a problem that a high quality transmitted voice or received voice could not be obtained.
また、ハンズフリー機能を備えた従来の通信機器では、ハンズフリー/非ハンズフリーにより、マイクロホンやアナログアンプといったノイズサプレスへの音声入力経路が変化したり、特性が可変されたり、あるいはエコー制御のためエコーキャンセラなど新たなデバイスを経由するなどの使用環境の変化により、ノイズサプレッサが十分な機能を果たさず、高品質な送話音声あるいは受話音声が得られないという問題があった。 Also, with conventional communication equipment with hands-free function, the voice input path to noise suppressors such as microphones and analog amplifiers can be changed, characteristics can be varied, or echo control can be performed by hands-free / non-hands-free. Due to changes in the usage environment such as via a new device such as an echo canceller, there is a problem that the noise suppressor does not function sufficiently and high-quality transmitted or received speech cannot be obtained.
マルチモード化、マルチレート化、あるいはハンズフリー機能の追加を行った従来の通信機器では、モードおよびレートの切り替え、あるいはハンズフリー/非ハンズフリーの切り替えなど、使用設定によってノイズサプレッサが十分な機能を果たさず、送話音声あるいは受話音声が劣化するという問題があった。 In conventional communication equipment that has been added multi-mode, multi-rate, or hands-free function, the noise suppressor has sufficient functions depending on the usage setting, such as switching modes and rates, or switching between hands-free / non-hands-free There was a problem that the transmitted voice or the received voice deteriorated.
この発明は上記の問題を解決すべくなされたもので、モードおよびレートの切り替え、あるいはハンズフリー/非ハンズフリーの切り替えなど、使用設定を変化させた場合でも、ノイズサプレッサが十分な機能を発揮し、高品質な音声を送受信することが可能な信号処理装置、信号処理方法および記録媒体を提供することを目的とする。 The present invention has been made to solve the above problems, and even when the use setting is changed, such as switching between modes and rates, or switching between hands-free / non-hands-free, the noise suppressor exhibits a sufficient function. An object of the present invention is to provide a signal processing device, a signal processing method, and a recording medium capable of transmitting and receiving high-quality sound.
上記の目的を達成するために、請求項1に係わる本発明は、音声信号に含まれる雑音成分を抑圧する雑音抑圧手段と、この雑音抑圧手段にて雑音成分が抑圧された音声信号に符号化処理を施して、圧縮された符号化音声データを生成する符号化手段とを備える信号処理装置であって、符号化手段は、複数の異なる符号化処理が可能であり、雑音抑圧手段は、符号化手段にて実施される符号化処理に応じた雑音抑圧特性を有することようにした。
To achieve the above object, the present invention according to
上記構成の信号処理装置では、複数の異なる符号化処理を選択的に実施するにあたり、その前段で音声信号に含まれる雑音成分を抑圧する際に、後段で実施される符号化処理に応じた雑音成分の抑圧を行うようにしている。 In the signal processing device having the above configuration, when selectively performing a plurality of different encoding processes, noise corresponding to the encoding process performed in the subsequent stage is performed when the noise component included in the audio signal is suppressed in the previous stage. The component is suppressed.
したがって、上記構成の信号処理装置によれば、符号化処理に応じた雑音成分の抑圧が行われるので、符号化処理の内容を可変しても、十分な雑音成分の抑圧が行われ、高品質な音声を送信することができる。 Therefore, according to the signal processing device having the above configuration, noise components are suppressed according to the encoding process. Therefore, even if the content of the encoding process is varied, sufficient noise component suppression is performed, resulting in high quality. Sound can be transmitted.
また、上記の目的を達成するために、請求項8に係わる本発明は、圧縮された符号化音声データを音声信号に復号する復号手段と、この復号手段により復号された音声信号に含まれる雑音成分を抑圧する雑音抑圧手段とを備える信号処理装置であって、復号手段は、復号化音声データに応じて複数の異なる復号化処理が可能であり、雑音抑圧手段は、復号手段にて実施される復号処理に応じた雑音抑圧特性を有するようにした。
In order to achieve the above object, the present invention according to
上記構成の信号処理装置では、複数の異なる復号処理を選択的に実施し、その後段で復号された音声信号に含まれる雑音成分を抑圧する際に、実施される復号処理に応じた雑音成分の抑圧を行うようにしている。 In the signal processing device having the above configuration, when a plurality of different decoding processes are selectively performed and the noise component included in the audio signal decoded in the subsequent stage is suppressed, the noise component corresponding to the decoding process to be performed is reduced. I try to do suppression.
したがって、上記構成の信号処理装置によれば、復号処理に応じた雑音成分の抑圧が行われるので、復号処理の内容を可変しても、十分な雑音成分の抑圧が行われ、高品質な音声を受信することができる。 Therefore, according to the signal processing device having the above configuration, noise components are suppressed according to the decoding process. Therefore, even if the content of the decoding process is varied, sufficient noise component suppression is performed, and high-quality audio is suppressed. Can be received.
さらに、上記の目的を達成するために、請求項15に係わる本発明は、ハンズフリー機能を選択的に使用可能な機器に用いられる信号処理装置において、入力された音声信号に対して、ハンズフリー機能を使用した音声入力か否かに応じた雑音成分の抑圧を行う雑音抑圧手段を具備して構成するようにした。
Furthermore, in order to achieve the above object, the present invention according to
上記構成の信号処理装置では、入力された音声信号に対して、ハンズフリー機能を使用した音声入力か否かに応じた雑音成分の抑圧を行うようにしている。
したがって、上記構成の信号処理装置によれば、ハンズフリー機能を使用した音声入力か否か音声の入力経路を可変しても、十分な雑音成分の抑圧が行われ、高品質な音声を入力することができる。
In the signal processing apparatus having the above-described configuration, noise components are suppressed according to whether or not the input voice signal is a voice input using a hands-free function.
Therefore, according to the signal processing apparatus having the above configuration, even if the voice input path is changed depending on whether the voice input uses the hands-free function, sufficient noise components are suppressed, and high-quality voice is input. be able to.
また、上記の目的を達成するために、請求項20に係わる本発明は、音声信号に含まれる雑音成分を抑圧する雑音抑圧工程と、この雑音抑圧工程にて雑音成分が抑圧された音声信号に符号化処理を施して、圧縮された符号化音声データを生成する符号化工程とを備える信号処理方法であって、符号化工程は、複数の異なる符号化処理を選択的に実施し、雑音抑圧工程は、音声信号に対して、符号化工程にて選択的に実施される符号化処理に応じた雑音成分の抑圧を行うようにした。
In order to achieve the above object, the present invention according to
上記構成の信号処理方法では、複数の異なる符号化処理を選択的に実施するにあたり、その前段で音声信号に含まれる雑音成分を抑圧する際に、後段で実施される符号化処理に応じた雑音成分の抑圧を行うようにしている。 In the signal processing method having the above-described configuration, when a plurality of different encoding processes are selectively performed, noise corresponding to the encoding process performed in the subsequent stage is performed when the noise component included in the audio signal is suppressed in the previous stage. The component is suppressed.
したがって、上記構成の信号処理方法によれば、符号化処理に応じた雑音成分の抑圧が行われるので、符号化処理の内容を可変しても、十分な雑音成分の抑圧が行われ、高品質な音声を送信することができる。 Therefore, according to the signal processing method having the above configuration, noise components are suppressed according to the encoding process. Therefore, even if the content of the encoding process is varied, sufficient noise component suppression is performed, resulting in high quality. Sound can be transmitted.
さらに、上記の目的を達成するために、請求項21に係わる本発明は、圧縮された符号化音声データを音声信号に復号する復号工程と、この復号工程により復号された音声信号に含まれる雑音成分を抑圧する雑音抑圧工程とを備える信号処理方法であって、復号工程は、符号化音声データに応じて、複数の異なる復号処理を選択的に符号化音声データに対して実施し、雑音抑圧工程は、音声信号に対して、復号工程にて選択的に実施される復号処理に応じた雑音成分の抑圧を行うようにした。 In order to achieve the above object, the present invention according to claim 21 includes a decoding step of decoding compressed encoded audio data into an audio signal, and noise included in the audio signal decoded by the decoding step. A noise suppression step of suppressing a component, wherein the decoding step selectively performs a plurality of different decoding processes on the encoded speech data according to the encoded speech data, and noise suppression In the process, the noise component is suppressed for the audio signal according to the decoding process selectively performed in the decoding process.
上記構成の信号処理方法では、複数の異なる復号処理を選択的に実施し、その後段で復号された音声信号に含まれる雑音成分を抑圧する際に、実施される復号処理に応じた雑音成分の抑圧を行うようにしている。 In the signal processing method having the above configuration, when a plurality of different decoding processes are selectively performed and the noise component included in the audio signal decoded in the subsequent stage is suppressed, the noise component corresponding to the decoding process to be performed is reduced. I try to do suppression.
したがって、上記構成の信号処理方法によれば、復号処理に応じた雑音成分の抑圧が行われるので、復号処理の内容を可変しても、十分な雑音成分の抑圧が行われ、高品質な音声を受信することができる。 Therefore, according to the signal processing method having the above-described configuration, noise components are suppressed according to the decoding process. Therefore, even if the contents of the decoding process are varied, sufficient noise component suppression is performed, and high-quality audio is suppressed. Can be received.
さらにまた、上記の目的を達成するために、請求項22に係わる本発明は、ハンズフリー機能を選択的に使用可能な機器に用いられる信号処理方法において、入力された音声信号に対して、ハンズフリー機能を使用した音声入力か否かに応じた雑音成分の抑圧を行う雑音抑圧工程を具備して構成するようにした。 Furthermore, in order to achieve the above object, the present invention according to claim 22 is a signal processing method used for a device capable of selectively using a hands-free function. A noise suppression process for suppressing noise components according to whether or not the voice input uses the free function is provided.
上記構成の信号処理方法では、入力された音声信号に対して、ハンズフリー機能を使用した音声入力か否かに応じた雑音成分の抑圧を行うようにしている。
したがって、上記構成の信号処理方法によれば、ハンズフリー機能を使用した音声入力か否か音声の入力経路を可変しても、十分な雑音成分の抑圧が行われ、高品質な音声を入力することができる。
In the signal processing method having the above configuration, noise components are suppressed according to whether or not the input voice signal is a voice input using a hands-free function.
Therefore, according to the signal processing method having the above-described configuration, even if the voice input path is changed depending on whether the voice input is performed using the hands-free function, sufficient noise components are suppressed and high-quality voice is input. be able to.
また、上記の目的を達成するために、請求項23に係わる本発明は、音声信号に含まれる雑音成分を抑圧する雑音抑圧手順と、この雑音抑圧手順にて雑音成分が抑圧された音声信号に符号化処理を施して圧縮された符号化音声データを生成する符号化手順をコンピュータに実行機能させるためのプログラムを記録したコンピュータ読み取り可能な記録媒体であって、符号化手順は、複数の異なる符号化処理を選択的に実施する手順であり、雑音抑圧手順は、音声信号に対して、符号化手順にて選択的に実施される符号化処理に応じた雑音成分の抑圧を行う手順とした。 In order to achieve the above object, the present invention according to claim 23 provides a noise suppression procedure for suppressing a noise component included in a speech signal, and a speech signal in which the noise component is suppressed by the noise suppression procedure. A computer-readable recording medium storing a program for causing a computer to execute an encoding procedure for generating encoded audio data compressed by performing an encoding process, wherein the encoding procedure includes a plurality of different codes. The noise suppression procedure is a procedure for suppressing noise components according to the encoding process selectively performed in the encoding procedure for the speech signal.
上記構成の記録媒体によれば、コンピュータが、複数の異なる符号化処理を選択的に実施するにあたり、その前段で音声信号に含まれる雑音成分を抑圧する際に、後段で実施される符号化処理に応じた雑音成分の抑圧を行うようにしている。 According to the recording medium having the above configuration, when the computer selectively performs a plurality of different encoding processes, the encoding process performed in the subsequent stage when the noise component included in the audio signal is suppressed in the previous stage. The noise component is suppressed according to.
したがって、上記構成の記録媒体によれば、コンピュータでは、符号化処理に応じた雑音成分の抑圧が行われるので、符号化処理の内容を可変しても、十分な雑音成分の抑圧が行われ、高品質な音声を送信することができる。 Therefore, according to the recording medium having the above configuration, in the computer, the noise component is suppressed according to the encoding process. Therefore, even if the content of the encoding process is varied, sufficient noise component suppression is performed. High quality voice can be transmitted.
さらに、上記の目的を達成するために、請求項24に係わる本発明は、圧縮された符号化音声データを音声信号に復号する復号手順と、この復号手順により復号された音声信号に含まれる雑音成分を抑圧する雑音抑圧手段をコンピュータに実行させるためのプログラムを記録したコンピュータ読み取り可能な記録媒体であって、復号手順は、符号化音声データに応じて、複数の異なる復号処理を選択的に符号化音声データに対して実施する手順であり、雑音抑圧手順は、音声信号に対して、復号手順にて選択的に実施される復号処理に応じた雑音成分の抑圧を行う手順とした。 Furthermore, in order to achieve the above object, the present invention according to claim 24 provides a decoding procedure for decoding compressed encoded audio data into an audio signal, and a noise included in the audio signal decoded by the decoding procedure. A computer-readable recording medium storing a program for causing a computer to execute noise suppression means for suppressing a component, wherein a decoding procedure selectively encodes a plurality of different decoding processes according to encoded audio data. The noise suppression procedure is a procedure for suppressing a noise component according to a decoding process selectively performed in the decoding procedure for the audio signal.
上記構成の記録媒体によれば、コンピュータが、複数の異なる復号処理を選択的に実施し、その後段で復号された音声信号に含まれる雑音成分を抑圧する際に、実施される復号処理に応じた雑音成分の抑圧を行うようにしている。 According to the recording medium having the above configuration, when the computer selectively performs a plurality of different decoding processes and suppresses the noise component included in the audio signal decoded in the subsequent stage, the computer performs the decoding process. The noise component is suppressed.
したがって、上記構成の記録媒体によれば、コンピュータでは、復号処理に応じた雑音成分の抑圧が行われるので、復号処理の内容を可変しても、十分な雑音成分の抑圧が行われ、高品質な音声を受信することができる。 Therefore, according to the recording medium having the above configuration, the computer suppresses the noise component according to the decoding process. Therefore, even if the content of the decoding process is varied, the noise component is sufficiently suppressed, and the high quality is achieved. Voice can be received.
さらにまた、上記の目的を達成するために、請求項25に係わる本発明は、ハンズフリー機能を選択的に使用可能とする手順と、入力された音声信号に対して、ハンズフリー機能を使用した音声入力か否かに応じた雑音成分の抑圧を行う雑音抑圧手順をコンピュータに実行させるためのプログラムを記録するようにした。 Furthermore, in order to achieve the above-mentioned object, the present invention according to claim 25 uses a hands-free function for a procedure for selectively enabling the hands-free function and an input audio signal. A program for causing a computer to execute a noise suppression procedure for suppressing noise components depending on whether or not a voice is input is recorded.
上記構成の記録媒体によれば、コンピュータが、入力された音声信号に対して、ハンズフリー機能を使用した音声入力か否かに応じた雑音成分の抑圧を行うようにしている。 According to the recording medium having the above configuration, the computer suppresses noise components according to whether or not the input audio signal is an audio input using a hands-free function.
したがって、上記構成の記録媒体によれば、コンピュータでは、ハンズフリー機能を使用した音声入力か否か音声の入力経路を可変しても、十分な雑音成分の抑圧が行われ、高品質な音声を入力することができる。 Therefore, according to the recording medium having the above-described configuration, even if the voice input path is varied depending on whether or not the voice input is performed using the hands-free function, the computer can sufficiently suppress noise components and generate high-quality voice. Can be entered.
また、上記の目的を達成するために、請求項26に係わる本発明は、音声信号に含まれる雑音成分を抑圧する雑音抑圧手段と、この雑音抑圧手段にて雑音成分が抑圧された音声信号に符号化処理を施して、圧縮された符号化音声データを生成する符号化手段とを備える信号処理装置であって、符号化手段は、複数の異なる符号化方式による符号化処理を選択的に実施し、雑音抑圧手段は、互いに異なる雑音成分の抑圧特性を有する複数のノイズサプレス部を備え、音声信号に対して、符号化手段で選択的に実施される符号化処理に応じて、複数のノイズサプレス部の中から1つのノイズサプレス部を選択的に用いて雑音成分の抑圧を行うものであり、符号化手段における複数の異なる符号化方式の数をP、雑音抑圧手段のノイズサプレス部の数をQ(P,Qは共に正の整数)とした場合、PとQは、P≧Q>1の関係にあることを特徴とする。 In order to achieve the above object, the present invention according to claim 26 provides a noise suppression means for suppressing a noise component included in a speech signal, and a speech signal in which the noise component is suppressed by the noise suppression means. A signal processing apparatus including an encoding unit that performs encoding processing to generate compressed encoded audio data, wherein the encoding unit selectively performs encoding processing by a plurality of different encoding methods The noise suppression unit includes a plurality of noise suppression units having noise component suppression characteristics different from each other, and a plurality of noises are selected according to encoding processing selectively performed by the encoding unit on the audio signal. The noise component is suppressed by selectively using one noise suppressor from among the suppressors. The number of different encoding methods in the encoding means is P, and the noise suppressor of the noise suppression means The Q if (P, Q are both positive integers) was, P and Q, characterized in that in the P ≧ Q> 1 relationship.
上記構成の信号処理装置では、複数の異なる符号化方式による符号化処理を選択的に実施するにあたり、その前段で音声信号に含まれる雑音成分を抑圧する際に、後段で実施される符号化処理に応じた雑音成分の抑圧を行うノイズサプレス部を、複数のノイズサプレス部の中から選択的に用いるもので、上記複数の符号化方式の数Pと、上記複数のノイズサプレス部の数Qとの関係をP≧Q>1とするようにした。 In the signal processing device having the above-described configuration, when selectively performing encoding processing using a plurality of different encoding schemes, encoding processing performed in the subsequent stage when suppressing noise components included in the audio signal in the preceding stage A noise suppressor that suppresses noise components in accordance with is selectively used from among a plurality of noise suppressors, and the number P of the plurality of encoding methods and the number Q of the plurality of noise suppressors are The relationship of P ≧ Q> 1 was established.
したがって、上記構成の信号処理装置によれば、符号化方式の数Pとノイズサプレス部の数Qとの関係がP≧Q>1にある場合でも、符号化処理に応じた雑音成分の抑圧が行われるので、符号化処理の内容を可変しても、十分な雑音成分の抑圧が行われ、高品質な音声を送信することができる。 Therefore, according to the signal processing device configured as described above, even when the relationship between the number P of coding schemes and the number Q of noise suppression units is P ≧ Q> 1, suppression of noise components according to the coding processing is suppressed. Therefore, even if the content of the encoding process is varied, sufficient noise component suppression is performed, and high-quality speech can be transmitted.
さらに、上記の目的を達成するために、請求項27に係わる本発明は、音声信号に含まれる雑音成分を抑圧する雑音抑圧手段と、この雑音抑圧手段にて雑音成分が抑圧された音声信号に符号化処理を施して、圧縮された符号化音声データを生成する符号化手段とを備える信号処理装置であって、符号化手段は、複数の異なる符号化レートによる符号化処理を選択的に実施し、雑音抑圧手段は、互いに異なる雑音成分の抑圧特性を有する複数のノイズサプレス部を備え、音声信号に対して、符号化手段で選択的に実施される符号化処理に応じて、複数のノイズサプレス部の中から1つのノイズサプレス部を選択的に用いて雑音成分の抑圧を行うものであり、符号化手段における複数の異なる符号化レートの数をR、雑音抑圧手段のノイズサプレス部の数をQ(R,Qは共に正の整数)とした場合、RとQは、R≧Q>1の関係にあることを特徴とする。 Furthermore, in order to achieve the above object, the present invention according to claim 27 provides noise suppression means for suppressing a noise component included in a speech signal, and a speech signal in which the noise component is suppressed by the noise suppression means. A signal processing apparatus including an encoding unit that performs encoding processing to generate compressed encoded audio data, wherein the encoding unit selectively performs encoding processing at a plurality of different encoding rates. The noise suppression unit includes a plurality of noise suppression units having noise component suppression characteristics different from each other, and a plurality of noises are selected according to encoding processing selectively performed by the encoding unit on the audio signal. The noise component is suppressed by selectively using one noise suppressor from among the suppressors. The number of different encoding rates in the encoding means is R, and the noise suppression of the noise suppression means. The number of parts Q if (R, Q are both positive integers) was, R and Q, characterized in that a relation of R ≧ Q> 1.
上記構成の信号処理装置では、複数の異なる符号化レートによる符号化処理を選択的に実施するにあたり、その前段で音声信号に含まれる雑音成分を抑圧する際に、後段で実施される符号化処理に応じた雑音成分の抑圧を行うノイズサプレス部を、複数のノイズサプレス部の中から選択的に用いるもので、上記複数の異なる符号化レートの数Rと、上記複数のノイズサプレス部の数Qとの関係をR≧Q>1とするようにした。 In the signal processing device having the above configuration, when selectively performing encoding processing at a plurality of different encoding rates, encoding processing performed in the subsequent stage when suppressing noise components included in the audio signal in the preceding stage The noise suppressor that suppresses the noise component according to the signal is selectively used from the plurality of noise suppressors, and the number R of the plurality of different encoding rates and the number Q of the plurality of noise suppressors are The relation of R ≧ Q> 1 was established.
したがって、上記構成の信号処理装置によれば、符号化レートの数Rとノイズサプレス部の数Qとの関係がR≧Q>1にある場合でも、符号化処理に応じた雑音成分の抑圧が行われるので、符号化処理の内容を可変しても、十分な雑音成分の抑圧が行われ、高品質な音声を送信することができる。 Therefore, according to the signal processing device having the above configuration, even when the relationship between the number R of coding rates and the number Q of noise suppression units is R ≧ Q> 1, the suppression of noise components according to the coding processing is suppressed. Therefore, even if the content of the encoding process is varied, sufficient noise component suppression is performed, and high-quality speech can be transmitted.
さらにまた、上記の目的を達成するために、請求項28に係わる本発明は、音声信号に含まれる雑音成分を抑圧する雑音抑圧手段と、この雑音抑圧手段にて雑音成分が抑圧された音声信号に符号化処理を施して、圧縮された符号化音声データを生成する符号化手段とを備える信号処理装置であって、符号化手段は、複数の異なる符号化方式による符号化処理を選択的に実施し、雑音抑圧手段は、音声信号に対して雑音成分の抑圧を行うもので、パラメータの設定に応じて雑音成分の抑圧特性を可変可能なノイズサプレス部と、符号化手段で選択的に実施される符号化処理に応じたパラメータを、ノイズサプレス部に設定するパラメータ設定手段とを備え、符号化手段における複数の異なる符号化方式の数をP、雑音抑圧手段のノイズサプレス部に設定するパラメータの数をS(P,Sは共に正の整数)とした場合、PとSは、P≧S>1の関係にあることを特徴とする。 Furthermore, in order to achieve the above object, the present invention according to claim 28 includes a noise suppression unit that suppresses a noise component included in the audio signal, and an audio signal in which the noise component is suppressed by the noise suppression unit. A signal processing apparatus comprising: encoding means for performing encoding processing on the signal to generate compressed encoded audio data, wherein the encoding means selectively performs encoding processing by a plurality of different encoding methods. The noise suppression unit performs noise component suppression on the speech signal, and is selectively performed by the noise suppression unit capable of varying the noise component suppression characteristic according to the parameter setting and the encoding unit. Parameter setting means for setting a parameter corresponding to the encoded processing in the noise suppression unit, P being the number of different encoding methods in the encoding means, and noise suppression of the noise suppression means If the number of parameters to be set to the S (P, S are both positive integers) to, P and S, which lies in the P ≧ S> 1 relationship.
上記構成の信号処理装置では、複数の異なる符号化方式による符号化処理を選択的に実施するにあたり、その前段で音声信号に含まれる雑音成分を抑圧する際に、後段で実施される符号化処理に応じた特性でノイズサプレス部が雑音成分を抑圧するように、ノイズサプレス部に対して複数のパラメータの中から選択的にパラメータを用いるもので、上記複数の符号化方式の数Pと、上記複数のパラメータセットの数Sとの関係をP≧S>1とするようにした。 In the signal processing device having the above-described configuration, when selectively performing encoding processing using a plurality of different encoding schemes, encoding processing performed in the subsequent stage when suppressing noise components included in the audio signal in the preceding stage A parameter is selectively used from among a plurality of parameters for the noise suppressor so that the noise suppressor suppresses a noise component with characteristics according to the number P, the number P of the plurality of encoding methods, and the above The relation with the number S of the plurality of parameter sets is set such that P ≧ S> 1.
したがって、上記構成の信号処理装置によれば、符号化方式の数Pとパラメータセットの数Sとの関係がP≧S>1にある場合でも、符号化処理に応じた雑音成分の抑圧が行われるので、符号化処理の内容を可変しても、十分な雑音成分の抑圧が行われ、高品質な音声を送信することができる。 Therefore, according to the signal processing apparatus having the above configuration, even when the relationship between the number P of encoding schemes and the number S of parameter sets is P ≧ S> 1, noise components are suppressed according to the encoding processing. Therefore, even if the content of the encoding process is varied, sufficient noise components are suppressed and high-quality speech can be transmitted.
さらにまた、上記の目的を達成するために、請求項29に係わる本発明は、音声信号に含まれる雑音成分を抑圧する雑音抑圧手段と、この雑音抑圧手段にて雑音成分が抑圧された音声信号に符号化処理を施して、圧縮された符号化音声データを生成する符号化手段とを備える信号処理装置であって、符号化手段は複数の異なる符号化レートによる符号化処理を選択的に実施し、雑音抑圧手段は、音声信号に対して雑音成分の抑圧を行うもので、パラメータの設定に応じて雑音成分の抑圧特性を可変可能なノイズサプレス部と、符号化手段で選択的に実施される符号化処理に応じたパラメータを、ノイズサプレス部に設定するパラメータ設定手段とを備え、符号化手段における複数の異なる符号化レートの数をR、雑音抑圧手段のノイズサプレス部に設定するパラメータセットの数をS(R,Sは共に正の整数)とした場合、RとSは、R≧S>1の関係にあることを特徴とする。 Furthermore, in order to achieve the above object, the present invention according to claim 29 includes a noise suppression unit that suppresses a noise component included in the audio signal, and an audio signal in which the noise component is suppressed by the noise suppression unit. A signal processing device comprising: encoding means for generating compressed encoded speech data, wherein the encoding means selectively performs encoding processing at a plurality of different encoding rates The noise suppression unit suppresses the noise component of the speech signal, and is selectively performed by the noise suppression unit capable of changing the noise component suppression characteristic according to the parameter setting and the encoding unit. Parameter setting means for setting a parameter according to the encoding processing in the noise suppression unit, R being the number of different encoding rates in the encoding means, and noise suppression of the noise suppression means. If the number of parameter sets to be set in section was S (R, S are both positive integers), R and S, characterized in that a relation of R ≧ S> 1.
上記構成の信号処理装置では、複数の異なる符号化レートによる符号化処理を選択的に実施するにあたり、その前段で音声信号に含まれる雑音成分を抑圧する際に、後段で実施される符号化処理に応じた特性でノイズサプレス部が雑音成分を抑圧するように、ノイズサプレス部に対して複数のパラメータの中から選択的にパラメータを用いるもので、上記複数の符号化レートの数Rと、上記複数のパラメータセットの数Sとの関係をR≧S>1とするようにした。 In the signal processing device having the above configuration, when selectively performing encoding processing at a plurality of different encoding rates, encoding processing performed in the subsequent stage when suppressing noise components included in the audio signal in the preceding stage The noise suppressor selectively uses a parameter from among a plurality of parameters so that the noise suppressor suppresses the noise component with a characteristic according to the above. The relationship with the number S of the plurality of parameter sets is set to R ≧ S> 1.
したがって、上記構成の信号処理装置によれば、符号化レート式の数Rとパラメータセットの数Sとの関係がR≧S>1にある場合でも、符号化処理に応じた雑音成分の抑圧が行われるので、符号化処理の内容を可変しても、十分な雑音成分の抑圧が行われ、高品質な音声を送信することができる。 Therefore, according to the signal processing device having the above configuration, even when the relationship between the number R of the coding rate equations and the number S of parameter sets is R ≧ S> 1, the suppression of noise components according to the coding processing is suppressed. Therefore, even if the content of the encoding process is varied, sufficient noise component suppression is performed, and high-quality speech can be transmitted.
以上述べたように、この発明では、複数の異なる符号化処理を選択的に実施するにあたり、その前段で音声信号に含まれる雑音成分を抑圧する際に、後段で実施される符号化処理に応じた雑音成分の抑圧を行うようにしている。 As described above, according to the present invention, when a plurality of different encoding processes are selectively performed, the noise component included in the speech signal is suppressed in accordance with the encoding process performed in the subsequent stage. The noise component is suppressed.
したがって、この発明によれば、符号化処理に応じた雑音成分の抑圧が行われるので、符号化処理の内容を可変しても、十分な雑音成分の抑圧が行われ、高品質な音声を送信することが可能な信号処理装置、信号処理方法および記録媒体を提供できる。 Therefore, according to the present invention, the noise component is suppressed according to the encoding process. Therefore, even if the content of the encoding process is varied, the noise component is sufficiently suppressed, and high-quality speech is transmitted. It is possible to provide a signal processing apparatus, a signal processing method, and a recording medium that can be used.
また、この発明では、複数の異なる復号処理を選択的に実施し、その後段で復号された音声信号に含まれる雑音成分を抑圧する際に、実施される復号処理に応じた雑音成分の抑圧を行うようにしている。 Further, in the present invention, when a plurality of different decoding processes are selectively performed and the noise component included in the audio signal decoded in the subsequent stage is suppressed, the noise component is suppressed according to the decoding process to be performed. Like to do.
したがって、この発明によれば、復号処理に応じた雑音成分の抑圧が行われるので、復号処理の内容を可変しても、十分な雑音成分の抑圧が行われ、高品質な音声を受信することが可能な信号処理装置、信号処理方法および記録媒体を提供できる。 Therefore, according to the present invention, the noise component is suppressed according to the decoding process. Therefore, even if the content of the decoding process is varied, the noise component is sufficiently suppressed and high quality speech is received. Can be provided, a signal processing method, and a recording medium.
さらに、この発明では、入力された音声信号に対して、ハンズフリー機能を使用した音声入力か否かに応じた雑音成分の抑圧を行うようにしている。
ハンズフリー機能を使用した音声入力か否か音声の入力経路を可変しても、十分な雑音成分の抑圧が行われ、高品質な音声を入力することが可能な信号処理装置、信号処理方法および記録媒体を提供できる。
Furthermore, in the present invention, noise components are suppressed according to whether or not the input voice signal is a voice input using a hands-free function.
A signal processing apparatus, a signal processing method, and a signal processing apparatus capable of sufficiently suppressing a noise component and inputting a high-quality voice even if the voice input path is varied depending on whether or not the voice input uses the hands-free function, and A recording medium can be provided.
以下、図面を参照して、この発明の実施の形態について説明する。
図1は、この発明の第1の実施形態に係わる信号処理装置の構成を示すものである。
Embodiments of the present invention will be described below with reference to the drawings.
FIG. 1 shows the configuration of a signal processing apparatus according to the first embodiment of the present invention.
101は、ユーザの送話音声を電気信号に変換して取り込むマイクロフォン、102は、上記マイクロフォン101にて得たアナログ音声信号をディジタル信号の音声データに変換するA/D変換器、110は、ディジタル信号処理により、上記音声データに含まれる背景雑音を抑圧するノイズサプレッサ、103は、ノイズサプレッサ110により背景雑音が抑圧された音声データ、120は、103のディジタルデータを圧縮符号化する音声符号化器、104は、音声符号化器120によってデータ圧縮された符号化データである。
101 is a microphone that converts a user's transmitted voice into an electric signal, and 102 is an A / D converter that converts an analog voice signal obtained by the
音声符号化器120は、互いに異なるアルゴリズムにより音声データを符号化する3つの回路として、A方式符号化部121、B方式符号化部122、C方式符号化部123を備えるほかに、符号化方式切換制御部124を備える。
The speech encoder 120 includes an A
ここで例えば、A方式符号化部121は、符号化レートは低いが背景雑音に対するの符号化音質があまりよくない方式であり、C方式符号化部123は符号化レートが高く背景雑音に対しても比較的音質がよい符号化方式であり、またB方式符号化部122は、A方式符号化部121とC方式符号化部123の中間の音質とする。
Here, for example, the A
符号化方式切換制御部124は、外部からの符号化方式選択コマンド105に応じて、A方式符号化部121、B方式符号化部122、C方式符号化部123のうち、いずれか1つが機能するように切換制御するとともに、この切換制御により機能する方式を示す情報を、符号化方式選択情報106として、ノイズサプレッサ110に出力する。
The coding method switching
ノイズサプレッサ110は、互いに異なるアルゴリズムにより背景雑音を抑圧する3つの回路として、X方式ノイズサプレス部111、Y方式ノイズサプレス部112、Z方式ノイズサプレス部113を備えるほかに、サプレス方式切換制御部114を備える。
The noise suppressor 110 includes an
サプレス方式切換制御部114は、符号化方式選択情報106に応じて、X方式ノイズサプレス部111、Y方式ノイズサプレス部112、Z方式ノイズサプレス部113のうち、最適ないずれか1つが機能するように切換制御するものである。
The suppression method switching control unit 114 is configured so that any one of the X method
すなわち、サプレス方式切換制御部114による切換制御では、音声符号化器120にて機能する符号化部(121,122,123のいずれか)に合わせて、最適なノイズサプレス部(111,112,113のいずれか)を機能させるために、符号化方式選択情報106に基づいて、A方式符号化部121が機能する場合には、X方式ノイズサプレス部111を選択し、B方式符号化部122が機能する場合には、Y方式ノイズサプレス部112を選択し、C方式符号化部123が機能する場合には、Z方式ノイズサプレス部113を選択する。
That is, in the switching control by the suppression system switching control unit 114, the optimum noise suppression unit (111, 112, 113) is matched with the encoding unit (121, 122, 123) functioning in the speech encoder 120. If the A
このような符号化部とノイズサプレス部との対応を最適なものにするために、例えば、X方式ノイズサプレス部111には、少し複雑な処理になるがノイズサプレス性能が高い周波数領域でのスペクトラル・サブトラクション法(SS法)を用いたものを、Y方式ノイズサプレス部112には、同様にSS法であるが、X方式ノイズサプレス部111より処理を簡略化したものを、Z方式ノイズサプレス部113には、比較的簡単な構成の時間領域での適応フィルタリングによるものを用いる。
In order to optimize the correspondence between such an encoding unit and a noise suppression unit, for example, the X-type
次に、上記第1の実施形態の信号処理装置の動作について説明する。図2は、この動作を説明するためのフローチャートである。
今、ステップ2aにてコマンド入力の待機状態から、「符号化方式としてA方式を使用せよ」の旨を示す符号化方式選択コマンド105が符号化方式切換制御部124に入力されると、ステップ2bに移行して、指定される方式を判定し、A方式であることより、ステップ2cに移行する。
Next, the operation of the signal processing apparatus according to the first embodiment will be described. FIG. 2 is a flowchart for explaining this operation.
If a coding
ステップ2cでは、符号化方式切換制御部124が、ディジタルデータ103がA方式符号化部121に入力されるように切換制御し、これに応動してA方式符号化部121は入力されるディジタルデータ103の符号化を開始する。
In
また、ステップ2cでは、この切換制御に並行して、符号化方式切換制御部124が、ディジタルデータ103の符号化にA方式符号化部121を使用する旨の情報を、符号化方式選択情報106として、サプレス方式切換制御部114に出力し、ステップ2dに移行する。
In
ステップ2dでは、サプレス方式切換制御部114が、A方式符号化部121による符号化に最適化されたX方式ノイズサプレス部111による雑音抑圧を実施するために、A/D変換器102の出力がX方式ノイズサプレス部111に入力されるように切換制御し、ステップ2iに移行する。
In
このような切換制御動作により、A/D変換器102の出力は、X方式ノイズサプレス部111にて雑音抑圧され、ディジタルデータ103としてA方式符号化部121に入力され、ここで符号化され、データ圧縮された符号化データ104として出力される。
By such a switching control operation, the output of the A /
ステップ2iにおいて、「符号化方式としてB方式を使用せよ」の旨を示す符号化方式選択コマンド105が符号化方式切換制御部124に入力されると、ステップ2bに移行して、指定される方式を判定し、B方式であることより、ステップ2eに移行する。
In step 2i, when an encoding
ステップ2eでは、符号化方式切換制御部124が、タイミングをはかって、ディジタルデータ103がB方式符号化部122に入力されるように切換制御し、これに応動してA方式符号化部121は動作停止し、代わってB方式符号化部122が入力されるディジタルデータ103の符号化を開始する。
In step 2e, the encoding system switching
また、ステップ2eでは、この切換制御に並行して、符号化方式切換制御部124が、ディジタルデータ103の符号化にB方式符号化部122を使用する旨の情報を、符号化方式選択情報106として、サプレス方式切換制御部114に出力し、ステップ2fに移行する。
In step 2e, in parallel with this switching control, the encoding method switching
ステップ2fでは、サプレス方式切換制御部114が、B方式符号化部122による符号化に最適化されたY方式ノイズサプレス部112による雑音抑圧を実施するために、A/D変換器102の出力がY方式ノイズサプレス部112に入力されるように切換制御し、ステップ2iに移行する。
In
このような切換制御動作により、A/D変換器102の出力は、Y方式ノイズサプレス部112にて雑音抑圧され、ディジタルデータ103としてB方式符号化部122に入力され、ここで符号化され、データ圧縮された符号化データ104として出力される。
By such a switching control operation, the output of the A /
また、ステップ2iにおいて、上述のようにA方式符号化部121あるいはB方式符号化部122にて、ディジタルデータ103を符号化している際に、「符号化方式としてC方式を使用せよ」の旨を示す符号化方式選択コマンド105が符号化方式切換制御部124に入力されると、ステップ2bに移行して、指定される方式を判定し、C方式であることより、ステップ2gに移行する。
In step 2i, when the
ステップ2gでは、符号化方式切換制御部124が、タイミングをはかって、ディジタルデータ103がC方式符号化部123に入力されるように切換制御し、これに応動して使用中のA方式符号化部121あるいはB方式符号化部122の動作を停止し、代わってC方式符号化部123が入力されるディジタルデータ103の符号化を開始する。
In
また、ステップ2gでは、この切換制御に並行して、符号化方式切換制御部124が、ディジタルデータ103の符号化にC方式符号化部123を使用する旨の情報を、符号化方式選択情報106として、サプレス方式切換制御部114に出力し、ステップ2hに移行する。
In
ステップ2hでは、サプレス方式切換制御部114が、C方式符号化部123による符号化に最適化されたZ方式ノイズサプレス部113による雑音抑圧を実施するために、A/D変換器102の出力がZ方式ノイズサプレス部113に入力されるように切換制御し、ステップ2iに移行する。
In
このような切換制御動作により、A/D変換器102の出力は、Z方式ノイズサプレス部113にて雑音抑圧され、ディジタルデータ103としてC方式符号化部122に入力され、ここで符号化され、データ圧縮された符号化データ104として出力される。
By such a switching control operation, the output of the A /
なお、ステップ2iにて、コマンド入力がない場合には、ステップ2jに移行する。ステップ2jでは、通信の終了要求がなされたか否かを判定し、終了要求があった場合には、当該処理を終了し、一方、終了要求がない場合には、再びステップ2iにてコマンド入力を監視する。
If no command is input in step 2i, the process proceeds to step 2j. In
以上のように、上記構成の信号処理装置では、データ圧縮された符号化データ104を得るにあたり、音声符号化器120にて機能する符号化部(121,122,123のいずれか)に合わせて、最適なノイズサプレス部(111,112,113のいずれか)を機能させるようにしている。
As described above, in the signal processing apparatus having the above-described configuration, in order to obtain the encoded
したがって、上記構成の信号処理装置によれば、音声符号化器120の符号化に最適なノイズサプレス部による雑音抑圧が行われるので、ノイズサプレス部が十分な機能を発揮し、高品質な音声を送信することができる。 Therefore, according to the signal processing device having the above configuration, noise suppression is performed by the noise suppression unit that is optimal for encoding by the speech encoder 120. Therefore, the noise suppression unit exhibits a sufficient function and produces high-quality speech. Can be sent.
尚、この発明は上記実施の形態に限定されるものではない。例えば、上記第1の実施形態では、サプレス方式切換制御部114は、符号化方式切換制御部124からの符号化方式選択情報106に基づいて、音声符号化器120にて機能する符号化部に合わせ、最適なノイズサプレス部を機能させるようにした。
The present invention is not limited to the above embodiment. For example, in the first embodiment, the suppression method switching control unit 114 is a coding unit that functions in the speech encoder 120 based on the coding method selection information 106 from the coding method switching
これに代わって例えば、サプレス方式切換制御部114は、符号化方式選択コマンド105に基づいて、音声符号化器120にて機能する符号化部に合わせ、最適なノイズサプレス部を機能させるようにしても同様の効果を発揮することができる。
Instead, for example, the suppression method switching control unit 114 causes the optimum noise suppression unit to function in accordance with the encoding unit functioning in the speech encoder 120 based on the encoding
なお、この場合、サプレス方式切換制御部114は、音声符号化器120における符号化部の切換タイミングを考慮したタイミングで、最適なノイズサプレス部を機能させるように切換制御を行う。 In this case, the suppression method switching control unit 114 performs switching control so that the optimum noise suppression unit functions at a timing that takes into account the switching timing of the encoding unit in the speech encoder 120.
次に、この発明の第2の実施形態に係わる信号処理装置について説明する。図3は、その構成を示すものである。
201は、ユーザの送話音声を電気信号に変換して取り込むマイクロフォン、202は、上記マイクロフォン201にて得たアナログ音声信号をディジタル信号の音声データに変換するA/D変換器、210は、ディジタル信号処理により、上記音声データに含まれる背景雑音を抑圧するノイズサプレッサ、203は、ノイズサプレッサ210により背景雑音が抑圧された音声データ、220は、203のディジタルデータを圧縮符号化する音声符号化器、204は、音声符号化器220によってデータ圧縮された符号化データである。
Next explained is a signal processing apparatus according to the second embodiment of the invention. FIG. 3 shows the configuration.
音声符号化器220は、互いに異なるアルゴリズムにより音声データを符号化する3つの回路として、A方式符号化部221、B方式符号化部222、C方式符号化部223を備えるほかに、符号化方式切換制御部224を備える。
The speech encoder 220 includes, as three circuits that encode speech data using different algorithms, an A method encoding unit 221, a B
ここで例えば、A方式符号化部221は、符号化レートは低いが背景雑音に対するの符号化音質があまりよくない方式であり、C方式符号化部223は符号化レートが高く背景雑音に対しても比較的音質がよい符号化方式であり、またB方式符号化部222は、A方式符号化部221とC方式符号化部223の中間の音質とする。
Here, for example, the A method encoding unit 221 is a method in which the encoding rate is low but the encoding sound quality with respect to the background noise is not so good, and the C
符号化方式切換制御部224は、外部からの符号化方式選択コマンド205に応じて、A方式符号化部221、B方式符号化部222、C方式符号化部223のうち、いずれか1つが機能するように切換制御するとともに、この切換制御により機能する方式を示す情報を、符号化方式選択情報206として、ノイズサプレッサ210に出力する。
The coding method switching
ノイズサプレッサ210は、ノイズサプレス部215と、パラメータテーブル216と、パラメータ切換制御部217とを備える。
ノイズサプレス部215は、A/D変換器202が出力する音声データに含まれる背景雑音を抑圧するもので、その抑圧特性は、パラメータテーブル216より入力されるパラメータによって制御される。
The noise suppressor 210 includes a
The
パラメータテーブル216は、ノイズサプレス部215にて行われる背景雑音の抑圧処理の特性を設定するパラメータを記憶するテーブルで、A方式符号化部221、B方式符号化部222、C方式符号化部223の各符号化方式にそれぞれ最適な抑圧特性となるような3つのパラメータセットを記憶し、パラメータ切換制御部217の制御によりパラメータセットをノイズサプレス部215に入力する。
The parameter table 216 is a table for storing parameters for setting the characteristics of the background noise suppression processing performed by the
本実施形態では、5つのパラメータを要素とするパラメータセットを想定しており、各符号化方式毎にパラメータセット(本実施形態では3つ)を用意している。 In this embodiment, a parameter set having five parameters as elements is assumed, and parameter sets (three in this embodiment) are prepared for each encoding method.
パラメータ切換制御部217は、パラメータテーブル216を制御して、符号化方式選択情報206に基づき、音声符号化器220にて機能する符号化部(221,222,223のいずれか)に最適なパラメータセットを選択的にノイズサプレス部215に設定するものである。
The parameter
このような符号化部とノイズサプレス部のパラメータ設定(抑圧特性設定)との対応を最適なものにするために、例えば、A方式符号化部221に対応するパラメータセットとしては、ノイズ抑圧量を強めに設定し、若干音声部分に歪みが生じても、極力ノイズを抑えるような特性が得られるパラメータセットととし、またC方式符号化部223に対応するパラメータセットとしては、ノイズ抑圧量は軽めに設定し、自然に聞こえる程度のノイズは透過させるような特性が得られるパラメータセットとする。
In order to optimize the correspondence between the parameter setting (suppression characteristic setting) of the encoding unit and the noise suppression unit, for example, as a parameter set corresponding to the A method encoding unit 221, a noise suppression amount is set as follows. The parameter set is set to be strong and can obtain a characteristic that suppresses noise as much as possible even if the audio part is slightly distorted, and the parameter set corresponding to the C
また、B方式符号化部222に対応するパラメータセットとしては、A方式符号化部221用の特性とC方式符号化部223用の特性の中間の特性が得られるパラメータセットとする。
In addition, the parameter set corresponding to the B
次に、上記第2の実施形態の信号処理装置の動作について説明する。図4は、この動作を説明するためのフローチャートである。
今、ステップ4aにてコマンド入力の待機状態から、「符号化方式としてA方式を使用せよ」の旨を示す符号化方式選択コマンド205が符号化方式切換制御部224に入力されると、ステップ4bに移行して、指定される方式を判定し、A方式であることより、ステップ4cに移行する。
Next, the operation of the signal processing apparatus according to the second embodiment will be described. FIG. 4 is a flowchart for explaining this operation.
When a coding
ステップ4cでは、符号化方式切換制御部224が、ディジタルデータ203がA方式符号化部221に入力されるように切換制御し、これに応動してA方式符号化部221は入力されるディジタルデータ203の符号化を開始する。
In
また、ステップ4cでは、この切換制御に並行して、符号化方式切換制御部224が、ディジタルデータ203の符号化にA方式符号化部221を使用する旨の情報を、符号化方式選択情報206として、パラメータ切換制御部217に出力し、ステップ4dに移行する。
In
ステップ4dでは、パラメータ切換制御部217が、ノイズサプレス部215の雑音抑圧特性が、A方式符号化部221による符号化に最適な特性となるように、A方式符号化部221に対応するパラメータセットを、パラメータテーブル216よりノイズサプレス部215に入力させ、ステップ4iに移行する。
In
このようなパラメータ設定(抑圧特性設定)の制御動作により、A/D変換器202の出力は、A方式符号化部221による符号化に適した抑圧特性で雑音が抑圧され、ディジタルデータ203としてA方式符号化部221に入力され、ここで符号化され、データ圧縮された符号化データ204として出力される。
With such parameter setting (suppression characteristic setting) control operation, noise is suppressed in the output of the A /
ステップ4iにおいて、「符号化方式としてB方式を使用せよ」の旨を示す符号化方式選択コマンド205が符号化方式切換制御部224に入力されると、ステップ4bに移行して、指定される方式を判定し、B方式であることより、ステップ4eに移行する。
In
ステップ4eでは、符号化方式切換制御部224が、タイミングをはかって、ディジタルデータ203がB方式符号化部222に入力されるように切換制御し、これに応動してA方式符号化部221は動作停止し、代わってB方式符号化部222が入力されるディジタルデータ203の符号化を開始する。
In
また、ステップ4eでは、この切換制御に並行して、符号化方式切換制御部224が、ディジタルデータ203の符号化にB方式符号化部222を使用する旨の情報を、符号化方式選択情報206として、パラメータ切換制御部217に出力し、ステップ4fに移行する。
Further, in
ステップ4fでは、パラメータ切換制御部217が、ノイズサプレス部215の雑音抑圧特性が、B方式符号化部222による符号化に最適な特性となるように、B方式符号化部222に対応するパラメータセットを、パラメータテーブル216よりノイズサプレス部215に入力させ、ステップ4iに移行する。
In step 4f, the parameter
このようなパラメータ設定(抑圧特性設定)の制御動作により、A/D変換器202の出力は、B方式符号化部222による符号化に適した抑圧特性で雑音が抑圧され、ディジタルデータ203としてB方式符号化部222に入力され、ここで符号化され、データ圧縮された符号化データ204として出力される。
By such parameter setting (suppression characteristic setting) control operation, noise is suppressed in the output of the A /
また、ステップ4iにおいて、上述のようにA方式符号化部221あるいはB方式符号化部222にて、ディジタルデータ203を符号化している際に、「符号化方式としてC方式を使用せよ」の旨を示す符号化方式選択コマンド205が符号化方式切換制御部224に入力されると、ステップ4bに移行して、指定される方式を判定し、C方式であることより、ステップ4gに移行する。
Further, in
ステップ4gでは、符号化方式切換制御部224が、タイミングをはかって、ディジタルデータ203がC方式符号化部223に入力されるように切換制御し、これに応動して使用中のA方式符号化部221あるいはB方式符号化部222の動作を停止し、代わってC方式符号化部223が入力されるディジタルデータ203の符号化を開始する。
In
また、ステップ4gでは、この切換制御に並行して、符号化方式切換制御部224が、ディジタルデータ203の符号化にC方式符号化部223を使用する旨の情報を、符号化方式選択情報206として、パラメータ切換制御部217に出力し、ステップ4hに移行する。
In
ステップ4hでは、パラメータ切換制御部217が、ノイズサプレス部215の雑音抑圧特性が、C方式符号化部223による符号化に最適な特性となるように、C方式符号化部223に対応するパラメータセットを、パラメータテーブル216よりノイズサプレス部215に入力させ、ステップ4iに移行する。
In
このようなパラメータ設定(抑圧特性設定)の制御動作により、A/D変換器202の出力は、C方式符号化部223による符号化に適した抑圧特性で雑音が抑圧され、ディジタルデータ203としてC方式符号化部223に入力され、ここで符号化され、データ圧縮された符号化データ204として出力される。
By such parameter setting (suppression characteristic setting) control operation, noise is suppressed in the output of the A /
なお、ステップ4iにて、コマンド入力がない場合には、ステップ4jに移行する。ステップ4jでは、通信の終了要求がなされたか否かを判定し、終了要求があった場合には、当該処理を終了し、一方、終了要求がない場合には、再びステップ4iにてコマンド入力を監視する。
If no command is input in
以上のように、上記構成の信号処理装置では、データ圧縮された符号化データ204を得るにあたり、音声符号化器220にて機能する符号化部(221,222,223のいずれか)に合わせて、ノイズサプレス部215のパラメータを可変して、ノイズサプレス部215の雑音抑圧特性を符号化処理に最適な特性に設定するようにしている。
As described above, in the signal processing apparatus having the above configuration, in order to obtain encoded
したがって、上記構成の信号処理装置によれば、音声符号化器220の符号化に合わせて、最適な雑音抑圧が行われるので、ノイズサプレス部が十分な機能を発揮し、高品質な音声を送信することができる。 Therefore, according to the signal processing apparatus configured as described above, optimal noise suppression is performed in accordance with the encoding of the audio encoder 220, so that the noise suppressor exhibits a sufficient function and transmits high-quality audio. can do.
尚、この発明は上記実施の形態に限定されるものではない。例えば、上記第2の実施形態では、パラメータ切換制御部217は、符号化方式切換制御部224からの符号化方式選択情報206に基づいて、音声符号化器220にて機能する符号化部に合わせ、ノイズサプレス部215の雑音抑圧特性を最適な特性に可変するようにした。
The present invention is not limited to the above embodiment. For example, in the second embodiment, the parameter
これに代わって例えば、パラメータ切換制御部217は、符号化方式選択コマンド205に基づいて、音声符号化器220にて機能する符号化部に合わせ、ノイズサプレス部215の雑音抑圧特性を最適な特性に可変するようにしても同様の効果を発揮することができる。
Instead of this, for example, the parameter
なお、この場合、パラメータ切換制御部217は、音声符号化器220における符号化部の切換タイミングを考慮したタイミングで、最適な雑音抑圧特性が得られるパラメータセットを設定する制御を行う。
In this case, the parameter
次に、この発明の第3の実施形態に係わる信号処理装置について説明する。図5は、その構成を示すものである。
301は、ユーザの送話音声を電気信号に変換して取り込むマイクロフォン、302は、上記マイクロフォン301にて得たアナログ音声信号をディジタル信号の音声データに変換するA/D変換器、310は、ディジタル信号処理により、上記音声データに含まれる背景雑音を抑圧するノイズサプレッサ、303は、ノイズサプレッサ310により背景雑音が抑圧された音声データ、320は、303のディジタルデータを圧縮符号化する音声符号化器、304は、音声符号化器320によってデータ圧縮された符号化データである。
Next explained is a signal processing apparatus according to the third embodiment of the invention. FIG. 5 shows the configuration.
音声符号化器320は、互いに異なる符号化レートで音声データを符号化する3つの回路として、Aレート符号化部321、Bレート符号化部322、Cレート符号化部323を備えるほかに、符号化レート切換制御部324を備える。
The speech encoder 320 includes an
ここで例えば、Aレート符号化部321は、符号化を行う上記3つの回路のうち、最も符号化レートは低いものであり、Cレート符号化部323は、符号化を行う上記3つの回路のうち、最も符号化レートが高いものであり、またBレート符号化部322は、Aレート符号化部321とCレート符号化部323の中間の符号化レートとする。
Here, for example, the A
符号化レート切換制御部324は、外部からの符号化レート選択コマンド305に応じて、Aレート符号化部321、Bレート符号化部322、Cレート符号化部323のうち、いずれか1つが機能するように切換制御するとともに、この切換制御により機能するレートを示す情報を、符号化レート選択情報306として、ノイズサプレッサ310に出力する。
The coding rate switching
ノイズサプレッサ310は、互いに異なるアルゴリズムにより背景雑音を抑圧する3つの回路として、X方式ノイズサプレス部311、Y方式ノイズサプレス部312、Z方式ノイズサプレス部313を備えるほかに、サプレス方式切換制御部314を備える。
The noise suppressor 310 includes an
サプレス方式切換制御部314は、符号化レート選択情報306に応じて、X方式ノイズサプレス部311、Y方式ノイズサプレス部312、Z方式ノイズサプレス部313のうち、最適ないずれか1つが機能するように切換制御するものである。
The suppression method switching
すなわち、サプレス方式切換制御部314による切換制御では、音声符号化器320にて機能する符号化部(321,322,323のいずれか)に合わせて、最適なノイズサプレス部(311,312,313のいずれか)を機能させるために、符号化レート選択情報306に基づいて、Aレート符号化部321が機能する場合には、X方式ノイズサプレス部311を選択し、Bレート符号化部322が機能する場合には、Y方式ノイズサプレス部312を選択し、Cレート符号化部323が機能する場合には、Z方式ノイズサプレス部313を選択する。
That is, in the switching control by the suppression system switching
このような符号化部とノイズサプレス部との対応を最適なものにするために、例えば、X方式ノイズサプレス部311には、少し複雑な処理になるがノイズサプレス性能が高い周波数領域でのスペクトラル・サブトラクション法(SS法)を用いたものを、Y方式ノイズサプレス部312には、同様にSS法であるが、X方式ノイズサプレス部311より処理を簡略化したものを、Z方式ノイズサプレス部313には、比較的簡単な構成の時間領域での適応フィルタリングによるものを用いる。
In order to optimize the correspondence between such an encoding unit and a noise suppression unit, for example, the X-type
次に、上記第3の実施形態の信号処理装置の動作について説明する。図6は、この動作を説明するためのフローチャートである。
今、ステップ6aにてコマンド入力の待機状態から、「符号化レートとしてAレートを使用せよ」の旨を示す符号化レート選択コマンド305が符号化レート切換制御部324に入力されると、ステップ6bに移行して、指定されるレートを判定し、Aレートであることより、ステップ6cに移行する。
Next, the operation of the signal processing apparatus according to the third embodiment will be described. FIG. 6 is a flowchart for explaining this operation.
When a coding
ステップ6cでは、符号化レート切換制御部324が、ディジタルデータ303がAレート符号化部321に入力されるように切換制御し、これに応動してAレート符号化部321は入力されるディジタルデータ303の符号化を開始する。
In
また、ステップ6cでは、この切換制御に並行して、符号化レート切換制御部324が、ディジタルデータ303の符号化にAレート符号化部321を使用する旨の情報を、符号化レート選択情報306として、サプレス方式切換制御部314に出力し、ステップ6dに移行する。
In
ステップ6dでは、サプレス方式切換制御部314が、Aレート符号化部321による符号化に最適化されたX方式ノイズサプレス部311による雑音抑圧を実施するために、A/D変換器302の出力がX方式ノイズサプレス部311に入力されるように切換制御し、ステップ6iに移行する。
In
このような切換制御動作により、A/D変換器302の出力は、X方式ノイズサプレス部311にて雑音抑圧され、ディジタルデータ303としてAレート符号化部321に入力され、ここで符号化され、データ圧縮された符号化データ304として出力される。
By such a switching control operation, the output of the A /
ステップ6iにおいて、「符号化レートとしてBレートを使用せよ」の旨を示す符号化レート選択コマンド305が符号化レート切換制御部324に入力されると、ステップ6bに移行して、指定されるレートを判定し、Bレートであることより、ステップ6eに移行する。
In
ステップ6eでは、符号化レート切換制御部324が、タイミングをはかって、ディジタルデータ303がBレート符号化部322に入力されるように切換制御し、これに応動してAレート符号化部321は動作停止し、代わってBレート符号化部322が入力されるディジタルデータ303の符号化を開始する。
In step 6e, the coding rate switching
また、ステップ6eでは、この切換制御に並行して、符号化レート切換制御部324が、ディジタルデータ303の符号化にBレート符号化部322を使用する旨の情報を、符号化レート選択情報306として、サプレス方式切換制御部314に出力し、ステップ6fに移行する。
In step 6e, in parallel with this switching control, the coding rate switching
ステップ6fでは、サプレス方式切換制御部314が、Bレート符号化部322による符号化に最適化されたY方式ノイズサプレス部312による雑音抑圧を実施するために、A/D変換器302の出力がY方式ノイズサプレス部312に入力されるように切換制御し、ステップ6iに移行する。
In
このような切換制御動作により、A/D変換器302の出力は、Y方式ノイズサプレス部312にて雑音抑圧され、ディジタルデータ303としてBレート符号化部322に入力され、ここで符号化され、データ圧縮された符号化データ304として出力される。
By such a switching control operation, the output of the A /
また、ステップ6iにおいて、上述のようにAレート符号化部321あるいはBレート符号化部322にて、ディジタルデータ303を符号化している際に、「符号化レートとしてCレートを使用せよ」の旨を示す符号化レート選択コマンド305が符号化レート切換制御部324に入力されると、ステップ6bに移行して、指定される方式を判定し、C方式であることより、ステップ6gに移行する。
In
ステップ6gでは、符号化レート切換制御部324が、タイミングをはかって、ディジタルデータ303がCレート符号化部323に入力されるように切換制御し、これに応動して使用中のAレート符号化部321あるいはBレート符号化部322の動作を停止し、代わってCレート符号化部323が入力されるディジタルデータ303の符号化を開始する。
In
また、ステップ6gでは、この切換制御に並行して、符号化レート切換制御部324が、ディジタルデータ303の符号化にCレート符号化部323を使用する旨の情報を、符号化レート選択情報306として、サプレス方式切換制御部314に出力し、ステップ6hに移行する。
In
ステップ6hでは、サプレス方式切換制御部314が、Cレート符号化部323による符号化に最適化されたZ方式ノイズサプレス部313による雑音抑圧を実施するために、A/D変換器302の出力がZ方式ノイズサプレス部313に入力されるように切換制御し、ステップ6iに移行する。
In
このような切換制御動作により、A/D変換器302の出力は、Z方式ノイズサプレス部313にて雑音抑圧され、ディジタルデータ303としてCレート符号化部322に入力され、ここで符号化され、データ圧縮された符号化データ304として出力される。
By such a switching control operation, the output of the A /
なお、ステップ6iにて、コマンド入力がない場合には、ステップ6jに移行する。ステップ6jでは、通信の終了要求がなされたか否かを判定し、終了要求があった場合には、当該処理を終了し、一方、終了要求がない場合には、再びステップ6iにてコマンド入力を監視する。
If no command is input in
以上のように、上記構成の信号処理装置では、データ圧縮された符号化データ304を得るにあたり、音声符号化器320にて機能する符号化部(321,322,323のいずれか)に合わせて、最適なノイズサプレス部(311,312,313のいずれか)を機能させるようにしている。
As described above, in the signal processing apparatus having the above-described configuration, in order to obtain encoded
したがって、上記構成の信号処理装置によれば、音声符号化器320の符号化に最適なノイズサプレス部による雑音抑圧が行われるので、ノイズサプレス部が十分な機能を発揮し、高品質な音声を送信することができる。 Therefore, according to the signal processing apparatus configured as described above, noise suppression is performed by the noise suppression unit that is optimal for encoding by the speech encoder 320. Therefore, the noise suppression unit exhibits a sufficient function and can produce high-quality speech. Can be sent.
尚、この発明は上記実施の形態に限定されるものではない。例えば、上記第3の実施形態では、サプレス方式切換制御部314は、符号化レート切換制御部324からの符号化レート選択情報306に基づいて、音声符号化器320にて機能する符号化部に合わせ、最適なノイズサプレス部を機能させるようにした。
The present invention is not limited to the above embodiment. For example, in the third embodiment, the suppression scheme switching
これに代わって例えば、サプレス方式切換制御部314は、符号化レート選択コマンド305に基づいて、音声符号化器320にて機能する符号化部に合わせ、最適なノイズサプレス部を機能させるようにしても同様の効果を発揮することができる。
Instead, for example, the suppression method switching
なお、この場合、サプレス方式切換制御部314は、音声符号化器320における符号化部の切換タイミングを考慮したタイミングで、最適なノイズサプレス部を機能させるように切換制御を行う。
In this case, the suppression method switching
次に、この発明の第4の実施形態に係わる信号処理装置について説明する。図7は、その構成を示すものである。
401は、ユーザの送話音声を電気信号に変換して取り込むマイクロフォン、402は、上記マイクロフォン401にて得たアナログ音声信号をディジタル信号の音声データに変換するA/D変換器、410は、ディジタル信号処理により、上記音声データに含まれる背景雑音を抑圧するノイズサプレッサ、403は、ノイズサプレッサ410により背景雑音が抑圧された音声データ、420は、403のディジタルデータを圧縮符号化する音声符号化器、404は、音声符号化器420によってデータ圧縮された符号化データである。
Next explained is a signal processing apparatus according to the fourth embodiment of the invention. FIG. 7 shows the configuration.
401 is a microphone that converts a user's transmitted voice into an electric signal, and 402 is an A / D converter that converts an analog voice signal obtained by the
音声符号化器420は、互いに異なる符号化レートで音声データを符号化する3つの回路として、Aレート符号化部421、Bレート符号化部422、Cレート符号化部423を備えるほかに、符号化レート切換制御部424を備える。
The audio encoder 420 includes an A
ここで例えば、Aレート符号化部421は、符号化を行う上記3つの回路のうち、最も符号化レートは低いものであり、Cレート符号化部423は、符号化を行う上記3つの回路のうち、最も符号化レートが高いものであり、またBレート符号化部422は、Aレート符号化部421とCレート符号化部423の中間の符号化レートとする。
Here, for example, the A
符号化レート切換制御部424は、外部からの符号化レート選択コマンド405に応じて、Aレート符号化部421、Bレート符号化部422、Cレート符号化部423のうち、いずれか1つが機能するように切換制御するとともに、この切換制御により機能するレートを示す情報を、符号化レート選択情報406として、ノイズサプレッサ410に出力する。
In the coding rate switching
ノイズサプレッサ410は、ノイズサプレス部415と、パラメータテーブル416と、パラメータ切換制御部417とを備える。
ノイズサプレス部415は、A/D変換器402が出力する音声データに含まれる背景雑音を抑圧するもので、その抑圧特性は、パラメータテーブル416より入力されるパラメータによって制御される。
The noise suppressor 410 includes a
The
パラメータテーブル416は、ノイズサプレス部415にて行われる背景雑音の抑圧処理の特性を設定するパラメータを記憶するテーブルで、Aレート符号化部421、Bレート符号化部422、Cレート符号化部423の各符号化レートにそれぞれ最適な抑圧特性となるような3つのパラメータセットを記憶し、パラメータ切換制御部417の制御によりパラメータセットをノイズサプレス部415に入力する。
The parameter table 416 is a table for storing parameters for setting the characteristics of the background noise suppression processing performed by the
パラメータ切換制御部417は、パラメータテーブル416を制御して、符号化レート選択情報406に基づき、音声符号化器420にて機能する符号化部(421,422,423のいずれか)に最適なパラメータセットを選択的にノイズサプレス部415に設定するものである。
The parameter
このような符号化部とノイズサプレス部のパラメータ設定(抑圧特性設定)との対応を最適なものにするために、例えば、Aレート符号化部421に対応するパラメータセットとしては、ノイズ抑圧量を強めに設定し、若干音声部分に歪みが生じても、極力ノイズを抑えるような特性が得られるパラメータセットととし、またCレート符号化部423に対応するパラメータセットとしては、ノイズ抑圧量は軽めに設定し、自然に聞こえる程度のノイズは透過させるような特性が得られるパラメータセットとする。
In order to optimize the correspondence between the parameter setting (suppression characteristic setting) of the encoding unit and the noise suppression unit, for example, as a parameter set corresponding to the A
また、Bレート符号化部422に対応するパラメータセットとしては、Aレート符号化部421用の特性とCレート符号化部423用の特性の中間の特性が得られるパラメータセットとする。
In addition, the parameter set corresponding to the B
次に、上記第4の実施形態の信号処理装置の動作について説明する。図8は、この動作を説明するためのフローチャートである。
今、ステップ8aにてコマンド入力の待機状態から、「符号化レートとしてAレートを使用せよ」の旨を示す符号化レート選択コマンド405が符号化レート切換制御部424に入力されると、ステップ8bに移行して、指定される方式を判定し、A方式であることより、ステップ8cに移行する。
Next, the operation of the signal processing apparatus according to the fourth embodiment will be described. FIG. 8 is a flowchart for explaining this operation.
When a coding
ステップ8cでは、符号化レート切換制御部424が、ディジタルデータ403がAレート符号化部421に入力されるように切換制御し、これに応動してAレート符号化部421は入力されるディジタルデータ403の符号化を開始する。
In
また、ステップ8cでは、この切換制御に並行して、符号化レート切換制御部424が、ディジタルデータ403の符号化にAレート符号化部421を使用する旨の情報を、符号化レート選択情報406として、パラメータ切換制御部417に出力し、ステップ8dに移行する。
In
ステップ8dでは、パラメータ切換制御部417が、ノイズサプレス部415の雑音抑圧特性が、Aレート符号化部421による符号化に最適な特性となるように、Aレート符号化部421に対応するパラメータセットを、パラメータテーブル416よりノイズサプレス部415に入力させ、ステップ8iに移行する。
In step 8d, the parameter
このようなパラメータ設定(抑圧特性設定)の制御動作により、A/D変換器402の出力は、Aレート符号化部421による符号化に適した抑圧特性で雑音が抑圧され、ディジタルデータ403としてAレート符号化部421に入力され、ここで符号化され、データ圧縮された符号化データ404として出力される。
By such parameter setting (suppression characteristic setting) control operation, noise is suppressed in the output of the A /
ステップ8iにおいて、「符号化レートとしてBレートを使用せよ」の旨を示す符号化レート選択コマンド405が符号化レート切換制御部424に入力されると、ステップ8bに移行して、指定される方式を判定し、C方式であることより、ステップ8eに移行する。
In
ステップ8eでは、符号化レート切換制御部424が、タイミングをはかって、ディジタルデータ403がBレート符号化部422に入力されるように切換制御し、これに応動してAレート符号化部421は動作停止し、代わってBレート符号化部422が入力されるディジタルデータ403の符号化を開始する。
In
また、ステップ8eでは、この切換制御に並行して、符号化レート切換制御部424が、ディジタルデータ403の符号化にBレート符号化部422を使用する旨の情報を、符号化レート選択情報406として、パラメータ切換制御部417に出力し、ステップ8fに移行する。
In
ステップ8fでは、パラメータ切換制御部417が、ノイズサプレス部415の雑音抑圧特性が、Bレート符号化部422による符号化に最適な特性となるように、Bレート符号化部422に対応するパラメータセットを、パラメータテーブル416よりノイズサプレス部415に入力させ、ステップ8iに移行する。
In
このようなパラメータ設定(抑圧特性設定)の制御動作により、A/D変換器402の出力は、Bレート符号化部422による符号化に適した抑圧特性で雑音が抑圧され、ディジタルデータ403としてBレート符号化部422に入力され、ここで符号化され、データ圧縮された符号化データ404として出力される。
By such parameter setting (suppression characteristic setting) control operation, noise is suppressed in the output of the A /
また、ステップ8iにおいて、上述のようにAレート符号化部421あるいはBレート符号化部422にて、ディジタルデータ403を符号化している際に、「符号化レートとしてCレートを使用せよ」の旨を示す符号化レート選択コマンド405が符号化レート切換制御部424に入力されると、ステップ8bに移行して、指定される方式を判定し、C方式であることより、ステップ8gに移行する。
Further, in
ステップ8gでは、符号化レート切換制御部424が、タイミングをはかって、ディジタルデータ403がCレート符号化部423に入力されるように切換制御し、これに応動して使用中のAレート符号化部421あるいはBレート符号化部422の動作を停止し、代わってCレート符号化部423が入力されるディジタルデータ403の符号化を開始する。
In
また、ステップ8gでは、この切換制御に並行して、符号化レート切換制御部424が、ディジタルデータ403の符号化にCレート符号化部423を使用する旨の情報を、符号化レート選択情報406として、パラメータ切換制御部417に出力し、ステップ8hに移行する。
In
ステップ8hでは、パラメータ切換制御部417が、ノイズサプレス部415の雑音抑圧特性が、Cレート符号化部423による符号化に最適な特性となるように、Cレート符号化部423に対応するパラメータセットを、パラメータテーブル416よりノイズサプレス部415に入力させ、ステップ8iに移行する。
In
このようなパラメータ設定(抑圧特性設定)の制御動作により、A/D変換器402の出力は、Cレート符号化部423による符号化に適した抑圧特性で雑音が抑圧され、ディジタルデータ403としてCレート符号化部423に入力され、ここで符号化され、データ圧縮された符号化データ404として出力される。
By such parameter setting (suppression characteristic setting) control operation, noise is suppressed in the output of the A /
なお、ステップ8iにて、コマンド入力がない場合には、ステップ8jに移行する。ステップ8jでは、通信の終了要求がなされたか否かを判定し、終了要求があった場合には、当該処理を終了し、一方、終了要求がない場合には、再びステップ8iにてコマンド入力を監視する。
If there is no command input in
以上のように、上記構成の信号処理装置では、データ圧縮された符号化データ404を得るにあたり、音声符号化器420にて機能する符号化部(421,422,423のいずれか)に合わせて、ノイズサプレス部415のパラメータを可変して、ノイズサプレス部415の雑音抑圧特性を符号化処理に最適な特性に設定するようにしている。
As described above, in the signal processing apparatus having the above-described configuration, in order to obtain encoded
したがって、上記構成の信号処理装置によれば、音声符号化器420の符号化に合わせて、最適な雑音抑圧が行われるので、ノイズサプレス部が十分な機能を発揮し、高品質な音声を送信することができる。 Therefore, according to the signal processing device configured as described above, optimal noise suppression is performed in accordance with the encoding of the audio encoder 420, so that the noise suppressor exhibits a sufficient function and transmits high-quality audio. can do.
尚、この発明は上記実施の形態に限定されるものではない。例えば、上記第4の実施形態では、パラメータ切換制御部417は、符号化レート切換制御部424からの符号化レート選択情報406に基づいて、音声符号化器420にて機能する符号化部に合わせ、ノイズサプレス部415の雑音抑圧特性を最適な特性に可変するようにした。
The present invention is not limited to the above embodiment. For example, in the fourth embodiment, the parameter
これに代わって例えば、パラメータ切換制御部417は、符号化レート選択コマンド405に基づいて、音声符号化器420にて機能する符号化部に合わせ、ノイズサプレス部415の雑音抑圧特性を最適な特性に可変するようにしても同様の効果を発揮することができる。
Instead, for example, the parameter
なお、この場合、パラメータ切換制御部417は、音声符号化器420における符号化部の切換タイミングを考慮したタイミングで、最適な雑音抑圧特性が得られるパラメータセットを設定する制御を行う。
In this case, the parameter
また、以上の第1〜第4の実施形態では、図9で要約して示されるように、送話音声を符号化する場合を例に説明した。なお、この図において、1はマイクロフォンであり、2はA/D変換器で、ノイズサプレッサ10が上述のノイズサプレッサ110,210,310,410に対応し、音声符号化器20が上述の音声符号化器120,220,320,420に対応する。
Further, in the above first to fourth embodiments, the case where the transmitted voice is encoded has been described as an example, as summarized in FIG. In this figure, 1 is a microphone, 2 is an A / D converter, the
ところで、上記の第1、第2の実施形態では、符号化方式の数(A方式、B方式、C方式の3個)とノイズサプレス方式の数(X方式、Y方式、Z方式の3個)および符号化方式の数とノイズサプレス部に設定するパラメータセットの数が同じものとして説明した。 By the way, in the first and second embodiments described above, the number of encoding methods (three, A method, B method, C method) and the number of noise suppression methods (three, X method, Y method, Z method). ) And the number of encoding methods and the number of parameter sets set in the noise suppression unit are the same.
また、第3、第4の実施形態でも符号化のレートの数(Aレート、Bレート、Cレートの3個)とノイズサプレス方式の数(X方式、Y方式、Z方式の3個)および符号化のレートの数とノイズサプレス部に設定するパラメータセットの数が同じものとして説明した。 Also in the third and fourth embodiments, the number of encoding rates (three rates of A rate, B rate, and C rate) and the number of noise suppression methods (three of the X method, Y method, and Z method) and The description has been made assuming that the number of encoding rates is the same as the number of parameter sets set in the noise suppression unit.
しかしながら、本発明を実施するにあたっては、符号化方式の数とノイズサプレス方式の数、符号化方式の数とノイズサプレス部に設定するパラメータセットの数が同数でなくてもよい。 However, in implementing the present invention, the number of encoding schemes and the number of noise suppression schemes, and the number of encoding schemes and the number of parameter sets set in the noise suppression section may not be the same.
また、符号化レートの数とノイズサプレス方式の数および符号化レートの数とノイズサプレス部に設定するパラメータセットの数が同数でなくてもよい。 Also, the number of encoding rates, the number of noise suppression schemes, and the number of encoding rates may not be the same as the number of parameter sets set in the noise suppression unit.
第3の実施形態を例に挙げて説明すると、例えば、図10に示すように、音声符号化器320が備える符号化部が8種類(Aレート、Bレート、Cレート、…、Hレート)あり、ノイズサプレス部がX方式とY方式の2つだけであってもよい。 The third embodiment will be described as an example. For example, as shown in FIG. 10, the speech encoder 320 includes eight types of encoding units (A rate, B rate, C rate,..., H rate). There may be only two noise suppression units, the X method and the Y method.
この場合、例えば図11に示すように、音質のあまり良くないAレートの符号化部321の場合は、X方式のノイズサプレス部311を使用し、それ以外の符号化レートをもつ符号化部は、Y方式のノイズサプレス部312が使用されるようにする方法がある。
In this case, for example, as shown in FIG. 11, in the case of an
また、これ以外にも、例えばAレート、Bレート、Cレート、Dレートには、X方式の雑音抑圧を使用し、Eレート、Fレート、Gレート、Hレートには、Y方式の雑音抑圧を使用するなど、様々な実現の形態が可能であることはいうまでもない。 In addition, for example, X-type noise suppression is used for the A rate, B rate, C rate, and D rate, and Y-type noise suppression is used for the E rate, F rate, G rate, and H rate. It goes without saying that various forms of implementation are possible, such as using.
要は、符号化レートとその符号化レートに応じて使用する雑音抑圧の方式(または符号化レートに応じて雑音抑圧の制御のために設定するパラメータセット)を予め対応づけておくことが重要で、これにより、本発明が様々な実施形態を実現できる。 In short, it is important to associate the coding rate with the noise suppression method used according to the coding rate (or the parameter set set for noise suppression control according to the coding rate) in advance. Thus, the present invention can realize various embodiments.
図1に示した第1の実施形態にあっては、音声符号化器120における互いに方式が異なる符号化部の数をP、ノイズサプレッサ110における互いに方式が異なるノイズサプレス部の数をQ(P,Qは共に正の整数)とした場合、PとQは、P≧Q>1の関係にあればよい。 In the first embodiment shown in FIG. 1, the number of encoding units having different schemes in the speech encoder 120 is P, and the number of noise suppressing units having different schemes in the noise suppressor 110 is Q (P , Q are both positive integers), P and Q need only have a relationship of P ≧ Q> 1.
また、図3に示した第2の実施形態にあっては、音声符号化器220における互いに方式が異なる符号化部の数をP、ノイズサプレッサ210のノイズサプレス部215に設定されるパラメータの数をS(P,Sは共に正の整数)とした場合、PとSは、P≧S>1の関係にあればよい。
In the second embodiment shown in FIG. 3, the number of encoding units having different schemes in speech encoder 220 is P, and the number of parameters set in
さらに、図5に示した第3の実施形態にあっては、音声符号化器320における互いに符号化レートが異なる符号化部の数をR、ノイズサプレッサ310における互いに方式が異なるノイズサプレス部の数をQ(R,Qは共に正の整数)とした場合、RとQは、R≧Q>1の関係にあればよい。 Furthermore, in the third embodiment shown in FIG. 5, the number of encoding units having different encoding rates in the speech encoder 320 is R, and the number of noise suppressing units having different methods in the noise suppressor 310 is used. Is Q (R and Q are both positive integers), R and Q need only have a relationship of R ≧ Q> 1.
図7に示した第4の実施形態にあっては、音声符号化器420における互いに符号化レートの異なる符号化部の数をR、ノイズサプレッサ410のノイズサプレス部415に設定されるパラメータの数をS(R,Sは共に正の整数)とした場合、RとSは、R≧S>1の関係にあればよい。
In the fourth embodiment shown in FIG. 7, the number of encoding units having different encoding rates in the speech encoder 420 is R, and the number of parameters set in the
また、この発明は、このような送話音声を符号化する場合にのみ適用が限定されるものではなく、図12に示すような符号化音声データを復号する場合にも適用可能である。 Further, the application of the present invention is not limited to the case where such transmitted speech is encoded, and can also be applied to the case where encoded speech data as shown in FIG. 12 is decoded.
なお、この図において、3はスピーカであり、2はD/A変換器で、40は、複数の復号方式、あるいは複数の符号化レートを選択的に用いて音声データを復号する復号器で、ノイズサプレッサ30が音声復号器40の復号処理に合わせ、最適な背景雑音の抑圧処理を行う。
In this figure, 3 is a speaker, 2 is a D / A converter, 40 is a decoder that selectively decodes audio data using a plurality of decoding methods or a plurality of encoding rates, The
このように、復号側にも適用する場合においても、前述の符号化の例と同様に、4つの形態を構成することが可能であり、このような各構成において、復号方式や符号化レートの切り替えた場合でも、ノイズサプレッサが十分な機能を発揮し、高品質な音声を受信することができる。 As described above, even when the present invention is applied to the decoding side, it is possible to configure four modes as in the above-described encoding example. In each of these configurations, the decoding scheme and the encoding rate can be configured. Even when switching, the noise suppressor can function sufficiently and receive high-quality sound.
また、第3および第4の両実施形態では、符号化レートが可変可能な符号化器として、図5および図7の音声符号化器320,420に示すような、3つの回路を選択的に用いる構成を例に説明した。 Further, in both the third and fourth embodiments, three circuits as shown in the speech encoders 320 and 420 in FIGS. 5 and 7 are selectively used as encoders capable of changing the encoding rate. The configuration used is described as an example.
しかし、これに限定されるものではなく、図13に示す音声符号化器720のように、1つの符号化部725のパラメータを可変することにより、符号化レートを可変するようにしてもよい。
However, the present invention is not limited to this, and the coding rate may be varied by varying the parameters of one
なお、この図の構成では、予め、複数の符号化レートで符号化を行うためのパラメータセットをパラメータテーブル726に記憶させておき、外部からの要求に応じて符号化レート切換制御部727が、要求に応じたパラメータセットをパラメータテーブル726より出力して符号化部725に設定するようにする。
In the configuration of this figure, a parameter set for performing encoding at a plurality of encoding rates is stored in the parameter table 726 in advance, and the encoding rate switching
このような構成の音声符号化器720が用いられる場合でも、第3および第4の実施形態と同様に、ノイズサプレス部が十分な機能を発揮し、高品質な音声を送信することができる。
そしてまた、図1や図3の音声符号化器120,220を構成する符号化部121〜123,221〜223のいずれかを、図13に示したような音声符号化器720とすることも可能である。
Even when the speech coder 720 having such a configuration is used, as in the third and fourth embodiments, the noise suppressor exhibits a sufficient function and can transmit high-quality speech.
In addition, any of the
なお、符号化と復号の違いはあるものの、図12に示した復号側の構成に図13に示した構成を適用することも同様に可能であり、この場合においても、復号方式や符号化レートの切り替えた場合でも、ノイズサプレッサが十分な機能を発揮し、高品質な音声を受信することができる。 Although there is a difference between encoding and decoding, it is also possible to apply the configuration shown in FIG. 13 to the configuration on the decoding side shown in FIG. 12, and even in this case, the decoding scheme and encoding rate are also applicable. Even when switching between, the noise suppressor exhibits a sufficient function and can receive high-quality sound.
さらにまた、第4の実施形態において、ノイズサプレッサ410の構成を、特定の符号化レート情報が検出された時に、全部の周波数帯域または一部の周波数帯域で雑音抑圧をOFFとする(雑音抑圧を行わない)構成にすることも可能である。 Furthermore, in the fourth embodiment, the noise suppressor 410 is configured such that when specific coding rate information is detected, noise suppression is turned off in all frequency bands or some frequency bands (noise suppression is suppressed). It is also possible to adopt a configuration that does not.
図14は、このような雑音抑圧を行う場合の構成をノイズサプレッサ410に適用したもので、以下、この図を参照して詳細に説明する。
なお、ここでは、音声信号をM個の周波数帯域に分割し、スペクトルサブトラクション法(SS法)により雑音抑圧を行う方法を例に挙げて説明する。雑音抑圧の方式によっても異なるが、Mの値は通常6〜32程度が用いられる。
FIG. 14 shows a configuration in which such noise suppression is applied to the noise suppressor 410, which will be described in detail below with reference to this figure.
Here, a description will be given by taking as an example a method of dividing a speech signal into M frequency bands and performing noise suppression by a spectral subtraction method (SS method). The value of M is usually about 6 to 32, although it varies depending on the noise suppression method.
パラメータ切換制御部417は、音声符号化器420で用いる符号化の符号化レートを、符号化レート選択情報406から検出し、この検出した符号化レートに応じて、このレートに対応するパラメータテーブル416のパラメータセットをパラメータテーブル416より、ノイズサプレス部415の帯域別抑圧係数計算部460に出力させる。
The parameter
この時、パラメータテーブル416より帯域別抑圧係数計算部460に入力されるパラメータセットは、L個の制御パラメータよりなる。この際、全周波数帯域で等しい程度の雑音抑圧を制御する場合は、1つの符号化レートに対しL=1個の制御パラメータを出力する。
At this time, the parameter set input from the parameter table 416 to the band-specific suppression
一方、M個の周波数帯域毎に異なる雑音抑圧を制御するためには、1つの符号化レートに対しL=M個の制御パラメータを発生する。Lの値はこれに限られるものではない。 On the other hand, in order to control different noise suppression for each of M frequency bands, L = M control parameters are generated for one coding rate. The value of L is not limited to this.
ここでは以降の説明の簡単化のため、符号化レートはA,B,Cの3種類、L=Mとする。この時、符号化レートAに対する制御パラメータはC(A,0)、C(A,1)、…、C(A,M−1)と表すことができる。 Here, for simplification of the following description, there are three types of coding rates, A, B, and C, and L = M. At this time, the control parameters for the coding rate A can be expressed as C (A, 0), C (A, 1),..., C (A, M−1).
C(A,k)は、符号化レートAに対し、M個に分割した周波数帯域のうちK番目の帯域を制御するための制御パラメータを表す。これをまとめたものを図15に示す。 C (A, k) represents a control parameter for controlling the K-th band among the M frequency bands divided with respect to the coding rate A. A summary of this is shown in FIG.
ノイズサプレス部415は、第4の実施形態でも説明したように、パラメータテーブル416からの制御パラメータに応じて、入力信号の雑音抑圧を行うもので、FFT部440、帯域別雑音量推定部450、帯域別抑圧係数計算部460、雑音抑圧部470、逆FFT部480から構成される。
As described in the fourth embodiment, the
FFT部440は、入力音声信号をFFT(高速フーリエ変換)により時間領域から周波数領域に変換する。なお、その他、周波数領域への変換法としてはDFT,DCTなど他の変換法を用いることができる。
The
帯域別雑音量推定部450は、周波数領域に変換された音声信号を所定M個の帯域に分割し、音声信号に含まれる雑音量を帯域別に推定する。帯域別抑圧係数計算部460は、帯域別雑音量推定部450で推定された帯域別の雑音量を基に、帯域別の雑音抑圧係数を計算する。
The band-specific noise
なお、ここでは、帯域別の雑音抑圧係数をD(0),D(1),…,D(M−1)とする。D(k)は、M個に分割した周波数帯域のうちk番目の帯域を制御するために用いる雑音抑圧係数を表す。 Here, it is assumed that the noise suppression coefficients for each band are D (0), D (1),..., D (M−1). D (k) represents a noise suppression coefficient used for controlling the kth band among the M frequency bands.
本発明では、入力信号の分析だけで求められた上記雑音抑圧係数以外に、符号化レート情報から求められる制御パラメータを用いて雑音抑圧処理を制御する。これを実現する1つの方法は、制御パラメータを雑音抑圧係数に乗算したものを新たな雑音抑圧係数として使用できるように制御パラメータを設定することである。 In the present invention, in addition to the noise suppression coefficient obtained only by analyzing the input signal, the noise suppression process is controlled using a control parameter obtained from the coding rate information. One way to achieve this is to set the control parameter so that the control parameter multiplied by the noise suppression coefficient can be used as the new noise suppression coefficient.
具体的には、例えば、以下のような操作を行うことにより、符号化レート情報から求められる制御パラメータC(k)を用いて雑音抑圧係数D(k)を更新する。更新後の雑音抑圧係数D(k)は、雑音抑圧部470へ出力される。
Specifically, for example, by performing the following operations, the noise suppression coefficient D (k) is updated using the control parameter C (k) obtained from the coding rate information. The updated noise suppression coefficient D (k) is output to the
D(k)←D(k)×C(k) (k=0,…,M−1)
雑音抑圧部470は、入力音声信号から求められた周波数領域の音声スペクトルに対し、帯域別抑圧係数計算部460で求められた更新後の抑圧係数を用いて1−D(k)を帯域別に乗じることで雑音抑圧された音声スペクトルが生成される。逆FFT部480は、雑音抑圧部470で生成された音声スペクトルを時問領域の音声信号に変換する。
D (k) ← D (k) × C (k) (k = 0,..., M−1)
ここで、例えば、最も符号化レートが高い符号化レートCの時に、全周波数帯域で雑音抑圧をOFF(雑音抑圧を行わない)とするには、図16のようにビットレートCが検出された時に使用する帯域別制御パラメータを全て「0」に設定すればよい。 Here, for example, in order to turn noise suppression OFF (no noise suppression) in all frequency bands at the highest coding rate C, the bit rate C is detected as shown in FIG. All the band-specific control parameters used at times may be set to “0”.
また、符号化レートBの時に、周波数帯域M−1でだけ雑音抑圧をOFF(雑音抑圧を行わない)とするには、図17のように符号化レートBが検出された時に使用する帯域M−1用の制御パラメータを「0」に設定すればよい。
このような構成によれば、これ以外にも様々な設定が可能であることは言うまでも無い。
In order to turn off noise suppression only in the frequency band M-1 at the coding rate B (no noise suppression is performed), the band M used when the coding rate B is detected as shown in FIG. The control parameter for -1 may be set to “0”.
Needless to say, according to such a configuration, various other settings are possible.
このように、符号化レート情報から生成される制御パラメータを用いてノイズサプレス部415で行う雑音抑圧処理を制御することにより、従来よりも雑音抑圧と可変レート音声符号化のトータル的なバランスを考慮した可変レート音声処理装置を実現できる。
In this way, by controlling the noise suppression processing performed by the
公知の雑音抑圧処理では、入力音声信号に含まれる雑音だけを完全に取り除くことはできないことは周知の事実である。雑音を完全に取り去ろうとすると音声信号の一部が雑音と共に取り去られてしまうことで、音が欠けたり、雑音と異なる異音が混入するなどが原因で、雑音抑圧後の音声の自然が失われるという劣化を引き起こす。 It is a well-known fact that known noise suppression processing cannot completely remove only noise contained in an input voice signal. If the noise is completely removed, part of the audio signal will be removed together with the noise. It causes deterioration that is lost.
一方、音声符号化にとっては、できるだけ雑音が混入していないクリーンな音声信号の方が、符号化の分析がうまく行くこと、符号化モデルにあっていることなどの理由で、符号化による音質の劣化が一般的に小さいことが知られている。 On the other hand, for speech coding, a clean speech signal that contains as little noise as possible has better sound quality due to coding because the coding analysis works better and the coding model fits. It is known that degradation is generally small.
逆に、背景雑音が多く含まれる音声信号を符号化すると、特に低符号化レートの音声符号化では、非音声部分の符号化が著しく劣化するため、背景雑音をある程度抑圧した後の音声信号を符号化した方が品質が向上する。 Conversely, if an audio signal that contains a lot of background noise is encoded, especially in low-rate audio encoding, the encoding of the non-audio portion will be significantly degraded. Encoding improves the quality.
一方、高い符号化レートの音声符号化では、背景雑音が多少多く含まれる音声であっても、符号化自体の能力が高いために背景雑音による音質の劣化が小さく、音質も比較的自然なものが得られる。 On the other hand, in speech coding with a high coding rate, even if the speech contains a lot of background noise, the performance of the coding itself is high, so the degradation of sound quality due to background noise is small, and the sound quality is relatively natural. Is obtained.
このように、ある程度の雑音抑圧をすることは低い符号化レートの音声符号化を用いる場合に、トータルの音声品質に良い影響をもたらす可能性が高い傾向にあるが、高い符号化レートの音声符号化を用いる場合には自然性の高い音質が要求されるアプリケーションにおいては、必ずしも通常の雑音抑圧が必要とは限らない。 In this way, a certain amount of noise suppression tends to have a good effect on the total speech quality when speech coding at a low coding rate is used. In the case of using the normalization, normal noise suppression is not necessarily required in an application that requires a high natural sound quality.
このような場合に、図16で説明した特定の符号化レート(1つの符号化レートとは限らない)で帯域別の制御パラメータを全て「0」に設定することにより、全周波数帯域で雑音抑圧をOFF(雑音抑圧を行わない)とする方法が有効になる。 In such a case, noise suppression is performed in all frequency bands by setting all the band-specific control parameters to “0” at the specific coding rate (not limited to one coding rate) described in FIG. Is effective (no noise suppression is performed).
このため、図14に示したノイズサプレッサ420を用いることにより、符号化レートに応じて雑音抑圧機能を従来よりも柔軟に制御できるため、背景雑音が多く混入するような実環境下で可変レート音声処理装置を使用する際の音声品質を改善できる。 Therefore, by using the noise suppressor 420 shown in FIG. 14, the noise suppression function can be controlled more flexibly than in the past in accordance with the coding rate, so that variable rate speech can be used in a real environment where a lot of background noise is mixed. The voice quality when using the processing device can be improved.
なお、ここでは、図7に示すような符号化側で符号化レートを可変する構成のノイズサプレッサ410に適用する場合について説明したが、復号側にて符号化レートに応じた雑音抑圧を行うノイズサプレッサに適用したり、あるいは符号化方式あるいは復号方式に応じた雑音抑圧を行うノイズサプレッサに適用することも可能で、その場合にも同様の効果を奏することはいうまでもない。 Here, the case where the present invention is applied to the noise suppressor 410 configured to vary the encoding rate on the encoding side as shown in FIG. 7 has been described, but noise that performs noise suppression in accordance with the encoding rate on the decoding side is described. It is possible to apply to a suppressor, or to a noise suppressor that performs noise suppression according to an encoding method or a decoding method, and it goes without saying that the same effect can be obtained in this case.
さらに、第4の実施形態において、ノイズサプレッサ410の構成を、図18に示すようなノイズサプレッサ411とし、符号化レートと無関係に、外部からの要求に応じて強制的に雑音抑圧をOFFとする(雑音抑圧を行わない)構成にすることも可能である。 Furthermore, in the fourth embodiment, the noise suppressor 410 is configured as a noise suppressor 411 as shown in FIG. 18, and the noise suppression is forcibly turned off according to an external request regardless of the encoding rate. A configuration (without noise suppression) is also possible.
同図において、ノイズサプレス部415、パラメータテーブル416、パラメータ切換制御部417は、第4の実施形態で説明したものと同様であることより、ここでは説明を省略する。ここでは、新たに設けた、ON/OFF情報検出部419と、切換スイッチ418について説明する。
In the figure, the
ON/OFF情報検出部419は、外部から雑音を抑圧する機能のON/OFFを指示する情報を検出/判定し、この判定結果に応じて切換スイッチ418の切換制御を行う。
The ON / OFF
すなわち、雑音を抑圧する機能をONにする指示を検出した場合には、A/D変換器402より出力される音声データがノイズサプレス部415に入力されるように切り換えられ、一方、雑音を抑圧する機能をOFFにする指示を検出した場合には、A/D変換器402より出力される音声データがノイズサプレス部415を介さずにディジタルデータ403として後段の音声符号化器420に入力されるように切り換えられる。
That is, when an instruction to turn on the noise suppression function is detected, the audio data output from the A /
雑音を抑圧する機能のON/OFFを外部から制御する一例としては、通信ネットワーク側からのノイズサプレッサ411へのON/OFF制御がある。このような制御が必要になる理由の1つは、受信側と送信側との間で符号化/復号化が2度行われる、いわゆるタンデム接続がありうる通信経路において、雑音抑圧が2度行われてタンデムになることを防止するためである。 As an example of externally controlling ON / OFF of the function for suppressing noise, there is ON / OFF control to the noise suppressor 411 from the communication network side. One of the reasons why such control is necessary is that noise suppression is performed twice in a communication path where there is a so-called tandem connection in which encoding / decoding is performed twice between the receiving side and the transmitting side. This is to prevent them from becoming tandem.
タンデム接続を防止するために行う制御の本質は、雑音抑圧をON(有効)にすることではなく、雑音抑圧をOFF(無効)にすることである。この点を考慮し、通信ネットワーク側からなどの外部からの雑音を抑圧する機能のON/OFF制御がある場合には、双方の意図を生かした制御の組み合わせが可能である。 The essence of the control performed to prevent the tandem connection is not to turn noise suppression ON (enabled) but to turn noise suppression OFF (disabled). In consideration of this point, when there is ON / OFF control of a function for suppressing noise from the outside such as from the communication network side, a combination of controls that makes use of both intentions is possible.
なお、ここでは、図7に示すような符号化側で符号化レートを可変する構成のノイズサプレッサ410に適用する場合について説明したが、復号側にて符号化レートに応じた雑音抑圧を行うノイズサプレッサに適用したり、あるいは符号化方式あるいは復号方式に応じた雑音抑圧を行うノイズサプレッサに適用することも可能で、その場合にも同様の効果を奏することはいうまでもない。 Here, the case where the present invention is applied to the noise suppressor 410 configured to vary the encoding rate on the encoding side as shown in FIG. 7 has been described, but noise that performs noise suppression in accordance with the encoding rate on the decoding side is described. It is possible to apply to a suppressor, or to a noise suppressor that performs noise suppression according to an encoding method or a decoding method, and it goes without saying that the same effect can be obtained in this case.
次に、この発明の第5の実施形態に係わる信号処理装置について説明する。図19は、その構成を示すものである。
音声入力部540は、ユーザの送話音声を電気信号に変換して取り込み、ディジタル化して音声データを得るもので、ハンズフリー用マイク541と、ハンズフリー用マイクアンプ542と、非ハンズフリー用マイク543と、非ハンズフリー用マイクアンプ544と、マイク切換制御部545と、A/D変換器546とを備える。
Next explained is a signal processing apparatus according to the fifth embodiment of the invention. FIG. 19 shows the configuration.
The
マイク切換制御部545は、ハンズフリーと非ハンズフリーとを切り換える制御コマンド553に応じて、上述のハンズフリー用のアナログ系と非ハンズフリー用のアナログ系を切り換える。
The microphone
A/D変換器546は、上記マイク切換制御部545の切換制御により上記いずれかのアナログ系にて得たアナログ音声信号が入力され、このアナログ音声信号をディジタル化し、音声データとして出力する。
The A /
なお、非ハンズフリー時は、音声の到来方向および距離がほぼ決まっているので、これにあわせたマイク感度、指向性をもたせたマイクを使用する。一方、ハンズフリー時は、遠くからの送話音声についても拾えるように、予めマイク感度を上げておく必要があり、また、音声の到来方向も非ハンズフリー時に比べ不確定になるので、指向性を広角化する必要がある。このため、ハンズフリー/非ハンズフリーにより、A/D変換器546に入力されるアナログ音声信号の特性が異なっている。
In non-hands-free, since the direction and distance of voice are almost determined, a microphone having microphone sensitivity and directivity corresponding to this is used. On the other hand, when hands-free, it is necessary to raise the microphone sensitivity in advance so that it can pick up transmitted speech from a distance, and the direction of voice arrival is also uncertain compared to non-hands-free, so directivity It is necessary to widen the angle. For this reason, the characteristics of the analog audio signal input to the A /
エコー制御ユニット530は、ハンズフリー用エコー制御部531と、非ハンズフリー用エコー制御部532と、エコー切換制御部533とを備える。
The echo control unit 530 includes a hands-free
ハンズフリー用エコー制御部531は、ハンズフリー用マイク541およびハンズフリー用マイクアンプ542の使用時に好適し、A/D変換器546の出力する音声データに重畳されるエコーを低減する。
The hands-free
一方、非ハンズフリー用エコー制御部532は、非ハンズフリー用マイク543および非ハンズフリー用マイクアンプ544の使用時に好適し、A/D変換器546の出力する音声データに重畳されるエコーを低減する。ただし、エコー抑圧が不要なときは音声データはエコー制御されること無く出力される。
On the other hand, the non-hands-free
エコー切換制御部533は、ハンズフリーと非ハンズフリーとを切り換える制御コマンド553に応じて、上記ハンズフリー用エコー制御部531と非ハンズフリー用エコー制御部532とうち、いずれか一方にA/D変換器546の出力する音声データを入力することにより、一方を機能させる制御を行うものである。
In response to a control command 553 for switching between hands-free and non-hands-free, the echo switching
この制御により、ハンズフリー用エコー制御部531あるいは非ハンズフリー用エコー制御部532にてエコーが低減された音声データ551は、ノイズサプレッサ510に出力される。
With this control, the
ノイズサプレッサ510は、互いに異なるアルゴリズムにより背景雑音を抑圧する2つの回路として、X方式ノイズサプレス部511、Y方式ノイズサプレス部512を備えるほかに、サプレス方式切換制御部514を備える。
The noise suppressor 510 includes a suppression method switching
X方式ノイズサプレス部511は、ハンズフリー時に使用される、ハンズフリー用マイク541、ハンズフリー用マイクアンプ542およびハンズフリー用エコー制御部531を経て生成される音声データ551に対する雑音抑圧に適するように設定されている。
The X-type
一方、Y方式ノイズサプレス部512は、非ハンズフリー時に使用される、非ハンズフリー用マイク543、非ハンズフリー用マイクアンプ544および非ハンズフリー用エコー制御部532を経て生成される音声データ551に対する雑音抑圧に適するように設定されている。
On the other hand, the Y-type
サプレス方式切換制御部514は、ハンズフリーと非ハンズフリーとを切り換える制御コマンド553に応じて、X方式ノイズサプレス部511とY方式ノイズサプレス部512とのうち、最適ないずれか一方に音声データ551を入力することにより、一方を機能させる制御を行うものである。
In response to a control command 553 for switching between hands-free and non-hands-free, the suppression method switching
次に、上記第5の実施形態の信号処理装置の動作について説明する。図20は、この動作を説明するためのフローチャートである。
今、ステップ20aにてコマンド入力の待機状態から、「ハンズフリーを実施せよ」の旨を示す制御コマンド553が入力されると、ステップ20bに移行して、指定される内容を判定し、ハンズフリーの実施指示であることより、ステップ20cに移行する。
Next, the operation of the signal processing apparatus of the fifth embodiment will be described. FIG. 20 is a flowchart for explaining this operation.
If a control command 553 indicating “execute hands-free” is input from the command input standby state in
ステップ20cでは、マイク切換制御部545が、ハンズフリー用マイク541およびハンズフリー用マイクアンプ542を通じて入力されるアナログ音声信号がA/D変換器546に入力されるように切換制御を開始する。
In
また、ステップ20cでは、この切換制御に並行して、エコー切換制御部533が、上記制御コマンド553に応じて、A/D変換器546より出力される音声データをハンズフリー用エコー制御部531に入力し、ステップ20dに移行する。
In
ステップ20dでは、サプレス方式切換制御部514が、上記制御コマンド553に応じて、ハンズフリー用エコー制御部531より出力される音声データをX方式ノイズサプレス部511に入力し、ステップ20gに移行する。
In
したがって、ハンズフリーの指示が与えられる場合には、このような切換制御動作により、ハンズフリー用マイク541を通じて入力されるユーザの送話音声は、ハンズフリー用エコー制御部531にて、ハンズフリー用マイク541およびハンズフリー用マイクアンプ542の使用時に好適するエコー制御が実施される。
Therefore, when a hands-free instruction is given, the user's transmitted voice input through the hands-
そして、このエコー制御された音声データ551は、X方式ノイズサプレス部511により、ハンズフリー用マイク541、ハンズフリー用マイクアンプ542およびハンズフリー用エコー制御部531の使用時に最適な雑音抑圧処理が施され、後段の送信部に送信音声データ552として出力される。
The echo-controlled
その後、ステップ20gにおいて、「ハンズフリーを中止せよ」の旨を示す制御コマンド553が入力されると、ステップ20bに移行して、指定される内容を判定し、ハンズフリーの中止指示であることより、ステップ20eに移行する。
After that, when a control command 553 indicating “Stop Hands-Free” is input in
ステップ20eでは、マイク切換制御部545が、非ハンズフリー用マイク543および非ハンズフリー用マイクアンプ544を通じて入力されるアナログ音声信号がA/D変換器546に入力されるように切換制御を開始する。
In
また、ステップ20eでは、この切換制御に並行して、エコー切換制御部533が、上記制御コマンド553に応じて、A/D変換器546より出力される音声データを非ハンズフリー用エコー制御部532に入力し、ステップ20fに移行する。
In
ステップ20fでは、サプレス方式切換制御部514が、上記制御コマンド553に応じて、非ハンズフリー用エコー制御部532より出力される音声データをY方式ノイズサプレス部512に入力し、ステップ20gに移行する。
In
したがって、ハンズフリーの中止指示が与えられる場合には、このような切換制御動作により、非ハンズフリー用マイク543を通じて入力されるユーザの送話音声は、非ハンズフリー用エコー制御部532にて、非ハンズフリー用マイク543および非ハンズフリー用マイクアンプ544の使用時に好適するエコー制御が実施される。
Therefore, when a hands-free stop instruction is given, the user's transmitted voice input through the non-hands-
そして、このエコー制御された音声データ551は、Y方式ノイズサプレス部512により、非ハンズフリー用マイク543、非ハンズフリー用マイクアンプ544および非ハンズフリー用エコー制御部532の使用時に最適な雑音抑圧処理が施され、後段の送信部に送信音声データ552として出力される。
Then, the echo-controlled
なお、ステップ20gにて、コマンド入力がない場合には、ステップ20hに移行する。ステップ20hでは、通信の終了要求がなされたか否かを判定し、終了要求があった場合には、当該処理を終了し、一方、終了要求がない場合には、再びステップ20gにてコマンド入力を監視する。
If there is no command input in
以上のように、上記構成の信号処理装置では、エコー制御および雑音抑圧された送信音声データ552を得るにあたり、ハンズフリー/非ハンズフリーの音声データの生成経路に合わせて、最適なノイズサプレス部(511あるいは512のいずれか)を機能させるようにしている。
As described above, in the signal processing apparatus having the above-described configuration, in order to obtain the
したがって、上記構成の信号処理装置によれば、ハンズフリー/非ハンズフリーが切り換えれる場合でも、音声データの生成経路、すなわち音声データの特性に適したノイズサプレス部による雑音抑圧が行われるので、ノイズサプレス部が十分な機能を発揮し、高品質な音声を送信することができる。 Therefore, according to the signal processing apparatus configured as described above, even when hands-free / non-hands-free switching is performed, noise suppression is performed by the noise suppression unit suitable for the sound data generation path, that is, the characteristics of the sound data. The suppressor can perform a sufficient function and transmit high-quality sound.
次に、この発明の第6の実施形態に係わる信号処理装置について説明する。図21は、その構成を示すものである。
音声入力部640は、ユーザの送話音声を電気信号に変換して取り込み、ディジタル化して音声データを得るもので、ハンズフリー用マイク641と、ハンズフリー用マイクアンプ642と、非ハンズフリー用マイク643と、非ハンズフリー用マイクアンプ644と、マイク切換制御部645と、A/D変換器646とを備える。
Next explained is a signal processing apparatus according to the sixth embodiment of the invention. FIG. 21 shows the configuration.
The
マイク切換制御部645は、ハンズフリーと非ハンズフリーとを切り換える制御コマンド653に応じて、上述のハンズフリー用のアナログ系と非ハンズフリー用のアナログ系を切り換える。 The microphone switching control unit 645 switches between the above-described hands-free analog system and non-hands-free analog system in response to a control command 653 that switches between hands-free and non-hands-free.
A/D変換器646は、上記マイク切換制御部645の切換制御により上記いずれかのアナログ系にて得たアナログ音声信号が入力され、このアナログ音声信号をディジタル化し、音声データとして出力する。
The A /
なお、非ハンズフリー時は、音声の到来方向および距離がほぼ決まっているので、これにあわせたマイク感度、指向性をもたせたマイクを使用する。一方、ハンズフリー時は、遠くからの送話音声についても拾えるように、予めマイク感度を上げておく必要があり、また、音声の到来方向も非ハンズフリー時に比べ不確定になるので、指向性を広角化する必要がある。このため、ハンズフリー/非ハンズフリーにより、A/D変換器646に入力されるアナログ音声信号の特性が異なっている。
In non-hands-free, since the direction and distance of voice are almost determined, a microphone having microphone sensitivity and directivity corresponding to this is used. On the other hand, when hands-free, it is necessary to raise the microphone sensitivity in advance so that it can pick up transmitted speech from a distance, and the direction of voice arrival is also uncertain compared to non-hands-free, so directivity It is necessary to widen the angle. For this reason, the characteristics of the analog audio signal input to the A /
エコー制御ユニット630は、ハンズフリー用エコー制御部631と、非ハンズフリー用エコー制御部632と、エコー切換制御部633とを備える。
The echo control unit 630 includes a hands-free
ハンズフリー用エコー制御部631は、ハンズフリー用マイク641およびハンズフリー用マイクアンプ642の使用時に好適し、A/D変換器646の出力する音声データに重畳されるエコーを低減する。
The hands-free
一方、非ハンズフリー用エコー制御部632は、非ハンズフリー用マイク643および非ハンズフリー用マイクアンプ644の使用時に好適し、A/D変換器646の出力する音声データに重畳されるエコーを低減する。ただし、エコー抑圧が不要なときは音声データはエコー制御されること無く出力される。
On the other hand, the non-hands-free
エコー切換制御部633は、ハンズフリーと非ハンズフリーとを切り換える制御コマンド653に応じて、上記ハンズフリー用エコー制御部631と非ハンズフリー用エコー制御部632とうち、いずれか一方にA/D変換器646の出力する音声データを入力することにより、一方を機能させる制御を行うものである。
The echo
この制御により、ハンズフリー用エコー制御部631あるいは非ハンズフリー用エコー制御部632にてエコーが低減された音声データ651は、ノイズサプレッサ610に出力される。
By this control, the
ノイズサプレッサ610は、ノイズサプレス部615と、パラメータテーブル616と、パラメータ切換制御部617とを備える。
ノイズサプレス部615は、エコー制御ユニット630が出力する音声データに含まれる背景雑音を抑圧するもので、その抑圧特性は、パラメータテーブル616より入力されるパラメータによって制御される。
The noise suppressor 610 includes a
The
パラメータテーブル616は、ノイズサプレス部615にて行われる背景雑音の抑圧処理の特性を設定するパラメータを記憶するテーブルで、ハンズフリー時に最適なパラメータセットAと、非ハンズフリー時に最適なパラメータセットBを記憶し、パラメータ切換制御部617の制御によりパラメータセットをノイズサプレス部615に入力する。
The parameter table 616 stores parameters for setting the characteristics of the background noise suppression processing performed by the
すなわち、パラメータセットAは、ノイズサプレス部615の特性を、ハンズフリー時に使用される、ハンズフリー用マイク641、ハンズフリー用マイクアンプ642およびハンズフリー用エコー制御部631を経て生成される音声データ651に対する雑音抑圧に適する特性となるようにするものである。
That is, the parameter set A uses the characteristics of the
また、パラメータセットBは、ノイズサプレス部615の特性を、非ハンズフリー時に使用される、非ハンズフリー用マイク643、非ハンズフリー用マイクアンプ644および非ハンズフリー用エコー制御部632を経て生成される音声データ651に対する雑音抑圧に適する特性となるようにするものである。
The parameter set B is generated through the non-hands-
パラメータ切換制御部617は、パラメータテーブル616を制御して、ハンズフリーと非ハンズフリーとを切り換える制御コマンド653に応じて、音声データ651の雑音抑圧処理に最適なパラメータセットを選択的にノイズサプレス部615に設定するものである。
The parameter
次に、上記第6の実施形態の信号処理装置の動作について説明する。図22は、この動作を説明するためのフローチャートである。
今、ステップ22aにてコマンド入力の待機状態から、「ハンズフリーを実施せよ」の旨を示す制御コマンド653が入力されると、ステップ22bに移行して、指定される内容を判定し、ハンズフリーの実施指示であることより、ステップ22cに移行する。
Next, the operation of the signal processing apparatus according to the sixth embodiment will be described. FIG. 22 is a flowchart for explaining this operation.
When a control command 653 indicating that “execute hands-free” is input from the command input standby state in
ステップ22cでは、マイク切換制御部645が、ハンズフリー用マイク641およびハンズフリー用マイクアンプ642を通じて入力されるアナログ音声信号がA/D変換器646に入力されるように切換制御を開始する。
In
また、ステップ22cでは、この切換制御に並行して、エコー切換制御部633が、上記制御コマンド653に応じて、A/D変換器646より出力される音声データをハンズフリー用エコー制御部631に入力し、ステップ22dに移行する。
In
ステップ22dでは、パラメータ切換制御部617が、上記制御コマンド653に応じて、パラメータテーブル616を制御して、ハンズフリー時に最適なパラメータセットAをノイズサプレス部615に設定し、ステップ22gに移行する。
In
したがって、ハンズフリーの指示が与えられる場合には、このような切換制御動作により、ハンズフリー用マイク641を通じて入力されるユーザの送話音声は、ハンズフリー用エコー制御部631にて、ハンズフリー用マイク641およびハンズフリー用マイクアンプ642の使用時に好適するエコー制御が実施される。
Therefore, when a hands-free instruction is given, the user's transmitted voice input through the hands-
そして、このエコー制御された音声データ651は、パラメータセットAが設定されるノイズサプレス部615により、ハンズフリー用マイク641、ハンズフリー用マイクアンプ642およびハンズフリー用エコー制御部631の使用時に最適な雑音抑圧処理が施され、後段の送信部に送信音声データ652として出力される。
Then, the echo-controlled
その後、ステップ22gにおいて、「ハンズフリーを中止せよ」の旨を示す制御コマンド653が入力されると、ステップ22bに移行して、指定される内容を判定し、ハンズフリーの中止指示であることより、ステップ22eに移行する。
After that, when a control command 653 indicating “Stop Hands-Free” is input in
ステップ22eでは、マイク切換制御部645が、非ハンズフリー用マイク643および非ハンズフリー用マイクアンプ644を通じて入力されるアナログ音声信号がA/D変換器646に入力されるように切換制御を開始する。
In
また、ステップ22eでは、この切換制御に並行して、エコー切換制御部633が、上記制御コマンド653に応じて、A/D変換器646より出力される音声データを非ハンズフリー用エコー制御部632に入力し、ステップ22fに移行する。
In
ステップ22fでは、パラメータ切換制御部617が、上記制御コマンド653に応じて、パラメータテーブル616を制御して、非ハンズフリー時に最適なパラメータセットBをノイズサプレス部615に設定し、ステップ22gに移行する。
In
したがって、ハンズフリーの中止指示が与えられる場合には、このような切換制御動作により、非ハンズフリー用マイク643を通じて入力されるユーザの送話音声は、非ハンズフリー用エコー制御部632にて、非ハンズフリー用マイク643および非ハンズフリー用マイクアンプ644の使用時に好適するエコー制御が実施される。
Therefore, when a hands-free stop instruction is given, the user's transmitted voice input through the non-hands-
そして、このエコー制御された音声データ651は、パラメータセットBが設定されるノイズサプレス部615により、非ハンズフリー用マイク643、非ハンズフリー用マイクアンプ644および非ハンズフリー用エコー制御部632の使用時に最適な雑音抑圧処理が施され、後段の送信部に送信音声データ652として出力される。
The
なお、ステップ22gにて、コマンド入力がない場合には、ステップ22hに移行する。ステップ22hでは、通信の終了要求がなされたか否かを判定し、終了要求があった場合には、当該処理を終了し、一方、終了要求がない場合には、再びステップ22gにてコマンド入力を監視する。
If there is no command input in
以上のように、上記構成の信号処理装置では、エコー制御および雑音抑圧された送信音声データ652を得るにあたり、ハンズフリー/非ハンズフリーの音声データの生成経路に合わせて、最適な雑音抑圧特性となるようにノイズサプレス部615の特性を制御するようにしている。
As described above, in the signal processing apparatus having the above-described configuration, when obtaining the
したがって、上記構成の信号処理装置によれば、ハンズフリー/非ハンズフリーが切り換えれる場合でも、音声データの生成経路、すなわち音声データの特性に適したノイズサプレス部による雑音抑圧が行われるので、ノイズサプレス部が十分な機能を発揮し、高品質な音声を送信することができる。 Therefore, according to the signal processing apparatus configured as described above, even when hands-free / non-hands-free switching is performed, noise suppression is performed by the noise suppression unit suitable for the sound data generation path, that is, the characteristics of the sound data. The suppressor can perform a sufficient function and transmit high-quality sound.
尚、この発明は上記実施の形態に限定されるものではない。例えば、上述の各実施の形態では、ノイズサプレッサ、音声符号化(復号)器、エコー制御ユニットなどを、それぞれ別の回路の如く説明したが、各実施形態において、これらを1チップ化して、1つまたは複数のDSPチップ上で実現することも可能である。 The present invention is not limited to the above embodiment. For example, in each of the above-described embodiments, the noise suppressor, the voice encoder (decoder), the echo control unit, and the like have been described as separate circuits. However, in each embodiment, these are integrated into one chip. It can also be implemented on one or more DSP chips.
また、これに代わって例えば、高速なプロセッサとメモリを用いて、ノイズサプレッサ、音声符号化(復号)器、エコー制御ユニットなどの機能を発揮するプログラムを上記メモリに記憶させ、このプログラムに従って上記プロセッサを作動させることにより実現することが可能であることはいうまでもない。
その他、この発明の要旨を逸脱しない範囲で種々の変形を施しても同様に実施可能であることはいうまでもない。
Alternatively, for example, using a high-speed processor and memory, a program that performs functions such as a noise suppressor, a speech coder (decoder), and an echo control unit is stored in the memory. Needless to say, this can be realized by operating the.
In addition, it goes without saying that the present invention can be similarly implemented even if various modifications are made without departing from the gist of the present invention.
10,30,110,310,510…ノイズサプレッサ
20,120,220,320,420,720…音声符号化器
40…音声復号器
111〜113,311〜313,511,512…ノイズサプレス部
114,314,514…サプレス方式切換制御部
121〜123,221〜223,725…符号化部
124,224…符号化方式切換制御部
210,410,411,610…ノイズサプレッサ
215,415,615…ノイズサプレス部
216,416,616,726…パラメータテーブル
217,417,617…パラメータ切換制御部
321〜323,421〜423…レート符号化部
324,424,727…符号化レート切換制御部
419…ON/OFF情報検出部
440…FFT部
450…帯域別雑音量推定部
460…帯域別抑圧係数計算部
470…雑音抑圧部
480…逆FFT部
530,630…エコー制御ユニット
531,631…ハンズフリー用エコー制御部
532,632…非ハンズフリー用エコー制御部
533,633…エコー切換制御部
540,640…音声入力部
541,641…ハンズフリー用マイク
542,642…ハンズフリー用マイクアンプ
543,643…非ハンズフリー用マイク
544,644…非ハンズフリー用マイクアンプ
545,645…マイク切換制御部。
10, 30, 110, 310, 510 ...
Claims (29)
前記符号化手段は、複数の異なる符号化処理が可能であり、
前記雑音抑圧手段は、前記符号化手段にて実施される符号化処理に応じた雑音抑圧特性を有することを特徴とする信号処理装置。 Noise suppression means for suppressing a noise component included in the audio signal, and encoding means for generating compressed encoded audio data by performing encoding processing on the audio signal in which the noise component is suppressed by the noise suppression means A signal processing device comprising:
The encoding means can perform a plurality of different encoding processes,
The signal processing apparatus, wherein the noise suppression unit has a noise suppression characteristic according to an encoding process performed by the encoding unit.
音声信号に対して雑音成分の抑圧を行うもので、パラメータの設定に応じて雑音成分の抑圧特性を可変可能なノイズサプレス部と、
前記符号化手段にて選択的に実施される符号化処理に応じたパラメータを、前記ノイズサプレス部に設定するパラメータ設定手段とを備えることを特徴とする請求項1乃至請求項5のいずれかに記載の信号処理装置。 The noise suppression means includes
A noise suppressor that suppresses noise components for audio signals, and that can vary the noise component suppression characteristics according to parameter settings;
6. The apparatus according to claim 1, further comprising: a parameter setting unit that sets, in the noise suppression unit, a parameter corresponding to an encoding process selectively performed by the encoding unit. The signal processing apparatus as described.
前記復号手段は、前記復号化音声データに応じて複数の異なる復号化処理が可能であり、
前記雑音抑圧手段は、前記復号手段にて実施される復号処理に応じた雑音抑圧特性を有することを特徴とする信号処理装置。 A signal processing apparatus comprising: decoding means for decoding compressed encoded audio data into an audio signal; and noise suppression means for suppressing a noise component contained in the audio signal decoded by the decoding means,
The decoding means can perform a plurality of different decoding processes according to the decoded audio data,
The signal processing apparatus, wherein the noise suppression means has a noise suppression characteristic according to a decoding process performed by the decoding means.
復号された音声信号に対して雑音成分の抑圧を行うもので、パラメータの設定に応じて雑音成分の抑圧特性を可変可能なノイズサプレス部と、
前記復号手段にて選択的に実施される復号処理に応じたパラメータを、前記ノイズサプレス部に設定するパラメータ設定手段とを備えることを特徴とする請求項8乃至請求項12のいずれかに記載の信号処理装置。 The noise suppression means includes
A noise suppressor that performs noise component suppression on the decoded speech signal, and a noise suppressor that can vary the noise component suppression characteristics in accordance with parameter settings;
The parameter setting means which sets the parameter according to the decoding process selectively implemented in the said decoding means in the said noise suppression part is provided. Signal processing device.
入力された音声信号に対して、前記ハンズフリー機能を使用した音声入力か否かに応じた雑音成分の抑圧を行う雑音抑圧手段を具備することを特徴とする信号処理装置。 In a signal processing device used for equipment that can selectively use the hands-free function,
A signal processing apparatus comprising noise suppression means for suppressing noise components in accordance with whether or not the input voice signal is voice input using the hands-free function.
入力された音声信号に対して雑音成分の抑圧を行うもので、パラメータの設定に応じて雑音成分の抑圧特性を可変可能なノイズサプレス部と、
前記ハンズフリー機能を使用した音声入力か否かに応じたパラメータを、前記ノイズサプレス部に設定するパラメータ設定手段とを備えることを特徴とする請求項15乃至請求項17のいずれかに記載の信号処理装置。 The noise suppression means includes
A noise suppressor that performs noise component suppression on the input audio signal, and that can vary the noise component suppression characteristics in accordance with parameter settings; and
18. The signal according to claim 15, further comprising: a parameter setting unit that sets, in the noise suppression unit, a parameter according to whether or not voice input using the hands-free function is performed. Processing equipment.
前記符号化工程は、複数の異なる符号化処理を選択的に実施し、
前記雑音抑圧工程は、音声信号に対して、前記符号化工程にて選択的に実施される符号化処理に応じた雑音成分の抑圧を行うことを特徴とする信号処理方法。 A noise suppression step for suppressing a noise component included in the audio signal, and an encoding step for generating compressed encoded audio data by performing encoding processing on the audio signal in which the noise component is suppressed in the noise suppression step A signal processing method comprising:
The encoding step selectively performs a plurality of different encoding processes,
The signal processing method characterized in that the noise suppression step suppresses noise components corresponding to the encoding process selectively performed in the encoding step on the speech signal.
前記復号工程は、前記符号化音声データに応じて、複数の異なる復号処理を選択的に前記符号化音声データに対して実施し、
前記雑音抑圧工程は、音声信号に対して、前記復号工程にて選択的に実施される復号処理に応じた雑音成分の抑圧を行うことを特徴とする信号処理方法。 A signal processing method comprising: a decoding step of decoding compressed encoded audio data into an audio signal; and a noise suppression step of suppressing a noise component included in the audio signal decoded by the decoding step,
The decoding step selectively performs a plurality of different decoding processes on the encoded audio data according to the encoded audio data,
The signal processing method characterized in that the noise suppression step suppresses a noise component corresponding to a decoding process selectively performed in the decoding step on the audio signal.
入力された音声信号に対して、前記ハンズフリー機能を使用した音声入力か否かに応じた雑音成分の抑圧を行う雑音抑圧工程を具備することを特徴とする信号処理方法。 In a signal processing method used for a device that can selectively use a hands-free function,
A signal processing method comprising: a noise suppression step of suppressing a noise component according to whether or not the input voice signal is a voice input using the hands-free function.
前記符号化手順は、複数の異なる符号化処理を選択的に実施する手順であり、
前記雑音抑圧手順は、音声信号に対して、前記符号化手順にて選択的に実施される符号化処理に応じた雑音成分の抑圧を行う手順であることを特徴とする記録媒体。 A noise suppression procedure for suppressing a noise component included in a speech signal, and a coding procedure for generating encoded speech data compressed by performing a coding process on the speech signal in which the noise component is suppressed by the noise suppression procedure. A computer-readable recording medium storing a program for causing a computer to execute functions,
The encoding procedure is a procedure for selectively performing a plurality of different encoding processes,
The recording medium according to claim 1, wherein the noise suppression procedure is a procedure for suppressing a noise component according to an encoding process selectively performed in the encoding procedure on an audio signal.
前記復号手順は、前記符号化音声データに応じて、複数の異なる復号処理を選択的に前記符号化音声データに対して実施する手順であり、
前記雑音抑圧手順は、音声信号に対して、前記復号手順にて選択的に実施される復号処理に応じた雑音成分の抑圧を行う手順であることを特徴とする記録媒体。 A computer-readable recording of a program for causing a computer to execute a decoding procedure for decoding compressed encoded voice data into a voice signal and a noise suppression unit for suppressing a noise component included in the voice signal decoded by the decoding procedure A possible recording medium,
The decoding procedure is a procedure for selectively performing a plurality of different decoding processes on the encoded audio data according to the encoded audio data,
The recording medium according to claim 1, wherein the noise suppression procedure is a procedure for suppressing a noise component corresponding to a decoding process selectively performed in the decoding procedure with respect to an audio signal.
入力された音声信号に対して、前記ハンズフリー機能を使用した音声入力か否かに応じた雑音成分の抑圧を行う雑音抑圧手順をコンピュータに実行させるためのプログラムを記録したコンピュータ読み取り可能な記録媒体。 A procedure for selectively enabling the hands-free function;
A computer-readable recording medium having recorded thereon a program for causing a computer to execute a noise suppression procedure for suppressing a noise component in accordance with whether or not the voice input using the hands-free function is performed on the input audio signal .
前記符号化手段は、複数の異なる符号化方式による符号化処理を選択的に実施し、
前記雑音抑圧手段は、互いに異なる雑音成分の抑圧特性を有する複数のノイズサプレス部を備え、音声信号に対して、前記符号化手段で選択的に実施される符号化処理に応じて、前記複数のノイズサプレス部の中から1つのノイズサプレス部を選択的に用いて雑音成分の抑圧を行うものであり、
前記符号化手段における複数の異なる符号化方式の数をP、前記雑音抑圧手段のノイズサプレス部の数をQ(P,Qは共に正の整数)とした場合、PとQは、P≧Q>1の関係にあることを特徴とする信号処理装置。 Noise suppression means for suppressing a noise component included in the audio signal, and encoding means for generating compressed encoded audio data by performing encoding processing on the audio signal in which the noise component is suppressed by the noise suppression means A signal processing device comprising:
The encoding means selectively performs encoding processing by a plurality of different encoding methods,
The noise suppression unit includes a plurality of noise suppression units having noise component suppression characteristics different from each other, and the plurality of noise suppression units according to an encoding process selectively performed by the encoding unit on a speech signal. The noise component is suppressed by selectively using one noise suppressor from among the noise suppressors,
When the number of different encoding methods in the encoding means is P and the number of noise suppression units in the noise suppression means is Q (P and Q are both positive integers), P and Q are P ≧ Q A signal processing apparatus having a relationship of> 1.
前記符号化手段は、複数の異なる符号化レートによる符号化処理を選択的に実施し、
前記雑音抑圧手段は、互いに異なる雑音成分の抑圧特性を有する複数のノイズサプレス部を備え、音声信号に対して、前記符号化手段で選択的に実施される符号化処理に応じて、前記複数のノイズサプレス部の中から1つのノイズサプレス部を選択的に用いて雑音成分の抑圧を行うものであり、
前記符号化手段における前記複数の異なる符号化レートの数をR、前記雑音抑圧手段のノイズサプレス部の数をQ(R,Qは共に正の整数)とした場合、RとQは、R≧Q>1の関係にあることを特徴とする信号処理装置。 Noise suppression means for suppressing a noise component included in the audio signal, and encoding means for generating compressed encoded audio data by performing encoding processing on the audio signal in which the noise component is suppressed by the noise suppression means A signal processing device comprising:
The encoding means selectively performs encoding processing at a plurality of different encoding rates,
The noise suppression unit includes a plurality of noise suppression units having noise component suppression characteristics different from each other, and the plurality of noise suppression units according to an encoding process selectively performed by the encoding unit on a speech signal. The noise component is suppressed by selectively using one noise suppressor from among the noise suppressors,
When the number of the plurality of different encoding rates in the encoding unit is R and the number of noise suppression units of the noise suppression unit is Q (R and Q are both positive integers), R and Q are R ≧ Q. A signal processing apparatus having a relationship of Q> 1.
前記符号化手段は、複数の異なる符号化方式による符号化処理を選択的に実施し、
前記雑音抑圧手段は、音声信号に対して雑音成分の抑圧を行うもので、パラメータの設定に応じて雑音成分の抑圧特性を可変可能なノイズサプレス部と、前記符号化手段で選択的に実施される符号化処理に応じたパラメータを、前記ノイズサプレス部に設定するパラメータ設定手段とを備え、
前記符号化手段における複数の異なる符号化方式の数をP、前記雑音抑圧手段のノイズサプレス部に設定するパラメータセットの数をS(P,Sは共に正の整数)とした場合、PとSは、P≧S>1の関係にあることを特徴とする信号処理装置。 Noise suppression means for suppressing a noise component included in the audio signal, and encoding means for generating compressed encoded audio data by performing encoding processing on the audio signal in which the noise component is suppressed by the noise suppression means A signal processing device comprising:
The encoding means selectively performs encoding processing by a plurality of different encoding methods,
The noise suppression unit performs noise component suppression on a speech signal, and is selectively implemented by a noise suppressor capable of varying noise component suppression characteristics according to parameter settings and the encoding unit. Parameter setting means for setting a parameter corresponding to the encoding processing in the noise suppression unit,
When P is the number of different encoding methods in the encoding means and S is the number of parameter sets to be set in the noise suppression unit of the noise suppression means (P and S are both positive integers), P and S Is a signal processing apparatus characterized by P ≧ S> 1.
前記符号化手段は複数の異なる符号化レートによる符号化処理を選択的に実施し、
前記雑音抑圧手段は、音声信号に対して雑音成分の抑圧を行うもので、パラメータの設定に応じて雑音成分の抑圧特性を可変可能なノイズサプレス部と、前記符号化手段で選択的に実施される符号化処理に応じたパラメータを、前記ノイズサプレス部に設定するパラメータ設定手段とを備え、
前記符号化手段における前記複数の異なる符号化レートの数をR、前記雑音抑圧手段のノイズサプレス部に設定するパラメータセットの数をS(R,Sは共に正の整数)とした場合、RとSは、R≧S>1の関係にあることを特徴とする信号処理装置。 Noise suppression means for suppressing a noise component included in the audio signal, and encoding means for generating compressed encoded audio data by performing encoding processing on the audio signal in which the noise component is suppressed by the noise suppression means A signal processing device comprising:
The encoding means selectively performs encoding processing at a plurality of different encoding rates;
The noise suppression unit performs noise component suppression on a speech signal, and is selectively implemented by a noise suppressor capable of varying noise component suppression characteristics according to parameter settings and the encoding unit. Parameter setting means for setting a parameter corresponding to the encoding processing in the noise suppression unit,
When the number of the plurality of different encoding rates in the encoding unit is R, and the number of parameter sets to be set in the noise suppression unit of the noise suppression unit is S (R and S are both positive integers), R and S is a signal processing apparatus characterized in that R ≧ S> 1.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2010030698A JP2010160496A (en) | 2010-02-15 | 2010-02-15 | Signal processing device and signal processing method |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2010030698A JP2010160496A (en) | 2010-02-15 | 2010-02-15 | Signal processing device and signal processing method |
Related Parent Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2000137181A Division JP2001318694A (en) | 2000-05-10 | 2000-05-10 | Device and method for signal processing and recording medium |
Related Child Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2011260812A Division JP5480226B2 (en) | 2011-11-29 | 2011-11-29 | Signal processing apparatus and signal processing method |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2010160496A true JP2010160496A (en) | 2010-07-22 |
Family
ID=42577655
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2010030698A Pending JP2010160496A (en) | 2010-02-15 | 2010-02-15 | Signal processing device and signal processing method |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2010160496A (en) |
Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH01261930A (en) * | 1988-04-13 | 1989-10-18 | Kokusai Denshin Denwa Co Ltd <Kdd> | Sound encoding/decoding system |
JPH0282710A (en) * | 1988-09-19 | 1990-03-23 | Nippon Telegr & Teleph Corp <Ntt> | After-treatment filter |
JPH0284830A (en) * | 1988-09-20 | 1990-03-26 | Fujitsu Ltd | Audio encoding switching system |
JPH08166800A (en) * | 1994-12-13 | 1996-06-25 | Hitachi Ltd | Speech coder and decoder provided with plural kinds of coding methods |
JPH09152899A (en) * | 1995-11-29 | 1997-06-10 | Nec Corp | Voice coding changeover system |
WO1999030315A1 (en) * | 1997-12-08 | 1999-06-17 | Mitsubishi Denki Kabushiki Kaisha | Sound signal processing method and sound signal processing device |
JP2004272292A (en) * | 1997-12-08 | 2004-09-30 | Mitsubishi Electric Corp | Sound signal processing method |
JP2005338872A (en) * | 1999-09-22 | 2005-12-08 | Conexant Systems Inc | Multimode speech encoder |
-
2010
- 2010-02-15 JP JP2010030698A patent/JP2010160496A/en active Pending
Patent Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH01261930A (en) * | 1988-04-13 | 1989-10-18 | Kokusai Denshin Denwa Co Ltd <Kdd> | Sound encoding/decoding system |
JPH0282710A (en) * | 1988-09-19 | 1990-03-23 | Nippon Telegr & Teleph Corp <Ntt> | After-treatment filter |
JPH0284830A (en) * | 1988-09-20 | 1990-03-26 | Fujitsu Ltd | Audio encoding switching system |
JPH08166800A (en) * | 1994-12-13 | 1996-06-25 | Hitachi Ltd | Speech coder and decoder provided with plural kinds of coding methods |
JPH09152899A (en) * | 1995-11-29 | 1997-06-10 | Nec Corp | Voice coding changeover system |
WO1999030315A1 (en) * | 1997-12-08 | 1999-06-17 | Mitsubishi Denki Kabushiki Kaisha | Sound signal processing method and sound signal processing device |
JP2004272292A (en) * | 1997-12-08 | 2004-09-30 | Mitsubishi Electric Corp | Sound signal processing method |
JP2005338872A (en) * | 1999-09-22 | 2005-12-08 | Conexant Systems Inc | Multimode speech encoder |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP2001318694A (en) | Device and method for signal processing and recording medium | |
JP6786679B2 (en) | Coding of multiple audio signals | |
KR101702281B1 (en) | Voice frequency signal processing method and device | |
US10218856B2 (en) | Voice signal processing method, related apparatus, and system | |
JP2018528479A (en) | Adaptive noise suppression for super wideband music | |
KR102551431B1 (en) | target sample generation | |
EP3391371B1 (en) | Temporal offset estimation | |
WO2008104463A1 (en) | Split-band encoding and decoding of an audio signal | |
CN110024029B (en) | audio signal processing | |
CA2721702C (en) | Apparatus and methods for audio encoding reproduction | |
US20080059154A1 (en) | Encoding an audio signal | |
KR20200051609A (en) | Time offset estimation | |
JP5480226B2 (en) | Signal processing apparatus and signal processing method | |
JP2010160496A (en) | Signal processing device and signal processing method | |
JP2010158044A (en) | Signal processing apparatus and signal processing method | |
JP2009103974A (en) | Masking level calculating device, encoder, masking level calculating method and masking level calculation program |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20110909 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20111004 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20120214 |