JP2010158044A - 信号処理装置および信号処理方法 - Google Patents
信号処理装置および信号処理方法 Download PDFInfo
- Publication number
- JP2010158044A JP2010158044A JP2010030699A JP2010030699A JP2010158044A JP 2010158044 A JP2010158044 A JP 2010158044A JP 2010030699 A JP2010030699 A JP 2010030699A JP 2010030699 A JP2010030699 A JP 2010030699A JP 2010158044 A JP2010158044 A JP 2010158044A
- Authority
- JP
- Japan
- Prior art keywords
- encoding
- noise
- unit
- noise suppression
- suppression
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Landscapes
- Telephone Function (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
Abstract
【課題】 使用設定を変化させた場合でも、ノイズサプレッサが十分な機能を発揮し、高品質な音声を送受信することを可能とする。
【解決手段】 音声符号化器120は、互いに異なるアルゴリズムにより音声データを符号化する3つの回路として、A方式符号化部121、B方式符号化部122、C方式符号化部123を備える。ノイズサプレッサ110は、互いに異なるアルゴリズムにより背景雑音を抑圧する3つの回路として、X方式ノイズサプレス部111、Y方式ノイズサプレス部112、Z方式ノイズサプレス部113を備える。サプレス方式切換制御部114は、符号化方式切換制御部124からの情報に基づいて、音声符号化器120にて機能する符号化部(121,122,123のいずれか)に合わせて、最適なノイズサプレス部(111,112,113のいずれか)を機能させるようにしたものである。
【選択図】 図1
【解決手段】 音声符号化器120は、互いに異なるアルゴリズムにより音声データを符号化する3つの回路として、A方式符号化部121、B方式符号化部122、C方式符号化部123を備える。ノイズサプレッサ110は、互いに異なるアルゴリズムにより背景雑音を抑圧する3つの回路として、X方式ノイズサプレス部111、Y方式ノイズサプレス部112、Z方式ノイズサプレス部113を備える。サプレス方式切換制御部114は、符号化方式切換制御部124からの情報に基づいて、音声符号化器120にて機能する符号化部(121,122,123のいずれか)に合わせて、最適なノイズサプレス部(111,112,113のいずれか)を機能させるようにしたものである。
【選択図】 図1
Description
この発明は、ディジタル携帯電話システムなどをはじめ、種々のディジタル通信方式の無線通信機器に用いられ、送受話音声に重畳される雑音を軽減するノイズサプレッサ(ノイズキャンセラ)に関する。
移動通信の基本サービスとして、音声通信による電話サービスがある。携帯電話システムでは、当初アナログ方式で始まったが、現在では日本のPDC(Personal Digital Cellar)方式などディジタル方式が主流となってきている。
ディジタル方式では、アナログ音声信号をディジタル信号に変換するために、A/D変換器が必要となるが、ただ、A/D変換しただけでは100kbpsほどの符号化レートを必要とし、少ない電波資源を考えるとこれを1/10〜1/20に圧縮する必要がある。この要求に対し、一般には音声圧縮とよばれる音声の高能率符号化方式が用いられ、音声コーデックとして具現化されている。
現在、移動通信では、3.5kbps〜32kbps程度の符号化レートの音声コーデックが使われているが、低レートのコーデックは、音声信号の特徴を最大限に活用して符号化レートの削減をはかっているため、音声に関しては十分な音質が得られても、音声以外の「音」に関しては再現性、音質が悪くなる傾向がある。
屋外で使用されることが多い携帯電話は、低レートの音声コーデックがアプリケーションとして使われ、かつ、背景雑音が大きな環境下で使用されることも少なくない。
このように「音声」に的を絞った低レート音声コーデックに背景雑音を入力すると、音が変質してしまい、背景雑音環境での音声はその明瞭度や音質が劣化してしまう。
この対策として、マイクから取り込まれた背景雑音を抑圧し、音声のみを音声コーデックに入力する目的で、近年注目されているのが、ノイズサプレッサ(あるいは、ノイズキャンセラ)と呼ばれる技術である。
具体例としては、(社)電波波産業会(ARIB)の「ディジタル自動車電話システム標準規格RCR STD−27」の「ハーフレート音声コーデック」の章に、ノイズキャンセラについての記述がある。
ところで近時、技術革新により新たな音声コーデックが開発されており、システムに新たな音声コーデックを導入し、2モード切替(2つの音声コーデックを切り替えられる)、3モード切替(3つの音声コーデックを切り替えられる)というように、マルチモード化の流れがある。
また、その一方で、TIA IS−127の規格で知られるEVRC(Enhanced Variable Rate Codec)やAMR(Adaptive Multi Rate)のように、音声コーデックは1つであるが、複数の異なる符号化レートをサポートしているマルチレート化の方向や、さらには、ユーザの利便を考えて、端末を手に持たず通話できるハンズフリー機能の取り込みも行われてきている。
しかしながら、このようなマルチモード化、あるいはマルチレート化を行った従来の通信機器では、音声コーデックとノイズサプレッサの相性により、選択したモードあるいはレートによっては、ノイズサプレッサが十分な機能を果たさず、高品質な送話音声あるいは受話音声が得られないという問題があった。
また、ハンズフリー機能を備えた従来の通信機器では、ハンズフリー/非ハンズフリーにより、マイクロホンやアナログアンプといったノイズサプレスへの音声入力経路が変化したり、特性が可変されたり、あるいはエコー制御のためエコーキャンセラなど新たなデバイスを経由するなどの使用環境の変化により、ノイズサプレッサが十分な機能を果たさず、高品質な送話音声あるいは受話音声が得られないという問題があった。
マルチモード化、マルチレート化、あるいはハンズフリー機能の追加を行った従来の通信機器では、モードおよびレートの切り替え、あるいはハンズフリー/非ハンズフリーの切り替えなど、使用設定によってノイズサプレッサが十分な機能を果たさず、送話音声あるいは受話音声が劣化するという問題があった。
この発明は上記の問題を解決すべくなされたもので、モードおよびレートの切り替え、あるいはハンズフリー/非ハンズフリーの切り替えなど、使用設定を変化させた場合でも、ノイズサプレッサが十分な機能を発揮し、高品質な音声を送受信することが可能な信号処理装置、信号処理方法および記録媒体を提供することを目的とする。
上記の目的を達成するために、請求項1に係わる本発明は、音声信号に含まれる雑音成分を抑圧する雑音抑圧手段と、この雑音抑圧手段にて雑音成分が抑圧された音声信号に符号化処理を施して、圧縮された符号化音声データを生成する符号化手段とを備える信号処理装置であって、符号化手段は、複数の異なる符号化処理が可能であり、雑音抑圧手段は、符号化手段にて実施される符号化処理に応じた雑音抑圧特性を有することようにした。
上記構成の信号処理装置では、複数の異なる符号化処理を選択的に実施するにあたり、その前段で音声信号に含まれる雑音成分を抑圧する際に、後段で実施される符号化処理に応じた雑音成分の抑圧を行うようにしている。
したがって、上記構成の信号処理装置によれば、符号化処理に応じた雑音成分の抑圧が行われるので、符号化処理の内容を可変しても、十分な雑音成分の抑圧が行われ、高品質な音声を送信することができる。
また、上記の目的を達成するために、請求項8に係わる本発明は、圧縮された符号化音声データを音声信号に復号する復号手段と、この復号手段により復号された音声信号に含まれる雑音成分を抑圧する雑音抑圧手段とを備える信号処理装置であって、復号手段は、復号化音声データに応じて複数の異なる復号化処理が可能であり、雑音抑圧手段は、復号手段にて実施される復号処理に応じた雑音抑圧特性を有するようにした。
上記構成の信号処理装置では、複数の異なる復号処理を選択的に実施し、その後段で復号された音声信号に含まれる雑音成分を抑圧する際に、実施される復号処理に応じた雑音成分の抑圧を行うようにしている。
したがって、上記構成の信号処理装置によれば、復号処理に応じた雑音成分の抑圧が行われるので、復号処理の内容を可変しても、十分な雑音成分の抑圧が行われ、高品質な音声を受信することができる。
さらに、上記の目的を達成するために、請求項15に係わる本発明は、ハンズフリー機能を選択的に使用可能な機器に用いられる信号処理装置において、入力された音声信号に対して、ハンズフリー機能を使用した音声入力か否かに応じた雑音成分の抑圧を行う雑音抑圧手段を具備して構成するようにした。
上記構成の信号処理装置では、入力された音声信号に対して、ハンズフリー機能を使用した音声入力か否かに応じた雑音成分の抑圧を行うようにしている。
したがって、上記構成の信号処理装置によれば、ハンズフリー機能を使用した音声入力か否か音声の入力経路を可変しても、十分な雑音成分の抑圧が行われ、高品質な音声を入力することができる。
したがって、上記構成の信号処理装置によれば、ハンズフリー機能を使用した音声入力か否か音声の入力経路を可変しても、十分な雑音成分の抑圧が行われ、高品質な音声を入力することができる。
また、上記の目的を達成するために、請求項20に係わる本発明は、音声信号に含まれる雑音成分を抑圧する雑音抑圧工程と、この雑音抑圧工程にて雑音成分が抑圧された音声信号に符号化処理を施して、圧縮された符号化音声データを生成する符号化工程とを備える信号処理方法であって、符号化工程は、複数の異なる符号化処理を選択的に実施し、雑音抑圧工程は、音声信号に対して、符号化工程にて選択的に実施される符号化処理に応じた雑音成分の抑圧を行うようにした。
上記構成の信号処理方法では、複数の異なる符号化処理を選択的に実施するにあたり、その前段で音声信号に含まれる雑音成分を抑圧する際に、後段で実施される符号化処理に応じた雑音成分の抑圧を行うようにしている。
したがって、上記構成の信号処理方法によれば、符号化処理に応じた雑音成分の抑圧が行われるので、符号化処理の内容を可変しても、十分な雑音成分の抑圧が行われ、高品質な音声を送信することができる。
さらに、上記の目的を達成するために、請求項21に係わる本発明は、圧縮された符号化音声データを音声信号に復号する復号工程と、この復号工程により復号された音声信号に含まれる雑音成分を抑圧する雑音抑圧工程とを備える信号処理方法であって、復号工程は、符号化音声データに応じて、複数の異なる復号処理を選択的に符号化音声データに対して実施し、雑音抑圧工程は、音声信号に対して、復号工程にて選択的に実施される復号処理に応じた雑音成分の抑圧を行うようにした。
上記構成の信号処理方法では、複数の異なる復号処理を選択的に実施し、その後段で復号された音声信号に含まれる雑音成分を抑圧する際に、実施される復号処理に応じた雑音成分の抑圧を行うようにしている。
したがって、上記構成の信号処理方法によれば、復号処理に応じた雑音成分の抑圧が行われるので、復号処理の内容を可変しても、十分な雑音成分の抑圧が行われ、高品質な音声を受信することができる。
さらにまた、上記の目的を達成するために、請求項22に係わる本発明は、ハンズフリー機能を選択的に使用可能な機器に用いられる信号処理方法において、入力された音声信号に対して、ハンズフリー機能を使用した音声入力か否かに応じた雑音成分の抑圧を行う雑音抑圧工程を具備して構成するようにした。
上記構成の信号処理方法では、入力された音声信号に対して、ハンズフリー機能を使用した音声入力か否かに応じた雑音成分の抑圧を行うようにしている。
したがって、上記構成の信号処理方法によれば、ハンズフリー機能を使用した音声入力か否か音声の入力経路を可変しても、十分な雑音成分の抑圧が行われ、高品質な音声を入力することができる。
したがって、上記構成の信号処理方法によれば、ハンズフリー機能を使用した音声入力か否か音声の入力経路を可変しても、十分な雑音成分の抑圧が行われ、高品質な音声を入力することができる。
また、上記の目的を達成するために、請求項23に係わる本発明は、音声信号に含まれる雑音成分を抑圧する雑音抑圧手順と、この雑音抑圧手順にて雑音成分が抑圧された音声信号に符号化処理を施して圧縮された符号化音声データを生成する符号化手順をコンピュータに実行機能させるためのプログラムを記録したコンピュータ読み取り可能な記録媒体であって、符号化手順は、複数の異なる符号化処理を選択的に実施する手順であり、雑音抑圧手順は、音声信号に対して、符号化手順にて選択的に実施される符号化処理に応じた雑音成分の抑圧を行う手順とした。
上記構成の記録媒体によれば、コンピュータが、複数の異なる符号化処理を選択的に実施するにあたり、その前段で音声信号に含まれる雑音成分を抑圧する際に、後段で実施される符号化処理に応じた雑音成分の抑圧を行うようにしている。
したがって、上記構成の記録媒体によれば、コンピュータでは、符号化処理に応じた雑音成分の抑圧が行われるので、符号化処理の内容を可変しても、十分な雑音成分の抑圧が行われ、高品質な音声を送信することができる。
さらに、上記の目的を達成するために、請求項24に係わる本発明は、圧縮された符号化音声データを音声信号に復号する復号手順と、この復号手順により復号された音声信号に含まれる雑音成分を抑圧する雑音抑圧手段をコンピュータに実行させるためのプログラムを記録したコンピュータ読み取り可能な記録媒体であって、復号手順は、符号化音声データに応じて、複数の異なる復号処理を選択的に符号化音声データに対して実施する手順であり、雑音抑圧手順は、音声信号に対して、復号手順にて選択的に実施される復号処理に応じた雑音成分の抑圧を行う手順とした。
上記構成の記録媒体によれば、コンピュータが、複数の異なる復号処理を選択的に実施し、その後段で復号された音声信号に含まれる雑音成分を抑圧する際に、実施される復号処理に応じた雑音成分の抑圧を行うようにしている。
したがって、上記構成の記録媒体によれば、コンピュータでは、復号処理に応じた雑音成分の抑圧が行われるので、復号処理の内容を可変しても、十分な雑音成分の抑圧が行われ、高品質な音声を受信することができる。
さらにまた、上記の目的を達成するために、請求項25に係わる本発明は、ハンズフリー機能を選択的に使用可能とする手順と、入力された音声信号に対して、ハンズフリー機能を使用した音声入力か否かに応じた雑音成分の抑圧を行う雑音抑圧手順をコンピュータに実行させるためのプログラムを記録するようにした。
上記構成の記録媒体によれば、コンピュータが、入力された音声信号に対して、ハンズフリー機能を使用した音声入力か否かに応じた雑音成分の抑圧を行うようにしている。
したがって、上記構成の記録媒体によれば、コンピュータでは、ハンズフリー機能を使用した音声入力か否か音声の入力経路を可変しても、十分な雑音成分の抑圧が行われ、高品質な音声を入力することができる。
また、上記の目的を達成するために、請求項26に係わる本発明は、音声信号に含まれる雑音成分を抑圧する雑音抑圧手段と、この雑音抑圧手段にて雑音成分が抑圧された音声信号に符号化処理を施して、圧縮された符号化音声データを生成する符号化手段とを備える信号処理装置であって、符号化手段は、複数の異なる符号化方式による符号化処理を選択的に実施し、雑音抑圧手段は、互いに異なる雑音成分の抑圧特性を有する複数のノイズサプレス部を備え、音声信号に対して、符号化手段で選択的に実施される符号化処理に応じて、複数のノイズサプレス部の中から1つのノイズサプレス部を選択的に用いて雑音成分の抑圧を行うものであり、符号化手段における複数の異なる符号化方式の数をP、雑音抑圧手段のノイズサプレス部の数をQ(P,Qは共に正の整数)とした場合、PとQは、P≧Q>1の関係にあることを特徴とする。
上記構成の信号処理装置では、複数の異なる符号化方式による符号化処理を選択的に実施するにあたり、その前段で音声信号に含まれる雑音成分を抑圧する際に、後段で実施される符号化処理に応じた雑音成分の抑圧を行うノイズサプレス部を、複数のノイズサプレス部の中から選択的に用いるもので、上記複数の符号化方式の数Pと、上記複数のノイズサプレス部の数Qとの関係をP≧Q>1とするようにした。
したがって、上記構成の信号処理装置によれば、符号化方式の数Pとノイズサプレス部の数Qとの関係がP≧Q>1にある場合でも、符号化処理に応じた雑音成分の抑圧が行われるので、符号化処理の内容を可変しても、十分な雑音成分の抑圧が行われ、高品質な音声を送信することができる。
さらに、上記の目的を達成するために、請求項27に係わる本発明は、音声信号に含まれる雑音成分を抑圧する雑音抑圧手段と、この雑音抑圧手段にて雑音成分が抑圧された音声信号に符号化処理を施して、圧縮された符号化音声データを生成する符号化手段とを備える信号処理装置であって、符号化手段は、複数の異なる符号化レートによる符号化処理を選択的に実施し、雑音抑圧手段は、互いに異なる雑音成分の抑圧特性を有する複数のノイズサプレス部を備え、音声信号に対して、符号化手段で選択的に実施される符号化処理に応じて、複数のノイズサプレス部の中から1つのノイズサプレス部を選択的に用いて雑音成分の抑圧を行うものであり、符号化手段における複数の異なる符号化レートの数をR、雑音抑圧手段のノイズサプレス部の数をQ(R,Qは共に正の整数)とした場合、RとQは、R≧Q>1の関係にあることを特徴とする。
上記構成の信号処理装置では、複数の異なる符号化レートによる符号化処理を選択的に実施するにあたり、その前段で音声信号に含まれる雑音成分を抑圧する際に、後段で実施される符号化処理に応じた雑音成分の抑圧を行うノイズサプレス部を、複数のノイズサプレス部の中から選択的に用いるもので、上記複数の異なる符号化レートの数Rと、上記複数のノイズサプレス部の数Qとの関係をR≧Q>1とするようにした。
したがって、上記構成の信号処理装置によれば、符号化レートの数Rとノイズサプレス部の数Qとの関係がR≧Q>1にある場合でも、符号化処理に応じた雑音成分の抑圧が行われるので、符号化処理の内容を可変しても、十分な雑音成分の抑圧が行われ、高品質な音声を送信することができる。
さらにまた、上記の目的を達成するために、請求項28に係わる本発明は、音声信号に含まれる雑音成分を抑圧する雑音抑圧手段と、この雑音抑圧手段にて雑音成分が抑圧された音声信号に符号化処理を施して、圧縮された符号化音声データを生成する符号化手段とを備える信号処理装置であって、符号化手段は、複数の異なる符号化方式による符号化処理を選択的に実施し、雑音抑圧手段は、音声信号に対して雑音成分の抑圧を行うもので、パラメータの設定に応じて雑音成分の抑圧特性を可変可能なノイズサプレス部と、符号化手段で選択的に実施される符号化処理に応じたパラメータを、ノイズサプレス部に設定するパラメータ設定手段とを備え、符号化手段における複数の異なる符号化方式の数をP、雑音抑圧手段のノイズサプレス部に設定するパラメータの数をS(P,Sは共に正の整数)とした場合、PとSは、P≧S>1の関係にあることを特徴とする。
上記構成の信号処理装置では、複数の異なる符号化方式による符号化処理を選択的に実施するにあたり、その前段で音声信号に含まれる雑音成分を抑圧する際に、後段で実施される符号化処理に応じた特性でノイズサプレス部が雑音成分を抑圧するように、ノイズサプレス部に対して複数のパラメータの中から選択的にパラメータを用いるもので、上記複数の符号化方式の数Pと、上記複数のパラメータセットの数Sとの関係をP≧S>1とするようにした。
したがって、上記構成の信号処理装置によれば、符号化方式の数Pとパラメータセットの数Sとの関係がP≧S>1にある場合でも、符号化処理に応じた雑音成分の抑圧が行われるので、符号化処理の内容を可変しても、十分な雑音成分の抑圧が行われ、高品質な音声を送信することができる。
さらにまた、上記の目的を達成するために、請求項29に係わる本発明は、音声信号に含まれる雑音成分を抑圧する雑音抑圧手段と、この雑音抑圧手段にて雑音成分が抑圧された音声信号に符号化処理を施して、圧縮された符号化音声データを生成する符号化手段とを備える信号処理装置であって、符号化手段は複数の異なる符号化レートによる符号化処理を選択的に実施し、雑音抑圧手段は、音声信号に対して雑音成分の抑圧を行うもので、パラメータの設定に応じて雑音成分の抑圧特性を可変可能なノイズサプレス部と、符号化手段で選択的に実施される符号化処理に応じたパラメータを、ノイズサプレス部に設定するパラメータ設定手段とを備え、符号化手段における複数の異なる符号化レートの数をR、雑音抑圧手段のノイズサプレス部に設定するパラメータセットの数をS(R,Sは共に正の整数)とした場合、RとSは、R≧S>1の関係にあることを特徴とする。
上記構成の信号処理装置では、複数の異なる符号化レートによる符号化処理を選択的に実施するにあたり、その前段で音声信号に含まれる雑音成分を抑圧する際に、後段で実施される符号化処理に応じた特性でノイズサプレス部が雑音成分を抑圧するように、ノイズサプレス部に対して複数のパラメータの中から選択的にパラメータを用いるもので、上記複数の符号化レートの数Rと、上記複数のパラメータセットの数Sとの関係をR≧S>1とするようにした。
したがって、上記構成の信号処理装置によれば、符号化レート式の数Rとパラメータセットの数Sとの関係がR≧S>1にある場合でも、符号化処理に応じた雑音成分の抑圧が行われるので、符号化処理の内容を可変しても、十分な雑音成分の抑圧が行われ、高品質な音声を送信することができる。
以上述べたように、この発明では、複数の異なる符号化処理を選択的に実施するにあたり、その前段で音声信号に含まれる雑音成分を抑圧する際に、後段で実施される符号化処理に応じた雑音成分の抑圧を行うようにしている。
したがって、この発明によれば、符号化処理に応じた雑音成分の抑圧が行われるので、符号化処理の内容を可変しても、十分な雑音成分の抑圧が行われ、高品質な音声を送信することが可能な信号処理装置、信号処理方法および記録媒体を提供できる。
また、この発明では、複数の異なる復号処理を選択的に実施し、その後段で復号された音声信号に含まれる雑音成分を抑圧する際に、実施される復号処理に応じた雑音成分の抑圧を行うようにしている。
したがって、この発明によれば、復号処理に応じた雑音成分の抑圧が行われるので、復号処理の内容を可変しても、十分な雑音成分の抑圧が行われ、高品質な音声を受信することが可能な信号処理装置、信号処理方法および記録媒体を提供できる。
さらに、この発明では、入力された音声信号に対して、ハンズフリー機能を使用した音声入力か否かに応じた雑音成分の抑圧を行うようにしている。
ハンズフリー機能を使用した音声入力か否か音声の入力経路を可変しても、十分な雑音成分の抑圧が行われ、高品質な音声を入力することが可能な信号処理装置、信号処理方法および記録媒体を提供できる。
ハンズフリー機能を使用した音声入力か否か音声の入力経路を可変しても、十分な雑音成分の抑圧が行われ、高品質な音声を入力することが可能な信号処理装置、信号処理方法および記録媒体を提供できる。
以下、図面を参照して、この発明の実施の形態について説明する。
図1は、この発明の第1の実施形態に係わる信号処理装置の構成を示すものである。
図1は、この発明の第1の実施形態に係わる信号処理装置の構成を示すものである。
101は、ユーザの送話音声を電気信号に変換して取り込むマイクロフォン、102は、上記マイクロフォン101にて得たアナログ音声信号をディジタル信号の音声データに変換するA/D変換器、110は、ディジタル信号処理により、上記音声データに含まれる背景雑音を抑圧するノイズサプレッサ、103は、ノイズサプレッサ110により背景雑音が抑圧された音声データ、120は、103のディジタルデータを圧縮符号化する音声符号化器、104は、音声符号化器120によってデータ圧縮された符号化データである。
音声符号化器120は、互いに異なるアルゴリズムにより音声データを符号化する3つの回路として、A方式符号化部121、B方式符号化部122、C方式符号化部123を備えるほかに、符号化方式切換制御部124を備える。
ここで例えば、A方式符号化部121は、符号化レートは低いが背景雑音に対するの符号化音質があまりよくない方式であり、C方式符号化部123は符号化レートが高く背景雑音に対しても比較的音質がよい符号化方式であり、またB方式符号化部122は、A方式符号化部121とC方式符号化部123の中間の音質とする。
符号化方式切換制御部124は、外部からの符号化方式選択コマンド105に応じて、A方式符号化部121、B方式符号化部122、C方式符号化部123のうち、いずれか1つが機能するように切換制御するとともに、この切換制御により機能する方式を示す情報を、符号化方式選択情報106として、ノイズサプレッサ110に出力する。
ノイズサプレッサ110は、互いに異なるアルゴリズムにより背景雑音を抑圧する3つの回路として、X方式ノイズサプレス部111、Y方式ノイズサプレス部112、Z方式ノイズサプレス部113を備えるほかに、サプレス方式切換制御部114を備える。
サプレス方式切換制御部114は、符号化方式選択情報106に応じて、X方式ノイズサプレス部111、Y方式ノイズサプレス部112、Z方式ノイズサプレス部113のうち、最適ないずれか1つが機能するように切換制御するものである。
すなわち、サプレス方式切換制御部114による切換制御では、音声符号化器120にて機能する符号化部(121,122,123のいずれか)に合わせて、最適なノイズサプレス部(111,112,113のいずれか)を機能させるために、符号化方式選択情報106に基づいて、A方式符号化部121が機能する場合には、X方式ノイズサプレス部111を選択し、B方式符号化部122が機能する場合には、Y方式ノイズサプレス部112を選択し、C方式符号化部123が機能する場合には、Z方式ノイズサプレス部113を選択する。
このような符号化部とノイズサプレス部との対応を最適なものにするために、例えば、X方式ノイズサプレス部111には、少し複雑な処理になるがノイズサプレス性能が高い周波数領域でのスペクトラル・サブトラクション法(SS法)を用いたものを、Y方式ノイズサプレス部112には、同様にSS法であるが、X方式ノイズサプレス部111より処理を簡略化したものを、Z方式ノイズサプレス部113には、比較的簡単な構成の時間領域での適応フィルタリングによるものを用いる。
次に、上記第1の実施形態の信号処理装置の動作について説明する。図2は、この動作を説明するためのフローチャートである。
今、ステップ2aにてコマンド入力の待機状態から、「符号化方式としてA方式を使用せよ」の旨を示す符号化方式選択コマンド105が符号化方式切換制御部124に入力されると、ステップ2bに移行して、指定される方式を判定し、A方式であることより、ステップ2cに移行する。
今、ステップ2aにてコマンド入力の待機状態から、「符号化方式としてA方式を使用せよ」の旨を示す符号化方式選択コマンド105が符号化方式切換制御部124に入力されると、ステップ2bに移行して、指定される方式を判定し、A方式であることより、ステップ2cに移行する。
ステップ2cでは、符号化方式切換制御部124が、ディジタルデータ103がA方式符号化部121に入力されるように切換制御し、これに応動してA方式符号化部121は入力されるディジタルデータ103の符号化を開始する。
また、ステップ2cでは、この切換制御に並行して、符号化方式切換制御部124が、ディジタルデータ103の符号化にA方式符号化部121を使用する旨の情報を、符号化方式選択情報106として、サプレス方式切換制御部114に出力し、ステップ2dに移行する。
ステップ2dでは、サプレス方式切換制御部114が、A方式符号化部121による符号化に最適化されたX方式ノイズサプレス部111による雑音抑圧を実施するために、A/D変換器102の出力がX方式ノイズサプレス部111に入力されるように切換制御し、ステップ2iに移行する。
このような切換制御動作により、A/D変換器102の出力は、X方式ノイズサプレス部111にて雑音抑圧され、ディジタルデータ103としてA方式符号化部121に入力され、ここで符号化され、データ圧縮された符号化データ104として出力される。
ステップ2iにおいて、「符号化方式としてB方式を使用せよ」の旨を示す符号化方式選択コマンド105が符号化方式切換制御部124に入力されると、ステップ2bに移行して、指定される方式を判定し、B方式であることより、ステップ2eに移行する。
ステップ2eでは、符号化方式切換制御部124が、タイミングをはかって、ディジタルデータ103がB方式符号化部122に入力されるように切換制御し、これに応動してA方式符号化部121は動作停止し、代わってB方式符号化部122が入力されるディジタルデータ103の符号化を開始する。
また、ステップ2eでは、この切換制御に並行して、符号化方式切換制御部124が、ディジタルデータ103の符号化にB方式符号化部122を使用する旨の情報を、符号化方式選択情報106として、サプレス方式切換制御部114に出力し、ステップ2fに移行する。
ステップ2fでは、サプレス方式切換制御部114が、B方式符号化部122による符号化に最適化されたY方式ノイズサプレス部112による雑音抑圧を実施するために、A/D変換器102の出力がY方式ノイズサプレス部112に入力されるように切換制御し、ステップ2iに移行する。
このような切換制御動作により、A/D変換器102の出力は、Y方式ノイズサプレス部112にて雑音抑圧され、ディジタルデータ103としてB方式符号化部122に入力され、ここで符号化され、データ圧縮された符号化データ104として出力される。
また、ステップ2iにおいて、上述のようにA方式符号化部121あるいはB方式符号化部122にて、ディジタルデータ103を符号化している際に、「符号化方式としてC方式を使用せよ」の旨を示す符号化方式選択コマンド105が符号化方式切換制御部124に入力されると、ステップ2bに移行して、指定される方式を判定し、C方式であることより、ステップ2gに移行する。
ステップ2gでは、符号化方式切換制御部124が、タイミングをはかって、ディジタルデータ103がC方式符号化部123に入力されるように切換制御し、これに応動して使用中のA方式符号化部121あるいはB方式符号化部122の動作を停止し、代わってC方式符号化部123が入力されるディジタルデータ103の符号化を開始する。
また、ステップ2gでは、この切換制御に並行して、符号化方式切換制御部124が、ディジタルデータ103の符号化にC方式符号化部123を使用する旨の情報を、符号化方式選択情報106として、サプレス方式切換制御部114に出力し、ステップ2hに移行する。
ステップ2hでは、サプレス方式切換制御部114が、C方式符号化部123による符号化に最適化されたZ方式ノイズサプレス部113による雑音抑圧を実施するために、A/D変換器102の出力がZ方式ノイズサプレス部113に入力されるように切換制御し、ステップ2iに移行する。
このような切換制御動作により、A/D変換器102の出力は、Z方式ノイズサプレス部113にて雑音抑圧され、ディジタルデータ103としてC方式符号化部122に入力され、ここで符号化され、データ圧縮された符号化データ104として出力される。
なお、ステップ2iにて、コマンド入力がない場合には、ステップ2jに移行する。ステップ2jでは、通信の終了要求がなされたか否かを判定し、終了要求があった場合には、当該処理を終了し、一方、終了要求がない場合には、再びステップ2iにてコマンド入力を監視する。
以上のように、上記構成の信号処理装置では、データ圧縮された符号化データ104を得るにあたり、音声符号化器120にて機能する符号化部(121,122,123のいずれか)に合わせて、最適なノイズサプレス部(111,112,113のいずれか)を機能させるようにしている。
したがって、上記構成の信号処理装置によれば、音声符号化器120の符号化に最適なノイズサプレス部による雑音抑圧が行われるので、ノイズサプレス部が十分な機能を発揮し、高品質な音声を送信することができる。
尚、この発明は上記実施の形態に限定されるものではない。例えば、上記第1の実施形態では、サプレス方式切換制御部114は、符号化方式切換制御部124からの符号化方式選択情報106に基づいて、音声符号化器120にて機能する符号化部に合わせ、最適なノイズサプレス部を機能させるようにした。
これに代わって例えば、サプレス方式切換制御部114は、符号化方式選択コマンド105に基づいて、音声符号化器120にて機能する符号化部に合わせ、最適なノイズサプレス部を機能させるようにしても同様の効果を発揮することができる。
なお、この場合、サプレス方式切換制御部114は、音声符号化器120における符号化部の切換タイミングを考慮したタイミングで、最適なノイズサプレス部を機能させるように切換制御を行う。
次に、この発明の第2の実施形態に係わる信号処理装置について説明する。図3は、その構成を示すものである。
201は、ユーザの送話音声を電気信号に変換して取り込むマイクロフォン、202は、上記マイクロフォン201にて得たアナログ音声信号をディジタル信号の音声データに変換するA/D変換器、210は、ディジタル信号処理により、上記音声データに含まれる背景雑音を抑圧するノイズサプレッサ、203は、ノイズサプレッサ210により背景雑音が抑圧された音声データ、220は、203のディジタルデータを圧縮符号化する音声符号化器、204は、音声符号化器220によってデータ圧縮された符号化データである。
201は、ユーザの送話音声を電気信号に変換して取り込むマイクロフォン、202は、上記マイクロフォン201にて得たアナログ音声信号をディジタル信号の音声データに変換するA/D変換器、210は、ディジタル信号処理により、上記音声データに含まれる背景雑音を抑圧するノイズサプレッサ、203は、ノイズサプレッサ210により背景雑音が抑圧された音声データ、220は、203のディジタルデータを圧縮符号化する音声符号化器、204は、音声符号化器220によってデータ圧縮された符号化データである。
音声符号化器220は、互いに異なるアルゴリズムにより音声データを符号化する3つの回路として、A方式符号化部221、B方式符号化部222、C方式符号化部223を備えるほかに、符号化方式切換制御部224を備える。
ここで例えば、A方式符号化部221は、符号化レートは低いが背景雑音に対するの符号化音質があまりよくない方式であり、C方式符号化部223は符号化レートが高く背景雑音に対しても比較的音質がよい符号化方式であり、またB方式符号化部222は、A方式符号化部221とC方式符号化部223の中間の音質とする。
符号化方式切換制御部224は、外部からの符号化方式選択コマンド205に応じて、A方式符号化部221、B方式符号化部222、C方式符号化部223のうち、いずれか1つが機能するように切換制御するとともに、この切換制御により機能する方式を示す情報を、符号化方式選択情報206として、ノイズサプレッサ210に出力する。
ノイズサプレッサ210は、ノイズサプレス部215と、パラメータテーブル216と、パラメータ切換制御部217とを備える。
ノイズサプレス部215は、A/D変換器202が出力する音声データに含まれる背景雑音を抑圧するもので、その抑圧特性は、パラメータテーブル216より入力されるパラメータによって制御される。
ノイズサプレス部215は、A/D変換器202が出力する音声データに含まれる背景雑音を抑圧するもので、その抑圧特性は、パラメータテーブル216より入力されるパラメータによって制御される。
パラメータテーブル216は、ノイズサプレス部215にて行われる背景雑音の抑圧処理の特性を設定するパラメータを記憶するテーブルで、A方式符号化部221、B方式符号化部222、C方式符号化部223の各符号化方式にそれぞれ最適な抑圧特性となるような3つのパラメータセットを記憶し、パラメータ切換制御部217の制御によりパラメータセットをノイズサプレス部215に入力する。
本実施形態では、5つのパラメータを要素とするパラメータセットを想定しており、各符号化方式毎にパラメータセット(本実施形態では3つ)を用意している。
パラメータ切換制御部217は、パラメータテーブル216を制御して、符号化方式選択情報206に基づき、音声符号化器220にて機能する符号化部(221,222,223のいずれか)に最適なパラメータセットを選択的にノイズサプレス部215に設定するものである。
このような符号化部とノイズサプレス部のパラメータ設定(抑圧特性設定)との対応を最適なものにするために、例えば、A方式符号化部221に対応するパラメータセットとしては、ノイズ抑圧量を強めに設定し、若干音声部分に歪みが生じても、極力ノイズを抑えるような特性が得られるパラメータセットととし、またC方式符号化部223に対応するパラメータセットとしては、ノイズ抑圧量は軽めに設定し、自然に聞こえる程度のノイズは透過させるような特性が得られるパラメータセットとする。
また、B方式符号化部222に対応するパラメータセットとしては、A方式符号化部221用の特性とC方式符号化部223用の特性の中間の特性が得られるパラメータセットとする。
次に、上記第2の実施形態の信号処理装置の動作について説明する。図4は、この動作を説明するためのフローチャートである。
今、ステップ4aにてコマンド入力の待機状態から、「符号化方式としてA方式を使用せよ」の旨を示す符号化方式選択コマンド205が符号化方式切換制御部224に入力されると、ステップ4bに移行して、指定される方式を判定し、A方式であることより、ステップ4cに移行する。
今、ステップ4aにてコマンド入力の待機状態から、「符号化方式としてA方式を使用せよ」の旨を示す符号化方式選択コマンド205が符号化方式切換制御部224に入力されると、ステップ4bに移行して、指定される方式を判定し、A方式であることより、ステップ4cに移行する。
ステップ4cでは、符号化方式切換制御部224が、ディジタルデータ203がA方式符号化部221に入力されるように切換制御し、これに応動してA方式符号化部221は入力されるディジタルデータ203の符号化を開始する。
また、ステップ4cでは、この切換制御に並行して、符号化方式切換制御部224が、ディジタルデータ203の符号化にA方式符号化部221を使用する旨の情報を、符号化方式選択情報206として、パラメータ切換制御部217に出力し、ステップ4dに移行する。
ステップ4dでは、パラメータ切換制御部217が、ノイズサプレス部215の雑音抑圧特性が、A方式符号化部221による符号化に最適な特性となるように、A方式符号化部221に対応するパラメータセットを、パラメータテーブル216よりノイズサプレス部215に入力させ、ステップ4iに移行する。
このようなパラメータ設定(抑圧特性設定)の制御動作により、A/D変換器202の出力は、A方式符号化部221による符号化に適した抑圧特性で雑音が抑圧され、ディジタルデータ203としてA方式符号化部221に入力され、ここで符号化され、データ圧縮された符号化データ204として出力される。
ステップ4iにおいて、「符号化方式としてB方式を使用せよ」の旨を示す符号化方式選択コマンド205が符号化方式切換制御部224に入力されると、ステップ4bに移行して、指定される方式を判定し、B方式であることより、ステップ4eに移行する。
ステップ4eでは、符号化方式切換制御部224が、タイミングをはかって、ディジタルデータ203がB方式符号化部222に入力されるように切換制御し、これに応動してA方式符号化部221は動作停止し、代わってB方式符号化部222が入力されるディジタルデータ203の符号化を開始する。
また、ステップ4eでは、この切換制御に並行して、符号化方式切換制御部224が、ディジタルデータ203の符号化にB方式符号化部222を使用する旨の情報を、符号化方式選択情報206として、パラメータ切換制御部217に出力し、ステップ4fに移行する。
ステップ4fでは、パラメータ切換制御部217が、ノイズサプレス部215の雑音抑圧特性が、B方式符号化部222による符号化に最適な特性となるように、B方式符号化部222に対応するパラメータセットを、パラメータテーブル216よりノイズサプレス部215に入力させ、ステップ4iに移行する。
このようなパラメータ設定(抑圧特性設定)の制御動作により、A/D変換器202の出力は、B方式符号化部222による符号化に適した抑圧特性で雑音が抑圧され、ディジタルデータ203としてB方式符号化部222に入力され、ここで符号化され、データ圧縮された符号化データ204として出力される。
また、ステップ4iにおいて、上述のようにA方式符号化部221あるいはB方式符号化部222にて、ディジタルデータ203を符号化している際に、「符号化方式としてC方式を使用せよ」の旨を示す符号化方式選択コマンド205が符号化方式切換制御部224に入力されると、ステップ4bに移行して、指定される方式を判定し、C方式であることより、ステップ4gに移行する。
ステップ4gでは、符号化方式切換制御部224が、タイミングをはかって、ディジタルデータ203がC方式符号化部223に入力されるように切換制御し、これに応動して使用中のA方式符号化部221あるいはB方式符号化部222の動作を停止し、代わってC方式符号化部223が入力されるディジタルデータ203の符号化を開始する。
また、ステップ4gでは、この切換制御に並行して、符号化方式切換制御部224が、ディジタルデータ203の符号化にC方式符号化部223を使用する旨の情報を、符号化方式選択情報206として、パラメータ切換制御部217に出力し、ステップ4hに移行する。
ステップ4hでは、パラメータ切換制御部217が、ノイズサプレス部215の雑音抑圧特性が、C方式符号化部223による符号化に最適な特性となるように、C方式符号化部223に対応するパラメータセットを、パラメータテーブル216よりノイズサプレス部215に入力させ、ステップ4iに移行する。
このようなパラメータ設定(抑圧特性設定)の制御動作により、A/D変換器202の出力は、C方式符号化部223による符号化に適した抑圧特性で雑音が抑圧され、ディジタルデータ203としてC方式符号化部223に入力され、ここで符号化され、データ圧縮された符号化データ204として出力される。
なお、ステップ4iにて、コマンド入力がない場合には、ステップ4jに移行する。ステップ4jでは、通信の終了要求がなされたか否かを判定し、終了要求があった場合には、当該処理を終了し、一方、終了要求がない場合には、再びステップ4iにてコマンド入力を監視する。
以上のように、上記構成の信号処理装置では、データ圧縮された符号化データ204を得るにあたり、音声符号化器220にて機能する符号化部(221,222,223のいずれか)に合わせて、ノイズサプレス部215のパラメータを可変して、ノイズサプレス部215の雑音抑圧特性を符号化処理に最適な特性に設定するようにしている。
したがって、上記構成の信号処理装置によれば、音声符号化器220の符号化に合わせて、最適な雑音抑圧が行われるので、ノイズサプレス部が十分な機能を発揮し、高品質な音声を送信することができる。
尚、この発明は上記実施の形態に限定されるものではない。例えば、上記第2の実施形態では、パラメータ切換制御部217は、符号化方式切換制御部224からの符号化方式選択情報206に基づいて、音声符号化器220にて機能する符号化部に合わせ、ノイズサプレス部215の雑音抑圧特性を最適な特性に可変するようにした。
これに代わって例えば、パラメータ切換制御部217は、符号化方式選択コマンド205に基づいて、音声符号化器220にて機能する符号化部に合わせ、ノイズサプレス部215の雑音抑圧特性を最適な特性に可変するようにしても同様の効果を発揮することができる。
なお、この場合、パラメータ切換制御部217は、音声符号化器220における符号化部の切換タイミングを考慮したタイミングで、最適な雑音抑圧特性が得られるパラメータセットを設定する制御を行う。
次に、この発明の第3の実施形態に係わる信号処理装置について説明する。図5は、その構成を示すものである。
301は、ユーザの送話音声を電気信号に変換して取り込むマイクロフォン、302は、上記マイクロフォン301にて得たアナログ音声信号をディジタル信号の音声データに変換するA/D変換器、310は、ディジタル信号処理により、上記音声データに含まれる背景雑音を抑圧するノイズサプレッサ、303は、ノイズサプレッサ310により背景雑音が抑圧された音声データ、320は、303のディジタルデータを圧縮符号化する音声符号化器、304は、音声符号化器320によってデータ圧縮された符号化データである。
301は、ユーザの送話音声を電気信号に変換して取り込むマイクロフォン、302は、上記マイクロフォン301にて得たアナログ音声信号をディジタル信号の音声データに変換するA/D変換器、310は、ディジタル信号処理により、上記音声データに含まれる背景雑音を抑圧するノイズサプレッサ、303は、ノイズサプレッサ310により背景雑音が抑圧された音声データ、320は、303のディジタルデータを圧縮符号化する音声符号化器、304は、音声符号化器320によってデータ圧縮された符号化データである。
音声符号化器320は、互いに異なる符号化レートで音声データを符号化する3つの回路として、Aレート符号化部321、Bレート符号化部322、Cレート符号化部323を備えるほかに、符号化レート切換制御部324を備える。
ここで例えば、Aレート符号化部321は、符号化を行う上記3つの回路のうち、最も符号化レートは低いものであり、Cレート符号化部323は、符号化を行う上記3つの回路のうち、最も符号化レートが高いものであり、またBレート符号化部322は、Aレート符号化部321とCレート符号化部323の中間の符号化レートとする。
符号化レート切換制御部324は、外部からの符号化レート選択コマンド305に応じて、Aレート符号化部321、Bレート符号化部322、Cレート符号化部323のうち、いずれか1つが機能するように切換制御するとともに、この切換制御により機能するレートを示す情報を、符号化レート選択情報306として、ノイズサプレッサ310に出力する。
ノイズサプレッサ310は、互いに異なるアルゴリズムにより背景雑音を抑圧する3つの回路として、X方式ノイズサプレス部311、Y方式ノイズサプレス部312、Z方式ノイズサプレス部313を備えるほかに、サプレス方式切換制御部314を備える。
サプレス方式切換制御部314は、符号化レート選択情報306に応じて、X方式ノイズサプレス部311、Y方式ノイズサプレス部312、Z方式ノイズサプレス部313のうち、最適ないずれか1つが機能するように切換制御するものである。
すなわち、サプレス方式切換制御部314による切換制御では、音声符号化器320にて機能する符号化部(321,322,323のいずれか)に合わせて、最適なノイズサプレス部(311,312,313のいずれか)を機能させるために、符号化レート選択情報306に基づいて、Aレート符号化部321が機能する場合には、X方式ノイズサプレス部311を選択し、Bレート符号化部322が機能する場合には、Y方式ノイズサプレス部312を選択し、Cレート符号化部323が機能する場合には、Z方式ノイズサプレス部313を選択する。
このような符号化部とノイズサプレス部との対応を最適なものにするために、例えば、X方式ノイズサプレス部311には、少し複雑な処理になるがノイズサプレス性能が高い周波数領域でのスペクトラル・サブトラクション法(SS法)を用いたものを、Y方式ノイズサプレス部312には、同様にSS法であるが、X方式ノイズサプレス部311より処理を簡略化したものを、Z方式ノイズサプレス部313には、比較的簡単な構成の時間領域での適応フィルタリングによるものを用いる。
次に、上記第3の実施形態の信号処理装置の動作について説明する。図6は、この動作を説明するためのフローチャートである。
今、ステップ6aにてコマンド入力の待機状態から、「符号化レートとしてAレートを使用せよ」の旨を示す符号化レート選択コマンド305が符号化レート切換制御部324に入力されると、ステップ6bに移行して、指定されるレートを判定し、Aレートであることより、ステップ6cに移行する。
今、ステップ6aにてコマンド入力の待機状態から、「符号化レートとしてAレートを使用せよ」の旨を示す符号化レート選択コマンド305が符号化レート切換制御部324に入力されると、ステップ6bに移行して、指定されるレートを判定し、Aレートであることより、ステップ6cに移行する。
ステップ6cでは、符号化レート切換制御部324が、ディジタルデータ303がAレート符号化部321に入力されるように切換制御し、これに応動してAレート符号化部321は入力されるディジタルデータ303の符号化を開始する。
また、ステップ6cでは、この切換制御に並行して、符号化レート切換制御部324が、ディジタルデータ303の符号化にAレート符号化部321を使用する旨の情報を、符号化レート選択情報306として、サプレス方式切換制御部314に出力し、ステップ6dに移行する。
ステップ6dでは、サプレス方式切換制御部314が、Aレート符号化部321による符号化に最適化されたX方式ノイズサプレス部311による雑音抑圧を実施するために、A/D変換器302の出力がX方式ノイズサプレス部311に入力されるように切換制御し、ステップ6iに移行する。
このような切換制御動作により、A/D変換器302の出力は、X方式ノイズサプレス部311にて雑音抑圧され、ディジタルデータ303としてAレート符号化部321に入力され、ここで符号化され、データ圧縮された符号化データ304として出力される。
ステップ6iにおいて、「符号化レートとしてBレートを使用せよ」の旨を示す符号化レート選択コマンド305が符号化レート切換制御部324に入力されると、ステップ6bに移行して、指定されるレートを判定し、Bレートであることより、ステップ6eに移行する。
ステップ6eでは、符号化レート切換制御部324が、タイミングをはかって、ディジタルデータ303がBレート符号化部322に入力されるように切換制御し、これに応動してAレート符号化部321は動作停止し、代わってBレート符号化部322が入力されるディジタルデータ303の符号化を開始する。
また、ステップ6eでは、この切換制御に並行して、符号化レート切換制御部324が、ディジタルデータ303の符号化にBレート符号化部322を使用する旨の情報を、符号化レート選択情報306として、サプレス方式切換制御部314に出力し、ステップ6fに移行する。
ステップ6fでは、サプレス方式切換制御部314が、Bレート符号化部322による符号化に最適化されたY方式ノイズサプレス部312による雑音抑圧を実施するために、A/D変換器302の出力がY方式ノイズサプレス部312に入力されるように切換制御し、ステップ6iに移行する。
このような切換制御動作により、A/D変換器302の出力は、Y方式ノイズサプレス部312にて雑音抑圧され、ディジタルデータ303としてBレート符号化部322に入力され、ここで符号化され、データ圧縮された符号化データ304として出力される。
また、ステップ6iにおいて、上述のようにAレート符号化部321あるいはBレート符号化部322にて、ディジタルデータ303を符号化している際に、「符号化レートとしてCレートを使用せよ」の旨を示す符号化レート選択コマンド305が符号化レート切換制御部324に入力されると、ステップ6bに移行して、指定される方式を判定し、C方式であることより、ステップ6gに移行する。
ステップ6gでは、符号化レート切換制御部324が、タイミングをはかって、ディジタルデータ303がCレート符号化部323に入力されるように切換制御し、これに応動して使用中のAレート符号化部321あるいはBレート符号化部322の動作を停止し、代わってCレート符号化部323が入力されるディジタルデータ303の符号化を開始する。
また、ステップ6gでは、この切換制御に並行して、符号化レート切換制御部324が、ディジタルデータ303の符号化にCレート符号化部323を使用する旨の情報を、符号化レート選択情報306として、サプレス方式切換制御部314に出力し、ステップ6hに移行する。
ステップ6hでは、サプレス方式切換制御部314が、Cレート符号化部323による符号化に最適化されたZ方式ノイズサプレス部313による雑音抑圧を実施するために、A/D変換器302の出力がZ方式ノイズサプレス部313に入力されるように切換制御し、ステップ6iに移行する。
このような切換制御動作により、A/D変換器302の出力は、Z方式ノイズサプレス部313にて雑音抑圧され、ディジタルデータ303としてCレート符号化部322に入力され、ここで符号化され、データ圧縮された符号化データ304として出力される。
なお、ステップ6iにて、コマンド入力がない場合には、ステップ6jに移行する。ステップ6jでは、通信の終了要求がなされたか否かを判定し、終了要求があった場合には、当該処理を終了し、一方、終了要求がない場合には、再びステップ6iにてコマンド入力を監視する。
以上のように、上記構成の信号処理装置では、データ圧縮された符号化データ304を得るにあたり、音声符号化器320にて機能する符号化部(321,322,323のいずれか)に合わせて、最適なノイズサプレス部(311,312,313のいずれか)を機能させるようにしている。
したがって、上記構成の信号処理装置によれば、音声符号化器320の符号化に最適なノイズサプレス部による雑音抑圧が行われるので、ノイズサプレス部が十分な機能を発揮し、高品質な音声を送信することができる。
尚、この発明は上記実施の形態に限定されるものではない。例えば、上記第3の実施形態では、サプレス方式切換制御部314は、符号化レート切換制御部324からの符号化レート選択情報306に基づいて、音声符号化器320にて機能する符号化部に合わせ、最適なノイズサプレス部を機能させるようにした。
これに代わって例えば、サプレス方式切換制御部314は、符号化レート選択コマンド305に基づいて、音声符号化器320にて機能する符号化部に合わせ、最適なノイズサプレス部を機能させるようにしても同様の効果を発揮することができる。
なお、この場合、サプレス方式切換制御部314は、音声符号化器320における符号化部の切換タイミングを考慮したタイミングで、最適なノイズサプレス部を機能させるように切換制御を行う。
次に、この発明の第4の実施形態に係わる信号処理装置について説明する。図7は、その構成を示すものである。
401は、ユーザの送話音声を電気信号に変換して取り込むマイクロフォン、402は、上記マイクロフォン401にて得たアナログ音声信号をディジタル信号の音声データに変換するA/D変換器、410は、ディジタル信号処理により、上記音声データに含まれる背景雑音を抑圧するノイズサプレッサ、403は、ノイズサプレッサ410により背景雑音が抑圧された音声データ、420は、403のディジタルデータを圧縮符号化する音声符号化器、404は、音声符号化器420によってデータ圧縮された符号化データである。
401は、ユーザの送話音声を電気信号に変換して取り込むマイクロフォン、402は、上記マイクロフォン401にて得たアナログ音声信号をディジタル信号の音声データに変換するA/D変換器、410は、ディジタル信号処理により、上記音声データに含まれる背景雑音を抑圧するノイズサプレッサ、403は、ノイズサプレッサ410により背景雑音が抑圧された音声データ、420は、403のディジタルデータを圧縮符号化する音声符号化器、404は、音声符号化器420によってデータ圧縮された符号化データである。
音声符号化器420は、互いに異なる符号化レートで音声データを符号化する3つの回路として、Aレート符号化部421、Bレート符号化部422、Cレート符号化部423を備えるほかに、符号化レート切換制御部424を備える。
ここで例えば、Aレート符号化部421は、符号化を行う上記3つの回路のうち、最も符号化レートは低いものであり、Cレート符号化部423は、符号化を行う上記3つの回路のうち、最も符号化レートが高いものであり、またBレート符号化部422は、Aレート符号化部421とCレート符号化部423の中間の符号化レートとする。
符号化レート切換制御部424は、外部からの符号化レート選択コマンド405に応じて、Aレート符号化部421、Bレート符号化部422、Cレート符号化部423のうち、いずれか1つが機能するように切換制御するとともに、この切換制御により機能するレートを示す情報を、符号化レート選択情報406として、ノイズサプレッサ410に出力する。
ノイズサプレッサ410は、ノイズサプレス部415と、パラメータテーブル416と、パラメータ切換制御部417とを備える。
ノイズサプレス部415は、A/D変換器402が出力する音声データに含まれる背景雑音を抑圧するもので、その抑圧特性は、パラメータテーブル416より入力されるパラメータによって制御される。
ノイズサプレス部415は、A/D変換器402が出力する音声データに含まれる背景雑音を抑圧するもので、その抑圧特性は、パラメータテーブル416より入力されるパラメータによって制御される。
パラメータテーブル416は、ノイズサプレス部415にて行われる背景雑音の抑圧処理の特性を設定するパラメータを記憶するテーブルで、Aレート符号化部421、Bレート符号化部422、Cレート符号化部423の各符号化レートにそれぞれ最適な抑圧特性となるような3つのパラメータセットを記憶し、パラメータ切換制御部417の制御によりパラメータセットをノイズサプレス部415に入力する。
パラメータ切換制御部417は、パラメータテーブル416を制御して、符号化レート選択情報406に基づき、音声符号化器420にて機能する符号化部(421,422,423のいずれか)に最適なパラメータセットを選択的にノイズサプレス部415に設定するものである。
このような符号化部とノイズサプレス部のパラメータ設定(抑圧特性設定)との対応を最適なものにするために、例えば、Aレート符号化部421に対応するパラメータセットとしては、ノイズ抑圧量を強めに設定し、若干音声部分に歪みが生じても、極力ノイズを抑えるような特性が得られるパラメータセットととし、またCレート符号化部423に対応するパラメータセットとしては、ノイズ抑圧量は軽めに設定し、自然に聞こえる程度のノイズは透過させるような特性が得られるパラメータセットとする。
また、Bレート符号化部422に対応するパラメータセットとしては、Aレート符号化部421用の特性とCレート符号化部423用の特性の中間の特性が得られるパラメータセットとする。
次に、上記第4の実施形態の信号処理装置の動作について説明する。図8は、この動作を説明するためのフローチャートである。
今、ステップ8aにてコマンド入力の待機状態から、「符号化レートとしてAレートを使用せよ」の旨を示す符号化レート選択コマンド405が符号化レート切換制御部424に入力されると、ステップ8bに移行して、指定される方式を判定し、A方式であることより、ステップ8cに移行する。
今、ステップ8aにてコマンド入力の待機状態から、「符号化レートとしてAレートを使用せよ」の旨を示す符号化レート選択コマンド405が符号化レート切換制御部424に入力されると、ステップ8bに移行して、指定される方式を判定し、A方式であることより、ステップ8cに移行する。
ステップ8cでは、符号化レート切換制御部424が、ディジタルデータ403がAレート符号化部421に入力されるように切換制御し、これに応動してAレート符号化部421は入力されるディジタルデータ403の符号化を開始する。
また、ステップ8cでは、この切換制御に並行して、符号化レート切換制御部424が、ディジタルデータ403の符号化にAレート符号化部421を使用する旨の情報を、符号化レート選択情報406として、パラメータ切換制御部417に出力し、ステップ8dに移行する。
ステップ8dでは、パラメータ切換制御部417が、ノイズサプレス部415の雑音抑圧特性が、Aレート符号化部421による符号化に最適な特性となるように、Aレート符号化部421に対応するパラメータセットを、パラメータテーブル416よりノイズサプレス部415に入力させ、ステップ8iに移行する。
このようなパラメータ設定(抑圧特性設定)の制御動作により、A/D変換器402の出力は、Aレート符号化部421による符号化に適した抑圧特性で雑音が抑圧され、ディジタルデータ403としてAレート符号化部421に入力され、ここで符号化され、データ圧縮された符号化データ404として出力される。
ステップ8iにおいて、「符号化レートとしてBレートを使用せよ」の旨を示す符号化レート選択コマンド405が符号化レート切換制御部424に入力されると、ステップ8bに移行して、指定される方式を判定し、C方式であることより、ステップ8eに移行する。
ステップ8eでは、符号化レート切換制御部424が、タイミングをはかって、ディジタルデータ403がBレート符号化部422に入力されるように切換制御し、これに応動してAレート符号化部421は動作停止し、代わってBレート符号化部422が入力されるディジタルデータ403の符号化を開始する。
また、ステップ8eでは、この切換制御に並行して、符号化レート切換制御部424が、ディジタルデータ403の符号化にBレート符号化部422を使用する旨の情報を、符号化レート選択情報406として、パラメータ切換制御部417に出力し、ステップ8fに移行する。
ステップ8fでは、パラメータ切換制御部417が、ノイズサプレス部415の雑音抑圧特性が、Bレート符号化部422による符号化に最適な特性となるように、Bレート符号化部422に対応するパラメータセットを、パラメータテーブル416よりノイズサプレス部415に入力させ、ステップ8iに移行する。
このようなパラメータ設定(抑圧特性設定)の制御動作により、A/D変換器402の出力は、Bレート符号化部422による符号化に適した抑圧特性で雑音が抑圧され、ディジタルデータ403としてBレート符号化部422に入力され、ここで符号化され、データ圧縮された符号化データ404として出力される。
また、ステップ8iにおいて、上述のようにAレート符号化部421あるいはBレート符号化部422にて、ディジタルデータ403を符号化している際に、「符号化レートとしてCレートを使用せよ」の旨を示す符号化レート選択コマンド405が符号化レート切換制御部424に入力されると、ステップ8bに移行して、指定される方式を判定し、C方式であることより、ステップ8gに移行する。
ステップ8gでは、符号化レート切換制御部424が、タイミングをはかって、ディジタルデータ403がCレート符号化部423に入力されるように切換制御し、これに応動して使用中のAレート符号化部421あるいはBレート符号化部422の動作を停止し、代わってCレート符号化部423が入力されるディジタルデータ403の符号化を開始する。
また、ステップ8gでは、この切換制御に並行して、符号化レート切換制御部424が、ディジタルデータ403の符号化にCレート符号化部423を使用する旨の情報を、符号化レート選択情報406として、パラメータ切換制御部417に出力し、ステップ8hに移行する。
ステップ8hでは、パラメータ切換制御部417が、ノイズサプレス部415の雑音抑圧特性が、Cレート符号化部423による符号化に最適な特性となるように、Cレート符号化部423に対応するパラメータセットを、パラメータテーブル416よりノイズサプレス部415に入力させ、ステップ8iに移行する。
このようなパラメータ設定(抑圧特性設定)の制御動作により、A/D変換器402の出力は、Cレート符号化部423による符号化に適した抑圧特性で雑音が抑圧され、ディジタルデータ403としてCレート符号化部423に入力され、ここで符号化され、データ圧縮された符号化データ404として出力される。
なお、ステップ8iにて、コマンド入力がない場合には、ステップ8jに移行する。ステップ8jでは、通信の終了要求がなされたか否かを判定し、終了要求があった場合には、当該処理を終了し、一方、終了要求がない場合には、再びステップ8iにてコマンド入力を監視する。
以上のように、上記構成の信号処理装置では、データ圧縮された符号化データ404を得るにあたり、音声符号化器420にて機能する符号化部(421,422,423のいずれか)に合わせて、ノイズサプレス部415のパラメータを可変して、ノイズサプレス部415の雑音抑圧特性を符号化処理に最適な特性に設定するようにしている。
したがって、上記構成の信号処理装置によれば、音声符号化器420の符号化に合わせて、最適な雑音抑圧が行われるので、ノイズサプレス部が十分な機能を発揮し、高品質な音声を送信することができる。
尚、この発明は上記実施の形態に限定されるものではない。例えば、上記第4の実施形態では、パラメータ切換制御部417は、符号化レート切換制御部424からの符号化レート選択情報406に基づいて、音声符号化器420にて機能する符号化部に合わせ、ノイズサプレス部415の雑音抑圧特性を最適な特性に可変するようにした。
これに代わって例えば、パラメータ切換制御部417は、符号化レート選択コマンド405に基づいて、音声符号化器420にて機能する符号化部に合わせ、ノイズサプレス部415の雑音抑圧特性を最適な特性に可変するようにしても同様の効果を発揮することができる。
なお、この場合、パラメータ切換制御部417は、音声符号化器420における符号化部の切換タイミングを考慮したタイミングで、最適な雑音抑圧特性が得られるパラメータセットを設定する制御を行う。
また、以上の第1〜第4の実施形態では、図9で要約して示されるように、送話音声を符号化する場合を例に説明した。なお、この図において、1はマイクロフォンであり、2はA/D変換器で、ノイズサプレッサ10が上述のノイズサプレッサ110,210,310,410に対応し、音声符号化器20が上述の音声符号化器120,220,320,420に対応する。
ところで、上記の第1、第2の実施形態では、符号化方式の数(A方式、B方式、C方式の3個)とノイズサプレス方式の数(X方式、Y方式、Z方式の3個)および符号化方式の数とノイズサプレス部に設定するパラメータセットの数が同じものとして説明した。
また、第3、第4の実施形態でも符号化のレートの数(Aレート、Bレート、Cレートの3個)とノイズサプレス方式の数(X方式、Y方式、Z方式の3個)および符号化のレートの数とノイズサプレス部に設定するパラメータセットの数が同じものとして説明した。
しかしながら、本発明を実施するにあたっては、符号化方式の数とノイズサプレス方式の数、符号化方式の数とノイズサプレス部に設定するパラメータセットの数が同数でなくてもよい。
また、符号化レートの数とノイズサプレス方式の数および符号化レートの数とノイズサプレス部に設定するパラメータセットの数が同数でなくてもよい。
第3の実施形態を例に挙げて説明すると、例えば、図10に示すように、音声符号化器320が備える符号化部が8種類(Aレート、Bレート、Cレート、…、Hレート)あり、ノイズサプレス部がX方式とY方式の2つだけであってもよい。
この場合、例えば図11に示すように、音質のあまり良くないAレートの符号化部321の場合は、X方式のノイズサプレス部311を使用し、それ以外の符号化レートをもつ符号化部は、Y方式のノイズサプレス部312が使用されるようにする方法がある。
また、これ以外にも、例えばAレート、Bレート、Cレート、Dレートには、X方式の雑音抑圧を使用し、Eレート、Fレート、Gレート、Hレートには、Y方式の雑音抑圧を使用するなど、様々な実現の形態が可能であることはいうまでもない。
要は、符号化レートとその符号化レートに応じて使用する雑音抑圧の方式(または符号化レートに応じて雑音抑圧の制御のために設定するパラメータセット)を予め対応づけておくことが重要で、これにより、本発明が様々な実施形態を実現できる。
図1に示した第1の実施形態にあっては、音声符号化器120における互いに方式が異なる符号化部の数をP、ノイズサプレッサ110における互いに方式が異なるノイズサプレス部の数をQ(P,Qは共に正の整数)とした場合、PとQは、P≧Q>1の関係にあればよい。
また、図3に示した第2の実施形態にあっては、音声符号化器220における互いに方式が異なる符号化部の数をP、ノイズサプレッサ210のノイズサプレス部215に設定されるパラメータの数をS(P,Sは共に正の整数)とした場合、PとSは、P≧S>1の関係にあればよい。
さらに、図5に示した第3の実施形態にあっては、音声符号化器320における互いに符号化レートが異なる符号化部の数をR、ノイズサプレッサ310における互いに方式が異なるノイズサプレス部の数をQ(R,Qは共に正の整数)とした場合、RとQは、R≧Q>1の関係にあればよい。
図7に示した第4の実施形態にあっては、音声符号化器420における互いに符号化レートの異なる符号化部の数をR、ノイズサプレッサ410のノイズサプレス部415に設定されるパラメータの数をS(R,Sは共に正の整数)とした場合、RとSは、R≧S>1の関係にあればよい。
また、この発明は、このような送話音声を符号化する場合にのみ適用が限定されるものではなく、図12に示すような符号化音声データを復号する場合にも適用可能である。
なお、この図において、3はスピーカであり、2はD/A変換器で、40は、複数の復号方式、あるいは複数の符号化レートを選択的に用いて音声データを復号する復号器で、ノイズサプレッサ30が音声復号器40の復号処理に合わせ、最適な背景雑音の抑圧処理を行う。
このように、復号側にも適用する場合においても、前述の符号化の例と同様に、4つの形態を構成することが可能であり、このような各構成において、復号方式や符号化レートの切り替えた場合でも、ノイズサプレッサが十分な機能を発揮し、高品質な音声を受信することができる。
また、第3および第4の両実施形態では、符号化レートが可変可能な符号化器として、図5および図7の音声符号化器320,420に示すような、3つの回路を選択的に用いる構成を例に説明した。
しかし、これに限定されるものではなく、図13に示す音声符号化器720のように、1つの符号化部725のパラメータを可変することにより、符号化レートを可変するようにしてもよい。
なお、この図の構成では、予め、複数の符号化レートで符号化を行うためのパラメータセットをパラメータテーブル726に記憶させておき、外部からの要求に応じて符号化レート切換制御部727が、要求に応じたパラメータセットをパラメータテーブル726より出力して符号化部725に設定するようにする。
このような構成の音声符号化器720が用いられる場合でも、第3および第4の実施形態と同様に、ノイズサプレス部が十分な機能を発揮し、高品質な音声を送信することができる。
そしてまた、図1や図3の音声符号化器120,220を構成する符号化部121〜123,221〜223のいずれかを、図13に示したような音声符号化器720とすることも可能である。
そしてまた、図1や図3の音声符号化器120,220を構成する符号化部121〜123,221〜223のいずれかを、図13に示したような音声符号化器720とすることも可能である。
なお、符号化と復号の違いはあるものの、図12に示した復号側の構成に図13に示した構成を適用することも同様に可能であり、この場合においても、復号方式や符号化レートの切り替えた場合でも、ノイズサプレッサが十分な機能を発揮し、高品質な音声を受信することができる。
さらにまた、第4の実施形態において、ノイズサプレッサ410の構成を、特定の符号化レート情報が検出された時に、全部の周波数帯域または一部の周波数帯域で雑音抑圧をOFFとする(雑音抑圧を行わない)構成にすることも可能である。
図14は、このような雑音抑圧を行う場合の構成をノイズサプレッサ410に適用したもので、以下、この図を参照して詳細に説明する。
なお、ここでは、音声信号をM個の周波数帯域に分割し、スペクトルサブトラクション法(SS法)により雑音抑圧を行う方法を例に挙げて説明する。雑音抑圧の方式によっても異なるが、Mの値は通常6〜32程度が用いられる。
なお、ここでは、音声信号をM個の周波数帯域に分割し、スペクトルサブトラクション法(SS法)により雑音抑圧を行う方法を例に挙げて説明する。雑音抑圧の方式によっても異なるが、Mの値は通常6〜32程度が用いられる。
パラメータ切換制御部417は、音声符号化器420で用いる符号化の符号化レートを、符号化レート選択情報406から検出し、この検出した符号化レートに応じて、このレートに対応するパラメータテーブル416のパラメータセットをパラメータテーブル416より、ノイズサプレス部415の帯域別抑圧係数計算部460に出力させる。
この時、パラメータテーブル416より帯域別抑圧係数計算部460に入力されるパラメータセットは、L個の制御パラメータよりなる。この際、全周波数帯域で等しい程度の雑音抑圧を制御する場合は、1つの符号化レートに対しL=1個の制御パラメータを出力する。
一方、M個の周波数帯域毎に異なる雑音抑圧を制御するためには、1つの符号化レートに対しL=M個の制御パラメータを発生する。Lの値はこれに限られるものではない。
ここでは以降の説明の簡単化のため、符号化レートはA,B,Cの3種類、L=Mとする。この時、符号化レートAに対する制御パラメータはC(A,0)、C(A,1)、…、C(A,M−1)と表すことができる。
C(A,k)は、符号化レートAに対し、M個に分割した周波数帯域のうちK番目の帯域を制御するための制御パラメータを表す。これをまとめたものを図15に示す。
ノイズサプレス部415は、第4の実施形態でも説明したように、パラメータテーブル416からの制御パラメータに応じて、入力信号の雑音抑圧を行うもので、FFT部440、帯域別雑音量推定部450、帯域別抑圧係数計算部460、雑音抑圧部470、逆FFT部480から構成される。
FFT部440は、入力音声信号をFFT(高速フーリエ変換)により時間領域から周波数領域に変換する。なお、その他、周波数領域への変換法としてはDFT,DCTなど他の変換法を用いることができる。
帯域別雑音量推定部450は、周波数領域に変換された音声信号を所定M個の帯域に分割し、音声信号に含まれる雑音量を帯域別に推定する。帯域別抑圧係数計算部460は、帯域別雑音量推定部450で推定された帯域別の雑音量を基に、帯域別の雑音抑圧係数を計算する。
なお、ここでは、帯域別の雑音抑圧係数をD(0),D(1),…,D(M−1)とする。D(k)は、M個に分割した周波数帯域のうちk番目の帯域を制御するために用いる雑音抑圧係数を表す。
本発明では、入力信号の分析だけで求められた上記雑音抑圧係数以外に、符号化レート情報から求められる制御パラメータを用いて雑音抑圧処理を制御する。これを実現する1つの方法は、制御パラメータを雑音抑圧係数に乗算したものを新たな雑音抑圧係数として使用できるように制御パラメータを設定することである。
具体的には、例えば、以下のような操作を行うことにより、符号化レート情報から求められる制御パラメータC(k)を用いて雑音抑圧係数D(k)を更新する。更新後の雑音抑圧係数D(k)は、雑音抑圧部470へ出力される。
D(k)←D(k)×C(k) (k=0,…,M−1)
雑音抑圧部470は、入力音声信号から求められた周波数領域の音声スペクトルに対し、帯域別抑圧係数計算部460で求められた更新後の抑圧係数を用いて1−D(k)を帯域別に乗じることで雑音抑圧された音声スペクトルが生成される。逆FFT部480は、雑音抑圧部470で生成された音声スペクトルを時問領域の音声信号に変換する。
雑音抑圧部470は、入力音声信号から求められた周波数領域の音声スペクトルに対し、帯域別抑圧係数計算部460で求められた更新後の抑圧係数を用いて1−D(k)を帯域別に乗じることで雑音抑圧された音声スペクトルが生成される。逆FFT部480は、雑音抑圧部470で生成された音声スペクトルを時問領域の音声信号に変換する。
ここで、例えば、最も符号化レートが高い符号化レートCの時に、全周波数帯域で雑音抑圧をOFF(雑音抑圧を行わない)とするには、図16のようにビットレートCが検出された時に使用する帯域別制御パラメータを全て「0」に設定すればよい。
また、符号化レートBの時に、周波数帯域M−1でだけ雑音抑圧をOFF(雑音抑圧を行わない)とするには、図17のように符号化レートBが検出された時に使用する帯域M−1用の制御パラメータを「0」に設定すればよい。
このような構成によれば、これ以外にも様々な設定が可能であることは言うまでも無い。
このような構成によれば、これ以外にも様々な設定が可能であることは言うまでも無い。
このように、符号化レート情報から生成される制御パラメータを用いてノイズサプレス部415で行う雑音抑圧処理を制御することにより、従来よりも雑音抑圧と可変レート音声符号化のトータル的なバランスを考慮した可変レート音声処理装置を実現できる。
公知の雑音抑圧処理では、入力音声信号に含まれる雑音だけを完全に取り除くことはできないことは周知の事実である。雑音を完全に取り去ろうとすると音声信号の一部が雑音と共に取り去られてしまうことで、音が欠けたり、雑音と異なる異音が混入するなどが原因で、雑音抑圧後の音声の自然が失われるという劣化を引き起こす。
一方、音声符号化にとっては、できるだけ雑音が混入していないクリーンな音声信号の方が、符号化の分析がうまく行くこと、符号化モデルにあっていることなどの理由で、符号化による音質の劣化が一般的に小さいことが知られている。
逆に、背景雑音が多く含まれる音声信号を符号化すると、特に低符号化レートの音声符号化では、非音声部分の符号化が著しく劣化するため、背景雑音をある程度抑圧した後の音声信号を符号化した方が品質が向上する。
一方、高い符号化レートの音声符号化では、背景雑音が多少多く含まれる音声であっても、符号化自体の能力が高いために背景雑音による音質の劣化が小さく、音質も比較的自然なものが得られる。
このように、ある程度の雑音抑圧をすることは低い符号化レートの音声符号化を用いる場合に、トータルの音声品質に良い影響をもたらす可能性が高い傾向にあるが、高い符号化レートの音声符号化を用いる場合には自然性の高い音質が要求されるアプリケーションにおいては、必ずしも通常の雑音抑圧が必要とは限らない。
このような場合に、図16で説明した特定の符号化レート(1つの符号化レートとは限らない)で帯域別の制御パラメータを全て「0」に設定することにより、全周波数帯域で雑音抑圧をOFF(雑音抑圧を行わない)とする方法が有効になる。
このため、図14に示したノイズサプレッサ420を用いることにより、符号化レートに応じて雑音抑圧機能を従来よりも柔軟に制御できるため、背景雑音が多く混入するような実環境下で可変レート音声処理装置を使用する際の音声品質を改善できる。
なお、ここでは、図7に示すような符号化側で符号化レートを可変する構成のノイズサプレッサ410に適用する場合について説明したが、復号側にて符号化レートに応じた雑音抑圧を行うノイズサプレッサに適用したり、あるいは符号化方式あるいは復号方式に応じた雑音抑圧を行うノイズサプレッサに適用することも可能で、その場合にも同様の効果を奏することはいうまでもない。
さらに、第4の実施形態において、ノイズサプレッサ410の構成を、図18に示すようなノイズサプレッサ411とし、符号化レートと無関係に、外部からの要求に応じて強制的に雑音抑圧をOFFとする(雑音抑圧を行わない)構成にすることも可能である。
同図において、ノイズサプレス部415、パラメータテーブル416、パラメータ切換制御部417は、第4の実施形態で説明したものと同様であることより、ここでは説明を省略する。ここでは、新たに設けた、ON/OFF情報検出部419と、切換スイッチ418について説明する。
ON/OFF情報検出部419は、外部から雑音を抑圧する機能のON/OFFを指示する情報を検出/判定し、この判定結果に応じて切換スイッチ418の切換制御を行う。
すなわち、雑音を抑圧する機能をONにする指示を検出した場合には、A/D変換器402より出力される音声データがノイズサプレス部415に入力されるように切り換えられ、一方、雑音を抑圧する機能をOFFにする指示を検出した場合には、A/D変換器402より出力される音声データがノイズサプレス部415を介さずにディジタルデータ403として後段の音声符号化器420に入力されるように切り換えられる。
雑音を抑圧する機能のON/OFFを外部から制御する一例としては、通信ネットワーク側からのノイズサプレッサ411へのON/OFF制御がある。このような制御が必要になる理由の1つは、受信側と送信側との間で符号化/復号化が2度行われる、いわゆるタンデム接続がありうる通信経路において、雑音抑圧が2度行われてタンデムになることを防止するためである。
タンデム接続を防止するために行う制御の本質は、雑音抑圧をON(有効)にすることではなく、雑音抑圧をOFF(無効)にすることである。この点を考慮し、通信ネットワーク側からなどの外部からの雑音を抑圧する機能のON/OFF制御がある場合には、双方の意図を生かした制御の組み合わせが可能である。
なお、ここでは、図7に示すような符号化側で符号化レートを可変する構成のノイズサプレッサ410に適用する場合について説明したが、復号側にて符号化レートに応じた雑音抑圧を行うノイズサプレッサに適用したり、あるいは符号化方式あるいは復号方式に応じた雑音抑圧を行うノイズサプレッサに適用することも可能で、その場合にも同様の効果を奏することはいうまでもない。
次に、この発明の第5の実施形態に係わる信号処理装置について説明する。図19は、その構成を示すものである。
音声入力部540は、ユーザの送話音声を電気信号に変換して取り込み、ディジタル化して音声データを得るもので、ハンズフリー用マイク541と、ハンズフリー用マイクアンプ542と、非ハンズフリー用マイク543と、非ハンズフリー用マイクアンプ544と、マイク切換制御部545と、A/D変換器546とを備える。
音声入力部540は、ユーザの送話音声を電気信号に変換して取り込み、ディジタル化して音声データを得るもので、ハンズフリー用マイク541と、ハンズフリー用マイクアンプ542と、非ハンズフリー用マイク543と、非ハンズフリー用マイクアンプ544と、マイク切換制御部545と、A/D変換器546とを備える。
マイク切換制御部545は、ハンズフリーと非ハンズフリーとを切り換える制御コマンド553に応じて、上述のハンズフリー用のアナログ系と非ハンズフリー用のアナログ系を切り換える。
A/D変換器546は、上記マイク切換制御部545の切換制御により上記いずれかのアナログ系にて得たアナログ音声信号が入力され、このアナログ音声信号をディジタル化し、音声データとして出力する。
なお、非ハンズフリー時は、音声の到来方向および距離がほぼ決まっているので、これにあわせたマイク感度、指向性をもたせたマイクを使用する。一方、ハンズフリー時は、遠くからの送話音声についても拾えるように、予めマイク感度を上げておく必要があり、また、音声の到来方向も非ハンズフリー時に比べ不確定になるので、指向性を広角化する必要がある。このため、ハンズフリー/非ハンズフリーにより、A/D変換器546に入力されるアナログ音声信号の特性が異なっている。
エコー制御ユニット530は、ハンズフリー用エコー制御部531と、非ハンズフリー用エコー制御部532と、エコー切換制御部533とを備える。
ハンズフリー用エコー制御部531は、ハンズフリー用マイク541およびハンズフリー用マイクアンプ542の使用時に好適し、A/D変換器546の出力する音声データに重畳されるエコーを低減する。
一方、非ハンズフリー用エコー制御部532は、非ハンズフリー用マイク543および非ハンズフリー用マイクアンプ544の使用時に好適し、A/D変換器546の出力する音声データに重畳されるエコーを低減する。ただし、エコー抑圧が不要なときは音声データはエコー制御されること無く出力される。
エコー切換制御部533は、ハンズフリーと非ハンズフリーとを切り換える制御コマンド553に応じて、上記ハンズフリー用エコー制御部531と非ハンズフリー用エコー制御部532とうち、いずれか一方にA/D変換器546の出力する音声データを入力することにより、一方を機能させる制御を行うものである。
この制御により、ハンズフリー用エコー制御部531あるいは非ハンズフリー用エコー制御部532にてエコーが低減された音声データ551は、ノイズサプレッサ510に出力される。
ノイズサプレッサ510は、互いに異なるアルゴリズムにより背景雑音を抑圧する2つの回路として、X方式ノイズサプレス部511、Y方式ノイズサプレス部512を備えるほかに、サプレス方式切換制御部514を備える。
X方式ノイズサプレス部511は、ハンズフリー時に使用される、ハンズフリー用マイク541、ハンズフリー用マイクアンプ542およびハンズフリー用エコー制御部531を経て生成される音声データ551に対する雑音抑圧に適するように設定されている。
一方、Y方式ノイズサプレス部512は、非ハンズフリー時に使用される、非ハンズフリー用マイク543、非ハンズフリー用マイクアンプ544および非ハンズフリー用エコー制御部532を経て生成される音声データ551に対する雑音抑圧に適するように設定されている。
サプレス方式切換制御部514は、ハンズフリーと非ハンズフリーとを切り換える制御コマンド553に応じて、X方式ノイズサプレス部511とY方式ノイズサプレス部512とのうち、最適ないずれか一方に音声データ551を入力することにより、一方を機能させる制御を行うものである。
次に、上記第5の実施形態の信号処理装置の動作について説明する。図20は、この動作を説明するためのフローチャートである。
今、ステップ20aにてコマンド入力の待機状態から、「ハンズフリーを実施せよ」の旨を示す制御コマンド553が入力されると、ステップ20bに移行して、指定される内容を判定し、ハンズフリーの実施指示であることより、ステップ20cに移行する。
今、ステップ20aにてコマンド入力の待機状態から、「ハンズフリーを実施せよ」の旨を示す制御コマンド553が入力されると、ステップ20bに移行して、指定される内容を判定し、ハンズフリーの実施指示であることより、ステップ20cに移行する。
ステップ20cでは、マイク切換制御部545が、ハンズフリー用マイク541およびハンズフリー用マイクアンプ542を通じて入力されるアナログ音声信号がA/D変換器546に入力されるように切換制御を開始する。
また、ステップ20cでは、この切換制御に並行して、エコー切換制御部533が、上記制御コマンド553に応じて、A/D変換器546より出力される音声データをハンズフリー用エコー制御部531に入力し、ステップ20dに移行する。
ステップ20dでは、サプレス方式切換制御部514が、上記制御コマンド553に応じて、ハンズフリー用エコー制御部531より出力される音声データをX方式ノイズサプレス部511に入力し、ステップ20gに移行する。
したがって、ハンズフリーの指示が与えられる場合には、このような切換制御動作により、ハンズフリー用マイク541を通じて入力されるユーザの送話音声は、ハンズフリー用エコー制御部531にて、ハンズフリー用マイク541およびハンズフリー用マイクアンプ542の使用時に好適するエコー制御が実施される。
そして、このエコー制御された音声データ551は、X方式ノイズサプレス部511により、ハンズフリー用マイク541、ハンズフリー用マイクアンプ542およびハンズフリー用エコー制御部531の使用時に最適な雑音抑圧処理が施され、後段の送信部に送信音声データ552として出力される。
その後、ステップ20gにおいて、「ハンズフリーを中止せよ」の旨を示す制御コマンド553が入力されると、ステップ20bに移行して、指定される内容を判定し、ハンズフリーの中止指示であることより、ステップ20eに移行する。
ステップ20eでは、マイク切換制御部545が、非ハンズフリー用マイク543および非ハンズフリー用マイクアンプ544を通じて入力されるアナログ音声信号がA/D変換器546に入力されるように切換制御を開始する。
また、ステップ20eでは、この切換制御に並行して、エコー切換制御部533が、上記制御コマンド553に応じて、A/D変換器546より出力される音声データを非ハンズフリー用エコー制御部532に入力し、ステップ20fに移行する。
ステップ20fでは、サプレス方式切換制御部514が、上記制御コマンド553に応じて、非ハンズフリー用エコー制御部532より出力される音声データをY方式ノイズサプレス部512に入力し、ステップ20gに移行する。
したがって、ハンズフリーの中止指示が与えられる場合には、このような切換制御動作により、非ハンズフリー用マイク543を通じて入力されるユーザの送話音声は、非ハンズフリー用エコー制御部532にて、非ハンズフリー用マイク543および非ハンズフリー用マイクアンプ544の使用時に好適するエコー制御が実施される。
そして、このエコー制御された音声データ551は、Y方式ノイズサプレス部512により、非ハンズフリー用マイク543、非ハンズフリー用マイクアンプ544および非ハンズフリー用エコー制御部532の使用時に最適な雑音抑圧処理が施され、後段の送信部に送信音声データ552として出力される。
なお、ステップ20gにて、コマンド入力がない場合には、ステップ20hに移行する。ステップ20hでは、通信の終了要求がなされたか否かを判定し、終了要求があった場合には、当該処理を終了し、一方、終了要求がない場合には、再びステップ20gにてコマンド入力を監視する。
以上のように、上記構成の信号処理装置では、エコー制御および雑音抑圧された送信音声データ552を得るにあたり、ハンズフリー/非ハンズフリーの音声データの生成経路に合わせて、最適なノイズサプレス部(511あるいは512のいずれか)を機能させるようにしている。
したがって、上記構成の信号処理装置によれば、ハンズフリー/非ハンズフリーが切り換えれる場合でも、音声データの生成経路、すなわち音声データの特性に適したノイズサプレス部による雑音抑圧が行われるので、ノイズサプレス部が十分な機能を発揮し、高品質な音声を送信することができる。
次に、この発明の第6の実施形態に係わる信号処理装置について説明する。図21は、その構成を示すものである。
音声入力部640は、ユーザの送話音声を電気信号に変換して取り込み、ディジタル化して音声データを得るもので、ハンズフリー用マイク641と、ハンズフリー用マイクアンプ642と、非ハンズフリー用マイク643と、非ハンズフリー用マイクアンプ644と、マイク切換制御部645と、A/D変換器646とを備える。
音声入力部640は、ユーザの送話音声を電気信号に変換して取り込み、ディジタル化して音声データを得るもので、ハンズフリー用マイク641と、ハンズフリー用マイクアンプ642と、非ハンズフリー用マイク643と、非ハンズフリー用マイクアンプ644と、マイク切換制御部645と、A/D変換器646とを備える。
マイク切換制御部645は、ハンズフリーと非ハンズフリーとを切り換える制御コマンド653に応じて、上述のハンズフリー用のアナログ系と非ハンズフリー用のアナログ系を切り換える。
A/D変換器646は、上記マイク切換制御部645の切換制御により上記いずれかのアナログ系にて得たアナログ音声信号が入力され、このアナログ音声信号をディジタル化し、音声データとして出力する。
なお、非ハンズフリー時は、音声の到来方向および距離がほぼ決まっているので、これにあわせたマイク感度、指向性をもたせたマイクを使用する。一方、ハンズフリー時は、遠くからの送話音声についても拾えるように、予めマイク感度を上げておく必要があり、また、音声の到来方向も非ハンズフリー時に比べ不確定になるので、指向性を広角化する必要がある。このため、ハンズフリー/非ハンズフリーにより、A/D変換器646に入力されるアナログ音声信号の特性が異なっている。
エコー制御ユニット630は、ハンズフリー用エコー制御部631と、非ハンズフリー用エコー制御部632と、エコー切換制御部633とを備える。
ハンズフリー用エコー制御部631は、ハンズフリー用マイク641およびハンズフリー用マイクアンプ642の使用時に好適し、A/D変換器646の出力する音声データに重畳されるエコーを低減する。
一方、非ハンズフリー用エコー制御部632は、非ハンズフリー用マイク643および非ハンズフリー用マイクアンプ644の使用時に好適し、A/D変換器646の出力する音声データに重畳されるエコーを低減する。ただし、エコー抑圧が不要なときは音声データはエコー制御されること無く出力される。
エコー切換制御部633は、ハンズフリーと非ハンズフリーとを切り換える制御コマンド653に応じて、上記ハンズフリー用エコー制御部631と非ハンズフリー用エコー制御部632とうち、いずれか一方にA/D変換器646の出力する音声データを入力することにより、一方を機能させる制御を行うものである。
この制御により、ハンズフリー用エコー制御部631あるいは非ハンズフリー用エコー制御部632にてエコーが低減された音声データ651は、ノイズサプレッサ610に出力される。
ノイズサプレッサ610は、ノイズサプレス部615と、パラメータテーブル616と、パラメータ切換制御部617とを備える。
ノイズサプレス部615は、エコー制御ユニット630が出力する音声データに含まれる背景雑音を抑圧するもので、その抑圧特性は、パラメータテーブル616より入力されるパラメータによって制御される。
ノイズサプレス部615は、エコー制御ユニット630が出力する音声データに含まれる背景雑音を抑圧するもので、その抑圧特性は、パラメータテーブル616より入力されるパラメータによって制御される。
パラメータテーブル616は、ノイズサプレス部615にて行われる背景雑音の抑圧処理の特性を設定するパラメータを記憶するテーブルで、ハンズフリー時に最適なパラメータセットAと、非ハンズフリー時に最適なパラメータセットBを記憶し、パラメータ切換制御部617の制御によりパラメータセットをノイズサプレス部615に入力する。
すなわち、パラメータセットAは、ノイズサプレス部615の特性を、ハンズフリー時に使用される、ハンズフリー用マイク641、ハンズフリー用マイクアンプ642およびハンズフリー用エコー制御部631を経て生成される音声データ651に対する雑音抑圧に適する特性となるようにするものである。
また、パラメータセットBは、ノイズサプレス部615の特性を、非ハンズフリー時に使用される、非ハンズフリー用マイク643、非ハンズフリー用マイクアンプ644および非ハンズフリー用エコー制御部632を経て生成される音声データ651に対する雑音抑圧に適する特性となるようにするものである。
パラメータ切換制御部617は、パラメータテーブル616を制御して、ハンズフリーと非ハンズフリーとを切り換える制御コマンド653に応じて、音声データ651の雑音抑圧処理に最適なパラメータセットを選択的にノイズサプレス部615に設定するものである。
次に、上記第6の実施形態の信号処理装置の動作について説明する。図22は、この動作を説明するためのフローチャートである。
今、ステップ22aにてコマンド入力の待機状態から、「ハンズフリーを実施せよ」の旨を示す制御コマンド653が入力されると、ステップ22bに移行して、指定される内容を判定し、ハンズフリーの実施指示であることより、ステップ22cに移行する。
今、ステップ22aにてコマンド入力の待機状態から、「ハンズフリーを実施せよ」の旨を示す制御コマンド653が入力されると、ステップ22bに移行して、指定される内容を判定し、ハンズフリーの実施指示であることより、ステップ22cに移行する。
ステップ22cでは、マイク切換制御部645が、ハンズフリー用マイク641およびハンズフリー用マイクアンプ642を通じて入力されるアナログ音声信号がA/D変換器646に入力されるように切換制御を開始する。
また、ステップ22cでは、この切換制御に並行して、エコー切換制御部633が、上記制御コマンド653に応じて、A/D変換器646より出力される音声データをハンズフリー用エコー制御部631に入力し、ステップ22dに移行する。
ステップ22dでは、パラメータ切換制御部617が、上記制御コマンド653に応じて、パラメータテーブル616を制御して、ハンズフリー時に最適なパラメータセットAをノイズサプレス部615に設定し、ステップ22gに移行する。
したがって、ハンズフリーの指示が与えられる場合には、このような切換制御動作により、ハンズフリー用マイク641を通じて入力されるユーザの送話音声は、ハンズフリー用エコー制御部631にて、ハンズフリー用マイク641およびハンズフリー用マイクアンプ642の使用時に好適するエコー制御が実施される。
そして、このエコー制御された音声データ651は、パラメータセットAが設定されるノイズサプレス部615により、ハンズフリー用マイク641、ハンズフリー用マイクアンプ642およびハンズフリー用エコー制御部631の使用時に最適な雑音抑圧処理が施され、後段の送信部に送信音声データ652として出力される。
その後、ステップ22gにおいて、「ハンズフリーを中止せよ」の旨を示す制御コマンド653が入力されると、ステップ22bに移行して、指定される内容を判定し、ハンズフリーの中止指示であることより、ステップ22eに移行する。
ステップ22eでは、マイク切換制御部645が、非ハンズフリー用マイク643および非ハンズフリー用マイクアンプ644を通じて入力されるアナログ音声信号がA/D変換器646に入力されるように切換制御を開始する。
また、ステップ22eでは、この切換制御に並行して、エコー切換制御部633が、上記制御コマンド653に応じて、A/D変換器646より出力される音声データを非ハンズフリー用エコー制御部632に入力し、ステップ22fに移行する。
ステップ22fでは、パラメータ切換制御部617が、上記制御コマンド653に応じて、パラメータテーブル616を制御して、非ハンズフリー時に最適なパラメータセットBをノイズサプレス部615に設定し、ステップ22gに移行する。
したがって、ハンズフリーの中止指示が与えられる場合には、このような切換制御動作により、非ハンズフリー用マイク643を通じて入力されるユーザの送話音声は、非ハンズフリー用エコー制御部632にて、非ハンズフリー用マイク643および非ハンズフリー用マイクアンプ644の使用時に好適するエコー制御が実施される。
そして、このエコー制御された音声データ651は、パラメータセットBが設定されるノイズサプレス部615により、非ハンズフリー用マイク643、非ハンズフリー用マイクアンプ644および非ハンズフリー用エコー制御部632の使用時に最適な雑音抑圧処理が施され、後段の送信部に送信音声データ652として出力される。
なお、ステップ22gにて、コマンド入力がない場合には、ステップ22hに移行する。ステップ22hでは、通信の終了要求がなされたか否かを判定し、終了要求があった場合には、当該処理を終了し、一方、終了要求がない場合には、再びステップ22gにてコマンド入力を監視する。
以上のように、上記構成の信号処理装置では、エコー制御および雑音抑圧された送信音声データ652を得るにあたり、ハンズフリー/非ハンズフリーの音声データの生成経路に合わせて、最適な雑音抑圧特性となるようにノイズサプレス部615の特性を制御するようにしている。
したがって、上記構成の信号処理装置によれば、ハンズフリー/非ハンズフリーが切り換えれる場合でも、音声データの生成経路、すなわち音声データの特性に適したノイズサプレス部による雑音抑圧が行われるので、ノイズサプレス部が十分な機能を発揮し、高品質な音声を送信することができる。
尚、この発明は上記実施の形態に限定されるものではない。例えば、上述の各実施の形態では、ノイズサプレッサ、音声符号化(復号)器、エコー制御ユニットなどを、それぞれ別の回路の如く説明したが、各実施形態において、これらを1チップ化して、1つまたは複数のDSPチップ上で実現することも可能である。
また、これに代わって例えば、高速なプロセッサとメモリを用いて、ノイズサプレッサ、音声符号化(復号)器、エコー制御ユニットなどの機能を発揮するプログラムを上記メモリに記憶させ、このプログラムに従って上記プロセッサを作動させることにより実現することが可能であることはいうまでもない。
その他、この発明の要旨を逸脱しない範囲で種々の変形を施しても同様に実施可能であることはいうまでもない。
その他、この発明の要旨を逸脱しない範囲で種々の変形を施しても同様に実施可能であることはいうまでもない。
10,30,110,310,510…ノイズサプレッサ
20,120,220,320,420,720…音声符号化器
40…音声復号器
111〜113,311〜313,511,512…ノイズサプレス部
114,314,514…サプレス方式切換制御部
121〜123,221〜223,725…符号化部
124,224…符号化方式切換制御部
210,410,411,610…ノイズサプレッサ
215,415,615…ノイズサプレス部
216,416,616,726…パラメータテーブル
217,417,617…パラメータ切換制御部
321〜323,421〜423…レート符号化部
324,424,727…符号化レート切換制御部
419…ON/OFF情報検出部
440…FFT部
450…帯域別雑音量推定部
460…帯域別抑圧係数計算部
470…雑音抑圧部
480…逆FFT部
530,630…エコー制御ユニット
531,631…ハンズフリー用エコー制御部
532,632…非ハンズフリー用エコー制御部
533,633…エコー切換制御部
540,640…音声入力部
541,641…ハンズフリー用マイク
542,642…ハンズフリー用マイクアンプ
543,643…非ハンズフリー用マイク
544,644…非ハンズフリー用マイクアンプ
545,645…マイク切換制御部。
20,120,220,320,420,720…音声符号化器
40…音声復号器
111〜113,311〜313,511,512…ノイズサプレス部
114,314,514…サプレス方式切換制御部
121〜123,221〜223,725…符号化部
124,224…符号化方式切換制御部
210,410,411,610…ノイズサプレッサ
215,415,615…ノイズサプレス部
216,416,616,726…パラメータテーブル
217,417,617…パラメータ切換制御部
321〜323,421〜423…レート符号化部
324,424,727…符号化レート切換制御部
419…ON/OFF情報検出部
440…FFT部
450…帯域別雑音量推定部
460…帯域別抑圧係数計算部
470…雑音抑圧部
480…逆FFT部
530,630…エコー制御ユニット
531,631…ハンズフリー用エコー制御部
532,632…非ハンズフリー用エコー制御部
533,633…エコー切換制御部
540,640…音声入力部
541,641…ハンズフリー用マイク
542,642…ハンズフリー用マイクアンプ
543,643…非ハンズフリー用マイク
544,644…非ハンズフリー用マイクアンプ
545,645…マイク切換制御部。
Claims (29)
- 音声信号に含まれる雑音成分を抑圧する雑音抑圧手段と、この雑音抑圧手段にて雑音成分が抑圧された音声信号に符号化処理を施して、圧縮された符号化音声データを生成する符号化手段とを備える信号処理装置であって、
前記符号化手段は、複数の異なる符号化処理が可能であり、
前記雑音抑圧手段は、前記符号化手段にて実施される符号化処理に応じた雑音抑圧特性を有することを特徴とする信号処理装置。 - 前記符号化手段における複数の異なる符号化処理は、それぞれ異なる符号化方式により符号化を行う処理であることを特徴とする請求項1に記載の信号処理装置。
- 前記符号化手段における複数の異なる符号化処理は、それぞれ異なる符号化レートにより符号化を行う処理であることを特徴とする請求項1に記載の信号処理装置。
- 前記雑音抑圧手段は、前記符号化手段にて選択的に実施される符号化処理に応じて、少なくとも一部の周波数帯域において、雑音成分の抑圧を行わないことを特徴とする請求項1乃至請求項3のいずれかに記載の信号処理装置。
- 前記雑音抑圧手段は、要求に応じて雑音成分の抑圧を行わないことを特徴とする請求項1乃至請求項4のいずれかに記載の信号処理装置。
- 前記雑音抑圧手段は、互いに異なる雑音成分の抑圧特性を有する複数のノイズサプレス部を備え、音声信号に対して、前記符号化手段にて選択的に実施される符号化処理に応じて、前記ノイズサプレス部を選択的に用いて雑音成分の抑圧を行うことを特徴とする請求項1乃至請求項5のいずれかに記載の信号処理装置。
- 前記雑音抑圧手段は、
音声信号に対して雑音成分の抑圧を行うもので、パラメータの設定に応じて雑音成分の抑圧特性を可変可能なノイズサプレス部と、
前記符号化手段にて選択的に実施される符号化処理に応じたパラメータを、前記ノイズサプレス部に設定するパラメータ設定手段とを備えることを特徴とする請求項1乃至請求項5のいずれかに記載の信号処理装置。 - 圧縮された符号化音声データを音声信号に復号する復号手段と、この復号手段により復号された音声信号に含まれる雑音成分を抑圧する雑音抑圧手段とを備える信号処理装置であって、
前記復号手段は、前記復号化音声データに応じて複数の異なる復号化処理が可能であり、
前記雑音抑圧手段は、前記復号手段にて実施される復号処理に応じた雑音抑圧特性を有することを特徴とする信号処理装置。 - 前記復号手段における複数の異なる復号処理は、それぞれ異なる復号方式により復号を行う処理であることを特徴とする請求項8に記載の信号処理装置。
- 前記符号化手段における複数の異なる復号処理は、それぞれ異なる符号化レートの符号化音声データを復号する処理であることを特徴とする請求項8に記載の信号処理装置。
- 前記雑音抑圧手段は、前記復号手段にて選択的に実施される復号処理に応じて、少なくとも一部の周波数帯域において、雑音成分の抑圧を行わないことを特徴とする請求項8乃至請求項10のいずれかに記載の信号処理装置。
- 前記雑音抑圧手段は、要求に応じて雑音成分の抑圧を行わないことを特徴とする請求項8乃至請求項11のいずれかに記載の信号処理装置。
- 前記雑音抑圧手段は、互いに異なる雑音成分の抑圧特性を有する複数のノイズサプレス部を備え、復号された音声信号に対して、前記復号手段にて選択的に実施される復号処理に応じて、前記ノイズサプレス部を選択的に用いて雑音成分の抑圧を行うことを特徴とする請求項8乃至請求項12のいずれかに記載の信号処理装置。
- 前記雑音抑圧手段は、
復号された音声信号に対して雑音成分の抑圧を行うもので、パラメータの設定に応じて雑音成分の抑圧特性を可変可能なノイズサプレス部と、
前記復号手段にて選択的に実施される復号処理に応じたパラメータを、前記ノイズサプレス部に設定するパラメータ設定手段とを備えることを特徴とする請求項8乃至請求項12のいずれかに記載の信号処理装置。 - ハンズフリー機能を選択的に使用可能な機器に用いられる信号処理装置において、
入力された音声信号に対して、前記ハンズフリー機能を使用した音声入力か否かに応じた雑音成分の抑圧を行う雑音抑圧手段を具備することを特徴とする信号処理装置。 - 前記雑音抑圧手段は、前記ハンズフリー機能を使用した音声入力か否かに応じて、少なくとも一部の周波数帯域において、雑音成分の抑圧を行わないことを特徴とする請求項15に記載の信号処理装置。
- 前記雑音抑圧手段は、要求に応じて雑音成分の抑圧を行わないことを特徴とする請求項15または請求項16に記載の信号処理装置。
- 前記雑音抑圧手段は、互いに異なる雑音成分の抑圧特性を有する複数のノイズサプレス部を備え、入力された音声信号に対して、前記ハンズフリー機能を使用した音声入力か否かに応じて、前記ノイズサプレス部を選択的に用いて雑音成分の抑圧を行うことを特徴とする請求項15乃至請求項17のいずれかに記載の信号処理装置。
- 前記雑音抑圧手段は、
入力された音声信号に対して雑音成分の抑圧を行うもので、パラメータの設定に応じて雑音成分の抑圧特性を可変可能なノイズサプレス部と、
前記ハンズフリー機能を使用した音声入力か否かに応じたパラメータを、前記ノイズサプレス部に設定するパラメータ設定手段とを備えることを特徴とする請求項15乃至請求項17のいずれかに記載の信号処理装置。 - 音声信号に含まれる雑音成分を抑圧する雑音抑圧工程と、この雑音抑圧工程にて雑音成分が抑圧された音声信号に符号化処理を施して、圧縮された符号化音声データを生成する符号化工程とを備える信号処理方法であって、
前記符号化工程は、複数の異なる符号化処理を選択的に実施し、
前記雑音抑圧工程は、音声信号に対して、前記符号化工程にて選択的に実施される符号化処理に応じた雑音成分の抑圧を行うことを特徴とする信号処理方法。 - 圧縮された符号化音声データを音声信号に復号する復号工程と、この復号工程により復号された音声信号に含まれる雑音成分を抑圧する雑音抑圧工程とを備える信号処理方法であって、
前記復号工程は、前記符号化音声データに応じて、複数の異なる復号処理を選択的に前記符号化音声データに対して実施し、
前記雑音抑圧工程は、音声信号に対して、前記復号工程にて選択的に実施される復号処理に応じた雑音成分の抑圧を行うことを特徴とする信号処理方法。 - ハンズフリー機能を選択的に使用可能な機器に用いられる信号処理方法において、
入力された音声信号に対して、前記ハンズフリー機能を使用した音声入力か否かに応じた雑音成分の抑圧を行う雑音抑圧工程を具備することを特徴とする信号処理方法。 - 音声信号に含まれる雑音成分を抑圧する雑音抑圧手順と、この雑音抑圧手順にて雑音成分が抑圧された音声信号に符号化処理を施して圧縮された符号化音声データを生成する符号化手順をコンピュータに実行機能させるためのプログラムを記録したコンピュータ読み取り可能な記録媒体であって、
前記符号化手順は、複数の異なる符号化処理を選択的に実施する手順であり、
前記雑音抑圧手順は、音声信号に対して、前記符号化手順にて選択的に実施される符号化処理に応じた雑音成分の抑圧を行う手順であることを特徴とする記録媒体。 - 圧縮された符号化音声データを音声信号に復号する復号手順と、この復号手順により復号された音声信号に含まれる雑音成分を抑圧する雑音抑圧手段をコンピュータに実行させるためのプログラムを記録したコンピュータ読み取り可能な記録媒体であって、
前記復号手順は、前記符号化音声データに応じて、複数の異なる復号処理を選択的に前記符号化音声データに対して実施する手順であり、
前記雑音抑圧手順は、音声信号に対して、前記復号手順にて選択的に実施される復号処理に応じた雑音成分の抑圧を行う手順であることを特徴とする記録媒体。 - ハンズフリー機能を選択的に使用可能とする手順と、
入力された音声信号に対して、前記ハンズフリー機能を使用した音声入力か否かに応じた雑音成分の抑圧を行う雑音抑圧手順をコンピュータに実行させるためのプログラムを記録したコンピュータ読み取り可能な記録媒体。 - 音声信号に含まれる雑音成分を抑圧する雑音抑圧手段と、この雑音抑圧手段にて雑音成分が抑圧された音声信号に符号化処理を施して、圧縮された符号化音声データを生成する符号化手段とを備える信号処理装置であって、
前記符号化手段は、複数の異なる符号化方式による符号化処理を選択的に実施し、
前記雑音抑圧手段は、互いに異なる雑音成分の抑圧特性を有する複数のノイズサプレス部を備え、音声信号に対して、前記符号化手段で選択的に実施される符号化処理に応じて、前記複数のノイズサプレス部の中から1つのノイズサプレス部を選択的に用いて雑音成分の抑圧を行うものであり、
前記符号化手段における複数の異なる符号化方式の数をP、前記雑音抑圧手段のノイズサプレス部の数をQ(P,Qは共に正の整数)とした場合、PとQは、P≧Q>1の関係にあることを特徴とする信号処理装置。 - 音声信号に含まれる雑音成分を抑圧する雑音抑圧手段と、この雑音抑圧手段にて雑音成分が抑圧された音声信号に符号化処理を施して、圧縮された符号化音声データを生成する符号化手段とを備える信号処理装置であって、
前記符号化手段は、複数の異なる符号化レートによる符号化処理を選択的に実施し、
前記雑音抑圧手段は、互いに異なる雑音成分の抑圧特性を有する複数のノイズサプレス部を備え、音声信号に対して、前記符号化手段で選択的に実施される符号化処理に応じて、前記複数のノイズサプレス部の中から1つのノイズサプレス部を選択的に用いて雑音成分の抑圧を行うものであり、
前記符号化手段における前記複数の異なる符号化レートの数をR、前記雑音抑圧手段のノイズサプレス部の数をQ(R,Qは共に正の整数)とした場合、RとQは、R≧Q>1の関係にあることを特徴とする信号処理装置。 - 音声信号に含まれる雑音成分を抑圧する雑音抑圧手段と、この雑音抑圧手段にて雑音成分が抑圧された音声信号に符号化処理を施して、圧縮された符号化音声データを生成する符号化手段とを備える信号処理装置であって、
前記符号化手段は、複数の異なる符号化方式による符号化処理を選択的に実施し、
前記雑音抑圧手段は、音声信号に対して雑音成分の抑圧を行うもので、パラメータの設定に応じて雑音成分の抑圧特性を可変可能なノイズサプレス部と、前記符号化手段で選択的に実施される符号化処理に応じたパラメータを、前記ノイズサプレス部に設定するパラメータ設定手段とを備え、
前記符号化手段における複数の異なる符号化方式の数をP、前記雑音抑圧手段のノイズサプレス部に設定するパラメータセットの数をS(P,Sは共に正の整数)とした場合、PとSは、P≧S>1の関係にあることを特徴とする信号処理装置。 - 音声信号に含まれる雑音成分を抑圧する雑音抑圧手段と、この雑音抑圧手段にて雑音成分が抑圧された音声信号に符号化処理を施して、圧縮された符号化音声データを生成する符号化手段とを備える信号処理装置であって、
前記符号化手段は複数の異なる符号化レートによる符号化処理を選択的に実施し、
前記雑音抑圧手段は、音声信号に対して雑音成分の抑圧を行うもので、パラメータの設定に応じて雑音成分の抑圧特性を可変可能なノイズサプレス部と、前記符号化手段で選択的に実施される符号化処理に応じたパラメータを、前記ノイズサプレス部に設定するパラメータ設定手段とを備え、
前記符号化手段における前記複数の異なる符号化レートの数をR、前記雑音抑圧手段のノイズサプレス部に設定するパラメータセットの数をS(R,Sは共に正の整数)とした場合、RとSは、R≧S>1の関係にあることを特徴とする信号処理装置。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2010030699A JP2010158044A (ja) | 2010-02-15 | 2010-02-15 | 信号処理装置および信号処理方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2010030699A JP2010158044A (ja) | 2010-02-15 | 2010-02-15 | 信号処理装置および信号処理方法 |
Related Parent Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2000137181A Division JP2001318694A (ja) | 2000-05-10 | 2000-05-10 | 信号処理装置、信号処理方法および記録媒体 |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2010158044A true JP2010158044A (ja) | 2010-07-15 |
Family
ID=42575544
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2010030699A Pending JP2010158044A (ja) | 2010-02-15 | 2010-02-15 | 信号処理装置および信号処理方法 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2010158044A (ja) |
-
2010
- 2010-02-15 JP JP2010030699A patent/JP2010158044A/ja active Pending
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP2001318694A (ja) | 信号処理装置、信号処理方法および記録媒体 | |
JP6786679B2 (ja) | 複数のオーディオ信号の符号化 | |
KR101702281B1 (ko) | 음성 주파수 신호 처리 방법 및 장치 | |
US10218856B2 (en) | Voice signal processing method, related apparatus, and system | |
KR102551431B1 (ko) | 목표 샘플 발생 | |
EP3391371B1 (en) | Temporal offset estimation | |
WO2008104463A1 (en) | Split-band encoding and decoding of an audio signal | |
CN110024029B (zh) | 音频信号处理 | |
US20080059154A1 (en) | Encoding an audio signal | |
KR20200051609A (ko) | 시간 오프셋 추정 | |
JP5480226B2 (ja) | 信号処理装置および信号処理方法 | |
JP2010158044A (ja) | 信号処理装置および信号処理方法 | |
JP2010160496A (ja) | 信号処理装置および信号処理方法 | |
JP2009103974A (ja) | マスキングレベル算出装置、符号化装置、マスキングレベル算出方法およびマスキングレベル算出プログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20110602 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20110628 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20111101 |