JP2013054282A - 通信装置及び通信方法 - Google Patents

通信装置及び通信方法 Download PDF

Info

Publication number
JP2013054282A
JP2013054282A JP2011193867A JP2011193867A JP2013054282A JP 2013054282 A JP2013054282 A JP 2013054282A JP 2011193867 A JP2011193867 A JP 2011193867A JP 2011193867 A JP2011193867 A JP 2011193867A JP 2013054282 A JP2013054282 A JP 2013054282A
Authority
JP
Japan
Prior art keywords
encoder
communication
sound pressure
communication partner
bit rate
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
JP2011193867A
Other languages
English (en)
Inventor
Toshiyuki Morii
利幸 森井
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Panasonic Corp
Original Assignee
Panasonic Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Panasonic Corp filed Critical Panasonic Corp
Priority to JP2011193867A priority Critical patent/JP2013054282A/ja
Publication of JP2013054282A publication Critical patent/JP2013054282A/ja
Withdrawn legal-status Critical Current

Links

Images

Landscapes

  • Telephone Function (AREA)

Abstract

【課題】双方向通信における人間の特性を十分利用した高効率な双方向通信を実現することができる通信装置を提供すること。
【解決手段】通信装置100は、伝送路102から受信した符号を復号する復号器170と、復号された信号の音圧を計測し、計測した音圧に基づいて通信相手の状況を判定する音圧計測部180と、通信相手の状況と符号器との対応関係を記憶したテーブル121と、トーナルディテクタ110からの調性の有無と、音圧計測部180からの通話中か否かの判定結果とに基づいて、テーブル121を参照し、高遅延用符号器130及び低遅延用符号器140から、通信相手の状況に対応した符号器を選択するモードセレクタ120と、を備える。
【選択図】図2

Description

本発明は、音声/楽音を伝送する通信装置及び通信方法に係り、詳細には、双方向でリアルタイムに音声及び/又は音楽を伝送する通信装置及び通信方法に関する。
移動体通信においては伝送帯域の有効利用のために音声及び画像のディジタル情報の圧縮符号化が必須である。その中でも携帯電話で広く利用されている音声コーデック(符号化/復号化)技術に対する期待は大きく、圧縮率の高い従来の高効率符号化に加えて、更によりよい音質の要求が強まっている。また、公衆で使用されるために標準化が必須であり、それに伴う知財権の強さゆえに世界の各社で研究開発が盛んに行われている。
近年では、音声も音楽も符号化できるコーデックの標準化がITU−T(International Telecommunication Union−Telecommunication Standardization Sector)やMPEG(Moving Picture Experts Group)で検討されており、より効率的で高品質の音声及び音楽の伝送が求められている。
20年前に確立された音声の発声機構をモデル化してベクトル量子化を巧みに応用した基本方式「CELP(Code Excited Linear Prediction)」によって、音声符号化技術は大きく性能を向上させている。CELPは、ITU−T標準G.729、G.722.2、ETSI(European Telecommunications Standards Institute)標準AMR(Adaptive Multiple Rate Coding)、AMR−WB(Adaptive Multiple Rate −Wide Band)、3GPP(3rd Generation Partnership Project)2標準VMR−WB(Variable Multiple rate−Wide Band)などの国際規格をはじめ、多くの標準方式に採用されている。
CELPは、低遅延で音声信号を符号化するのに適したコーデック方式である。一方、最近では「より高品質に」というニーズに対応するために広帯域信号(16kbps)、超広帯域信号(32kbps)を符号化するコーデックが求められており、ITU−T、MPEG、3GPPなどで標準化が進んでいる。
また、音声信号だけでなく、楽音信号の符号化のニーズも高く、近年ITU−Tや3GPPで標準化されているものは、1つのコーデックで音声と音楽とのモードを備えている。また、ITU−T標準G.718のように各モードのコーデックがスケーラブル構成になっているものも実用に向けて検討が進んでいる。
図1は、従来のモードセレクタを取り入れたコーデックを説明する図である。
図1に示すように、符号化装置10は、モードセレクタ11と、符号器A12と、符号器B13と、スイッチ14,15と、を備える。
符号器A12と符号器B13とは、異なる特徴を持つ符号器である。
入力信号1は、まずモードセレクタ11に入力される。ここで、入力信号1は、音声信号、楽音信号、音声及び音楽を含む信号、のいずれであってもよい。
モードセレクタ11は、符号器A12と符号器B13とのどちらで符号化するのが適当であるかを選択する。モードセレクタ11は、選択結果に従ってスイッチ14,15を切り替え、いずれかの符号器で符号化を行い、得られた符号2を伝送する。この際、モードセレクタ11から得られるモード情報も併せて符号3として伝送する。
モードセレクタ11でのモード選択の根拠となるパラメータの例としては、フレームエネルギ、スペクトル毎のエネルギ、周期性、定常性、有声性/無声性、調性(Tonality)などが挙げられる。
符号器A12と符号器B13とについては、「CELPなどの時間軸符号化器と、FPC(factorial pulse coding)、AAC(Advanced Audio Coding)、AMR−WB+(Adaptive Multiple Rate−Wideband plus)などの変換符号化器」、又は、「CELPなどの低遅延符号化器と、FPC、AAC、AMR−WB+などの高遅延符号化器」、又は、「CELPなどの音声に適した符号器と、FPC、AAC、AMR−WB+などの音楽に適した符号器」、又は、「高ビットレートの符号器と、低ビットレートの符号器」、などが挙げられる。
上記従来例により、例えばITU−T G.718のように、符号器A12と、符号器B13として「音声に適した符号器と、音楽に適した符号器」を備える。モードセレクタ11は、入力信号の調性を求め、それがあらかじめ定められたしきい値未満の場合には音声であるとして音声に適した符号器を使用し、しきい値以上の場合には音楽であるとして音楽に適した符号器を使用する。これにより、より高品質な高効率的通信が可能になる。
しかし、この従来例は、送信側に入力される入力信号に対応して適応的に高品質又は高効率通信を実現するものではあるものの、双方向通信の特徴を利用するものではなく効率化は不十分であった。
特許文献1には、収集した通信環境情報に基づいてマルチモード通信を行う移動体通信システムが記載されている。特許文献1記載の移動体通信システムは、移動体通信を行う移動局に、通信環境情報を収集する通信環境情報収集部と、収集された通信環境情報により、当該通信環境に適合した通信モードを決定する通信モード決定部と、予め用意された2種以上の通信モードのうちから、いずれかの通信モードを選択して、移動局による通信を実行する送信部とを備える。
特許文献2には、受信側の使用環境を考慮して送信側の伝送ビットレートを制御することにより、所定の品質を維持しつつ効率的な音声信号/楽音信号の符号化を行うことができる通信装置が記載されている。特許文献2記載の通信装置は、受信側において自動車又は電車の走行音等が存在した場合、受信側においてそのような環境雑音を認識し、環境雑音によるマスキング効果を利用する。送信側は、音声信号/楽音信号を、人間の聴感に影響のない範囲で最小限の伝送ビットレートを用いて通信することが可能となる。これにより回線効率を大幅に向上させることができる。また、受信側の環境雑音に加え、送信側における環境雑音の情報を検知し、これを音声信号/楽音信号の符号化に利用することにより、さらに効率的な通信が可能となる。
特開平11−331936号公報 特開2005−241761号公報 特開平9−34497号公報
しかしながら、上記特許文献1,2記載の装置では、双方向音声通信において、「音楽は比較的長時間黙って聞く」あるいは「相手の話を聞く時は話ができない」といった双方向通信における人間の特性を十分利用していない。このため、双方向でリアルタイム音声通信を行う音声通信装置に適用した場合、効率化が不十分であった。
また、双方向通信における利用方法については、他の音声通信装置についても同様の課題がある。例えば、近年標準化が進んでいるG.718ではモードセレクタに応じたマルチモード符号化を行っており、送信側に入力される入力信号に対応して適応的に高品質/高効率通信を実現している。しかし、双方向通信の特徴を利用するものではなく効率化は不十分であった。
本発明の目的は、双方向通信における人間の特性を十分利用した高効率な双方向通信を実現することができる通信装置及び通信方法を提供することである。
本発明の通信装置は、双方向でリアルタイムに音声/音楽の通信を行う通信装置であって、入力信号を符号化する、互いに異なる複数の符号器と、通信相手の状況と符号器との対応関係を記憶したテーブルと、受信した符号を復号する復号器と、前記復号して得られた信号の音圧を計測し、計測した音圧に基づいて通信相手の状況を判定する音圧計測部と、前記音圧計測部の判定結果に基づいて前記テーブルを参照し、前記複数の符号器から、前記入力信号の符号化を実行させる一つの符号器を選択するモードセレクタと、を備える構成を採る。
本発明の通信方法は、互いに異なる複数の符号器を有する通信装置により、双方向でリアルタイムに音声/音楽の通信を行う通信方法であって、受信した符号を復号する復号ステップと、前記復号して得られた信号の音圧を計測し、計測した音圧に基づいて通信相手の状況を判定する判定ステップと、前記判定ステップの判定結果に基づいて、通信相手の状況と符号器との対応関係を記憶したテーブルを参照し、前記複数の符号器から、入力信号の符号化を実行させる一つの符号器を選択する選択ステップと、を有する。
本発明によれば、「音楽は比較的長時間黙って聞く」あるいは「相手の話を聞く時は話ができない」といった双方向通信における人間の特性を十分利用した高効率な双方向通信を実現することができる。
従来のモードセレクタを取り入れたコーデックを説明する図 本発明の実施の形態1に係る通信装置の構成を示す機能ブロック図 上記実施の形態1に係る通信装置の音圧計測部の構成を示す機能ブロック図 本発明の実施の形態2に係る通信装置の構成を示す機能ブロック図
以下、本発明の実施の形態について図面を参照して詳細に説明する。
(実施の形態1)
図2は、実施の形態1に係る通信装置の構成を示す機能ブロック図である。本実施の形態は、双方向で音声及び/又は音楽のリアルタイム通信を行う双方向リアルタイム通信装置に適用した例である。図2においては、音声/音楽の通信制御に直接関係しない機能ブロックの記載は省略されている。
図2に示すように、通信装置100は、トーナルディテクタ110と、音圧計測部180の判定結果及びテーブル121を参照して、符号器を選択するモードセレクタ120と、入力信号101を符号化する、互いに異なる高遅延用符号器130と低遅延用符号器140と、スイッチ150,160と、復号器170と、音圧計測部180と、を備える。ここで、入力信号101は、音声信号、楽音信号、音声及び音楽を含む信号、のいずれであってもよい。
トーナルディテクタ110は、入力信号101をスペクトルに変換した後、調性(Tonality)を分析する。トーナルディテクタ110は、調性が有る場合「1」を、調性が無い場合「0」をモードセレクタ120に出力する。分析アルゴリズムの例としては、ITU−T標準G.718の規格書に記載(6.7.2.2.4章「Tonal Stability」)されたアルゴリズムが挙げられる。この分析アルゴリズムの例には、スペクトルを入力して最後にTonalityの有無で「1」、「0」のフラグを送るアルゴリズムが詳細に記載されている。
モードセレクタ120は、通信相手の状況に対応して使用する符号器をあらかじめ記憶するテーブル121を有する。なお、テーブル121は、モードセレクタ120と別体で設けられていてもよい。
テーブル121は、通信相手の状況と符号器との対応関係を記憶する。テーブル121は、通信相手の状況、望まれている対応、及び使用する符号器を、〔表1〕に示すように一覧形式で記憶している。表1において、aはトーナルディテクタ110から得られる「調性の有無を示す値」を表し、bは音圧計測部180からの「通話中か否かを示す値」を表す。
Figure 2013054282
〔表1〕に示すように、通信相手の状況には、「黙って話を聞いている」「音声通話中に話している」「音楽送信中に黙って聞いている」「音楽送信中に話始めている」がある。このうち、通信相手の状況が「音楽送信中に黙って聞いている」場合の、望まれている対応は「高遅延音楽」であり、使用する符号器は「高遅延用符号器」である。
モードセレクタ120は、トーナルディテクタ110から得られる「調性の有無を示す値」であるaの値と、音圧計測部180の判定結果であるbの値とに基づいて、〔表1〕に示すテーブル121を参照して符号器のモードを選択する。具体的には、モードセレクタ120は、トーナルディテクタ110からの調性の有無を示す「1」又は「0」と、音圧計測部180からの「通話中か否かを示す値」である「1」又は「0」との組み合わせにより、使用する符号器を選択し、該当符号器を選択する切換信号をスイッチ150,160に出力する。また、モードセレクタ120は、どちらの符号器を使ったかというモード情報104を、符号器(高遅延用符号器130又は低遅延用符号器140)から得られる符号103と共に出力する。
高遅延用符号器130は、入力信号101を符号化し送信用コードを出力する。高遅延用符号器130は、遅延が大きく、音楽の符号化に適した符号器である。
低遅延用符号器140は、入力信号101を符号化し送信用コードを出力する。低遅延用符号器140は、遅延が小さく、音声の符号化に適した符号器である。
スイッチ150,160は、モードセレクタ120からの切換信号を受けて、符号器を高遅延用符号器130又は低遅延用符号器140に切換える。
復号器170は、伝送路102から受信した符号を復号して復号信号を出力する。
音圧計測部180は、復号器170により復号された信号の音圧を計測し、計測した音圧に基づいて通信相手の状況(通話中であるか否か)を判定する。音圧計測部180は、判定結果である「通話中か否かを示す値」「1」「0」をモードセレクタ120に出力する。
図3は、音圧計測部180の構成を示す機能ブロック図である。
図3に示すように、音圧計測部180は、有声/無声判定部181と、背景音測定部182と、音圧測定部183と、測定結果判定部184と、を備える。
有声/無声判定部181は、まず復号信号201に対してスペクトル分析を行う。スペクトル分析の方法としてはDCT(Discrete Cosine Transform)、FFT(Fast Fourier Transform)などの直交変換が挙げられる。どちらでも周波数毎のパワーが求められるのでそれを使用する。
次に、有声/無声判定部181は、そのフレームが有声であるか無声であるかを判定する。判定方法としては、さまざまな方法がこれまで開発されているが、最も単純なものとして、長期相関を計算し、相関値が大きく基本周期に当たるピッチ成分が連続している場合に「有声区間」と判断するという方法が挙げられる。
この際には、背景音測定部182内に格納されている背景音のスペクトルを用いて、これよりもパワーが明らかに大きい場合に有声であると判断するという判定も組み合わせると性能を更に向上することができる。また、上記判定を用いることが一般的である。本実施の形態では、有声/無声判定部181は、「有声区間」と判定されなかった区間を「無声区間」と判定する。有声/無声判定部181は、「無声区間」と判定された場合、背景音測定部182に無声区間のスペクトルを送る。また、有声/無声判定部181は、有声/無声に関わらず音圧測定部183に無声区間のスペクトルを出力する。
背景音測定部182は、内部に平均環境スペクトルを格納する格納部を持っており、有声/無声判定部181から得られた無声区間のスペクトルで、上記格納された平均環境スペクトルを更新する。
更新アルゴリズムとしては、特許文献3に記載のノイズ削減装置のノイズ推定部のアルゴリズムが挙げられる。本実施の形態で述べている平均環境スペクトルは、特許文献3に記載のノイズ削減装置におけるノイズスペクトルに対応する。
背景音測定部182は、更新した平均環境スペクトルを、背景音測定部182の前記内部の格納部に格納する。また、背景音測定部182は、更新したスペクトルを次のフレームで有声/無声判定部181に送る。また、背景音測定部182は、平均環境スペクトルの総和を求め、環境パワーとして測定結果判定部184へ送る。
音圧測定部183は、有声/無声判定部181から送られてきたスペクトルの総和を求めて、そのフレームの信号パワーとする。信号パワーは、通信相手が「話をしているかどうか」の尺度になる値であり、ある程度の長期に渡って観測する必要がある。そこで、音圧測定部183は、内部に信号パワーの履歴を格納しておき、前記信号パワーで格納領域を更新する。アルゴリズムは、次式(1)で示される。
=P i−1 i=T−1,T−2,…,2,1
=p …(1)
但し p:信号パワー、P:信号パワーの履歴、T:観測する時間
音圧測定部183は、信号パワーの平均を求めて平均信号パワーを求める。計算法は、次式(2)に示される。
Figure 2013054282
但し P AV:平均信号パワー
音圧測定部183は、式(2)で求めた平均信号パワーを測定結果判定部184に送る。
測定結果判定部184は、背景音測定部182から得られた環境パワーと、音圧測定部183から得られた平均信号パワーとを用いて、通信相手が通話中であるかどうかを判定する。環境パワーは「通話していない場合の音圧」を示しているので、この値よりも平均信号パワーが十分大きい時には「通話中(1)」、そうでない場合には「黙っている状態(0)」ということで状態を1ビットで表し、測定結果202としてモードセレクタ120に出力する。判定アルゴリズムは、次式(3)に示される。
Figure 2013054282
以下、上述のように構成された通信装置100の動作について説明する。
図2に示すように、まず、伝送路102を経由して通信相手から送られてきた符号が復号器170に入力される。復号器170は、入力された符号を復号し、復号信号(例えば復号音声)を音圧計測部180に出力する。
音圧計測部180は、復号された信号の音圧を計測し、計測した音圧に基づいて通信相手の状況を判定し、判定結果をモードセレクタ120に出力する。音圧計測部180は、判定結果として、通話中の場合「1」、相手が黙っている場合「0」を出力する。
一方、入力信号101は、スイッチ150を介して高遅延用符号器130又は低遅延用符号器140に入力される。また、入力信号101はトーナルディテクタ110にも入力される。
トーナルディテクタ110は、入力信号101をスペクトルに変換した後、調性を分析し、調性が有る場合「1」を、調性が無い場合「0」をモードセレクタ120に出力する。
モードセレクタ120は、トーナルディテクタ110からの調性の有無を示す「1」又は「0」と、音圧計測部180からの「通話中か否かを示す値」である「1」又は「0」とに基づいて、テーブル121の〔表1〕を参照し、符号器を選択する切換信号をスイッチ150,160に出力する。また、モードセレクタ120は、どちらの符号器を使ったかというモード情報104を、符号器(高遅延用符号器130又は低遅延用符号器140)から得られる符号103と共に出力する。
スイッチ150,160は、モードセレクタ120からの切換信号を受けて、符号器を高遅延用符号器130又は低遅延用符号器140に切換える。
本実施の形態では、通信相手の状況に対応して、遅延が大きく音楽の符号化に適した高遅延用符号器130か、遅延が小さく音声の符号化に適した低遅延用符号器140のいずれかが選択される。
以上詳細に説明したように、通信装置100は、双方向で音声/音楽のリアルタイム通信を行う通信装置であって、入力信号101から調性を分析するトーナルディテクタ110と、入力信号101を符号化する遅延が大きく音楽の符号化に適した高遅延用符号器130と、遅延が小さく音声の符号化に適した低遅延用符号器140と、伝送路102から受信した符号を復号する復号器170と、復号された信号の音圧を計測し、計測した音圧に基づいて通信相手の状況を判定する音圧計測部180と、通信相手の状況と符号器との対応関係を記憶したテーブル121と、トーナルディテクタ110からの調性の有無及び音圧計測部180からの通話中か否かの判定結果に基づいて、テーブル121を参照し、高遅延用符号器130及び低遅延用符号器140から通信相手の状況に対応した符号器を選択するモードセレクタ120と、を備える。モードセレクタ120は、トーナルディテクタ110から「調性が有」を受け、かつ音圧計測部180から「通話中でない」との判定結果を受けた場合(すなわち、(a,b)=(1,0)の場合)、高遅延用符号器130を選択し、それ以外は低遅延用符号器140を選択する。
この構成により、通信相手の状況に対応した適切な符号器を使用することができ、相手側あるいは送信側の状況に適切な符号器で符号化することによって高効率な双方向音声を実現することができる。その結果、「音楽は比較的長時間黙って聞く」あるいは「相手の話を聞く時は話ができない」といった双方向通信における人間の特性を十分利用した高効率な双方向通信を実現することができる。
本実施の形態では、音楽は高遅延でより高品質符号化でき、通話は低遅延で通話環境を良くすることができ、双方向通信の品質をより良くすることができる。
(実施の形態2)
図4は、実施の形態2に係る通信装置の構成を示す機能ブロック図である。本実施の形態も実施の形態1と同様に、双方向で音声及び/又は音楽のリアルタイム通信を行う双方向リアルタイム通信装置に適用した例を示す。図4においても図2と同様に、音声/音楽の通信制御に直接関係しない機能ブロックの記載は省略されている。本実施の形態の説明に当り、図2と同一構成部分には同一番号を付して重複箇所の説明を省略する。
本実施の形態は、符号器として高ビットレート符号器230と低ビットレート符号器240とを用いた場合の例である。
本実施の形態の通信装置200の基本動作は、実施の形態1とほぼ同様であるので、同じ動作については説明を省略する。
図4に示すように、通信装置200は、音圧計測部180の判定結果及びテーブル221を参照して、符号器を選択するモードセレクタ220と、入力信号101を符号化する、互いに異なる高ビットレート符号器230と低ビットレート符号器240と、スイッチ250,260と、復号器170と、音圧計測部180と、を備える。ここで、入力信号101は、音声信号、楽音信号、音声及び音楽を含む信号、のいずれであってもよい。
モードセレクタ220は、通信相手の状況に対応して使用する符号器をあらかじめ記憶するテーブル221を有する。なお、テーブル221は、モードセレクタ220と別体で設けられていてもよい。
テーブル221は、通信相手の状況と符号器との対応関係を記憶する。テーブル221は、通信相手の状況、望まれている対応、及び使用する符号器を、〔表2〕に示すように一覧形式で記憶している。表2において、bは音圧計測部180からの「通話中か否かを示す値」を表す。
Figure 2013054282
〔表2〕に示すように、通信相手の状況には、「黙って話を聞いている」「話している(こちらが聞いている)」がある。このうち、通信相手の状況が「黙って話を聞いている」場合の、望まれている対応は「高品質音声」であり、使用する符号器は「高ビットレート符号器」である。
モードセレクタ220は、音圧計測部180の判定結果であるbの値に基づいて、〔表2〕に示すテーブル221を参照して符号器のモードを選択する。具体的には、モードセレクタ220は、音圧計測部180からの「通話中か否かを示す値」である「1」又は「0」により、使用する符号器を選択し、該当符号器を選択する切換信号をスイッチ250,260に出力する。また、モードセレクタ220は、どちらの符号器を使ったかというモード情報204を、符号器(高ビットレート符号器230又は低ビットレート符号器240)から得られる符号203と共に出力する。
高ビットレート符号器230は、入力信号101を符号化し送信用コードを出力する。高ビットレート符号器230は、高品質であるが情報量(ビットレート)が多い符号化に適した符号器である。
低ビットレート符号器240は、入力信号101を符号化し送信用コードを出力する。低ビットレート符号器240は、低品質であるが情報量が少ない符号器である。
本実施の形態では「高品質だが情報量(ビットレート)が多い」高ビットレート符号器230と、「低品質だが情報量が少ない」低ビットレート符号器240のどちらかを選択する。
本実施の形態では、通信相手の状況に対応して、高品質であるが情報量(ビットレート)が多い符号化に適した高ビットレート符号器230か、低品質であるが情報量(ビットレート)が少ない符号化に適した低ビットレート符号器240のいずれかが選択される。
このように、本実施の形態によれば、通信装置200は、音圧計測部180と、通信相手の状況と符号器との対応関係を記憶したテーブル221と、音圧計測部180からの通話中か否かの判定結果に基づいて、テーブル221を参照し、高ビットレート符号器230及び低ビットレート符号器240から、通信相手の状況に対応した符号器を選択するモードセレクタ220と、を備える。モードセレクタ220は、音圧計測部180から「通信相手が通話中でない」との判定結果を受けた場合、高ビットレート符号器230を選択し、それ以外は低ビットレート符号器240を選択する。
この構成により、通信相手の状況に対応した適切な符号器を使用することができ、「音楽は比較的長時間黙って聞く」あるいは「相手の話を聞く時は話ができない」といった双方向通信における人間の特性を十分利用した高効率な双方向通信を実現することができる。
具体的には、本実施の形態では、平均ビットレートを下げ、情報量を節約する高効率な音声/音楽の通信を実現することができる。
例えば、相手が聞いている場合にはより高品質で符号化でき、相手が話をしている場合は、自分は主に聞いているので低品質でも低ビットレートで伝送することができ、双方向通信の伝送情報量の効率をより良くすることができる。
以上、実施の形態について説明した。
以上の説明は本発明の好適な実施の形態の例証であり、本発明の範囲はこれに限定されることはない。
上記各実施の形態では、「高遅延用符号器と低遅延用符号器」「高ビットレート符号器と低ビットレート符号器」の2つの例を挙げたが、そのほかにも様々な符号器を扱うことができる。例えば、「時間軸符号器と変換符号器」は、実施の形態1と同様に音声に適した符号器と音楽に適した符号器とであるので、実施の形態1と同様に使用することができる。通信相手の状況により切り替えることで効果が得られることは多い。
また、上記各実施の形態では、符号器は2つを切り替えたが、これは3つ以上でも有効である。
また、音圧計測部180及び/又はトーナルディテクタ110の出力を、1ビットではなく、もっと細かく段階的にすれば、モードセレクタ120,220で、もっと段階的な符号器の選択ができる。例えば、実施の形態2では、ビットレートを4つ用意して、相手の音圧の度合いに応じたビットレートを設定することができる。
上記各実施の形態では、通信装置、という名称を用いたが、これは説明の便宜上であり、装置は音声通信装置、移動体通信システム等であってもよい。また、テーブルは、記憶部と呼称してもよく、どのような形でどこに設けられていてもよい。
さらに、上記各通信装置を構成する各構成部、例えば復号器の種類、無線伝搬環境などは前述した実施の形態に限られない。
また、上記各実施の形態では、本発明をハードウェアで構成する場合を例にとって説明したが、本発明はハードウェアとの連携においてソフトウェアでも実現することも可能である。例えば、上記各実施の形態において用いたモードセレクタ及びスイッチは、ソフトウェアで実現する場合には、例えばIF文による分岐を用いたプログラムとして実現することができる。
また、上記各実施の形態の説明に用いた各機能ブロックは、典型的には集積回路であるLSIとして実現される。これらは個別に1チップ化されてもよいし、一部又は全てを含むように1チップ化されてもよい。ここでは、LSIとしたが、集積度の違いにより、IC、システムLSI、スーパーLSI、ウルトラLSIと呼称されることもある。
また、集積回路化の手法はLSIに限るものではなく、専用回路又は汎用プロセッサで実現してもよい。LSI製造後に、プログラムすることが可能なFPGA(Field Programmable Gate Array)、又は、LSI内部の回路セルの接続又は設定を再構成可能なリコンフィギュラブルプロセッサを利用してもよい。
さらには、半導体技術の進歩又は派生する別技術によりLSIに置き換わる集積回路化の技術が登場すれば、当然、その技術を用いて機能ブロックの集積化を行ってもよい。例えば、バイオ技術の適用等が可能である。
本発明の通信装置は、双方向でリアルタイムに音声/楽音を伝送する通信装置等に有用である。また、移動通信システムの通信端末装置に用いて好適である。
100,200 通信装置
110 トーナルディテクタ
120,220 モードセレクタ
121,221 テーブル
130 高遅延用符号器
140 低遅延用符号器
150,160,250,260 スイッチ
170 復号器
180 音圧計測部
181 有声/無声判定部
182 背景音測定部
183 音圧測定部
184 測定結果判定部
230 高ビットレート符号器
240 低ビットレート符号器

Claims (5)

  1. 双方向でリアルタイムに音声/音楽の通信を行う通信装置であって、
    入力信号を符号化する、互いに異なる複数の符号器と、
    通信相手の状況と符号器との対応関係を記憶したテーブルと、
    受信した符号を復号する復号器と、
    前記復号して得られた信号の音圧を計測し、計測した音圧に基づいて通信相手の状況を判定する音圧計測部と、
    前記音圧計測部の判定結果に基づいて前記テーブルを参照し、前記複数の符号器から、前記入力信号の符号化を実行させる一つの符号器を選択するモードセレクタと、
    を備える通信装置。
  2. 前記音圧計測部は、
    有声区間と無声区間とを判定する有声/無声判定部と、
    前記有声/無声判定部から得られた無声区間のスペクトルから背景音を環境パワーとして測定する背景音測定部と、
    前記有声/無声判定部のスペクトルの総和から信号パワーを求め、該信号パワーの履歴を基に平均信号パワーを測定する音圧測定部と、
    前記背景音測定部の前記環境パワーと前記音圧測定部からの前記平均信号パワーとに基づいて、通信相手が通話中であるか否かを判定する測定結果判定部と、
    を備える請求項1記載の通信装置。
  3. 前記入力信号から調性を分析し、調性の有無を出力するトーナルディテクタを更に備え、
    前記複数の符号器は、音楽に適した符号化を行う高遅延用符号器、及び、音声通話に適した符号化を行う低遅延用符号器を有し、
    前記モードセレクタは、
    前記入力信号に代えて前記トーナルディテクタからの分析結果を入力し、前記分析結果が「調性が有り」で、かつ、前記音圧計測部からの判定結果が「通話中でない」である場合、前記高遅延用符号器を選択し、それ以外は前記低遅延用符号器を選択する、
    請求項1記載の通信装置。
  4. 前記複数の符号器は、高ビットレート符号器、及び、低ビットレート符号器を有し、
    前記モードセレクタは、
    前記音圧計測部からの判定結果が「通信相手が通話中でない」である場合、前記高ビットレート符号器を選択し、それ以外は前記低ビットレート符号器を選択する、
    請求項1記載の通信装置。
  5. 互いに異なる複数の符号器を有する通信装置により、双方向でリアルタイムに音声/音楽の通信を行う通信方法であって、
    受信した符号を復号する復号ステップと、
    前記復号して得られた信号の音圧を計測し、計測した音圧に基づいて通信相手の状況を判定する判定ステップと、
    前記判定ステップの判定結果に基づいて、通信相手の状況と符号器との対応関係を記憶したテーブルを参照し、前記複数の符号器から、入力信号の符号化を実行させる一つの符号器を選択する選択ステップと、
    を有する通信方法。
JP2011193867A 2011-09-06 2011-09-06 通信装置及び通信方法 Withdrawn JP2013054282A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2011193867A JP2013054282A (ja) 2011-09-06 2011-09-06 通信装置及び通信方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2011193867A JP2013054282A (ja) 2011-09-06 2011-09-06 通信装置及び通信方法

Publications (1)

Publication Number Publication Date
JP2013054282A true JP2013054282A (ja) 2013-03-21

Family

ID=48131299

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2011193867A Withdrawn JP2013054282A (ja) 2011-09-06 2011-09-06 通信装置及び通信方法

Country Status (1)

Country Link
JP (1) JP2013054282A (ja)

Similar Documents

Publication Publication Date Title
RU2765565C2 (ru) Способ и система для кодирования стереофонического звукового сигнала с использованием параметров кодирования первичного канала для кодирования вторичного канала
TWI499247B (zh) 用於關鍵性臨限控制之系統、方法、裝置及電腦可讀媒體
JP5608660B2 (ja) エネルギ保存型マルチチャネルオーディオ符号化
KR101668401B1 (ko) 오디오 신호를 인코딩하기 위한 방법 및 장치
CN101627426B (zh) 用于控制稳态背景噪声的平滑的方法和设备
JP2017203996A (ja) 線形予測係数の量子化装置、サウンド符号化装置、線形予測係数の逆量子化装置、サウンド復号化装置及び電子機器
US20140052439A1 (en) Method and apparatus for polyphonic audio signal prediction in coding and networking systems
US20110320194A1 (en) Decoder with embedded silence and background noise compression
US20100250244A1 (en) Encoder and decoder
RU2617926C1 (ru) Способ, устройство и система для обработки аудиоданных
US9830920B2 (en) Method and apparatus for polyphonic audio signal prediction in coding and networking systems
JPWO2012081166A1 (ja) 符号化装置、復号装置およびそれらの方法
CA2677774A1 (en) Audio signal encoding
KR20170013405A (ko) 음성 주파수 신호 처리 방법 및 장치
WO2008104463A1 (en) Split-band encoding and decoding of an audio signal
JP2010530084A (ja) ピッチ調整コーディング及び非ピッチ調整コーディングを使用する信号符号化
JPWO2012169133A1 (ja) 音声符号化装置、音声復号装置、音声符号化方法及び音声復号方法
KR101100280B1 (ko) 오디오 양자화
AU2015295624B2 (en) Method for estimating noise in an audio signal, noise estimator, audio encoder, audio decoder, and system for transmitting audio signals
EP2057626B1 (en) Encoding an audio signal
Hiwasaki et al. A G. 711 embedded wideband speech coding for VoIP conferences
UA114233C2 (uk) Системи та способи для визначення набору коефіцієнтів інтерполяції
JP4437011B2 (ja) 音声符号化装置
JP2013054282A (ja) 通信装置及び通信方法
WO2014010175A1 (ja) 符号化装置及び符号化方法

Legal Events

Date Code Title Description
A300 Withdrawal of application because of no request for examination

Free format text: JAPANESE INTERMEDIATE CODE: A300

Effective date: 20141202