JP2004109244A - 音声間欠通信方式 - Google Patents
音声間欠通信方式 Download PDFInfo
- Publication number
- JP2004109244A JP2004109244A JP2002268938A JP2002268938A JP2004109244A JP 2004109244 A JP2004109244 A JP 2004109244A JP 2002268938 A JP2002268938 A JP 2002268938A JP 2002268938 A JP2002268938 A JP 2002268938A JP 2004109244 A JP2004109244 A JP 2004109244A
- Authority
- JP
- Japan
- Prior art keywords
- voice
- information
- section
- noise
- voiced
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Withdrawn
Links
Images
Landscapes
- Time-Division Multiplex Systems (AREA)
- Transmission Systems Not Characterized By The Medium Used For Transmission (AREA)
Abstract
【課題】音声間欠通信方式において、受信側で無音区間音声情報となる雑音情報の伝送を不要とし、伝送効率が低減することを解決するとともに、受話者が違和感を感ずることがない音声通信を提供することを目的とする。
【解決手段】音声間欠通信方式において、有音区間では有音区間音声情報を送信するが、無音区間では、送信側からは無音区間音声信号を送信することなく、受信した有音区間音声情報、あるいは対向局に送信する自局の音声信号より受信側で雑音情報を抽出し、無音区間音声信号を生成する。
【選択図】 図1
【解決手段】音声間欠通信方式において、有音区間では有音区間音声情報を送信するが、無音区間では、送信側からは無音区間音声信号を送信することなく、受信した有音区間音声情報、あるいは対向局に送信する自局の音声信号より受信側で雑音情報を抽出し、無音区間音声信号を生成する。
【選択図】 図1
Description
【0001】
【発明の属する技術分野】
本発明は、音声信号をある一定時間間隔毎に有音であるか、無音であるか判定し、無音区間では無音区間音声情報を有音区間音声情報より圧縮して伝送する音声間欠通信方式に係り、特に、音声無音時には音声情報の送信を停止して音声情報の伝送効率を向上させると共に受話者に違和感のない音声間欠通信方式に関する。
【0002】
【従来の技術】
音声間欠通信方式は、通話の相手が話をしている時間、あるいは通話がとぎれているポーズ時間等送信する通話が無いことを利用して無音区間音声情報を有音区間音声情報より圧縮して送信する音声通信方式である。例えば、移動通信システムでは端末装置の消費電力の低減を図る目的で、あるいはVoIPシステム(Voice over IP System)では信号伝送の伝送効率を高める目的で用いられている。
【0003】
従来の音声間欠通信方式では送信部において、フレーム区間内に音声信号があるかないかを判定し、有音区間と判定された場合はシステムの符号化方式に則って符号化し、有音区間音声情報として送出する。一方、無音区間と判定した時は、入力音声信号の雑音情報(フレーム内の雑音電力、ピッチ相関等)を算出し、この雑音情報を符号化し、無音区間音声情報として送出する。あるいは、更に伝送効率を高める方式として、有音区間であるか、無音区間であるかの識別情報を送り、無音区間では受信側で雑音を生成する方式が採用される。あるいは、特許文献1では送信側で有音・無音の検出を行い、無音から有音、有音から無音への切り替え時に、その1フレーム前に予告信号を送出する。受信側では、その予告信号を受信し、有音処理、無音処理の切り替えを行う方式が開示されている。
【0004】
又、受信側での無音区間音声情報となる雑音の生成に関し、特許文献2では無音区間での受信側での聴感上の不自然さをなくす復号化装置として、送信されてきた無音区間の長さと平均雑音レベルに関する情報から送信側雑音と同一の雑音レベルを無音区間に挿入する方式が開示されている。
【0005】
【特許文献1】特開平6−97898号公報(第2ページ、図2)
【0006】
【特許文献2】特開昭60−107933号公報(第2ページ、第1図)
【0007】
【発明が解決しようとする課題】
しかしながら、従来の音声間欠通信方式では、受信側で無音区間音声情報として雑音を生成するために(1)雑音情報を符号化して送信する(2)有音・無音識別信号を送信する(3)有音・無音の切り替え予告信号を送信する等の方法で伝送するため伝送路の伝送効率を低減させてしまう問題があった。また、有音区間から無音区間に切り替わった時にも受話者にとり、通話に連続性があり、違和感のない雑音を生成することは難しい面があった。
【0008】
本発明は、受信側で無音区間音声情報となる雑音情報の伝送を不要とし、伝送効率が低減することを解決するとともに、受話者が違和感を感ずることがない音声通信を提供することを目的とする。尚、以降で表現する快適雑音とは復号化音声信号に連続性があり、受話者にとって違和感のない雑音を意味する。
【0009】
【課題を解決するための手段】
上記目的を達成する本発明は以下の通りである。
本第1の発明は、音声有音時と音声無音時とでは異なる規則で符号化及び復号化を行う音声間欠通信方式において、送信側で、音声有音時には有音区間音声情報を送信し、音声無音時には無音区間音声情報の送信を停止し、受信側で有音区間音声情報を受信した時には該有音区間音声情報を復号化し、情報を受信しなかった時には受信した有音区間音声情報より雑音情報を抽出し、抽出した該雑音情報より無音区間音声情報を生成して復号化する。
【0010】
このように構成された装置の構成により、有音区間では受信した有音区間音声情報を、システムの音声符号復号化方式に則って復号化することにより、送信された元の音声信号を再生する。一方、無音区間においては、受信した有音区間音声情報に含まれる有音区間から無音区間への切り替え時のガード時間の雑音、あるいは通話のとぎれのポーズ時間の雑音等から雑音情報を抽出し、雑音生成部で快適雑音を無音区間音声情報として生成することにより有音区間の音声信号と連続性があり、受話者にとって違和感のない元の音声信号を再生できる。
【0011】
本第2の発明は、音声有音時と音声無音時とでは異なる規則で符号化及び復号化を行う音声間欠通信方式において、送信側で、音声有音時には有音区間音声情報を送信し、音声無音時には無音区間音声情報の送信を停止し、受信側で有音区間音声情報を受信した時には該有音区間音声情報を復号化し、情報を受信しなかった時には対向局に送信する自局の音声信号より雑音情報を抽出し、抽出した該雑音情報より無音区間音声情報を生成して復号化する。
【0012】
このように構成された装置の構成により、有音区間では受信した有音区間音声情報を、システムの音声符号復号化方式に則って復号化することにより、送信された元の音声信号を再生する。一方、無音区間においては、対向局に送信する自局の音声信号に含まれる雑音情報から雑音情報を抽出し、雑音生成部で快適雑音を無音区間音声情報として生成することにより有音区間の音声信号と連続性があり、受話者にとって違和感のない元の音声信号を再生できる。
【0013】
本第3の発明は、音声有音時と音声無音時とでは異なる規則で符号化及び復号化を行う音声間欠通信方式において、送信側で、音声有音時には有音区間音声情報を送信し、音声無音時には無音区間音声情報の送信を停止し、受信側で有音区間音声情報を受信した時には該有音区間音声情報を復号化し、情報を受信しなかった時には受信した有音声区間音声情報及び対向局に送信する自局の音声信号より雑音情報を抽出し、抽出した該雑音情報より無音区間音声情報を生成して復号化する。
【0014】
このように構成された装置の構成により、有音区間では受信した有音区間音声情報を、システムの音声符号復号化方式に則って復号化することにより、送信された元の音声信号を再生する。一方、無音区間においては、受信した有音区間音声情報に含まれる有音区間から無音区間への切り替え時のガード時間の雑音、あるいは通話のとぎれのポーズ時間の雑音等からの雑音情報及び対向局に送信する自局の音声信号に含まれる雑音情報から雑音情報を抽出し、雑音生成部で快適雑音を無音区間音声情報として生成することにより有音区間の音声信号と連続性があり、受話者にとって違和感のない元の音声信号を再生できる。
【0015】
【発明の実施の形態】
詳細の説明の前に、LPC分析及び無音区間情報を伝送せずに受信側で無音区間であることを識別する方法についての説明を行う。
先ず、LPC分析について説明する。音声信号の符号復号化方式として、線形予測符号化方式LPC方式が知られている。LPC方式は一定時間間隔(フレーム区間)の音声信号を分析して、下記で示すLPC分析情報を算出できることが知られている。ここで、jはある時点のフレーム番号を示す。
1)LPC係数情報
LPC係数は音声信号を音源に対するフィルタの応答結果と見なした場合の、フィルタの係数である。以下ではL(j、i)(i=1〜M)で示す。ここで、MはLPC分析の予測次数を示す。
2)電力情報
フレーム内の音声信号の電力である。以下ではE(j)で示す。
3)ピッチ情報
ピッチは音声信号の有する基本の周期である。有音の場合は基本周期情報の他倍周期のピッチ情報が得られ、これよりピッチ相関値が算出できる。一方、無音の場合、即ち雑音の場合には基本的にはピッチはランダムであり、ピッチ相関が無いのでピッチ相関値は有音に比較して小さくなる。以下ではピッチ相関値をP(j)で示す。
【0016】
又、音声通信の場合、無音時は背景雑音であるから電力E(j)は有音時に比較して小さくなる。このE(j)、P(j)の値により、フレーム区間の音声信号が有音であるか、無音の雑音であるかを判定することができる。
次に無音区間音声情報を送信側で送出しない方式を採用する本発明での無音区間であることの検出を行う方法を説明する。音声信号はフレーム単位で処理される。無音区間の識別は、この1フレーム時間を受信側でカウントすることにより行う。無音区間識別部でカウンタを備え、有音区間のフレーム始まりの時点よりこの1フレーム時間をカウントする。1フレーム時間後、有音区間音声情報が無い場合、無音区間として、無音区間識別情報を出力する。更に、カウンタはリセットされると同時に次の1フレーム時間をカウントし、有音区間音声情報を認識するまで無音区間識別情報を出力する。このようにして無音区間であることを認識する。
【0017】
本第1の発明の実施形態システム構成図(片対向)を図1に示す。
送信部20は入力音声信号1とインタフェースし、音声信号のフレーム処理を行う音声IF部21、音声信号をシステムの音声符号化方式に則ってフレーム単位で符号化を行う音声符号化部22、フレーム単位で音声信号が有音区間であるか無音区間であるかを有音区間から無音区間へのガード時間を含めて判定する音声検出部23及びフレーム信号及び符号化された有音区間音声情報を多重し、伝送路に適した形式に変換し、伝送路とのインタフェースを行う多重化及び送信回線IF部24で構成する。
【0018】
一方、受信部40は伝送路とのインタフェースをとって受信したフレームから有音区間音声情報を分離する受信回線IF及び多重分離部41、システムの音声符号化方式に則って受信した音声信号の復号化を行う音声復号化部42、前述のLPC分析を行って雑音情報を抽出する雑音情報抽出部44、抽出した雑音情報より快適雑音を生成する雑音生成部45、受信フレームが無音区間であるか否かを識別する無音区間識別部46、有音区間の音声複合化信号と無音区間音声情報として生成された雑音情報とを出力音声信号として結合する結合部43で構成する。
【0019】
図1の構成において、入力音声信号1は音声符号化部22で、例えば20ミリ秒単位のフレーム単位で符号化する共に、音声検出部23でフレーム単位での有音区間、無音区間の判定を行う。有音区間の場合は多重化及び送信回線IF部24を経由して有音区間音声情報として伝送路に送出する。一方無音区間の場合は、本発明では、無音区間音声情報は送信しない。受信部40では伝送路30からの信号3を受信回線IF及び多重分離部41で受け、有音区間音声情報は音声復号化部42で復号化し、結合部43を経由して出力音声信号4として出力する。
【0020】
一方、無音区間識別部46で無音区間と識別された場合は、雑音情報抽出部44が受信した有音声区間音声情報より抽出した雑音情報より雑音生成部45が該雑音情報から快適雑音を生成し、結合部43を経て当該フレームの無音区間音声情報となり出力音声信号4として出力する。
雑音情報抽出部44で行うLPC分析は、例えば、良く知られているディジタル信号処理(DSP:Degital Signal Processing)によりDSPプロセッサを用いて、LPC係数L(j、i)(j:フレーム番号、i=1〜M、MはLPC予測次数を表す)、ピッチ情報P(j)、フレーム電力E(j)を算出する。このLPC分析情報を使用して図6に示す手順で雑音情報を抽出する。尚、Lave(j、i)(i=1〜M)、Eave(j)は各々あるフレーム時点でのフレーム電力E(j)、LPC予測係数L(j、i)(i=1〜M)の平均値を示し、P0は該当フレームが有音区間、あるいは無音区間の判定を行うピッチ相関値の閾値を示す。これらの情報は順次述べる本第1の発明、本第2の発明、本第3の発明の説明において同一の内容を表すものとする。
【0021】
次に図6に示す本第1、2の発明の実施形態の雑音情報抽出フローチャートにより雑音情報抽出のフローを説明する。
S1:音声通信の開始としてフレームカウンタを初期化する。(j=1)
S2:有音区間フレームである、当該フレームの音声信号よりL(j、i)(i=1〜M)、E(j)、P(j)、を得る。
S3:フレームカウンタをチェックし、最初のフレーム(j=1)の場合は、S4に処理を進め、それ以外の場合にはS5に処理を進める。
S4:Lave(j、i)(i=1〜M)、Eave(j)の初期値である
Lave(0、i)(i=1〜M)、Eave(0)として
最初のフレームのL(1、i)(i=1〜M)、E(1)を用いる。
S5:ピッチ相関P(j)を閾値P0と比較し、閾値より小さい場合は、雑音情報がある音声情報としてS6に処理を進め、それ以外の場合はS7に処理を進める。尚、重み付け係数α、β(0≦α、β≦ 1)は予めシステムの状態に応じて容易に設定することができる。
S6:当該フレームの物理量L(j、i)(i=1〜M)、E(j)を用いて、雑音情報Lave(j、i)(i=1〜M)、Eave(j)を更新する。
S7:雑音情報Lave(j、i)(i=1〜M)、Eave(j)を雑音情報生成部に出力する。
S8:次フレームの処理のために、フレームカウンタを1増加させる。
S9:次フレームをチェックする。次フレームがある場合には、S2に処理を進め、次フレームがない場合(終話の場合)は処理を終了させる。
【0022】
以上述べた手順により、図4に示す雑音生成部の入力となる雑音情報Lave(j、i)(i=1〜M)、Eave(j)を得る。
図4に本発明の実施形態の雑音生成部構成図を示す。LPC合成は音声振幅の大きさに応じた振幅の音源をLPC合成フィルタに入力し、LPC合成フィルタの係数であるLPC係数を入力音源と乗算することにより出力音声信号を得ることができる。音源としては元の音声信号のピッチ間隔に対応した音源を使う。この場合は背景雑音の再生であり、背景雑音のピッチはランダムであるから、音源としてはランダムなピッチを有する白色雑音を音源として使う。この白色雑音に電力E(j)で決まる振幅を乗算し、合成フィルタに入力し、Lave(j、i)(i=1〜M)をフィルタ係数として乗算することにより快適雑音を得る。尚、これらの演算は前述のDSP処理により、LPC分析を行うDSPプロセッサをタイムシェァリングで使用して実現することができる。
【0023】
図2に本第2の発明の実施形態システム構成図を示す。
伝送装置A50、伝送装置B51は各々送信部201、受信部401、送信部202、受信部402で構成する。図1で示した送信部20、受信部40と異なる部分についての説明を行う。受信部402の雑音情報抽出部44に入力する音声信号は対向局に送信する自局の送信部202からの音声信号11である。該音声信号11に含まれる雑音を雑音情報抽出部44で抽出し、雑音情報Lave(j、i)(i=1〜M)、Eave(j)を得、雑音生成部45で無音区間音声情報である雑音を生成する。該雑音は受話者の自局、即ち、自己の背景雑音である。通常、音声通信では電話機の送話部と受話部の間には側音回路が設けられており、送話者には自分の音声が側音回路を通じて周り込む。これより生成した雑音は自局の背景雑音であるが、側音回路を通じての音声信号に含まれる背景雑音でもあり快適雑音となり加算部43を経由して無音区間の出力音声信号4となる。雑音情報Lave(j、i)(i=1〜M)、Eave(j)の抽出及び快適雑音の生成方法は本第1の発明の処理方法と同一である。
【0024】
図3に本第3の発明の実施形態システム構成図を示す。伝送装置A50、伝送装置B51は各々送信部201、受信部401、送信部202、受信部402で構成する。図1、図2で示した送信部20、受信部40、送信部202、受信部402と異なる部分の説明を行う。受信部402の雑音情報抽出部44に入力する音声信号10は受信部402で受信し、復号化した有音区間音声信号10及び対向局に送信する自局の送信部202からの音声信号11である。雑音情報抽出部44では音声信号10、音声信号11の両信号から雑音情報Lave(j、i)(i=1〜M)、Eave(j)を抽出する。図5に本第3の発明の実施形態雑音情報抽出部構成図を示す。実施に当たっては前述のDSP処理により、同一のDSPプロセッサでタイムシェァリング処理により雑音情報Lave(j、i)(i=1〜M)、Eave(j)を算出することができる。この雑音情報より雑音生成部45で雑音を生成する。本第1、3の発明の実施形態で説明したようにこの雑音は快適雑音となり無音区間の出力音声信号4となる。
【0025】
次に本第3の発明における、これら雑音情報Lave(j、i)(i=1〜M)、Eave(j)を得る手順について図7を用いて説明する。
S21:音声通信の開始時フレームカウンタを初期化する。(j=1)
S22:当該フレームの音声信号1よりL(j、i)(i=1〜M)、E(j)、P(j)を得る。
S23:フレームカウンタをチェックする。最初のフレーム(j=1)の場合は、S24に処理を進め、それ以外の場合には25に処理を進める。
S24:Lave(j、i)(i=1〜M)、Eave(j)を初期化する。
S25:ピッチ相関P(j)を閾値P0と比較し、閾値より小さい場合は、雑音情報がある音声情報としてS26に処理を進め、それ以外の場合はS27に処理を進める。
S26:現フレームの物理量L(j、i)(i=1〜M)、E(j)を用いて、雑音情報Lave(j、i)(i=1〜M)、Eave(j)を更新する。重み付け係数α、β(0≦α、β≦1)は予めシステムの状態に応じて容易に設定することができる。
S27:当該フレームの音声信号2より雑音電力Ein(j)を算出する。
S28:Ein(j)を用いてEave(j)を調節する。重み付け係数γ(0≦ γ≦1)は予め設定する。
S29:雑音情報Lave(j、i)(i=1〜M)、Eave(j)を雑音情報生成部に出力する。
S30:次フレームの処理のために、フレームカウンタを1増加させる。
S31:次フレームをチェックする。次フレームがある場合には、S22に処理を進め、次フレームがない場合(終話の場合)は処理を終了させる。
【0026】
【発明の効果】
本第1の発明によれば、音声間欠通信方式において、無音区間音声情報を送信することなく受信側で受信した有音区間音声情報より雑音情報を算出し、これを用いて無音区間音声情報を生成でき、雑音情報の伝送による伝送効率を低減させることなく、違和感の無い音声通信を行うことが可能となる。
【0027】
本第2の発明によれば、音声間欠通信方式において、無音区間音声情報を送信することなく受信側で、対向局へ送信する音声信号を用いて雑音情報を抽出することで無音区間音声情報を生成でき、雑音情報の伝送による伝送効率を低減させることなく、違和感の無い音声通信を行うことが可能となる。
本第3の発明によれば、音声間欠通信方式において、無音区間音声情報を送信することなく受信した有音区間音声情報、及び受信側から対向局へ送信する音声信号を用いて雑音情報を抽出することで、受信側で無音区間音声情報を生成でき、雑音情報の伝送による伝送効率を低減させることなく、違和感の無い音声通信を行うことが可能となる。
【図面の簡単な説明】
【図1】本第1の発明の実施形態システム構成図(片対向)
【図2】本第2の発明の実施形態システム構成図
【図3】本第3の発明の実施形態システム構成図
【図4】本発明実施形態の雑音生成部構成図
【図5】本第3の発明の実施形態の雑音情報抽出部構成図
【図6】本第1、2の発明の実施形態の雑音情報抽出フローチャート
【図7】本第3の発明の実施形態の雑音情報抽出フローチャート
【発明の属する技術分野】
本発明は、音声信号をある一定時間間隔毎に有音であるか、無音であるか判定し、無音区間では無音区間音声情報を有音区間音声情報より圧縮して伝送する音声間欠通信方式に係り、特に、音声無音時には音声情報の送信を停止して音声情報の伝送効率を向上させると共に受話者に違和感のない音声間欠通信方式に関する。
【0002】
【従来の技術】
音声間欠通信方式は、通話の相手が話をしている時間、あるいは通話がとぎれているポーズ時間等送信する通話が無いことを利用して無音区間音声情報を有音区間音声情報より圧縮して送信する音声通信方式である。例えば、移動通信システムでは端末装置の消費電力の低減を図る目的で、あるいはVoIPシステム(Voice over IP System)では信号伝送の伝送効率を高める目的で用いられている。
【0003】
従来の音声間欠通信方式では送信部において、フレーム区間内に音声信号があるかないかを判定し、有音区間と判定された場合はシステムの符号化方式に則って符号化し、有音区間音声情報として送出する。一方、無音区間と判定した時は、入力音声信号の雑音情報(フレーム内の雑音電力、ピッチ相関等)を算出し、この雑音情報を符号化し、無音区間音声情報として送出する。あるいは、更に伝送効率を高める方式として、有音区間であるか、無音区間であるかの識別情報を送り、無音区間では受信側で雑音を生成する方式が採用される。あるいは、特許文献1では送信側で有音・無音の検出を行い、無音から有音、有音から無音への切り替え時に、その1フレーム前に予告信号を送出する。受信側では、その予告信号を受信し、有音処理、無音処理の切り替えを行う方式が開示されている。
【0004】
又、受信側での無音区間音声情報となる雑音の生成に関し、特許文献2では無音区間での受信側での聴感上の不自然さをなくす復号化装置として、送信されてきた無音区間の長さと平均雑音レベルに関する情報から送信側雑音と同一の雑音レベルを無音区間に挿入する方式が開示されている。
【0005】
【特許文献1】特開平6−97898号公報(第2ページ、図2)
【0006】
【特許文献2】特開昭60−107933号公報(第2ページ、第1図)
【0007】
【発明が解決しようとする課題】
しかしながら、従来の音声間欠通信方式では、受信側で無音区間音声情報として雑音を生成するために(1)雑音情報を符号化して送信する(2)有音・無音識別信号を送信する(3)有音・無音の切り替え予告信号を送信する等の方法で伝送するため伝送路の伝送効率を低減させてしまう問題があった。また、有音区間から無音区間に切り替わった時にも受話者にとり、通話に連続性があり、違和感のない雑音を生成することは難しい面があった。
【0008】
本発明は、受信側で無音区間音声情報となる雑音情報の伝送を不要とし、伝送効率が低減することを解決するとともに、受話者が違和感を感ずることがない音声通信を提供することを目的とする。尚、以降で表現する快適雑音とは復号化音声信号に連続性があり、受話者にとって違和感のない雑音を意味する。
【0009】
【課題を解決するための手段】
上記目的を達成する本発明は以下の通りである。
本第1の発明は、音声有音時と音声無音時とでは異なる規則で符号化及び復号化を行う音声間欠通信方式において、送信側で、音声有音時には有音区間音声情報を送信し、音声無音時には無音区間音声情報の送信を停止し、受信側で有音区間音声情報を受信した時には該有音区間音声情報を復号化し、情報を受信しなかった時には受信した有音区間音声情報より雑音情報を抽出し、抽出した該雑音情報より無音区間音声情報を生成して復号化する。
【0010】
このように構成された装置の構成により、有音区間では受信した有音区間音声情報を、システムの音声符号復号化方式に則って復号化することにより、送信された元の音声信号を再生する。一方、無音区間においては、受信した有音区間音声情報に含まれる有音区間から無音区間への切り替え時のガード時間の雑音、あるいは通話のとぎれのポーズ時間の雑音等から雑音情報を抽出し、雑音生成部で快適雑音を無音区間音声情報として生成することにより有音区間の音声信号と連続性があり、受話者にとって違和感のない元の音声信号を再生できる。
【0011】
本第2の発明は、音声有音時と音声無音時とでは異なる規則で符号化及び復号化を行う音声間欠通信方式において、送信側で、音声有音時には有音区間音声情報を送信し、音声無音時には無音区間音声情報の送信を停止し、受信側で有音区間音声情報を受信した時には該有音区間音声情報を復号化し、情報を受信しなかった時には対向局に送信する自局の音声信号より雑音情報を抽出し、抽出した該雑音情報より無音区間音声情報を生成して復号化する。
【0012】
このように構成された装置の構成により、有音区間では受信した有音区間音声情報を、システムの音声符号復号化方式に則って復号化することにより、送信された元の音声信号を再生する。一方、無音区間においては、対向局に送信する自局の音声信号に含まれる雑音情報から雑音情報を抽出し、雑音生成部で快適雑音を無音区間音声情報として生成することにより有音区間の音声信号と連続性があり、受話者にとって違和感のない元の音声信号を再生できる。
【0013】
本第3の発明は、音声有音時と音声無音時とでは異なる規則で符号化及び復号化を行う音声間欠通信方式において、送信側で、音声有音時には有音区間音声情報を送信し、音声無音時には無音区間音声情報の送信を停止し、受信側で有音区間音声情報を受信した時には該有音区間音声情報を復号化し、情報を受信しなかった時には受信した有音声区間音声情報及び対向局に送信する自局の音声信号より雑音情報を抽出し、抽出した該雑音情報より無音区間音声情報を生成して復号化する。
【0014】
このように構成された装置の構成により、有音区間では受信した有音区間音声情報を、システムの音声符号復号化方式に則って復号化することにより、送信された元の音声信号を再生する。一方、無音区間においては、受信した有音区間音声情報に含まれる有音区間から無音区間への切り替え時のガード時間の雑音、あるいは通話のとぎれのポーズ時間の雑音等からの雑音情報及び対向局に送信する自局の音声信号に含まれる雑音情報から雑音情報を抽出し、雑音生成部で快適雑音を無音区間音声情報として生成することにより有音区間の音声信号と連続性があり、受話者にとって違和感のない元の音声信号を再生できる。
【0015】
【発明の実施の形態】
詳細の説明の前に、LPC分析及び無音区間情報を伝送せずに受信側で無音区間であることを識別する方法についての説明を行う。
先ず、LPC分析について説明する。音声信号の符号復号化方式として、線形予測符号化方式LPC方式が知られている。LPC方式は一定時間間隔(フレーム区間)の音声信号を分析して、下記で示すLPC分析情報を算出できることが知られている。ここで、jはある時点のフレーム番号を示す。
1)LPC係数情報
LPC係数は音声信号を音源に対するフィルタの応答結果と見なした場合の、フィルタの係数である。以下ではL(j、i)(i=1〜M)で示す。ここで、MはLPC分析の予測次数を示す。
2)電力情報
フレーム内の音声信号の電力である。以下ではE(j)で示す。
3)ピッチ情報
ピッチは音声信号の有する基本の周期である。有音の場合は基本周期情報の他倍周期のピッチ情報が得られ、これよりピッチ相関値が算出できる。一方、無音の場合、即ち雑音の場合には基本的にはピッチはランダムであり、ピッチ相関が無いのでピッチ相関値は有音に比較して小さくなる。以下ではピッチ相関値をP(j)で示す。
【0016】
又、音声通信の場合、無音時は背景雑音であるから電力E(j)は有音時に比較して小さくなる。このE(j)、P(j)の値により、フレーム区間の音声信号が有音であるか、無音の雑音であるかを判定することができる。
次に無音区間音声情報を送信側で送出しない方式を採用する本発明での無音区間であることの検出を行う方法を説明する。音声信号はフレーム単位で処理される。無音区間の識別は、この1フレーム時間を受信側でカウントすることにより行う。無音区間識別部でカウンタを備え、有音区間のフレーム始まりの時点よりこの1フレーム時間をカウントする。1フレーム時間後、有音区間音声情報が無い場合、無音区間として、無音区間識別情報を出力する。更に、カウンタはリセットされると同時に次の1フレーム時間をカウントし、有音区間音声情報を認識するまで無音区間識別情報を出力する。このようにして無音区間であることを認識する。
【0017】
本第1の発明の実施形態システム構成図(片対向)を図1に示す。
送信部20は入力音声信号1とインタフェースし、音声信号のフレーム処理を行う音声IF部21、音声信号をシステムの音声符号化方式に則ってフレーム単位で符号化を行う音声符号化部22、フレーム単位で音声信号が有音区間であるか無音区間であるかを有音区間から無音区間へのガード時間を含めて判定する音声検出部23及びフレーム信号及び符号化された有音区間音声情報を多重し、伝送路に適した形式に変換し、伝送路とのインタフェースを行う多重化及び送信回線IF部24で構成する。
【0018】
一方、受信部40は伝送路とのインタフェースをとって受信したフレームから有音区間音声情報を分離する受信回線IF及び多重分離部41、システムの音声符号化方式に則って受信した音声信号の復号化を行う音声復号化部42、前述のLPC分析を行って雑音情報を抽出する雑音情報抽出部44、抽出した雑音情報より快適雑音を生成する雑音生成部45、受信フレームが無音区間であるか否かを識別する無音区間識別部46、有音区間の音声複合化信号と無音区間音声情報として生成された雑音情報とを出力音声信号として結合する結合部43で構成する。
【0019】
図1の構成において、入力音声信号1は音声符号化部22で、例えば20ミリ秒単位のフレーム単位で符号化する共に、音声検出部23でフレーム単位での有音区間、無音区間の判定を行う。有音区間の場合は多重化及び送信回線IF部24を経由して有音区間音声情報として伝送路に送出する。一方無音区間の場合は、本発明では、無音区間音声情報は送信しない。受信部40では伝送路30からの信号3を受信回線IF及び多重分離部41で受け、有音区間音声情報は音声復号化部42で復号化し、結合部43を経由して出力音声信号4として出力する。
【0020】
一方、無音区間識別部46で無音区間と識別された場合は、雑音情報抽出部44が受信した有音声区間音声情報より抽出した雑音情報より雑音生成部45が該雑音情報から快適雑音を生成し、結合部43を経て当該フレームの無音区間音声情報となり出力音声信号4として出力する。
雑音情報抽出部44で行うLPC分析は、例えば、良く知られているディジタル信号処理(DSP:Degital Signal Processing)によりDSPプロセッサを用いて、LPC係数L(j、i)(j:フレーム番号、i=1〜M、MはLPC予測次数を表す)、ピッチ情報P(j)、フレーム電力E(j)を算出する。このLPC分析情報を使用して図6に示す手順で雑音情報を抽出する。尚、Lave(j、i)(i=1〜M)、Eave(j)は各々あるフレーム時点でのフレーム電力E(j)、LPC予測係数L(j、i)(i=1〜M)の平均値を示し、P0は該当フレームが有音区間、あるいは無音区間の判定を行うピッチ相関値の閾値を示す。これらの情報は順次述べる本第1の発明、本第2の発明、本第3の発明の説明において同一の内容を表すものとする。
【0021】
次に図6に示す本第1、2の発明の実施形態の雑音情報抽出フローチャートにより雑音情報抽出のフローを説明する。
S1:音声通信の開始としてフレームカウンタを初期化する。(j=1)
S2:有音区間フレームである、当該フレームの音声信号よりL(j、i)(i=1〜M)、E(j)、P(j)、を得る。
S3:フレームカウンタをチェックし、最初のフレーム(j=1)の場合は、S4に処理を進め、それ以外の場合にはS5に処理を進める。
S4:Lave(j、i)(i=1〜M)、Eave(j)の初期値である
Lave(0、i)(i=1〜M)、Eave(0)として
最初のフレームのL(1、i)(i=1〜M)、E(1)を用いる。
S5:ピッチ相関P(j)を閾値P0と比較し、閾値より小さい場合は、雑音情報がある音声情報としてS6に処理を進め、それ以外の場合はS7に処理を進める。尚、重み付け係数α、β(0≦α、β≦ 1)は予めシステムの状態に応じて容易に設定することができる。
S6:当該フレームの物理量L(j、i)(i=1〜M)、E(j)を用いて、雑音情報Lave(j、i)(i=1〜M)、Eave(j)を更新する。
S7:雑音情報Lave(j、i)(i=1〜M)、Eave(j)を雑音情報生成部に出力する。
S8:次フレームの処理のために、フレームカウンタを1増加させる。
S9:次フレームをチェックする。次フレームがある場合には、S2に処理を進め、次フレームがない場合(終話の場合)は処理を終了させる。
【0022】
以上述べた手順により、図4に示す雑音生成部の入力となる雑音情報Lave(j、i)(i=1〜M)、Eave(j)を得る。
図4に本発明の実施形態の雑音生成部構成図を示す。LPC合成は音声振幅の大きさに応じた振幅の音源をLPC合成フィルタに入力し、LPC合成フィルタの係数であるLPC係数を入力音源と乗算することにより出力音声信号を得ることができる。音源としては元の音声信号のピッチ間隔に対応した音源を使う。この場合は背景雑音の再生であり、背景雑音のピッチはランダムであるから、音源としてはランダムなピッチを有する白色雑音を音源として使う。この白色雑音に電力E(j)で決まる振幅を乗算し、合成フィルタに入力し、Lave(j、i)(i=1〜M)をフィルタ係数として乗算することにより快適雑音を得る。尚、これらの演算は前述のDSP処理により、LPC分析を行うDSPプロセッサをタイムシェァリングで使用して実現することができる。
【0023】
図2に本第2の発明の実施形態システム構成図を示す。
伝送装置A50、伝送装置B51は各々送信部201、受信部401、送信部202、受信部402で構成する。図1で示した送信部20、受信部40と異なる部分についての説明を行う。受信部402の雑音情報抽出部44に入力する音声信号は対向局に送信する自局の送信部202からの音声信号11である。該音声信号11に含まれる雑音を雑音情報抽出部44で抽出し、雑音情報Lave(j、i)(i=1〜M)、Eave(j)を得、雑音生成部45で無音区間音声情報である雑音を生成する。該雑音は受話者の自局、即ち、自己の背景雑音である。通常、音声通信では電話機の送話部と受話部の間には側音回路が設けられており、送話者には自分の音声が側音回路を通じて周り込む。これより生成した雑音は自局の背景雑音であるが、側音回路を通じての音声信号に含まれる背景雑音でもあり快適雑音となり加算部43を経由して無音区間の出力音声信号4となる。雑音情報Lave(j、i)(i=1〜M)、Eave(j)の抽出及び快適雑音の生成方法は本第1の発明の処理方法と同一である。
【0024】
図3に本第3の発明の実施形態システム構成図を示す。伝送装置A50、伝送装置B51は各々送信部201、受信部401、送信部202、受信部402で構成する。図1、図2で示した送信部20、受信部40、送信部202、受信部402と異なる部分の説明を行う。受信部402の雑音情報抽出部44に入力する音声信号10は受信部402で受信し、復号化した有音区間音声信号10及び対向局に送信する自局の送信部202からの音声信号11である。雑音情報抽出部44では音声信号10、音声信号11の両信号から雑音情報Lave(j、i)(i=1〜M)、Eave(j)を抽出する。図5に本第3の発明の実施形態雑音情報抽出部構成図を示す。実施に当たっては前述のDSP処理により、同一のDSPプロセッサでタイムシェァリング処理により雑音情報Lave(j、i)(i=1〜M)、Eave(j)を算出することができる。この雑音情報より雑音生成部45で雑音を生成する。本第1、3の発明の実施形態で説明したようにこの雑音は快適雑音となり無音区間の出力音声信号4となる。
【0025】
次に本第3の発明における、これら雑音情報Lave(j、i)(i=1〜M)、Eave(j)を得る手順について図7を用いて説明する。
S21:音声通信の開始時フレームカウンタを初期化する。(j=1)
S22:当該フレームの音声信号1よりL(j、i)(i=1〜M)、E(j)、P(j)を得る。
S23:フレームカウンタをチェックする。最初のフレーム(j=1)の場合は、S24に処理を進め、それ以外の場合には25に処理を進める。
S24:Lave(j、i)(i=1〜M)、Eave(j)を初期化する。
S25:ピッチ相関P(j)を閾値P0と比較し、閾値より小さい場合は、雑音情報がある音声情報としてS26に処理を進め、それ以外の場合はS27に処理を進める。
S26:現フレームの物理量L(j、i)(i=1〜M)、E(j)を用いて、雑音情報Lave(j、i)(i=1〜M)、Eave(j)を更新する。重み付け係数α、β(0≦α、β≦1)は予めシステムの状態に応じて容易に設定することができる。
S27:当該フレームの音声信号2より雑音電力Ein(j)を算出する。
S28:Ein(j)を用いてEave(j)を調節する。重み付け係数γ(0≦ γ≦1)は予め設定する。
S29:雑音情報Lave(j、i)(i=1〜M)、Eave(j)を雑音情報生成部に出力する。
S30:次フレームの処理のために、フレームカウンタを1増加させる。
S31:次フレームをチェックする。次フレームがある場合には、S22に処理を進め、次フレームがない場合(終話の場合)は処理を終了させる。
【0026】
【発明の効果】
本第1の発明によれば、音声間欠通信方式において、無音区間音声情報を送信することなく受信側で受信した有音区間音声情報より雑音情報を算出し、これを用いて無音区間音声情報を生成でき、雑音情報の伝送による伝送効率を低減させることなく、違和感の無い音声通信を行うことが可能となる。
【0027】
本第2の発明によれば、音声間欠通信方式において、無音区間音声情報を送信することなく受信側で、対向局へ送信する音声信号を用いて雑音情報を抽出することで無音区間音声情報を生成でき、雑音情報の伝送による伝送効率を低減させることなく、違和感の無い音声通信を行うことが可能となる。
本第3の発明によれば、音声間欠通信方式において、無音区間音声情報を送信することなく受信した有音区間音声情報、及び受信側から対向局へ送信する音声信号を用いて雑音情報を抽出することで、受信側で無音区間音声情報を生成でき、雑音情報の伝送による伝送効率を低減させることなく、違和感の無い音声通信を行うことが可能となる。
【図面の簡単な説明】
【図1】本第1の発明の実施形態システム構成図(片対向)
【図2】本第2の発明の実施形態システム構成図
【図3】本第3の発明の実施形態システム構成図
【図4】本発明実施形態の雑音生成部構成図
【図5】本第3の発明の実施形態の雑音情報抽出部構成図
【図6】本第1、2の発明の実施形態の雑音情報抽出フローチャート
【図7】本第3の発明の実施形態の雑音情報抽出フローチャート
Claims (3)
- 音声有音時と音声無音時とでは異なる規則で符号化及び復号化を行う音声間欠通信方式において、
送信側で、
音声有音時には有音区間音声情報を送信し、
音声無音時には無音区間音声情報の送信を停止し、
受信側で、
有音区間音声情報を受信した時には該有音区間音声情報を復号化し、
情報を受信しなかった時には受信した有音声区間音声情報より雑音情報を抽出し、抽出した該雑音情報より無音区間音声情報を生成して復号化する
ことを特徴とする音声間欠通信方式。 - 音声有音時と音声無音時とでは異なる規則で符号化及び復号化を行う音声間欠通信方式において、
送信側で、
音声有音時には有音区間音声情報を送信し、
音声無音時には無音区間音声情報の送信を停止し、
受信側で、
有音区間音声情報を受信した時には該有音区間音声情報を復号化し、
情報を受信しなかった時には対向局に送信する自局の音声信号より雑音情報を抽出し、
抽出した該雑音情報より無音区間音声情報を生成して復号化する
ことを特徴とする音声間欠通信方式。 - 音声有音時と音声無音時とでは異なる規則で符号化及び復号化を行う音声間欠通信方式において、
送信側で、
音声有音時には有音区間音声情報を送信し、
音声無音時には無音区間音声情報の送信を停止し、
受信側で、
有音区間音声情報を受信した時には該有音区間音声情報を復号化し、
情報を受信しなかった時には受信した有音声区間音声情報及び、
対向局に送信する自局の音声信号より雑音情報を抽出し、
抽出した該雑音情報より無音区間音声情報を生成して復号化する
ことを特徴とする音声間欠通信方式。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2002268938A JP2004109244A (ja) | 2002-09-13 | 2002-09-13 | 音声間欠通信方式 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2002268938A JP2004109244A (ja) | 2002-09-13 | 2002-09-13 | 音声間欠通信方式 |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2004109244A true JP2004109244A (ja) | 2004-04-08 |
Family
ID=32267019
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2002268938A Withdrawn JP2004109244A (ja) | 2002-09-13 | 2002-09-13 | 音声間欠通信方式 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2004109244A (ja) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP1845691A2 (en) * | 2006-04-13 | 2007-10-17 | NEC Corporation | Media stream relay device and method |
-
2002
- 2002-09-13 JP JP2002268938A patent/JP2004109244A/ja not_active Withdrawn
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP1845691A2 (en) * | 2006-04-13 | 2007-10-17 | NEC Corporation | Media stream relay device and method |
EP1845691A3 (en) * | 2006-04-13 | 2007-12-05 | NEC Corporation | Media stream relay device and method |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
EP1720154B1 (en) | Communication device, signal encoding/decoding method | |
JP3182032B2 (ja) | 音声符号化通信方式及びその装置 | |
WO2007140724A1 (fr) | procédé et appareil pour transmettre et recevoir un bruit de fond et système de compression de silence | |
US20040128126A1 (en) | Preprocessing of digital audio data for mobile audio codecs | |
WO2001065542A1 (fr) | Dispositif de codage/decodage de la voix et procede associe | |
JPH10340097A (ja) | 快適雑音発生装置及び該装置の構成要素を含む音声エンコーダ及びデコーダ | |
JP2861889B2 (ja) | 音声パケット伝送システム | |
JPH1049199A (ja) | 無音圧縮音声符号化復号化装置 | |
JP3999204B2 (ja) | ディジタル回線伝送装置 | |
JP2004109244A (ja) | 音声間欠通信方式 | |
RU2454737C2 (ru) | Способ и средство для декодирования информации о фоновом шуме | |
JP4437011B2 (ja) | 音声符号化装置 | |
JP2900987B2 (ja) | 無音圧縮音声符号化復号化装置 | |
JP3734696B2 (ja) | 無音圧縮音声符号化復号化装置 | |
JP3132636B2 (ja) | 音声データ変換装置 | |
JP3055608B2 (ja) | 音声符号化方法および装置 | |
JP2002252644A (ja) | 音声パケット通信装置及び音声パケット通信方法 | |
JPS60107933A (ja) | Adpcm符号化装置 | |
JPH07334197A (ja) | 音声符号化装置 | |
JP2885225B2 (ja) | 音声符号化復号化装置 | |
JP2000322096A (ja) | 音声伝送装置 | |
JPH0530137A (ja) | 音声パケツト伝送装置 | |
JP2002333900A (ja) | 音声符号化復号化方法および音声送受信装置 | |
JPH10145764A (ja) | 話者検出方法および多地点テレビ会議装置 | |
JP2002032095A (ja) | 音声符号化・復号化装置、音声符号化装置および符号化方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
RD02 | Notification of acceptance of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7422 Effective date: 20040610 |
|
RD04 | Notification of resignation of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7424 Effective date: 20040610 |
|
A300 | Application deemed to be withdrawn because no request for examination was validly filed |
Free format text: JAPANESE INTERMEDIATE CODE: A300 Effective date: 20060110 |