JP2004109244A

JP2004109244A - 音声間欠通信方式

Info

Publication number: JP2004109244A
Application number: JP2002268938A
Authority: JP
Inventors: Kaori Endou; 遠藤　香緒里; Takashi Ota; 大田　恭士
Original assignee: Fujitsu Ltd
Current assignee: Fujitsu Ltd
Priority date: 2002-09-13
Filing date: 2002-09-13
Publication date: 2004-04-08

Abstract

【課題】音声間欠通信方式において、受信側で無音区間音声情報となる雑音情報の伝送を不要とし、伝送効率が低減することを解決するとともに、受話者が違和感を感ずることがない音声通信を提供することを目的とする。
【解決手段】音声間欠通信方式において、有音区間では有音区間音声情報を送信するが、無音区間では、送信側からは無音区間音声信号を送信することなく、受信した有音区間音声情報、あるいは対向局に送信する自局の音声信号より受信側で雑音情報を抽出し、無音区間音声信号を生成する。
【選択図】　　図１

Description

【０００１】
【発明の属する技術分野】
本発明は、音声信号をある一定時間間隔毎に有音であるか、無音であるか判定し、無音区間では無音区間音声情報を有音区間音声情報より圧縮して伝送する音声間欠通信方式に係り、特に、音声無音時には音声情報の送信を停止して音声情報の伝送効率を向上させると共に受話者に違和感のない音声間欠通信方式に関する。
【０００２】
【従来の技術】
音声間欠通信方式は、通話の相手が話をしている時間、あるいは通話がとぎれているポーズ時間等送信する通話が無いことを利用して無音区間音声情報を有音区間音声情報より圧縮して送信する音声通信方式である。例えば、移動通信システムでは端末装置の消費電力の低減を図る目的で、あるいはＶｏＩＰシステム（Ｖｏｉｃｅ　ｏｖｅｒ　ＩＰ　Ｓｙｓｔｅｍ）では信号伝送の伝送効率を高める目的で用いられている。
【０００３】
従来の音声間欠通信方式では送信部において、フレーム区間内に音声信号があるかないかを判定し、有音区間と判定された場合はシステムの符号化方式に則って符号化し、有音区間音声情報として送出する。一方、無音区間と判定した時は、入力音声信号の雑音情報（フレーム内の雑音電力、ピッチ相関等）を算出し、この雑音情報を符号化し、無音区間音声情報として送出する。あるいは、更に伝送効率を高める方式として、有音区間であるか、無音区間であるかの識別情報を送り、無音区間では受信側で雑音を生成する方式が採用される。あるいは、特許文献１では送信側で有音・無音の検出を行い、無音から有音、有音から無音への切り替え時に、その１フレーム前に予告信号を送出する。受信側では、その予告信号を受信し、有音処理、無音処理の切り替えを行う方式が開示されている。
【０００４】
又、受信側での無音区間音声情報となる雑音の生成に関し、特許文献２では無音区間での受信側での聴感上の不自然さをなくす復号化装置として、送信されてきた無音区間の長さと平均雑音レベルに関する情報から送信側雑音と同一の雑音レベルを無音区間に挿入する方式が開示されている。
【０００５】
【特許文献１】特開平６−９７８９８号公報（第２ページ、図２）
【０００６】
【特許文献２】特開昭６０−１０７９３３号公報（第２ページ、第１図）
【０００７】
【発明が解決しようとする課題】
しかしながら、従来の音声間欠通信方式では、受信側で無音区間音声情報として雑音を生成するために（１）雑音情報を符号化して送信する（２）有音・無音識別信号を送信する（３）有音・無音の切り替え予告信号を送信する等の方法で伝送するため伝送路の伝送効率を低減させてしまう問題があった。また、有音区間から無音区間に切り替わった時にも受話者にとり、通話に連続性があり、違和感のない雑音を生成することは難しい面があった。
【０００８】
本発明は、受信側で無音区間音声情報となる雑音情報の伝送を不要とし、伝送効率が低減することを解決するとともに、受話者が違和感を感ずることがない音声通信を提供することを目的とする。尚、以降で表現する快適雑音とは復号化音声信号に連続性があり、受話者にとって違和感のない雑音を意味する。
【０００９】
【課題を解決するための手段】
上記目的を達成する本発明は以下の通りである。
本第１の発明は、音声有音時と音声無音時とでは異なる規則で符号化及び復号化を行う音声間欠通信方式において、送信側で、音声有音時には有音区間音声情報を送信し、音声無音時には無音区間音声情報の送信を停止し、受信側で有音区間音声情報を受信した時には該有音区間音声情報を復号化し、情報を受信しなかった時には受信した有音区間音声情報より雑音情報を抽出し、抽出した該雑音情報より無音区間音声情報を生成して復号化する。
【００１０】
このように構成された装置の構成により、有音区間では受信した有音区間音声情報を、システムの音声符号復号化方式に則って復号化することにより、送信された元の音声信号を再生する。一方、無音区間においては、受信した有音区間音声情報に含まれる有音区間から無音区間への切り替え時のガード時間の雑音、あるいは通話のとぎれのポーズ時間の雑音等から雑音情報を抽出し、雑音生成部で快適雑音を無音区間音声情報として生成することにより有音区間の音声信号と連続性があり、受話者にとって違和感のない元の音声信号を再生できる。
【００１１】
本第２の発明は、音声有音時と音声無音時とでは異なる規則で符号化及び復号化を行う音声間欠通信方式において、送信側で、音声有音時には有音区間音声情報を送信し、音声無音時には無音区間音声情報の送信を停止し、受信側で有音区間音声情報を受信した時には該有音区間音声情報を復号化し、情報を受信しなかった時には対向局に送信する自局の音声信号より雑音情報を抽出し、抽出した該雑音情報より無音区間音声情報を生成して復号化する。
【００１２】
このように構成された装置の構成により、有音区間では受信した有音区間音声情報を、システムの音声符号復号化方式に則って復号化することにより、送信された元の音声信号を再生する。一方、無音区間においては、対向局に送信する自局の音声信号に含まれる雑音情報から雑音情報を抽出し、雑音生成部で快適雑音を無音区間音声情報として生成することにより有音区間の音声信号と連続性があり、受話者にとって違和感のない元の音声信号を再生できる。
【００１３】
本第３の発明は、音声有音時と音声無音時とでは異なる規則で符号化及び復号化を行う音声間欠通信方式において、送信側で、音声有音時には有音区間音声情報を送信し、音声無音時には無音区間音声情報の送信を停止し、受信側で有音区間音声情報を受信した時には該有音区間音声情報を復号化し、情報を受信しなかった時には受信した有音声区間音声情報及び対向局に送信する自局の音声信号より雑音情報を抽出し、抽出した該雑音情報より無音区間音声情報を生成して復号化する。
【００１４】
このように構成された装置の構成により、有音区間では受信した有音区間音声情報を、システムの音声符号復号化方式に則って復号化することにより、送信された元の音声信号を再生する。一方、無音区間においては、受信した有音区間音声情報に含まれる有音区間から無音区間への切り替え時のガード時間の雑音、あるいは通話のとぎれのポーズ時間の雑音等からの雑音情報及び対向局に送信する自局の音声信号に含まれる雑音情報から雑音情報を抽出し、雑音生成部で快適雑音を無音区間音声情報として生成することにより有音区間の音声信号と連続性があり、受話者にとって違和感のない元の音声信号を再生できる。
【００１５】
【発明の実施の形態】
詳細の説明の前に、ＬＰＣ分析及び無音区間情報を伝送せずに受信側で無音区間であることを識別する方法についての説明を行う。
先ず、ＬＰＣ分析について説明する。音声信号の符号復号化方式として、線形予測符号化方式ＬＰＣ方式が知られている。ＬＰＣ方式は一定時間間隔（フレーム区間）の音声信号を分析して、下記で示すＬＰＣ分析情報を算出できることが知られている。ここで、ｊはある時点のフレーム番号を示す。
１）ＬＰＣ係数情報
ＬＰＣ係数は音声信号を音源に対するフィルタの応答結果と見なした場合の、フィルタの係数である。以下ではＬ（ｊ、ｉ）（ｉ＝１〜Ｍ）で示す。ここで、ＭはＬＰＣ分析の予測次数を示す。
２）電力情報
フレーム内の音声信号の電力である。以下ではＥ（ｊ）で示す。
３）ピッチ情報
ピッチは音声信号の有する基本の周期である。有音の場合は基本周期情報の他倍周期のピッチ情報が得られ、これよりピッチ相関値が算出できる。一方、無音の場合、即ち雑音の場合には基本的にはピッチはランダムであり、ピッチ相関が無いのでピッチ相関値は有音に比較して小さくなる。以下ではピッチ相関値をＰ（ｊ）で示す。
【００１６】
又、音声通信の場合、無音時は背景雑音であるから電力Ｅ（ｊ）は有音時に比較して小さくなる。このＥ（ｊ）、Ｐ（ｊ）の値により、フレーム区間の音声信号が有音であるか、無音の雑音であるかを判定することができる。
次に無音区間音声情報を送信側で送出しない方式を採用する本発明での無音区間であることの検出を行う方法を説明する。音声信号はフレーム単位で処理される。無音区間の識別は、この１フレーム時間を受信側でカウントすることにより行う。無音区間識別部でカウンタを備え、有音区間のフレーム始まりの時点よりこの１フレーム時間をカウントする。１フレーム時間後、有音区間音声情報が無い場合、無音区間として、無音区間識別情報を出力する。更に、カウンタはリセットされると同時に次の１フレーム時間をカウントし、有音区間音声情報を認識するまで無音区間識別情報を出力する。このようにして無音区間であることを認識する。
【００１７】
本第１の発明の実施形態システム構成図（片対向）を図１に示す。
送信部２０は入力音声信号１とインタフェースし、音声信号のフレーム処理を行う音声ＩＦ部２１、音声信号をシステムの音声符号化方式に則ってフレーム単位で符号化を行う音声符号化部２２、フレーム単位で音声信号が有音区間であるか無音区間であるかを有音区間から無音区間へのガード時間を含めて判定する音声検出部２３及びフレーム信号及び符号化された有音区間音声情報を多重し、伝送路に適した形式に変換し、伝送路とのインタフェースを行う多重化及び送信回線ＩＦ部２４で構成する。
【００１８】
一方、受信部４０は伝送路とのインタフェースをとって受信したフレームから有音区間音声情報を分離する受信回線ＩＦ及び多重分離部４１、システムの音声符号化方式に則って受信した音声信号の復号化を行う音声復号化部４２、前述のＬＰＣ分析を行って雑音情報を抽出する雑音情報抽出部４４、抽出した雑音情報より快適雑音を生成する雑音生成部４５、受信フレームが無音区間であるか否かを識別する無音区間識別部４６、有音区間の音声複合化信号と無音区間音声情報として生成された雑音情報とを出力音声信号として結合する結合部４３で構成する。
【００１９】
図１の構成において、入力音声信号１は音声符号化部２２で、例えば２０ミリ秒単位のフレーム単位で符号化する共に、音声検出部２３でフレーム単位での有音区間、無音区間の判定を行う。有音区間の場合は多重化及び送信回線ＩＦ部２４を経由して有音区間音声情報として伝送路に送出する。一方無音区間の場合は、本発明では、無音区間音声情報は送信しない。受信部４０では伝送路３０からの信号３を受信回線ＩＦ及び多重分離部４１で受け、有音区間音声情報は音声復号化部４２で復号化し、結合部４３を経由して出力音声信号４として出力する。
【００２０】
一方、無音区間識別部４６で無音区間と識別された場合は、雑音情報抽出部４４が受信した有音声区間音声情報より抽出した雑音情報より雑音生成部４５が該雑音情報から快適雑音を生成し、結合部４３を経て当該フレームの無音区間音声情報となり出力音声信号４として出力する。
雑音情報抽出部４４で行うＬＰＣ分析は、例えば、良く知られているディジタル信号処理（ＤＳＰ：Ｄｅｇｉｔａｌ　Ｓｉｇｎａｌ　Ｐｒｏｃｅｓｓｉｎｇ）によりＤＳＰプロセッサを用いて、ＬＰＣ係数Ｌ（ｊ、ｉ）（ｊ：フレーム番号、ｉ＝１〜Ｍ、ＭはＬＰＣ予測次数を表す）、ピッチ情報Ｐ（ｊ）、フレーム電力Ｅ（ｊ）を算出する。このＬＰＣ分析情報を使用して図６に示す手順で雑音情報を抽出する。尚、Ｌａｖｅ（ｊ、ｉ）（ｉ＝１〜Ｍ）、Ｅａｖｅ（ｊ）は各々あるフレーム時点でのフレーム電力Ｅ（ｊ）、ＬＰＣ予測係数Ｌ（ｊ、ｉ）（ｉ＝１〜Ｍ）の平均値を示し、Ｐ０は該当フレームが有音区間、あるいは無音区間の判定を行うピッチ相関値の閾値を示す。これらの情報は順次述べる本第１の発明、本第２の発明、本第３の発明の説明において同一の内容を表すものとする。
【００２１】
次に図６に示す本第１、２の発明の実施形態の雑音情報抽出フローチャートにより雑音情報抽出のフローを説明する。
Ｓ１：音声通信の開始としてフレームカウンタを初期化する。（ｊ＝１）
Ｓ２：有音区間フレームである、当該フレームの音声信号よりＬ（ｊ、ｉ）（ｉ＝１〜Ｍ）、Ｅ（ｊ）、Ｐ（ｊ）、を得る。
Ｓ３：フレームカウンタをチェックし、最初のフレーム（ｊ＝１）の場合は、Ｓ４に処理を進め、それ以外の場合にはＳ５に処理を進める。
Ｓ４：Ｌａｖｅ（ｊ、ｉ）（ｉ＝１〜Ｍ）、Ｅａｖｅ（ｊ）の初期値である
Ｌａｖｅ（０、ｉ）（ｉ＝１〜Ｍ）、Ｅａｖｅ（０）として
最初のフレームのＬ（１、ｉ）（ｉ＝１〜Ｍ）、Ｅ（１）を用いる。
Ｓ５：ピッチ相関Ｐ（ｊ）を閾値Ｐ０と比較し、閾値より小さい場合は、雑音情報がある音声情報としてＳ６に処理を進め、それ以外の場合はＳ７に処理を進める。尚、重み付け係数α、β（０≦α、β≦　１）は予めシステムの状態に応じて容易に設定することができる。
Ｓ６：当該フレームの物理量Ｌ（ｊ、ｉ）（ｉ＝１〜Ｍ）、Ｅ（ｊ）を用いて、雑音情報Ｌａｖｅ（ｊ、ｉ）（ｉ＝１〜Ｍ）、Ｅａｖｅ（ｊ）を更新する。
Ｓ７：雑音情報Ｌａｖｅ（ｊ、ｉ）（ｉ＝１〜Ｍ）、Ｅａｖｅ（ｊ）を雑音情報生成部に出力する。
Ｓ８：次フレームの処理のために、フレームカウンタを１増加させる。
Ｓ９：次フレームをチェックする。次フレームがある場合には、Ｓ２に処理を進め、次フレームがない場合（終話の場合）は処理を終了させる。
【００２２】
以上述べた手順により、図４に示す雑音生成部の入力となる雑音情報Ｌａｖｅ（ｊ、ｉ）（ｉ＝１〜Ｍ）、Ｅａｖｅ（ｊ）を得る。
図４に本発明の実施形態の雑音生成部構成図を示す。ＬＰＣ合成は音声振幅の大きさに応じた振幅の音源をＬＰＣ合成フィルタに入力し、ＬＰＣ合成フィルタの係数であるＬＰＣ係数を入力音源と乗算することにより出力音声信号を得ることができる。音源としては元の音声信号のピッチ間隔に対応した音源を使う。この場合は背景雑音の再生であり、背景雑音のピッチはランダムであるから、音源としてはランダムなピッチを有する白色雑音を音源として使う。この白色雑音に電力Ｅ（ｊ）で決まる振幅を乗算し、合成フィルタに入力し、Ｌａｖｅ（ｊ、ｉ）（ｉ＝１〜Ｍ）をフィルタ係数として乗算することにより快適雑音を得る。尚、これらの演算は前述のＤＳＰ処理により、ＬＰＣ分析を行うＤＳＰプロセッサをタイムシェァリングで使用して実現することができる。
【００２３】
図２に本第２の発明の実施形態システム構成図を示す。
伝送装置Ａ５０、伝送装置Ｂ５１は各々送信部２０１、受信部４０１、送信部２０２、受信部４０２で構成する。図１で示した送信部２０、受信部４０と異なる部分についての説明を行う。受信部４０２の雑音情報抽出部４４に入力する音声信号は対向局に送信する自局の送信部２０２からの音声信号１１である。該音声信号１１に含まれる雑音を雑音情報抽出部４４で抽出し、雑音情報Ｌａｖｅ（ｊ、ｉ）（ｉ＝１〜Ｍ）、Ｅａｖｅ（ｊ）を得、雑音生成部４５で無音区間音声情報である雑音を生成する。該雑音は受話者の自局、即ち、自己の背景雑音である。通常、音声通信では電話機の送話部と受話部の間には側音回路が設けられており、送話者には自分の音声が側音回路を通じて周り込む。これより生成した雑音は自局の背景雑音であるが、側音回路を通じての音声信号に含まれる背景雑音でもあり快適雑音となり加算部４３を経由して無音区間の出力音声信号４となる。雑音情報Ｌａｖｅ（ｊ、ｉ）（ｉ＝１〜Ｍ）、Ｅａｖｅ（ｊ）の抽出及び快適雑音の生成方法は本第１の発明の処理方法と同一である。
【００２４】
図３に本第３の発明の実施形態システム構成図を示す。伝送装置Ａ５０、伝送装置Ｂ５１は各々送信部２０１、受信部４０１、送信部２０２、受信部４０２で構成する。図１、図２で示した送信部２０、受信部４０、送信部２０２、受信部４０２と異なる部分の説明を行う。受信部４０２の雑音情報抽出部４４に入力する音声信号１０は受信部４０２で受信し、復号化した有音区間音声信号１０及び対向局に送信する自局の送信部２０２からの音声信号１１である。雑音情報抽出部４４では音声信号１０、音声信号１１の両信号から雑音情報Ｌａｖｅ（ｊ、ｉ）（ｉ＝１〜Ｍ）、Ｅａｖｅ（ｊ）を抽出する。図５に本第３の発明の実施形態雑音情報抽出部構成図を示す。実施に当たっては前述のＤＳＰ処理により、同一のＤＳＰプロセッサでタイムシェァリング処理により雑音情報Ｌａｖｅ（ｊ、ｉ）（ｉ＝１〜Ｍ）、Ｅａｖｅ（ｊ）を算出することができる。この雑音情報より雑音生成部４５で雑音を生成する。本第１、３の発明の実施形態で説明したようにこの雑音は快適雑音となり無音区間の出力音声信号４となる。
【００２５】
次に本第３の発明における、これら雑音情報Ｌａｖｅ（ｊ、ｉ）（ｉ＝１〜Ｍ）、Ｅａｖｅ（ｊ）を得る手順について図７を用いて説明する。
Ｓ２１：音声通信の開始時フレームカウンタを初期化する。（ｊ＝１）
Ｓ２２：当該フレームの音声信号１よりＬ（ｊ、ｉ）（ｉ＝１〜Ｍ）、Ｅ（ｊ）、Ｐ（ｊ）を得る。
Ｓ２３：フレームカウンタをチェックする。最初のフレーム（ｊ＝１）の場合は、Ｓ２４に処理を進め、それ以外の場合には２５に処理を進める。
Ｓ２４：Ｌａｖｅ（ｊ、ｉ）（ｉ＝１〜Ｍ）、Ｅａｖｅ（ｊ）を初期化する。
Ｓ２５：ピッチ相関Ｐ（ｊ）を閾値Ｐ０と比較し、閾値より小さい場合は、雑音情報がある音声情報としてＳ２６に処理を進め、それ以外の場合はＳ２７に処理を進める。
Ｓ２６：現フレームの物理量Ｌ（ｊ、ｉ）（ｉ＝１〜Ｍ）、Ｅ（ｊ）を用いて、雑音情報Ｌａｖｅ（ｊ、ｉ）（ｉ＝１〜Ｍ）、Ｅａｖｅ（ｊ）を更新する。重み付け係数α、β（０≦α、β≦１）は予めシステムの状態に応じて容易に設定することができる。
Ｓ２７：当該フレームの音声信号２より雑音電力Ｅｉｎ（ｊ）を算出する。
Ｓ２８：Ｅｉｎ（ｊ）を用いてＥａｖｅ（ｊ）を調節する。重み付け係数γ（０≦　γ≦１）は予め設定する。
Ｓ２９：雑音情報Ｌａｖｅ（ｊ、ｉ）（ｉ＝１〜Ｍ）、Ｅａｖｅ（ｊ）を雑音情報生成部に出力する。
Ｓ３０：次フレームの処理のために、フレームカウンタを１増加させる。
Ｓ３１：次フレームをチェックする。次フレームがある場合には、Ｓ２２に処理を進め、次フレームがない場合（終話の場合）は処理を終了させる。
【００２６】
【発明の効果】
本第１の発明によれば、音声間欠通信方式において、無音区間音声情報を送信することなく受信側で受信した有音区間音声情報より雑音情報を算出し、これを用いて無音区間音声情報を生成でき、雑音情報の伝送による伝送効率を低減させることなく、違和感の無い音声通信を行うことが可能となる。
【００２７】
本第２の発明によれば、音声間欠通信方式において、無音区間音声情報を送信することなく受信側で、対向局へ送信する音声信号を用いて雑音情報を抽出することで無音区間音声情報を生成でき、雑音情報の伝送による伝送効率を低減させることなく、違和感の無い音声通信を行うことが可能となる。
本第３の発明によれば、音声間欠通信方式において、無音区間音声情報を送信することなく受信した有音区間音声情報、及び受信側から対向局へ送信する音声信号を用いて雑音情報を抽出することで、受信側で無音区間音声情報を生成でき、雑音情報の伝送による伝送効率を低減させることなく、違和感の無い音声通信を行うことが可能となる。
【図面の簡単な説明】
【図１】本第１の発明の実施形態システム構成図（片対向）
【図２】本第２の発明の実施形態システム構成図
【図３】本第３の発明の実施形態システム構成図
【図４】本発明実施形態の雑音生成部構成図
【図５】本第３の発明の実施形態の雑音情報抽出部構成図
【図６】本第１、２の発明の実施形態の雑音情報抽出フローチャート
【図７】本第３の発明の実施形態の雑音情報抽出フローチャート

Claims

音声有音時と音声無音時とでは異なる規則で符号化及び復号化を行う音声間欠通信方式において、
送信側で、
音声有音時には有音区間音声情報を送信し、
音声無音時には無音区間音声情報の送信を停止し、
受信側で、
有音区間音声情報を受信した時には該有音区間音声情報を復号化し、
情報を受信しなかった時には受信した有音声区間音声情報より雑音情報を抽出し、抽出した該雑音情報より無音区間音声情報を生成して復号化する
ことを特徴とする音声間欠通信方式。
音声有音時と音声無音時とでは異なる規則で符号化及び復号化を行う音声間欠通信方式において、
送信側で、
音声有音時には有音区間音声情報を送信し、
音声無音時には無音区間音声情報の送信を停止し、
受信側で、
有音区間音声情報を受信した時には該有音区間音声情報を復号化し、
情報を受信しなかった時には対向局に送信する自局の音声信号より雑音情報を抽出し、
抽出した該雑音情報より無音区間音声情報を生成して復号化する
ことを特徴とする音声間欠通信方式。
音声有音時と音声無音時とでは異なる規則で符号化及び復号化を行う音声間欠通信方式において、
送信側で、
音声有音時には有音区間音声情報を送信し、
音声無音時には無音区間音声情報の送信を停止し、
受信側で、
有音区間音声情報を受信した時には該有音区間音声情報を復号化し、
情報を受信しなかった時には受信した有音声区間音声情報及び、
対向局に送信する自局の音声信号より雑音情報を抽出し、
抽出した該雑音情報より無音区間音声情報を生成して復号化する
ことを特徴とする音声間欠通信方式。