JP2014187620A - 通話遅延低減装置及びプログラム - Google Patents

通話遅延低減装置及びプログラム Download PDF

Info

Publication number
JP2014187620A
JP2014187620A JP2013062222A JP2013062222A JP2014187620A JP 2014187620 A JP2014187620 A JP 2014187620A JP 2013062222 A JP2013062222 A JP 2013062222A JP 2013062222 A JP2013062222 A JP 2013062222A JP 2014187620 A JP2014187620 A JP 2014187620A
Authority
JP
Japan
Prior art keywords
voice
signal processing
signal
sample number
samples
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2013062222A
Other languages
English (en)
Inventor
Hiromi Aoyanagi
弘美 青柳
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Oki Electric Industry Co Ltd
Original Assignee
Oki Electric Industry Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Oki Electric Industry Co Ltd filed Critical Oki Electric Industry Co Ltd
Priority to JP2013062222A priority Critical patent/JP2014187620A/ja
Publication of JP2014187620A publication Critical patent/JP2014187620A/ja
Pending legal-status Critical Current

Links

Images

Landscapes

  • Telephone Function (AREA)

Abstract

【課題】送話信号処理と受話信号処理との処理速度の違いに応じて生じ得る通話遅延を低減することができる通話遅延低減装置及びプログラムを提供する。
【解決手段】送話側の通信遅延低減装置100が、入力された送話音声信号のサンプル数を所定の割合で減じるサンプル数変換手段と、サンプル数変換手段による処理後の送話音声信号を用いて送話信号処理を行う送話信号処理手段と、を備える。また、受話側の通話遅延低減装置が、入力された信号に対して受話信号処理を行う受話信号処理手段と、受話信号処理手段から入力された受話音声信号のサンプル数を処理の割合で減じるサンプル数変換手段と、を備える。
【選択図】図1

Description

本発明は、通話遅延低減装置及びプログラムに関し、例えば、スマートフォンに適用し得るものである。
現在、VoIP(Voice over IP)を利用したIP電話が普及している。これを、パーソナルコンピュータ(PC)などのアプリケーションとして実現するものがあり、一般にソフトフォンと称されている。近年、スマートフォンと呼ばれる携帯型情報端末が普及し、ソフトフォンはスマートフォン上のアプリケーションとして実現される場合が主流となってきている。
ところが、スマートフォンは、PCと同様に、音声通信に特化された機器ではないため、動作クロックの精度が機種毎にばらつきがあり、また、機種が同じであっても製品毎にばらつきも大きい。そのため、対向する端末との間で通話を行う場合、動作クロックの精度が基準から遅い方に変位している端末に音声データが蓄積されていき、通話遅延が発生するという問題が生じ得る。
このような課題を解決するために、例えば、特許文献1に記載される技術がある。特許文献1の記載技術は、通話遅延を低減するために、送話信号の特徴量としてパワーや発話速度やピッチ周波数や発話の間の長さ等を分析し、送話音声の話速を変更するというものである。
特開2010−139571号公報
しかしながら、特許文献1に記載のような技術は、送話音声の特徴量を音響分析する等の複雑な分析処理を行うことが必要となり、その処理負荷が大きくなってしまい、例えばスマートフォンに適用する方法としては不向きである。
本発明は、上述したような課題に鑑みてなされたものであり、送話信号処理と受話信号処理との処理速度の違いに応じて生じ得る通話遅延を低減することができる通話遅延低減装置及びプログラムを提供しようとするものである。
かかる課題を解決するため、第1の本発明は、(1)入力された送話音声信号のサンプル数を所定の割合で減じるサンプル数変換手段と、(2)サンプル数変換手段による処理後の送話音声信号を用いて送話信号処理を行う送話信号処理手段とを備えることを特徴とする通話遅延低減装置である。
第2の本発明は、(1)入力された信号に対して受話信号処理を行う受話信号処理手段と、(2)受話信号処理手段から入力された受話音声信号のサンプル数を処理の割合で減じるサンプル数変換手段とを備えることを特徴とする通話遅延低減装置である。
第3の本発明は、コンピュータを、(1)入力された送話音声信号のサンプル数を所定の割合で減じるサンプル数変換手段と、(2)サンプル数変換手段による処理後の送話音声信号を用いて送話信号処理を行う送話信号処理手段として機能させることを特徴とする通話遅延低減プログラムである。
第4の本発明は、コンピュータを、(1)入力された信号に対して受話信号処理を行う受話信号処理手段と、(2)受話信号処理手段から入力された受話音声信号のサンプル数を処理の割合で減じるサンプル数変換手段として機能させることを特徴とする通話遅延低減プログラムである。
本発明によれば、送話信号処理と受話信号処理との処理速度の違いに応じて生じ得る通話遅延を低減することができる。
第1の実施形態に係る送話信号処理部の機能的構成を示すブロック図である。 第1の実施形態に係る受話信号処理部の機能的構成を示すブロック図である。 第1の実施形態の音声通信システムの全体的な構成を示す全体構成図である。 第1の実施形態に係る送話側のサンプル数変換回路部による処理動作を説明する説明図である。 第1の実施形態に係るサンプル数変換回路部の処理概念を説明する説明図である。 第1の実施形態に係る受話側のサンプル数変換回路部による処理動作を説明する説明図である。 第2の実施形態に係る送話信号処理部の機能的構成を示すブロック図である。 第2の実施形態に係る受話信号処理部の機能的構成を示すブロック図である。 第3の実施形態に係る受話信号処理部の機能的構成を示すブロック図である。 第3の実施形態に係る送話信号処理部の機能的構成を示すブロック図である。
(A)第1の実施形態
以下では、本発明の通話遅延低減装置及びプログラムの第1の実施形態を、図面を参照して詳細に説明する。
(A−1)第1の実施形態の構成
図3は、第1の実施形態の音声通信システムの全体的な構成を示す全体構成図である。図3において、第1の実施形態の音声通信システム9は、ネットワーク2を介して、端末1−1と端末1−2との間で音声通信を行う。
端末1−1及び端末1−2は、音声通信部11及び12を有する端末である。例えば、端末1−1及び端末1−2、スマートフォン、タブレット型コンピュータ、コンピュータ、ゲーム端末等を適用することができる。この実施形態では、説明を容易にするために、端末1−1及び端末1−2がスマートフォンである場合を例示して説明する。
端末1−1及び端末1−2のハードウェア構成は、CPU、ROM、RAM、EEPROM、入出力インターフェース部、通信回路等を有して構成されており、CPUが、ROMに格納される処理プログラムを実行することで、端末1−1及び端末1−2の機能は実現される。
端末1−1及び端末1−2が有する音声通信部11及び12は、ソフトフォン等のように音声通信をソフトウェアで実現するアプリケーションである。音声通信部11及び12は、送話音声信号を処理する送話信号処理部10と、受話音声信号を処理する受話信号処理部20とを有する。
図1は、第1の実施形態に係る送話信号処理部10の機能的構成を示すブロック図である。また、図2は、第1の実施形態に係る受話信号処理部20の機能的構成を示すブロック図である。
図1において、送話信号処理部10は、アナログ/デジタル(A/D)変換部120、通話遅延低減装置100を有する。
A/D変換部120は、入力される動作クロックに基づいて、マイク(図示しない)から入力された送話音声信号(アナログ信号)に対してサンプリング処理及び量子化処理等を施してデジタル変換し、変換後の送話音声信号(デジタル信号)s(n)を通話遅延低減装置100に与えるものである。
通話遅延低減装置100は、A/D変換部120から入力された送話音声信号s(n)に対して所定の送話処理を行うものであって、動作クロックの精度が異なる対向端末1−2との間の通話遅延を低減するために、送話処理の速度を遅らせるものである。
通話遅延低減装置100は、サンプル数変換回路部101、音声圧縮回路部102、音声パケット生成回路部103を有する。
ここで、第1の実施形態に係る通話遅延低減装置100は、専用のICチップ等のハードウェア的に構成することもでき、又、CPUと、CPUが実行するプログラムのようにソフトウェア的に構築することもできるが、機能的には、図1で表すことができる。ソフトウェア的に構成した場合の例としては、スマートフォンに搭載されるアプリケーションの例を挙げることができる。
サンプル数変換回路部101は、入力された送話音声信号s(n)のサンプル数を減じ、サンプル数が減ぜられた信号sd(n)を音声圧縮回路部102に与えるものである。送話音声信号s(n)は、所定のサンプリング周期によりサンプリングされたものであり、所定のサンプル数毎に切り出されたものである。この所定のサンプル数毎に切り出されたものを1フレームとする。
サンプル数変換回路部101は、自端末1−1の送信信号処理よりも、対向する端末1−2内の受話信号処理の処理速度が早くなるように、入力された送話音声信号s(n)のサンプル数を減じる。
サンプル数変換回路部101が送話音声信号s(n)のサンプル数を減じる方法は、種々の方法を広く適用することができる。例えば、サンプル数変換回路部101は、例えば、1フレームの送話音声信号s(n)の単位サンプル数のうち1サンプルを破棄するようにしたり、また例えば、数フレームの送話音声信号s(n)のサンプルのうちの1サンプルを破棄するようにしたりする方法を適用することができる。また、サンプル数変換回路部101は、A/D変換部120のサンプリング周波数変換処理を行い、ダウンサンプリングを行うようにしても良い。
サンプル数変換回路部101によりサンプル数が減ぜられたフレームは、信号sd(n)の1フレームのサンプル数に満たないため信号sd(n)は出力されない。
音声圧縮回路部102は、サンプル数変換回路部101から出力される信号sd(n)を入力し、所定の音声符号化方式を用いてフレーム毎に音声符号化を行い、音声圧縮データdsを音声パケット生成回路部103に与えるものである。音声圧縮回路部102は、1フレーム(所定サンプル数)分の音声信号(音声データ)sd(n)で音声符号化を行う。なお、音声圧縮回路部102による音声符号化方式は、特に限定されるものではなく、種々の方式を広く適用することができる。例えば、G.729等に規定される音声圧縮アルゴリズムを適用することができる。
音声パケット生成回路部103は、音声圧縮回路部102からの音声圧縮データdsを含む音声パケットdspを生成し、その生成した音声パケットdspをネットワーク2に出力するものである。
図2において、受話信号処理部20は、通話遅延低減装置200、デジタル/アナログ(D/A)変換部220を有する。
通話遅延低減装置200は、ネットワーク2から入力された音声パケットdrpに対して受話処理を行うものであって、通話遅延を低減するために、受話処理の速度を早くするものである。
通話遅延低減装置200は、音声パケット分解回路部201、音声伸張回路部202、サンプル数変換回路部203を有する。
ここで、第1の実施形態に係る通話遅延低減装置200は、専用のICチップ等のハードウェア的に構成することもでき、又、CPUと、CPUが実行するプログラムのようにソフトウェア的に構築することもできるが、機能的には、図1で表すことができる。ソフトウェア的に構成した場合の例としては、スマートフォンに搭載されるアプリケーションの例を挙げることができる。
音声パケット分解回路部201は、ネットワーク2から入力された音声パケットdrpに含まれる音声データdrを抽出し、その音声データdrを音声伸張回路部202に与えるものである。
音声伸張回路部202は、音声パケット分解回路部201からの音声データdrを、例えばG.729等の音声圧縮アルゴリズムの音声復号方式を用いて音声伸張処理を行い、フレーム単位の受話音声信号rd(n)を生成するものである。音声伸張回路部202は、生成したフレーム単位の受話音声信号rd(n)をサンプル数変換回路部203に与えるものである。
サンプル数変換回路部203は、音声伸張回路部202から入力される受話音声信号rd(n)のサンプル数を減じ、サンプル数を減じた信号r(n)をD/A変換部220に与えるものである。
サンプル数変換回路部203は、受話音声信号に対する処理速度を早くなるように、入力された受話音声信号rd(n)のサンプル数を減じる。
サンプル数変換回路部203が受話音声信号rd(n)のサンプル数を減じる方法は、種々の方法を広く適用することができる。例えば、サンプル数変換回路部203は、例えば、1フレームの受話音声信号rd(n)の単位サンプル数のうち1サンプルを破棄するようにしたり、また例えば、数フレームの受話音声信号rd(n)のサンプルのうち、1サンプルを破棄するようにしたりする方法を適用することができる。
サンプル数変換回路部203によりサンプル数が減ぜられたフレームは、信号r(n)の1フレームのサンプル数に満たない。そのため、音声信号r(n)の1フレームのサンプル数分を満たすように、即座に次の受話音声信号rd(n)が信号r(n)に変換されて、フレームを満たす分を信号r(n)として出力する。
D/A変換部220は、入力される動作クロックに基づいて、サンプル数変換部203からの音声信号d(n)をアナログ変換して、変換後の音声をスピーカ(図示しない)に出力するものである。
(A−2)第1の実施形態の動作
次に、第1の実施形態の通話遅延低減処理の動作を、図面を参照しながら詳細に説明する。
以下では、端末1−1の動作クロックの精度が、端末1−2の動作クロックの精度よりも相対的に早いほうに変位しているものとする。また、端末1−1が、対向する端末1−2に対して音声信号を送信する場合を例示する。
図1において、端末1−1では、入力される動作クロックに基づいてA/D変換部120によりデジタル変換された送話音声信号s(n)がサンプル数変換回路部101に入力される。
サンプル数変換回路部101は、自端末1−1の送話処理速度よりも、対向する端末1−2内の受話処理速度が早くなるように、入力された送話音声信号s(n)のサンプル数を減じる。
一般的に、端末1−1及び端末1−2内の動作クロックは、所定のクロック周波数で正常動作を行うが、例えば±100ppm(parts per million)程度のクロック周波数の変動範囲がある。
動作クロックのクロック周波数が、クロック周波数変動範囲(許容偏差)内で変動しても、通話を行う端末1−1及び端末1−2の間の通話処理は当然実現されるが、端末1−1及び端末1−2の動作クロックの精度は、機種や製品毎にばらつきがある。
ここで、端末1−1の動作クロックの精度は、端末1−2の動作クロックの精度よりも相対的に早いほうに変位している。この場合、端末1−1における送話信号処理の処理速度は、端末1−2における受話信号処理の処理速度よりも早くなるため、端末1−1から送信された音声信号は端末1−2において蓄積される。つまり、動作クロックの精度が相対的に遅い方に変位している端末1−2において音声信号が蓄積されてしまい、通話遅延が生じ得ることになる。
そこで、受話側の端末1−2における音声データの蓄積を低減するために、サンプル数変換回路部101は、対向する端末1−2内の受話信号処理部20の処理速度が早くなるように、送話音声信号s(n)のサンプル数を減じる。
図4は、第1の実施形態に係るサンプル数変換回路部101による処理動作を説明する説明図である。図4において、丸数字は、サンプリングデータ(すなわち、サンプリングされた音声データ)である。
図4(A)は、送話音声信号s(n)の信号列である。ここでは説明を容易にするために、送話音声信号s(n)の1フレームが3サンプルであるものとする場合を例示する。
図4(B)に示すように、サンプル数変換回路部101は、入力された送話音声信号s(n)のうち、サンプル数を減じるため、「5」のサンプルと「9」のサンプルを破棄する。サンプル数変換回路部101から出力される音声信号sd(n)は音声圧縮回路部102に与えられる。
音声圧縮回路部102は、1フレーム分の音声信号(音声データ)sd(n)で音声符号化を行う。そうすると、図4(C)に示すように、第1のフレームについてはサンプルが破棄されていないため、音声圧縮回路部102は、1フレーム分の「1」「2」「3」の音声データを音声符号化する。
次に、第2のフレームについては「5」の音声データが破棄されている。音声圧縮回路部102は、1フレーム分の音声データで音声符号化を行う。そのため、図4(C)に示すように、音声圧縮回路部102は、第2のフレームの「4」及び「6」の音声データと、次の送話音声信号s(n)の「7」の音声データとを取り出して音声圧縮信号dsを生成する。
さらに、第3のフレームについては「9」の音声データが破棄されている。この場合も上記と同様に、音声圧縮回路部102は、第3のフレームの「8」の音声データと、その次の第4のフレームの「10」及び「11」の音声データを取出して音声圧縮信号dsを生成する。
このように、端末1−1において、サンプル数変換回路部101により送話音声信号s(n)のサンプル数が減ぜられ、音声圧縮回路部102により1フレーム分の音声データで音声符号化がなされたものが音声パケット化されて、音声パケットdspが端末1−2に送信される。
端末1−2では、音声パケット分解回路部201が音声パケットdrpに含まれる音声データdrを抽出し、音声伸張回路部202が1フレーム分の音声データdrで音声復号を行い、受話音声信号rd(n)を生成する(図4(D)、図4(E)参照)。
このとき、送話側である端末1−1において、サンプル数変換回路部101が送話音声信号s(n)のサンプルを減じているから、その分、受話側である端末1−2では、受話音声信号rd(n)のサンプル数が少なくなり、受話信号処理の処理速度が早くなる。その結果、端末1−2での音声データの蓄積量が低減し、通話遅延が低減する。
ここで、端末1−1のサンプル数変換回路部101によるサンプル数を減じる手法の概念を、図5を用いて説明する。
図5に示すように、動作クロックのクロック周波数は、周波数変動の範囲(許容偏差)がある。図5に示すように、端末1−1の動作クロックの精度が、端末1−2の動作クロックの精度よりも相対的に早いほうに変位している場合、端末1−2での音声データの蓄積が生じ得る。
従って、端末1−2の音声データの蓄積を低減させるためには、端末1−1の動作クロックの精度が、端末1−2の動作クロックの精度よりも相対的に遅いほうに変位させることが望ましい。
そこで、端末1−1のサンプル数変換回路部101は、動作クロックの許容偏差範囲の下限値付近に変位させたときに相当する処理速度となるように、送話音声信号s(n)のサンプルを減じるようにする。これにより、少なくとも、送話側である端末1−1の送話処理速度を、受話側の端末1−2の受話処理速度よりも遅くすることができるため、受話側での音声データの蓄積を低減させることができる。
なお、上記の例では、端末1−1のサンプル数変換回路部101が、送話音声信号s(n)のサンプルを減じる方法として、サンプルを破棄する場合を例示したが、その他の方法を適用するようにしても良い。
例えば、サンプル数変換回路部101は、A/D変換部120のサンプリング周波数をダウンサンプリングするようにしても良い。この場合も、図5に示す動作クロックの精度の許容偏差範囲の下限値付近に変位させるようにすることで実現できる。
また例えば、サンプリング数変換回路部101は、隣接する複数個のサンプルの音声データ値を用いて相加平均等の平均化処理を行い、サンプル数を減じるようにしても良い。この場合、サンプル数を減じて行なわれる送話信号処理が、動作クロックの精度の許容偏差範囲の下限値付近に変位させたときに相当する処理速度となるようにすることが望ましい。
次に、受話側である端末1−2における通話遅延低減処理を説明する。
端末1−2において、ネットワーク2からの音声パケットdrpが入力されると、音声パケット分解回路部201が、入力された音声パケットdrpに含まれる音声データdrを抽出する。
音声パケット分解回路部201からの音声データdrが音声伸張回路部202に入力されると、音声伸張回路部202は、1フレーム分の音声データdrで復号処理を行い、復号した受話音声信号rd(n)をサンプル数変換回路部203に与える。
サンプル数変換回路部203は、音声伸張回路部202から入力される受話音声信号rd(n)のサンプル数を減じ、サンプル数を減じた信号r(n)をD/A変換部220に与える。
図6は、第1の実施形態に係るサンプル数変換回路部203による処理動作を説明する説明図である。図6において、丸数字は、サンプルされた音声データである。
図6(A)は、受話音声信号rd(n)の信号列である。ここでは説明を容易にするために、受話音声信号rd(n)の1フレームが3サンプルであるものとする場合を例示する。
図6(B)に示すように、サンプル数変換回路部203は、入力された受話音声信号rd(n)のうち、サンプル数を減じるため、「5」のサンプルと「9」のサンプルを破棄する。
このように、サンプル数変換回路部203が受話音声信号rd(n)のサンプルを破棄することにより、受話音声信号rd(n)のサンプル数が減じられるから、その分、受話音声信号rd(n)のサンプル数が少なくなり、受話信号処理の処理速度が早くなる。その結果、音声データの蓄積が低減し、通話遅延が低減する。
ここで、端末1−2のサンプル数変換回路部203によるサンプル数を減じる手法の概念を、図5を用いて説明する。
図5において、端末1−2の受話処理速度が、端末1−1の送話処理速度よりも早くするためには、端末1−2の動作クロックの精度が、端末1−1の動作クロックよりも相対的に早いほうに変位させたときに相当する処理速度にすることが望ましい。
そこで、端末1−2のサンプル数変換回路部203は、動作クロックの許容偏差範囲の上限値付近に変位させたときに相当する処理速度となるように、受話音声信号rd(n)のサンプルを減じるようにする。これにより、少なくとも、受話側である端末1−2の受話処理速度を、送話側の端末1−1の送話処理速度よりも早くすることができるため、受話側での音声データの蓄積を低減させることができる。
なお、上記の例では、端末1−2のサンプル数変換回路部203が、受話音声信号rd(n)のサンプルを減じる方法として、サンプルを破棄する場合を例示したが、その他の方法を適用するようにしても良い。
例えば、サンプル数変換回路部203は、D/A変換部220のサンプリング周波数をアップサンプリングするようにしても良い。この場合も、図5に示す動作クロックの精度の許容偏差範囲の下限値付近に変位させるようにすることで実現できる。
また例えば、サンプリング数変換回路部203は、隣接するサンプルの音声データ値を用いて相加平均等の平均化処理を行い、サンプル数を減じるようにしても良い。この場合、サンプル数を減じて行なわれる受話信号処理が、動作クロックの精度の許容偏差範囲の上限値付近に変位させたときに相当する処理速度となるようにすることが望ましい。
(A−3)第1の実施形態の効果
以上のように、第1の実施形態によれば、以下のような効果を奏することができる。
送話側の処理に関して、基準の処理(サンプル数を減じない場合)に比べると、ds(n)が生成されないフレームが生じるために音声圧縮の起動タイミングが徐々に遅れていく。即ち、送話処理の速度が遅くなるため、対向側がクロックの精度が遅い方に変位している場合でも、対向側にて音声データが蓄積されていくことがない。
受信側の処理に関して、基準の処理に比べると、一度に2回rs(n)が消費されるフレームが生じるため音声伸張の起動タイミングが徐々に早くなっていく。即ち、受話処理の速度が速くなるため、対向側がクロックの精度が早い方に変位している場合でも、自端末にて音声データが蓄積されていくことがない。
以上のように、対向側及び自端末側に音声データが蓄積されていくことがなく、通話遅延が生じない。
(B)第2の実施形態
次に、本発明の通話遅延低減装置及びプログラムの第2の実施形態を、図面を参照しながら詳細に説明する。
(B−1)第2の実施形態の構成
図7は、第2の実施形態に係る送話信号処理部10の機能的構成を示すブロック図である。図7において、第2の実施形態の送話信号処理部10アナログ/デジタル(A/D)変換部120、通話遅延低減装置100を有する。
第2の実施形態は、通話遅延低減装置100が、サンプル数変換回路部101、音声圧縮回路部102、音声パケット生成回路部103に加えて、有音無音判定部104を有する点で第1の実施形態と異なる。
有音無音判定部104は、送話音声信号が有音であるか又は無音であるかを判定し、無音である場合に、その旨をサンプル数変換回路部101に通知するものである。
サンプル数変換回路部101は、有音無音判定部104から無音である旨の通知を受けると、第1の実施形態と同様にして、送話音声信号のサンプルを減じる処理を行う。
第2の実施形態は、有音無音判定部104を備え、サンプル数変換回路部101が、無音期間に送話音声信号s(n)のサンプルを減じることができる。これにより、有音期間に送話音声信号のサンプルを減じる場合には、受話側のユーザが「プツ」というような不快な音が聞こえる場合があるが、無音期間に送話音声信号のサンプルを減じることにより、そのような音が生じないため、通話品質を保持することができる。
図8は、第2の実施形態に係る受話信号処理部20の機能的構成を示すブロック図である。図8において、第2の実施形態の受話信号処理部20は、アナログ/デジタル(A/D)変換部220、通話遅延低減装置200を有する。
第2の実施形態は、通話遅延低減装置200が、音声パケット分解回路部201、音声伸張回路部202、サンプル数変換回路部203に加えて、有音無音判定部204を有する点で第1の実施形態と異なる。
有音無音判定部204は、受話音声信号が有音であるか又は無音であるかを判定し、無音である場合に、その旨をサンプル数変換回路部203に通知するものである。
サンプル数変換回路部203は、有音無音判定部204から無音である旨の通知を受けると、第1の実施形態と同様にして、受話音声信号のサンプルを減じる処理を行う。
つまり、受話信号処理部20においても、有音無音判定部204を備え、サンプル数変換回路部203が、無音期間に送話音声信号s(n)のサンプルを減じることができる。このように、無音期間に送話音声信号のサンプルを減じることにより、そのような音が生じないため、通話品質を保持することができる。
(B−2)第2の実施形態の効果
以上のように、第2の実施形態によれば、第1の実施形態の効果に加えて、無音期間に送話音声信号、受話音声信号のサンプルを減じることができるので通話品質を保持することができる。
(C)第3の実施形態
次に、本発明の通話遅延低減装置及びプログラムの第2の実施形態を、図面を参照しながら詳細に説明する。
(C−1)第3の実施形態の構成
図9は、第3の実施形態に係る受話信号処理部20の機能的構成を示すブロック図である。図9において、第3の実施形態の受話信号処理部20は、アナログ/デジタル(A/D)変換部220、通話遅延低減装置200を有する。
第3の実施形態は、通話遅延低減装置200が、音声パケット分解回路部201、音声伸張回路部202、サンプル数変換回路部203に加えて、変換切替部205を有する点で第1の実施形態と異なる。
なお、図9は、第1の実施形態の構成要素に変換切替部205を加える場合を例示するが、第2の実施形態の構成に変換切替部205を加えるようにしても良い。
変換切替部205は、サンプル数変換回路部203が受話音声信号rd(n)のサンプルを減じる割合を切り替えるものである。
図5において、第1の実施形態では、サンプル数変換回路部203は、動作クロックの許容偏差範囲の上限値付近に変位させたときに相当する処理速度となるように、受話音声信号rd(n)のサンプルを減じるようにした。
しかし、受話側の受話信号処理部20において音声データの蓄積を少なくするためには、端末1−2の動作クロックの精度が、端末1−1の動作クロックよりも相対的に早いほうに変位させたときに相当する処理速度であればよい。
つまり、図5において、端末1−2の動作クロックの精度が、許容偏差の上限値から端末1−1の動作クロックまでの間にあればよく、変換切替部205は、許容偏差の上限値の付近から端末1−1の動作クロックの方に近づくように
サンプル数変換回路部203のサンプル数を減じる割合を切替制御する。
例えば、変換切替部205は、受話側の音声データのバッファ蓄積量を監視し、バッファ蓄積量が多い場合にはサンプル数変換回路部203が減じるサンプルの割合を高めるように制御する。
一方、変換切替部205がバッファアンダーフローを検出すると、受話処理速度が送話処理速度より早くなった状態とみることができる。そのため、変換切替部205は、サンプル数変換回路部203が減じるサンプルの割合を低下させるように制御する。
換言すると、変換切替部205は、以下の通話低減条件を満たすように、サンプル数変換回路部203の動作を制御する。
例えば、音声伸張回路部202の動作クロックのクロック周波数が「x(kHz)」であり、音声パケット分解回路部201の動作クロックのクロック周波数が「y(kHz)」であるとする。このとき、音声データの蓄積をなくす通話遅延低減条件は、バッファをアンダーフローにすることである。つまり、音声伸張回路部202の処理速度が音声パケット分解回路部201の処理速度以上である場合であるから、変換切替部205は、「x≧y」の条件を満たすように、サンプル数変換回路部203の動作を制御する。
図10は、第3の実施形態に係る送話信号処理部10の機能的構成を示すブロック図である。図10において、第3の実施形態の送話信号処理部10は、アナログ/デジタル(A/D)変換部120、通話遅延低減装置100を有する。
第3の実施形態は、通話遅延低減装置100が、サンプル数変換回路部101、音声圧縮回路部102、音声パケット生成回路部103に加えて、変換切替部105を有する点で第1の実施形態と異なる。
なお、図10は、第1の実施形態の構成要素に変換切替部105を加える場合を例示するが、第2の実施形態の構成に変換切替部105を加えるようにしても良い。
変換切替部105は、サンプル数変換回路部101が送話音声信号s(n)のサンプルを減じる割合を切り替えるものである。
図5において、第1の実施形態では、サンプル数変換回路部101は、動作クロックの許容偏差範囲の下限値付近に変位させたときに相当する処理速度となるように、送話音声信号s(n)のサンプルを減じるようにした。
しかし、受話側の端末1−2において音声データの蓄積を少なくするためには、端末1−1の動作クロックの精度が、端末1−2の動作クロックよりも相対的に遅いほうに変位させたときに相当する処理速度であればよい。
つまり、図5において、端末1−1の動作クロックの精度が、許容偏差の下限値から端末1−2の動作クロックまでの間にあればよい。変換切替部105は、許容偏差の下限値の付近から端末1−2の動作クロックの方に近づくように
サンプル数変換回路部101のサンプル数を減じる割合を切替制御する。
ここで、受話側である端末1−2の送話信号処理部10の音声パケット生成回路部103と受話信号処理部20の音声パケット分解回路部201とは同調している。また、ネットワーク2を介して、端末1−1は端末1−2との間で音声パケットの処理タイミングを同期しているから、端末1−1の音声パケット生成回路部103は、端末1−2の音声パケット分解回路部201とは同調している。端末1−1の音声パケット生成回路部103と端末1−1の音声パケット分解回路部201とは同調していない。
従って、端末1−1において、音声パケット分解回路部201の動作クロックのクロック周波数が「y(kHz)」とし、音声圧縮回路部102の動作クロックのクロック周波数が「X(kHz)」としたときに、変換切替部105は、「X≦y」としたときに、少なくとも、端末1−1の音声パケット生成回路部103が音声圧縮回路部102よりも早く処理することができる。
(C−2)第3の実施形態の効果
以上のように、第3の実施形態によれば、第1及び第2の実施形態の効果に加えて、サンプル数変換回路部のサンプルを減じる割合を調整することができる。そのため、送話側と受話側との間で送話処理速度と受話処理速度の調整を行うことができる。
(D)他の実施形態
上述した第1〜第3の実施形態においても本発明の種々の変形実施形態を説明したが、本発明は、以下のような他の実施形態にも適用することができる。
(D−1)上述した第1の実施形態では、送話側のサンプル数変換回路部101が、動作クロックの精度の許容偏差の下限値付近に変位させたときに相当する処理速度になるように、送話音声信号s(n)のサンプル数を減じる場合を例示した。
しかし、許容偏差の下限値付近の処理速度にすることに限定されない。送話側の端末1−1は、受話側の端末1−2の動作クロックの精度を知ることができない。そのため、許容偏差の最遅値である下限値付近に変位させたときの処理速度にすれば、少なくとも受話側の端末1−2の受話信号処理の処理速度よりは遅くなるという意味である。
サンプル数変換回路部101は、送話処理速度が受話処理速度よりも相対的に遅くなるようにすることを本質的な意図するものである。
同様に、受話側の送話側のサンプル数変換回路部203も、動作クロックの精度の許容偏差の上限値付近に変位させたときに相当する処理速度になるように、受話音声信号rd(n)のサンプル数を減じる場合を例示した。しかし、上記と同様の観点から、許容偏差の上限値付近に処理速度にすることに限定されない。サンプル数変換回路部203は、受話処理速度が送話処理速度よりも相対的に早くなるようにすることを本質的な意図するものである。
10…送話信号処理部、100…通話遅延低減装置、101…サンプル数変換回路部、102…音声圧縮回路部、103…音声パケット生成回路部、104…有音無音判定部、105…変換切替部、
20…受話信号処理部、200…通話遅延低減装置、201…音声パケット分解回路部、202…音声伸張回路部、203…サンプル数変換回路部、204…有音無音判定部、205…変換切替部。

Claims (8)

  1. 入力された送話音声信号のサンプル数を所定の割合で減じるサンプル数変換手段と、
    上記サンプル数変換手段による処理後の送話音声信号を用いて送話信号処理を行う送話信号処理手段と
    を備えることを特徴とする通話遅延低減装置。
  2. 上記入力された送話音声信号が有音であるか又は無音であるかを判定する有音無音判定手段を備え、
    上記サンプル数変換手段が、無音期間において、上記送話音声信号のサンプル数を減じるものである
    ことを特徴とする請求項1に記載の通話遅延低減装置。
  3. 入力された信号に対して受話信号処理を行う受話信号処理手段を備え、
    上記送話信号処理手段が音声圧縮部を有するものであり、
    上記サンプル数変換手段は、上記受話信号処理手段と上記音声圧縮部との処理速度に応じて、上記送話音声信号のサンプル数を減じるものである
    ことを特徴とする請求項1又は2に記載の通話遅延低減装置。
  4. 入力された信号に対して受話信号処理を行う受話信号処理手段と、
    上記受話信号処理手段から入力された受話音声信号のサンプル数を処理の割合で減じるサンプル数変換手段と
    を備えることを特徴とする通話遅延低減装置。
  5. 上記受話音声信号が有音であるか又は無音であるかを判定する有音無音判定手段を備え、
    上記サンプル数変換手段が、無音期間において、上記受話音声信号のサンプル数を減じるものである
    ことを特徴とする請求項4に記載の通話遅延低減装置。
  6. 上記受話信号処理手段が、音声パケット分解部と音声伸張部とを有するものであり、
    上記サンプル数変換手段が、上記音声パケット分解部と上記音声伸張部との処理速度に応じて、上記受話音声信号のサンプル数を減じるものである
    ことを特徴とする請求項4又は5に記載の通話遅延低減装置。
  7. コンピュータを、
    入力された送話音声信号のサンプル数を所定の割合で減じるサンプル数変換手段と、
    上記サンプル数変換手段による処理後の送話音声信号を用いて送話信号処理を行う送話信号処理手段と
    して機能させることを特徴とする通話遅延低減プログラム。
  8. コンピュータを、
    入力された信号に対して受話信号処理を行う受話信号処理手段と、
    上記受話信号処理手段から入力された受話音声信号のサンプル数を処理の割合で減じるサンプル数変換手段と
    して機能させることを特徴とする通話遅延低減プログラム。
JP2013062222A 2013-03-25 2013-03-25 通話遅延低減装置及びプログラム Pending JP2014187620A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2013062222A JP2014187620A (ja) 2013-03-25 2013-03-25 通話遅延低減装置及びプログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2013062222A JP2014187620A (ja) 2013-03-25 2013-03-25 通話遅延低減装置及びプログラム

Publications (1)

Publication Number Publication Date
JP2014187620A true JP2014187620A (ja) 2014-10-02

Family

ID=51834710

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2013062222A Pending JP2014187620A (ja) 2013-03-25 2013-03-25 通話遅延低減装置及びプログラム

Country Status (1)

Country Link
JP (1) JP2014187620A (ja)

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005300765A (ja) * 2004-04-08 2005-10-27 Mitsubishi Electric Corp 音声伝送装置
WO2006009087A1 (ja) * 2004-07-20 2006-01-26 Matsushita Electric Industrial Co., Ltd. ストリームデータ受信再生装置およびストリームデータ受信再生方法
JP2010224179A (ja) * 2009-03-23 2010-10-07 Oki Electric Ind Co Ltd 受信装置、方法及びプログラム

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005300765A (ja) * 2004-04-08 2005-10-27 Mitsubishi Electric Corp 音声伝送装置
WO2006009087A1 (ja) * 2004-07-20 2006-01-26 Matsushita Electric Industrial Co., Ltd. ストリームデータ受信再生装置およびストリームデータ受信再生方法
JP2010224179A (ja) * 2009-03-23 2010-10-07 Oki Electric Ind Co Ltd 受信装置、方法及びプログラム

Similar Documents

Publication Publication Date Title
JP6558748B2 (ja) 音声/オーディオ信号処理方法および装置
US11605394B2 (en) Speech signal cascade processing method, terminal, and computer-readable storage medium
US9294834B2 (en) Method and apparatus for reducing noise in voices of mobile terminal
US20150088528A1 (en) Decoding apparatus and method, audio signal processing apparatus and method, and program
CN102355484B (zh) 一种音频数据传输的方法
TWI480861B (zh) 用於控制聲頻信號之時間縮放的方法、裝置及系統
KR101516113B1 (ko) 음성 복호 장치
EP3376499B1 (en) Speech/audio signal processing method and coding apparatus
JP2014187620A (ja) 通話遅延低減装置及びプログラム
JP2004264497A (ja) 音声復号装置
JP4135621B2 (ja) 受信装置および方法
Florencio et al. Enhanced adaptive playout scheduling and loss concealment techniques for voice over ip networks
JP6031752B2 (ja) 音声通信装置及びプログラム
EP2482533A2 (en) Echo suppression
US9111527B2 (en) Encoding device, decoding device, and methods therefor
JP2010224179A (ja) 受信装置、方法及びプログラム
US10056093B2 (en) Encoding device, decoding device, and communication system for extending voice band
JP2018137614A (ja) 通信装置、通信システム、通信方法及びプログラム
JP2013046238A (ja) インターホン装置
Borgh et al. Efficient asynchronous re-sampling implementation on a low-power fixed-point DSP
JP2010026243A (ja) 自動話速変換装置
JP5201259B2 (ja) 音声の基本周期を検出する装置およびその基本周期を用いて話速変換を行う装置
JP2012182618A (ja) 映像音声処理装置および映像音声処理方法
JP2013074424A (ja) 音声通信システム、音声通信装置及びプログラム
JP2016158133A (ja) 通信装置、遅延回復方法および遅延回復プログラム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20151117

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20160816

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20160927

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20161128

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20170502