JP7334846B2 - 通信伝送装置、音声障害検出方法、および、プログラム - Google Patents
通信伝送装置、音声障害検出方法、および、プログラム Download PDFInfo
- Publication number
- JP7334846B2 JP7334846B2 JP2022502768A JP2022502768A JP7334846B2 JP 7334846 B2 JP7334846 B2 JP 7334846B2 JP 2022502768 A JP2022502768 A JP 2022502768A JP 2022502768 A JP2022502768 A JP 2022502768A JP 7334846 B2 JP7334846 B2 JP 7334846B2
- Authority
- JP
- Japan
- Prior art keywords
- arithmetic processing
- bit string
- audio
- bit
- communication transmission
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000004891 communication Methods 0.000 title claims description 65
- 230000005540 biological transmission Effects 0.000 title claims description 58
- 238000001514 detection method Methods 0.000 title claims description 46
- PWPJGUXAGUPAHP-UHFFFAOYSA-N lufenuron Chemical compound C1=C(Cl)C(OC(F)(F)C(C(F)(F)F)F)=CC(Cl)=C1NC(=O)NC(=O)C1=C(F)C=CC=C1F PWPJGUXAGUPAHP-UHFFFAOYSA-N 0.000 title 1
- 238000012545 processing Methods 0.000 claims description 132
- 208000011293 voice disease Diseases 0.000 claims description 25
- 206010013952 Dysphonia Diseases 0.000 claims description 22
- 208000023180 voice disturbance Diseases 0.000 claims description 22
- 230000006735 deficit Effects 0.000 claims description 2
- 238000010586 diagram Methods 0.000 description 10
- 238000000034 method Methods 0.000 description 10
- 238000006243 chemical reaction Methods 0.000 description 9
- 238000012423 maintenance Methods 0.000 description 9
- 230000005236 sound signal Effects 0.000 description 8
- 230000000694 effects Effects 0.000 description 6
- 230000006870 function Effects 0.000 description 5
- 230000000052 comparative effect Effects 0.000 description 4
- 230000003287 optical effect Effects 0.000 description 2
- 230000003321 amplification Effects 0.000 description 1
- 239000004020 conductor Substances 0.000 description 1
- 230000006866 deterioration Effects 0.000 description 1
- 230000002542 deteriorative effect Effects 0.000 description 1
- 238000002592 echocardiography Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000003199 nucleic acid amplification method Methods 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/48—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use
- G10L25/69—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for evaluating synthetic or decoded voice signals
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04M—TELEPHONIC COMMUNICATION
- H04M3/00—Automatic or semi-automatic exchanges
- H04M3/22—Arrangements for supervision, monitoring or testing
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0208—Noise filtering
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04M—TELEPHONIC COMMUNICATION
- H04M1/00—Substation equipment, e.g. for use by subscribers
- H04M1/24—Arrangements for testing
Landscapes
- Engineering & Computer Science (AREA)
- Signal Processing (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Quality & Reliability (AREA)
- Maintenance And Management Of Digital Transmission (AREA)
- Telephonic Communication Services (AREA)
Description
本発明は、音声信号に対してデジタル処理を行う、通信伝送装置、通信伝送装置の音声障害検出方法、および、プログラムに関する。
音声信号(音声データ)の通信を行う通信伝送装置では、音声信号を所定仕様のデータに変換するコーデック変換処理や、エコー成分をキャンセルするエコーキャンセル処理等を施すデジタルの演算処理が行われている(例えば、特許文献1参照)。
コーデック変換処理では、一方のコーデック形式による音声信号が、他方において通信可能なコーデック形式の音声信号に変換される。エコーキャンセル処理では、電話機のスピーカから出た音声をマイクで拾って発生するエコーが除去される。
上記のデジタル処理を行う通信伝送装置では、音声信号に対してコーデック変換処理やエコーキャンセル処理等の演算処理を行った場合、処理前後においてデータの同一性が保証されない場合がある。しかしながら、通信伝送装置の演算処理の誤りで、当該演算処理前後の音声信号が異なっていても、必ずしも人の耳で音声が聞き取りにくくなる等の音声障害が発生しているとは限らない。このため、デジタル化された音声信号の単純比較では、音声障害が発生しているかを判定することが難しかった。
このような点を鑑みて本発明がなされたのであり、本発明は、音声信号に対するコーデック変換処理やエコーキャンセル処理等の演算処理後の音声障害を適正に判定することを課題とする。
本発明に係る通信伝送装置は、音声データを伝送する通信伝送装置であって、入力された所定時間の音声データを、単位時間ごとに区切り、前記単位時間ごとの音声データの音声レベルが所定の閾値を超えているか否かにより0または1のビット値で示されるビット列に変換する入力音声レベル検出部と、前記音声データに対して所定の演算処理を行う演算処理部と、前記演算処理部が出力した所定時間の演算処理後の音声データを、前記単位時間ごとに区切り、前記単位時間ごとの音声データの音声レベルが前記所定の閾値を超えているか否かにより0または1のビット値で示されるビット列に変換する出力音声レベル検出部と、前記入力音声レベル検出部が変換した演算処理前のビット列と、前記出力音声レベル検出部が変換した演算処理後のビット列とを比較する所定のロジックに基づき、音声障害が発生しているか否かを判定する比較判定部と、を備えることを特徴とする。
本発明によれば、音声信号に対するコーデック変換処理やエコーキャンセル処理等の演算処理後の音声障害を適正に判定することができる。
次に、本発明を実施するための形態(以下、「本実施形態」と称する。)について説明する。
本実施形態に係る通信伝送装置1(1A,1B)(後記する図1,図4参照)は、デジタル化された音声データそのものを比較するのではなく、演算処理前後において、音声データの音声レベルの大小を検出しビット列に変換する。そして、通信伝送装置1は、演算処理前後のビット列を所定のロジックに基づき比較することにより、演算処理誤りによるチャネル間の入れ替わりや雑音等の音声障害を検出する。
以下、第1実施形態においては、通信伝送装置1(1A)が、演算処理前後において、音声データの音声レベルをビット列に変換し、そのビット列の変化パターンを比較することにより、音声障害の発生を検出する例について説明する。また、第2実施形態においては、通信伝送装置1(1B)が、演算処理前後において音声レベルを変換した各ビットの変化タイミングを比較することにより、音声障害の発生を検出する例について説明する。
本実施形態に係る通信伝送装置1(1A,1B)(後記する図1,図4参照)は、デジタル化された音声データそのものを比較するのではなく、演算処理前後において、音声データの音声レベルの大小を検出しビット列に変換する。そして、通信伝送装置1は、演算処理前後のビット列を所定のロジックに基づき比較することにより、演算処理誤りによるチャネル間の入れ替わりや雑音等の音声障害を検出する。
以下、第1実施形態においては、通信伝送装置1(1A)が、演算処理前後において、音声データの音声レベルをビット列に変換し、そのビット列の変化パターンを比較することにより、音声障害の発生を検出する例について説明する。また、第2実施形態においては、通信伝送装置1(1B)が、演算処理前後において音声レベルを変換した各ビットの変化タイミングを比較することにより、音声障害の発生を検出する例について説明する。
<第1実施形態>
図1は、本発明の第1実施形態に係る通信伝送装置1(1A)の構成を示すブロック図である。
この通信伝送装置1(1A)は、制御部、入出力部、記憶部(いずれも図示省略)を備えるコンピュータにより構成される(詳細は後記)。また、制御部は、図1に示すように、演算処理部10と、入力音声レベル検出部11と、出力音声レベル検出部12と、比較判定部13(13A)と、を含んで構成される。
図1は、本発明の第1実施形態に係る通信伝送装置1(1A)の構成を示すブロック図である。
この通信伝送装置1(1A)は、制御部、入出力部、記憶部(いずれも図示省略)を備えるコンピュータにより構成される(詳細は後記)。また、制御部は、図1に示すように、演算処理部10と、入力音声レベル検出部11と、出力音声レベル検出部12と、比較判定部13(13A)と、を含んで構成される。
演算処理部10は、入力された音声データに対して、例えば、コーデック変換処理やエコーキャンセル処理等の所定の演算処理を行う。
入力音声レベル検出部11は、端末(例えば、IP電話機)等から通信伝送装置1に入力された所定時間の音声データ100を、音声レベルの判定周期となる単位時間ごとに区切り、単位時間ごとの音声レベルの大小を所定の閾値を超えているか否かにより判定する。そして、入力音声レベル検出部11は、判定した結果をビット列101に変換する。具体的には、入力音声レベル検出部11は、音声レベルが所定の閾値を超えていた場合にはビット値「1」とし、所定の閾値以下である場合にはビット値「0」とし、単位時間ごとに音声レベルを判定することによりビット列101に変換する。
入力音声レベル検出部11は、受信した音声データ100については、そのまま演算処理部10に出力する。そして、入力音声レベル検出部11は、変換したビット列101については、比較判定部13(13A)に出力する。
出力音声レベル検出部12は、演算処理部10から出力される(演算処理後の)音声データ100aを受信すると、入力音声レベル検出部11と同様に、所定時間に受信した音声データ100aを音声レベルの判定周期となる単位時間ごとに区切り、単位時間ごとの音声レベルの大小を所定の閾値を超えているか否かにより判定する。そして、出力音声レベル検出部12は、判定した結果をビット列101aに変換する。具体的には、出力音声レベル検出部12は、音声レベルが所定の閾値を超えていた場合にはビット値「1」とし、所定の閾値以下である場合にはビット値「0」とし、単位時間ごとに音声レベルを判定することによりビット列101aに変換する。
出力音声レベル検出部12は、受信した音声データ100aについては、そのまま通信先となる端末(例えば、IP電話等)に出力する。そして、出力音声レベル検出部12は、変換したビット列101aについては、比較判定部13(13A)に出力する。
比較判定部13(13A)は、演算処理部10における演算処理前後のビット列を比較する所定のロジックに基づき、音声障害が発生しているか否かの判定を行う。
具体的には、比較判定部13Aは、入力音声レベル検出部11からビット列101を取得し、出力音声レベル検出部12からビット列101aを取得すると、それぞれのビット列における最初のビット変化の時間差を固定遅延として設定する。これは、演算処理部10での処理遅延の影響を補償するためである。比較判定部13Aは、入力音声レベル検出部11から取得した演算処理前のビット列101と、出力音声レベル検出部12から取得した演算処理後のビット列101aとについて、ビット列(音声レベル)の変化パターンを比較することにより、音声障害の判定を行う。
具体的には、比較判定部13Aは、入力音声レベル検出部11からビット列101を取得し、出力音声レベル検出部12からビット列101aを取得すると、それぞれのビット列における最初のビット変化の時間差を固定遅延として設定する。これは、演算処理部10での処理遅延の影響を補償するためである。比較判定部13Aは、入力音声レベル検出部11から取得した演算処理前のビット列101と、出力音声レベル検出部12から取得した演算処理後のビット列101aとについて、ビット列(音声レベル)の変化パターンを比較することにより、音声障害の判定を行う。
図2は、本発明の第1実施形態に係る通信伝送装置1(1A)による、音声障害の判定を説明するための図である。
符号2-1で示す、ビット列の比較例は、演算処理前後でビット列が一致しており、音声障害が発生していない例である。
演算処理前の音声データ100は、入力音声レベル検出部11により、ビット列101に変換されている。一方、演算処理後の音声データ100aは、出力音声レベル検出部12により、ビット列101aに変換されている。
比較判定部13(13A)は、演算処理前のビット列101と、演算処理後のビット列101aの各ビットの値が一致している、つまり、音声レベルの変化パターンが一致していることにより、音声障害の発生はないと判定する。
符号2-1で示す、ビット列の比較例は、演算処理前後でビット列が一致しており、音声障害が発生していない例である。
演算処理前の音声データ100は、入力音声レベル検出部11により、ビット列101に変換されている。一方、演算処理後の音声データ100aは、出力音声レベル検出部12により、ビット列101aに変換されている。
比較判定部13(13A)は、演算処理前のビット列101と、演算処理後のビット列101aの各ビットの値が一致している、つまり、音声レベルの変化パターンが一致していることにより、音声障害の発生はないと判定する。
符号2-2で示す、ビット列の比較例は、演算処理前後でビット列が不一致であり、音声障害が発生している例である。
演算処理前の音声データ100は、入力音声レベル検出部11により、ビット列101に変換されている。一方、演算処理後の音声データ100aは、出力音声レベル検出部12により、ビット列101aに変換されている。
比較判定部13(13A)は、演算処理前のビット列101と、演算処理後のビット列101aとにおいて、ビットの値が一致していない箇所がある、つまり、音声レベルの変化パターンが一致していないことにより、音声障害が発生していると判定する。
演算処理前の音声データ100は、入力音声レベル検出部11により、ビット列101に変換されている。一方、演算処理後の音声データ100aは、出力音声レベル検出部12により、ビット列101aに変換されている。
比較判定部13(13A)は、演算処理前のビット列101と、演算処理後のビット列101aとにおいて、ビットの値が一致していない箇所がある、つまり、音声レベルの変化パターンが一致していないことにより、音声障害が発生していると判定する。
比較判定部13(13A)は、演算処理前後のビット列が不一致であり、音声障害が発生していると判定した場合は、その旨の判定結果を、保守端末(管理サーバ)等へ送信する。これにより、演算処理誤りによる、チャネル間の入れ替わりや、雑音等の音声障害が発生していることを保守者に通知し、適切な対処を促すことができ、サービス品質の維持が可能となる。
次に、通信伝送装置1(1A)の処理の流れについて説明する。
図3は、本発明の第1実施形態に係る通信伝送装置1(1A)が実行する音声障害検出処理の流れを示すフローチャートである。
図3は、本発明の第1実施形態に係る通信伝送装置1(1A)が実行する音声障害検出処理の流れを示すフローチャートである。
まず、ステップS1において、通信伝送装置1(1A)の入力音声レベル検出部11は、端末(例えば、IP電話機)等から入力された所定時間の音声データ100を、音声レベルの判定周期となる単位時間ごとに区切り、単位時間ごとの音声レベルの大小を所定の閾値を超えているか否かにより判定する。そして、入力音声レベル検出部11は、音声レベルの大小の判定に基づき音声レベルを0/1のビットにすることにより、音声データ100をビット列101に変換する。
そして、入力音声レベル検出部11は、受信した音声データ100を演算処理部10に出力するとともに、変換したビット列101を比較判定部13Aに出力する(ステップS2)。
続いて、演算処理部10は、音声データ100を取得すると、例えば、コーデック変換処理やエコーキャンセル処理等の所定の演算処理を行う(ステップS3)。
そして、演算処理部10は、演算処理後の音声データを、出力音声レベル検出部12へ出力する。
そして、演算処理部10は、演算処理後の音声データを、出力音声レベル検出部12へ出力する。
ステップS4において、出力音声レベル検出部12は、演算処理部10から出力される(演算処理後の)音声データ100aを受信すると、所定時間の音声データ100aを音声レベルの判定周期となる単位時間ごとに区切り、単位時間ごとの音声レベルの大小を所定の閾値を超えているか否かにより判定する。そして、出力音声レベル検出部12は、音声レベルの大小の判定に基づき音声レベルを0/1のビットにすることにより、演算処理後の音声データ100aをビット列101aに変換する。
そして、出力音声レベル検出部12は、受信した音声データ100aについては、そのまま通信先となる端末(例えば、IP電話等)に出力するとともに、変換したビット列101aを比較判定部13Aに出力する(ステップS5)。
次に、比較判定部13Aは、入力音声レベル検出部11から取得した演算処理前のビット列101と、出力音声レベル検出部12から取得した演算処理後のビット列101aとを比較し、ビット列で示される音声レベルの変化パターンが一致(各ビットの値が一致)するか否かにより、音声障害の判定を行う(ステップS6A)。
そして、比較判定部13Aは、音声レベルの変化パターンが一致(ビット列の値が一致)している場合には(ステップS6A→Yes)、音声障害が発生していないと判定し、処理を終える。一方、比較判定部13Aは、音声レベルの変化パターンが一致(ビット列の値が一致)していない場合には(ステップS6A→No)、音声障害が発生していると判定する。そして、比較判定部13Aは、その旨の判定結果を、保守端末(管理サーバ)等に送信し(ステップS7)、処理を終える。
そして、比較判定部13Aは、音声レベルの変化パターンが一致(ビット列の値が一致)している場合には(ステップS6A→Yes)、音声障害が発生していないと判定し、処理を終える。一方、比較判定部13Aは、音声レベルの変化パターンが一致(ビット列の値が一致)していない場合には(ステップS6A→No)、音声障害が発生していると判定する。そして、比較判定部13Aは、その旨の判定結果を、保守端末(管理サーバ)等に送信し(ステップS7)、処理を終える。
<第2実施形態>
次に、本発明の第2実施形態について説明する。
図4は、本発明の第2実施形態に係る通信伝送装置1(1B)の構成を示すブロック図である。
図1において示した第1実施形態に係る通信伝送装置1(1A)との違いは、図4に示す第2実施形態においては、比較判定部13(13B)となっていることである。
なお、図1に示す構成と同じ構成については、同一の名称と符号を付し、説明を省略する。
次に、本発明の第2実施形態について説明する。
図4は、本発明の第2実施形態に係る通信伝送装置1(1B)の構成を示すブロック図である。
図1において示した第1実施形態に係る通信伝送装置1(1A)との違いは、図4に示す第2実施形態においては、比較判定部13(13B)となっていることである。
なお、図1に示す構成と同じ構成については、同一の名称と符号を付し、説明を省略する。
比較判定部13(13B)は、演算処理部10での処理前後のビット列を比較する所定のロジックに基づき、音声障害が発生しているか否かの判定を行う。
具体的には、比較判定部13Bは、入力音声レベル検出部11からビット列101を取得し、出力音声レベル検出部12からビット列101aを取得すると、それぞれのビット列における最初のビット変化の時間差を固定遅延として設定する。そして、比較判定部13Bは、入力音声レベル検出部11から取得した演算処理前のビット列101と、出力音声レベル検出部12から取得した演算処理後のビット列101aとについて、ビットの変化タイミングを比較することにより、音声障害の判定を行う。より詳細には、比較判定部13Bは、ビットの変化0→1,1→0のタイミングが演算処理前後のビット列で一致するか否かを判定する。
具体的には、比較判定部13Bは、入力音声レベル検出部11からビット列101を取得し、出力音声レベル検出部12からビット列101aを取得すると、それぞれのビット列における最初のビット変化の時間差を固定遅延として設定する。そして、比較判定部13Bは、入力音声レベル検出部11から取得した演算処理前のビット列101と、出力音声レベル検出部12から取得した演算処理後のビット列101aとについて、ビットの変化タイミングを比較することにより、音声障害の判定を行う。より詳細には、比較判定部13Bは、ビットの変化0→1,1→0のタイミングが演算処理前後のビット列で一致するか否かを判定する。
図5は、本発明の第2実施形態に係る通信伝送装置1(1B)による、音声障害の判定を説明するための図である。
符号5-1で示す、ビット列の比較例は、演算処理前後でビット変化のタイミングが一致しており、音声障害が発生していない例である。
演算処理前の音声データ100は、入力音声レベル検出部11により、ビット列101に変換されている。一方、演算処理後の音声データ100aは、出力音声レベル検出部12により、ビット列101aに変換されている。
比較判定部13(13B)は、演算処理前のビット列101と、演算処理後のビット列101aとにおいてビットが変化(0→1,1→0)している箇所(図5においては、ビットを斜線で囲んだ箇所)を特定する。そして、比較判定部13(13B)は、ビットの変化している箇所(タイミング)が一致していることにより、演算処理前後において音声障害の発生はないと判定する。
符号5-1で示す、ビット列の比較例は、演算処理前後でビット変化のタイミングが一致しており、音声障害が発生していない例である。
演算処理前の音声データ100は、入力音声レベル検出部11により、ビット列101に変換されている。一方、演算処理後の音声データ100aは、出力音声レベル検出部12により、ビット列101aに変換されている。
比較判定部13(13B)は、演算処理前のビット列101と、演算処理後のビット列101aとにおいてビットが変化(0→1,1→0)している箇所(図5においては、ビットを斜線で囲んだ箇所)を特定する。そして、比較判定部13(13B)は、ビットの変化している箇所(タイミング)が一致していることにより、演算処理前後において音声障害の発生はないと判定する。
符号5-2で示す、ビット列の比較例は、演算処理前後でビット変化のタイミングが不一致であり、音声障害が発生している例である。
演算処理前の音声データ100は、入力音声レベル検出部11により、ビット列101に変換されている。一方、演算処理後の音声データ100aは、出力音声レベル検出部12により、ビット列101aに変換されている。
比較判定部13(13B)は、演算処理前のビット列101と、演算処理後のビット列101aとにおいてビットが変化(0→1,1→0)している箇所(図5においては、ビットを斜線で囲んだ箇所)を特定する。そして、比較判定部13(13B)は、ビットの変化している箇所が一致していない箇所がある、つまり、ビット変化のタイミングが一致していないことにより、音声障害が発生していると判定する。
演算処理前の音声データ100は、入力音声レベル検出部11により、ビット列101に変換されている。一方、演算処理後の音声データ100aは、出力音声レベル検出部12により、ビット列101aに変換されている。
比較判定部13(13B)は、演算処理前のビット列101と、演算処理後のビット列101aとにおいてビットが変化(0→1,1→0)している箇所(図5においては、ビットを斜線で囲んだ箇所)を特定する。そして、比較判定部13(13B)は、ビットの変化している箇所が一致していない箇所がある、つまり、ビット変化のタイミングが一致していないことにより、音声障害が発生していると判定する。
比較判定部13(13B)は、演算処理前後のビット変化のタイミングが不一致であり、音声障害が発生していると判定した場合は、その旨の判定結果を、保守端末(管理サーバ)等へ送信する。これにより、演算処理誤りによる、チャネル間の入れ替わりや、雑音等の音声障害が発生していることを保守者に通知し、適切な対処を促すことができ、サービス品質の維持が可能となる。
次に、通信伝送装置1(1B)の処理の流れについて説明する。
図6は、本発明の第2実施形態に係る通信伝送装置1(1B)が実行する音声障害検出処理の流れを示すフローチャートである。
なお、図3で示した第1実施形態に係る通信伝送装置1(1A)における処理と同じ処理については、図6においても同一のステップ番号を付し、説明を省略する。具体的には、ステップS1~S5の説明を省略する。
図6は、本発明の第2実施形態に係る通信伝送装置1(1B)が実行する音声障害検出処理の流れを示すフローチャートである。
なお、図3で示した第1実施形態に係る通信伝送装置1(1A)における処理と同じ処理については、図6においても同一のステップ番号を付し、説明を省略する。具体的には、ステップS1~S5の説明を省略する。
ステップS6Bにおいて、比較判定部13Bは、ステップS2において入力音声レベル検出部11から取得したビット列101と、ステップS5において出力音声レベル検出部12から取得したビット列101aとを比較し、演算処理前後のビット変化のタイミングが一致するか否かにより、音声障害の判定を行う。
そして、比較判定部13Bは、ビット変化のタイミングが一致している場合には(ステップS6B→Yes)、音声障害が発生していないと判定し、処理を終える。一方、比較判定部13Bは、ビット変化のタイミングが一致していない場合には(ステップS6B→No)、音声障害が発生していると判定する。そして、比較判定部13Bは、その旨の判定結果を、保守端末(管理サーバ)等に送信し(ステップS7)、処理を終える。
そして、比較判定部13Bは、ビット変化のタイミングが一致している場合には(ステップS6B→Yes)、音声障害が発生していないと判定し、処理を終える。一方、比較判定部13Bは、ビット変化のタイミングが一致していない場合には(ステップS6B→No)、音声障害が発生していると判定する。そして、比較判定部13Bは、その旨の判定結果を、保守端末(管理サーバ)等に送信し(ステップS7)、処理を終える。
以上説明した本実施形態に係る通信伝送装置1(1A,1B)によれば、時間経過に伴って音声レベルが変化する会話等の音声通信において、コーデック変換処理やエコーキャンセル処理等の演算処理前後で音声信号(音声データ)に変化がある場合においても、音声障害を適正に判定することが可能となる。
また、通信伝送装置1(1A,1B)において、保守用端末で音声障害の発生を常時監視し、障害発生時に保守端末(管理サーバ)等へ通知することにより、サービス品質の維持を可能とする。
さらに、通信伝送装置1(1A,1B)では、伝送対象の音声データそのものを加工することなく障害発生を検出することができる。よって、音声データの加工による品質劣化が生じるおそれがない。
通信伝送装置1(1A,1B)の機能は、演算処理前後の音声データにおける音声レベルの変化を比較することにより音声障害を検出するものであるため、コーデック変換処理やエコーキャンセル処理等を行う装置に加え、単純増幅を行う装置等のように、演算処理前後で音声データの差分が生じる装置においても適応可能である。
また、通信伝送装置1(1A,1B)において、保守用端末で音声障害の発生を常時監視し、障害発生時に保守端末(管理サーバ)等へ通知することにより、サービス品質の維持を可能とする。
さらに、通信伝送装置1(1A,1B)では、伝送対象の音声データそのものを加工することなく障害発生を検出することができる。よって、音声データの加工による品質劣化が生じるおそれがない。
通信伝送装置1(1A,1B)の機能は、演算処理前後の音声データにおける音声レベルの変化を比較することにより音声障害を検出するものであるため、コーデック変換処理やエコーキャンセル処理等を行う装置に加え、単純増幅を行う装置等のように、演算処理前後で音声データの差分が生じる装置においても適応可能である。
<ハードウェア構成>
本実施形態に係る通信伝送装置1(1A,1B)は、例えば図7に示すような構成のコンピュータ900によって実現される。
図7は、本実施形態に係る通信伝送装置1の機能を実現するコンピュータ900の一例を示すハードウェア構成図である。コンピュータ900は、CPU(Central Processing Unit)901、ROM(Read Only Memory)902、RAM(Random Access Memory)903、HDD(Hard Disk Drive)904、入出力I/F(Interface)905、通信I/F906およびメディアI/F907を有する。
本実施形態に係る通信伝送装置1(1A,1B)は、例えば図7に示すような構成のコンピュータ900によって実現される。
図7は、本実施形態に係る通信伝送装置1の機能を実現するコンピュータ900の一例を示すハードウェア構成図である。コンピュータ900は、CPU(Central Processing Unit)901、ROM(Read Only Memory)902、RAM(Random Access Memory)903、HDD(Hard Disk Drive)904、入出力I/F(Interface)905、通信I/F906およびメディアI/F907を有する。
CPU901は、ROM902またはHDD904に記憶されたプログラムに基づき作動し、図1および図4の各機能部による制御を行う。ROM902は、コンピュータ900の起動時にCPU901により実行されるブートプログラムや、コンピュータ900のハードウェアに係るプログラム等を記憶する。
CPU901は、入出力I/F905を介して、マウスやキーボード等の入力装置910、および、ディスプレイやプリンタ等の出力装置911を制御する。CPU901は、入出力I/F905を介して、入力装置910からデータを取得するともに、生成したデータを出力装置911へ出力する。
HDD904は、CPU901により実行されるプログラムおよび当該プログラムによって使用されるデータ等を記憶する。通信I/F906は、通信網(例えば、ネットワーク920)を介して図示せぬ他の装置(例えば、保守端末等)からデータを受信してCPU901へ出力し、また、CPU901が生成したデータを、通信網を介して他の装置へ送信する。
メディアI/F907は、記録媒体912に格納されたプログラムまたはデータを読み取り、RAM903を介してCPU901へ出力する。CPU901は、目的の処理に係るプログラムを、メディアI/F907を介して記録媒体912からRAM903上にロードし、ロードしたプログラムを実行する。記録媒体912は、DVD(Digital Versatile Disc)、PD(Phase change rewritable Disk)等の光学記録媒体、MO(Magneto Optical disk)等の光磁気記録媒体、磁気記録媒体、導体メモリテープ媒体又は半導体メモリ等である。
例えば、コンピュータ900が本実施形態に係る通信伝送装置1として機能する場合、コンピュータ900のCPU901は、RAM903上にロードされたプログラムを実行することにより、通信伝送装置1の機能を実現する。また、HDD904には、RAM903内のデータが記憶される。CPU901は、目的の処理に係るプログラムを記録媒体912から読み取って実行する。この他、CPU901は、他の装置から通信網(ネットワーク920)を介して目的の処理に係るプログラムを読み込んでもよい。
<効果>
以下、本発明に係る通信伝送装置の効果について説明する。
本発明に係る通信伝送装置は、音声データを伝送する通信伝送装置1(1A,1B)であって、入力された所定時間の音声データ100を、単位時間ごとに区切り、単位時間ごとの音声データの音声レベルが所定の閾値を超えているか否かにより0または1のビット値で示されるビット列101に変換する入力音声レベル検出部11と、音声データ100に対して所定の演算処理を行う演算処理部10と、演算処理部10が出力した所定時間の演算処理後の音声データ100aを、単位時間ごとに区切り、単位時間ごとの音声データの音声レベルが所定の閾値を超えているか否かにより0または1のビット値で示されるビット列101aに変換する出力音声レベル検出部12と、入力音声レベル検出部11が変換した演算処理前のビット列101と、出力音声レベル検出部12が変換した演算処理後のビット列101aとを比較する所定のロジックに基づき、音声障害が発生しているか否かを判定する比較判定部13と、を備えることを特徴とする。
以下、本発明に係る通信伝送装置の効果について説明する。
本発明に係る通信伝送装置は、音声データを伝送する通信伝送装置1(1A,1B)であって、入力された所定時間の音声データ100を、単位時間ごとに区切り、単位時間ごとの音声データの音声レベルが所定の閾値を超えているか否かにより0または1のビット値で示されるビット列101に変換する入力音声レベル検出部11と、音声データ100に対して所定の演算処理を行う演算処理部10と、演算処理部10が出力した所定時間の演算処理後の音声データ100aを、単位時間ごとに区切り、単位時間ごとの音声データの音声レベルが所定の閾値を超えているか否かにより0または1のビット値で示されるビット列101aに変換する出力音声レベル検出部12と、入力音声レベル検出部11が変換した演算処理前のビット列101と、出力音声レベル検出部12が変換した演算処理後のビット列101aとを比較する所定のロジックに基づき、音声障害が発生しているか否かを判定する比較判定部13と、を備えることを特徴とする。
このように、通信伝送装置1(1A,1B)によれば、音声データ(音声信号)が、例えば、コーデック変換処理やエコーキャンセル処理等の所定の演算処理により、その演算処理前後で変化がある場合においても、音声障害を適正に判定することが可能となる。
また、通信伝送装置1(1A,1B)では、伝送対象の音声データそのものを加工するのではなく、音声データが示す音声レベルをビット列に変換して演算処理前後で比較する。よって、音声データの加工による品質劣化を生じさせることなく、音声障害を判定することができる。
また、通信伝送装置1(1A,1B)では、伝送対象の音声データそのものを加工するのではなく、音声データが示す音声レベルをビット列に変換して演算処理前後で比較する。よって、音声データの加工による品質劣化を生じさせることなく、音声障害を判定することができる。
また、通信伝送装置1(1A)において、所定のロジックは、演算処理前のビット列101と演算処理後のビット列101aとを比較し、ビット列の各ビット値の変化パターンが一致しない場合に音声障害が発生していると判定し、一致する場合に音声障害が発生していないと判定するロジックであることを特徴とする。
このようにすることにより、通信伝送装置1(1A)は、演算処理前後のビット列において、各ビット値の変化パターンが一致しない場合に、例えば、チャネル間の入れ替わりや雑音等による音声障害が発生していることを判定することができる。よって、音声障害の発生を確実に検出することが可能となる。
また、通信伝送装置1(1B)において、所定のロジックは、演算処理前のビット列101と演算処理後のビット列101aとを比較し、ビット値の0から1、および、1から0で示されるビット変化のタイミングが一致しない場合に音声障害が発生していると判定し、一致する場合に音声障害が発生していないと判定するロジックであることを特徴とする。
このようにすることにより、通信伝送装置1(1B)は、演算処理前後のビット列において、ビット変化のタイミングが一致しない場合に、例えば、チャネル間の入れ替わりや雑音等による音声障害が発生していることを判定することができる。よって、音声障害の発生を確実に検出することが可能となる。
なお、本発明は、以上説明した実施形態に限定されるものではなく、多くの変形が本発明の技術的思想内で当分野において通常の知識を有する者により可能である。
1,1A,1B 通信伝送装置
10 演算処理部
11 入力音声レベル検出部
12 出力音声レベル検出部
13,13A,13B 比較判定部
10 演算処理部
11 入力音声レベル検出部
12 出力音声レベル検出部
13,13A,13B 比較判定部
Claims (5)
- 音声データを伝送する通信伝送装置であって、
入力された所定時間の音声データを、単位時間ごとに区切り、前記単位時間ごとの音声データの音声レベルが所定の閾値を超えているか否かにより0または1のビット値で示されるビット列に変換する入力音声レベル検出部と、
前記音声データに対して所定の演算処理を行う演算処理部と、
前記演算処理部が出力した所定時間の演算処理後の音声データを、前記単位時間ごとに区切り、前記単位時間ごとの音声データの音声レベルが前記所定の閾値を超えているか否かにより0または1のビット値で示されるビット列に変換する出力音声レベル検出部と、
前記入力音声レベル検出部が変換した演算処理前のビット列と、前記出力音声レベル検出部が変換した演算処理後のビット列とを比較する所定のロジックに基づき、音声障害が発生しているか否かを判定する比較判定部と、
を備えることを特徴とする通信伝送装置。 - 前記所定のロジックは、
前記演算処理前のビット列と前記演算処理後のビット列とを比較し、ビット列の各ビット値の変化パターンが一致しない場合に音声障害が発生していると判定し、一致する場合に音声障害が発生していないと判定するロジックであること
を特徴とする請求項1に記載の通信伝送装置。 - 前記所定のロジックは、
前記演算処理前のビット列と前記演算処理後のビット列とを比較し、ビット値の0から1、および、1から0で示されるビット変化のタイミングが一致しない場合に音声障害が発生していると判定し、一致する場合に音声障害が発生していないと判定するロジックであること
を特徴とする請求項1に記載の通信伝送装置。 - 音声データを伝送する通信伝送装置の音声障害検出方法であって、
前記通信伝送装置は、
入力された所定時間の音声データを、単位時間ごとに区切り、前記単位時間ごとの音声データの音声レベルが所定の閾値を超えているか否かにより0または1のビット値で示されるビット列に変換するステップと、
前記音声データに対して所定の演算処理を行うステップと、
前記所定時間の演算処理後の音声データを、前記単位時間ごとに区切り、前記単位時間ごとの音声データの音声レベルが前記所定の閾値を超えているか否かにより0または1のビット値で示されるビット列に変換するステップと、
演算処理前に変換されたビット列と、演算処理後に変換されたビット列とを比較する所定のロジックに基づき、音声障害が発生しているか否かを判定するステップと、
を実行することを特徴とする音声障害検出方法。 - コンピュータを、請求項1乃至請求項3のいずれか一項に記載の通信伝送装置として機能させるためのプログラム。
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
PCT/JP2020/008269 WO2021171547A1 (ja) | 2020-02-28 | 2020-02-28 | 通信伝送装置、音声障害検出方法、および、プログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JPWO2021171547A1 JPWO2021171547A1 (ja) | 2021-09-02 |
JP7334846B2 true JP7334846B2 (ja) | 2023-08-29 |
Family
ID=77491171
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2022502768A Active JP7334846B2 (ja) | 2020-02-28 | 2020-02-28 | 通信伝送装置、音声障害検出方法、および、プログラム |
Country Status (3)
Country | Link |
---|---|
US (1) | US11810580B2 (ja) |
JP (1) | JP7334846B2 (ja) |
WO (1) | WO2021171547A1 (ja) |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2000347678A (ja) | 1999-06-08 | 2000-12-15 | Nec Corp | トーン発生回路 |
JP2002258900A (ja) | 2001-02-28 | 2002-09-11 | Toshiba Corp | 音声再生装置及び音声再生方法 |
Family Cites Families (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2005100159A (ja) * | 2003-09-25 | 2005-04-14 | Sony Corp | 演算装置及びその方法 |
EP3492008B1 (en) | 2005-09-13 | 2021-06-02 | Veran Medical Technologies, Inc. | Apparatus and method for image guided accuracy verification |
JP2007259143A (ja) * | 2006-03-23 | 2007-10-04 | Fujitsu Ltd | 音声データ処理装置及び方法 |
JP5195402B2 (ja) * | 2008-12-25 | 2013-05-08 | パナソニック株式会社 | 無線通信装置及び無線通信システム |
JP5456609B2 (ja) * | 2010-07-23 | 2014-04-02 | 本田技研工業株式会社 | 異音検査装置及び方法、並びにプログラム |
JP5136670B2 (ja) * | 2011-03-18 | 2013-02-06 | 株式会社Jvcケンウッド | 信号検出装置、無線機及び信号検出方法 |
JP5827108B2 (ja) * | 2011-11-18 | 2015-12-02 | 株式会社アニモ | 情報処理方法、装置及びプログラム |
JP6210448B2 (ja) * | 2013-04-05 | 2017-10-11 | パナソニックIpマネジメント株式会社 | 携帯端末装置 |
JP6853727B2 (ja) * | 2017-04-28 | 2021-03-31 | 大阪瓦斯株式会社 | 警報システム |
JP6744343B2 (ja) | 2018-02-15 | 2020-08-19 | 日本電信電話株式会社 | 通信伝送装置及び通信伝送装置の音声品質判定方法 |
JP2019211737A (ja) * | 2018-06-08 | 2019-12-12 | パナソニックIpマネジメント株式会社 | 音声処理装置および翻訳装置 |
WO2020004609A1 (ja) * | 2018-06-28 | 2020-01-02 | ローム株式会社 | 音波処理装置、および超音波システム |
JP7184656B2 (ja) * | 2019-01-23 | 2022-12-06 | ラピスセミコンダクタ株式会社 | 故障判定装置及び音出力装置 |
-
2020
- 2020-02-28 JP JP2022502768A patent/JP7334846B2/ja active Active
- 2020-02-28 WO PCT/JP2020/008269 patent/WO2021171547A1/ja active Application Filing
- 2020-02-28 US US17/802,225 patent/US11810580B2/en active Active
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2000347678A (ja) | 1999-06-08 | 2000-12-15 | Nec Corp | トーン発生回路 |
JP2002258900A (ja) | 2001-02-28 | 2002-09-11 | Toshiba Corp | 音声再生装置及び音声再生方法 |
Non-Patent Citations (3)
Title |
---|
佐藤教之、他1名,通信系伝送装置における音声系障害時機能停止の検討,電子情報通信学会2019年総合大会講演論文集 通信2,2019年03月05日,p. 26 |
金光卓生,通信系伝送装置における音声系障害検出方式の検討,電子情報通信学会2018年総合大会講演論文集 通信2,2018年03月06日,p. 81 |
金光卓生、他1名,通信系伝送装置における音声系障害検出方式の検討,電子情報通信学会2019年総合大会講演論文集 通信2,2019年03月05日,p. 25 |
Also Published As
Publication number | Publication date |
---|---|
JPWO2021171547A1 (ja) | 2021-09-02 |
US11810580B2 (en) | 2023-11-07 |
WO2021171547A1 (ja) | 2021-09-02 |
US20230083378A1 (en) | 2023-03-16 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
EP2405634B1 (en) | Method of indicating presence of transient noise in a call and apparatus thereof | |
US8391175B2 (en) | Generic on-chip homing and resident, real-time bit exact tests | |
EP2140637B1 (en) | Method of transmitting data in a communication system | |
GB2493327A (en) | Processing audio signals during a communication session by treating as noise, portions of the signal identified as unwanted | |
JP3255584B2 (ja) | 有音検知装置および方法 | |
US8786659B2 (en) | Device, method and computer program product for responding to media conference deficiencies | |
US8041026B1 (en) | Event driven noise cancellation | |
JP4438720B2 (ja) | エコーキャンセラ及びマイク装置 | |
US8886527B2 (en) | Speech recognition system to evaluate speech signals, method thereof, and storage medium storing the program for speech recognition to evaluate speech signals | |
US20140133648A1 (en) | Method and apparatus for acoustic echo cancellation in voip terminal | |
JP7334846B2 (ja) | 通信伝送装置、音声障害検出方法、および、プログラム | |
JPWO2019160006A1 (ja) | ハウリング抑圧装置、その方法、およびプログラム | |
KR20160145711A (ko) | 정보 손실을 감소시킨 전자 통신들을 위한 시스템들, 방법들 및 디바이스들 | |
JP6644213B1 (ja) | 音響信号処理装置、音響システム、音響信号処理方法、及び音響信号処理プログラム | |
US10554822B1 (en) | Noise removal in call centers | |
JP2016220060A (ja) | 帯域予測プログラム、帯域予測装置、および帯域予測方法 | |
JP4825153B2 (ja) | 通話区間検出装置、その方法、プログラム及び記録媒体 | |
US12015902B2 (en) | Echo cancellation device, echo cancellation method, and program | |
JP2008294600A (ja) | 放収音装置、および放収音システム | |
WO2024006005A1 (en) | Personalized speech enhancement without enrollment | |
JP2011155665A (ja) | 通話区間検出装置、その方法、及びプログラム | |
JP2009171430A (ja) | ノイズ監視方法及びそのシステム並びにその制御プログラム | |
JP2009100072A (ja) | 音声処理装置、音声処理装置の音声処理方法及びプログラム | |
JPH10200987A (ja) | エコーキャンセラー及びエコーキャンセル方法 | |
JP2015200779A (ja) | 信号処理装置、信号処理方法およびプログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20220711 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20230718 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20230731 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 7334846 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |