JP7334846B2 - 通信伝送装置、音声障害検出方法、および、プログラム - Google Patents

通信伝送装置、音声障害検出方法、および、プログラム Download PDF

Info

Publication number
JP7334846B2
JP7334846B2 JP2022502768A JP2022502768A JP7334846B2 JP 7334846 B2 JP7334846 B2 JP 7334846B2 JP 2022502768 A JP2022502768 A JP 2022502768A JP 2022502768 A JP2022502768 A JP 2022502768A JP 7334846 B2 JP7334846 B2 JP 7334846B2
Authority
JP
Japan
Prior art keywords
arithmetic processing
bit string
audio
bit
communication transmission
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2022502768A
Other languages
English (en)
Other versions
JPWO2021171547A1 (ja
Inventor
卓生 金光
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Publication of JPWO2021171547A1 publication Critical patent/JPWO2021171547A1/ja
Application granted granted Critical
Publication of JP7334846B2 publication Critical patent/JP7334846B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/48Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use
    • G10L25/69Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for evaluating synthetic or decoded voice signals
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M3/00Automatic or semi-automatic exchanges
    • H04M3/22Arrangements for supervision, monitoring or testing
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M1/00Substation equipment, e.g. for use by subscribers
    • H04M1/24Arrangements for testing

Landscapes

  • Engineering & Computer Science (AREA)
  • Signal Processing (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Quality & Reliability (AREA)
  • Maintenance And Management Of Digital Transmission (AREA)
  • Telephonic Communication Services (AREA)

Description

本発明は、音声信号に対してデジタル処理を行う、通信伝送装置、通信伝送装置の音声障害検出方法、および、プログラムに関する。
音声信号(音声データ)の通信を行う通信伝送装置では、音声信号を所定仕様のデータに変換するコーデック変換処理や、エコー成分をキャンセルするエコーキャンセル処理等を施すデジタルの演算処理が行われている(例えば、特許文献1参照)。
コーデック変換処理では、一方のコーデック形式による音声信号が、他方において通信可能なコーデック形式の音声信号に変換される。エコーキャンセル処理では、電話機のスピーカから出た音声をマイクで拾って発生するエコーが除去される。
特開2019-145874号公報
上記のデジタル処理を行う通信伝送装置では、音声信号に対してコーデック変換処理やエコーキャンセル処理等の演算処理を行った場合、処理前後においてデータの同一性が保証されない場合がある。しかしながら、通信伝送装置の演算処理の誤りで、当該演算処理前後の音声信号が異なっていても、必ずしも人の耳で音声が聞き取りにくくなる等の音声障害が発生しているとは限らない。このため、デジタル化された音声信号の単純比較では、音声障害が発生しているかを判定することが難しかった。
このような点を鑑みて本発明がなされたのであり、本発明は、音声信号に対するコーデック変換処理やエコーキャンセル処理等の演算処理後の音声障害を適正に判定することを課題とする。
本発明に係る通信伝送装置は、音声データを伝送する通信伝送装置であって、入力された所定時間の音声データを、単位時間ごとに区切り、前記単位時間ごとの音声データの音声レベルが所定の閾値を超えているか否かにより0または1のビット値で示されるビット列に変換する入力音声レベル検出部と、前記音声データに対して所定の演算処理を行う演算処理部と、前記演算処理部が出力した所定時間の演算処理後の音声データを、前記単位時間ごとに区切り、前記単位時間ごとの音声データの音声レベルが前記所定の閾値を超えているか否かにより0または1のビット値で示されるビット列に変換する出力音声レベル検出部と、前記入力音声レベル検出部が変換した演算処理前のビット列と、前記出力音声レベル検出部が変換した演算処理後のビット列とを比較する所定のロジックに基づき、音声障害が発生しているか否かを判定する比較判定部と、を備えることを特徴とする。
本発明によれば、音声信号に対するコーデック変換処理やエコーキャンセル処理等の演算処理後の音声障害を適正に判定することができる。
本発明の第1実施形態に係る通信伝送装置の構成を示すブロック図である。 本発明の第1実施形態に係る通信伝送装置による、音声障害の判定を説明するための図である。 本発明の第1実施形態に係る通信伝送装置が実行する音声障害検出処理の流れを示すフローチャートである。 本発明の第2実施形態に係る通信伝送装置の構成を示すブロック図である。 本発明の第2実施形態に係る通信伝送装置による、音声障害の判定を説明するための図である。 本発明の第2実施形態に係る通信伝送装置が実行する音声障害検出処理の流れを示すフローチャートである。 本実施形態に係る通信伝送装置の機能を実現するコンピュータの一例を示すハードウェア構成図である。
次に、本発明を実施するための形態(以下、「本実施形態」と称する。)について説明する。
本実施形態に係る通信伝送装置1(1A,1B)(後記する図1,図4参照)は、デジタル化された音声データそのものを比較するのではなく、演算処理前後において、音声データの音声レベルの大小を検出しビット列に変換する。そして、通信伝送装置1は、演算処理前後のビット列を所定のロジックに基づき比較することにより、演算処理誤りによるチャネル間の入れ替わりや雑音等の音声障害を検出する。
以下、第1実施形態においては、通信伝送装置1(1A)が、演算処理前後において、音声データの音声レベルをビット列に変換し、そのビット列の変化パターンを比較することにより、音声障害の発生を検出する例について説明する。また、第2実施形態においては、通信伝送装置1(1B)が、演算処理前後において音声レベルを変換した各ビットの変化タイミングを比較することにより、音声障害の発生を検出する例について説明する。
<第1実施形態>
図1は、本発明の第1実施形態に係る通信伝送装置1(1A)の構成を示すブロック図である。
この通信伝送装置1(1A)は、制御部、入出力部、記憶部(いずれも図示省略)を備えるコンピュータにより構成される(詳細は後記)。また、制御部は、図1に示すように、演算処理部10と、入力音声レベル検出部11と、出力音声レベル検出部12と、比較判定部13(13A)と、を含んで構成される。
演算処理部10は、入力された音声データに対して、例えば、コーデック変換処理やエコーキャンセル処理等の所定の演算処理を行う。
入力音声レベル検出部11は、端末(例えば、IP電話機)等から通信伝送装置1に入力された所定時間の音声データ100を、音声レベルの判定周期となる単位時間ごとに区切り、単位時間ごとの音声レベルの大小を所定の閾値を超えているか否かにより判定する。そして、入力音声レベル検出部11は、判定した結果をビット列101に変換する。具体的には、入力音声レベル検出部11は、音声レベルが所定の閾値を超えていた場合にはビット値「1」とし、所定の閾値以下である場合にはビット値「0」とし、単位時間ごとに音声レベルを判定することによりビット列101に変換する。
入力音声レベル検出部11は、受信した音声データ100については、そのまま演算処理部10に出力する。そして、入力音声レベル検出部11は、変換したビット列101については、比較判定部13(13A)に出力する。
出力音声レベル検出部12は、演算処理部10から出力される(演算処理後の)音声データ100aを受信すると、入力音声レベル検出部11と同様に、所定時間に受信した音声データ100aを音声レベルの判定周期となる単位時間ごとに区切り、単位時間ごとの音声レベルの大小を所定の閾値を超えているか否かにより判定する。そして、出力音声レベル検出部12は、判定した結果をビット列101aに変換する。具体的には、出力音声レベル検出部12は、音声レベルが所定の閾値を超えていた場合にはビット値「1」とし、所定の閾値以下である場合にはビット値「0」とし、単位時間ごとに音声レベルを判定することによりビット列101aに変換する。
出力音声レベル検出部12は、受信した音声データ100aについては、そのまま通信先となる端末(例えば、IP電話等)に出力する。そして、出力音声レベル検出部12は、変換したビット列101aについては、比較判定部13(13A)に出力する。
比較判定部13(13A)は、演算処理部10における演算処理前後のビット列を比較する所定のロジックに基づき、音声障害が発生しているか否かの判定を行う。
具体的には、比較判定部13Aは、入力音声レベル検出部11からビット列101を取得し、出力音声レベル検出部12からビット列101aを取得すると、それぞれのビット列における最初のビット変化の時間差を固定遅延として設定する。これは、演算処理部10での処理遅延の影響を補償するためである。比較判定部13Aは、入力音声レベル検出部11から取得した演算処理前のビット列101と、出力音声レベル検出部12から取得した演算処理後のビット列101aとについて、ビット列(音声レベル)の変化パターンを比較することにより、音声障害の判定を行う。
図2は、本発明の第1実施形態に係る通信伝送装置1(1A)による、音声障害の判定を説明するための図である。
符号2-1で示す、ビット列の比較例は、演算処理前後でビット列が一致しており、音声障害が発生していない例である。
演算処理前の音声データ100は、入力音声レベル検出部11により、ビット列101に変換されている。一方、演算処理後の音声データ100aは、出力音声レベル検出部12により、ビット列101aに変換されている。
比較判定部13(13A)は、演算処理前のビット列101と、演算処理後のビット列101aの各ビットの値が一致している、つまり、音声レベルの変化パターンが一致していることにより、音声障害の発生はないと判定する。
符号2-2で示す、ビット列の比較例は、演算処理前後でビット列が不一致であり、音声障害が発生している例である。
演算処理前の音声データ100は、入力音声レベル検出部11により、ビット列101に変換されている。一方、演算処理後の音声データ100aは、出力音声レベル検出部12により、ビット列101aに変換されている。
比較判定部13(13A)は、演算処理前のビット列101と、演算処理後のビット列101aとにおいて、ビットの値が一致していない箇所がある、つまり、音声レベルの変化パターンが一致していないことにより、音声障害が発生していると判定する。
比較判定部13(13A)は、演算処理前後のビット列が不一致であり、音声障害が発生していると判定した場合は、その旨の判定結果を、保守端末(管理サーバ)等へ送信する。これにより、演算処理誤りによる、チャネル間の入れ替わりや、雑音等の音声障害が発生していることを保守者に通知し、適切な対処を促すことができ、サービス品質の維持が可能となる。
次に、通信伝送装置1(1A)の処理の流れについて説明する。
図3は、本発明の第1実施形態に係る通信伝送装置1(1A)が実行する音声障害検出処理の流れを示すフローチャートである。
まず、ステップS1において、通信伝送装置1(1A)の入力音声レベル検出部11は、端末(例えば、IP電話機)等から入力された所定時間の音声データ100を、音声レベルの判定周期となる単位時間ごとに区切り、単位時間ごとの音声レベルの大小を所定の閾値を超えているか否かにより判定する。そして、入力音声レベル検出部11は、音声レベルの大小の判定に基づき音声レベルを0/1のビットにすることにより、音声データ100をビット列101に変換する。
そして、入力音声レベル検出部11は、受信した音声データ100を演算処理部10に出力するとともに、変換したビット列101を比較判定部13Aに出力する(ステップS2)。
続いて、演算処理部10は、音声データ100を取得すると、例えば、コーデック変換処理やエコーキャンセル処理等の所定の演算処理を行う(ステップS3)。
そして、演算処理部10は、演算処理後の音声データを、出力音声レベル検出部12へ出力する。
ステップS4において、出力音声レベル検出部12は、演算処理部10から出力される(演算処理後の)音声データ100aを受信すると、所定時間の音声データ100aを音声レベルの判定周期となる単位時間ごとに区切り、単位時間ごとの音声レベルの大小を所定の閾値を超えているか否かにより判定する。そして、出力音声レベル検出部12は、音声レベルの大小の判定に基づき音声レベルを0/1のビットにすることにより、演算処理後の音声データ100aをビット列101aに変換する。
そして、出力音声レベル検出部12は、受信した音声データ100aについては、そのまま通信先となる端末(例えば、IP電話等)に出力するとともに、変換したビット列101aを比較判定部13Aに出力する(ステップS5)。
次に、比較判定部13Aは、入力音声レベル検出部11から取得した演算処理前のビット列101と、出力音声レベル検出部12から取得した演算処理後のビット列101aとを比較し、ビット列で示される音声レベルの変化パターンが一致(各ビットの値が一致)するか否かにより、音声障害の判定を行う(ステップS6A)。
そして、比較判定部13Aは、音声レベルの変化パターンが一致(ビット列の値が一致)している場合には(ステップS6A→Yes)、音声障害が発生していないと判定し、処理を終える。一方、比較判定部13Aは、音声レベルの変化パターンが一致(ビット列の値が一致)していない場合には(ステップS6A→No)、音声障害が発生していると判定する。そして、比較判定部13Aは、その旨の判定結果を、保守端末(管理サーバ)等に送信し(ステップS7)、処理を終える。
<第2実施形態>
次に、本発明の第2実施形態について説明する。
図4は、本発明の第2実施形態に係る通信伝送装置1(1B)の構成を示すブロック図である。
図1において示した第1実施形態に係る通信伝送装置1(1A)との違いは、図4に示す第2実施形態においては、比較判定部13(13B)となっていることである。
なお、図1に示す構成と同じ構成については、同一の名称と符号を付し、説明を省略する。
比較判定部13(13B)は、演算処理部10での処理前後のビット列を比較する所定のロジックに基づき、音声障害が発生しているか否かの判定を行う。
具体的には、比較判定部13Bは、入力音声レベル検出部11からビット列101を取得し、出力音声レベル検出部12からビット列101aを取得すると、それぞれのビット列における最初のビット変化の時間差を固定遅延として設定する。そして、比較判定部13Bは、入力音声レベル検出部11から取得した演算処理前のビット列101と、出力音声レベル検出部12から取得した演算処理後のビット列101aとについて、ビットの変化タイミングを比較することにより、音声障害の判定を行う。より詳細には、比較判定部13Bは、ビットの変化0→1,1→0のタイミングが演算処理前後のビット列で一致するか否かを判定する。
図5は、本発明の第2実施形態に係る通信伝送装置1(1B)による、音声障害の判定を説明するための図である。
符号5-1で示す、ビット列の比較例は、演算処理前後でビット変化のタイミングが一致しており、音声障害が発生していない例である。
演算処理前の音声データ100は、入力音声レベル検出部11により、ビット列101に変換されている。一方、演算処理後の音声データ100aは、出力音声レベル検出部12により、ビット列101aに変換されている。
比較判定部13(13B)は、演算処理前のビット列101と、演算処理後のビット列101aとにおいてビットが変化(0→1,1→0)している箇所(図5においては、ビットを斜線で囲んだ箇所)を特定する。そして、比較判定部13(13B)は、ビットの変化している箇所(タイミング)が一致していることにより、演算処理前後において音声障害の発生はないと判定する。
符号5-2で示す、ビット列の比較例は、演算処理前後でビット変化のタイミングが不一致であり、音声障害が発生している例である。
演算処理前の音声データ100は、入力音声レベル検出部11により、ビット列101に変換されている。一方、演算処理後の音声データ100aは、出力音声レベル検出部12により、ビット列101aに変換されている。
比較判定部13(13B)は、演算処理前のビット列101と、演算処理後のビット列101aとにおいてビットが変化(0→1,1→0)している箇所(図5においては、ビットを斜線で囲んだ箇所)を特定する。そして、比較判定部13(13B)は、ビットの変化している箇所が一致していない箇所がある、つまり、ビット変化のタイミングが一致していないことにより、音声障害が発生していると判定する。
比較判定部13(13B)は、演算処理前後のビット変化のタイミングが不一致であり、音声障害が発生していると判定した場合は、その旨の判定結果を、保守端末(管理サーバ)等へ送信する。これにより、演算処理誤りによる、チャネル間の入れ替わりや、雑音等の音声障害が発生していることを保守者に通知し、適切な対処を促すことができ、サービス品質の維持が可能となる。
次に、通信伝送装置1(1B)の処理の流れについて説明する。
図6は、本発明の第2実施形態に係る通信伝送装置1(1B)が実行する音声障害検出処理の流れを示すフローチャートである。
なお、図3で示した第1実施形態に係る通信伝送装置1(1A)における処理と同じ処理については、図6においても同一のステップ番号を付し、説明を省略する。具体的には、ステップS1~S5の説明を省略する。
ステップS6Bにおいて、比較判定部13Bは、ステップS2において入力音声レベル検出部11から取得したビット列101と、ステップS5において出力音声レベル検出部12から取得したビット列101aとを比較し、演算処理前後のビット変化のタイミングが一致するか否かにより、音声障害の判定を行う。
そして、比較判定部13Bは、ビット変化のタイミングが一致している場合には(ステップS6B→Yes)、音声障害が発生していないと判定し、処理を終える。一方、比較判定部13Bは、ビット変化のタイミングが一致していない場合には(ステップS6B→No)、音声障害が発生していると判定する。そして、比較判定部13Bは、その旨の判定結果を、保守端末(管理サーバ)等に送信し(ステップS7)、処理を終える。
以上説明した本実施形態に係る通信伝送装置1(1A,1B)によれば、時間経過に伴って音声レベルが変化する会話等の音声通信において、コーデック変換処理やエコーキャンセル処理等の演算処理前後で音声信号(音声データ)に変化がある場合においても、音声障害を適正に判定することが可能となる。
また、通信伝送装置1(1A,1B)において、保守用端末で音声障害の発生を常時監視し、障害発生時に保守端末(管理サーバ)等へ通知することにより、サービス品質の維持を可能とする。
さらに、通信伝送装置1(1A,1B)では、伝送対象の音声データそのものを加工することなく障害発生を検出することができる。よって、音声データの加工による品質劣化が生じるおそれがない。
通信伝送装置1(1A,1B)の機能は、演算処理前後の音声データにおける音声レベルの変化を比較することにより音声障害を検出するものであるため、コーデック変換処理やエコーキャンセル処理等を行う装置に加え、単純増幅を行う装置等のように、演算処理前後で音声データの差分が生じる装置においても適応可能である。
<ハードウェア構成>
本実施形態に係る通信伝送装置1(1A,1B)は、例えば図7に示すような構成のコンピュータ900によって実現される。
図7は、本実施形態に係る通信伝送装置1の機能を実現するコンピュータ900の一例を示すハードウェア構成図である。コンピュータ900は、CPU(Central Processing Unit)901、ROM(Read Only Memory)902、RAM(Random Access Memory)903、HDD(Hard Disk Drive)904、入出力I/F(Interface)905、通信I/F906およびメディアI/F907を有する。
CPU901は、ROM902またはHDD904に記憶されたプログラムに基づき作動し、図1および図4の各機能部による制御を行う。ROM902は、コンピュータ900の起動時にCPU901により実行されるブートプログラムや、コンピュータ900のハードウェアに係るプログラム等を記憶する。
CPU901は、入出力I/F905を介して、マウスやキーボード等の入力装置910、および、ディスプレイやプリンタ等の出力装置911を制御する。CPU901は、入出力I/F905を介して、入力装置910からデータを取得するともに、生成したデータを出力装置911へ出力する。
HDD904は、CPU901により実行されるプログラムおよび当該プログラムによって使用されるデータ等を記憶する。通信I/F906は、通信網(例えば、ネットワーク920)を介して図示せぬ他の装置(例えば、保守端末等)からデータを受信してCPU901へ出力し、また、CPU901が生成したデータを、通信網を介して他の装置へ送信する。
メディアI/F907は、記録媒体912に格納されたプログラムまたはデータを読み取り、RAM903を介してCPU901へ出力する。CPU901は、目的の処理に係るプログラムを、メディアI/F907を介して記録媒体912からRAM903上にロードし、ロードしたプログラムを実行する。記録媒体912は、DVD(Digital Versatile Disc)、PD(Phase change rewritable Disk)等の光学記録媒体、MO(Magneto Optical disk)等の光磁気記録媒体、磁気記録媒体、導体メモリテープ媒体又は半導体メモリ等である。
例えば、コンピュータ900が本実施形態に係る通信伝送装置1として機能する場合、コンピュータ900のCPU901は、RAM903上にロードされたプログラムを実行することにより、通信伝送装置1の機能を実現する。また、HDD904には、RAM903内のデータが記憶される。CPU901は、目的の処理に係るプログラムを記録媒体912から読み取って実行する。この他、CPU901は、他の装置から通信網(ネットワーク920)を介して目的の処理に係るプログラムを読み込んでもよい。
<効果>
以下、本発明に係る通信伝送装置の効果について説明する。
本発明に係る通信伝送装置は、音声データを伝送する通信伝送装置1(1A,1B)であって、入力された所定時間の音声データ100を、単位時間ごとに区切り、単位時間ごとの音声データの音声レベルが所定の閾値を超えているか否かにより0または1のビット値で示されるビット列101に変換する入力音声レベル検出部11と、音声データ100に対して所定の演算処理を行う演算処理部10と、演算処理部10が出力した所定時間の演算処理後の音声データ100aを、単位時間ごとに区切り、単位時間ごとの音声データの音声レベルが所定の閾値を超えているか否かにより0または1のビット値で示されるビット列101aに変換する出力音声レベル検出部12と、入力音声レベル検出部11が変換した演算処理前のビット列101と、出力音声レベル検出部12が変換した演算処理後のビット列101aとを比較する所定のロジックに基づき、音声障害が発生しているか否かを判定する比較判定部13と、を備えることを特徴とする。
このように、通信伝送装置1(1A,1B)によれば、音声データ(音声信号)が、例えば、コーデック変換処理やエコーキャンセル処理等の所定の演算処理により、その演算処理前後で変化がある場合においても、音声障害を適正に判定することが可能となる。
また、通信伝送装置1(1A,1B)では、伝送対象の音声データそのものを加工するのではなく、音声データが示す音声レベルをビット列に変換して演算処理前後で比較する。よって、音声データの加工による品質劣化を生じさせることなく、音声障害を判定することができる。
また、通信伝送装置1(1A)において、所定のロジックは、演算処理前のビット列101と演算処理後のビット列101aとを比較し、ビット列の各ビット値の変化パターンが一致しない場合に音声障害が発生していると判定し、一致する場合に音声障害が発生していないと判定するロジックであることを特徴とする。
このようにすることにより、通信伝送装置1(1A)は、演算処理前後のビット列において、各ビット値の変化パターンが一致しない場合に、例えば、チャネル間の入れ替わりや雑音等による音声障害が発生していることを判定することができる。よって、音声障害の発生を確実に検出することが可能となる。
また、通信伝送装置1(1B)において、所定のロジックは、演算処理前のビット列101と演算処理後のビット列101aとを比較し、ビット値の0から1、および、1から0で示されるビット変化のタイミングが一致しない場合に音声障害が発生していると判定し、一致する場合に音声障害が発生していないと判定するロジックであることを特徴とする。
このようにすることにより、通信伝送装置1(1B)は、演算処理前後のビット列において、ビット変化のタイミングが一致しない場合に、例えば、チャネル間の入れ替わりや雑音等による音声障害が発生していることを判定することができる。よって、音声障害の発生を確実に検出することが可能となる。
なお、本発明は、以上説明した実施形態に限定されるものではなく、多くの変形が本発明の技術的思想内で当分野において通常の知識を有する者により可能である。
1,1A,1B 通信伝送装置
10 演算処理部
11 入力音声レベル検出部
12 出力音声レベル検出部
13,13A,13B 比較判定部

Claims (5)

  1. 音声データを伝送する通信伝送装置であって、
    入力された所定時間の音声データを、単位時間ごとに区切り、前記単位時間ごとの音声データの音声レベルが所定の閾値を超えているか否かにより0または1のビット値で示されるビット列に変換する入力音声レベル検出部と、
    前記音声データに対して所定の演算処理を行う演算処理部と、
    前記演算処理部が出力した所定時間の演算処理後の音声データを、前記単位時間ごとに区切り、前記単位時間ごとの音声データの音声レベルが前記所定の閾値を超えているか否かにより0または1のビット値で示されるビット列に変換する出力音声レベル検出部と、
    前記入力音声レベル検出部が変換した演算処理前のビット列と、前記出力音声レベル検出部が変換した演算処理後のビット列とを比較する所定のロジックに基づき、音声障害が発生しているか否かを判定する比較判定部と、
    を備えることを特徴とする通信伝送装置。
  2. 前記所定のロジックは、
    前記演算処理前のビット列と前記演算処理後のビット列とを比較し、ビット列の各ビット値の変化パターンが一致しない場合に音声障害が発生していると判定し、一致する場合に音声障害が発生していないと判定するロジックであること
    を特徴とする請求項1に記載の通信伝送装置。
  3. 前記所定のロジックは、
    前記演算処理前のビット列と前記演算処理後のビット列とを比較し、ビット値の0から1、および、1から0で示されるビット変化のタイミングが一致しない場合に音声障害が発生していると判定し、一致する場合に音声障害が発生していないと判定するロジックであること
    を特徴とする請求項1に記載の通信伝送装置。
  4. 音声データを伝送する通信伝送装置の音声障害検出方法であって、
    前記通信伝送装置は、
    入力された所定時間の音声データを、単位時間ごとに区切り、前記単位時間ごとの音声データの音声レベルが所定の閾値を超えているか否かにより0または1のビット値で示されるビット列に変換するステップと、
    前記音声データに対して所定の演算処理を行うステップと、
    前記所定時間の演算処理後の音声データを、前記単位時間ごとに区切り、前記単位時間ごとの音声データの音声レベルが前記所定の閾値を超えているか否かにより0または1のビット値で示されるビット列に変換するステップと、
    演算処理前に変換されたビット列と、演算処理後に変換されたビット列とを比較する所定のロジックに基づき、音声障害が発生しているか否かを判定するステップと、
    を実行することを特徴とする音声障害検出方法。
  5. コンピュータを、請求項1乃至請求項3のいずれか一項に記載の通信伝送装置として機能させるためのプログラム。
JP2022502768A 2020-02-28 2020-02-28 通信伝送装置、音声障害検出方法、および、プログラム Active JP7334846B2 (ja)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
PCT/JP2020/008269 WO2021171547A1 (ja) 2020-02-28 2020-02-28 通信伝送装置、音声障害検出方法、および、プログラム

Publications (2)

Publication Number Publication Date
JPWO2021171547A1 JPWO2021171547A1 (ja) 2021-09-02
JP7334846B2 true JP7334846B2 (ja) 2023-08-29

Family

ID=77491171

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2022502768A Active JP7334846B2 (ja) 2020-02-28 2020-02-28 通信伝送装置、音声障害検出方法、および、プログラム

Country Status (3)

Country Link
US (1) US11810580B2 (ja)
JP (1) JP7334846B2 (ja)
WO (1) WO2021171547A1 (ja)

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2000347678A (ja) 1999-06-08 2000-12-15 Nec Corp トーン発生回路
JP2002258900A (ja) 2001-02-28 2002-09-11 Toshiba Corp 音声再生装置及び音声再生方法

Family Cites Families (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005100159A (ja) * 2003-09-25 2005-04-14 Sony Corp 演算装置及びその方法
EP3492008B1 (en) 2005-09-13 2021-06-02 Veran Medical Technologies, Inc. Apparatus and method for image guided accuracy verification
JP2007259143A (ja) * 2006-03-23 2007-10-04 Fujitsu Ltd 音声データ処理装置及び方法
JP5195402B2 (ja) * 2008-12-25 2013-05-08 パナソニック株式会社 無線通信装置及び無線通信システム
JP5456609B2 (ja) * 2010-07-23 2014-04-02 本田技研工業株式会社 異音検査装置及び方法、並びにプログラム
JP5136670B2 (ja) * 2011-03-18 2013-02-06 株式会社Jvcケンウッド 信号検出装置、無線機及び信号検出方法
JP5827108B2 (ja) * 2011-11-18 2015-12-02 株式会社アニモ 情報処理方法、装置及びプログラム
JP6210448B2 (ja) * 2013-04-05 2017-10-11 パナソニックIpマネジメント株式会社 携帯端末装置
JP6853727B2 (ja) * 2017-04-28 2021-03-31 大阪瓦斯株式会社 警報システム
JP6744343B2 (ja) 2018-02-15 2020-08-19 日本電信電話株式会社 通信伝送装置及び通信伝送装置の音声品質判定方法
JP2019211737A (ja) * 2018-06-08 2019-12-12 パナソニックIpマネジメント株式会社 音声処理装置および翻訳装置
WO2020004609A1 (ja) * 2018-06-28 2020-01-02 ローム株式会社 音波処理装置、および超音波システム
JP7184656B2 (ja) * 2019-01-23 2022-12-06 ラピスセミコンダクタ株式会社 故障判定装置及び音出力装置

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2000347678A (ja) 1999-06-08 2000-12-15 Nec Corp トーン発生回路
JP2002258900A (ja) 2001-02-28 2002-09-11 Toshiba Corp 音声再生装置及び音声再生方法

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
佐藤教之、他1名,通信系伝送装置における音声系障害時機能停止の検討,電子情報通信学会2019年総合大会講演論文集 通信2,2019年03月05日,p. 26
金光卓生,通信系伝送装置における音声系障害検出方式の検討,電子情報通信学会2018年総合大会講演論文集 通信2,2018年03月06日,p. 81
金光卓生、他1名,通信系伝送装置における音声系障害検出方式の検討,電子情報通信学会2019年総合大会講演論文集 通信2,2019年03月05日,p. 25

Also Published As

Publication number Publication date
JPWO2021171547A1 (ja) 2021-09-02
US11810580B2 (en) 2023-11-07
WO2021171547A1 (ja) 2021-09-02
US20230083378A1 (en) 2023-03-16

Similar Documents

Publication Publication Date Title
EP2405634B1 (en) Method of indicating presence of transient noise in a call and apparatus thereof
US8391175B2 (en) Generic on-chip homing and resident, real-time bit exact tests
EP2140637B1 (en) Method of transmitting data in a communication system
GB2493327A (en) Processing audio signals during a communication session by treating as noise, portions of the signal identified as unwanted
JP3255584B2 (ja) 有音検知装置および方法
US8786659B2 (en) Device, method and computer program product for responding to media conference deficiencies
US8041026B1 (en) Event driven noise cancellation
JP4438720B2 (ja) エコーキャンセラ及びマイク装置
US8886527B2 (en) Speech recognition system to evaluate speech signals, method thereof, and storage medium storing the program for speech recognition to evaluate speech signals
US20140133648A1 (en) Method and apparatus for acoustic echo cancellation in voip terminal
JP7334846B2 (ja) 通信伝送装置、音声障害検出方法、および、プログラム
JPWO2019160006A1 (ja) ハウリング抑圧装置、その方法、およびプログラム
KR20160145711A (ko) 정보 손실을 감소시킨 전자 통신들을 위한 시스템들, 방법들 및 디바이스들
JP6644213B1 (ja) 音響信号処理装置、音響システム、音響信号処理方法、及び音響信号処理プログラム
US10554822B1 (en) Noise removal in call centers
JP2016220060A (ja) 帯域予測プログラム、帯域予測装置、および帯域予測方法
JP4825153B2 (ja) 通話区間検出装置、その方法、プログラム及び記録媒体
US12015902B2 (en) Echo cancellation device, echo cancellation method, and program
JP2008294600A (ja) 放収音装置、および放収音システム
WO2024006005A1 (en) Personalized speech enhancement without enrollment
JP2011155665A (ja) 通話区間検出装置、その方法、及びプログラム
JP2009171430A (ja) ノイズ監視方法及びそのシステム並びにその制御プログラム
JP2009100072A (ja) 音声処理装置、音声処理装置の音声処理方法及びプログラム
JPH10200987A (ja) エコーキャンセラー及びエコーキャンセル方法
JP2015200779A (ja) 信号処理装置、信号処理方法およびプログラム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20220711

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20230718

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20230731

R150 Certificate of patent or registration of utility model

Ref document number: 7334846

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150