JP2007514379A - 発信音検出方法及び発信音検出システム - Google Patents

発信音検出方法及び発信音検出システム Download PDF

Info

Publication number
JP2007514379A
JP2007514379A JP2006544077A JP2006544077A JP2007514379A JP 2007514379 A JP2007514379 A JP 2007514379A JP 2006544077 A JP2006544077 A JP 2006544077A JP 2006544077 A JP2006544077 A JP 2006544077A JP 2007514379 A JP2007514379 A JP 2007514379A
Authority
JP
Japan
Prior art keywords
frame
dial tone
signal
signal energy
frames
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2006544077A
Other languages
English (en)
Other versions
JP2007514379A5 (ja
JP4206115B2 (ja
Inventor
ラム、シウ
ミャオ、カイ
レムタラ、アミン
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Intel Corp
Original Assignee
Intel Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Intel Corp filed Critical Intel Corp
Publication of JP2007514379A publication Critical patent/JP2007514379A/ja
Publication of JP2007514379A5 publication Critical patent/JP2007514379A5/ja
Application granted granted Critical
Publication of JP4206115B2 publication Critical patent/JP4206115B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04QSELECTING
    • H04Q1/00Details of selecting apparatus or arrangements
    • H04Q1/18Electrical details
    • H04Q1/30Signalling arrangements; Manipulation of signalling currents
    • H04Q1/44Signalling arrangements; Manipulation of signalling currents using alternate current
    • H04Q1/444Signalling arrangements; Manipulation of signalling currents using alternate current with voice-band signalling frequencies
    • H04Q1/46Signalling arrangements; Manipulation of signalling currents using alternate current with voice-band signalling frequencies comprising means for distinguishing between a signalling current of predetermined frequency and a complex current containing that frequency, e.g. speech current
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04QSELECTING
    • H04Q1/00Details of selecting apparatus or arrangements
    • H04Q1/18Electrical details
    • H04Q1/20Testing circuits or apparatus; Circuits or apparatus for detecting, indicating, or signalling faults or troubles

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Telephonic Communication Services (AREA)
  • Mobile Radio Communication Systems (AREA)
  • Measurement Of Mechanical Vibrations Or Ultrasonic Waves (AREA)
  • Position Fixing By Use Of Radio Waves (AREA)

Abstract

発信音検出方法及び発信音検出システムが説明される。本方法は、発信音を含む信号を有する一連のフレームを受信すること、及び、一連のフレームにおける、少なくとも一部に発信音が存在する最初のフレームを突き止めることを含む。次に、少なくとも一部に発信音が存在する最初のフレームの信号エネルギーを、全体が発信音のフレームの信号エネルギーと比較することもできるし、一連のフレームにおける最初のフレームの後続のフレームの信号エネルギーと比較することもできる。すると、最初のフレームの信号エネルギーと全体が発信音のフレーム又は後続のフレームの信号エネルギーとの比較に基づいて、信号における発信音の開始時刻を求めることができる。一連のフレームにおける、少なくとも一部に発信音が存在する最後のフレームを突き止めて、少なくとも一部に発信音が存在する最後のフレームの信号エネルギーを、全体が発信音のフレームの信号エネルギー又は一連のフレームにおける最後のフレームに先行するフレームの信号エネルギーと比較することによって、信号における発信音の終了時刻を求めることができる。信号における発信音の求められた開始時刻及び求められた終了時刻に基づいて、発信音信号の継続期間を求めることができる。

Description

本発明の実施の形態は、IP電話通信アプリケーションの分野に関し、より詳細には、発信音検出に関する。
現在の電話通信アプリケーションでは、標準化された発信音の存在を検出して送信する必要がある。データ送信が、IP上の音声等のパケットネットワーク上で必要とされる場合、発信音検出は、通常は音声コーデックのフレームレートと同じレートでフレームごとに行われる。発信音の開始及び終了は、音声フレームレートと同期していないので、発信音の開始、終了、及び継続期間の時間表示は正確でない。たとえば、10msのフレームレートの場合、発信音の開始及び終了の時点は、10msずつの増分で表される。これによって、発信音の継続期間の表示は、10msよりも長い分については、その実際の値から逸れる場合がある。発信音の継続期間は、発信音の検出及び分類における重要な基準であるので、この逸れは、発信音検出を不正確とするおそれがあり、発信音の韻律情報を歪ませるおそれがある。
本発明は、本発明の実施の形態を例示するのに使用される以下の説明及び添付図面を参照することによって最も良く理解することができる。
本発明を組み込んだシステムの一般化された一実施の形態を示すブロック図。
本発明の一実施の形態による発信音検出例を示す図。
本発明の一実施の形態による方法を示すフロー図。
例示された発明の一定の態様を実施できる適切なコンピューティング環境を示すブロック図。
発信音検出システム及び発信音検出方法の実施の形態を説明する。以下の説明では、多数の具体的な詳細が述べられる。しかしながら、本発明の実施の形態は、これらの具体的な詳細がなくても実施できることが理解されよう。それ以外の場合には、この説明の理解を分かりにくくしないように、既知の回路、構造、及び技法は詳細に示されていない。
この明細書全体を通じた「一実施の形態」への言及は、その実施の形態と共に説明する特定の特徴、構造、又は特性が、本発明の少なくとも1つの実施の形態に含まれることを意味する。したがって、この明細書の全体を通じたさまざまな箇所に「一実施の形態では」又は「一実施の形態において」というフレーズが現れるが、これは、必ずしもすべてが同じ実施の形態に言及しているとは限らない。さらに、特定の特徴、構造、又は特性は、1つ又は2つ以上の実施の形態において任意の適切な方法で組み合わせることができる。
図1を参照して、ブロック図が、本発明の一実施の形態によるシステム100を示している。システム100は、図1に示すコンポーネントよりも多くのコンポーネントを含むことができることが当業者には理解されよう。しかしながら、これらの一般的には従来のコンポーネントのすべてを、本発明を実施するための一例示の実施の形態を開示するのに示す必要はない。
システム100は、IPネットワーク114と、ゲートウェイ106を介してIPネットワーク114に接続された送信機102と、ゲートウェイ116を介してIPネットワーク114に接続された受信機104とを含む。ゲートウェイ106は、送信機からの受信信号が発信音信号であるかどうかを検出する発信音検出器108を含む。受信信号が発信音信号であると判断された場合、それらの受信信号は、IPネットワーク114へ送信される前に発信音符号化器112によって符号化される。受信信号が、音声信号であると判断された場合、それらの受信信号は、IPネットワーク114へ送信される前に音声符号化器110によって符号化される。発信音信号又は音声信号は、その後、IPネットワーク114からゲートウェイ116を介して受信機104へ送信することができる。
発信音検出器108は、高速フーリエ変換(FFT)又はフィルタバンク解析等のさまざまな発信音検出アルゴリズムの1つを使用して、受信信号中に発信音を検出することができる。これらのアルゴリズムは、通常、信号のエネルギー及び周波数を求めることによって受信信号を解析する。次に、信号のエネルギー及び周波数は、あらかじめ定義された発信音テンプレートのさまざまな発信音のエネルギー及び周波数と比較されて、信号に発信音がもしあれば、その発信音が識別される。したがって、発信音が信号中に検出された後、発信音信号の各フレームの平均エネルギーレベルは、すでに求められている場合がある。
発信音信号の中間フレームでは、平均エネルギーは比較的安定しており、信号の振幅によって求めることができる。一方、発信音は、フレームの先頭で常に開始するとは限らず、また、フレームの末尾で常に終了するとは限らない。したがって、発信音信号の最初のフレーム及び最後のフレームは、発信音がフレームの一部にしか現れないために、中間フレームの平均エネルギーよりも小さな平均エネルギーを有する場合がある。
フレームの平均エネルギーのレベルは、そのフレーム内の発信音の継続期間に比例するはずである。したがって、発信音信号の最初のフレーム内の発信音の持続時間を見積もるために、全体が発信音のフレームの平均エネルギーに対する最初のフレームの平均エネルギーの比を使用することができる。一実施の形態では、発信音信号の最初のフレーム内における発信音の持続時間は、中間フレームの平均エネルギーに対する最初のフレームの平均エネルギーの比を使用することによって見積もることができる。同様に、発信音信号の最後のフレーム内における発信音の持続時間を見積もるには、全体が発信音のフレーム、すなわち中間フレームの平均エネルギーに対する最後のフレームの平均エネルギーの比を使用することができる。一実施の形態では、エネルギーの比を実際の持続時間にマッピングする参照表を使用して、最初のフレーム内又は最後のフレーム内における発信音の持続時間を求めることができる。
発信音信号の各フレームの平均エネルギーを求めて記憶するとともに、上述した除算及び/又は表参照を行うことにより、発信音信号の最初のフレーム内及び最後のフレーム内における発信音の持続時間を求めることができ、発信音信号における発信音のより正確且つ精密な開始時刻、終了時刻、及び全持続時間を提供することができる。
図2は、本発明の一実施の形態による一例示の発信音信号202を用いた発信音検出例を示す図である。この例では、発信音は、6つのフレーム(N+1からN+6)に現れ、フレームレートは10msである。他のさまざまなフレームレートを本発明と共に使用することができる。他のさまざまなフレームレートには、20ms、40ms、又は60msが含まれるが、これらに限定されるものではない。発信音検出器は、上述したように、多数の発信音検出アルゴリズムの1つを使用して、受信信号202が発信音信号であるかどうかを判断することができる。信号202のエネルギー及び周波数を解析して、1つ又は2つ以上の所定の発信音テンプレートにおける1つ又は2つ以上の発信音のエネルギー及び周波数と比較することができる。この比較によって、発信音が信号202に存在するかどうかが判断される。発信音が信号202中に検出されない場合、信号202は、受信機104へ送信される前に、音声符号化器110へ送られて符号化を受けることができる。発信音が信号202中に検出された場合、さらなる解析を行って、発信音の先頭、末尾、及び継続期間を求めることができる。信号202の各フレームの平均エネルギーは、発信音の先頭、中間、及び末尾の周波数ビンに従って記憶することができる。この平均エネルギーは、発信音検出解析中にすでに求められている場合がある。
発信音の先頭を見つけるために、少なくとも一部に発信音が存在する、発信音信号の最初のフレームの位置が突き止められる。上述した発信音検出解析は、発信音信号の先頭フレーム及び末尾フレームをすでに求めている場合がある。この求められた先頭フレーム及び末尾フレームは正確である場合もあるし、正確でない場合もある。たとえば、図2に示す例では、発信音検出解析は、発信音がフレームN+2で開始してフレームN+5で終了すると判断している可能性がある。この不正確な判断は、フレームN+1及びN+6が、検出解析によって認識されるだけ十分な発信音を含んでいないことにより引き起こされる場合がある。
一実施の形態では、発信音の先頭の位置は、発信音検出解析によって提供された先頭フレームを検査して、このフレームの平均エネルギーを後続のフレーム及び/又は先行するフレームの平均エネルギーと比較することによって求めることができる。たとえば、発信音検出解析は、フレームN+2が発信音の先頭フレームであると判断したものと仮定する。フレームN+2の平均エネルギーは100である。次のフレーム(N+3)の平均エネルギーは100である。これらの平均エネルギーの比は1である。発信音信号の中間フレームのそれぞれの平均エネルギーは、全体が発信音のフレームの平均エネルギーを表すので、この1という比は、フレームN+2及びフレームN+3の双方が、全体が発信音のフレームであることを示している。したがって、フレームN+2の前に、一部の発信音を有し、且つ、発信音の実際の先頭を含むフレームが存在する可能性がある。したがって、フレームN+1が解析される。フレームN+1の平均エネルギーは、40であり、100であるフレームN+2の平均エネルギーと比較される。したがって、平均エネルギーの比は4/10である。これは、フレームN+1が、一部が発信音のフレームであり、発信音の先頭を含むことを示している。この発信音の先頭の開始時刻を求めるために、4/10の比が使用されて、実際の持続時間が参照される。フレームの平均エネルギーのレベルは、そのフレーム内における発信音の継続期間に比例するはずであるので、10msのフレームレートの場合の4/10の比は、フレームN+1に4msの発信音が存在することを示している。
別の例で、発信音検出解析が、発信音の先頭フレームとしてN+1と判断していた場合、4/10である、フレームN+2の平均エネルギーに対するフレームN+1の平均エネルギーの比は、N+1が、一部が発信音のフレームであり、発信音の先頭を含むことを示している。したがって、先行するフレーム(たとえば、フレームN)の解析は必要とされない。
発信音の末尾の位置も、同様にして求めることができる。たとえば、発信音検出解析は、フレームN+5が末尾フレームであると判断するものと仮定する。フレームN+5の平均エネルギーは100である。この平均エネルギーは、100である先行するフレーム(たとえば、N+4)の平均エネルギーと比較される。これらの平均エネルギーの比は1である。これは、N+4及びN+5の双方が、全体が発信音のフレームであることを示している。したがって、後続のフレームを解析する必要がある。フレームN+6は、20の平均エネルギーを有する。フレームN+5の平均エネルギーに対するフレームN+6の平均エネルギーの比は2/10である。これは、フレームN+6が、一部が発信音のフレームであり、発信音の末尾を含むことを示している。10msのフレームレートの場合の2/10の比は、フレームN+6が2msの発信音を含むことを示している。
より精密な発信音の先頭及び末尾が、上述したプロセスを介して求められた後、より精密な発信音の全継続期間を求めることができる。図2の例では、それぞれが10msの発信音を有する、全体が発信音の4つのフレーム(N+2〜N+5)、4msの発信音を有する先頭の一部のフレーム、及び2msの発信音を有する末尾の一部のフレームが存在するので、発信音の全継続期間は46msとなる。
図3は、本発明の一実施の形態による方法を示している。300において、発信音を含む信号を有する一連のフレームが受信される。302において、一連のフレームにおける、少なくとも一部に発信音が存在する最初のフレームが突き止められる。304において、最初のフレームの信号エネルギーが、一連のフレームにおける後続のフレームの信号エネルギーと比較される。一実施の形態では、この比較は、一連のフレームにおける後続のフレームの信号エネルギーに対する最初のフレームの信号エネルギーの比を使用することによって行うことができる。一実施の形態では、この比にフレームレートを乗算して、最初のフレームにおける発信音の継続期間を求めることができる。一実施の形態では、この比を使用して、エネルギーの比を持続時間にマッピングする表参照を行うことができる。306において、最初のフレームの信号エネルギーと後続のフレームの信号エネルギーとの比較に基づいて、信号における発信音の開始時刻が求められる。一実施の形態では、一連のフレームにおける、少なくとも一部に発信音が存在する最後のフレームが突き止められる。次に、最後のフレームの信号エネルギーは、一連のフレームにおける先行するフレームの信号エネルギーと比較することができる。次に、最後のフレームの信号エネルギーと先行するフレームの信号エネルギーとの比較に基づいて、信号における発信音の終了時刻を求めることができる。一実施の形態では、信号における求められた発信音の開始時刻及び終了時刻に基づいて、発信音の継続期間を求めることができる。
図4は、例示された発明の一定の態様を実施できる適切なコンピューティング環境を示すブロック図である。一実施の形態では、上述した方法は、コンポーネント402〜412を有するコンピュータシステム400において実施することができる。コンポーネント402〜412は、プロセッサ402、メモリ404、入出力デバイス406、データストレージデバイス412、及びネットワークインターフェース410を含む。これらのコンポーネントは、バス408を介して相互に接続されている。これらのコンポーネントは、当該技術分野において既知の、それらコンポーネントの従来の機能を実行し、システム100を実施するための手段を提供する。集合的に、これらのコンポーネントは、ハードウェアシステムの広いカテゴリーを表す。ハードウェアシステムには、汎用コンピュータシステム及び専用パケット転送デバイスが含まれるが、これらに限定されるものではない。コンピュータシステム400のさまざまなコンポーネントが再配置できること、及び、本発明の一定の実施態様は、上記コンポーネントのすべてを必要とするとは限らない場合もあるし、すべてを含むとは限らない場合もあることが理解されるべきである。さらに、追加プロセッサ(たとえば、デジタル信号プロセッサ)、ストレージデバイス、メモリ、及びネットワークインターフェース又は通信インターフェース等の追加コンポーネントをシステム400に含めることもできる。
当業者には理解されるように、本発明の方法の一実施の形態を実施するためのコンテンツ、たとえば、コンピュータプログラム命令は、メモリの一部として、又は、メモリに加えて、システム100によりアクセス可能なデータを記憶できる任意のマシン可読媒体が提供することができる。このマシン可読媒体には、カートリッジ、磁気カセット、フラッシュメモリカード、デジタルビデオディスク、ランダムアクセスメモリ(RAM)、読み出し専用メモリ(ROM)等が含まれるが、これらに限定されるものではない。この点において、システム100は、当該技術分野において既知の方法で、このようなマシン可読媒体と通信するように装備されている。
本発明の方法の一実施の形態を実施するためのコンテンツは、当該コンテンツを記憶し、当該コンテンツをシステム100へ通信することができる任意の外部デバイスからシステム100へ提供することができることが、当業者によってさらに理解されよう。たとえば、本発明の一実施の形態では、システム100をネットワークに接続でき、コンテンツをネットワークの任意のデバイスに記憶することができる。
本発明をいくつかの実施の形態に関して説明してきたが、本発明は、説明した実施の形態に限定されるものではなく、添付の特許請求の範囲の精神内及び範囲内にある変更及び改変を伴って実施できることが当業者には認識されよう。したがって、この説明は、限定ではなく例示とみなされるべきである。

Claims (26)

  1. 発信音を含む信号を有する一連のフレームを受信すること、
    前記一連のフレームにおける、少なくとも一部に発信音が存在する最初のフレームを突き止めること、
    少なくとも一部に発信音が存在する前記最初のフレームの前記信号エネルギーを、前記一連のフレームにおける後続のフレームの信号エネルギーと比較すること、及び
    前記最初のフレームの前記信号エネルギーと前記後続のフレームの前記信号エネルギーとの前記比較に基づいて、前記信号における前記発信音の開始時刻を求めること、
    を含む方法。
  2. 前記一連のフレームにおける、少なくとも一部に発信音が存在する最後のフレームを突き止めることをさらに含む、請求項1に記載の方法。
  3. 前記最後のフレームの前記信号エネルギーを前記一連のフレームにおける先行するフレームの信号エネルギーと比較することをさらに含む、請求項2に記載の方法。
  4. 前記最後のフレームの前記信号エネルギーと前記先行するフレームの前記信号エネルギーとの前記比較に基づいて、前記信号における前記発信音の終了時刻を求めることをさらに含む、請求項3に記載の方法。
  5. 前記信号における前記発信音の前記求められた開始時刻及び前記求められた終了時刻に基づいて、前記発信音の継続期間を求めることをさらに含む、請求項4に記載の方法。
  6. 前記最初のフレームの前記信号エネルギーを、前記一連のフレームにおける後続のフレームの信号エネルギーと比較することは、該一連のフレームにおける後続のフレームの信号エネルギーに対する前記最初のフレームの前記信号エネルギーの比を求めることを含む、請求項1に記載の方法。
  7. 前記最初のフレームの前記信号エネルギーと前記後続のフレームの前記信号エネルギーとの前記比較に基づいて、前記信号における前記発信音の開始時刻を求めることは、前記一連のフレームにおける後続のフレームの前記信号エネルギーに対する前記最初のフレームの前記信号エネルギーの前記比に前記フレームレートを乗算することであって、それによって、前記最初のフレームにおける前記発信音の前記継続期間を求める、乗算することを含む、請求項6に記載の方法。
  8. 前記最初のフレームの前記信号エネルギーと前記後続のフレームの前記信号エネルギーとの前記比較に基づいて、前記信号における前記発信音の開始時刻を求めることは、前記一連のフレームにおける後続のフレームの前記信号エネルギーに対する前記最初のフレームの前記信号エネルギーの前記比を使用することであって、それによって、エネルギーの比を持続時間にマッピングする表参照を行う、使用することを含む、請求項6に記載の方法。
  9. 一連のフレームで表される信号において発信音の存在を検出して、前記一連のフレームにおける各フレームの信号エネルギーを求める、発信音検出素子と、
    該発信音検出素子に接続されて、前記一連のフレームにおける、少なくとも一部に発信音が存在する最初のフレームの前記信号エネルギーを、全体が発信音のフレームの前記信号エネルギーと比較し、前記最初のフレームの前記信号エネルギーと前記全体が発信音のフレームの前記信号エネルギーとの前記比較に基づいて、前記信号における前記発信音の開始時刻を求める発信音解析素子と
    を備える装置。
  10. 前記発信音検出素子に接続されて音声信号を符号化する音声符号化器をさらに備える、請求項9に記載の装置。
  11. 前記発信音解析素子に接続されて発信音信号を符号化する発信音符号化器をさらに備える、請求項9に記載の装置。
  12. 前記一連のフレームにおける、少なくとも一部に発信音が存在する前記最初のフレームの前記信号エネルギーを、全体が発信音のフレームの前記信号エネルギーと比較し、前記最初のフレームの前記信号エネルギーと前記全体が発信音のフレームの前記信号エネルギーとの前記比較に基づいて、前記信号における前記発信音の開始時刻を求める前記発信音解析素子は、前記一連のフレームにおける、少なくとも一部に発信音が存在する前記最初のフレームの前記信号エネルギーを、該一連のフレームにおける該最初のフレームの後続のフレームの前記信号エネルギーと比較し、前記最初のフレームの前記信号エネルギーと前記後続のフレームの前記信号エネルギーとの前記比較に基づいて、前記信号における前記発信音の開始時刻を求める前記発信音解析素子を含む、請求項9に記載の装置。
  13. 前記発信音解析素子は、さらに、前記一連のフレームにおける、少なくとも一部に発信音が存在する最後のフレームの前記信号エネルギーを、全体が発信音のフレームの前記信号エネルギーと比較し、前記最後のフレームの前記信号エネルギーと前記全体が発信音のフレームの前記信号エネルギーとの前記比較に基づいて、前記信号における前記発信音の前記終了時刻を求める、請求項9に記載の装置。
  14. 前記発信音解析素子は、さらに、前記信号における前記発信音の前記求められた開始時刻及び前記求められた終了時刻に基づいて、前記発信音の継続期間を求める、請求項13に記載の装置。
  15. 前記一連のフレームにおける、少なくとも一部に発信音が存在する前記最後のフレームの前記信号エネルギーを、全体が発信音のフレームの前記信号エネルギーと比較し、前記最後のフレームの前記信号エネルギーと前記全体が発信音のフレームの前記信号エネルギーとの前記比較に基づいて、前記信号における前記発信音の前記終了時刻を求める前記発信音解析素子は、前記一連のフレームにおける、少なくとも一部に発信音が存在する前記最後のフレームの前記信号エネルギーを、該一連のフレームにおける該最後のフレームに先行するフレームの前記信号エネルギーと比較し、前記最後のフレームの前記信号エネルギーと前記先行するフレームの前記信号エネルギーとの前記比較に基づいて、前記信号における前記発信音の前記終了時刻を求める前記発信音解析素子を含む、請求項13に記載の装置。
  16. マシンアクセス可能媒体であって、
    マシンによってアクセスされると、
    発信音信号を有する一連のフレームを受信すること、
    前記一連のフレームにおける、少なくとも一部に発信音を含む最初のフレームを突き止めること、
    少なくとも一部に発信音を含む前記最初のフレームの前記信号エネルギーを、全体が発信音のフレームの信号エネルギーと比較すること、及び
    前記最初のフレームの前記信号エネルギーと前記全体が発信音のフレームの前記信号エネルギーとの前記比較に基づいて、前記信号における前記発信音の開始時刻を求めること、
    を含むオペレーションを前記マシンに実行させるコンテンツを含む、マシンアクセス可能媒体
    を備える製品。
  17. 前記マシンアクセス可能媒体は、前記一連のフレームにおける、少なくとも一部に発信音を含む最後のフレームを突き止めることを含むオペレーションを前記マシンに実行させるコンテンツをさらに含む、請求項16に記載の製品。
  18. 前記マシンアクセス可能媒体は、前記最後のフレームの前記信号エネルギーを全体が発信音のフレームの信号エネルギーと比較することを含むオペレーションを前記マシンに実行させるコンテンツをさらに含む、請求項17に記載の製品。
  19. 前記マシンアクセス可能媒体は、前記最後のフレームの前記信号エネルギーと前記全体が発信音のフレームの前記信号エネルギーとの前記比較に基づいて、前記信号における前記発信音の終了時刻を求めることを含むオペレーションを前記マシンに実行させるコンテンツをさらに含む、請求項18に記載の製品。
  20. 前記マシンによってアクセスされると、前記最後のフレームの前記信号エネルギーを全体が発信音のフレームの信号エネルギーと比較すること、及び、前記最後のフレームの前記信号エネルギーと前記全体が発信音のフレームの前記信号エネルギーとの前記比較に基づいて、前記信号における前記発信音の終了時刻を求めることを含むオペレーションを前記マシンに実行させるコンテンツを含む前記マシンアクセス可能媒体は、前記マシンによってアクセスされると、前記最後のフレームの前記信号エネルギーを、前記一連のフレームにおける該最後のフレームに先行するフレームの信号エネルギーと比較すること、及び、前記最後のフレームの前記信号エネルギーと前記先行するフレームの前記信号エネルギーとの前記比較に基づいて、前記信号における前記発信音の終了時刻を求めることを含むオペレーションを前記マシンに実行させるコンテンツを含む前記マシンアクセス可能媒体を含む、請求項19に記載の製品。
  21. 前記マシンアクセス可能媒体は、前記信号における前記発信音の前記求められた開始時刻及び前記求められた終了時刻に基づいて、前記発信音の継続期間を求めることを含むオペレーションを前記マシンに実行させるコンテンツをさらに含む、請求項19に記載の製品。
  22. 前記マシンによってアクセスされると、少なくとも一部に発信音を含む前記最初のフレームの前記信号エネルギーを全体が発信音のフレームの信号エネルギーと比較すること、及び、前記最初のフレームの前記信号エネルギーと前記全体が発信音のフレームの前記信号エネルギーとの前記比較に基づいて、前記信号における前記発信音の開始時刻を求めることを含むオペレーションを前記マシンに実行させるコンテンツを含む前記マシンアクセス可能媒体は、前記マシンによってアクセスされると、少なくとも一部に発信音を含む前記最初のフレームの前記信号エネルギーを、前記一連のフレームにおける該最初のフレームの後続のフレームの信号エネルギーと比較すること、及び、前記最初のフレームの前記信号エネルギーと前記後続のフレームの前記信号エネルギーとの前記比較に基づいて、前記信号における前記発信音の開始時刻を求めることを含むオペレーションを前記マシンに実行させるコンテンツを含む前記マシンアクセス可能媒体を含む、請求項16に記載の製品。
  23. 発信音を含む信号を送信する送信機と、
    該送信機に接続されて前記信号を受信する発信音検出器であって、前記信号は一連のフレームで表され、
    前記信号において前記発信音の存在を検出して、前記一連のフレームにおける各フレームの信号エネルギーを求める、発信音検出素子と、
    該発信音検出素子に接続されて、前記一連のフレームにおける、少なくとも一部に発信音が存在する最初のフレームの前記信号エネルギーを、前記一連のフレームにおける後続のフレームの前記信号エネルギーと比較し、前記最初のフレームの前記信号エネルギーと前記後続のフレームの前記信号エネルギーとの前記比較に基づいて、前記信号における前記発信音の開始時刻を求める、発信音解析素子と
    を含む、発信音検出器と
    を備えるシステム。
  24. 前記発信音検出器に接続されて、受信機への送信前に前記信号を符号化する、発信音符号化器をさらに備える、請求項23に記載のシステム。
  25. 前記発信音検出器に接続されて、受信された音声信号を符号化する、音声符号化器をさらに備える、請求項23に記載のシステム。
  26. 前記発信音解析素子は、さらに、前記一連のフレームにおける、少なくとも一部に発信音が存在する最後のフレームの前記信号エネルギーを、前記一連のフレームにおける、先行するフレームの前記信号エネルギーと比較し、前記最後のフレームの前記信号エネルギーと前記先行するフレームの前記信号エネルギーとの前記比較に基づいて、前記信号における前記発信音の終了時刻を求める、請求項23に記載のシステム。
JP2006544077A 2003-12-23 2004-12-10 トーン検出方法及びトーン検出システム Expired - Fee Related JP4206115B2 (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US10/746,900 US7715447B2 (en) 2003-12-23 2003-12-23 Method and system for tone detection
PCT/US2004/041688 WO2005067321A1 (en) 2003-12-23 2004-12-10 Method and system for tone detection

Publications (3)

Publication Number Publication Date
JP2007514379A true JP2007514379A (ja) 2007-05-31
JP2007514379A5 JP2007514379A5 (ja) 2008-04-17
JP4206115B2 JP4206115B2 (ja) 2009-01-07

Family

ID=34679275

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2006544077A Expired - Fee Related JP4206115B2 (ja) 2003-12-23 2004-12-10 トーン検出方法及びトーン検出システム

Country Status (8)

Country Link
US (1) US7715447B2 (ja)
EP (1) EP1698184B1 (ja)
JP (1) JP4206115B2 (ja)
KR (1) KR100839691B1 (ja)
CN (1) CN1898970B (ja)
AT (1) ATE525864T1 (ja)
TW (1) TWI265720B (ja)
WO (1) WO2005067321A1 (ja)

Families Citing this family (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101383982B (zh) * 2008-10-21 2011-11-23 松翰科技股份有限公司 适用于自动控制装置的音调检测方法及音调检测装置
WO2010131074A1 (en) * 2009-05-14 2010-11-18 Freescale Semiconductor, Inc. Tone relay system and method
CN105050021B (zh) * 2015-08-05 2019-02-22 Oppo广东移动通信有限公司 耳机音质检测方法、系统及终端
CN106887241A (zh) 2016-10-12 2017-06-23 阿里巴巴集团控股有限公司 一种语音信号检测方法与装置
US10621980B2 (en) * 2017-03-21 2020-04-14 Harman International Industries, Inc. Execution of voice commands in a multi-device system
GB2596169B (en) * 2020-02-11 2022-04-27 Tymphany Acoustic Tech Ltd A method and an audio processing unit for detecting a tone
US11445283B2 (en) * 2020-10-13 2022-09-13 Plantronics, Inc. Systems and methods for automated configuration of telephone headset interface

Family Cites Families (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
FI100932B (fi) 1995-04-12 1998-03-13 Nokia Telecommunications Oy Äänitaajuussignaalien lähetys radiopuhelinjärjestelmässä
CN1136536C (zh) * 1996-01-16 2004-01-28 雅马哈株式会社 音调检测装置
US5809133A (en) * 1996-05-24 1998-09-15 Advanced Micro Devices, Inc. DTMF detector system and method which performs frequency domain energy calculations with improved performance
US6046977A (en) * 1998-09-23 2000-04-04 Advanced Microdevices, Inc. Method and apparatus for detecting signal misalignment
US6370555B1 (en) * 1998-09-25 2002-04-09 Legerity, Inc. Method and system for improved detection of analog signals
US6711540B1 (en) * 1998-09-25 2004-03-23 Legerity, Inc. Tone detector with noise detection and dynamic thresholding for robust performance
US6763106B1 (en) * 1998-11-19 2004-07-13 Legerity Inc. Signal detector with duration-based frame width
US6898204B2 (en) * 2000-04-07 2005-05-24 Broadcom Corporation Method of determining a collision between a plurality of transmitting stations in a frame-based communications network
US6873701B1 (en) * 2001-03-29 2005-03-29 3Com Corporation System and method for DTMF detection using likelihood ratios
US20030123574A1 (en) * 2001-12-31 2003-07-03 Simeon Richard Corpuz System and method for robust tone detection
ATE377911T1 (de) 2002-02-08 2007-11-15 Hewlett Packard Co Verbesserungen in beziehung zur detektion eines zweitonmehrfrequenzsignales
US7257165B2 (en) * 2002-04-18 2007-08-14 Gardner Steven H Method and apparatus for preamble detection and time synchronization estimation in OFDM communication systems
US20050058273A1 (en) * 2003-09-11 2005-03-17 Lam Siu H. Methods and apparatus for detecting signaling tones in telephony data signal

Also Published As

Publication number Publication date
WO2005067321A1 (en) 2005-07-21
US20050135431A1 (en) 2005-06-23
KR20060108726A (ko) 2006-10-18
EP1698184A1 (en) 2006-09-06
TW200526000A (en) 2005-08-01
EP1698184B1 (en) 2011-09-21
KR100839691B1 (ko) 2008-06-19
CN1898970A (zh) 2007-01-17
JP4206115B2 (ja) 2009-01-07
ATE525864T1 (de) 2011-10-15
CN1898970B (zh) 2011-01-26
US7715447B2 (en) 2010-05-11
TWI265720B (en) 2006-11-01

Similar Documents

Publication Publication Date Title
US9947338B1 (en) Echo latency estimation
US9467790B2 (en) Reverberation estimator
US6873954B1 (en) Method and apparatus in a telecommunications system
US20050043959A1 (en) Method for replacing corrupted audio data
CN106486134B (zh) 话语状态确定装置及方法
CN113192536B (zh) 语音质量检测模型的训练方法、语音质量检测方法及装置
WO2014194641A1 (en) Audio playback method, apparatus and system
US8214201B2 (en) Pitch range refinement
JP4206115B2 (ja) トーン検出方法及びトーン検出システム
US10522160B2 (en) Methods and apparatus to identify a source of speech captured at a wearable electronic device
EP1226577A1 (en) Handling variable delay in objective speech quality assessment
EP0972283A1 (en) Vocoder system and method for performing pitch estimation using an adaptive correlation sample window
JP2007514379A5 (ja)
CN108093356B (zh) 一种啸叫检测方法及装置
CN113436644B (zh) 音质评估方法、装置、电子设备及存储介质
CN114678038A (zh) 音频噪声检测方法、计算机设备和计算机程序产品
CN109830243B (zh) 音效处理方法、装置及计算机设备
TWI358717B (en) Apparatus, server, method, and computer readabe me
FR2817096A1 (fr) Procede et systeme de detection non intrusive des defauts d'un signal de parole transmis en telephonie sur reseau de transmission par paquets
JPS63281200A (ja) 音声区間検出方式
WO1988007738A1 (en) An adaptive multivariate estimating apparatus
Farsi et al. Improving voice activity detection used in ITU-T G. 729. B
CN116320372A (zh) 音频延时检测方法、系统、装置、存储介质和处理器
WO2022139730A1 (en) Method enabling the detection of the speech signal activity regions
JPS5834986B2 (ja) 適応形音声検出回路

Legal Events

Date Code Title Description
A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20071010

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20080115

A524 Written submission of copy of amendment under article 19 pct

Free format text: JAPANESE INTERMEDIATE CODE: A524

Effective date: 20080229

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20080930

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20081017

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20111024

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Ref document number: 4206115

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20121024

Year of fee payment: 4

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20131024

Year of fee payment: 5

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

LAPS Cancellation because of no payment of annual fees