JP2006504300A

JP2006504300A - Ｃｅｌｐパラメータ領域におけるｄｔｍｆ検索と音声ミキシングのための方法及び装置

Info

Publication number: JP2006504300A
Application number: JP2004545611A
Authority: JP
Inventors: ジャブリ、マーワン、エー; ワン、ジランウェイ; ジョージ、サムチ; イブラハム、マイケル
Original assignee: ディリティアムネットワークスピーティーワイリミテッド
Priority date: 2002-10-25
Filing date: 2003-10-24
Publication date: 2006-02-02
Also published as: US7133521B2; KR100756311B1; CN1708997A; US20070025546A1; EP1557052A1; US20040174984A1; KR20050072456A; WO2004039096A1; AU2003273625A1

Abstract

【課題】十分に符号化と音声信号を再構成せずに、ＤＴＭＦ検出と符号励起線形予測（ＣＥＬＰ）パラメータ空間における音声混合のための方法と装置を提供する。
【解決手段】この装置はデュアルトーン多重化周波数（ＤＴＭＦ）信号検出モジュールと多重−入力混合モジュールを含む。ＤＴＭＦ信号検出モジュールはＤＴＭＦ信号を検出する。ＤＴＭＦ信号検出モジュールは入力ＣＥＬＰパラメータからの特徴的な特性を計算し、ＤＴＭＦ信号の知られた特性と比較することによりＤＴＭＦ信号検出モジュールを検出する。多重−入力混合モジュールは多重音声信号を表す入力ＣＥＬＰパラメータの多重セットを混合し、ＣＥＬＰパラメータの単一セットにする。混合計算は入力ＣＥＬＰパラメータの各セットを解析し、入力セットの重要度を決定し、ＣＥＬＰパラメータを混合するための戦略を選択し、混合したＣＥＬＰパラメータを出力することにより実施される。方法はＣＥＬＰパラメータの一つもしくはそれ以上のセットと外部コマンドを入力し、ＤＴＭＦトーンを検出し、ＣＥＬＰパラメータ多重セットを混合し、ＤＴＭＦ信号をもし検出されれば、出力し、混合したＣＥＬＰパラメータを出力する。

Description

本出願は、２００２年１０月２５日に出願され、発明の名称を「音声トランスコーダにおけるインバンドＤＴＭＦ検出及び生成の方法」とする米国仮特許出願第６０/４２１３４２号（アトーニードケット番号０２１３１８−００１２００ＵＳ）、及び２００２年１０月２５日に出願され、発明の名称を「複数入力源音声トランスコーディングの方法」とする米国仮特許出願第６０／４２１２７１号（アトーニードケット番号０２１３１８−００１４００ＵＳ）、について優先権を主張する。これらの出願の内容は参照として本願に取り込むものとする。

本願発明は、一般的に電気通信信号処理に関する。より詳細には、本発明はＤＴＭＦ（すなわち、デュアルトーン変調周波数）検索とＣＥＬＰ（即ち、符号励起線形予測）領域における音声ミキシングを実行するための方法と装置を提供する。詳細には、ＣＥＬＰパラメータからの圧縮された信号におけるＤＴＭＦ音声の存在を検索するための方法と装置に関する。そして又ＣＥＬＰパラメータの複数セットにより表された多重（複数）入力圧縮音声信号をミキシングしてＣＥＬＰパラメータの単一のセットのための方法と装置に関する。単に実施例によってのみ、本発明は音声符号化に追うようされている。しかし、本発明はより広い応用範囲を有していると認識されている。

電気通信技術は長年にわたり発達してきた。最近、特定のバンド幅の異なるパケットネットワークとモバイル通信システムの要求に適合するように発達したさまざまなデジタル音声符号器がある。デジタル音声符号器は逆変換関数と同様にデジタル化された音声信号の圧縮を提供する。多様なネットワークと無線通信システムにおける早い成長は、一般的に音声信号が異なる圧縮形式の間で変換されることを要求する。このような変換に対する従来の方法は２つの音声符号器を一列に連結して配置し単一の連結を提供することである。このような場合、第一の圧縮された音声信号は第一の音声デコーダにより復号化されデジタル化された信号にされ、生成されるデジタル信号は第二の音声エンコーダにより再び符号化（エンコード）され第二の圧縮された音声信号にされる。一列に連結された２つの音声符号器は「タンデムコーディング」アプローチと通常呼ばれる。タンデムコーディングアプローチは十分に圧縮された信号を復号化してパルス符号変調（ＰＣＭ）表現のようなデジタル化された信号にし、そして信号を再びコード化（エンコード）する。このことはしばしば多くの処理を要求し遅延の増加を招く。多くの効率的なアプローチはとりわけスマートな符号変換と呼ばれる技術を含む。

現在の多様なネットワークと無線通信システムにおける音声符号変換の要求に加えて、先進の特徴処理のための機能を提供することも要求される。上位機能の特別な例はデュアルトーン多重化周波数（ＤＴＭＦ）信号検出である。ＤＴＭＦ信号は電話のダイアリング、ボイスメール、電子バンキングシステムにおいて広く使用され、さらに、インターネット・プロトコル（ＩＰ）電話を使用する場合でさえ、ＩＰアドレスに固定するために広く使用される。電気通信音声コーデックにおいて、インバンドＤＴＭＦ信号は圧縮されたビット列にエンコードされる。従来のＤＴＭＦ信号検出は音声信号空間において実施される。単に一例として、２極無限インパルス応答（ＩＩＲ）型フィルターに伴うＧoertzelアルゴリズムは入力デジタル信号から必要なスペクトル情報を抽出するために広く使用され、ＤＴＭＦ検出の基礎を形成するために使用される。

ＤＴＭＦ信号検出が音声符号変換に要求されるとき、タンデムアプローチが広く使用される。このアプローチでは、入力圧縮音声信号はＤＴＭＦ信号を検出するために音声領域にデコード（復号化）され、圧縮フォーマットへ再エンコードされる。音声符号変換における先進の利口な処理はＣＥＬＰパラメータ空間において実施されるので、既知のＤＴＭＦ検出方法はしばしば適合しない。さらに、既知の先進的な音声符号変換方法はＤＴＭＦ信号検出機能を含まず、従って制限される。

音声符号化のための新進的な構成の別の特定の例は多重（複数）入力信号を取り扱う能力である。入力信号が複数の音声信号で有る場合、単に音声ミキサーは音声信号を混合し、混合音声信号を出力するのみである。しかし、パケットネットワークもしくは無線通信システムにおいては、入力信号は多重圧縮信号である。さらに、パケットネットワークの現在の多様性と無線通信システムとともに、入力信号は様々な圧縮形式を有している。従来の音声混合ソリューションは、音声信号を音声信号に復号化し音声信号を混合し、混合音声信号を出力パケットに再度エンコードすることにより、入力パケットを混合する。これは、それぞれの入力圧縮信号を復号化し再エンコード（符号化）するために大きな計算複雑性を要求する。

パケットネットワークに対して音声ミキシングにより生成された音声の質を改善する試みにおいて、あるスマートな会議ブリッジング方法が提案されている。このような方法は補足的な情報を提供し、混合音声信号の質を改善することができる。しかしながら、この方法は復号化し、音声空間において混合し、再符号化（再エンコード）を含む一連の処理を行うというアプローチをまだ使用している。このアプローチは音声空間に行くことなしに、ＣＥＬＰパラメータ空間において動作する音声トランスコーダにしばしば適していない。

上述したことから、電気通信信号の処理を改善するための技術は非常に望まれている。

本発明によれば、電気通信信号を処理するための技術が提供される。より詳細には、本発明はＤＴＭＦ検索とＣＥＬＰ領域における音声ミキシングを実施するための方法と装置を提供する。より詳細には、ＣＥＬＰパラメータからの圧縮された信号におけるＤＴＭＦトーンの存在を検索し、又、ＣＥＬＰパラメータの多重セットにより表示される多重（複数）入力圧縮音声信号を混合して、ＣＥＬＰパラメータの単一のセットにするための方法と装置に関する。単に実施例のみによれば、本発明は音声符号変換に応用される。しかし、本発明はより広い応用範囲を有していることが理解されるであろう。

詳細な実施例において、本願発明はＣＥＬＰパラメータを使用して音声符号変換における上位機能処理のための方法と装置を提供する。この装置は入力として、要求されれば、フレームサイズ、サブフレームサイズもしくは他の特性値及び外からのコマンドに合わせるために、補間されうる１つもしくはそれ以上のＣＥＬＰパラメータの集合を受け取る。上記装置は入力ＣＥＬＰパラメータからのＤＴＭＦ信号と多重ＣＥＬＰコーデックからＣＥＬＰパラメータの単一のセットへ混合する多重−入力混合モジュールを検出するＤＴＭＦ単一検出モジュールとを備える。詳細な実施例では、多重−入力混合モジュールはダイナミックトポロジーを有し、入力圧縮信号の数に従って異なるトポロジーを配列できる。上記装置は、もし検出されれば、ＤＴＭＦ信号とＣＥＬＰパラメータを出力する。

ＤＴＭＦ信号検出モジュールはＤＴＭＦ特性を計算するためにＤＴＭＦ特性計算部、ＤＴＭＦ信号に対応するストアされた特性データを伴ったＤＴＭＦ特性パターンテーブル、計算された特性とストアされたパターンテーブルを比較するためＤＴＭＦ特性比較部、過去の特性データをストアするためにＤＴＭＦ特性バッファ及びＤＴＭＦ信号を決定するためのＤＴＭＦ決定部を含む。

多重−入力混合モジュールはＣＥＬＰパラメータの各セットからの多数の音声特性を検出するための機能検出部、ＣＥＬＰパラメータの各セットの重要度をランクするためのソーティング部、混合戦略を決定するための混合決定部及びＣＥＬＰパラメータの多重セットの混合を実施するための混合計算部を含む。

本発明はＣＥＬＰパラメータ空間における上位機能処理の方法を提供する。この方法はフレームサイズ、サブフレームサイズもしくは他の特性及び外のコマンドに合うように補間されうるＣＥＬＰパラメータの一つもしくはそれ以上のセットを受け取るステップと、ＤＴＭＦトーンを検索するステップと、ＣＥＬＰパラメータの多重セットを混合するステップ、及び上述の検出されたＤＴＭＦ信号と混合ＣＥＬＰパラメータを出力するステップとを含む。

別の実施例によれば、本願発明はＣＥＬＰパラメータ空間におけるＤＴＭＦ信号を検出するための方法を提供する。この方法はＣＥＬＰパラメータからのＤＴＭＦ検出を計算する構成と、あらかじめ計算されたＤＴＭＦ特性データと比較する構成と、ＤＴＭＦ検出と先のサブフレームにおける構成の状態をチェックするステップと、ＤＴＭＦ信号仕様に従ったＤＴＭＦ信号を決定するステップと、先のサブフレームの状態と構成パラメータを構成するステップ、及び検出されたＤＴＭＦ数字を出力するステップを含む。

さらに別の実施例によれば、入力ＣＥＬＰパラメータの混合多重セットのための方法を提供する。この方法はＣＥＬＰパラメータの多重セットを受信するステップと、選択された混合戦略に従ってＣＥＬＰパラメータのセットを混合するステップ、及びこの混合されたＣＥＬＰパラメータを出力するステップを含む。入力されたＣＥＬＰパラメータの混合多重セットを混合ＣＥＬＰパラメータの単一のセットに混合する方法は、各入力の重要性を決定するために要求される信号構成パラメータを計算するステップと、構成パラメータ計算結果に従って入力ＣＥＬＰパラメータの多重セットの重要性の順序を配列するステップと、外の制御コマンドからの優先順位を考慮するステップと、混合された入力を選択するステップと、選択された入力からの混合されたＣＥＬＰパラメータを計算するステップをさらに備える。

別の実施例において、本発明は電気通信信号の構成の処理の装置を提供する。この装置は、音声信号領域に復号化することなしにＣＥＬＰ領域において動作するように適合される。この装置はデュアルトーンモデュレーション（ＤＴＭＦ）信号検出モジュールを有する。デュアルトーンモデュレーション周波数（ＤＴＭＦ）信号検出モジュールは少なくとも一つもしくはそれ以上の入力ＣＥＬＰパラメータに基づいた一つもしくはそれ以上のＤＴＭＦトーンに適合され、ＤＴＭＦ信号検出モジュールも又、もし決定すれば、一つもしくはＤＴＭＦ信号に出力するように適合される。

さらに、別の実施例において、本発明は電気通信信号の特性の処理のための装置を提供する。この装置は音声信号領域に復号化することなしにＣＥＬＰ領域において動作するように適合する。この装置はＤＴＭＦ信号検出モジュールに連結された多重入力混合モジュールを有する。多重入力混合モジュールは一つ以上の音声信号それぞれを表す、一つ以上のＣＥＬＰベースのコーデックから、ＣＥＬＰパラメータの単一のセットへと、ＣＥＬＰパラメータを処理するように適合される。

従来の技術に対して本発明には数多くの利点がある。実施例において、本発明はＣＥＬＰ情報を音声領域の中に変換せずにＤＴＭＦ信号を検出する簡単な方法を提供する。さらに、本発明は従来のハードウェアとソフトウェアを使用して提供されうる。ある実施例において、本発明は又、符号変換技術に結びつけられ得る追加の上位モジュールを考慮する。実施例により、一つもしくは複数のこれらの利点もしくは構成が達成可能である。これらのそして多くの利点は発明の詳細な説明において、そして以下により詳細に述べられる。

詳細な説明に含まれており、一部分をなしている、添付した図面は、本発明の実施例を説明し、図面の簡単な説明とともに本発明の原理を説明することに役に立つ。

本発明によれば、電気通信信号を処理するための技術が提供される。より詳細には、本発明はＣＥＬＰ領域におけるＤＴＭＦ検出と音声混合を実行する方法と装置を提供する。より詳細には、ＣＥＬＰパラメータからの圧縮信号におけるＤＴＭＦトーンの存在を検出し、さらに、ＣＥＬＰパラメータの複数セット（組）により表される複数の入力圧縮音声信号を混合してＣＥＬＰパラメータの単一のセットにするための方法と装置に関する。単に例としてのみ、本発明は音声符合変換に適用される。しかし、本発明はより広い適用範囲を有する。

図１は改良型構成処理モジュール１００を示すブロック図である。好ましくは、このモジュールは、本発明の実施の形態に係るＤＴＭＦ検出モジュールと複数入力混合モジュールとを有する。外部コマンドと共に一つ以上のＣＥＬＰ−ベースのコーデックにより送信されたビット列を元に戻す（アンパックする）ことによりもたらされたＣＥＬＰパラメータの一つ以上のセットが入力として受信される。出力は、検出されたならば、ＤＴＭＦ信号と、混合されたＣＥＬＰパラメータとである。改良型特徴処理は、異なる構成でも可能であり、異なる応用分野への適用を可能とする。追加の処理モジュールを改良型処理モジュールに含めてもよく、ＤＴＭＦ検出モジュールを省略してもよい、もしくは、複数入力混合モジュールを省略してもよい。

好ましくは、デュアル−トーン変調周波数（ＤＴＭＦ）信号検出モジュールは少なくとも一つもしくはそれ以上の入力ＣＥＬＰパラメータ（例えば、サイレンスディスクリプタフレーム）に基づいた一つもしくはＤＴＭＦトーンを決定するような構成を有する。また、ＤＴＭＦ信号検出モジュールは、もし決定されれば、一つもしくはそれ以上のＤＴＭＦ信号を出力するように構成される。好ましくは、複数入力混合モジュールは、一つ以上のＣＥＬＰ−ベースのコーデックからの、一つ以上の音声信号を表しているＣＥＬＰパラメータをＣＥＬＰパラメータの単一のセットに処理するように構成される。

ＤＴＭＦ信号は電話のダイアリング、音声メール、電子バンキンギングシステム等に広く使用され、ＩＰアドレスに固定するＩＰ電話にさえ使用されている。多くの標準化された電気通信音声コーデックにおいて、インバンドＤＴＭＦ信号は、音声圧縮の間、ＣＥＬＰ−ベースのビットストリームにエンコードされる。詳細は以下の明細書において以下に詳細に述べられる。

ＤＴＭＦ信号２００は図２において示される１６のプッシュホンのキー（０−９、Ａ−Ｄ、＃、＊）の一つに対応する。ＤＴＭＦ信号は低周波数の発信音と高周波数の発信音を有している。実現可能な４つの低周波数と４つの高周波数がある。水平行は低周波数を表し、垂直列は高周波数を表す。低周波数は６９７，７７０，８５２，及び９４１Ｈｚである。高周波数は１２０９、１３３６、１４７７、及び１６３３Ｈｚである。このように、１６のＤＴＭＦ信号は特定の具体例に従って一意的に特定される。

一般に、ＤＴＭＦアルゴリズムは周波数が特定のトレランス（公差）内にある信号に対応しなければならない。やや広めのトレランスを受け入れるようにしてもよい。しかしより広い制限によって、雑音への感応度を増大させる可能性があり、ディジットシミュレーションを音声に適用させる可能性がある。又、ＤＴＭＦアルゴリズムは、パワーレベルが受容範囲内にある信号を適切に受容可能とするものでなければならない。送信振幅と伝送減衰は異なる周波数で異なる可能性があることに注意が必要である。

さらに、ＤＴＭＦアルゴリズムは、デュレーション（継続時間）が加入者からの最小の期待値を超える信号を認識しなければならない。誤った信号の指標に対して保護するために、ＤＴＭＦアルゴリズムは、デュレーションが特定の最大値より小さい信号に対応すべきでない。同様に、特定された最小値より長い中止間隔は、ＤＴＭＦアルゴリズムにより認識されなければならない。例えば見せかけの故障もしくは誤りを最小するために、伝送における小さな中断もしくは雑音パルスにより受信が妨害され、及び、特定の最大値より中断が短い場合に、信号の二重登録は認識されてはならない。

図３はＤＴＭＦ検出モジュール３００を詳細に示す。この図は単に一例に過ぎず、本特許請求の範囲を狭く制限するものでは決してない。当業者の一人であれば、多くの変形例、代替例、修正例を認識できるであろう。ＤＴＭＦ検出モジュールはＣＥＬＰパラメータと外部制御コマンドを入力とする。ＤＴＭＦ検出モジュールは、ＣＥＬＰパラメータからＤＴＭＦ信号特徴構成を計算するＤＴＭＦ特性パラメータ生成サブモジュールと、各ＤＴＭＦ信号に対応する構成データをストアする予め定義された検索テーブルと、入力構成パラメータと検索テーブルとの間の類似性を計算する比較サブモジュールと、有限状態遷移機械（FSM（Finit State Machine））を介してＤＴＭＦ信号を決定するＤＴＭＦ決定部分モジュールと、従前のサブフレームのデータをストアするバッファとを備える。例として、ＤＴＭＦ信号特性構成パラメータは信号エネルギー情報、ピッチ情報及びスペクトル情報である。このような情報は入力ＣＥＬＰパラメータから得られる。比較サブモジュールは、入力構成パラメータを検索テーブルと適合させることにより入力信号をチェックする。もし、マッチング結果が特定の閾値以上の場合、潜在的なＤＴＭＦディジットはＤＴＭＦ決定サブモジュールに出力される。ＤＴＭＦ決定サブモジュールは、ＤＴＭＦトーンが存在するか否かを決定するためにＤＴＭＦ信号要求仕様に対して以前の状態をチェックする。

好ましくは、デュアル−トーン変調周波数（ＤＴＭＦ）信号検出モジュールは、ＤＴＭＦ特性計算部を有する。ＤＴＭＦ特性計算部は、一つ以上のＣＥＬＰパラメータと外部コマンドを受け取り、一つもしくはそれ以上のＤＴＭＦ特性（構成）を計算することができる。このモジュールは、一つ以上のＤＴＭＦ特性パターンテーブルを有する。このテーブルは、一つ以上のＤＴＭＦ信号に対応する一つ以上の特定の構成データを有する。ＤＴＭＦ特性比較部も含まれている。ＤＴＭＦ特性比較部は、一つもしくはそれ以上のＤＴＭＦ特定信号を識別し、さらに、一つ以上のＤＴＭＦ特定信号を分類するために、ＤＴＭＦ特性パターンテーブルにおける一つ以上の特定の構成のデータを用いて、ＤＴＭＦ特性計算部から引き出される一つもしくはそれ以上のＤＴＭＦ特性を処理するように構成されている。ＤＴＭＦ特性バッファが含まれている。特性バッファは一つ以上のＤＴＭＦ特性パラメータと一つもしくはそれ以上の従前のサブフレームもしくはフレームの一つもしくはそれ以上のＤＴＭＦ分類データをストアすることが可能である。さらに、このモジュールは、ＤＴＭＦ決定部を備える。ＤＴＭＦ決定部は、一つ以上のＤＴＭＦ仕様に従って、現在と一つもしくはそれ以上の従前のサブフレームもしくはフレームのＤＴＭＦ分類データから、一つもしくはそれ以上のＤＴＭＦ信号を決定し、ＤＴＭＦ決定信号を送信することが可能である。好ましくは、ＤＴＭＦ特性計算部は、線形予測パラメータ情報、ピッチ情報、及びエネルギー情報のうち少なくとも一つもしくはそれ以上を使用して、一つ以上のＤＴＭＦ特性を処理する。ＤＴＭＦ特性パターンテーブルは、一つ以上のＤＴＭＦ信号に対応するＣＥＬＰパラメータから付随した特定の事前に計算された構成データを有する。所定の実施例において、ＤＴＭＦ特性比較部は、国際電気通信単位（ＩＴＵ）仕様に従って、「１」、「２」、「３」、「４」、「５」、「６」、「７」、「８」、「９」、「０」、「Ａ」、「Ｂ」、「Ｃ」、「Ｄ」、「＃」及び「＊」の１６個の「数字」に対応しているＤＴＭＦ特定信号を分類する。実施例によれば、ＤＴＭＦ決定部はさらに、論理状態機械と、一つ以上のＤＴＭＦ信号と一つ以上の特定の「数字」を判定するＤＴＭＦ信号判定基準を備える。これら及び他の特徴は本明細書及び以下に詳細に述べられる。

図４は、ＤＴＭＦ検出アルゴリズム４００のフローチャートを示す。まず、入力コーディックの線スペクトルペア（ＬＳＰ）、ピッチラグ、及び利得等のＣＥＬＰパラメータから、ＤＴＭＦ特性が計算される。第二に、この計算された特性は、１６の可能なＤＴＭＦ信号に対してあらかじめ定義されたテーブルにおける特性と比較される。もしマッチ（合致）しなければ、ＤＴＭＦ検出フラグはリセットされＤＴＭＦ信号状態に到達しない。全ての必要なデータの更新が起こる。もし別の入力サブフレームがあれば、検出アルゴリズムは継続し、さもなければ検出アルゴリズムは終了する。もし、ＤＴＭＦマッチすると（類似すると）、ＤＴＭＦ信号要求仕様は潜在検出結果に対してチェックされる。もしこれが満たされるならば、ＤＴＭＦフラグがセットされ、ＤＴＭＦの「数」が出力に信号として送信される。再び、全ての必要なデータの更新が起こり、他のサブフレームがあれば、前記検出アルゴリズムは、ＣＥＬＰコーディングパラメータ空間において、完璧に動作し全ての入力サブフレームに対して実行される。

図５のブロック図５００において示されるように、改良型構成処理の応用は２つの符号励起線形予測（ＣＥＬＰ）ベース音声コーデック間の音声符号化にある。ソースコーデックアンパックモジュールはＣＥＬＰパラメータを生成するためにソースコーデックビット列をアンパックする。ＣＥＬＰパラメータ補間モジュールはフレーム長と、もし要求されれば目標コーデックのサブフレーム長に適合するようにＣＥＬＰパラメータを補間する。補間されたＣＥＬＰパラメータは、エンコード（符号化）された目標（宛先）コーデックパラメータにマップされる。宛先コーデックパッカーはエンコードされたパラメータを、要求された形式のビット列へパックする。この典型的な音声符号化アプローチに加えて、改良型特徴処理モジュール５０１は前記音声トランスコーダに加えられる。改良型特徴処理モジュールは補間ＣＥＬＰパラメータを入力としてとり、要求された特性を計算する。もたらされる特性は、目標コーデックのビット列に並行する出力（バンド外に送信された）か、上位処理に対する音声トランスコーダに移行される（バンド内に送信される）か、バンド内とバンド外の両方に送信される。ＤＴＭＦ検出アルゴリズムは音声符号化と平行して働く（すなわち、メインストリーム音声符号変換化を妨害しない）。

一例として、ＤＴＭＦ信号検出はＧＳＭ−ＡＭＲ音声コーデックとＧ．７２３．１音声コーデック間の音声トランスコーダに適用される。符号変換方法とシステムの例は、共通して所有され、ここに参照としてあらゆる目的のために引用された、Jabri,Marwan,Anwarの名で,国際出願番号ＰＣＴ／ＵＳ０２／０８２１８を有し、２００２年３月１３日に提出された「符号変換化ビデオと音声信号に対する方法と装置」と、Jabri,Marwan Anwar Wang, Jianwei, Gould, Stephenの名で、国際出願番号ＰＣＴ／ＵＳ０３／００６４９を有し、２００３年８月１日に提出された「ＣＥＬＰ−ベース音声間のコード符号変換方法とシステム」に発見される。実施例において、ＤＴＭＦ信号検出モジュールと多重−入力モジュールがＣＥＬＰ−ベース音声トランスコーダ内に含まれる。

図６は完全−二重構造ＧＳＭ−ＡＭＲの単純化されたブロック図、即ち、Ｇ．７２３．１音声トランスコーダ６００がＤＴＭＦ検出の上位機能を伴うことを可能にすることを示す。本発明のＤＴＭＦ信号検出処理を使用して、ＤＴＭＦ検出は、Ｇ．７２３．１コーデックビット列への音声符号変換プロセスと平行してＧＳＭ−ＡＭＲ入力ＣＥＬＰパラメータ上で実施され得る。まず、２０ｍｓフレーム入力ＧＳＭ−ＡＭＲビット列は４つの５ｍｓサブフレームに対するＣＥＬＰパラメータにアンパックされる。次の２０ｍｓフレームのＣＥＬＰパラメータからの別の２つのＧＳＭ−ＡＭＲサブフレームを有するこれらの４つのＧＳＭ−ＳＭＲサブフレームはＣＥＬＰパラメータの一つＧ．７２３．１フレームへ補間される。結果として得られた補間されたＣＥＬＰパラメータは一つのＧ．７２３．１フレームに対するビット列にマップされ、パックされる。この処理に平行して、４つのＧＳＭ−ＡＭＲサブフレームのＣＥＬＰパラメータは、音声トランスコーダ内のＤＴＭＦ検出モジュールに与えられる。ＤＴＭＦ検出モジュールはＣＥＬＰの各サブフレームからのＤＴＭＦ特性を計算し、あらかじめ定義されたＤＴＭＦ特性データと比較し、入力圧縮スピーチ信号がＤＴＭＦ仕様の最小要求に従ってＤＴＭＦ信号を含むか否かを決める。入力構成パラメータが検索テーブルにおいてあらかじめ定義されたＤＴＭＦデータにマッチし、既に述べた有限状態機械を通したＤＴＭＦ信号の要求を満足するならば、検出されたＤＴＭＦディジットは出力に信号として送信される。もしＤＴＭＦ検出モジュールはＧＳＭ−ＡＭＲフレームからＧ．７２３．１へ音声トランスコーダにおいて可能とされるならば、ＤＴＭＦ検出アルゴリズムは全ての入力ＧＳＭ−ＡＭＲフレーム上で実行する。このように、音声符号化の間、常に入力ＣＥＬＰパラメータからＤＴＭＦ信号を検出することができる。

同様に、Ｇ．７２３．１からＧＳＭ−ＡＭＲに符号変換するにあたって、ＤＴＭＦ検出計算は入力Ｇ．７２３．１フレーム上で応用される。少し異なる変形例は異なるサブフレームサイズとＧＳＭ−ＡＭＲとＧ．７２３．１コーデックのフレームサイズにより存在する。

ＤＴＭＦ信号の一意的な特別な構成はＣＥＬＰパラメータから計算され得ることを示すために、図７は可能なＤＴＭＦディジットに対して１２．２ｋｂｐｓの割合で入力ＧＳＭ−ＡＭＲフレーム線スペクトル対（ＬＳＰ）パラメータ７００を示す。図８は可能なＤＴＭＦディジットに対して６．３ｋｂｐｓの割合で入力Ｇ．７２３．１の線スペクトル対パラメータ８００を示す。同様に、アンパックされたＣＥＬＰピッチラグと利得情報は、ＤＴＭＦディジットを検出し分類するために使用される。

ＧＳＭ−ＡＭＲコーデックは音声圧縮の８つの異なるモードにおいて動作することができ、Ｇ．７２３．１は音声圧縮の２つの異なるモードにおいて動作することができることに注意する必要がある。図５において例示されるＤＴＭＦ検出アルゴリズムはＧＳＭ−ＡＭＲとＧ．７２３．１コーデックの如何なる割合にも適用できる。このアルゴリズムは又如何なるＣＥＬＰ−ベースの音声コーデックに適用される。

図９は、入力として、多重圧縮音声を有する多重−入力混合器９００を示す概念図である。圧縮された信号は異なるコーデック標準を使用し、符号化されている。多重（複数）−入力混合器は多重（複数）入力からの音声情報を混合し、出力された混合圧縮信号を出力する。

実施例において、多重−入力混合モジュールは一つかそれ以上のＣＥＬＰパラメータと外部コマンドを受け取ることと多重の音声構成を検出することを可能とする構成検出部を備える。実施例において、構成検出部は多数の音声信号構成を決定するように適合され、この決定は、動作音声、サイレンス記述語フレーム、もしくは不連続伝送フレームとしてＣＥＬＰパラメータにより表される入力を分類するステップを含んでいる。他の実施例において、特性検出部はＬＳＰスペクトル情報、ピッチ情報、固定−コードブック情報、エネルギー情報のうち、一つもしくはそれ以上を含む複数の音声信号の特性を決定する。このモジュールは又ＣＥＬＰパラメータより以上の検出された特性を処理し、あらかじめ決められた判定に基づくＣＥＬＰパラメータの各セットに対して重要度をランク付けすることが可能なソート部を有している。このソート部は特性検出部からデータを受け取り、ある実施例によれば所定の判定に基づくＣＥＬＰパラメータの多重セットの重要度を配置する。特別な実施例において、一つもしくはそれ以上のＣＥＬＰパラメータのセットは一つ以上の音声圧縮標準により特徴付け可能であり、もしくは、２つのＣＥＬＰパラメータのセットは同じ音声圧縮標準により特徴付け可能、もしくは全てのＣＥＬＰパラメータのセットは同じ音声圧縮標準により特徴付け可能である。フレームサイズ、サブフレームサイズ又ある実施例における他の特性に適合させるために、異なる音声圧縮標準を使用することで、生成されるならば、一つもしくはそれ以上のＣＥＬＰパラメータのセットは補間されうる。更に、モジュールは処理戦略、処理のためのＣＥＬＰパラメータのいくつかもしくは全てのセットを選択し、ＣＥＬＰパラメータの一つのセット以上の処理をコントロールすることを決定することを可能とする混合決定ユニットを有している。特別な実施例によれば、処理されるＣＥＬＰパラメータのセットを決定するためのソーティングユニットと外部制御コマンドから混合決定ユニットがデータを受け取る。ＣＥＬＰパラメータの一つのセット以上を処理することができる混合計算ユニットが含まれる。好ましくは、ＣＥＬＰパラメータの単一のセット混合計算ユニットはＣＥＬＰパラメータの単一のセットを通過し、もしくはＣＥＬＰパラメータの多重セットを選択し、混合し、もしくはサイレンス記述語データ情報を送信する。

従来の音声混合ソリューションはタンデムアプローチにおいて音声コーデック入力を取り扱う。多重ビット列入力に含まれる音声情報が得られ、復号化される。音声情報入力の音声ミキシングは音声領域において実施され、混合音声は再びエンコードされる。音声混合アプリケーションの一例は会議呼び出しの間多重チャネルを取り扱う会議の橋である。会議の呼び出しのシナリオにおいて、参加者は異なる音声コーデックを有するならば、再符号化処理は混合音声のための複数の特定のエンコード処理を含む。

図１０はタンデムアプローチにおける従来の音声混合ソリューション１０００を説明する。スピーカー１はコーデックＡ圧縮形式における音声情報を送信し、スピーカー２はコーデックＢ圧縮形式における音声情報を送信する。リスナーはコーデックＣ音声圧縮形式を受け入れる。スピーカー１と２から音声を混合するために、リスナーへ混合音声を送信するために、音声混合器はデコーダＡとＢを要求して２つの入力音声圧縮形式を同じ音声領域へ変換し、入力音声信号をミックスする。混合信号を送信する前、コーデックＣ形式へ再符号化される必要がある。

音声ミキシングへのタンデム−ベースアプローチが十分でないことは明らかである。入力ビット列を音声信号に完全に復号化すること、音声空間におけるこれらの信号を組み合わせること、出力ビット列への混合音声信号の完全な符号化に関わる。

図１１は本発明について述べられた実施例において、多重−入力混合モジュール１１００をさらに説明する。多重−入力混合モジュールは構成検出部分、ソート部分モジュール、混合決定部分モジュールと混合計算部分モジュールを備える。構成検出部分モジュールはＣＥＬＰパラメータの各セットからの音声信号構成を計算する。ＣＥＬＰパラメータが異なるＣＥＬＰ圧縮標準から生成されれば、ＣＥＬＰパラメータの補間が、フレームサイズ、サブフレームサイズまたは他の特性にマッチするように要求される。計算された信号構成は信号エネルギー、フレームタイプと信号タイプ（すなわち、アクティブな音声、アクティブでない音声、不連続な伝送）を含む。ソート部分モジュールは計算された信号構成からＣＥＬＰパラメータの各セットの重要性を計算し、それらの重要性によりＣＥＬＰパラメータの入力セットをソートする。混合決定部分モジュールはソート結果、外部コマンド、及び以前の混合決定からのファクターを混合戦略を決定するために結合する。
この決定はＣＥＬＰパラメータのセットは選択されておらず、ＣＥＬＰパラメータの一つのセットのみが選択されており、もしくは、ＣＥＬＰパラメータの全てのセットが選択されていることである。混合計算部分モジュールはＣＥＬＰパラメータの選択されたセットを混合し混合ＣＥＬＰパラメータを出力する。

一例として、多重−入力混合モジュールは会議呼び出しの間入力チャネルを混合するために使用される。１、２、３とラベル付けされた３人の参加者が、呼に加わっており、参加者１のみがあるタイミングで話している場面を想定する。参加者１向きのための混合決定では、参加者２と３が話していない間に、入力チャネルが選択されない。参加者２及び３向きの混合決定では、アクティブな音声を含んでいるものとして検出されるチャネルが１つだけなので、参加者１からのチャネルのみが選択される。

参加者１と２の両方があるときに話しているならば、参加者３への混合決定は入力チャネル１と２が選択される。しかし、参加者１と２の方向への混合決定は、参加者３からの入力チャネルが沈黙しているので、ただ一つのチャネルが選択されていることである。混合モジュールは望まれていないエコーを避けるために参加者の自分自身への音声を混合しないように構成される。

幾つかの混合計算のアプローチがある。一例として、２つの入力ＡとＢを混合するために、各入力列に対する総サブフレーム励起エネルギーが次の式で与えられる。

ここに、e_Ａ(ｎ)とe_Ｂ(ｎ)は入力ＡとＢそれぞれの励起ベクタであり、Ｎは目標コーデックのサブフレームサイズで、Ｅ_χＡとＥ_χＢは入力ＡとＢそれぞれのエネルギーである。

ピッチラグは次式のように導かれる。

ここでＰＬ_ＡとＰＬ_Ｂは入力ＡとＢそれぞれのピッチラグで、ＰＬ_mixは混合信号のピッチラグである。

新しいＬＳＰパラメータの生成のための２、３の異なる方法がある。これらの第一はＬＳＰパラメータをスペクトルパラメータに変換し、サブフレームエネルギーによりスペクトルパラメータを平均し、スペクトルパラメータからＬＳＰパラーメタに変換することに関する。スペクトルパラメータの平均は以下の等式に示される。

ここで、ＬＳＦ_ＡとＬＳＦ_Ｂは、それぞれ入力ＡとＢのスペクトルパラメータであり、ＬＳＦ_mixは混合信号のスペクトルパラメータである。

他の方法は、フィルター付けされた励起信号を組み合わせ、ＬＳＰパラメータと合成励起を再計算するために各々の励起信号へのＬＳＰの寄与を再導入するだろう。

他の方法はより低いエネルギーの入力のＬＳＰパラメータを無視することと、チャンネル優先度のような、いくつかの制御パラメータに基づいた、より高いエネルギー入力のＬＳＰパラメータを使用することに関与する。

ＬＳＰ混合計算と同様に、混合励起パラメータは２、３の異なる方法により計算され得る。サブフレームエネルギーにより励起パラメータを平均し、混合ＬＳＰパラメータを使用しそれらを再計算し、又、最も高いエネルギー入力の励起を使用することにより得られる。

電話会議のような、多くのシナリオにおいて、ＣＥＬＰパラメータの全てのセットがアクティブ音声を表すわけではない。このケースでは、ＣＥＬＰパラメータはサイレンス記述語フレームを表す。これらのフレームは無視される。言い換えれば、混合されるＣＥＬＰの唯一のセットは音声を含む信号を表す。これはアクティブ音声を表さないＣＥＬＰパラメータのセットにおいて伝送される雑音を拒絶するのと同量の計算を削減する。

図１２はＣＥＬＰ領域多重−入力混合方法１２００のフローチャートを示す。このフローチャートは、ＣＥＬＰパラメータの各セット上の信号特性の計算を実施すること、構成の計算の結果に従ってＣＥＬＰパラメータのセットの重要度を配列すること、外部コマンドにより特定されるあらゆる優先順位をチェックし、重要性と優先度に従い混合されようとするＣＥＬＰパラメータのセットを決定すること、ＣＥＬＰパラメータの選択されたセットを混合すること、そして最後に混合ＣＥＬＰパラメータを出力することに関する。

主に３つのタイプの混合戦略がある。第一の場合、ＣＥＬＰパラメータのどのセットはアクティブ音声を表し、混合計算はサイレンス記述語フレームもしくは不連続伝送情報を出力する。第二の場合、ＣＥＬＰパラメータの一つのみがアクティブ音声を表すか、もしくは、ＣＥＬＰパラメータの一つのみは混合のために選択され、混合計算は選択されたＣＥＬＰパラメータを混合された結果として出力される。第３の場合、ＣＥＬＰパラメータの一つのセット以上は混合のために選択され、混合計算はＣＥＬＰパラメータの選択されたセットを混合して混合された結果を出力する。

図１３は本発明に従って、音声トランスコーダ内のＣＥＬＰ領域における多重−入力混合１３００の実施例のブロック図を示す。多重−入力混合を伴う音声トランスコーダは２人以上の参加者以上を結びつける。一例として、多重−入力混合システムは３人の参加者を結び付ける。２つのソースコーデック入力圧縮音声信号の混合を実施し、目標コーデックフォーマットに符号変換するために、多重−入力混合システムは第一入力ビット列データをＣＥＬＰパラメータにアンパックするソースコーデックアンパッカーモジュール、第二の入力ビット列をＣＥＬＰパラメータにアンパックする他のソースコーデックアンパッカーモジュール、第一のソースコーデックＣＥＬＰパラメータを目標コーデックのフレームとサブフレームサイズをマッチさせる補間ＣＥＬＰパラメータに変換する補間モジュール、第二のソースコーデックＣＥＬＰパラメータをフレームと目標コーデックのサブフレームサイズをマッチさせる補間ＣＥＬＰパラメータに変換させる他の補間モジュール、二つの入力から補間ＣＥＬＰパラメータを混合し、補間ＣＥＬＰパラメータを次のステージへ送信する混合モジュール、目標コーデックに従い、混合ＣＥＬＰパラメータを量子化ＣＥＬＰパラメータに混合する目標コーデックマッピングモジュール、目標コーデック標準に従い、量子化ＣＥＬＰパラメータをビット列に変換する目標コーデックパッカーモジュールを備える。

既に述べた実施例に従い、入力ビット列は音声空間に十分に復号化されず、好ましくはＣＥＬＰパラメータ空間において混合する。このことは、入力ビット列は十分に音声信号に復号されず、再び十分に再符号化されるので、かなり低い計算要求の利点を提供する。

図１４は、音声符号変換において多重−入力混合器１４００の他の構成のブロック図を示す。混合圧縮音声信号は、異なるフレームサイズの２つの目標コーデックに送信されることを要求される。

図１５はＶＯＩＣＥ−ＯＶＥＲ−ＩＰパケットネットワークと無線通信システム間の会議呼において使用される多重−入力混合器を伴う典型的な音声トランスコーダ１５００を描写する。会議呼び出しに参加する４つの参加者がある。２つの参加者はパケットネットワークからで、二人の参加者は無線通信システムからのものである。全ての音声入力信号は圧縮音声形式である。これらの形式は異なる。Ｇ．７２９、Ｇ．７２３．１とＧＳＭ−ＡＭＲにより生成される。パケットネットワーク内の参加者ＡとＢはＧ．７２９コーデックとＧ．７２３．１コーデックを別個に使用し、無線通信システム内の参加者ＣとＤはＧＳＭ−ＡＭＲコーデックを使用する。

図１６は３つの音声コーデックＧ．７２９、ＧＳＭ−ＡＭＲ、Ｇ．７２３．１１６００間のフレームサイズとサブフレームサイズにおける相違を示す。これらの３つの音声コーデックは異なるサイズフレーム長を有する。Ｇ．７２９コーデックは１０ｍｓのフレーム長を有する。ＧＳＭ−ＡＭＲコーデックは２０ｍｓのフレーム長を有する。Ｇ．７２３．１は３０ｍｓ．のフレーム長を有する。更に、Ｇ．７２９は各フレームに２つのサブフレームを有し、ＧＳＭ−ＡＭＲとＧ．７２３．１はフレーム当たり４つのサブフレームを有する。

図１７は本発明によればコーデックＧ．７２９、Ｇ．７２３．１とＧＳＭ−ＡＭＲの間の全ての指示に対して多重−入力混合器を有する音声符号変換のブロック図を示す。参加者への各連結は入力と出力ビット列両方に対する経路を有する。従って、各コーデック標準に対してトランスコーダは入力と出力両方のビット列を操作するためにアンパッカーモジュールとパッカーモジュール、目標コーデックにおいて参加者の以外の全ての参加者の音声情報を混合するための混合モジュール、量子化されたＣＥＬＰパラメータへの混合ＣＥＬＰパラメータを変換するために特別なマッピングモジュールを含む。会議呼び出しにおいて使用される３つの異なるコーデックＧ．７２３．１、ＧＳＭ−ＡＭＲとＧ．７２９があるので、各連結は２つの補間モジュールをアンパッカーモジュールに従い、要求する。二つの補間モジュールはフレームサイズ、サブフレームサイズと他の目標コーデックの他の特定にマッチするＣＥＬＰパラメータを補間するためにソースコーデックＣＥＬＰパラメータを補間する。一例として、Ｇ．７２９コーデックフォーマットにおける参加者Ａからの入力ビット列があげられる。参加者Ａに対して、目標コーデックは参加者Ｂに対してはＧ．７２３．１であり、参加者ＣとＤに対してはＧＳＭ−ＡＭＲである。Ｇ．７２９の連結は、Ｇ．７２９ＣＥＬＰパラメータをＡＭＲＣＥＬＰパラメータに変換するために補間モジュールＧ．７２９−＞ＡＭＲを、Ｇ．７２９ＣＥＬＰパラメータをＧ．７２３．１ＣＥＬＰパラメータに変換するために他の補間モジュールＧ．７２９−＞Ｇ．７２３．１を要求する。このように、上記、多重−入力混合方法の記述に従って、このシステムは、十分な復号と再暗号処理なしに多重−入力混合機能を有する音声符号を実施することができる。実施例に従って、他の変形、修正、代替物があり得る。他のＣＥＬＰトランスコーダのある例は本明細書を通じて、そして以下により詳細に見い出すことができるだろう。

ＤＴＭＦ信号検出とこの文書に述べられているＣＥＬＰ領域における多重−入力混合の発明はコーデックＧ．７２３．１、ＧＳＭ−ＡＭＲ、ＥＶＲＣ、Ｇ．７２８、Ｇ７２９、Ｇ．７２９Ａ、ＱＣＥＬＰ、ＭＰＥＧ−４ＣＥＬＰ、ＳＭＶ、ＡＭＲ−ＷＢ、ＶＭＲそして符号−励起線形予測音声符号化を利用する全ての音声コーデックのような音声コーデックに基づく全てのＣＥＬＰにより生成されるＣＥＬＰパラメータに一般的である。

以上の実施例の以上の記述は当業者に本発明をなし、使用することを可能とするように提供される。これらの実施例に対するさまざまな修正は当業者に直ちに明らかであり、ここに定義される一般原則は進歩的な性質を使用することなしに他の実施例に適用され得る。このように、本発明はここに示された実施例に限定されることを意図したものではなく、ここに開示された原則と新規性を有する構成と首尾一貫する最も広い範囲と一致する。

新規性があると信じられている対象、構成、及び利点は特許請求の範囲に詳細に述べられている。構成と動作の方法の両方に関して、さらなる対象と利点を伴って、図面と結びついた、以下の説明を参照することにより最も良く理解されるであろう。

図１は、本発明の実施例による、ＣＥＬＰパラメータ領域におけるＤＴＭＦ検出と多重入力ミキシングのための装置の単純化されたブロック図である。図２は本発明の実施例による、ＤＴＭＦ信号周波数の類別を示すブロック図である。図３は本発明の実施例による、ＤＴＭＦ信号検出の簡略化されたブロック図の表示である。図４は本発明の実施例による、ＣＥＬＰパラメータを使用しＤＴＭＦ信号検出のための方法の簡略化されたフローチャートである。図５は本発明の実施例による、先進の音声トランスコーダ内のＤＴＭＦ検出と多重−入力ミキシングの簡略化されたブロック図の表示である。図６は本発明の実施例による、音声コーデックＧＳＭ−ＡＭＲとＧ．７２３．１間の音声符号変換におけるＤＴＭＦ検出モジュールの簡略化されたブロック図表示である。図７は本発明の実施例による、入力ＧＳＭ−ＡＭＲコーデックビット列からＤＴＭＦ信号のＬＳＰ表示を示す。図８は本発明の実施例による、入力Ｇ．７２３．１コーデックビット列からＤＴＭＦ信号のＬＳＰ表示を示す。図９は本発明の実施例による、多重−入力混合器を伴う３つのスピーカーを接続する通信リンクの概念図である。図１０は本発明の実施例による、圧縮音声コーデック形式を伴うスピーカー間の従来の多重−入力混合の簡略化された図である。図１１は本発明の実施例による、多重−入力混合モジュールの簡略化されたブロック図である。図１２は本発明の実施例による、多重−入力混合方法のフローチャートである。図１３は本発明の実施例による、音声トランスコーダ内の多重−入力混合装置の簡略化されたブロック図である。図１４は本発明の実施例による、異なる音声コーデック出力を伴う音声トランスコーダ内の多重−入力混合器装置のブロック図である。図１５は本発明の実施例による、異なる音声コーデック形式を伴う異なる４人の参加者間の４つのパーティ会議の概念図である。図１６は本発明の実施例による、音声コーデックＧ．７２９、ＧＳＭ−ＡＭＲとＧ．７２３．１間のフレームサイズ差を示す。図１７は本発明の実施例による、音声符号変換内の４つのパーティの多重−入力混合システムに対する実施例のブロック図を示す。

Claims

電気通信の特徴処理のための装置であり、前記装置は、音声信号領域に復号化することをせずにＣＥＬＰ領域において動作するように構成され、
少なくとも一つもしくはそれ以上の入力ＣＥＬＰパラメータに基づいた一つもしくはそれ以上のＤＴＭＦトーンを決定し、決定されると、一つもしくはそれ以上のＤＴＭＦ信号を出力するように構成されたデュアル−トーン変調周波数（ＤＴＭＦ）信号検出モジュールと、
前記ＤＴＭＦ信号検出モジュールに接続され、対応する一つより多い音声信号を表し、一つ以上のＣＥＬＰ−ベースのコーデックからのＣＥＬＰパラメータを、ＣＥＬＰパラメータの単一セットに、処理する複数入力混合モジュールと、
を備える、ことを特徴とする装置。
前記デュアルトーン変調周波数（ＤＴＭＦ）信号検出モジュールは、
一つ以上のＣＥＬＰパラメータと外部コマンドとを受信し、一以上のＤＴＭＦ特徴を計算するＤＴＭＦ特徴計算部と、
一以上のＤＴＭＦ信号に対応する一以上の特定の構成データを有する一つ以上のＤＴＭＦ構成パターンテーブルと、
一つ以上のＤＴＭＦ特別信号を特定し一つ以上のＤＴＭＦ特別の信号を分類（識別）するために、ＤＴＭＦ構成パターンテーブルの一つそれ以上の特定の構成データを用いてＤＴＭＦ構成計算部から導かれる一以上のＤＴＭＦ構成を処理するように構成されたＤＴＭＦ構成比較部と、
一つ以上のＤＴＭＦ構成パラメータと、一つ以上の以前のサブフレームもしくはフレームの一つもしくはそれ以上のＤＴＭＦ分類データを格納することが可能なＤＴＭＦ構成バッファと、
一以上のＤＴＭＦ仕様に従って、現在及び一つ以上の以前のサブフレーム又はフレームのＤＴＭＦ分類データから、一つ以上のＤＴＭＦ信号を決定し、ＤＴＭＦ決定信号を送信することが可能なＤＴＭＦ決定部と、
を備えることを特徴とする請求項１に記載の装置。
前記ＤＴＭＦ構成計算部が、少なくとも一つ以上の線形予測パラメータ情報、ピッチ情報、エネルギー情報を使用し、一つ以上のＤＴＭＦ構成を処理する、
ことを特徴とする請求項２に記載の装置。
前記ＤＴＭＦ構成パターンテーブルは、一つ以上のＤＴＭＦ信号に対応するＣＥＬＰパラメータに付随する特定の予め計算された構成データを有する、ことを特徴とする請求項２に記載の装置。
ＤＴＭＦ構成計算部は、国際電気通信ユニット（ＩＴＵ）仕様に従って「１」、「２」、「３」、「４」、「５」、「６」、「７」、「８」、「９」、「０」、「Ａ」、「Ｂ」、「Ｃ」、「Ｄ」、「＃」と「＊」の１６のディジットに対応するＤＴＭＦ特定信号を分類する、
ことを特徴とする請求項２に記載の装置。
前記ＤＴＭＦ決定部は、さらに論理状態機械と、前記一つ以上のＤＴＭＦ信号と一以上の特定なディジットを判別するＤＴＭＦ信号判定基準と、を備える、ことをさらに特徴とする請求項２に記載の装置。
前記複数入力混合モジュールは、
一つ以上のＣＥＬＰパラメータと外部のコマンドとを受け取り、複数の音声構成を検出することが可能な構成検出部と、
ＣＥＬＰパラメータの一つのセット以上の検出された構成を処理し、所定の判定基準に基づいてＣＥＬＰパラメータの各セットの重要度をランキングすることが可能なソート部と、
処理戦略を決定し、処理のための幾つかのもしくは全てのＣＥＬＰパラメータのセットを選択し、一つ以上のＣＥＬＰパラメータのセットを処理することを制御することが可能な混合決定部と、
ＣＥＬＰパラメータの一つ以上のセットを処理することが可能な混合計算部と、
を備えることを特徴とする請求項１に記載の装置。
一つ以上のＣＥＬＰパラメータのセットは、一つ以上の音声圧縮標準により特徴付けられ、もしくは、ＣＥＬＰパラメータの２つのセットは同じ音声圧縮により特徴付けられ、もしくは、ＣＥＬＰパラメータの全てのセットは同じ音声圧縮標準によって特徴付けられる、
ことを特徴とする請求項７に記載の装置。
ＣＥＬＰパラメータの一つの以上のセットは、それらが異なる音声圧縮基準を使用して生成されているならば、フレームサイズ、サブフレームサイズもしくは他の特性に適合するように、補間される、
ことを特徴とする請求項７に記載の装置。
ＤＴＭＦ検出モジュールに接続された符号変換モジュールをさらに備え、複数入力混合モジュールに接続されている、
ことを特徴とする請求項１に記載の装置。
複数入力混合モジュールに接続された符号変換モジュールをさらに備えることを請求項１に記載の装置。
複数入力混合モジュールとＤＴＭＦ信号検出モジュールは、改善処理モジュールにおいて提供され、改善処理モジュールは符号変換モジュールに接続されている、
ことを特徴とする請求項１に記載の装置。
前記ＣＥＬＰパラメータはサイレンス記述語フレームを表す、
ことを特徴とする請求項１に記載の装置。
複数入力混合モジュールは、動的トポロジーを有し、入力圧縮信号の数に従って異なるトポロジーを構成することが可能である、ことを特徴とする請求項１に記載の装置。
ＤＴＭＦ信号検出モジュールと複数入力モジュールとは、ＣＥＬＰ−ベース音声トランスコーダ内に組み込まれている、
ことを特徴とする請求項１に記載の装置。
前記構成検出部は多数の音声信号特性を決定するように構成され、前記決定は、ＣＥＬＰパラメータにより表される入力を、アクティブ音声、サイレンス記述語フレーム、もしくは不連続な伝送フレームに分類することを備える、
ことを特徴とする請求項７に記載の装置。
前記構成検出部は一つもしくはそれ以上のＬＳＰスペクトル情報、ピッチ情報、固定された符号帳情報、エネルギー情報を含む複数の音声信号構成を決定する、
ことを特徴とする請求項７に記載の装置。
ソート部は、前記構成決定部からのデータを受け取り、所定の基準に基づいてＣＥＬＰパラメータの複数のセットの重要度を配列する、
ことを特徴とする請求項７に記載の装置。
前記混合決定部は、ソート部からのデータと処理されるＣＥＬＰパラメータのセットを決定する外部制御コマンドと、を受け取る、
ことを特徴とする請求項７に記載の装置。
前記混合計算部は、ＣＥＬＰパラメータの単一のセットを入出力することができ、又、ＣＥＬＰパラメータの複数セットを選択及び混合し、もしくはサイレンス記述語データ情報を送信する、
ことを特徴とする請求項７に記載の装置。
ＣＥＬＰベース領域における電気通信信号を処理するための方法であって、
ＤＴＭＦトーンを決定すること、及び、音声信号への復号化をせずに、それぞれ一以上のＣＥＬＰ−ベースの符号器の一つもしくはそれ以上のＣＥＬＰパラメータを使用し、複数入力圧縮信号を処理することを備え、
ＣＥＬＰパラメータの一つ以上のセットと外部コマンドを入力し、
一つ以上のＣＥＬＰパラメータから、圧縮された信号における一つ以上のＤＴＭＦトーンを決定し、
ＣＥＬＰパラメータの複数セットをＣＥＬＰパラメータの単一のセットへ処理し、
前記決定された一以上のＤＴＭＦトーンを出力し、もし検出されれば、単一のセットにおける処理されたＣＥＬＰパラメータを出力する、
ことを特徴とする方法。
前記ＣＥＬＰパラメータは、一以上のＬＳＰ情報、ピッチ情報、励起ベクタ情報、エネルギー情報、固定された符号帳情報と、サイレンス記述語情報を備える、
ことを特徴とする請求項２１に記載の方法。
ＤＴＭＦトーンを決定するステップは、
ＣＥＬＰパラメータからＤＴＭＦ特性パラメータを導き出し、
ＤＴＭＦ信号特性データのあらかじめ定義された探索テーブルを用いて、構成パラメータを処理し、一つ以上の結果を出力し、
該一以上の結果をＤＴＭＦ決定ユニットに転送し、
一つ以上の以前のサブフレームの結果を分類し、ＤＴＭＦ信号決定標準に従って、一つ以上のＤＴＭＦ信号を出力し、
現在のサブフレームの一つ以上の結果を保存し、一つ以上の以前のサブフレームの結果を更新する、
ＤＴＭＦ信号が検出されるならば、ＤＴＭＦトーンを出力する、
ことを特徴とする請求項２１に記載の方法。
一つ以上のＤＴＭＦトーンを決定するステップは、全てのサブフレームに対して実行される、
ことを特徴とする請求項２１に記載の方法。
前記一つ以上のＤＴＭＦ特性は、一つ以上のＬＳＰスペクトル情報、ピッチ情報、エネルギー情報を使用する、
ことを特徴とする請求項２３に記載の方法。
ＤＴＭＦ信号特性データの前記あらかじめ定義された探索テーブルは、ＤＴＭＦ信号を選択されたＣＥＬＰ圧縮形式におけるＣＥＬＰパラメータに変換することにより予め計算され、ＤＴＭＦ検出処理の前に、テーブルに予めロードされる、
ことを特徴とする請求項２３に記載の方法。
前記ＣＥＬＰパラメータの複数セットの処理は、２つ以上の入力コーデックＣＥＬＰパラメータを混合することができる、
ことを特徴とする請求項２１に記載の方法。
前記ＣＥＬＰパラメータの複数セットの処理は、サイレンス記述語フレームと不連続伝送とを、操作することが可能である、
ことを特徴とする請求項２１に記載の方法。
前記ＣＥＬＰパラメータの複数セットの処理は、
入力ＣＥＬＰパラメータの各セットに信号特性の計算を実施するステップと、
信号特性の計算の結果に従って入力ＣＥＬＰパラメータの各セットの重要度を配列するステップと、
重要性の配列と外部コマンドとに従って、混合戦略を決定するステップと、
選択された混合戦略に従ってＣＥＬＰパラメータの入力セットを混合するステップと、
混合されたＣＥＬＰパラメータを出力するステップと、
を備えることを特徴とする請求項２１に記載の方法。
前記信号特性の計算を実施することは、ＬＳＰ情報、ピッチ情報、励起情報、固定された符号帳情報、エネルギー情報、サイレンスフレーム情報のうちの１つもしくはそれ以上を使用して信号の特性を計算する、
ことを特徴とする請求項２９に記載の方法。
混合戦略は、最高の重要性を有するＣＥＬＰパラメータのただ一つのセットのみを選択するステップ、外部コマンドに従ってＣＥＬＰパラメータの特別なセットを選択するステップ、ＣＥＬＰパラメータの入力セットのいくつかを混合するステップ、もしくはＣＥＬＰパラメータの入力セットの全てを混合するステップ、を備える、
ことを特徴とする請求項２９に記載の方法。
ＣＥＬＰパラメータの入力セットは、会議の呼び出しへの入力チャネルであり、遅延のためのエコーを避けるために、混合のために選択されたＣＥＬＰパラメータのセットは宛先チャネルのＣＥＬＰパラメータを含まない、
ことを特徴とする請求項２９に記載の方法。
電気通信信号の特性処理のための装置であって、前記装置は音声信号領域に復号化せずにＣＥＬＰ領域において動作し、前記装置は、
デュアル−トーン変調周波数（ＤＴＭＦ）信号検出モジュールを備え、
該デュアル−トーン変調周波数（ＤＴＭＦ）信号検出モジュールは、少なくとも一つ以上の入力ＣＥＬＰパラメータに基づいた一つ以上のＤＴＭＦトーンを決定するように構成され、
前記ＤＴＭＦ信号検出モジュールは、もし決定されれば、一つ以上のＤＴＭＦ信号を出力するように構成される、
ことを特徴とする装置。
電気通信信号の特性処理のための装置であって、前記装置は音声信号領域にデコードせずにＣＥＬＰ領域において動作するように構成され、前記装置は、
前記ＤＴＭＦ信号検出モジュールに接続された複数入力混合モジュールを備え、
前記ＤＴＭＦ信号検出モジュールは、各々一つ以上の音声信号を表す一つ以上のＣＥＬＰ−ベースコーデックからＣＥＬＰパラメータをＣＥＬＰパラメータの単一のセットへ処理するように構成されている。