JPH11501405A - 話者依存時間スケーリング技術を使用した通信システムおよび方法 - Google Patents

話者依存時間スケーリング技術を使用した通信システムおよび方法

Info

Publication number
JPH11501405A
JPH11501405A JP8526247A JP52624796A JPH11501405A JP H11501405 A JPH11501405 A JP H11501405A JP 8526247 A JP8526247 A JP 8526247A JP 52624796 A JP52624796 A JP 52624796A JP H11501405 A JPH11501405 A JP H11501405A
Authority
JP
Japan
Prior art keywords
signal
audio signal
audio
selective call
receiver
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Ceased
Application number
JP8526247A
Other languages
English (en)
Inventor
サチャマーティ・スーニル
ダナ リーチ・クリフォード
ジョン シュウェンデマン・ロバート
シウィアク・カジミーア
ジョセフ クズニッキ・ウィリアム
Original Assignee
モトローラ・インコーポレーテッド
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by モトローラ・インコーポレーテッド filed Critical モトローラ・インコーポレーテッド
Publication of JPH11501405A publication Critical patent/JPH11501405A/ja
Ceased legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/003Changing voice quality, e.g. pitch or formants
    • G10L21/007Changing voice quality, e.g. pitch or formants characterised by the process used
    • G10L21/01Correction of time axis
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/04Time compression or expansion
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04BTRANSMISSION
    • H04B5/00Near-field transmission systems, e.g. inductive or capacitive transmission systems
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/90Pitch determination of speech signals

Landscapes

  • Engineering & Computer Science (AREA)
  • Signal Processing (AREA)
  • Quality & Reliability (AREA)
  • Acoustics & Sound (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Multimedia (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Reduction Or Emphasis Of Bandwidth Of Signals (AREA)
  • Mobile Radio Communication Systems (AREA)
  • Transceivers (AREA)
  • Transmission Systems Not Characterized By The Medium Used For Transmission (AREA)
  • Telephone Function (AREA)

Abstract

(57)【要約】 波形類似性をベースとした重複加算技術(WSOLA)の修正されたものを使用する音声の時間スケール変更のための方法は、メモリに入力音声信号の一部を記憶するステップ、前記入力音声信号の一部を分析して推定されたピッチの値を提供するステップ(12)、前記推定されたピッチの値に応じてセグメントサイズを決定するステップ(14)、および与えられた時間スケーリング係数に対しかつ前記決定されたセグメントサイズに応じて前記入力音声信号を時間スケーリングするステップ(18)を備えている。

Description

【発明の詳細な説明】 話者依存時間スケーリング技術を使用した 通信システムおよび方法 技術分野 この発明は一般的には音声圧縮および伸長技術に関し、かつより特定的には波 形類似性をベースとした重複加算技術(Waveform Similarit y based Overlap−Add:WSOLA)の修正版を使用した音 声圧縮および伸長の方法および装置に関する。 発明の背景 限られた帯域幅またはメモリを有する用途における音声信号の伝送または処理 は典型的には結果として得られる音声出力信号の品質を低減するかあるいはその ような音響信号の処理における柔軟性を低下させるトレードオフとなる。時間ス ケール変更を使用する音楽または音声のスピードアップまたはスローダウン(こ れはピッチを変えないことが好ましい)はいくつかを挙げればディクテイション 、音声メール、およびサウンドトラック編集を含む数多くの用途を有している。 他の特定の用途である、音声メッセージのページング、は現在の技術によっては 大きなページングシステムに対して経済的に実現できそうにない。音声ページ のために必要とされる送信時間(air time)はトーン、数字または英数 字ページについて必要とされるものよりずっと大きい。今日の技術では、音声ペ ージングサービスは理想的ではない音声品質再生によりトーン、数字または英数 字ページングと比較して経済的に可能ではない。音声メッセージページングを制 限する他の制約は帯域幅およびページングチャネルの帯域幅を使用する現在の方 法である。これに対し、英数字ページングの成長は、個人的なキーボードまたは オペレータセンタへの電話呼の形式で、ページングターミナルへ英数字メッセー ジを送るためのキーボード入力装置への限られたアクセスによって制限されてい る。音声システムはこれらの入力の事項を克服するが、それは発呼者は単に電話 機を取り上げ、アクセス番号をダイアルしかつメッセージを話すことができるか らである。さらに、今日の音声ページングシステムはいずれも、例えば、FLE XTMとしても知られたモトローラ社の新しい高速ページングプロトコル構造を活 用していない。 現存する音声ページングシステムは、高いバッテリセイビング比率、マルチチ ャネル走査能力、データを備えた音声のようなモードの混合、アクノレッジバッ クページング(発呼パーティへの戻り受信の許容)、位置検出能力、特に大都市 領域における、システムおよび周波数の再使用、および失われたメッセージ部分 の選択的再送信によるレンジ延長を含む、FLEXTMプロトコルの利点の多くを 欠 いている。 音声信号の時間スケーリングを含むページングの態様に関しておよびディクテ イションおよび音声メールのような他の用途に関して、時間スケーリングの現在 の方法は設計者が与えられた制約の中でアプリケーションを最適化できるように する適切な音声品質および柔軟性を提供する理想的な組合せを欠いている。従っ て、経済的に実現可能であり、与えられた構成の中で最適化を可能にする上での 柔軟性のある、かつより特定的にページングの用途に関して、さらにモトローラ 社のFLEXTMプロトコルの利点を保持する音声通信システムの必要性が存在す る。 発明の概要 前記波形類似性をベースとした重複加算技術(WSOLA)の修正版を使用し た音声の時間スケール変更のための方法は、入力音声信号の一部をメモリに格納 する段階、前記入力音声信号の部分を分析して推定されたピッチの値を提供する 段階、前記推定されたピッチの値に応じてセグメントサイズを決定する段階、お よび与えられた時間スケール係数に対しかつ決定されたセグメントサイズに応じ て前記入力音声信号を時間スケーリングする段階を備えている。 本発明の別の態様では、少なくとも1つの送信ベースステーションおよび複数 の選択呼出し受信機を有する音声圧縮を使用する通信システムは、送信ベースス テーションに おいて、WSOLA−SD技術および直角位相振幅変調技術を使用してオーディ オ信号を圧縮し処理された信号を提供する処理装置、および該処理された信号を 送信するための直角位相振幅変調送信機を具備する。また、前記複数の選択呼出 し受信機の各々に、前記送信された処理信号を受信するための選択呼出し受信機 モジュール、直角位相振幅復調技術およびWSOLA−SD伸長技術を使用して 前記受信された処理信号を復調し再生された信号を提供する処理装置を備えてい る。 本発明のさらに別の態様では、圧縮された音声信号を受信するための選択呼出 し受信機は、送信された処理信号を受信するための選択呼出し受信機、そして単 側波帯復調技術およびWSOLA−SD伸長技術を使用して前記受信された処理 信号を復調し再生された信号を提供する処理装置を備えている。 本発明のさらに別の態様では、音声の時間スケールまたは周波数スケール変更 のための波形の類似性をベースとした重複加算技術(WSOLA)の修正版を使 用する電子装置は、入力音声信号の一部を記憶するためのメモリ、入力音声の前 記一部を分析して推定されたピッチの値を提供しかつさらに該推定されたピッチ の値に応じてセグメントサイズを決定するためのプロセッサ、および前記決定さ れたセグメントサイズに応じて入力音声信号の時間スケーリングまたは周波数ス ケーリングを行うための装置を具備する。 図面の簡単な説明 図1は、本発明に係わる音声通信システムのブロック図である。 図2は、本発明に係わるベースステーション送信機のブロック図である。 図3は、本発明に係わるベースステーション送信機の詳細な電気的ブロック図 である。 図4は、本発明に係わる他のベースステーション送信機の詳細な電気的ブロッ ク図である。 図5、本発明に係わるベースステーション送信機の音声処理、符号化および変 調部分のブロック図である。 図6は、本発明に係わる6単側波帯信号送信機のスペクトルアナライザ出力を 示す。 図7は、本発明に係わる選択呼出し受信機の詳細な電気的ブロック図である。 図8は、本発明に係わる他の選択呼出し受信機の詳細な電気的ブロック図であ る。 図9は、本発明に係わる他の選択呼出し受信機の詳細な電気的ブロック図であ る。 図10は、本発明に係わる出シグナリングプロトコルの送信フォーマットを示 すタイミング図である。 図11は、本発明に係わる音声フレームの詳細を含む発信シグナリングプロト コルの送信フォーマットを示す他の タイミング図である。 図12は、本発明に係わる出シグナリングプロトコルの制御フレームおよび2 つのアナログフレームを示す他のタイミング図である。 図13〜図17は、本発明に係わるWSOLA時間スケーリング(圧縮)方法 のいくつかの反復に対するタイミング図を示す。 図18〜図22は、本発明に係わるWSOLA−SD時間スケーリング(圧縮 )方法のいくつかの反復に対するタイミング図を示す。 図23および図24は、本発明に係わるWSOLA−SD時間スケーリング( 伸長)方法の反復に対するタイミング図を示す。 図25は、本発明に係わるWSOLA−SD時間スケーリング方法全体のブロ ック図を示す。 好ましい実施形態の詳細な説明 図1を参照すると、本発明の音声圧縮および伸長技術を説明する通信システム が選択呼出しシステム100のブロック図で示されており、該選択呼出しシステ ム100は該システム100において選択呼出し受信機に送信するために音声を ベースとした選択呼出しが開始される電話機114のようなオーディオ信号を受 けるための入力装置を備えている。電話機114(またはコンピュータのような 他の 入力装置)を通して入力される各々の選択呼出しは典型的には(a)システムに おける選択呼出し受信機の少なくとも1つの受信機アドレス、および(b)音声 メッセージを備えている。前記開始された選択呼出しは典型的にはフォーマット およびキューイングのために送信機ベースステーションまたは選択呼出しターミ ナル113に提供される。ターミナル113の音声圧縮回路101は提供された 音声メッセージの時間的長さを圧縮するよう作用する(そのような音声圧縮回路 101の詳細な動作は図2、図3および図4の後の説明において述べる)。好ま しくは、音声圧縮回路101は時間スケーリング技術および単側波帯変調技術を 使用してオーディオ信号を圧縮して処理された信号を提供するための処理装置を 含む。前記選択呼出しは次に選択呼出し送受信機102に入力され、そこでアン テナ103を通して無線により送信される無線周波信号に変調として加えられる 。好ましくは、前記送信機は前記処理された信号を送信するための直角位相振幅 変調送信機である。 選択呼出し受信機112内のアンテナ104は前記変調された送信無線周波信 号を受信しかつそれを前記処理された信号または無線周波信号を受信するための 選択呼出し受信機モジュールまたは無線周波受信機モジュール105に入力し、 そこで前記無線周波信号は復調されかつ受信機アドレスおよび圧縮された音声メ ッセージ変調が復元される。前記圧縮された音声メッセージは次にアナログ−デ ジタル 変換器(A/D)115に提供される。好ましくは、前記選択呼出し受信機11 2は単側波帯復調技術および時間スケーリング伸長技術を使用して受信された処 理信号を復調し再生された信号を提供するための処理装置を含む。前記圧縮され た音声メッセージは次に音声伸長回路106に提供され、そこで前記音声メッセ ージの時間長は好ましくは所望の値に伸長される(本発明において使用されるそ のような音声伸長回路106の詳細な動作は図7および図8の後の説明において 述べる)。前記音声メッセージは次にそれを再生されたオーディオ信号へと増幅 するためにオーディオ増幅器108のような増幅器に与えられる。 前記復調された受信機アドレスは無線周波受信機105からデコーダ107に 供給される。もし前記受信機アドレスがデコーダ107に格納された受信機アド レスのいずれかと整合すれば、警報部111が任意選択的に作動され、選択呼出 しが受信されたことの短時間のセンサ指示を選択呼出し受信機112のユーザに 提供する。前記短時間のセンサ指示はオーディオ信号、振動のような触覚的信号 、または光のような可視的信号、あるいはそれらの組合せから構成することがで きる。増幅された音声メッセージは次にオーディオ増幅器108からメッセージ の告知およびユーザによる検閲のために警報部111内のオーディオスピーカへ と供給される。 デコーダ107はメモリを備えることができ、該メモリ に受信された音声メッセージを格納しかつ1つまたはそれ以上の制御部110の 作動により検閲のために反復して呼び出すことができる。 本発明の別の態様では、図1の部分は例えばディクテイション装置、音声メー ルシステム、応答装置、またはサウンドトラック編集装置の一部として同様に考 えることができる。選択呼出し送信機102および無線周波受信機105の除去 を含むシステム100の無線部分を除去することにより、該システムは任意選択 的に点線で示されるように音声圧縮回路101からA/D115を通して音声伸 長回路106へとハードワイヤ接続することができる。従って、音声メール、応 答装置、サウンドトラック編集またはディクテイションシステムにおいては、入 力装置114は音声圧縮回路101を有するターミナル113への音声信号のよ うな音響入力信号を供給することになる。音声伸長回路106および制御部11 0は音声メール、応答装置、ディクテイション、サウンドトラック編集または他 の用途のシステムにおいて出力音声信号に対する聴取および操作の手段を供給す る。この発明は明らかに特許請求された発明の時間スケーリング技術がページン グの他に数多くの用途を有することを意図している。ここで開示されるページン グの例は単にこれらの用途の内の1つを例示するものに過ぎない。 次に図2を参照すると、ページング送信機102とター ミナル113のブロック図が示されており、ターミナル113は選択呼出し送信 機102に結合されかつ空中線またはアンテナ103を使用してメッセージを送 信する時間圧縮モジュール160に結合された振幅圧縮およびろ波モジュール1 50を含んでいる。図3および図4を参照すると、図2のブロック図のさらに低 いレベルのブロック図が示されている。 この圧縮音声ページングシステムは極めて帯域幅効率がよくかつ直角位相振幅 (QAM)または単側波帯(SSB)変調の基本概念および音声信号の時間スケ ーリングを使用して25kHzのチャネル当たり典型的には6〜30の音声メッ セージをサポートすることを意図したものであることを銘記すべきである。好ま しくは、第1の実施形態においてかつまた図6を参照すると、圧縮音声チャネル または音声通信資源は6250Hzだけ離された3つのサブチャネルからなる。 各々のサブチャネルは2つの側波帯およびパイロットキャリアからなる。これら 2つの側波帯の各々は第1の方法では同じメッセージを有するか、あるいは第2 の方法では各々のサイドバンドに別個の音声メッセージをもつかまたは上側およ び下側サイドバンドの間に分割された単一のメッセージをもつことができる(す べて希望に応じてかつ設計に応じて同じ受信機または異なる受信機に向けられて いる)。前記単一のサブチャネルは実質的に6250Hzの帯域幅を有し、各々 のサイドバンドは実質的 に3125Hzの帯域幅を占有している。実際の音声帯域幅は実質的に300〜 2800Hzである。あるいは、直角位相振幅変調を使用することができ、この 場合は2つの独立の信号が信号のIおよびQ成分を介して直接送信され各々のサ ブチャネルの信号を形成する。送信のために必要とされる帯域幅はQAMおよび SSBの場合で同じである。 図2のモジュール150および160は各々異なる音声信号によって使用する ために反復することができ(25kHz幅のチャネルでは6倍までかつ50kH z幅のチャネルでは14倍まで)、音声メッセージの効率的なかつ同時的な送信 (示された例では6まで)を可能にする。それらは次に加算装置(図示せず、し かしながら図5を参照)において加算することができ、かつ好ましくは102に おいて複合信号として処理される。別個の信号(図示せず)はFLEXTMプロト コル(後に説明する)のFM変調を含みこれは任意選択的にソフトウエアである いはハードウエアのFM信号エキサイタとして発生することができる。 好ましくは、ここで示された例においては、入り音声メッセージはターミナル 113によって受信される。本システムは好ましくは必要な圧縮を行うために時 間スケーリング機構または技術を使用する。本発明において使用される好ましい 圧縮技術は最適の品質を提供するために入りメッセージに対して特定的なあるパ ラメータを必要とする。好ましくは、時間スケール圧縮の技術は音声信号を圧縮 され ない音声と同じ帯域幅特性を有する信号に処理する。(いったんこれらのパラメ ータが計算されると、音声は所望の時間スケーリング圧縮技術を使用して圧縮さ れる)。この時間スケール圧縮音声は次にデジタルコーダを使用して符号化され て送信機に分配するのに必要なビットの数を低減する。ページングシステムの場 合は、サイマルカストページングシステムにおける複数のまたは多数のサイマル カストサイトの送信機に分配される符号化された音声は振幅圧縮のようなさらな る処理のために再びデコードされる必要がある。入り音声信号の振幅圧縮(好ま しくは音節コンパンダ(syllabic compander)を使用する) は送信機において使用されてチャネル損傷(channel impairme nts)に対する保護を与える。 波形類似性をベースとした重複加算技術またはWSOLAとして知られた時間 スケーリング技術は音声を非圧縮音声と同じ帯域幅特性を有するアナログ信号に 符号化する。WSOLAのこの特性はそれをSSBまたはQAM変調と組み合わ せ達成される総合的な圧縮が複数のQAMまたはSSBサブチャネル(この例で は、3つの音声チャネル)の帯域幅圧縮比およびWSOLAの時間圧縮比(典型 的には1〜5)の積となるようにすることができるようにする。本発明では、後 に説明するかつ“WSOLA−SD”と称される、WSOLAの修正版が使用さ れる。WSOLA−SDはWSOLAの互換性を維持しSSBまたはQAM変 調との組合せを可能にする。 好ましくは、適応差分パルス符号変調コーダ(ADPCM)が使用されて音声 をその後送信機に分配されるデータに符号化する。送信機においては、前記デジ タルデータがデコードされてWSOLA−SD圧縮音声が得られこれは次に振幅 圧伸されて(companded)チャネルノイズに対する保護を提供する。こ の信号はヒルバート変換されて単側波帯信号を得る。あるいは、前記信号は直角 位相変調されてQAM信号を得る。次にパイロットキャリアが前記信号に加えら れかつ最終的な信号は、好ましくは、16kHzのサンプリングレートに補間さ れかつアナログに変換される。これは次に変調されかつ送信される。 本発明は混合モード(mixed−mode)(音声またはデジタル)1方向 または2方向通信システムとして動作させることができアナログ音声および/ま たはデジタルメッセージを順方向チャネル(ベース送信機から発信)によって選 択呼出し受信機ユニットに伝達しかつ付加的に任意選択的な送信機を有する同じ 選択呼出し受信機ユニットからアクノレッジメントを任意選択的な逆方向チャネ ルによって(ベース受信機への入り)受信することができる。本発明のシステム は好ましくはアドレシングおよび音声メッセージングの双方のために順方向チャ ネルにおいてFLEXTMと同様の同期フレーム構造を使用する(モトローラ・イ ンコーポレイテッドによる高速ページングプロトコ ルであり、かつ米国特許第5,282,205号の主題であり、該米国特許は参 照のためここに導入される)。2つのタイプのフレームが使用され、すなわち制 御フレームおよび音声フレームである。制御フレームは好ましくはアドレシング および携帯用音声ユニットの(PVU)の形式の選択呼出し受信機に対しデジタ ルデータを伝達するために使用される。前記音声フレームはPVUにアナログ音 声メッセージを伝達するために使用される。両方の形式のフレームは長さにおい て標準的なFLEXTMフレームと同じでありかつ両方のフレームは標準的なFL EXTM同期と共に開始する。これら2つの形式のフレームは単一の順方向チャネ ルに時間多重される。本発明に対するフレーム構造は図10、図11および図1 2を参照して後により詳細に説明する。 変調に関しては、好ましくは2つの形式の変調が本発明の順方向チャネルにお いて使用される。すなわち、デジタルFM(2レベルおよび4レベルFSK)お よびAM(SSBまたはパイロットキャリアを備えたQAM)である。デジタル FM変調は両方の形式のフレームの同期部分に対して、かつ制御フレームのアド レスおよびデータフィールドに対して使用される。AM変調(各サイドバンドは 独立に使用できあるいは単一のメッセージでいっしょに組み合わせることができ る)は音声フレームの音声メッセージフィールドにおいて使用される。前記送信 のデジタルFM部 分は6400BPS(3200ボーのシンボル)のシグナリングをサポートする 。前記送信のAM部分は帯域制限された音声(280Hz)をサポートしかつ一 対の音声信号に対し6.25kHzを必要とする。後に示される、プロトコルは 1つのチャネル全体を6.25kHzのサブチャネルに細分し、かつ各サブチャ ネルおよびAMサイドバンドを独立のメッセージに使用することにより低減され たAM帯域幅の利点を得る。 本発明の音声システムは好ましくは25kHzまたは50kHzの順方向チャ ネルによって動作するよう設計されるが、他のサイズのスペクトルも本発明の意 図する範囲内にある。25kHzの順方向チャネルは制御フレームの間に単一の FM制御信号をサポートし、かつ音声フレームのメッセージ部分の間に3つまで のAMサブチャネル(6つの独立した信号)をサポートする。50kHzの順方 向チャネルは制御フレームの間に時間ロックして動作する2つのFM制御信号を サポートし、かつ音声フレームのメッセージ部分の間に7つまでのAMサブチャ ネル(14の独立した信号)をサポートする。もちろん、異なるサイズの帯域幅 およびサブチャネルおよび信号の数を使用する他の構成も本発明の範囲内にある 。ここで開示される例は単に例示的なものでありかつここで特許請求される可能 性ある広い範囲を示すものに過ぎない。 変調およびスペクトルのサブチャネル化によって達成さ れるスペクトル効率に加えて、本発明は、他の実施形態において、音声を1〜5 倍の係数で時間スケーリングする話者依存(speaker dependen t)音声圧縮技術を使用することができる。同じメッセージの異なる部分または 異なるメッセージに対してサブチャネルの双方のAMサイドバンド(あるいは、 2つのQAM成分)を使用することにより、サブチャネルごとの総合的な圧縮率 または係数は2〜10倍となる。音声品質は典型的には時間圧縮係数の増大と共 に低減する。本発明の音声システムにおいて好適に使用される圧縮技術は前に述 べたように波形類似性をベースとした重複加算技術(WSOLA)として知られ た時間スケーリング技術の修正された形式である。WSOLAの修正された形式 は使用される特定の話者または音声に依存し、従って「WSOLA−話者依存( WSOLA−Speaker dependent)」に対して“WSOLA− SD”と称され、これについては後に説明する。 本発明の動作は逆方向(ベース受信機への入り:inbound to th e base receiver)チャネルが利用可能な場合に強化される。周 波数分割単信(simplex)モードの動作はサポートされる1つの入り(i nbound)動作モードである。(共に本発明の譲受人、モトローラ・インコ ーポレイテッド、に譲渡された、米国特許第4,875,038号および第4, 88 2,579号は入りチャネルによる複数のアクノレッジ信号の使用について説明 しておりかつここに参照のため導入される)。周波数分割単信においては、別個 の専用のチャネル(通常出チャネルと対になっている)が入り送信のために設け られる。800〜9600BPSの入りデータレートは12.5kHzのチャネ ル帯域幅内に入るものと考えられる。 本発明のシステムは逆方向チャネルの利用可能性に応じていくつかのモードの 1つで動作することができる。いずれの逆方向チャネルも利用可能でない場合は 、システムは好ましくはアドレシングおよび音声メッセージングの双方のために サイマルカストモードで動作する。逆方向チャネルが提供されたとき、システム はターゲット(targeted)メッセージモードで動作することができ、こ れによってメッセージは携帯用音声ユニットの近くに位置する単一のまたはある 部分集合の送信機によってのみ放送される。前記ターゲットメッセージモードは 携帯用音声ユニットを位置決めするためのサイマルカストアドレシングによって 特徴付けられる。逆方向チャネルによる携帯用音声ユニットの応答はロケーショ ンを提供し、それに続き携帯用音声ユニットへの局部的な(localized )メッセージ送信がある。ターゲットメッセージモードの動作はそれがサブチャ ネルの再使用の機会を提供する点で有利であり、かつその結果このモードの動作 は数多くのシステムに おいて大きなシステム容量につなげることができる。 図3は、本発明に係わる送信機300の第1の実施形態のブロック図を示す。 アナログ音声信号はアンチエイリアス・ローパスフィルタ301に入力され、該 ローパスフィルタ301は、該フィルタにさらに結合されるアナログ−デジタル 変換器(ADC)303のサンプリングレートの2分の1より上のすべての周波 数を強力に減衰させる。ADC303は好ましくは前記アナログ音声信号をデジ タル信号に変換し、それによってさらなる信号処理がデジタ処理技術を使用して 行うことができるようにする。デジタル処理は好ましい方法であるが、同じ機能 はアナログ技術によって行うこともでき、あるいはアナログおよびデジタル技術 の組合せによって行うこともできる。 ADC303に結合されたバンドパスフィルタ305はそのカットオフ周波数 より低いおよび高い周波数を強力に減衰させる。より低いカットオフ周波数は好 ましくは300Hzであり、これは重要な音声周波数を通過させることができる が、パイロットキャリアと干渉するような低い周波数を減衰させる。上のカット オフ周波数は好ましくは2800Hzでありこれは重要な音声周波数を通過させ るが隣接送信チャネルと干渉する可能性のあるより高い周波数を減衰させる。自 動利得制御(AGC)ブロック307がフィルタ305に結合されて異なる音声 の音量レベルを等しくするのが好ましい。 AGCブロック307に好適に結合された時間圧縮ブロック309は音声信号 の送信のために必要な時間を短縮し、一方バンドパスフィルタ305の出力にお けるものと実質的に同じ信号スペクトルを維持する。前記時間圧縮方法は好まし くは(後に説明する)WSOLA−SDであるが、他の方法も使用できる。振幅 圧縮ブロック311、および受信機700(図7)における対応する振幅伸長ブ ロック720は受信音声の見かけの(apparent)信号対雑音比を増大す るためによく知られた圧伸(companding)装置を形成する。圧伸比率 は好ましくはデシベルで2〜1であるが、他の比率も本発明によって使用するこ とができる。ページングシステムのような通信システムの特定の場合は、装置3 01〜309はページングターミナル(図1の113)に含まれかつ図3の残り の構成要素はページング送信機(図1の102)を構成するようにすることがで きる。そのような場合、ページングターミナルとページング送信機との間に典型 的にはデジタルリンクがある。例えば、ブロック309の後の信号はパルス符号 変調(PCM)技術を使用して符号化されかつ次にPCMを使用してデコードさ れてページングターミナルとページング送信機との間で転送されるビットの数を 低減することができる。 いずれにしても、振幅圧縮ブロック311に結合された第2のバンドパスフィ ルタ308はそのカットオフ周波数 より下のおよび上の周波数を強力に減衰させてAGC307、時間圧縮ブロック 309または振幅圧縮ブロック311によって発生されるいずれのスプリアス成 分をも除去する。下側のカットオフ周波数は好ましくは300Hzであり、これ は重要な音声周波数を通過できるようにするが、パイロットキャリアと干渉する 可能性のあるより低い周波数を減衰させる。上側カットオフ周波数は好ましくは 2800Hzであり、これは重要な音声周波数を通過させるが隣接送信チャネル と干渉する可能性のあるより高い周波数を減衰させる。 前記時間圧縮音声サンプルは好ましくは音声メッセージ全体が処理されるまで バッファ313に格納される。これは時間圧縮された音声メッセージが次に全体 として送信できるようにする。このバッファリング方法は好ましくはページング サービス(これは典型的には非リアルタイムサービスである)のために使用され る。他のバッファリング方法も他の用途のためには好ましく使用することができ る。例えば、2方向リアルタイム通話を含む用途では、この形式のバッファリン グによって生じる遅延は耐えられないものとなるであろう。その場合、幾つかの 通話の小さなセグメントをインタリーブするのが好ましい。例えば、もし時間圧 縮比が3:1であれば、3つのリアルタイム音声信号が単一のチャネルによって 送信できる。これら3つの送信は前記チャネルにおいて150ミリセカンドのバ ーストで インタリーブすることができ、かつ結果として生じる遅延は好ましくないもので はない。バッファ313からの時間圧縮された音声信号はヒルバート変換フィル タ323にかつ該ヒルバート変換フィルタと同じ遅延を有するがそれ以外は信号 に影響を与えない時間遅延ブロック315の双方に供給される。 時間遅延ブロック315(加算回路317を通って)およびヒルバート変換フ ィルタ323の出力は、それぞれ、上部サイドバンド(USB)単側波帯(SS B)信号の同相(I)および直角位相(Q)成分を形成する。前記時間遅延の出 力およびヒルバート変換フィルタの否定(negative)(325)は、そ れぞれ、下部サイドバンド(LSB)単側波帯信号の同相(I)および直角位相 (Q)成分を形成する。従って、前記送信は、点線接続で示されるように、下部 サイドバンドまたは上部サイドバンドのいずれかによることができる。 1つの時間圧縮された音声信号を送信するために上部サイドバンドが使用され ている間に、下部サイドバンドは同時に下部サイドバンドによって動作する他の 同様の送信機を使用することにより第2の時間圧縮された音声信号を送信するこ とができる。SSBは送信帯域幅の効率的な使用およびクロストークに対する耐 性のため好ましい変調方法である。両側波帯振幅変調(AM)または周波数変調 (FM)を使用することができるが、送信のために少なくとも 2倍の帯域幅を必要とする。また、1つの時間圧縮された音声信号を直接I成分 を介してかつ第2の時間圧縮された音声信号を直接Q成分を介して送信すること もできるが、本実施形態では、この方法はマルチパス受信が受信機において生じ た場合に2つの信号の間でクロストークを受けやすい。 直流(DC)信号が前記信号のI成分に加えられてパイロットキャリアを発生 し、これは前記信号と共に送信されかつ受信機(700)によって利得および位 相変動の影響または送信チャネルにおけるフェーディングを実質的に打ち消すた めに使用される。前記信号のIおよびQ成分はそれぞれデジタル−アナログ変換 器(DAC)319および327によってアナログ形式に変換される。これは2 つの信号は次にそれぞれローパス再生フィルタ321および329によってろ波 されてデジタル−アナログ変換プロセスから生じるスプルアス周波数成分を除去 する。直角位相振幅変調(QAM)変調器333は前記IおよびQ信号を低い電 力レベルで無線周波(RF)キャリアへと変調する。他の変調方法、例えば、変 調信号の直接デジタル合成、もDAC(319および327)、再生フィルタ( 321および329)、およびQAM変調器333と同じ目的を達成する。最後 に、リニアRF電力増幅器335は前記変調されたRF信号を所望の電力レベル 、典型的には50ワットあるいはそれ以上、まで増幅する。次にRF電力増幅器 335の出力は送信アンテナに結合される。他の変形も実質的に同じ結果を生じ させることができる。例えば、振幅圧縮は時間圧縮の前に行うことができ、ある いは完全に除去することができ、装置はそれでも実質的に同じ機能を達成する。 図4は、本発明に係わる送信機400の第2の実施形態のブロック図を示す。 図4においては、上部および下部サイドバンドの双方が使用されて同時に同じ時 間圧縮信号の異なる部分を送信する。送信機400は好ましくは図3に示される ように結合されかつ構成されたアンチエイリアス(anti−alias)フィ ルタ400、ADC403、バンドパスフィルタ405、AGC407、時間圧 縮ブロック409、振幅圧縮ブロック411、およびバンドパスフィルタ408 を含む。図4の送信機の動作は音声メッセージ全体が処理されかつバッファ41 3に記憶されるまでは図3の場合と同じである。バッファ413に格納された時 間圧縮音声サンプルは次に上部または下部サイドバンドによって送信されるべく 分配される。好ましくは、時間圧縮音声メッセージの第1のハーフは一方のサイ ドバンドによって送信されかつ時間圧縮音声メッセージの第2のハーフは他方の サイドバンドによって送信される(あるいは、直接前記IおよびQ成分の各々に よって送信される)。 バッファ413からの時間圧縮音声信号の第1の部分は第1のヒルバート変換 フィルタ423および第1の時間遅 延ブロック415の双方に供給され、前記第1の時間遅延ブロック415はヒル バート変換フィルタ423と同じ遅延を有するがそれ以外は信号に影響を与えな い。(加算回路417を通った)第1の時間遅延および(加算回路465を通っ た)第1のヒルバート変換フィルタ423の出力は同相(I)および直角位相( Q)信号成分であり、これらはQAM変調器のIおよびQ入力に結合された時、 時間圧縮音声サンプルの第1の部分からのみの情報を有する上部サイドバンド信 号を発生する。バッファ413からの第2の時間圧縮音声信号は第2のヒルバー ト変換フィルタ461および第2の時間遅延ブロック457の双方に供給され、 前記第2の時間遅延ブロック457はヒルバート変換フィルタ461と同じ遅延 を有するがそれ以外では信号に影響を与えない。第2の時間遅延の出力(加算回 路459および417を通った)および第2のヒルバート変換フィルタ461の 出力の否定(463)(かつ再び加算回路465を通った)は同相(I)および は直角位相(Q)信号成分であり、これらはQAM変調器のIおよびQ入力に結 合された時、時間圧縮音声サンプルの第2の部分からのみの情報を有する上部サ イドバンド信号を発生する。上部および下部サイドバンド信号のI成分は(加算 回路459によって)DCパイロットキャリア成分と加算されて送信のための複 合I成分を形成する。上部および下部サイドバンド信号のQ成分は(加算回路4 65によって)加算されて 送信のための複合Q成分を形成する。要素415,423,457,461,4 17,459,463,465,419,427,421および429はプリプ ロセッサを形成し、該プリプロセッサは前処理された(preprocesse d)IおよびQ信号成分を発生し、これらの成分はQAM変調器453に結合さ れた時、各々のサイドバンドに独立した情報を有する、2つの単側波帯信号を有 する、サブキャリアFAを備えた低レベルのサブチャネル信号を発生する。 送信機400はさらに図3において述べたように配置されかつ構成されたDA C419および427、再生フィルタ421および429、QAM変調器433 、およびRF電力増幅器455を備えている。図4の送信機の残りの部分の動作 は図3の場合と同じである。 好ましくは、図3および図4のそれぞれ送信機300および400の双方にお いて、アンチエイリアスフィルタ、再生フィルタ、RF電力増幅器および任意選 択的にアナログ−デジタル変換器およびデジタル−アナログ変換器のみが別個の ハードウエア要素である。装置の残りは好ましくはプロセッサ、好ましくはデジ タル信号プロセッサ、によって動作することができるソフトウエアに導入するこ とができる。 図7は、本発明に係わる図3の送信機300に関連して好適に動作する受信機 700のブロック図を示す。受信ア ンテナが受信機モジュール702に結合されている。受信機モジュール702は 、RF増幅器、ミキサ、バンドパスフィルタ、および中間周波(IF)増幅器( 図示せず)のような、伝統的な受信機要素を含む。QAM復調器704は受信信 号のIおよびQ成分を検出する。アナログ−デジタル変換器(ADC)706は これらのIおよびQ成分をさらに処理するためにデジタル形式に変換する。デジ タル処理が好ましい方法であるが、同じ機能はまたアナログ技術またはアナログ およびデジタル技術の組合せによって行うこともできる。他の方法の復調、例え ば、シグマ−デルタ変換器、または直接デジタル復調、も前記QAM復調器70 4およびADC706と同じ目的を達成することができる。 フィードフォワード自動利得制御(AGC)ブロック708は時間圧縮音声信 号と共に送信される、パイロットキャリアを位相および振幅基準信号として使用 し送信チャネルにおいて生じる振幅および位相ひずみの影響を実質的に打ち消す 。フィードフォワード自動利得制御の出力は受信信号の修正されたIおよびQ成 分である。該修正されたQ成分はヒルバート変換フィルタ712に供給され、か つ前記修正されたI成分はヒルバート変換フィルタ712と同じ遅延を有するが それ以外には信号に影響を与えない時間遅延ブロック710に供給される。 もし時間圧縮音声信号が上部サイドバンドによって送信 されれば、ヒルバート変換フィルタ712の出力は(加算回路714を通して) 時間遅延ブロック710の出力に加えられ復元されたまたは再生された時間圧縮 音声信号を生成する。もし前記時間圧縮音声信号が下部サイドバンドによって送 信されれば、ヒルバート変換フィルタ712の出力は前記時間遅延ブロック71 0の出力から減算され(716)復元されたまたは再生された時間圧縮音声信号 を生成する。再生された時間圧縮音声信号は好ましくはメッセージ全体が受信さ れるまでバッファ718に格納される。他のバッファリング方法も可能である。 (図3の説明を参照。) 振幅伸長ブロック720は図3の振幅圧縮ブロック311と組み合わせて動作 し圧伸(companding)機能を達成する。時間伸長ブロック722は図 3の時間圧縮ブロック309と組み合わせて動作しかつ好ましくは音声をその本 来の時間フレーム(変換器724を通してのオーディオ出力のために)または他 のアプリケーションが指示するように他の時間フレームに再構成する。1つのア プリケーションは任意選択的にデジタル化された音声を計算装置726に転送す ることを含み、この場合受信機−コンピュータインタフェースはPCMCIAま たはRS−232インタフェースあるいは技術的に知られた任意の種類のインタ フェースとすることができる。時間圧縮方法は好ましくはWSOLA−SDであ るが、他の方法も、送信機およ び受信機において相補的(complementary)な方法が使用される限 り、使用することができる。構造上の他の変形も実質的に同じ結果を生じさせる ことができる。例えば、振幅圧縮は時間圧縮の後に行うことができ、あるいは完 全に省略することもでき、かつ装置はそれでも実質的に同じ機能を達成するであ ろう。 図8は、本発明に係わる図4の送信機と組み合わせて動作する受信機750の ブロック図を示す。図8の受信機はアンテナ、受信機モジュール752、QAM 変調器754、ADC756、フィードフォワードAGC758、時間遅延ブロ ック760、そしてヒルバート変換フィルタ762を備えこれらは図7において 説明したのと同様に配置されかつ構成されている。図8の受信機の動作は、時間 遅延ブロック760およびヒルバート変換フィルタ762の出力までは図7と同 じである。ヒルバート変換フィルタ762の出力は(加算回路764を通して) 時間遅延ブロック760の出力に加えられて上部サイドバンドによって送信され た音声メッセージの第1のハーフに対応する再生された時間圧縮音声信号を生成 する。ヒルバート変換フィルタ762の出力は時間遅延ブロック760の出力か ら減算され(766)下部サイドバンドによって送信された音声メッセージの第 2のハーフに対応する復元または再生された時間圧縮音声を生成する。 前記2つの再生された時間圧縮音声信号はメッセージ全 体が受信されるまでそれぞれ上部サイドバンドおよび下部サイドバンド用バッフ ァ768および769に記憶される。次に、前記メッセージの第1のハーフに対 応する信号および前記メッセージの第2のハーフに対応する信号が順次振幅伸長 ブロック770に供給される。振幅伸長ブロック770は図4の振幅圧縮ブロッ ク411と組み合わせて動作し圧伸機能を行う。 図8の受信機の残りの部分の動作は図7のものと同じである。時間伸長ブロッ ク772は図4の時間圧縮ブロック409と組み合わせて動作しかつ好ましくは 音声をその本来の時間フレームにまたは他のアプリケーションが指示または要求 するのに応じて他の時間フレームに再構成する。前記時間圧縮方法は好ましくは WSOLA−SDであるが、送信機および受信機において相補的な方法が使用さ れる限り、他の方法も使用できる。他の構成も実質的に同じ結果を生じさせるこ とができる。例えば、振幅圧縮は時間圧縮の後に行い、あるいは完全に削除する ことができ、かつ装置はそれでも実質的に同じ機能を達成する。 図3および図4の送信機の構成と同様に、図7および図8の構成要素の多くは 、これらに限定されるものではないが、AGC、単側波帯またはQAM復調器、 加算回路、振幅伸長ブロック、および時間伸長ブロックを含めてソフトウエアで 実施できる。すべての他の構成要素は好適にハードウエアで構成できる。 もし本発明の音声処理、符号化および変調部分がハードウエアで構成される場 合は図5の構成を使用することができる。例えば、図5の送信機500はそれぞ れのパイロットキャリアの周波数(581〜583)にセットされた一連の対の 単側波帯エキサイタ(571〜576)を含む。エキサイタ571〜576およ びパイロットキャリア581〜583は別個の音声処理経路に対応する。FM信 号エキサイタ577(前に述べた同期、アドレスおよびデータフィールドのため に使用されるデジタルFM変調に対する)信号を含めて、これらすべての信号は 加算増幅器(summing amplifier)570に供給され、該加算 増幅器570は次にリニア増幅器580によって増幅されかつその後送信される 。FMエキサイタ577の低レベル出力はまた加算増幅器570においてリニア に組み合わされる。加算増幅器570の複合出力はリニアRF電力増幅器580 によって所望の電力レベル、通常50ワットまたはそれ以上、に増幅される。リ ニアRF電力増幅器580の出力は次に送信アンテナに結合される。 いくつかのサブチャネルの信号を組み合わせるために他の手段を使用すること もできる。例えば、図4における417および465の出力において得られた、 いくつかのデジタルベースバンドIおよびQ信号は周波数的にそれらのそれぞれ のサブキャリアオフセット周波数に変換され、デジタル形式で結合され、次にキ ャリア周波数への変調のた めにアナログ形式に変換することができる。 図9を参照すると、本発明に係わる他の受信機ユニット900が示されている 。受信機900はさらに前記FLEXTMシグナリングプロトコルにおいて使用さ れるFM変調された制御信号を検出しかつデコードするための手段を導入してい る。ブロック902は受信機フロントエンドおよびFMバックエンドである。デ ジタル自動周波数コントローラ(DAFC)および自動利得コントローラ(AG C)がブロック902に導入されている。ブロック906はサポート用チップ9 50を備えた無線プロセッサを含み、かつブロック911,914および916 はすべての出力装置を含む。ブロック904はプロセッサ906の制御の下で動 作するバッテリセイバまたはバッテリ節約回路である。ブロック850はリニア デコーダであり、これに続きアナログ−デジタル変換器およびランダムアクセス メモリ(RAM)ブロック868が設けられる。受信機ブロック902は好まし くは米国特許第5,239,306号(この特許は本発明の譲受人に譲渡されか つ参照のためここに導入される)に記載されたDAFCおよびAGCの追加を含 む修正されたFM受信機であり、かつ大部分の受信機利得の後のしかしながらF M復調器の前のポイントで中間周波(IF)出力を提供する。 モトローラのFLEXTMプロトコルに両立するページャを制御する同じプロセ ッサは適切にアドレス認識および FM復調信号のメッセージデコードを含む本発明のすべてのプロトコル機能を取 り扱うことができる。さらに、FM変調されたアドレス(かつ多分メッセージポ インタのコードワード)に応じて、プロセッサ906はアナログ−デジタル変換 およびRAMブロック868の動作を開始する。ブロック868はリニアデコー ダブロック850の出力におけるI(同相)およびQ(直角位相)リニア変調信 号のいずれかまたは双方をサンプルする。信号サンプルは直接アドレスカウンタ の助けによりかつプロセッサ906からの制御信号に応じてRAMに書き込まれ る。 音声はチャネルの単一の音声帯域幅を占有するSSB信号として、あるいは等 価的に前に述べたようにIまたはQチャネルのいずれかによって送信することが できる。IおよびQ信号の各々は同時に同じRF帯域幅を2つのアナログの単側 波帯(SSB)として占有する。音声帯域幅は2.8KHzのオーダであり、従 ってもしアナログSSBがIおよびQチャネル情報から再生される場合は各々約 6.4KHzの信号サンプリングレートが典型的に前記アナログ−デジタル変換 器に要求される。アナログ−デジタル変換器は8ビット精度でサンプルする(も ちろん10ビット程度が好ましいが)。アナログ−デジタル変換器によるダイレ クトメモリアクセスはその速度および電力がチャネルデータレートの直接の関数 ではないプロセッサを使用することができるようにする。すなわち、マイクロプ ロセッサは ダイレクトメモリアクセスと共に使用でき、もしアナログ−デジタル変換された データがマイクロプロセッサを通してメモリに読まれるべき場合はかなり高速の プロセッサが必要となる。 前記アナログ−デジタル変換器(A/D)、デュアルポートRAMおよびアド レスカウンタはブロック868としてグループ化されている。第2のRAM I /Oポートは直列または並列とすることができ、かつ毎秒6または12Kサンプ ルのレートで動作する。第2のRAM I/Oポートはプロセッサがサンプルさ れた音声またはデータを抽出し、復調機能を処理し、かつ圧縮音声を伸長しある いはデータをフォーマットすることができるように設けられている。回復された 音声は音声プロセッサ914および変換器916を介して再生され、一方フォー マットされたデータは表示装置911上に表示することができる。 再び図9を参照すると、詳細な電気的ブロック図は本発明のデュアルモード通 信受信機の受信機動作をさらに詳細に説明するために使用できる。FM変調フォ ーマットで、あるいはリニア変調フォーマット(SSBのような)で変調された 、送信された情報信号はアンテナ802によって捕捉され、該アンテナ802は 該情報信号を受信機セクション902に、かつ特に無線周波(RF)増幅器80 6の入力に結合する。前記メッセージ情報は、VHFバンドおよびUHFバンド におけるもののような、任意の適切なR Fチャネルによって送信される。RF増幅器806は、930MHzのページン グチャネル周波数で受信された信号のもののような、受信された情報信号を増幅 し、増幅された情報信号を第1のミキサ808の入力に結合する。本発明の好ま しい実施形態においては周波数シンセサイザまたは局部発振器810によって発 生される、第1の発振器信号もまた第1のミキサ808に結合される。第1のミ キサ808は前記増幅された情報信号および前記第1の発振器信号を混合して4 5MHzのIFのような、第1の中間周波数、またはIF、信号を提供し、これ は第1のIFフィルタ812の入力に結合される。特に他のページングチャネル 周波数が使用される場合には、他のIF周波数も同様に使用できることが理解さ れるであろう。オンチャネル(on−channel)情報信号であるIFフィ ルタ812の出力は第2の変換セクション814の入力に結合され、これについ ては後にさらに詳細に説明する。第2の変換セクション814は前記オンチャネ ル情報信号を、これもまたシンセサイザ810によって発生される、第2の発振 器信号を使用して、455KHzのような、下側の中間周波数に混合する。第2 の変換セクション814は結果として得られた中間周波信号を増幅してFM復調 セクション908にまたはリニア出力セクション824に結合するのに適した第 2のIF信号を提供する。 受信機セクション804は伝統的なFM受信機と同様の 方法で動作するが、伝統的なFM受信機と異なり、本発明の受信機セクション8 04はまた前記第2の変換セクション814に結合され、かつ前記第2のIF信 号を適切にサンプルして受信機の同調を割り当てられたチャネルに維持するため に周波数シンセサイザ810に結合される周波数訂正信号を提供する自動周波数 制御セクション816を含んでいる。受信機の同調の維持は特にQAM(すなわ ち、IおよびQ成分)および/またはリニア変調フォーマットで送信されるSS B情報の適切な受信のために重要である。第1および第2の発振器周波数を発生 するために周波数シンセサイザを使用することは、例えば、FLEXTMプロトコ ルにおけるような、コードメモリのプログラミングおよび/または無線により受 信されたパラメータによることなどによって選択される、複数の動作周波数に対 する受信機の動作選択を可能にする。自動周波数制御セクション816からの周 波数訂正信号によって調整できる固定周波数発振回路のような、他の発振回路も 同様に使用できることが理解されるであろう。 自動利得制御820はまた本発明のデュアルモード受信機の第2の変換セクシ ョン814に結合されている。自動利得制御820は第2のIF信号のサンプル のエネルギを推定または評価しかつRF増幅器806のための所定の利得を維持 するためにRF増幅器806に対して結合される利得訂正信号を提供する。利得 訂正信号はまた第2の変換 セクション814に結合し第2の変換セクション814のための所定の利得を維 持する。RF増幅器806および第2の変換セクション814の利得の維持はリ ニア変調フォーマットで送信される高速データ情報の適切な受信のために必要と され、かつさらに本発明のデュアルモード受信機を伝統的なFM受信機と区別す る。 メッセージ情報または制御データがFM変調フォーマットで送信される場合、 第2のIF信号は、後に詳細に説明するように、FM復調セクション908に結 合される。FM復調セクション908は第2のIF信号を当業者によく知られた 方法で復調して復元または再生データ信号を提供し、これは前記FM変調フォー マットで送信されたメッセージ情報および受信アドレスに対応する2進情報の流 れ(stream)である。復元されたデータ信号は入力/出力ポート、または I/Oポート828の入力を通して、デコーダおよびコントローラとして機能す る、マイクロコンピュータ906の入力に結合される。マイクロコンピュータ9 06は通信受信機900の完全な動作制御を提供し、いくつかを挙げれば、デコ ード、メッセージ記憶および読出し、表示制御、および警報のような機能を提供 する。装置906は好ましくはモトローラ社によって製造されるMC68HC0 5型マイクロコンピュータのような単一チップマイクロコンピュータであり、か つ動作制御のためにCPU840を含む。内部バス830は装置906の動作要 素の各々を接続する。I/Oポート828(図9において分割して示されている )は複数の制御およびデータラインを提供し、バッテリセイバスイッチ904、 オーディオプロセッサ914、表示装置911、およびデジタル記憶装置868 のような、外部回路から装置906への通信を提供する。タイマ834のような タイミング手段が使用されて、バッテリセイバのタイミング、警報タイミング、 およびメッセージ記憶および表示タイミングのような、通信受信機の動作のため に必要なタイミング信号を発生するのに使用される。発振器832はCPU84 0の動作のためのクロックを提供し、かつタイマ834のための基準クロックを 提供する。RAM838は通信受信機900の動作を制御する種々のファームウ エアルーチンを実行する上で使用される情報を記憶するために用いられ、かつま た数字メッセージのような短いメッセージを記憶するために使用することもでき る。ROM836は、前記復元されたデータ信号のデコード、バッテリセイバ制 御、デジタル記憶セクション868におけるメッセージ記憶および読出し、そし てページャ動作およびメッセージ提示の一般的な制御などを含む、装置906の 動作を制御するために使用されるファームウエアルーチンを含む。警報発生器8 42は前記FM変調されたシグナリング情報のデコードに応じて警報信号を提供 する。コードメモリ910(図示せず)はI/Oポート828を介してマイクロ コンピュータ906に結合 している。コードメモリは好ましくはEEPROM(電気的に消去可能かつプロ グラム可能なリードオンリメモリ)であり、通信受信機900が応答する1つま たはそれ以上の所定のアドレスを格納している。 前記FM変調されたシグナリング情報が受信されたとき、それは当業者によく 知られた方法でデコーダとして機能する、装置906によってデコードされる。 前記復元または再生されたデータ信号の情報が記憶された所定のアドレスのいず れかと整合したとき、その後に受信される情報がデコードされてFM変調フォー マットで変調された付加的な情報が受信機に向けられているか否か、あるいは該 付加的な情報がリニア変調フォーマットで変調されているか否かを判定する。前 記付加的な情報がFM変調フォーマットで送信された場合には、復元されたメッ セージ情報は、後にさらに説明するように、マイクロコンピュータのRAM83 8に、あるいはデジタル記憶セクション868において受信されかつ記憶され、 かつ警報発生器842に対し警報信号が発生される。該警報信号は変換器916 をドライブするオーディオ処理回路914に結合され、可聴警報を伝達する。触 覚的または振動的警報のような、他の形式の検知可能な警報も同様にユーザに警 報するために提供することができる。 付加的な情報がリニア変調フォーマット(SSBまたは「IおよびQ」のよう な)で送信されるべき場合は、マイ クロコンピュータ906はポインタ情報をデコードする。該ポインタ情報は受信 機に対して前記付加的な情報が送信されるべきチャネル帯域幅内でサイドバンド のどのような組合せであるか(あるいはIおよびQ成分のどのような組合せであ るか)に関して指示する情報を含む。装置906は現在のバッチの終りまで、F M変調フォーマットで送信される情報の監視およびデコードの動作を維持し、現 在のバッチの終りで次の割り当てられたバッチまであるいは前記ポインタによっ て識別されるバッチに到達するまで受信機への電源を停止し、その間に高速デー タが送信される。装置906は、I/Oポート828を介してバッテリセイビン グ制御信号を発生し、これはバッテリセイバスイッチ904に結合してFM復調 器908への電源を停止し、かつリニア出力セクション824、リニア復調器8 50、およびデジタル記憶セクション868への電源を供給し、これについては 後に説明する。 今やSSB(または「IおよびQ」)情報を伝達する、第2のIF出力信号は リニア出力セクション824に結合される。リニア出力セクション824の出力 は直角位相検出器850、特に第3のミキサ852の入力に結合される。第3の 局部発振器もまた第3のミキサ852に結合され、該発振器は、もちろん他の周 波数も同様に使用できるが、35〜150kHzの範囲の周波数であるのが好ま しい。リニア出力セクション824からの信号は前記第3の局部 発振器の信号854と混合され、第3のミキサ852の出力に第3のIF信号を 生成し、これは第3のIF増幅器856に結合される。第3のIF増幅器は入力 信号から出力信号をバッファリングする低利得増幅器である。前記第3の出力信 号はIチャネルミキサ858およびQチャネルミキサ860に結合される。前記 I/Q発振器862は第3のIF周波数で直角位相発振信号を提供し、これらの 信号はIチャネルミキサ858およびQチャネルミキサ860において第3の出 力信号と混合されてミキサ出力にベースバンドIチャネル信号およびQチャネル 信号を提供する。該ベースバンドIチャネル信号はローパスフィルタ864に結 合され、かつベースバンドQチャネル信号はローパスフィルタ866に結合され 、圧縮されかつ圧伸された音声信号を表す一対のベースバンドオーディオ信号を 提供する。 前記オーディオ信号はデジタル記憶セクション868、特にアナログ−デジタ ル変換器870の入力に結合される。A/D変換器870は該信号を864およ び866の出力における最も高い周波数成分の少なくとも2倍のレートでサンプ ルする。サンプリングレートは好ましくはIおよびQチャネルごとに6.4キロ ヘルツである。該データのサンプリングレートは一例として示されているに過ぎ ず、かつ他のサンプリングレートも受信されるオーディオメッセージの帯域幅に 依存して使用できることが理解されるであろう。 高速データが送信されるバッチの間に、マイクロプロセッサ906はカウント イネーブル信号を提供しこれはアドレスカウンタ872に結合される。A/D変 換器870もまた情報シンボル対のサンプリングを可能にするためイネーブルさ れる。A/D変換器870は高速サンプルブロック信号を発生し、該信号はアド レスカウンタ872をクロックするために使用され、該アドレスカウンタ872 はコンバータ870からRAM874へとつながるデータラインを通してサンプ ルされた音声信号をデュアルポートランダムアクセスメモリ874にロードする ためのアドレスを順次発生する。高速度でデュアルポートRAM874にリアル タイムでロードされた音声信号はすべての音声信号が受信された後にマイクロコ ンピュータ906によって処理され、それによってマイクロコンピュータ906 が情報をリアルタイムで処理することを要求しないことにより消費されるエネル ギの大幅な低減が得られる。マイクロコンピュータ906はデータラインおよび アドレスラインを通して記憶された信号にアクセスし、かつ本発明の好ましい実 施形態では、前記情報シンボル対を処理して英数字データが送信されている場合 にASCII符号化情報を、あるいは音声が送信されている場合にデジタル化サ ンプルデータを発生する。前記デジタル化音声サンプルはあるいはBCD,CV SDまたはLPCをベースとした形式および必要に応じて他の形式のような他の フォーマットで格納するこ とができる。時間圧縮音声信号の場合は、ADC変換器870によってサンプル されるIおよびQ成分はさらにデュアルポートRAM874およびI/O 82 8を介してCPU840によってさらに処理されて、(1)オーディオ信号を振 幅伸長し、かつ(2)図7および図8の受信機の同様の動作で説明したように信 号を時間伸長する。音声は次に再びRAM874に格納される。ASCII符号 化データまたは音声データは通信受信機のユーザよって提示のために情報が要求 されるまでデュアルポートRAMに格納される。記憶されたASCII符号化デ ータはユーザによって記憶されたメッセージを選択しかつ読み出すためのスイッ チ(図示せず)を使用して再生される。記憶されたASCII符号化メッセージ が読み出されるべき場合は、ユーザは読み出されるべきメッセージを選択しかつ 読出しスイッチを作動させ、これはマイクロコンピュータ906がデータを再生 し、かつ再生されたデータを液晶表示装置のような表示装置911に提示するよ うイネーブルする。音声メッセージが読まれるべき場合は、ユーザは読まれるべ きメッセージを選択しかつ読出しスイッチを作動させ、これはマイクロコンピュ ータ906がデータをデュアルポートRAMから読み出し、かつ読み出したデー タをオーディオプロセッサ914に提示するようイネーブルし、前記オーディオ プロセッサ914は前記デジタル音声情報をアナログ音声信号に変換し、該アナ ログ音声信号はユーザへの 音声メッセージの提示のためにスピーカ916に結合される。マイクロコンピュ ータ906はまた周波数選択信号を発生することができ、該信号は周波数シンセ サイザ810に結合されて前に述べたように異なる周波数の選択を可能にする。 図10を参照すると、タイミング図が示されており図1の無線通信システム1 00によって使用される出(outbound)シグナリングにおけるFLEXTM コーディングフォーマットの特徴的構成を示しかつ本発明の好ましい実施形態 に係わる制御フレーム330の詳細を含んでいる。制御フレームはまたデジタル フレームとして分類される。このシグナリングプロトコルはプロトコル分割部分 (divisions)に再分され、該プロトコル分割部分は時間310、サイ クル320、フレーム330,430、ブロック340、およびワード350で ある。15(fifteen)までの4分の独自に識別されるサイクルが各々の 時間310に送信される。通常、各時間ごとに15すべてのサイクル320が送 信される。128(one hundred twenty eight)まで のデジタルフレーム330およびアナログフレーム430を含む1.875秒の 独自に識別されるフレームが前記サイクル320の各々において送信される。通 常、128すべてのフレームが送信される。115(one hundred fifteen)ミリセカンド続く1つの同期およびフレーム情報信号331お よび11個の160(one hundred sixty)ミリセカンドの独 自に識別されるブロック340が制御フレーム330の各々において送信される 。毎秒3200ビット(bps)または6400bpsのビットレートが各々の 制御フレーム330 の間に好適に使用される。各々の制御フレーム330の間のビットレートは同期 信号331の間に選択呼出し無線機106に通信される。ビットレートが320 0bpsである場合、図10に示されるように16の独自に識別される32ビッ トのワードが各ブロック340に含まれる。ビットレートが6400bpsであ る場合、32の独自に識別される32ビットのワードが各ブロック340に含ま れる(図示せず)。各々のワードにおいて、当業者によく知られた方法で、少な くとも11ビットがエラー検出および訂正のために使用され、かつ21ビットま たはそれ以下が情報のために使用される。各ブロック340におけるビットおよ びワード350は当業者によく知られた技術を使用してインタリーブ様式で送信 されてプロトコルのエラー訂正能力を改善する。 情報は情報フィールドにおける各々の制御フレーム330に含まれ、ブロック 情報フィールド(BI)332におけるフレーム構造情報、アドレスフィールド (AF)333における1つまたはそれ以上の選択呼出しアドレス、およびベク トルフィールド(VF)334における1つまたはそれ以上のベクトルを備えて いる。ベクトルフィールド334はベクトル境界337で開始する。ベクトルフ ィールド334の各ベクトルはアドレスフィールド333のアドレスの1つに対 応する。情報フィールド332,333,334の境界はブロック情報フィール ド332によって規 定される。情報フィールド332,333,334は、同期およびフレーム情報 フィールド331に含まれるシステム情報の形式、およびアドレスフィールド3 33に含まれるアドレスの数、およびベクトルフィールド334に含まれるベク トルの数および形式のような、要因に依存して、変わり得る。 図11を参照すると、タイミング図が示されておりこれは図1の無線通信シス テムによって使用される出シグナリングプロトコルの送信フォーマットの特徴的 構造を示しかつ、本発明の好ましい実施形態に従って、音声フレーム430の詳 細を含んでいる。音声フレームはまたここではアナログフレームとして分類され る。プロトコル分割部分の時間310、320およびフレーム330,430の 持続時間は図10における制御フレームに関して述べたものと同じである。各々 のアナログフレーム430はヘッダ部分435およびアナログ部分440を有す る。同期およびフレーム情報信号331の情報は制御フレーム330における同 期信号331と同じである。前に説明したように、ヘッダ部分435は周波数変 調されかつフレーム430のアナログ部分440は振幅変調される。ヘッダ部分 435とアナログ部分440の間に遷移部分444が存在する。本発明の好まし い実施形態によれば、前記遷移部分は3つまでのサブチャネル441,442, 443に対する振幅変調されたパイロットサブキャリアを含む。前記アナログ部 分440は3つのサブチャネル441,442,443を含みこれらは同時に送 信され、かつ各々のサブチャネルは上部サイドバンド信号401および下部サイ ドバンド信号402(あるいは、同相および直角位相信号)を含む。図11に示 される例では、上部サイドバンド信号401は1つのメッセージ断片またはメッ セージフラグメント(message fragment)415を含み、これ は第1のアナログメッセージの第1のフラグメントである。下部サイドバンド4 02には4つの品質評価信号420,422,424,426、4つのメッセー ジセグメント410,412,416,418、および1つのセグメント414 (この例では未使用)が含まれる。2つのセグメント410,412は前記第1 のアナログメッセージの第2のフラグメントのセグメントである。2つのセグメ ント416,418は第2のアナログメッセージの第1のフラグメントのセグメ ントである。第1および第2のアナログメッセージは圧縮された音声信号であり これは320のサイクル2の430のフレーム1の第1のサブチャネル441に 含めるためにフラグメント化されている。第1のメッセージの第2のフラグメン トおよび第2のメッセージの第1のフラグメントは各々分割されて品質評価信号 420,426を含み、これは3つのサブチャネル441,442,443の各 々の下部サイドバンド402における所定の位置で反復される。アナログフレー ムに含まれるメッセージの 最も小さなセグメントは音声インクリメントまたは音声増分(voice in crement)450として規定され、そのうち88がアナログフレーム43 0の各々のアナログ部分440において独自的に識別される。前記品質評価信号 は好ましくは非変調サブキャリアパイロット信号として送信され、好ましくは持 続期間において1つの音声増分であり、かつ好ましくは1つのフレームのアナロ グ部分内で420ミリセカンドより長くない間隔を有する。2つの品質評価信号 の間で1つより多くのメッセージフラグメントが生じることができ、かつメッセ ージフラグメントは典型的には音声増分の可変全体長さを有することが理解され るであろう。 図12を参照すると、本発明の好ましい実施形態に係わる、図1の無線通信シ ステムによって使用される制御フレーム330および出シグナリングプロトコル の2つのアナログフレームのタイミング図が示されている。図12のタイミング 図は制御フレーム330であるフレームゼロ(図10)の例を示している。4つ のアドレス510,511,512,513および4つのベクトル520,52 1,522,523が示されている。2つのアドレス510,511は1つの選 択呼出し無線機106のアドレスを含み、一方他の2つのアドレス512,51 3は第2および第3の選択呼出し無線機106のためのものである。各々のアド レス510,511,512,513は関連するベクト ルのプロトコル位置(即ち、どこでベクトルがスタートしかつそれがどれだけ長 いか)を示すポインタを各々のアドレス内に含めることによってベクトル520 ,521,522および523の1つと独自的に関連している。 図12に示される例では、ベクトル520,521,522,523はまたサ ブチャネルの1つにおけるメッセージ部分と独自的に関連している。特に、ベク トル520はサブチャネル441の上部サイドバンドを指示することができ(図 11を参照)かつベクトル522はサブチャネル441の下部サイドバンドを指 示することができる。同様に、ベクトル521はサブチャネル442の両方のサ イドバンドを指示することができる。即ち、サブチャネル441の場合は、前記 例は2つの異なるメッセージ部分が上部および下部サイドバンドによって伝達さ れることを示すことができる。サブチャネル442の場合は、1つのメッセージ 部分の2つのハーフがそれぞれ上部および下部サイドバンドによって伝達される 。従って、前記ベクトルは好ましくはどのサブチャネル(即ち、どの無線周波数 )を受信機がメッセージのために探すべきかを示す情報、かつまた2つの別個の メッセージが前記サブチャネルから復元されるべきか否か、あるいは単一のメッ セージの第1および第2のハーフが復元されるべきかを示す情報を含む。 2つの異なるメッセージが同時にそれぞれ上部および下部サイドバンド(また は、IおよびQチャネル)によって 送信される実施形態に対する1つの用途は1つのメッセージが直接的な音声ペー ジングメッセージであり、かつ他方がページャに格納されるべき音声メールボッ クスのメッセージである場合である。 本発明の好ましい実施形態によれば、前記ベクトル位置はベクトルがスタート するベクトル境界335の後のワード350の数およびワードにおけるベクトル の長さを識別することによって提供される。アドレスおよびベクトルの相対的な 位置は互いに独立であることが理解されるであろう。該関係は矢印で示されてい る。各ベクトル520,521,522,523は関連するベクトルのプロトコ ル位置(即ち、どこでフラグメントがスタートしかつそれがどれ程長いか)を示 すポインタを各々のベクトル内に含めることによってメッセージフラグメント5 50,551,552,553に独自に関連している。本発明の好ましい実施形 態によれば、前記メッセージフラグメントの位置はフレーム430の数(1から 127まで)、サブチャネル441,442,443の数(1から3まで)、サ イドバンド401,402(またはIまたはQ)およびメッセージフラグメント がスタートする音声増分450、そして音声増分450に関するメッセージフラ グメントの長さを識別することによって提供される。例えば、522のベクトル 3は552のメッセージ2、フラグメント1を示す情報を含み、これは選択呼出 しアドレス512を有する選択呼出 し送受信機106に向けられており、560のフレーム1の音声増分46 45 0(図12には音声増分450は示されていない)でスタートして配置されてお り、そして523のベクトル13は553のメッセージ9フラグメント1を示す 情報を含み、これは選択呼出しアドレス513を有する選択呼出し送受信機10 6に向けられており、561のフレーム5の音声増分ゼロ 450(音声増分4 50は図12には示されていない)でスタートするよう配置されている。 本発明の好ましい実施形態に従って音声信号が説明されているが、モデム信号 またはデュアルトーン多周波(DTMF)信号のような、他のアナログ信号もこ れに変えて本発明により適応できることが理解されるであろう。また、前に説明 したフレーム構造において使用されるブロック情報は通信システムにおけるより 大きな総合スループットを可能にしかつ付加的な特徴を可能にするさらなる強化 を達成するために使用できることも理解されるべきである。例えば、携帯用音声 ユニットに送信されるメッセージはシステムに送り戻されるアクノレッジメント 信号がメッセージを受信していた送信機を識別する情報を含むことを要求するこ とができる。従って、サイマルカストシステムにおける周波数の再使用がこのよ うにしてメッセージを、携帯用音声ユニットに到達するために要求される1つの 送信機を使用して、与えられた携帯用音声ユニットに送信すること により達成できる。さらに、いったんシステムが携帯用音声ユニットのロケーシ ョンを知ると、ターゲットのメッセージングを行うことは論理的に続くことにな る。 本発明の別の態様では、前にWSOLAとして説明した時間スケーリング技術 は本発明と共に使用された場合に幾つかの現存する不利益を有する。従って、話 者依存となるようWSOLAを修正する技術が開発されかつ適切に“WSOLA −SD”と名付けられた。本発明におけるWSOLAの修正をさらに理解するた め、WSOLAの簡単な説明を行う。 波形類似性をベースとした重複加算(Waveform similarit y based Overlap−Add)技術(WSOLA)と称される技術 は他の技術と比較して高品質の時間スケール変更を達成することができかつまた 他の方法よりもずっと簡単である。音声をスピードアップしまたはスローダウン するために使用された時、音声の品質はWSOLA技術によっても非常に良好な ものとはならない。再生された音声は背景にエコー、金属音および反響音のよう な数多くの人工物を含む。本発明のこの態様はこの問題を克服しかつ存在する人 工物を最も少なくするための幾つかの強化について述べている。WSOLAアル ゴリズムにおける数多くのパラメータは与えられた話者および必要とされる圧縮 /伸長または時間スケーリング係数に対して可能な最もよい品質を達成するため に最適化 されなければならない。本発明のこの態様はこれらのパラメータを決定すること およびそれらを再生された通話または音声信号の品質の改善と共に音声信号の圧 縮/伸長または時間スケーリングにおいてどのように導入するかを取り扱う。 WSOLAアルゴリズムにおいて、x(n)が変更されるべき入力音声信号であ り、y(n)が時間スケールを変更された信号であり、かつαが時間スケーリン グパラメータであるとする。もしαが1より小さければ、音声信号は時間的に伸 長される。もしαが1より大きければ、音声信号は時間的に圧縮される。 図13〜図17を参照すると、WSOLA時間スケーリング(圧縮)方法の幾 つかの反復(iterations)に対するタイミング図が本発明のWSOL A−SDの好ましい方法との比較のために示されている。入力音声は適切にデジ タル化されかつ記憶されているものと仮定すると、図13は非圧縮音声入力信号 に対するWSOLA方法の第1の反復を示している。WSOLA方法は時間スケ ール係数α(この例ではこれは2に等しいと仮定し、もしα>1であれば圧縮と なりかつα<1あれば伸長となる)、および入力音声特性に独立でありかつ特に ピッチに独立である任意の分析セグメントサイズ(Ss)を必要とする。オーバ ラップセグメントサイズSoは0.5*Ssとして計算されかつWSOLAにお いて固定される。最初のSsサンプルは図14に示されるように直接出力にコピ ーされる。 出力における最後のサンプルの指数またはインデクス(index)がIf1るも のとする。オーバラップインデクスO1前記出力における最後に得られるサンプ ルの終わりからSs/2サンプルとして決定される。今やオーバラップ加算され るサンプルはO1およびIf1の間である。サーチインデクス(S1)はα*O1と して決定される。入力信号の初期部分が出力にコピーされた後、入力からのサン プルの移動ウィンドウの決定が行われる。該ウィンドウはサーチインデクスS1 周りに決定される。前記ウィンドウの初めがSi−Loffsetであるものとしかつ 終わりがSi+Hoffsetであるものとする。最初の反復では、i=1である。ウ ィンドウ内で以下に示される正規化された相互相関方程式を使用して最善の相関 Soサンプルが決定される。 【数1】 前記正規化されたR(k)が最大になる遅れ(lag)k=mが決定される。 最善のインデクスBiはSi+mで与えられる。平均振幅差関数(Average Magnitude Difference Function:::AMD F)のような他の機構および他の相関関数も最善の整合する波形を検出するため に使用することができる。B1で始まるSoサンプルは次に増大するランプ関数( increasing ramp function)によって乗算され(もち ろん他の重み付け関数も使用できる)かつ出力における最後のSoサンプルに加 算される。加算の前に、出力におけるSoサンプルは低減する(decreas ing)ランプ関数によって乗算される。加算の結果得られたサンプルは入力に おける最後のSoサンプルを置き換えることになる。最後に前の最善の整合する Soサンプルのすぐ後に続く次のSoサンプルが次に次の反復において使用するた めに出力の終わりにコピーされる。これはWSOLAにおける最初の反復の終わ りになる。 次の反復のために図15および図16を参照すると、O1と同様に新しいオー バラップインデクスO2を計算する 必要がある。同様に、新しいサーチインデクスS2および対応するサーチウィン ドウが前の反復において行われたように決定される。再び、サーチウィンドウ内 で、最善の相関Soサンプルが前に述べた相互相関方程式を使用して決定され、 この場合決定される最善のサンプルの初めはB2である。B2で始まるSoサンプ ルは次に増大するランプ関数によって乗算されかつ出力における最後のSoサン プルに加算される。加算に先立ち、出力におけるSoサンプルは低減するランプ 関数により乗算される。加算の結果得られるサンプルは入力における最後のSo サンプルを置き換える。最後に、前の最善の整合するSoサンプルのすぐ後に続 く次のSoサンプルが次に次の反復において使用するために出力の終わりにコピ ーされ、この場合将来のi番目の反復はオーバラップインデクスOi、サーチイ ンデクスSi、出力における最後のサンプルIfi、および最善のインデクスBiを 有することになる。 図17は、図13〜図16を参照して前に述べた2つの反復からの結果として 得られる出力を示す。2つの反復の間に結果として得られた出力信号に重複がな いことに注目すべきである。もし前記方法が同様の様式で継続されれば、WSO LA方法は音声信号全体を時間スケール(圧縮)するが、各々の反復の結果の間 に決して重複がないことになる。WSOLA時間スケール伸長は同様の様式で行 われる。 本発明の好ましい方法(WSOLA−SD)に対して、 WSOLAの幾つかの欠点または不都合が明らかになる。これらの欠点は図18 〜図23において示されるWSOLA−SD方法の次の例を見る場合に考慮すべ きである。WSOLAの主たる欠点は時間スケールされた音声の最適の品質を得 ることができないことであり、それはピッチ特性に係わりなくすべての入力音声 に対し固定された分析セグメントサイズ(Ss)が使用されるためである。例え ば、もしSsが入力音声信号に対して大きすぎる場合は、伸長によって結果とし て得られる音声はエコーおよび反響を含むであろう。さらに、もしSsが入力音 声信号に対して小さすぎれば、伸長に応じて得られる音声は荒い(raspy) 響きのものとなるであろう。 WSOLAの第2の重要な欠点は圧縮率(α)が2より大きい場合に生じる。 そのような場合、反復の間の移動ウィンドウの間隔は該方法が重要な入力音声成 分をスキップするようにさせ、それによって結果として得られる出力音声の了解 性(intelligibility)に重大な影響を与える。反復の間の重複 しないサーチウィンドウを補償するために移動ウィンドウのサイズを増大するこ とは相互相関関数の結果として幾らかの入力音声をさらにスキップさせることに なりかつさらに得られる出力音声に顕著に影響を与える可変時間スケーリングを 生じさせる。 WSOLA方法の第3の欠点は設計者またはユーザに音声の品質およびある制 約を有する与えられたシステムに対 する計算の複雑さに関して(与えられた時間スケーリング係数(α)に対して) 柔軟性を提供しないことである。これはオーバラップ(f)の程度がWSOLA 方法においては0.5に固定されているために特に明らかである。従って、高品 質の音声再生を必要とする用途では、適切な処理能力とメモリとを想定すると、 本発明のWSOLA−SD方法は余分の計算機的な複雑さの費用を払ってより高 い程度のオーバラップを使用することができより高品質の音声再生を提供するこ とができる。これに対し、処理能力、メモリまたは他の制約によって制限されて いる用途では、すぐに使える特定の用途の制約を考慮して、音声の品質が希望す る程度まで犠牲になるようにオーバラップの程度をWSOLA−SDにおいて低 下させることができる。 図25は、WSOLA−SD方法の総合的なブロック図を示す。このブロック 図において、Ss,fおよびαは音声を圧縮するかあるいは伸長するかに応じて 計算される。このWSOLA−SDアルゴリズムはWSOLAのみよりも再生さ れる音声の品質において大きな改善を提供する。WSOLA−SD方法は話者に 依存し、特に特定の話者のピッチに依存する。従って、ピッチ決定12は分析セ グメントサイズが決定された後に行われる(14)。与えられたfおよびα(こ れらはピッチ決定12に応じて変更することができ、変更されたαを提供する( 16))に対して、WSOLA−SDは音声を時間スケーリングする(18)。 時間スケーリングは入力信号の伸長または圧縮のいずれかとすることができる。 あるいは、周波数スケーリングされた信号をもしα>1であればαの係数により 時間スケーリングされた信号を補間することによって、あるいはもしα<1であ れば1/αの係数により時間スケーリングされた信号をデシメイトすることによ って得ることができる。デシメイションの場合には、デシメイトされる信号のサ ンプリング周波数は少なくとも該信号の最上位(most significa nt)周波数成分の少なくとも2/α倍とすべきである。(α=0.5でありか つ最上位周波数が4000ヘルツである場合は、前記サンプリングレートは好ま しくは少なくとも16,000ヘルツであろう。)補間およびデシメイションは デジタル信号処理においてよく知られた技術であり、オッペンハイムおよびシェ ファ(Oppenheim & Sahaefer)による「離散的時間信号処 理(Discrete Time Signal Processing)」に 記載されている。例えば、2秒に値する入力音声が8kHzでサンプルされるも のと仮定し、この場合信号が0および4000ヘルツの間の有意の(signi ticant)周波数成分を有するものとする。該入力音声信号が2の係数で時 間スケール圧縮されるものと仮定する。結果として得られる信号は1秒の長さを 有するが、それでも0および4000ヘルツの間の有意の周波数成分を有する。 該信号はα=2の係数で補 間される(前記オッペンハイムおよびシェファを参照)。これは結果として2秒 の長さの信号を生じるが、0および2000ヘルツの間の周波数成分を有してい る。時間スケール領域への戻りが周波数圧縮された信号をα=2の係数でデシメ イトすることにより達成でき情報内容の喪失なしに元の時間スケーリングされた 音声(0〜4000ヘルツの間の周波数成分)が得られる。 図18〜図22を参照すると、本発明に従ってWSOLA−SD時間スケーリ ング(圧縮)方法の幾つかの反復のタイミング図が示されている。入力音声信号 は適切にデジタル化されかつ記憶されているものとし、図18は非圧縮音声入力 信号に対するWSOLA−SD方法の最初の反復を示す。WSOLA−SD方法 はまた入力音声信号の有声音(voiced)部分の近似的なピッチ期間の決定 を必要とする。ピッチ決定およびどのようにしてセグメントサイズがそこから得 られるかの簡単な説明を次に行う。 1)入力音声を20msのブロックにフレーム化する。 2)各ブロックのエネルギを計算する。 3)ブロックごとの平均エネルギを計算する。 4)ブロックごとの平均エネルギの関数として有声音を検出するためのエネル ギしきい値を決定する。 5)前記エネルギしきい値を使用して少なくとも5ブロックの長さの有声音の 隣接または連続する(conti guous)ブロックを決定する。 6)ステップ5において検出された連続する有声音の各ブロックに対してピッ チ分析を行う。これは修正された自己相関方法、AMDFまたはクリップされた 自己相関方法(Clipped auto correlation meth od)を含む種々の方法を使用して行うことができる。 7)前記ピッチの値がメジアンフィルタ(median filter)を使 用して平滑化され推定におけるエラーを除去する。 8)すべての平滑化されたピッチの値を平均して話者のピッチの適切な推定ま たは評価を得る。 9)従って、セグメントサイズSsの計算は次のようになる。 もしピッチPが60サンプルより大きければ、Ss=2*ピッチ もしビッチPが40および60サンプルの間であれば、Ss=120 もしPが40サンプルより小さければ、Ss=100 上のすべての場合に8kHzのサンプリングレートが想定されている。 WSOLA−SDにWSOLAの説明で上に述べた欠点 のいくつかを克服する利点を与える重要な要因はオーバラップまたは重複fの程 度である。もしWSOLA−SDにおける重複fの程度が0.5より大きければ 、これはより複雑であることを犠牲にしてより高い品質を提供する。もしWSO LA−SDの重複fの程度が0.5より小さければ、これは品質を犠牲にしてア ルゴリズムの複雑さを低減する。したがって、ユーザは彼らの特定のアプリケー ションの設計および使用においてより大きな柔軟性および制御を持つことができ る。 再び図18〜図23を参照すると、前記WSOLA−SD方法はαの時間スケ ール係数(これはこの例では2に等しいと想定しており、もしα>1であれば圧 縮となり、かつもしα<1であれば伸長となる)および入力音声の特性、すなわ ち話者のピッチ、に対して最適化される分析セグメントサイズ(Ss)を必要と する。重複セグメントサイズSoはf*Ssとして計算され、かつある与えられ たピッチ期間およびfに対してWSOLA−SDにおいては固定される。示され た例では、fは0.5より大きく、より高い品質の出力音声を示している。最初 のSsサンプルは直接出力にコピーされる。最後のサンプルのインデクスまたは 指数がIf1であるとする。重複指数O1は出力において最後に得られるサンプル の終りからSoサンプルとして決定される。今や重複加算されるサンプルは図1 9に示されるようにO1とIf1の間である。最初のサーチインデ クスまたはサーチ指数(S1)は図18に見られるようにα*O1として決定され る。入力信号の初期部分または始めの部分が出力にコピーされた後、入力音声信 号からのサンプルの移動ウィンドウ(moving window)のロケーシ ョンに関して決定が行なわれる。該ウィンドウはサーチインデクスS1の回りで あるいは付近で決定される。ウィンドウ内で、最善の相関Soサンプルが前に説 明した相互相関方程式を使用して決定され、この場合決定される最善のサンプル の始めはB1である。B1で始まるSoサンプルは次に増大するランプ関数(もち ろん、他の重み関数も使用できる)によって乗算されかつ出力における最後のS oサンプルに加えられる。加算の前に、出力におけるSoサンプルは低減するラ ンプ関数により乗算される。加算の結果得られるサンプルは入力における最後の Soサンプルを置き換えることになる。最後に、前の最善の整合するSoサンプ ルの直後に続く次のSs−Soサンプルが次に次の反復において使用するために 出力の終りにコピーされる。これはWSOLA−SDにおける最初の反復の終り である。 次の反復のために図20および図21を参照すると、O1と同様に新しい重複 指数O2を計算する必要がある。同様に、新しいサーチ指数S2および対応するサ ーチウィンドウが前の反復において行なわれたように決定される。再び、サーチ ウィンドウ内で、最善の相関Soサンプルが前 に説明した相互相関方程式を使用して決定され、この場合決定される最善のサン プルの始めはB2である。B2で始まるSoサンプルは次に増大するランプ関数に よって乗算されかつ出力における最後のSoサンプルに加算される。加算の前に 、出力におけるSoサンプルは低減するランプ関数によって乗算される。加算の 結果得られたサンプルは入力における最後のSoサンプルを置き換えることにな る。最後に、前の最善の整合するSoサンプルの直後に続く次のSs−Soサン プルが次に次の反復において使用するために出力の終りにコピーされる。 図22は、WSOLA−SD方法を使用した2つの反復からの結果として得ら れる出力信号を示す。結果として得られる出力信号における重複の領域(Ss− So)があり、これは増大した了解性を保証しかつ本方法が前記WSOLA方法 と比較して重要な入力音声成分をスキップすることを防止する。 図23および図24を参照すると、本発明にしたがってWSOLA−SD方法 を使用する時間スケール伸長のためのi番目の反復の例示的な入力タイミング図 および出力タイミング図が示されている。伸長のための本方法はOi、重複指数 、がSi、サーチ指数、よりも速く移動することを除き、本質的に図18〜図2 2に示された例と同様に機能する。より正確には、Oiは伸長の間にSiよりもα 倍高速で移動する。分析セグメントサイズSsは入力音声の ピッチ期間に依存する。重複の程度は0から1におよぶことができるが、図23 および図24のこの例では0.7が使用されている。この場合における、時間ス ケーリング係数αは伸長率(expansion rate)の逆数である。伸 長率が2であると仮定すると、時間スケーリング係数α=0.5である。重複セ グメントサイズSoはf*Ssに等しく、または重複の程度×分析セグメントサ イズである。したがって、重複加算のいくつかの反復および各々の最善の整合す る入力セグメントに対する増大するランプ関数を使用しかつ各々の出力重複セグ メントに対し低減するランプ関数を、加算の前に、使用した後、入力音声信号は 前に述べたようなWSOLA−SDの全ての利点を維持する出力音声信号として 伸長される。 WSOLA−SDアルゴリズムにおけるセグメントサイズSsをその瞬間にお けるセグメントのピッチによって動的に適応させることによりさらなる改善が得 られる。これは前に説明した機構の変更によって行なわれる。もし無声音に対し てSs=100(サンプリングレート8KHzが想定されている)の短いセグメ ントサイズを使用すればそれらの品質は改善されかつ有声音に対してはセグメン トサイズはSs=2*ピッチとなるであろう。また、音声セグメントが有声音で あるか無声音であるかを決定するために少しの変更が必要である。これらの変更 を備えた方法は以下の通りである。 1)入力音声を20msのブロックにフレーム化する。 2)各ブロックにおけるエネルギを計算する。 3)各ブロックにおけるゼロクロスの数を計算する。 4)ブロックごとの平均エネルギを計算する。 5)ブロックごとの平均エネルギの関数として有声音を検出するためのエネル ギしきい値を決定する。 6)前記エネルギしきい値およびゼロクロスしきい値を使用して少なくとも5 ブロックの長さの有声音の連続するブロックを決定する。 7)全ての有声音セグメントに対してピッチ分析を行ないかつこれらの有声音 セグメントの各々における平均ピッチを決定する。これは修正された自己相関方 法、AMDFまたはクリップド自己相関(Clipped autocorre lation)方法を含む種々の方法を使用して行なうことができる。 8)有声音としてマーク付けられていないセグメントを今や仮の(tenta tive)無声音セグメントとしてマーク付ける。 9)前記「仮の無声音セグメント」における少なくとも5つのフレームの連続 するブロックがとられかつピッチ分析が行なわれる。最大対最小相関係数の比率 が決定される。もし該比率が大きければ、前記セグメントは無声音として分類さ れ、かつもしそれが小さければこれらのセグメント は有声音としてマーク付けられ、かつこれらのセグメントの平均ピッチが音声セ グメントの始めおよび終りと共に決定される。 10)これらの分類された音声セグメントの各々に対するセグメントサイズS sが次のように決定される。 もし有声音であれば、Ss=2*ピッチ もし無声音であれば、Ss=100(8KHzのサンプリングレートが想定さ れる) 11)今や、時間スケーリングのWSOLA−SD方法が行なわれたが、可変 セグメントサイズによる。ここでは、各々の瞬間における処理において使用され る入力音声セグメントの位置が決定される。その位置に応じて、すでに決定され たセグメントサイズSsが処理において使用される。この技術を使用することは より高い品質の時間スケーリングされた音声信号を生じる結果となる。 もしWSOLA−SDが本通信システムの場合におけるように同じ音声入力信 号に対して圧縮および次にその後の伸長の双方を行なうために使用されれば、い くつかの技術を使用してある与えられた平均の時間スケール係数に対して再生さ れた音声信号の品質はさらに改善できる。 知覚テストから、より高い基本周波数(より低いピッチ 期間)を有する音声信号はより低い基本周波数(より高いピッチ期間)を有する 音声信号と比較してある与えられた音声品質に対しより多く圧縮できることがわ かる。例えば、子供および女性の話者は平均してより高い基本周波数を有する。 したがって、彼らの音声は彼らの音声の品質に顕著に影響を与えることなく10 %より多く圧縮/伸長することができる。これに対し、平均してより低い基本周 波数を備えた音声を有する男性の話者は10%より少ない量だけ彼らの音声圧縮 /伸長を行なうことができる。したがって、より高いおよびより低い基本周波数 を有するほぼ等しい数の話者を有する典型的な通信システムでは、音声の再生に おける総合的な改善品質は前と同じ圧縮/伸長(時間スケーリング)係数によっ て得られる。 この技術を使用する伸長および圧縮の他の特性がさらなる向上につながる。例 えば、音声における大部分の人工物は音声信号の時間スケール伸長の間に生成さ れることが注目された。音声信号がより多く伸長されればされるほど人工物がよ り多くなる。また、もし音声信号が元の音声よりやや速く(10%より少なく) 再生されれば、速度の変化はほとんど目立たず、しかしながら人工物の顕著な低 減がある。この特性はより小さな伸長係数を備えた音声信号を伸長しかつ人工物 を低減しかつその品質を改善することを助ける。例えば、もし入力音声が3の時 間スケール係数で圧縮されれば、伸長の間にそれは2.7の係数によって伸 長され、これは音声が10%だけ速く再生されることを意味する。音声速度のこ の変化は顕著なものではなくかつ人工物を低減するから、音声の精度が絶対に重 要なものではない用途において本発明の方法を実施することができる。
───────────────────────────────────────────────────── フロントページの続き (72)発明者 シュウェンデマン・ロバート ジョン アメリカ合衆国フロリダ州 33060、ポン パノ・ビーチ、サウスイースト・テンス・ アベニュー 590 (72)発明者 シウィアク・カジミーア アメリカ合衆国フロリダ州 33071、コー ラル・スプリングス、ノースウエスト・フ ォーティーンス・ストリート 10988 (72)発明者 クズニッキ・ウィリアム ジョセフ アメリカ合衆国フロリダ州 33065、コー ラル・スプリングス、ノースウエスト・ワ ンハンドレッドス・アベニュー 3681

Claims (1)

  1. 【特許請求の範囲】 1.少なくとも1つの送信ベースステーションおよび複数の選択呼出し受信機 を有する音声圧縮を使用した通信システムであって、 前記少なくとも1つの送信ベースステーションにおいて、 オーディオ信号を受信するための入力装置、 オーディオ信号を圧縮して圧縮されたオーディオ信号を生成しかつ前記圧縮さ れたオーディオ信号を直角位相振幅変調を使用して変調して処理された信号を提 供するための処理装置であって、 該処理装置は以下のステップ、 a)前記オーディオ信号の一部を分析して一連のピッチ期間を決定するス テップ、 b)前記一連のピッチ期間から推定されたピッチの値を計算するステップ 、 c)前記推定されたピッチの値に応じてセグメントサイズを決定するステ ップ、そして d)前記決定されたセグメントサイズに応じて前記オーディオ信号を時間 スケール圧縮するステップ、 にしたがって前記オーディオ信号を圧縮するもの、そして 前記処理された信号を送信するための直角位相振幅変調送信機、 を具備し、そして 前記複数の選択呼出し受信機の各々において、 送信される前記処理された信号を受信するための選択呼出し受信機、 直角位相振幅復調技術を使用して受信された前記処理された信号を復調しかつ 復調された前記処理された信号を時間スケール伸長して再構成された信号を提供 するための処理装置、そして 前記再構成された信号を再構成されたオーディオ信号へと増幅するための増幅 器、 を具備する、前記通信システム。 2.前記直角位相振幅変調は単側波帯変調である、請求項1に記載の通信シス テム。 3.前記直角位相振幅変調は同相(I)および直角位相(Q)変調である、請 求項1に記載の通信システム。 4.前記通信システムは複数の送信ベースステーションを含み、かつ前記処理 された信号は前記複数の選択呼出し受信機の少なくとも1つからアクノレッジメ ント信号の形式で前記通信システムが将来のメッセージを前記複数の送信ベース ステーションを介して前記複数の選択呼出し受信機の内の少なくとも1つに向け ることができるようにする情報を要求する制御信号を含む、請求項1に記載の通 信システム。 5.前記システムはさらに、 前記少なくとも1つの送信ベースステーションにおいて、 チャネル逸脱の結果として生じるひずみに対する振幅および位相の基準として 作用するパイロットキャリア信号発生器、 を具備し、 前記選択呼出し受信機において、 前記パイロットキャリア信号発生器によって発生された振幅および位相基準を 検出し、ろ波しかつ応答するための受信機回路、 を具備する、請求項1に記載の通信システム。 6.圧縮された音声信号を受信するための選択呼出し受信機であって、 送信される処理された信号を受信するための選択呼出し受信機であって、前記 処理された信号は以下のステップ、 a)入力音声信号の一部を分析して一連のピッチ期間を決定するステップ 、 b)前記一連のピッチ期間から推定されたピッチの値を計算するステップ 、 c)前記推定されたピッチの値に応じてセグメントサイズを決定するステ ップ、そして d)前記決定されたセグメントサイズに応じて入力音声信号を時間スケー ル伸長するステップ、 にしたがって処理されるもの、 単側波帯復調技術および時間スケール伸長技術を使用して受信される処理され た信号を復調し再構成された信号を 提供するための処理装置、そして 前記再構成された信号を再構成されたオーディオ信号へと増幅するための増幅 器、 を具備する、圧縮された音声信号を受信する選択呼出し受信機。 7.前記選択呼出し受信機はさらに、 ベースステーションの送信機におけるパイロットキャリア信号発生器によって 発生された振幅および位相基準を検出し、ろ波しかつ応答するための受信機回路 、 を具備する、請求項6に記載の選択呼出し受信機。 8.所定の帯域幅を有する通信資源によって選択呼出し信号を送信するための 選択呼出しページングベースステーションであって、 複数のオーディオ信号を受信するための入力装置、 前記通信資源を所定の数のサブチャネルへとサブチャネル化するための手段、 前記所定の数のサブチャネルの内の各サブチャネルに対して、それぞれのオー ディオ信号の振幅を圧縮しかつそれぞれのオーディオ信号をろ波するための振幅 圧縮およびろ波モジュール、 前記所定の数のサブチャネルの各々に対しそれぞれのオーディオ信号の圧縮を 与える時間スケール圧縮モジュールであって、 該時間スケール圧縮モジュールは以下のステップ、 a)入力音声信号の一部を分析して一連のピッチ期間を決定するステップ 、 b)前記一連のピッチ期間から推定されたピッチの値を計算するステップ 、 c)前記推定されたピッチの値に応じてセグメントサイズを決定するステ ップ、そして d)前記決定されたセグメントサイズに応じて入力音声信号を時間スケー ル圧縮するステップ、 にしたがって処理された信号を発生するよう動作するもの、そして 前記処理された信号を送信するための直角位相振幅変調送信機、 を具備する、選択呼出しページングベースステーション。 9.複数のオーディオ信号を受信するための前記入力装置は電話メッセージま たはコンピュータ装置からのデータメッセージを受信するためのページングター ミナルを備えている、請求項8に記載の選択呼出しページングベースステーショ ン。 10.前記振幅圧縮およびろ波モジュールは自動利得制御装置に結合されたバ ンドパスフィルタに結合されたアナログ−デジタル変換器に結合されたアンチエ イリアスフィルタを具備する、請求項8に記載の選択呼出しページングベースス テーション。
JP8526247A 1995-02-28 1996-01-26 話者依存時間スケーリング技術を使用した通信システムおよび方法 Ceased JPH11501405A (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US08/395,739 US5920840A (en) 1995-02-28 1995-02-28 Communication system and method using a speaker dependent time-scaling technique
US08/395,739 1995-02-28
PCT/US1996/000838 WO1996027184A1 (en) 1995-02-28 1996-01-26 A communication system and method using a speaker dependent time-scaling technique

Publications (1)

Publication Number Publication Date
JPH11501405A true JPH11501405A (ja) 1999-02-02

Family

ID=23564298

Family Applications (1)

Application Number Title Priority Date Filing Date
JP8526247A Ceased JPH11501405A (ja) 1995-02-28 1996-01-26 話者依存時間スケーリング技術を使用した通信システムおよび方法

Country Status (9)

Country Link
US (1) US5920840A (ja)
EP (1) EP0870299A4 (ja)
JP (1) JPH11501405A (ja)
KR (1) KR100289359B1 (ja)
CN (1) CN1176702A (ja)
BR (1) BR9607731A (ja)
CA (1) CA2213699C (ja)
TW (1) TW347619B (ja)
WO (1) WO1996027184A1 (ja)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2004126595A (ja) * 2002-10-03 2004-04-22 Docomo Communications Laboratories Usa Inc 信号エネルギーに基づく非一様時間領域音声信号処理方法
WO2005011223A1 (ja) * 2003-07-25 2005-02-03 Matsushita Electric Industrial Co., Ltd. 変調装置、復調装置、変調方法および復調方法
US7505898B2 (en) 2002-07-24 2009-03-17 Applied Minds, Inc. Method and system for masking speech
JP2010015152A (ja) * 2008-07-03 2010-01-21 Thomson Licensing 入力信号の値のシーケンスのタイムスケーリングのための方法

Families Citing this family (78)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
AT403969B (de) * 1995-12-04 1998-07-27 Ericsson Schrack Aktiengesells Verfahren zur kompression eines analogen signals
US6584147B1 (en) * 1997-05-23 2003-06-24 Imec High speed modem for a communication network
JP3484980B2 (ja) * 1998-06-23 2004-01-06 日本電気株式会社 無線受信機
US6563868B1 (en) * 1998-07-17 2003-05-13 General Instruments Corporation Method and apparatus for adaptive equalization in the presence of large multipath echoes
EP1138038B1 (en) 1998-11-13 2005-06-22 Lernout & Hauspie Speech Products N.V. Speech synthesis using concatenation of speech waveforms
US6795807B1 (en) 1999-08-17 2004-09-21 David R. Baraff Method and means for creating prosody in speech regeneration for laryngectomees
US6782245B1 (en) * 1999-09-10 2004-08-24 Logitech Europe S.A. Wireless peripheral interface with universal serial bus port
AU2001291117A1 (en) * 2000-09-26 2002-04-08 Adc Telecommunications Inc. System for providing voice mail message summary
US7610205B2 (en) 2002-02-12 2009-10-27 Dolby Laboratories Licensing Corporation High quality time-scaling and pitch-scaling of audio signals
US7711123B2 (en) 2001-04-13 2010-05-04 Dolby Laboratories Licensing Corporation Segmenting audio signals into auditory events
US7283954B2 (en) 2001-04-13 2007-10-16 Dolby Laboratories Licensing Corporation Comparing audio using characterizations based on auditory events
US7461002B2 (en) 2001-04-13 2008-12-02 Dolby Laboratories Licensing Corporation Method for time aligning audio signals using characterizations based on auditory events
ATE353503T1 (de) * 2001-04-24 2007-02-15 Nokia Corp Verfahren zum ändern der grösse eines zitlerpuffers zur zeitausrichtung, kommunikationssystem, empfängerseite und transcoder
JP4180807B2 (ja) * 2001-04-27 2008-11-12 パイオニア株式会社 スピーカ検出装置
EP1386312B1 (en) 2001-05-10 2008-02-20 Dolby Laboratories Licensing Corporation Improving transient performance of low bit rate audio coding systems by reducing pre-noise
US7171367B2 (en) * 2001-12-05 2007-01-30 Ssi Corporation Digital audio with parameters for real-time time scaling
DE10160439A1 (de) * 2001-12-08 2003-06-26 Bosch Gmbh Robert Laserentfernungsmeßgerät
US8019598B2 (en) * 2002-11-15 2011-09-13 Texas Instruments Incorporated Phase locking method for frequency domain time scale modification based on a bark-scale spectral partition
US7467084B2 (en) * 2003-02-07 2008-12-16 Volkswagen Ag Device and method for operating a voice-enhancement system
DE10327057A1 (de) * 2003-06-16 2005-01-20 Siemens Ag Vorrichtung zum zeitlichen Stauchen oder Strecken, Verfahren und Folge von Abtastwerten
US8340972B2 (en) * 2003-06-27 2012-12-25 Motorola Mobility Llc Psychoacoustic method and system to impose a preferred talking rate through auditory feedback rate adjustment
US6999922B2 (en) * 2003-06-27 2006-02-14 Motorola, Inc. Synchronization and overlap method and system for single buffer speech compression and expansion
WO2005057550A1 (ja) * 2003-12-15 2005-06-23 Matsushita Electric Industrial Co., Ltd. 音声圧縮伸張装置
DE602005026778D1 (de) * 2004-01-16 2011-04-21 Scansoft Inc Corpus-gestützte sprachsynthese auf der basis von segmentrekombination
US7716046B2 (en) * 2004-10-26 2010-05-11 Qnx Software Systems (Wavemakers), Inc. Advanced periodic signal enhancement
US7949520B2 (en) * 2004-10-26 2011-05-24 QNX Software Sytems Co. Adaptive filter pitch extraction
US8543390B2 (en) * 2004-10-26 2013-09-24 Qnx Software Systems Limited Multi-channel periodic signal enhancement system
US8170879B2 (en) * 2004-10-26 2012-05-01 Qnx Software Systems Limited Periodic signal enhancement system
US8306821B2 (en) 2004-10-26 2012-11-06 Qnx Software Systems Limited Sub-band periodic signal enhancement system
KR100750115B1 (ko) * 2004-10-26 2007-08-21 삼성전자주식회사 오디오 신호 부호화 및 복호화 방법 및 그 장치
US7680652B2 (en) * 2004-10-26 2010-03-16 Qnx Software Systems (Wavemakers), Inc. Periodic signal enhancement system
US7610196B2 (en) * 2004-10-26 2009-10-27 Qnx Software Systems (Wavemakers), Inc. Periodic signal enhancement system
US20060149535A1 (en) * 2004-12-30 2006-07-06 Lg Electronics Inc. Method for controlling speed of audio signals
US7676362B2 (en) * 2004-12-31 2010-03-09 Motorola, Inc. Method and apparatus for enhancing loudness of a speech signal
US7602127B2 (en) 2005-04-18 2009-10-13 Mks Instruments, Inc. Phase and frequency control of a radio frequency generator from an external source
US8102954B2 (en) * 2005-04-26 2012-01-24 Mks Instruments, Inc. Frequency interference detection and correction
US8280730B2 (en) 2005-05-25 2012-10-02 Motorola Mobility Llc Method and apparatus of increasing speech intelligibility in noisy environments
US8155972B2 (en) * 2005-10-05 2012-04-10 Texas Instruments Incorporated Seamless audio speed change based on time scale modification
US8345890B2 (en) 2006-01-05 2013-01-01 Audience, Inc. System and method for utilizing inter-microphone level differences for speech enhancement
US8194880B2 (en) 2006-01-30 2012-06-05 Audience, Inc. System and method for utilizing omni-directional microphones for speech enhancement
US9185487B2 (en) * 2006-01-30 2015-11-10 Audience, Inc. System and method for providing noise suppression utilizing null processing noise subtraction
US8204252B1 (en) 2006-10-10 2012-06-19 Audience, Inc. System and method for providing close microphone adaptive array processing
US8744844B2 (en) 2007-07-06 2014-06-03 Audience, Inc. System and method for adaptive intelligent noise suppression
US20070276657A1 (en) * 2006-04-27 2007-11-29 Technologies Humanware Canada, Inc. Method for the time scaling of an audio signal
US8849231B1 (en) 2007-08-08 2014-09-30 Audience, Inc. System and method for adaptive power control
US8934641B2 (en) 2006-05-25 2015-01-13 Audience, Inc. Systems and methods for reconstructing decomposed audio signals
US8949120B1 (en) 2006-05-25 2015-02-03 Audience, Inc. Adaptive noise cancelation
US8150065B2 (en) * 2006-05-25 2012-04-03 Audience, Inc. System and method for processing an audio signal
US8204253B1 (en) 2008-06-30 2012-06-19 Audience, Inc. Self calibration of audio device
US8027377B2 (en) * 2006-08-14 2011-09-27 Intersil Americas Inc. Differential driver with common-mode voltage tracking and method
US20080075032A1 (en) * 2006-09-22 2008-03-27 Krishna Balachandran Method of resource allocation in a wireless communication system
US8259926B1 (en) 2007-02-23 2012-09-04 Audience, Inc. System and method for 2-channel and 3-channel acoustic echo cancellation
US20080231557A1 (en) * 2007-03-20 2008-09-25 Leadis Technology, Inc. Emission control in aged active matrix oled display using voltage ratio or current ratio
US8189766B1 (en) 2007-07-26 2012-05-29 Audience, Inc. System and method for blind subband acoustic echo cancellation postfiltering
US8321222B2 (en) * 2007-08-14 2012-11-27 Nuance Communications, Inc. Synthesis by generation and concatenation of multi-form segments
US8904400B2 (en) * 2007-09-11 2014-12-02 2236008 Ontario Inc. Processing system having a partitioning component for resource partitioning
US8850154B2 (en) 2007-09-11 2014-09-30 2236008 Ontario Inc. Processing system having memory partitioning
US8694310B2 (en) 2007-09-17 2014-04-08 Qnx Software Systems Limited Remote control server protocol system
US8143620B1 (en) 2007-12-21 2012-03-27 Audience, Inc. System and method for adaptive classification of audio sources
US8180064B1 (en) 2007-12-21 2012-05-15 Audience, Inc. System and method for providing voice equalization
US8209514B2 (en) * 2008-02-04 2012-06-26 Qnx Software Systems Limited Media processing system having resource partitioning
US8194882B2 (en) 2008-02-29 2012-06-05 Audience, Inc. System and method for providing single microphone noise suppression fallback
US8355511B2 (en) 2008-03-18 2013-01-15 Audience, Inc. System and method for envelope-based acoustic echo cancellation
US8521530B1 (en) 2008-06-30 2013-08-27 Audience, Inc. System and method for enhancing a monaural audio signal
US8774423B1 (en) 2008-06-30 2014-07-08 Audience, Inc. System and method for controlling adaptivity of signal modification using a phantom coefficient
US9008329B1 (en) 2010-01-26 2015-04-14 Audience, Inc. Noise reduction using multi-feature cluster tracker
KR20120080356A (ko) * 2011-01-07 2012-07-17 삼성전자주식회사 휴대 단말기 및 그 휴대 단말기에서 오디오 데이터 처리 방법
US9824695B2 (en) * 2012-06-18 2017-11-21 International Business Machines Corporation Enhancing comprehension in voice communications
US9640194B1 (en) 2012-10-04 2017-05-02 Knowles Electronics, Llc Noise suppression for speech processing based on machine-learning mask estimation
PL401371A1 (pl) * 2012-10-26 2014-04-28 Ivona Software Spółka Z Ograniczoną Odpowiedzialnością Opracowanie głosu dla zautomatyzowanej zamiany tekstu na mowę
PL401372A1 (pl) * 2012-10-26 2014-04-28 Ivona Software Spółka Z Ograniczoną Odpowiedzialnością Hybrydowa kompresja danych głosowych w systemach zamiany tekstu na mowę
US9536540B2 (en) 2013-07-19 2017-01-03 Knowles Electronics, Llc Speech signal separation and synthesis based on auditory scene analysis and speech modeling
BR112017001382B1 (pt) 2014-07-22 2022-02-08 Huawei Technologies Co., Ltd Aparelho e método para manipular um sinal de áudio de entrada
US9799330B2 (en) 2014-08-28 2017-10-24 Knowles Electronics, Llc Multi-sourced noise suppression
EP3451557B1 (en) * 2016-04-25 2020-09-16 Kyowa Electronic Instruments Co, Ltd Radio communication system
CN109841216B (zh) * 2018-12-26 2020-12-15 珠海格力电器股份有限公司 语音数据的处理方法、装置和智能终端
CN111816198A (zh) * 2020-08-05 2020-10-23 上海影卓信息科技有限公司 改变语音音调和音色的变声方法和系统
KR20220083294A (ko) * 2020-12-11 2022-06-20 삼성전자주식회사 전자 장치 및 전자 장치의 동작 방법

Family Cites Families (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4839923A (en) * 1986-12-12 1989-06-13 Motorola, Inc. Method and apparatus for time companding an analog signal
US4882579A (en) * 1988-01-07 1989-11-21 Motorola, Inc. Code division multiplexed acknowledge back paging system
US4875038A (en) * 1988-01-07 1989-10-17 Motorola, Inc. Frequency division multiplexed acknowledge back paging system
US5142279A (en) * 1989-06-05 1992-08-25 Motorola, Inc. Acknowledge back paging system having the capability of matching variable length data messages to pager addresses
US5068898A (en) * 1989-12-26 1991-11-26 Motorola, Inc. Voice messaging method for selective call receivers
CA2139516C (en) * 1990-12-24 2000-02-08 Kazimierz Siwiak Dual mode receiver having battery saving capability
US5216744A (en) * 1991-03-21 1993-06-01 Dictaphone Corporation Time scale modification of speech signals
US5175769A (en) * 1991-07-23 1992-12-29 Rolm Systems Method for time-scale modification of signals
US5282205A (en) * 1992-05-29 1994-01-25 Motorola, Inc. Data communication terminal providing variable length message carry-on and method therefor
US5353374A (en) * 1992-10-19 1994-10-04 Loral Aerospace Corporation Low bit rate voice transmission for use in a noisy environment
US5619503A (en) * 1994-01-11 1997-04-08 Ericsson Inc. Cellular/satellite communications system with improved frequency re-use

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7505898B2 (en) 2002-07-24 2009-03-17 Applied Minds, Inc. Method and system for masking speech
JP2004126595A (ja) * 2002-10-03 2004-04-22 Docomo Communications Laboratories Usa Inc 信号エネルギーに基づく非一様時間領域音声信号処理方法
JP4523257B2 (ja) * 2002-10-03 2010-08-11 株式会社エヌ・ティ・ティ・ドコモ 音声データ処理方法、プログラム及び音声信号処理システム
WO2005011223A1 (ja) * 2003-07-25 2005-02-03 Matsushita Electric Industrial Co., Ltd. 変調装置、復調装置、変調方法および復調方法
US8121213B2 (en) 2003-07-25 2012-02-21 Panasonic Corporation Modulation device, demodulation device, modulation method and demodulation method
JP2010015152A (ja) * 2008-07-03 2010-01-21 Thomson Licensing 入力信号の値のシーケンスのタイムスケーリングのための方法
US8676584B2 (en) 2008-07-03 2014-03-18 Thomson Licensing Method for time scaling of a sequence of input signal values

Also Published As

Publication number Publication date
EP0870299A1 (en) 1998-10-14
EP0870299A4 (en) 1999-02-10
CA2213699C (en) 2001-04-10
CA2213699A1 (en) 1996-09-06
WO1996027184A1 (en) 1996-09-06
BR9607731A (pt) 1998-07-14
US5920840A (en) 1999-07-06
CN1176702A (zh) 1998-03-18
TW347619B (en) 1998-12-11
KR100289359B1 (ko) 2001-05-02
MX9706530A (es) 1997-11-29
KR19980702558A (ko) 1998-07-15

Similar Documents

Publication Publication Date Title
JPH11501405A (ja) 話者依存時間スケーリング技術を使用した通信システムおよび方法
US5828995A (en) Method and apparatus for intelligible fast forward and reverse playback of time-scale compressed voice messages
US5689440A (en) Voice compression method and apparatus in a communication system
US5603088A (en) Method and apparatus for determining a quality level of an analog signal in a radio communication system
US5699404A (en) Apparatus for time-scaling in communication products
US5630016A (en) Comfort noise generation for digital communication systems
US5537509A (en) Comfort noise generation for digital communication systems
CN101505160B (zh) 通过数字通信网络的语音信道传送数字数据的系统
US6246885B1 (en) Digital FM audio processing in a dual-mode communication system
US5806023A (en) Method and apparatus for time-scale modification of a signal
CN104981870A (zh) 声音增强装置
KR100256378B1 (ko) 신호 처리기에서 잡음 버스트 검출 방법 및 장치
US5524279A (en) Method and apparatus for improving perceived quality of a stored voice message in a communication receiver
JPH098891A (ja) 無線電話機
KR100300156B1 (ko) 직교변조성분을효율적으로이용한음성메시징시스템및방법
EP0850471B1 (en) Very low bit rate voice messaging system using variable rate backward search interpolation processing
TW295753B (ja)
MXPA97006530A (en) A system and method of communications using a time-change change depending on time
EP0583172A1 (en) Speech decoding apparatus and method of decoding
CN116155425B (zh) 一种中波应急广播的指令音消除方法及其系统
JP2979859B2 (ja) デジタル移動無線装置
JP3092157B2 (ja) 通信信号圧縮システムおよび圧縮方法
JPH1013362A (ja) データ変調装置
MXPA97010462A (en) Method and apparatus for time-scaling in communication products
JP2000078246A (ja) 無線電話装置

Legal Events

Date Code Title Description
A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20060314

A313 Final decision of rejection without a dissenting response from the applicant

Free format text: JAPANESE INTERMEDIATE CODE: A313

Effective date: 20060731

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20060905