JPH10503299A - 改良されたピッチ検出を備えた音声符号化用伝送システム及び方法 - Google Patents

改良されたピッチ検出を備えた音声符号化用伝送システム及び方法

Info

Publication number
JPH10503299A
JPH10503299A JP8533915A JP53391596A JPH10503299A JP H10503299 A JPH10503299 A JP H10503299A JP 8533915 A JP8533915 A JP 8533915A JP 53391596 A JP53391596 A JP 53391596A JP H10503299 A JPH10503299 A JP H10503299A
Authority
JP
Japan
Prior art keywords
signal
pitch
characteristic
auxiliary signal
quasi
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP8533915A
Other languages
English (en)
Inventor
タオリ,ラベシュ
ヨハネス スルイター,ロベルト
カトマン,エリック
Original Assignee
フィリップス エレクトロニクス エヌ ベー
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by フィリップス エレクトロニクス エヌ ベー filed Critical フィリップス エレクトロニクス エヌ ベー
Priority claimed from PCT/IB1996/000410 external-priority patent/WO1996036041A2/en
Publication of JPH10503299A publication Critical patent/JPH10503299A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

(57)【要約】 ピッチ検出器(12)を含む音声符号器が使用される伝送システムにおいて、符号化されるべき信号から特性補助信号部を選択する選択手段(22)は、ピッチ検出の質を改良するため使用される。ピッチは、音声信号内で上記特性補助信号部に対応する信号部を探索し、夫々の信号部の間の時間差を計算することにより検出される。

Description

【発明の詳細な説明】 改良されたピッチ検出を備えた音声符号化用伝送システム及び方法 本発明は、準周期信号から符号化された信号を得る符号器を備えた送信器によ り構成され、上記送信器は上記符号化された信号を媒体を介して受信器に送信す るため設けられ、上記符号器は上記周期信号からピッチ情報を得るピッチ検出器 からなる伝送システムに関する。 本発明は、更に、符号器と、準周期信号の周期を検出する検出器と、ピッチ検 出の方法とに係る。 上記の如く定義されたような伝送システムにおいて使用されるべきピッチ検出 器は、ワイ エム チェン(Y.M.Cheng)、ディー オー シャウグネッシー(D.O .Shaughnessy)の論文:“自動的かつ高信頼性の声門閉包の瞬間及び周期の評価 (Automatic and Reliable Estimation of Glottal Closure Instant and Period )”、IEEE音響、音声及び信号処理学会誌、ASSP−23巻、418−4 23ページ、1976年により知られている。 かかる伝送システムは、例えば、無線チャネル、同軸ケーブル又はグラスファ イバのような伝送媒体によって音声信号を伝送するため使用される。或いは、か かる伝送システムは、音声信号を磁気テープ又はディスクのような記憶媒体に格 納するため使用される。応用には、例えば、自動電話応答装置及び口述録音装置 がある。 音声信号は、無声音成分及び有声音成分からなる。音声信号の無声音成分は、 ある種の子音が発音され、周期性を示さない場合に生じる。音声信号の有声音成 分は、母音が発音され、多少の周期性がある場合に生じる。かかる信号は準周期 的であると称される。かかる信号の重要なパラメータは、通常ピッチと称される 周期である。種々のタイプの音声符号器に対し、音声信号の有声音成分のピッチ を厳密に計算することが非常に重要である。 ピッチを判定する第1の方法は、二つのピークの間の遅延の差によってピッチ 情報が表わされる準周期信号の自己相関関数を計算することである。問題は、所 定の時間間隔を有する信号セグメントの間に1個のピッチ値しか計算されないこ とである。所定の時間間隔のピッチの変動は測定できないが、自己相関関数のピ ークの(望まれていない)広がりだけが生じる。 上記論文から知られるピッチ検出器において、ピッチ情報は音声信号と、声帯 が閉じることにより生じた興奮信号に対するヒトの音声系のモデル化された応答 との間の相互相関関数から得られる。ヒトの音声系の特性は、音声信号から得ら れた線形予測パラメータにより表わされる。上記相互相関関数から、興奮の瞬間 を示すピークが発生する信号が得られる。上記信号の平均値は、上記信号から減 算され除かれるので、パルスが興奮の瞬間を表わすパルス状の信号が得られる。 パルスは一定ではないピッチを有する信号内で失われ、或いは、一時的に非常に 高く又は非常に低くなる平均値の結果として2次的なパルスが現れることが分か る。これは、ピッチ検出の信頼度の低下を生じさせる。 本発明の目的は、準周期信号が信頼できるピッチ検出の間に安定であることが 要求されない上記のタイプの伝送システムを提供することである。 上記目的のため、本発明は、ピッチ検出器が、準周期信号を表わす補助信号の 中の特性信号部を選択する選択手段と、上記特性補助信号部と十分に対応した上 記補助信号の中の少なくとも更なる信号部を探索する探索手段と、上記特性信号 部及び上記更なる信号部が生じた瞬間から上記ピッチ情報を得る手段とからなる ことを特徴とする。 上記補助信号から特性補助信号部を選択し、上記特性補助信号部と十分に対応 した上記補助信号の中の少なくとも更なる信号部を探 索することにより、準周期信号の安定性の利用が要求されることなく、ピッチ情 報を得ることが可能になる。 本発明の他の利点は、線形予測パラメータを計算する必要がないので、本発明 によるピッチ検出器は、従来技術のピッチ検出器よりも簡単になる点である。更 なる利点は、2個の興奮パルスが1個のピッチ周期内に存在する場合に生じる誤 りのあるピッチ検出が防止されることである。更に言うと、2個の興奮の瞬間が 音声信号内の1ピッチ周期に規則的に発生することが分かった。このような状況 では、興奮の瞬間を探索する従来技術のピッチ検出器は、ピッチ周期を誤って計 算する。本発明によるピッチ検出器は、興奮の瞬間ではなく、特性補助信号部の 繰り返し的な発生を探索するので、上記のピッチ周期の誤りのある計算は生じな い。 本発明の一実施例は、特性補助信号部が特定の時間セグメントに関して最大エ ネルギーを有する信号部により構成されることを特徴とする。 適当な特性補助信号部は、そのエネルギーが特定の時間セグメントに亘って最 大化される補助信号部である。かかる信号部は、最大ランニングエネルギー関数 の値を探索することにより容易に見つけられる。ランニングエネルギー関数の値 は、偶関数によって表わされる補助信号の非線形演算を行い、その演算の結果を 特定の時間間隔に関して積分することにより計算される。適当な偶関数は、 f(x)=x2 及び f(x)=|x| である。特性補助信号部を検出する別の方法は、特定の時間セグメント内の補助 信号の最大値を探索することである。一般的に、最大強度を有する補助信号部は 、特性補助信号部としての役目を行うために適当である。 本発明の他の実施例は、特性補助信号部の時間間隔が最短時間に 出現するピッチ周期以下であることを特徴とする。 適当な特性補助信号部は、ピッチ周期又はピッチ周期の中の重要な部分である 。長さに関して略最短時間のピッチ周期の特性補助信号部を取ることにより、適 当な特性補助信号部が殆どの状況で見つけられる。補助信号部の長さは、出現す るピッチ周期に依存して選択されるので、適合したシステムが得られると考えら れる。 本発明の他の実施例は、上記探索手段が、上記特性補助信号部と上記補助信号 との間の相関を計算する相関手段からなり、上記ピッチ情報は上記相関関数のピ ークの位置により表わされていることを特徴とする。 上記特性補助信号部に対応する更なる補助信号部を探索する簡単な方法は、上 記特性補助信号部と上記補助信号との間の相互相関関数を計算することである。 上記ピッチ情報は、上記相互相関関数の最大値の位置により表わされる。上記ピ ッチ周期は、上記相互相関関数の2個の連続した最大値の間の時間差から計算さ れる。 本発明の他の実施例は、上記ピッチ検出器が上記相関関数のピーク面を計算す る手段により構成され、上記ピッチ検出器は、時間に関してプロットされた上記 相関関数の上記ピーク面から上記ピッチ情報を得るため設けられていることを特 徴とする。 上記特性補助信号部と上記補助信号の相互相関関数は、所望のピークだけでは なく、所望のピークより狭い幅を有する望まれていない2次的なピークを示すこ とが実験により分かった。自己相関関数内の対応したピークの面と比例する振幅 を有するパルスによって上記ピッチ情報を表わすことにより、上記所望のピーク と上記望まれていないピークとの間の識別がより簡単になる。上記の識別は、上 記面の代わりに、伸張された面の値を利用することにより更に簡単化される。伸 張された面の値を得る適当な方法は、ピーク面を夫々のピークの最大値により乗 算することである。 本発明は、音声信号のピッチ検出に制限されることがなく、2個 以上の信号成分の間の遅延を判定する必要がある状況に適用されることが分かっ た。この例は、レーダーシステムにおけるバックグラウンドノイズ抑制、及び、 ビーム形成のためのシステムで行われるような多数のソースの分離である。かか る応用において、準周期信号には高々2周期しかない場合が起こり得る。 本発明の上記及び他の面は、添付図面を参照して、明らかになり、かつ、解明 される。 添付図面において、 図1は本発明が適用される伝送システムを表わす図であり、 図2は本発明によるピッチ検出器の一実施例を示す図であり、 図3は図2に示されたピッチ検出器に生じるような種々の信号形状を表わす図 であり、 図4は本発明にしたがってピッチを判定するプログラマブルプロセッサのプロ グラムのフローチャートである。 図1に示された伝送システムにおいて、ディジタル音声信号S’〔n〕は送信 器2に供給される。送信器2において、音声信号S’〔n〕は符号器に供給され 、符号器の中でピッチ検出器12と、ピッチ同期符号化手段10とに供給される 。ピッチ情報を出力信号として伝搬するピッチ検出器12の出力は、マルチプレ クサ14の入力と、ピッチ同期符号化手段10の第1の入力とに接続される。ピ ッチ同期符号化手段10の出力はマルチプレクサ14の第2の入力に接続される 。マルチプレクサ14の出力は送信器2の出力に結合される。 送信器2の出力は、チャネル4を介して、受信器6の入力に接続される。受信 器6の入力はデマルチプレクサ16の入力に接続される。デマルチプレクサの第 1の出力はピッチ同期復号器8の第1の入力に接続される。ピッチ情報を出力と して伝達するデマルチプレ クサ16の第2の出力は、ピッチ同期復号器8の第2の入力に接続される。再生 された音声信号を出力として伝達するピッチ同期復号器8の出力は、受信器6の 出力に接続される。 図1に示された伝送システムにおいて、ピッチ情報は、ピッチ検出器12によ って準周期音声信号から得られる。このピッチ情報は、符号化された信号のため の要求伝送容量を減少させるため、ピッチ同期符号器10により使用される。ピ ッチ同期符号器10の例は、ピー ヘデリン(P.Hedelin)による論文“声門LP C−ボコーダ(A glottal LPC-vocoder)”、IEEE国際会議予稿集、ASSP ’84、サンディエゴ、1984年と、ダブリュー ビー クレイン(W.B.Kley n)による論文“プロトタイプ波形を使用する音声符号化(Encoding Speech Using Prototype Waveforms)”、IEEE音声及びオーディオ処理学会誌、第1巻、 第4号、1993年に記載されている。 符号化された音声信号及びピッチ情報は、マルチプレクサ14により単一の符 号化された出力信号に合成される。この符号化された出力信号は伝送チャネル4 により受信器6に伝送される。 受信器6において、受信された信号が検出され、ディジタル信号に変換される 。このディジタル信号は、デマルチプレクサ16により、符号化された信号と、 ピッチ情報を表わす信号とに分離される。ピッチ同期復号器18は、上記符号化 された信号と上記ピッチ情報とから再生された音声信号を得る。この再生された 音声信号は受信器6の出力で利用可能である。 図2に示されたピッチ検出器において、準周期信号S’〔n〕はローパスフィ ルタ20に供給される。その出力信号として補助信号S〔n〕を伝達するローパ スフィルタ20の出力は、エネルギー測定手段の入力と、選択手段24の第1の 入力と、エンベロープ検出器30の入力とに接続される。 出力信号E〔n〕を伝達するエネルギー出力手段22の出力は、 選択手段24の第2の入力に接続される。特性補助信号部f〔n〕をその出力信 号として伝達する選択手段24の出力は、相関器28により形成された探索手段 の第1の入力に接続される。出力信号Sec〔n〕を伝達する制御可能増幅器26 の出力は、相関器28の第2の入力に接続される。制御信号ec〔n〕を伝達す るエンベロープ検出器30の出力は、制御可能増幅器26の制御入力に接続され る。制御可能増幅器26及びエンベロープ検出器30は、一体的に振幅制御手段 を形成する。 出力信号Rsf〔n〕を伝達する相関器28の出力は、積分器32に接続される 。出力信号A〔n〕を伝達する積分器32の出力は、伸張手段34の入力に接続 され、一方、出力信号P〔n〕を伝達する伸張手段34の出力は検出器36の入 力に接続される。検出器36の出力側で、信号P’〔n〕の形式のピッチ情報が 得られる。 信号S’〔n〕によりディジタル的に表わされた音声信号は、比較的高い周波 数を有し、ピッチ検出に妨害性の影響を与える可能性のある信号成分の信号を除 去するためのローパスフィルタ20によりフィルタ処理される。ローパスフィル タ20の遮断周波数は、最高の実現可能なピッチ周波数より低くなるように選択 される。実際に使用可能であることが判明した値は、600Hzである。 エネルギー測定手段22は、Nサンプルの長さを有するセグメントの間にMサ ンプル長の補助信号部のランニングエネルギー関数を計算する。適当であること が分かったセグメント間隔は、例えば、40msであり、一方、2msの間隔は ランニングエネルギー関数に適当である。8kHzのサンプリング周波数の場合 に、Nは320と一致し、Mは16と一致する。信号E〔n〕に対し、以下の式 : が得られる。特性補助信号部は、ランニングエネルギー関数E〔 n〕が最大の補助信号部である。E〔n〕がn=nmに対し最大であるならば、 特性補助信号部f〔n〕は以下の式: と一致する。E〔n〕から計算された値nmが利用されている間に、補助信号部 f〔n〕は選択手段24によって信号S〔n〕から得られる。相関器28は、制 御可能な増幅器26の出力で得られる振幅制御信号Sec〔n〕の相互相関関数Rsf 〔n〕を計算する。この相関関数Rsf〔n〕に対し、以下の式: が成り立つ。式(3)は、以下の式: のように表わしてもよい。 関数MAXは、式(3)及び式(4)において、Rsf〔n〕の負の値が発生す ることを防止するため使用される。特性補助信号部と一致する信号部が探索され るとき、負の相関値は重要ではない。 相互相関関数Rsf〔n〕のnの夫々の値に属するピーク面の測定量であるA〔 n〕は、積分器32により得られる。相互相関関数のk番目のピークは、以下の 式: のように表わされ、bk及びekは、自己相関関数のk番目のピークの最初と最後 を表わす。k番目のピークの面Akに対し、以下の式: が成り立つ。akに属するnkの値は、ピークLk〔n〕の最大値mkに属するnの 値である。mkに対し、次の式: mk = MAX{Lk〔n〕} (7) が成り立つ。面Aはakの最大値を利用することによりスケール処理されるので 、値A〔n〕は1以下である。関数A〔n〕に対し、以下の式: が得られる。式(8)において、qは信号セグメント内のピークの数である。上 記の望まれていないパルスは、低いだけではなく、幅も狭いので、2次的なピー クの面は所望のピークの面よりもかなり小さくなるため、関数Rsf〔n〕の関数 A〔n〕への変換は、関数Rsf〔n〕の望まれていない2次的なピークの相対的 な減衰を生じさせる。 所望のピークと、望まれていない2次的なピークとの間の差を更に増加させる ため、伸張手段34は、大きい値のA〔n〕の方が小さい値のA〔n〕よりも大 きく増幅される非線形演算を実行する。この演算は、例えば、関数A〔n〕をmk の夫々の値により乗算することにより行われる。伸張手段の出力信号P〔n〕 に対し、以下の式: が成り立つ。式(9)の代わりに、A〔n〕の別の非線形演算を行なっても構わ ない。 検出器36は、信号P〔n〕から望まれていない2次的なパルスを除去する。 第1の選択は、相互に2ms未満の距離に収まる最小のパルスP〔n〕を除去す ることにより行われる。この手段は、2ms未満のピッチ周期は非常に稀である という事実に基づいている。最終的な選択は、先行するパルスの振幅のある一部 分よりも小さい振幅を有するパルスを除去することにより達成される。ピッチ情 報は、信号P’〔n〕により表わされ、一方、信号P’〔n〕は、ピッチパルス が生じるときのnの値に対し第1の論理値(“1”)を有し、他のnの値に対し 第2の論理値(“0”)を有する。 図3において、グラフ38は、nに関してプロットされた準周期的な音声信号 S’〔n〕を表わす。グラフ38は、音声信号の(準)周期特性を明瞭に表わし ている。グラフ40は、時間に関しプロットされた補助信号S〔n〕を表わす。 この信号はピッチ検出を複雑にする高周波成分が除去されている。グラフ42は 、nに関してプロットされたランニングエネルギー関数E〔n〕の値を表わす。 E〔n〕の最大値はnmaxに対し得られる。グラフ44には、特性補助信号部f 〔n〕が示される。この特性補助信号部f〔n〕は、n=nmaxの近傍のS〔n 〕から抽出される。 グラフ46は、nに関してプロットされた相互相関信号Rsf〔n〕を表わす。 上記グラフにおいて、所望のピークと、望まれていない2次的なピークの両方が 視覚化される。グラフ48には、nに関して面の測定量A〔n〕がプロットされ ている。グラフ48は、 所望のピークと、望まれていないピークとの間の区別が増大されたことを明瞭に 示している。 グラフ50には、信号A〔n〕から非線形演算によって得られた信号P〔n〕 がnに関してプロットされている。同グラフにおいて、所望のパルスと望まれて いないパルスとの間の区別は、より拡大されている。最後に、グラフ52は、所 望のパルスが発生したときにnの値に対し値“1”を有する論理信号の形式でピ ッチ情報を示す。 望まれていないパルスは、上記の如く、除去される。 図4のフローチャートにおいて各ブロックは以下の意味を含む。 番号 名称 意味 60 スタート 処理が開始される。 62 初期化 変数は初期化される。 64 セグメント {S[n]}の取得 補助信号のサンプルのセグメン トが記憶される。 66 有声音 補助信号が有声音かどうかの検 査を行う。 68 E[n]の計算 記憶されたセグメントのランニ ングエネルギー関数が計算され る。 70 f[n]の抽出 特性補助信号部が補助信号から 抽出される。 72 相関 振幅制御された補助信号が補助 信号から得られる。 74 Rsf[n]の計算 相互相関関数Rsf〔n〕が計算 される。 76 A[n]の計算 Rsf〔n〕のピーク面が計算さ れる。 78 伸張 信号P〔n〕が非線形演算によ りA〔n〕から計算される。 80 ピークの削除 望まれていない2次的なピーク が削除される。 82 n1,n2の計算 セグメントの最初の2個のピッ チパルスの位置n1及びn2が 計算される。 84 最初の有声音セグメント 各セグメントが音声信号の一部 分の最初の有声音セグメントで あるかどうかが検査される。 86 n1,n2のピッチマーク n=n1及びn=n2に対し、 P〔n〕の論理値が“1”に一 致させられる。 88 LPM:=n2 最後に割り当てられたピッチ マーカーの位置が記憶される。 90 LPM:=LPM+n2-n1 新しいピッチマーカーの位置が 計算、記憶される。 92 LPM のピッチマーク n=LPMに対しP’〔n〕の 論理値が“1”に一致させられ る。 94 セグメント {S[n]+n2-n1}取得 補助信号の次のサンプルのセグ メントが取得される。 ブロック60及び62において、有声音の音声信号があるならば、上記プログ ラムは起動され、変数は所望の初期値に設定される。ブロック64において、信 号S〔n〕のセグメントが記憶される。そのセグメントの長さは、20乃至40 msの値を有する。 ブロック66においてS〔n〕のセグメントが依然として有声音であるかどう かが検査される。上記信号が有声音ではないならば、プログラムはブロック96 で停止する。音声信号が有声音であるか どうかの情報は、プロシージャ(図示しない)により発生させられる。 ブロック68において、ランニングエネルギー関数E〔n〕が計算される。こ れは、式(1)に従って行われる。次に、ブロック70において、特性補助信号 部が式(2)に従って抽出される。ステップ72において、振幅制御された補助 信号Sec〔n〕が計算される。この目的のため、補助信号のエンベロープの測定 量Se〔n〕が最初に計算される。この計算は、以下の式: に従って行われる。式(10)において、iはランニング変数であり、Lは式( 10)によりシミュレートされるフィルタのインパルス応答の長さであり、h〔 i〕は式(10)によりシミュレートされたフィルタのインパルス応答である。 式(10)によりシミュレートされたフィルタの適当であることが明らかにされ た遮断周波数は25Hzである。適当なLの値は121である。 振幅補正信号Ic〔n〕は、信号Se〔n〕から以下の式: に従って計算される。式(11)を用いて、振幅制御された補助信号Sec〔n〕 は以下の式: Sec〔n〕 = S〔n〕・ec〔n〕 (12) に従って得られる。 補助信号の振幅が低い場合に、振幅補正は、望まれていない2次的なピークが 所望のピークとして検出されるような方法で望まれていない2次的なピークを増 幅することが分かる。このことを防止するため、振幅補正は、補助信号の(平均 )振幅が特定の閾値レベルよりも低下したとき、スイッチオフされる。 ブロック74において、補正関数Rsf〔n〕が計算される。この 計算は、式(3)又は式(4)に従って行われる。次に、ブロック76において 、信号A〔n〕は式(8)に従って計算され、ブロック78において、信号P〔 n〕は式(9)に従って非線形演算を行うことにより計算される。 ブロック80において、望まれていない2次的なパルスは信号A〔n〕から除 去される。この除去は上記のような方法により行われる。 ブロック82において、現在のセグメントの信号P〔n〕内の最初の2個のパ ルスの位置n1及びn2が計算される。次に、ブロック84において、現在のセグ メントが有声音の音声を含む最初のセグメントであるかどうかが検査される。も し、最初のセグメントであれば、ブロック86において、ピッチマーカーは、位 置n1及びn2に対応した位置で信号P’〔n〕に挿入される。ブロック88にお いて、最後に信号P’〔n〕に挿入されたピッチマーカーの位置は、後の使用の ため可変LPMに記憶される。 現在のセグメントが有声音の音声を含む最初のセグメントではないならば、ブ ロック90において、値n2−n1をLPMの元の値に加算することにより最後の ピッチマーカーの位置が計算される。次に、ブロック92において、ピッチマー カーは信号P’〔n〕の位置LPMに置かれる。 ブロック94において、次のセグメントが取得される。このセグメントは、前 のセグメントと隣接していないが、前のセグメントの上に重なる。次のセグメン トの開始は、n2−n1サンプルずつシフトされる。その理由は、2個の隣接した セグメントの間に変化がある場合には、確定されたピッチの値に不連続な変化が 生じ、結局、特性信号部が変化するからである。この変化は、セグメントの重な り合いを大きくさせることにより回避される。 ブロック94の後、新しいセグメントの処理のためブロック66に戻る。

Claims (1)

  1. 【特許請求の範囲】 1. 準周期信号から符号化された信号を得る符号器を備えた送信器により構成 され、上記送信器は上記符号化された信号を媒体を介して受信器に送信するため 設けられ、上記符号器は上記準周期信号からピッチ情報を得るピッチ検出器から なる伝送システムであって、 上記ピッチ検出器は、 上記準周期信号を表わす補助信号の中の特性信号部を選択する選択手段と、 上記特性補助信号部と十分に対応した上記補助信号の中の少なくとも更なる信 号部を探索する探索手段と、 上記特性信号部及び上記更なる信号部が生じた瞬間から上記ピッチ情報を得る 手段とからなることを特徴とする伝送システム。 2. 上記特性補助信号部は、ある時間セグメントの間に最大エネルギーを有す る信号部により構成されることを特徴とする請求項1記載の伝送システム。 3. 上記特性補助信号部の時間間隔は、最短時間で出現するピッチ周期以下で あることを特徴とする請求項1又は2記載の伝送システム。 4. 上記探索手段は上記特性補助信号部と上記補助信号との間の相関を計算す る相関手段からなり、 上記ピッチ情報は上記相関関数のピークの位置により表わされることを特徴と する請求項1乃至3のうちいずれか1項記載の伝送システム。 5. 上記ピッチ検出器は上記相関関数のピーク面を計算する手段 により構成され、 上記ピッチ検出器は時間に関してプロットされた上記相関関数の上記ピーク面 から上記ピッチ情報を得るため設けられていることを特徴とする請求項4記載の 伝送システム。 6. 上記ピッチ検出器は、上記相関関数の上記ピーク面を上記相関関数の伸張 されたピーク面の値に変換する伸張手段を更に有することを特徴とする請求項5 記載の伝送システム。 7. 準周期信号からピッチ情報を得るピッチ検出器からなり、上記準周期信号 から符号化された信号を得る符号器であって、 上記ピッチ検出器は、 上記準周期信号を表わす補助信号の中の特性信号部を選択する選択手段と、 上記特性補助信号部と十分に対応した上記補助信号の中の少なくとも更なる信 号部を探索する探索手段と、 上記特性信号部及び上記更なる信号部が生じた瞬間から上記ピッチ情報を得る 手段とからなることを特徴とする符号器。 8. 上記特性補助信号部は、ある時間セグメントの間に最大エネルギーを有す る信号部により構成されることを特徴とする請求項7記載の符号器。 9. 準周期信号を表わす補助信号の中の特性信号部を選択する選択手段と、 上記特性補助信号部と十分に対応した上記補助信号の中の少なくとも更なる信 号部を探索する探索手段と、 上記特性信号部及び上記更なる信号部が生じた瞬間からピッチ情報を得る手段 とからなることを特徴とする準周期信号の周期を計算 する配置。 10. 準周期信号からピッチ情報を得る段階からなる準周期信号から符号化さ れた信号を得る符号化方法であって、 上記準周期信号を表わす補助信号の中の特性信号部を選択する段階と、 上記特性補助信号部と十分に対応した上記補助信号の中の少なくとも更なる信 号部を探索する段階と、 上記特性信号部及び上記更なる信号部が生じた瞬間から上記ピッチ情報を得る 段階を更に有することを特徴とする符号化方法。
JP8533915A 1995-05-10 1996-05-07 改良されたピッチ検出を備えた音声符号化用伝送システム及び方法 Pending JPH10503299A (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
NL9520119 1995-05-10
NL95201199.7 1995-05-10
PCT/IB1996/000410 WO1996036041A2 (en) 1995-05-10 1996-05-07 Transmission system and method for encoding speech with improved pitch detection

Publications (1)

Publication Number Publication Date
JPH10503299A true JPH10503299A (ja) 1998-03-24

Family

ID=19865831

Family Applications (1)

Application Number Title Priority Date Filing Date
JP8533915A Pending JPH10503299A (ja) 1995-05-10 1996-05-07 改良されたピッチ検出を備えた音声符号化用伝送システム及び方法

Country Status (1)

Country Link
JP (1) JPH10503299A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2002095731A1 (fr) * 2001-05-22 2002-11-28 Fujitsu Limited Processeur de signaux vocaux

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2002095731A1 (fr) * 2001-05-22 2002-11-28 Fujitsu Limited Processeur de signaux vocaux

Similar Documents

Publication Publication Date Title
JP3423906B2 (ja) 音声の動作特性検出装置および検出方法
JP2738534B2 (ja) 異なる型の励起情報を有するディジタル音声符号器
US5774836A (en) System and method for performing pitch estimation and error checking on low estimated pitch values in a correlation based pitch estimator
WO1987001498A1 (en) A parallel processing pitch detector
KR960005741B1 (ko) 음성신호부호화장치
JP4497911B2 (ja) 信号検出装置および方法、ならびにプログラム
JPS6051720B2 (ja) 音声の基本周期抽出装置
EP0634041B1 (en) Method and apparatus for encoding/decoding of background sounds
US6865529B2 (en) Method of estimating the pitch of a speech signal using an average distance between peaks, use of the method, and a device adapted therefor
WO1997031366A1 (en) System and method for error correction in a correlation-based pitch estimator
EP0770254B1 (en) Transmission system and method for encoding speech with improved pitch detection
JPH07319498A (ja) 音声信号のピッチ周期抽出装置
JPH10503299A (ja) 改良されたピッチ検出を備えた音声符号化用伝送システム及び方法
JPH0636159B2 (ja) ピツチ検出器
US20010029447A1 (en) Method of estimating the pitch of a speech signal using previous estimates, use of the method, and a device adapted therefor
US20060077844A1 (en) Voice recording and playing equipment
JPH0483300A (ja) 雑音抑圧型音声検出器
KR940005047B1 (ko) 음성전이구간 검출기
JP3571448B2 (ja) 音声信号のピッチ検出方法および装置
JPS5817497A (ja) 音声ピッチ検出装置
JPS59632A (ja) 信号分析装置
JP3360370B2 (ja) 波形検出装置
EP1143414A1 (en) Estimating the pitch of a speech signal using previous estimates
JPH04230799A (ja) 音声信号符号化装置
JPS61269198A (ja) 音声合成方式

Legal Events

Date Code Title Description
A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20060411

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20060710

A602 Written permission of extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A602

Effective date: 20060828

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20061011

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20070109