JPH0582600B2 - - Google Patents

Info

Publication number
JPH0582600B2
JPH0582600B2 JP60077827A JP7782785A JPH0582600B2 JP H0582600 B2 JPH0582600 B2 JP H0582600B2 JP 60077827 A JP60077827 A JP 60077827A JP 7782785 A JP7782785 A JP 7782785A JP H0582600 B2 JPH0582600 B2 JP H0582600B2
Authority
JP
Japan
Prior art keywords
pattern matching
band
vocoder
analysis
linear prediction
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP60077827A
Other languages
English (en)
Other versions
JPS61236600A (ja
Inventor
Satoru Taguchi
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
Nippon Electric Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Electric Co Ltd filed Critical Nippon Electric Co Ltd
Priority to JP60077827A priority Critical patent/JPS61236600A/ja
Priority to CA000504517A priority patent/CA1245363A/en
Publication of JPS61236600A publication Critical patent/JPS61236600A/ja
Priority to US07/522,411 priority patent/US5027404A/en
Publication of JPH0582600B2 publication Critical patent/JPH0582600B2/ja
Granted legal-status Critical Current

Links

Description

【発明の詳細な説明】 〔産業上の利用分野〕 本発明はパタンマツチングボコーダに関し、特
に帯域分割型のパタンマツチングボコーダに関す
る。
〔従来の技術〕
入力音声信号の周波数帯域を予め設定する複数
の帯域に分割して各帯域ごとにLPC(Linear
Prediction Coefficient、線形予測係数)分析を
行なう帯域分割型ボコーダはよく知られている。
これはLPC分析が有する2つの欠点、すなわ
ちフオトマント帯域幅の過小推定、およびエネル
ギーの少ない高次フオルマントたとえば第3フオ
ルマントが第1フオルマントに比して近似性が悪
いといつた欠点を改善する手段を提供するもので
ある。前記2つの欠点は第1フオルマント等エネ
ルギーの集中する周波数に極が過度に集中するた
めに発生すると推定され、帯域分割型ボコーダは
特定の周波数に極が集中するのを防ぐために入力
音声の周波数帯域を複数に分割しそれぞれの帯域
に対してLPC分析を行なうことによつて極の分
数を図り上記欠点を排除しようとするものであ
る。
この場合、分割帯域数をあまり多くしても分割
帯域のそれぞれを白色化する結果となり、入力音
声信号の帯域圧縮の意味が無くなつていくという
問題が起るため通常2〜4分割程度が利用される
ことが多く、また分割は等間隔ではなく各帯域に
スペクトル包絡の極としてのフオルマントをそれ
ぞれ含ませるように分割し通常周波数間隔は対数
比で予め設定される。
〔発明が解決しようとする問題点〕
しかしながら、従来のこの種の帯域分割型ボコ
ーダでは本質的に合成側の帯域間スペクトルに不
連続性が発生しこのため合成音質の劣化を招き易
いという欠点がある。
本発明の目的は上述した欠点を除去し、合成側
における帯域間スペクトルの不連続性を大幅に改
善した帯域分割型のパタンマツチングボコーダを
提供することにある。
〔問題点を解決するための手段〕
本発明のパタンマツチングボコーダは、入力音
声信号の音声帯域を複数の周波数帯域に分割し各
分割周波数帯域ごとに線形予測分析して求めた線
形予測係数と前記各分割周波数帯域間の電力比と
をスペクトル包絡のベクトル要素としてパタン照
合を行なうパタン照合手段を分析側に備えるとと
もに入力音声信号の全周波数帯域のベクトル要素
を表現しうる標準パタンを記憶した標準パタンメ
モリを合成側に備えて構成される。
〔実施例〕
次に図面を参照して本発明を詳細に説明する。
第1図Aおよび第1図Bはそれぞれ本発明による
パタンマツチングボコーダの第1の実施例の分析
側および合成側の構成を示すブロツク図である。
第1図Aに示す分析側1はLPF(Low Pass
Filter)101、A/Dコンバータ102、ウイ
ンドウ処理器103、DFT(Discrete Fourieris
Fransform)104、電力スペクトル算出器10
5、自己相関関数算出器(1)106−1〜自己相関
係数算出器(N)106−N、線形予測分析器(1)10
7−1〜線形予測分析器N107−(N)、電力比算
出器(1)108−1〜電力算出器(N−1)108
−(N−1)、パタン照合器109、標準パタンメ
モリ(1)110、音源データ分析器111およびマ
ルチプレクサ112を備えて構成される。
また、第1図Bに示す合成側2は、デマルチプ
レクサ201、標準パタンメモリ(2)202、音源
信号発生器203、音声合成フイルタ204、
D/Aコンバータ205およびLPF206を備
えて構成される。
第1図Aにおいて、入力ライン1001を介し
て入力した入力音声信号はLPF101によつて
所定の高域遮断を受ける。本実施例の場合高域遮
断周波数は3333KHzに設定してある。次にLPF1
01の出力はA/Dコンバータ102によつて
8KHzのサンプリング周波数でサンプリングされ
所定のビツト数で量る化されたのちウインドウ処
理器103に供給される。
ウインドウ処理器103は、入力信号の
32mSEC分ずつにハミング関数を換算するウイン
ドウ処理を行なつたのち256ポイント(32mSEC
×8KHz)DFTをDFT104にて実施する。
DFT回路104によるDFT出力は周波数領域
の複素スペクトル成分であり、これはさらに電力
スペクトル算出器105によつて自乗演算等を介
し周波数対電力スペクトルが算出される。
電力スペクトル算出器105の出力は自己相関
係数算出器1〜(N)106−1〜106−Nに帯域
分割して供給される。
これら自己相関係数算出器はそれぞれ予め設定
した分割数と分割周波数帯域とに対応する個数N
と帯域幅B1,B2…BN(B1<B2…<BN)
とを有し、たとえば本実施例は運用周波数0〜
3333KHzを対象として分割されたN個がそれぞれ
設定された帯域の周波数を対象として自己相関関
数を算出する。これら分割数ならびに分割周波数
帯域幅はそれぞれにフオルマント周波数が含まれ
るように、音声資料等を勘案して設定される。
自己相関関数算出器(1)106〜1〜(N)106−
Nはそれぞれ設定された分割周波数帯域の電力ス
ペクトル算出器105の出力を受けてIDFT
(Inverse DFT)を施して必要な範囲内の各遅れ
時間における自己相関係数を求め、これらを線形
予測分析器(1)107−1〜線形予測分析器N10
7−(N)に供給するとともに、算出した遅れ時間零
における自己相関係数すなわち各周波数帯域の短
時間平均電力e1〜enをN−1個の電力比算出
器(1)108−1電力比算出器(N−1)108−
(N−1)に供給し、各周波数帯域間の短時間平
均電力の比を算出する。本実施例においてはこの
短時間平均電力の比で表現する電力比が短時間平
均電力e1を基準として算出するようにしてお
り、従つて電力比算出器(1)108−1にはe1と
e2とが、また電力比算出器(2)108−2にはe
1とe3とが供給され以下同様にして電力比算出
器(N−1)108−(N−1)にはe1とenと
が供給されるというようにしてN−1個の電力比
算出器で各周波数帯域間の電力比を求めている
が、これはe1とe2,e2とe3…e(n−1)
とenというような供給の仕方としても勿論差支
えない。
さて、線形予測分析器(1)107−1〜線形予測
分析分析器107−Nはそれぞれ、供給を受けた
自己相関係数を利用し公知の処理技術、たとえば
Auto−Correlation法等を利用し所定のLPC係
数、本実施例では8次の(偏自己相関係数)パラ
メータを抽出しパタン照合器109に送出する。
また、電力比算出器(1)108−1〜電力算出器
(N−1)108−(N−1)からはそれぞれ算出
した電力比がパタン照合器109に供給され、か
くしてパタン照合器109には分割各周波数帯域
ごとのKパラメータと電力比とが供給される。
標準パタンメモリ(1)110は前述したN個の帯
域分割に対応する如く分類したKパラメータの標
準パタンフアイルを、本ボコーダを利用するかま
たは他のコンピユータを利用してオフライン的に
予め音声資料にもとづいて用意する。本実施例の
場合は8次のKパラメータを分割帯域に対応して
パタンフアイルとして用意し、さらにこれらパタ
ンフアイルには前述した分割帯域間の電力比も予
め算出して用意し、こうしてパタン照合は各周波
数帯域ごとに線形予測分析して算出したKパラメ
ータと各周波数帯域間の電力比とをスペクトル包
絡を表現するベクトル要素として行なわれる。こ
のパタン照合では2つのパタンのマツチングが両
パタンに含まれる全Kパラメータ間で計測したス
ペクトル距離を尺度として行なわれ、これが最小
のものが標準パタンとして各周波数帯域ごとに選
択され、かつこの場合各帯域間のKパラメータに
よつて表現されるスペクトルの連続性を各帯域間
の電力比を介して確認しつつ行なう。つまり、各
帯域間の電力比というスベクトル要素が上記スペ
クトルの連続性を確認しうる唯一のパラメータで
あることを利用し、この電力比をパタン照合にお
けるベクトル要素に加えて帯域間の連続性を保証
しつつパタン照合を実施する。
このパタン照合によつて選択された標準パタン
(1)110の標準パタンは各周波数帯域ごとにその
番号を指定する標準パタン番号指定データがマル
チプレクサ112に供給される。
一方、音源データ分析器111は入力ライン1
001から入力音声信号を受けるとこれをLPF、
A/Dコンバータ等に通して所定の高域遮断、量
る化を行なう。この内容はほぼ前述したLPF1
01、A/Dコンバータ102によるものと同じ
で、このあと公知の処理技術で音源データとして
のピツチ周期データ、有声/無声/無音判別デー
タ、および音源の強さデータを抽出しこれら音源
データをマルチプレクサ112に供給する。
マルチプレクサ112はこうして入力した標準
パタン番号指定データと音源データとを符号化し
たうえ所定の形式で多重化し、これを伝送路10
02を介して合成側2に送出する。
次に第1図Bの合成側2について説明する。デ
マルチプレクサ201は入力した多重化信号の多
重化分離を行なつて復号化したうえ標準パタン番
号指定データは標準パタンメモリ(2)202に、ま
た音源データは音源信号発生器203にそれぞれ
供給される。
標準パタンメモリ(2)202は入力した標準パタ
ン番号指定データによつて読出されるものが入力
音声信号のスペクトル包絡を全周波数帯域にわた
つて表現しうる特徴パラメータであればどのよう
なLPC係数もしくはこのLPC係数から誘導され
る係数等であつてもよく、ただ合成すべき全周波
数帯域のスペクトル包絡を代表するベクトル要素
が分割周波数帯域間で不連続性を帯びないもので
あることを配慮すればよい。
本実施の場合18次分析した全周波数帯域一括の
Kパラメータを登録したものを利用しこれによつ
て全周波数帯域のベクトル要素を表現している
が、このKパラメータは勿論αパラメータ等他の
LPC係数を利用してもよく、さらにその次数も
全周波数帯域にわたつてのベクトル要素をほぼ満
足に表現しうるものであれば差支えない。
標準パタンメモリ(2)202は標準パタン番号指
定データによつて指定された標準パタンを読出し
これを音声合成フイルタ204に供給する。こう
して読出された標準パタンは分析側1によつて選
択された標準パタンを介して全周波数にわたつて
分析側とは次数も含めて独立的に登録したLPC
係数を内容とするものであり、これらは音声合成
フイルタ204のフイルタ係数として提供され
る。
全極型デイジタルフイルタによつて構成される
音声合成フイルタ204は、標準パタンメモリ(2)
202に登録されている標準パタンのLPC係数
と同次数のものでありそのフイルタ係数をこうし
て標準パタンメモリ(2)202から受け、また音源
信号発生器203から受けた音源信号によつて駆
動される入力音声信号をデイジタル量で合成す
る。
音源信号発生器203はデマルチプレクサ20
1から受ける音源データを利用し次のようにモデ
ル化された音源を公知の手法によつて生成する。
すなわち、音源信号発生器203は入力した有
声/無声/無声判別データを利用し、これが有
声/無声の有意を指定するときはピツチ周期デー
タに対応する周期のパルス列を発生し、また無声
を指定するときは雑音を発生してこれらを可変利
得増幅器を介して音源信号として音声合成フイル
タ204に供給する。上記可変利得増幅器の利得
は音源データのうちの音源の強さデータを利用し
て制御する。
こうして合成されたデイジタル音声はD/Aコ
ンバータ205によつてアナログ化されたのち
LPF206で不要な高域成分を除去され出力ラ
イン2001に送出される。
次に本発明の第2の実施例について説明する。
第2の実施例は第1図A,Bに示す第1の実施例
の分析側において分析する線形予測係数にLSP係
数を利用するものであり、従つて標準パタンとし
てフアイルしておく内容もLSP係数を利用する点
のみが異るので図示は省略する。
LSP係数は通常のLPC分析によつて得られた
αパラメータを利用し、ニユートンの高次方程式
を解く方法や零点探索法を公知の技術として利用
して抽出されており、音声に関するスペクトル包
絡を周波数領域で表現するものであり、直感的に
理解し易くまた合成における捕間特性にも優れて
いるといつた観点から近時多用されつつある。
本発明の第2の実施例ではこのLSP係数を線形
予測係数として各帯域ごとに抽出、またスペクト
ル距離計測を介してこれと照合すべき標準パタン
もLSP係数をベクトル要素として利用し、さらに
合成側で全周波数帯域にわたるベクトル要素を表
現しうるものとしてフアイルされるLPC係数も
18次のLSP係数を利用したものとしている。その
他の基本的動作はほぼ第1の実施例に準ずる内容
であるのでこれらに関する詳細な説明は省略す
る。
本発明は分析側は帯域分割によるパタン照合で
LPCパフメータベクトルの抽出合成側では全帯
域のベクトル要素を表現しうる標準パタンを備え
た状態での音声合成を行なうパタンマツチングボ
コーダとして、LPC分析ならびに帯域分割ボコ
ーダの欠点を基本的に排除した点に基本的特徴を
有するものであり、前述した第1および第2の実
施例の変形も種々考えられる。
たとえば第1図Aに示す分析側1でのLPF1
01の遮断周波数、A/Dコンバータ102のサ
ンプリング周波数あるいはウインドウ処理器10
3において利用するウインドウ関数等はパタンマ
ツチングボコーダの運用条件等を勘案して任意に
設定しうることは明らかであり、また、音源デー
タ分析は本実施例のほかに音源波形を伝送するマ
ルチパルス、もしくは残差励振等の形式による分
析がありこれらはいずれも容易に実施しうるもの
である。
さらに、本第1、第2の実施例では分析フレー
ムを一定周期とした固定長フレームボコーダとし
ているが、これを可変長フレームボコーダとして
もよく、以上はすべて本発明の主旨を損なうこと
なく容易に実施しうる。
〔発明の効果〕
以上説明した如く本発明によれば、パタンマツ
チングボコーダにおいて、分析側は帯域分割して
抽出したLPC係数と帯域間の電力比とベクトル
要素としてパタン照合を行なうとともに合成側で
は全帯域のベクトル要素を表現しうる標準パタン
を用意するという手段を備えることによりLPC
分析と帯域分割型ボコーダにおける本質的欠点を
根本的に排除したパタンマツチングボコーダが実
現できるという効果がある。
【図面の簡単な説明】
第1図Aは本発明によるパタンマツチングボコ
ーダの第1の実施例における分析側の構成を示す
ブロツク図、第1図Bは本発明によるパタンマツ
チングボコーダの第1の実施例における合成側の
構成を示すブロツク図である。 1…分析側、2…合成側、101…LPF、1
02…A/Dコンバータ、103…ウインドウ処
理器、103,104…DFT回路、105…電
力スペクトル算出器、106−1〜106−N…
自己相関係数算出器(1)〜(N)、107−1〜107
−N…線形予測分析器(1)〜(N)、108−1〜10
8−(N−1)…電力比算出器(1)〜(N−1)、1
09…パタン照合器、110…標準パタンメモリ
(1)、111…音源データ分析器、112…マルチ
プレクサ、201…デマルチプレクサ、202…
標準パタンメモリ(2)、203…音源信号発生器、
204…音成合成フイルタ、205…D/Aコン
バータ、206…LPF。

Claims (1)

  1. 【特許請求の範囲】 1 入力音声信号の音声帯域を複数の周波数帯域
    に分割し各分割周波数帯域ごとに線形予測分析し
    て求めた線形予測係数と前記各分割周波数帯域間
    の電力比とをスペクトル包絡のベクトル要素とし
    てパタン照合を行なうパタン照合手段を分析側に
    備えるとともに入力音声信号の全周波数帯域のベ
    クトル要素を表現じうる標準パタンを記憶した標
    準パタンメモリを合成側に備えて成ることを特徴
    とするパタンマツチングボコーダ。 2 前記線形予側係数がLSP(Line Spectrum
    Pairs、線スペクトル対)であることを特徴とす
    る特許請求範囲第1項記載のパタンマツチングボ
    コーダ。
JP60077827A 1985-03-20 1985-04-12 パタンマツチングボコ−ダ Granted JPS61236600A (ja)

Priority Applications (3)

Application Number Priority Date Filing Date Title
JP60077827A JPS61236600A (ja) 1985-04-12 1985-04-12 パタンマツチングボコ−ダ
CA000504517A CA1245363A (en) 1985-03-20 1986-03-19 Pattern matching vocoder
US07/522,411 US5027404A (en) 1985-03-20 1990-05-11 Pattern matching vocoder

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP60077827A JPS61236600A (ja) 1985-04-12 1985-04-12 パタンマツチングボコ−ダ

Publications (2)

Publication Number Publication Date
JPS61236600A JPS61236600A (ja) 1986-10-21
JPH0582600B2 true JPH0582600B2 (ja) 1993-11-19

Family

ID=13644870

Family Applications (1)

Application Number Title Priority Date Filing Date
JP60077827A Granted JPS61236600A (ja) 1985-03-20 1985-04-12 パタンマツチングボコ−ダ

Country Status (1)

Country Link
JP (1) JPS61236600A (ja)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5313531A (en) * 1990-11-05 1994-05-17 International Business Machines Corporation Method and apparatus for speech analysis and speech recognition

Also Published As

Publication number Publication date
JPS61236600A (ja) 1986-10-21

Similar Documents

Publication Publication Date Title
US5305421A (en) Low bit rate speech coding system and compression
US4301329A (en) Speech analysis and synthesis apparatus
JP2763322B2 (ja) 音声処理方法
US5027404A (en) Pattern matching vocoder
KR0155315B1 (ko) Lsp를 이용한 celp보코더의 피치 검색방법
JPH0582600B2 (ja)
US4914702A (en) Formant pattern matching vocoder
GB2061071A (en) Speech analyzer
KR100383668B1 (ko) 시간 분리 부호화 알고리즘을 이용한 음성 부호화기 및부호화 방법
JPH05297895A (ja) 高能率符号化方法
JP3138574B2 (ja) 線形予測係数補間装置
JP3398968B2 (ja) 音声分析合成方法
JPH0235994B2 (ja)
JPS62278598A (ja) 帯域分割型ボコ−ダ
JP2605256B2 (ja) Lspパタンマツチングボコーダ
JP2535809B2 (ja) 線形予測型音声分析合成装置
Makhoul Methods for nonlinear spectral distortion of speech signals
JPS61252600A (ja) Lsp型パタンマツチングボコ−ダ
JPH0229239B2 (ja)
KR0138878B1 (ko) 보코더용 피치검색 처리시간 단축법
JPS593493A (ja) 帯域分割型ボコ−ダ
JP3063088B2 (ja) 音声分析合成装置、音声分析装置及び音声合成装置
JPH0229233B2 (ja)
JPH0123800B2 (ja)
JPS6113600B2 (ja)