JPS6032100A - Lsp型パタンマッチングボコ−ダ - Google Patents

Lsp型パタンマッチングボコ−ダ

Info

Publication number
JPS6032100A
JPS6032100A JP58142025A JP14202583A JPS6032100A JP S6032100 A JPS6032100 A JP S6032100A JP 58142025 A JP58142025 A JP 58142025A JP 14202583 A JP14202583 A JP 14202583A JP S6032100 A JPS6032100 A JP S6032100A
Authority
JP
Japan
Prior art keywords
standard
button
coefficient
audio signal
vocoder
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP58142025A
Other languages
English (en)
Other versions
JPH0235994B2 (ja
Inventor
哲 田口
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
Nippon Electric Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Electric Co Ltd filed Critical Nippon Electric Co Ltd
Priority to JP58142025A priority Critical patent/JPS6032100A/ja
Publication of JPS6032100A publication Critical patent/JPS6032100A/ja
Publication of JPH0235994B2 publication Critical patent/JPH0235994B2/ja
Granted legal-status Critical Current

Links

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 本発明はLSP型バタンマツチングボコーダに関する。
、入力音声信号にL P C(Linear Pred
ictionCoefficient 、線形予測係数
)分析等を施して得られるαパラメータ、露パラメータ
とともにこれらの係数から誘導して得られるLAP係数
は、声道を仮想フィルタと見たてた場合の伝達関数を表
わす線スペクトル周波数対によるパラメータとして近時
よく知られつつある。
このL8P係数は、αパラメータ等が時間領域で表わさ
れるのに対し周波数領域で表現されるため、直観的にも
扱い易い量であり、またα、にパラメータ等による方式
に比して数10%程度も低い情報量で合成音声の品質の
劣化も最小限度にとどめることができ、るといったよう
なさまざまな特徴を有し、従ってこのよりなL8F係数
を利用するLAP型ボコーダも同様な特徴を有するもの
として構成される。
また、バタンマツチングボコーダは、予め設定する音声
資料にもとづいて上述した各パラメータのいずれかによ
る声道フィルタの伝達関数の分布もしくは他の言語的特
徴等を抽出し、これを音声のスペクトル包絡に関する標
準バタンとして利用し、入力音声信号によるこれらの係
数のバタンとを比較、照合して最近似した標準バタンを
選択することにより入力音声信号のスペクトル包絡に関
する情報を得て、これと入力音声信号を分析して得られ
る有声/無声/無音に関する情報、ピッチ情報および音
源の強さ等に関する音源情報とを入力音声信号に関する
分析情報として分析側から合成側に伝送したうえ、前記
標準バタン情報を復号して得られるスペクトル包絡情報
と音源情報とを利用して入力音声信号の合成を行なうも
のである。
LSP型バタンマツチングボコーダは、声道フィルタを
構成するための伝達関数をLSP係数によって表現する
バタンマツチングボコーダであり、入力音声信号を分析
して得られるLAP係数と照合すべき標準バタンには音
声資料を分析して得られたLSP係数の分布に関する資
料が予めストアされている。
バタンマツチングボコーダは従来のボコーダに対してめ
られている改善、特に音質/ビットレートの向上、すな
わち音質を劣化することなく極力ビットレートを低減す
ることを基本目的としておハたとえば0.6〜1.2キ
ロビツト/8ECといった低ビツトレート領域で動作す
るボコーダの実現に対しては、LPC係数等を従来のベ
クトル要素を独立的に量子化する方法では不可能であシ
、特徴パラメータのベクトル要素をベクトルのままで量
子化する、いわゆるブロック量子化を行なうことが必要
となシ、バタンマツチングボコーダはこのようなブロッ
ク量子化を採用して音声/ビットレートの改善を図る有
力な1つの手法となっている。特にLAP型バタンマツ
チングボコーダにあってはバタン間の補間特性の改善が
図れ、またLAPの量子化歪の性質を利用したバタン照
合によってバタン間の不連続性を大幅に改善した低ビツ
トレート領域での高品質のボコーダとして構成でき、し
かもこのLAP型バタンマツチングボコーダをコーダお
よびデコーダとして低ビツトレート領域にお叶る秘匿通
信ができるといったさまざまな特徴を有している。
しかしながら、従来のこの種のLAP型バタンマツチン
グボコーダにあっては、標準バタントt。
てストアしておくバタンの内容は、全ての話者によくマ
ツチングするバタンの作成は事実上不可能であるため通
常は数人からたかだか数100人程度の話者による音声
資料をサンプルとして作成されておシ、このため特に秘
匿通信等の通信分野で利用する場合に話者ごとに異なる
入力音声信号のバタンを的確に選択する話者の選択とい
う観点からみて完全なものとは言い難く、従って入力音
声信号によるバタンと標準バタンとかよくマツチングせ
ず、しばしば合成音の劣化を招いているという欠点があ
る。
本発明の目的は上従した欠点を除去し、不特定話者用に
作成された標準バタンメモリと、特定話者グループ用に
登録される内容をもつ標準バタンメモリとを標準バタン
メモリとして併用するという手段を備えることにより、
マツチングにおける精匿を上げ合成音の劣化を著しく改
善しうるL8P型バタンマツチングボコーダを提供する
ことにある。
本発明のボコーダは、音声資料のLSP(Line8p
ectrum Pa1r )係数の分布に関する標準バ
タンと入力音声信号をL8F分析して得られるLAP 
′係数に関するバタンとを照合して入力音声信号の合成
を行なうLSP型バタンマツチングボコーダにおいて、
不特定話者を対象として作成した第1の標準バタンと特
定話者を対象として作成した第2の標準バタンとを前記
標準バタンとして備えて構成される。
次に図面を参照して本発明の詳細な説明する。
第1図(5)、(B)は本発明の一実施例を示すブロッ
ク図であシ、第1図囚は分析側、第1図CB)は合成側
の構成を示すブロック図である。
第1図囚に示す分析側lは、 LPF(LowPass
杓口” ) l 1 + A / D * yメータ1
2.窓関数処理器13.自己相関係数計測器14 、L
PC分析器15.有声/無声/無音判別器16.ピッチ
抽出器17.LSP分析器18.スペクトル距離計測器
19.標準バタンメモ9 (1) 201標準バタンメ
モリ(2)21.スペクトル感度メモリ22および符号
化器23を備えて構成される。
また、第1図(B)に示す分析側2は、第1図(5)と
同じ標準バタンメモリ(1120,標準バタンメモリ(
2)21のほかに、復号器24.バタン復号器25゜L
8F合成器26.可変利得増幅器27.切替器28、パ
ルス発生器29.線量発生器30.D/Aコンバータ3
1およびLPF32を備えて構成される。
第1回内において、入力ライン111 を介して入力す
る、通信を行なう話者等による入力音声信号はLPPI
Iによって不要な高域を遮断するフィルタリングを受け
たのち出力ライ゛ン112 に送出され、A/Dコンバ
ータ12によって所定のビット数に量子化されたうえ量
子化音声信号として出力ライン121 を介して窓関数
処理器13に送出される。
窓関数処理器13は、入力した量子化音声信号のaom
sgcずつにlQmsFicの周期で繰返されるハミン
グ関数のfjEを実施する窓関数処理を行ない、これに
よって得られるtOmsEc ごとの出力を基本フレー
ムとして次次に出力ライン131を介して自互相関係数
計測器14に供給する。
自己相関係数計測器14は、こうして入力した入力音声
信号の音声波形データを、乗算回路等を利用して各遅れ
時間における自己相関係数データ−916およびピッチ
抽出器17にそれぞれ送出するとともに、また遅れ時間
零における基本フレームごとの自己相関係数を短時間音
声電力データとして出力ライン143 を介して符号化
器23に送出する。
有声/無声/無音判別器五6は、入力した自己相関係数
データを利用し、各基本フレームごとの有声もしくは無
声、あるいは無音状態を判別しこれを有声/無声/無音
判別データとして出力ライン161 を介してLAP分
析器18に送出するとともに、また符号化器23にも送
出する。
ピッチ抽出器17は、入力した各、基本フレームごとの
自己相関係数を利用して基本フレームごとのピッチ情報
を抽出しこれをピッチデータとして出力ライン171 
を介して符号化器23に送出する。
LPC分析器15はbsp分析器18とともに、基本フ
レームごとの自己相関係数を利用してL8F分析によ、
9LSP係数を得るためのLAF係数抽出回路を形成す
る。 □ LPC分析器15は、入力する基本フレームごとの自己
相関係数を利用し、これに線形予測分析を施して予め定
める次数、本実施例の場合は10次の線形予測係数を予
測分析し、これを出力ライン151 を介してLSF分
析器18に送出する。
LAF分析器18は、このようにして入力する線形予測
係数をNewtonの反復法を利用する高次方程式法に
よって10次のLSF係数に変換するが、とのL8P係
数変換に先立″ち、波形領域における高周波成分強調の
ためのプリエンファシス(Pre −emphasls
 )処理および自己相関係数領域におけるLag関数に
よるLag窓関数処理を行なって、いずれもL8F係数
の最小同波数間隔を拡大してバタンマツチング処理を容
易にし、また後述する合成側2における音声合成用の全
極型デジタルフィルタの安定動作機能を高めるようにし
ている。
こうして得られた基本フレームごとの一定周期をもつL
AP係数列は、さらに出力ライン161を介して受ける
有声/無声/無音判別データを利用し、有声および無声
に関する有香区間と無香区間とによってそれぞれ予め設
定する可変長周期をもつフレーム、いわゆる可変長フレ
ームによりて構成される係数列に変換し、ビットレート
の低減を図りている。この場合、基本フレームを可変長
フレームに変換する際に利用したフレーム変換レートは
いわゆるレビートビットデータとして出力ライン181
 を介して符号化器23に送出される。
このようにして得られる10次のLAF係数は、前述し
た如く声道フィルタの伝達関数を周波数領域で表現する
線スペクトルω0.ω2.・・・・・・ω1゜であシ、
これはよく知られる如く声道を完全に開放したときおよ
び完全に閉そくした状態に対応する上述ω1〜ω1oに
対応するものである。
LSP分析器18から出力ライン181 を介して送出
されるLSP係数列はスペクトル距離計測器19によっ
て標準バタン群とのスペクトル距離の計測を行なう。
N次のL8F8部係数れぞれは、N次のパラメータ空間
におけるひとつの空間ベクトルを表わすものとして考え
ることができ、したがってLAP係数による周波数間の
空間ベクトル距離を表わすスペクトル距離は、2つのL
8P係数の近似度を表わす尺匪、すなわちiツチング尺
度として利用される。
フレームi、j間のスペクトル距離Dijl′i次の(
1)式によって示される。
(1)式においてSt(ω)はフレームiの対数スペク
トル、8j(ω)はフレームjの対数スペクトルである
(1)式による演算は処理内容が膨大となるため、通常
は次の近似等式(2)によってスペクトル距離DMJを
演算する。
(2)式においてPKはフレームiのN次のLSF係数
であシp ;jlはフレーズjのN次のLAF係数、W
Kはこの近似等゛式(2)における重みづけ係数であり
、通常UN次のLAF係数ω1.ω2・・・・・・ω、
の各L8F8部数に対応するスペクトル感度であシ、こ
のスペクトル感度はL8F8部数の微少変化に対するス
ペクトル変化の程度を示すものとしてよく知られヱいる
ものである。
スペクトル距離計測器19は、スペクトル感度メそり2
2に予めストアされているスペクトル感度データを出力
ライン221 を介して受けこれを重みづけ係数として
入力したL8F8部係数ず標準バタンメモ!j(1)2
0にストアされている第1の標準バタンによるLAF係
数を対象として両者のスペクトル距離を(2)式によっ
て計測し、各可変長フレームごとに最近似する標準パタ
ンを選択すると込うバタン照合を行なう。
スペクトル感度メモリ22は、不特定話者による音声資
料にもとづいて予め登録されストアされている第1の標
準バタンメモ’J(1)20にょるLf9P係数の同波
数に関するスペクトル感度を予めストアするものである
、 ・ さて、バタンマツチングボコーダ、特にLAP型バ
タンマツチングボコーダにあっては一般のLPGボコー
ダ等に比して173〜1/6程度に音声ノ帯域を圧縮す
ることが可能であり、また音声情報の本質的な秘匿化が
行なわれるためにこれをコーダおよびデコーダとして秘
匿無線通信の分野に対する利用も近時試みられているが
、このような利用形態におけるボコーダの運用者の数は
、たとえば漁業無線等における秘匿無線通信の如く比較
的多人数の場合でも、ボコーダを介して相互通信によシ
情報の授受を特徴とする特定話者の数はたかだか数lθ
〜数1数100産程あり、これらの中から任意に選定さ
れる特定話者による入力音声信号の選択を前記不特定者
による音声資料による標準バタンのみで行なうむと社不
十分である。
また、ボコーダを介してこのような双方向通信を行なう
場合には単なる音声認識と異なって話者を特定すること
はできず、話者を完全に限定しても2名分、N名の場合
にはN名分のバタンか必要となる。
一方、音声に関するL8P係数の統計的調査によれば、
不特定話者による音声資料を分析して得られるLAP係
数の分布に関するバタン、すなわち特徴ベクトルの分布
密度は必らずしもほぼ一様ではなく、分布密度の高いベ
クトル空間が存在することが判明している。従って各話
者の占有するベクトル空間は、上述した分布密度の高い
空間の1部と話者独自の空間とによって構成されること
となる。
標準バタンメモIJ(1)20.および標準バタンメそ
17(2)21は、特定話者および不特定話者に関する
上述したベクトル空間に関する特徴にもとづき、標準バ
タンメモIJ (1) 20には不特定話者に関する音
声資料による第1の標準バタン、標準バタンメモIJ(
2)21には予め特定する話者独自のベクトル空間に対
応する準特定用の第2の標準バタンを登録しストアして
おき、通信を行なう相互の話者に対する標準バタンの選
択をほぼ完全なものとしている。
標準バタンメモリ(1)20にストアしておく第1の標
準バタンは、本実施例の場合次のようにして予め別なコ
ンピュータを利用してオフライン処理で作成されるが、
これを本実施例によるボコーダの分析側を利用して予め
作成しておいても一向に差支えない。
第1の標準バタンは、分析側1をコーグとし分析側2を
デコーダとして通信を行なう不特定話者の人数による音
声宋料を利用し、従来から行なわれるいわゆるクラスタ
リングと呼ばれる次の手順で作成する。
まずlO次元LSF係数のベクトル空間UがN個のバタ
ンで構成されるものとし、これらN個のバタンそれぞれ
について(2)式によ)スペクトル距離を計測し、この
スペクトル距離が予め設定した近似度判定域値θdB”
、本実施例では4dB”以上となる、バタン数をN個の
全パタンについてめ、このバタン数をML(i==1,
2.・・・・・・N)とする。
次にバタンMiのうち最も大きいバタン数をもつバタン
PLを見出し、このバタンPLにスペクトル距離がθd
B”以下で含まれるすべてのバタンをベクトル空間Uか
ら除去しPLを標準バタンとして登録する。
さらに、バタン除去したべり、トル空間Uに対し上述し
た手順を繰返しこれをベクトル空間Uに含まれるバタン
かなくなるまで実施し、このようにして標準バタンを次
次に選択する。
このような手順によりて不特定話者による音声資料にも
とづいて登録された第1の標準バタンをストアする標準
バタンメモリ(1)20の標準バタンを出力ライン20
1 を介して読み出しつつ、これと出力ライン182 
を介して受ける入力音声信号のLSP係数バタンとのス
ペクトル距離を(2)式によって計測し、このスペクト
ル距離が最小となる標準バタンを検索しこれを通話時等
における入力音声信号に最近似した標準バタンとして、
この標準バタンを指定する標準バタン指定コードデータ
を出力ライン191 を介して符号化器23に送出する
スペクトル感度メモリ22は、標準バタンのlOけ係数
として掃併する。
このようにして行なわれるバタン照合は、標準バタンメ
モリ(1)20にストアされている第1の標準バタンと
入力音声信号のバタンとかよくマツチングして検索され
れば特に問題はないが、数人乃至数百式の不特定話者の
音声資料をサンプルとして作成した標準バタンですべて
iの話者によくマツチングさせることは事実上不可能で
ある。本実施例においては標準バタンメモ1月1)20
にストアされている標準バタンと入力音声信号のバタン
との照合におけるマツチングが悪くスペクトル距離が予
め定めた最近似判定域値に入る所望の標準パ°タンが得
られないときには、このような入力音声信号のバタンを
標準バタンメモリ(2)にストアされている第2の標準
バタンと照合して入力音声信号のバタンに最近似する最
適バタンを標準バタンとして決定する。
標準バタンメモリ(2)21にストアされる第2の標準
バタンは、特定話者グループが指定される都[これら特
定話者ブルーフ“による音声資料を利用し、相互通信に
おいて使用される第1回内に示す分析側のいずれか1つ
に内蔵されるかもしくは外付による専用のバタン作成器
を利用して予め作成されるものであり、仁のバタン作成
器は専用のワークメモリ、スペクトル麺離計測器等よシ
成シ、これを利用し従来からよく知られた学習(tra
ining )手法により次のようにして作成される。
特定話者グループによる音声資料にもとづいて得られる
10次のLAF係数と、第1の標準バタンによる10次
のL8F係数とによるベクトル空間のスペクトル距離を
上述したバタン作成器を用いて(2)式によp柑測して
第1の標準バタンと共通するベクトル空間を除去し、残
った特定話者グループ独自のベクトル空間のみを対象と
して第1の標準バタン作成における手順と同様な手法に
よってベクトル空間を次次に分割しつつ標準バタンとし
て選択する、前述したクラスタリング(Cluster
ing)を実施して得られるベクトル空間に対応するL
8F係数を第2の標準バタンとして登録する。
従って、第1の標準バタンとの照合においてマツチング
がよくとれなかりたものもこの第2の標準バタンとの照
合によりて#1は完全にマツチングが得られることとな
る。
スペクトル距離計測器19は、標準バタンメモ1月1)
20にストアされている第1の標準バタンと入力音声信
号によるバタンとのバタンマツチングにおいて所定の近
似度を得られないときはこの入力音声信号によるバタン
を、出力ライン211 を介して標準バタンメモリ(2
)から入力する第2の標準バタンとスペクトル距離計測
によシ照合し、これによって最近似した第2の標準バタ
ンを標準バタンとして選択し、この標準バタンを指定す
る標準バタン指定コードデータを出力ライン191 を
介して符号化器23に送出する。
こうして2段階のバタン照合を含むバタンマツチングを
行なりて標準バタンを選択した分析側lは、この標準バ
タンによって入力音声信号のスペクトル包絡に関する情
報、および前述した短時間音声電力データ、有声/無声
/無音判別データおよびピッチデータ等の音源情報なら
びにレピートビットデータを符号化器23によって所定
の符号形式のデジタル符号に変換したうえこれらを伝送
路231 を介して合成側2に送出する。
合成側2では、復号器24によって分析側1から送出さ
れた各種データの復号を行なって再生し、標準バタンコ
ード指定データは出力ライン251を介してバタン復号
器25に送出する。
パタン復号器25は、入力した標準バタン指定コードデ
ータにもとづき、指定される標準バタンを標準バタンメ
モリ(1)20にストアされた第1の標準バタンもしく
は標準バタンメモリ(2)21にストアされた第2の標
準バタンいずれかの中から選択して読出し、こうして読
出された標準バタンによるL8F係数を出力ライン25
2を介してL8F合成器26に送出する。
このようにしてL8F合成器26に送出されるデータは
、入力音声信号の可変長フレームごとに選択された標準
バタンによるL8F8F係数ある。
LSP合成器26は、復号器24から出力ライy261
 を介して受けるレビートビットデータによって可変長
フレームをもとの基本フレームに復元し、さらに予め設
定した近似関数を利用してこの標本化周期の間隔でL8
F係数の補間処理を行なう。こうして補間処理を受けた
基本フレームごとの10次のL8P係数は、全極型モデ
ルによる10次のLSF音声合成デジタルフィルタの係
数として利用される。
LAF音声合成デジタルフィルタは、こうして入力した
10次のL8P係数をフィルタ係数とし、可変利得増幅
器27から出力ライン271 を介して入力する音源励
振電力とによってLSF音声合成デジタルフィルタを動
作せしめてデジタル形式の合成音声出力を発生し、これ
を出力ライン262に送出する。
上述した音源励振電力は、入力音声信号からスペクトル
包絡成分を除いた、いわゆる残差電力であシ、入力音声
信号の音源情報を利用して次のようにして形成される。
゛ ・、出力ライン2°91を介してピッチデータを受けた
パルス発生器29は、このピッチデータのピッチ情報に
対応する周波数のパルスを発生しこれをピッチパルスと
して出力ライン292を介して切替器28に送出する。
また、雑音発生器300発生する白色雑音は出力ライン
301 を介して切替器28に送出される。
切替器2Bは、出力ライン281 を介して有声/無声
/無音判別データを受け、これが有声を指定するときは
ピッチパルスを、また無声もしくは無音を指定するとき
には白色雑音を出力するように切替えて、これらを出力
ライン282を介して可変利得増幅器27に送出する。
可変利得増幅器27はこうして入力するピッチパルス(
シ<は白色雑音いずれかを、出力ライン271 を介し
て入力する短時間音声電力データによって重みづけをし
て増幅しこれを音源励振電力として出力ライン271 
に送出する。
さて、D/Aコンバータ31は、デジタル形式の合成音
声出力をアナログ信号に変換しこれを出力ライン311
 を介してLPF32に送出し、不要な高域フィルタリ
ングを行なったのち合成音声信号として出力ライン32
1に送出する。
以上のようにして、不特定話者による音声資料および予
め特定した特定話者による音声資料を利用して作成した
L8F係数の分布に関する第1の標準バタンおよび第2
の標準バタンと、入力音声信号を分析して得られるL8
F係数のバタンとを照合して行なうLAP型バタンマツ
チングボコーダの分析側と合成側とによる入力音声信号
の分析および合成が実施されるが、この場合、第2の標
準バタンの内容は、このようなLaP型バタンマツチン
グボコーダを介して相互に通信を行なう複数の話者のう
ちから予め特定された者の音声資料にもとづいて作成′
しておくことによル、第1の標準バタンによるバタン照
合で所定のマツチング匿を得られない話者のバタンとの
マツチングもtlは完全に得られることとなシ、従って
バタン照合における話者の選択の面での自由直が大幅に
改善され、合成音声の品質の劣化を著しく改善すること
ができるようになる。第2の標準バタンの内容は特定話
者グループを変更するごとに常に容易に変更することが
でき、従りてこの方式によればボコーダを介して通信す
る話者の数に基本的に左右されなくてすむ高品質の秘匿
通信が可能となる。
本発明は、LSP型バタンマツチングボコーダにおいて
、不特定話者用に作成された第1の標準バタンをストア
する標準バタンメモリと、予め特定する特定話者グルー
プ用に登録される第2の標準バタンをストアする標準バ
タンメモリとを備えて入力音声信号をLAP分析して得
られるバタンと紡記2つの標準バタンメモリによる標準
バタンとの照合を行なって入力音声信号のバタンに最近
似する標準バタンを選択する点に基本点な特徴を有する
ものであル、第XE囚口均に示す本発明の実施例の変形
も種種考えられる。
たとえば、ts1図(A) 、 03)に示す実施例で
取扱うL8F係数は10次のL8F係数を対象としてい
るが、これは入力音声の分析および合成における忠実度
を保持しうる範囲内の他の次数としても差支えない。
また、第1図(5)におけるLPC分析器15は、入力
音声信号のαパラメータを得る他の手段と置換しても同
様に実施しうろことは明らかである。
また、LAF分析器18においてαパラメータたらL8
F係数を得るために利用する高次方程式法はこれを零点
探索法等によっても同様に実施しつることは明らかであ
る。
ざらに、第1図因、@においては分析フレームを可変長
フレームとして構成しているが、これは一定フレーム間
隔の固定分析フレームとしても差支えなく、いずれを利
用するかは所望のビットレート等に対応して任意に選定
しうるものであル、以上はすべて本発明の主旨を損なう
ことなく容易に実施しつるものである。
以上説明した如く本発明によれば、L8PIJノ<タン
マツチングボコーダにおいてバタンマツチングに利用す
る標準バタンを、不特定話者用に作成した第1の標準バ
タンと、特定話者グループ用に登録した第±の標準バタ
ンとの両者によって構成し、これら標準バタンとの照合
を介して入力音声信号に最近似する標準バタンを選択す
るという手段を備えることにより、話者選択の面におけ
る自由匿を大幅に改善し、限定された数の話者による音
声資料にもとづいて作成された標準バタンによっても極
めて高品質の合成音声が得られるLAP盤バタンマツチ
ングボコーダが実現できるという効果がある。
【図面の簡単な説明】
第1図(5)、(B)は本発明によるLSP型バタンマ
ツチングボコーダの一実施例における分析側(5)、お
よび合成側(B)の構成を示すブロック図である。 1・・・・・・分析側、2・・・・・・合成側、11・
・・・・・LPF。

Claims (1)

    【特許請求の範囲】
  1. 音声資料のL 8 P (Line 8p’ectru
    m Pa1r )係数の分布に関する標準バタンと入力
    音声信号をLAF分析して得られるLSP係数に関する
    バタンとを照合して入力音声信号の合成を行なうLSP
    fiバタンマツチングボコーダにおいて、不特定話者を
    対象として作成した第1の標準バタンと特定話者を対象
    として作成した第2の標準バタンとを前記標準バタンと
    して備えて成ることを特徴とするLSP型バタンマツチ
    ングボコーダ。
JP58142025A 1983-08-03 1983-08-03 Lsp型パタンマッチングボコ−ダ Granted JPS6032100A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP58142025A JPS6032100A (ja) 1983-08-03 1983-08-03 Lsp型パタンマッチングボコ−ダ

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP58142025A JPS6032100A (ja) 1983-08-03 1983-08-03 Lsp型パタンマッチングボコ−ダ

Publications (2)

Publication Number Publication Date
JPS6032100A true JPS6032100A (ja) 1985-02-19
JPH0235994B2 JPH0235994B2 (ja) 1990-08-14

Family

ID=15305612

Family Applications (1)

Application Number Title Priority Date Filing Date
JP58142025A Granted JPS6032100A (ja) 1983-08-03 1983-08-03 Lsp型パタンマッチングボコ−ダ

Country Status (1)

Country Link
JP (1) JPS6032100A (ja)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS61215599A (ja) * 1985-03-20 1986-09-25 日本電気株式会社 Lspパタンマツチングボコ−ダ
JPH07212239A (ja) * 1993-12-27 1995-08-11 Hughes Aircraft Co ラインスペクトル周波数のベクトル量子化方法および装置
JPH08195722A (ja) * 1995-01-17 1996-07-30 Nec Corp スペクトルパラメータを用いた音声信号伝送システムおよびそれに用いられる音声パラメータ符号化装置および復号化装置
JP2007240779A (ja) * 2006-03-07 2007-09-20 Nippon Telegr & Teleph Corp <Ntt> 時系列類似度スコアリング方法

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS61215599A (ja) * 1985-03-20 1986-09-25 日本電気株式会社 Lspパタンマツチングボコ−ダ
JPH07212239A (ja) * 1993-12-27 1995-08-11 Hughes Aircraft Co ラインスペクトル周波数のベクトル量子化方法および装置
JPH08195722A (ja) * 1995-01-17 1996-07-30 Nec Corp スペクトルパラメータを用いた音声信号伝送システムおよびそれに用いられる音声パラメータ符号化装置および復号化装置
JP2007240779A (ja) * 2006-03-07 2007-09-20 Nippon Telegr & Teleph Corp <Ntt> 時系列類似度スコアリング方法
JP4728842B2 (ja) * 2006-03-07 2011-07-20 日本電信電話株式会社 時系列類似度スコアリング方法および装置

Also Published As

Publication number Publication date
JPH0235994B2 (ja) 1990-08-14

Similar Documents

Publication Publication Date Title
US5305421A (en) Low bit rate speech coding system and compression
AU639394B2 (en) Speech synthesis using perceptual linear prediction parameters
JPS58100199A (ja) 音声認識及び再生方法とその装置
JP2954588B2 (ja) 音声の符号化装置、復号装置及び符号化・復号システム
JPH0869299A (ja) 音声符号化方法、音声復号化方法及び音声符号化復号化方法
EP0477960A2 (en) Linear prediction speech coding with high-frequency preemphasis
JPH09258795A (ja) ディジタルフィルタおよび音響符号化/復号化装置
JP2779325B2 (ja) ボコーダーにおける前処理の相関関係式を用いたピッチ検索時間短縮方法
Hagen et al. Voicing-specific LPC quantization for variable-rate speech coding
JPS6032100A (ja) Lsp型パタンマッチングボコ−ダ
JPH07191696A (ja) 音声認識装置
US4914702A (en) Formant pattern matching vocoder
JP2796408B2 (ja) 音声情報圧縮装置
JP2605256B2 (ja) Lspパタンマツチングボコーダ
JPH0197997A (ja) 声質変換方法
JPH0650440B2 (ja) Lsp型パタンマツチングボコ−ダ
JPS6162100A (ja) マルチパルス型符号化復号化装置
Ding et al. A Hybrid Structure Speech coding scheme based on MELPe and LPCNet
Makhoul Methods for nonlinear spectral distortion of speech signals
JPH0235993B2 (ja)
JP2535809B2 (ja) 線形予測型音声分析合成装置
JP2880508B2 (ja) 音声の規則合成装置
JPH0736119B2 (ja) 区分的最適関数近似方法
JPH10105200A (ja) 音声符号化/復号化方法
JPH0754438B2 (ja) 音声処理装置