JP2880508B2 - 音声の規則合成装置 - Google Patents

音声の規則合成装置

Info

Publication number
JP2880508B2
JP2880508B2 JP63037947A JP3794788A JP2880508B2 JP 2880508 B2 JP2880508 B2 JP 2880508B2 JP 63037947 A JP63037947 A JP 63037947A JP 3794788 A JP3794788 A JP 3794788A JP 2880508 B2 JP2880508 B2 JP 2880508B2
Authority
JP
Japan
Prior art keywords
speaker
voice
conversion
signal
quantized
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP63037947A
Other languages
English (en)
Other versions
JPH01211798A (ja
Inventor
匡伸 阿部
尚夫 桑原
清宏 鹿野
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
EI TEI AARU JIDO HONYAKU DENWA KENKYUSHO KK
Original Assignee
EI TEI AARU JIDO HONYAKU DENWA KENKYUSHO KK
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by EI TEI AARU JIDO HONYAKU DENWA KENKYUSHO KK filed Critical EI TEI AARU JIDO HONYAKU DENWA KENKYUSHO KK
Priority to JP63037947A priority Critical patent/JP2880508B2/ja
Publication of JPH01211798A publication Critical patent/JPH01211798A/ja
Application granted granted Critical
Publication of JP2880508B2 publication Critical patent/JP2880508B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Description

【発明の詳細な説明】 [産業上の利用分野] この発明は、音声の規則合成装置に関し、特に、音質
を変換して出力する規則合成装置に関する。
[従来の技術および発明が解決しようとする課題] 従来の規則合成システムで出力される合成音の音質
は、1つまたは数種類(男性の音声、女性の音声、子供
らしい音声および老人のような音声など)に限られてい
る。しかし、現実に規則合成システムを使用する場合に
は、各個人が音声の個人性を持っているように、出力さ
れる合成音声の音質も個人的な特徴を持っていることが
望まれる。また、これとは別に、規則合成音に、希望す
る特定の人の音質を持たせたい要求もある。
しかし、従来の規則合成システムでは、 (1) 規則合成に用いられる音声単位は、或る話者が
発声した数百個の音声から作成されるため、発声者の負
担が大きい。
(2) 音声単位の作成は、全自動で行なうのが難し
く、人手がかかり、沢山の話者について音声の単位を作
成するのは事実上不可能である。
(3) 規則合成に用いられる音声の単位セットを各話
者ごとに作ると、格納しておくメモリ量が膨大なものと
なる。
などのような理由により、上記の要求を実現することが
できないという課題があった。
この発明は、上記のような課題を解決するためになさ
れたもので、発声者、規則合成のためのデータ作成者お
よび規則合成システムの負担をできる限り少なく保ちな
がら、規則合成音に発声者の個人性を持たせることを目
的とする。
[課題を解決するための手段] この発明に係る音声の規則合成装置は、標準となる第
1の話者の音声単位信号の集合を含み、外部から文字情
報信号を受け、音声単位信号の集合を参照して第1の話
者の音声信号を合成する規則合成手段と、第1の話者の
音声信号から抽出されかつ量子化された特徴パラメータ
と音声に個人的情報を付与したい第2の話者の音声信号
から抽出されかつ量子化された特徴パラメータとの対応
関係に基づいて予め作成された変換コードブックを含む
ファイル手段と、規則合成手段によって合成された第1
の話者の音声信号を受け、ファイル手段の変換コードブ
ックに基づいて第1の話者の声質を第2の話者の声質に
変換することにより、第2の話者の音声信号を生成する
声質変換手段とを備える。声質変換手段は、第1の話者
の音声信号から特徴パラメータを抽出する抽出手段と、
抽出手段によって抽出された特徴パラメータを量子化す
る量子化手段と、変換コードブックを参照して量子化手
段によって量子化された特徴パラメータを複号化する復
号化手段とを含む。
[作用] この発明に係る音声の規則合成装置においては、取敢
えず第1の話者の音声信号が合成され、続いて予め作成
された変換コードブックに基づいて第1の話者の声質が
第2の話者の声質に変換される。より具体的には、合成
された第1の話者の音声信号から特徴パラメータが抽出
され、その抽出された特徴パラメータが量子化され、さ
らにその量子化された特徴パラメータが変換コードブッ
クを参照して復号化され、これにより第2の話者の音声
信号が生成される。
[発明の実施例] 第1図は、この発明による規則合成装置の一実施例を
示すブロック図である。
第1図を参照して、入力部10に、外部から文字および
アクセント型などの文字列ならびに韻律信号を含む文字
情報信号s1が与えられる。音声の単位セット情報ファイ
ル21を含む規則合成部20は、文字情報信号s1を受け、音
声の単位セット情報ファイル21を参照して、標準の話者
Aの音声信号s2を合成する。ここで、音声の単位セット
情報ファイル21は、標準話者Aについて、音素や音節な
どの音声の単位となる情報が予め蓄えられたデータベー
スである。
声質変換部30は、話者Aの音声信号s2を受け、予め登
録されている、音声に個人性を付与したい話者Bの音声
個人情報ファイル40を参照して、話者Aの音声信号(規
則合成音)s2の声質を、話者Bの声質に変換し、話者B
の音声信号s4として出力する。
声質変換部30における声質変換方法として、ベクトル
量子化を利用した声質変換法が用いられる。この方法
は、規則合成部20の基準となった標準話者Aと、音声に
個人性を付与したい話者Bとの間の声質変換を、各話者
のコードブックの対応づけである変換コードブックによ
って行なうものである。
変換コードブックは、個人性を付与したい話者の音声
のパワー、ピッチ周波数およびスペクトル情報を含み、
音声の特徴が離散的に表現されている。第1図の音声個
人情報ファイル40は、この変換コードブックの内容を含
む。
第2図は、変換コードブックの作成手順を示すフロー
図である。
第2図を参照して、以下に変換コードブック41、42、
43を求める手順について説明する。まず、ステップ301
および302において、話者Aおよび話者Bのそれぞれの
音声にLPC分析を施し、パワー、ピッチ周波数およびス
ペクトルパラメータを求める。次に、ステップ303およ
び304において、スペクトルパラメータをベクトル量子
化し、ステップ305および306でパワーをスカラー量子化
し、ステップ307および308においてピッチ周波数をスカ
ラー量子化する。
話者Aおよび話者Bの発声した音声の時間対応をとる
ために、スペクトルパラメータを用いて、ステップ309
においてDouble Split法によるDPマッチングを行なう。
ここで得られた時間対応の情報を基にして、ステップ31
0、311および312において、各特徴量において話者Aと
話者Bの対応関係を求め、ヒストグラムを作成する。ス
ペクトルパラメータおよびパワーの変換コードブック4
1,43は、このヒストグラムを重みとした話者Bの特徴ベ
クトルの線形結合で求める。また、ピッチ周波数の変換
コードブック42は、このヒストグラムの最大値を与える
話者Bの特徴ベクトルで作成する。
第3図は、声質変換部30における声質変換手順を示す
フロー図である。
第3図を参照して、以下に変換コードブックを用いた
声質変換方法について説明する。話者Aの音声信号s2
は、ステップ401においてLPC分析され、パワー、ピッチ
周波数およびスペクトルパラメータが抽出される。
次に、ステップ402において話者Aのスペクトルコー
ドブックからのスペクトルパラメータがベクトル量子化
され、ステップ403において話者Aのパワーコードブッ
クからのパワーがスカラー量子化され、ステップ404に
おいて話者Aのピッチ周波数コードブックからのピッチ
周波数がスカラー量子化される。これらの量子化された
パラメータを復号化する過程において、前述の変換コー
ドブック41、42、43が使用される。すなわち、ステップ
405において、話者Aから話者Bへのスペクトル変換コ
ードブック41を用い、ステップ406において、パワー変
換コードブック43を用い、ステップ407においてピッチ
周波数変換コードブック42を用いる。そして、変換され
た各パラメータを用いてステップ408で話者Bの音声信
号s4が合成される。
第4図は、この発明による規則合成装置を含む規則合
成システムのハードウェア構成を示す概略ブロック図で
ある。
第4図を参照して、この規則合成システムは、アンプ
1とローパスフィルタ2とA/D変換器3とコンピュータ
システム4とを含む。アンプ1は入力された音声信号を
増幅するものであり、ローパスフィルタ2は増幅された
音声号から折返し雑音を除去するものである。A/D変換
器3は音声信号は12kHzのサンプリング信号により、16
ビットのディジタル信号に変換するものである。コンピ
ュータシステム4は、規則合成装置(演算処理部)5と
磁気ディスク6と端末類7とプリンタ8とを含む。この
発明による音声の規則合成装置は第4図の規則合成装置
5内において構成される。
[発明の効果] 以上のように、この発明によれば、取敢えず第1の話
者の音声信号が合成され、続いて第1の話者の声質が第
2の話者の声質に変換されるため、第2の話者の音声を
合成するのに必要なすべてのデータが格納されているも
のに比べて、ファイル手段の容量が小さくなる。
また、第1および第2の話者の音声信号から抽出され
た特徴パラメータがともに量子化されているため、両話
者間の関係を高精度で対応付けた変換コードブックを容
易に作成できるとともに、第1の話者の音声信号から特
徴パラメータを抽出し、その抽出された特徴パラメータ
を量子化し、さらにその量子化された特徴パラメータを
変換コードブックを参照して復号化することにより、第
1の話者の声質を第2の話者の声質に変換しているた
め、第2の話者の音声信号を高い精度で合成することが
できる。
【図面の簡単な説明】
第1図は、この発明による規則合成装置の一実施例を示
すブロック図である。第2図は、変換コードブックの作
成手順を示すフロー図である。第3図は、声質変換部に
おける声質変換手順を示すフロー図である。第4図は、
この発明による規則合成装置を含む規則合成システムの
ハードウェア構成を示す概略ブロック図である。 図において、1はアンプ、2はローパスフィルタ、3は
A/D変換器、4はコンピュータシステム、5は規則合成
装置、10は入力部、20は規則合成部、21は音声単位セッ
ト情報ファイル、30は声質変換部、40は音声個人情報フ
ァイル、50は出力部、s1は文字情報信号、s2は話者Aの
音声信号、s3は話者Bの音声個人情報信号、s4は話者B
の音声信号を示す。
フロントページの続き (72)発明者 鹿野 清宏 京都府相楽郡精華町大字乾谷小字三平谷 5番地 株式会社エイ・ティ・アール自 動翻訳電話研究所内 (56)参考文献 特開 昭58−168098(JP,A) 特開 昭61−166600(JP,A) 特開 昭63−100499(JP,A) 特表 昭62−502571(JP,A) (58)調査した分野(Int.Cl.6,DB名) G10L 3/00 - 3/02 G10L 5/00 - 5/04 G10L 9/18

Claims (1)

    (57)【特許請求の範囲】
  1. 【請求項1】標準となる第1の話者の音声単位信号の集
    合を含み、外部から文字情報信号を受け、前記音声単位
    信号の集合を参照して前記第1の話者の音声信号を合成
    する規則合成手段と、 前記第1の話者の音声信号から抽出されかつ量子化され
    た特徴パラメータと音声に個人的特徴を付与したい第2
    の話者の音声信号から抽出されかつ量子化された特徴パ
    ラメータとの対応関係に基づいて予め作成された変換コ
    ードブックを含むファイル手段と、 前記規則合成手段によって合成された第1の話者の音声
    信号を受け、前記ファイル手段の前記変換コードブック
    に基づいて前記第1の話者の声質を前記第2の話者の声
    質に変換することにより、前記第2の話者の音声信号を
    生成する声質変換手段とを備え、 前記声質変換手段は、 前記第1の話者の音声信号から特徴パラメータを抽出す
    る抽出手段と、 前記抽出手段によって抽出された特徴パラメータを量子
    化する量子化手段と、 前記変換コードブックを参照して前記量子化手段によっ
    て量子化された特徴パラメータを複号化する復号化手段
    とを含む、音声の規則合成装置。
JP63037947A 1988-02-19 1988-02-19 音声の規則合成装置 Expired - Fee Related JP2880508B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP63037947A JP2880508B2 (ja) 1988-02-19 1988-02-19 音声の規則合成装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP63037947A JP2880508B2 (ja) 1988-02-19 1988-02-19 音声の規則合成装置

Publications (2)

Publication Number Publication Date
JPH01211798A JPH01211798A (ja) 1989-08-24
JP2880508B2 true JP2880508B2 (ja) 1999-04-12

Family

ID=12511746

Family Applications (1)

Application Number Title Priority Date Filing Date
JP63037947A Expired - Fee Related JP2880508B2 (ja) 1988-02-19 1988-02-19 音声の規則合成装置

Country Status (1)

Country Link
JP (1) JP2880508B2 (ja)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002229599A (ja) * 2001-02-02 2002-08-16 Nec Corp 音声符号列の変換装置および変換方法

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2642617B2 (ja) * 1985-01-19 1997-08-20 三洋電機株式会社 音声合成装置

Also Published As

Publication number Publication date
JPH01211798A (ja) 1989-08-24

Similar Documents

Publication Publication Date Title
US10535336B1 (en) Voice conversion using deep neural network with intermediate voice training
CN105788589B (zh) 一种音频数据的处理方法及装置
EP1422690B1 (en) Apparatus and method for generating pitch waveform signal and apparatus and method for compressing/decompressing and synthesizing speech signal using the same
US4661915A (en) Allophone vocoder
US8099282B2 (en) Voice conversion system
US7792672B2 (en) Method and system for the quick conversion of a voice signal
JP2002328695A (ja) テキストからパーソナライズ化音声を生成する方法
JPH0869299A (ja) 音声符号化方法、音声復号化方法及び音声符号化復号化方法
JPH01997A (ja) ベクトル量子化を用いた音声認識方式
JPH01998A (ja) スペクトログラムの正規化方法
JP2006171751A (ja) 音声符号化装置及び方法
JPS5827200A (ja) 音声認識装置
JP2001034280A (ja) 電子メール受信装置および電子メールシステム
JP2709926B2 (ja) 声質変換方法
JP2880508B2 (ja) 音声の規則合成装置
JP3354252B2 (ja) 音声認識装置
JP2796408B2 (ja) 音声情報圧縮装置
JPH01211799A (ja) 多言語を扱う音声の規則合成装置
JP3994332B2 (ja) 音声信号圧縮装置、音声信号圧縮方法、及び、プログラム
JPH0738114B2 (ja) フオルマント型パタンマツチングボコ−ダ
JPS6032100A (ja) Lsp型パタンマッチングボコ−ダ
Kim et al. Controllable and Interpretable Singing Voice Decomposition via Assem-VC
JP3921416B2 (ja) 音声合成装置及び音声明瞭化方法
JPH05127697A (ja) ホルマントの線形転移区間の分割による音声の合成方法
TW526466B (en) Encoding and voice integration method of phoneme

Legal Events

Date Code Title Description
LAPS Cancellation because of no payment of annual fees