JPS60140299A - 素片編集型音声分析装置 - Google Patents

素片編集型音声分析装置

Info

Publication number
JPS60140299A
JPS60140299A JP58250106A JP25010683A JPS60140299A JP S60140299 A JPS60140299 A JP S60140299A JP 58250106 A JP58250106 A JP 58250106A JP 25010683 A JP25010683 A JP 25010683A JP S60140299 A JPS60140299 A JP S60140299A
Authority
JP
Japan
Prior art keywords
waveform
pitch
envelope
data
segment
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP58250106A
Other languages
English (en)
Inventor
東福 祐之
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
Nippon Electric Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Electric Co Ltd filed Critical Nippon Electric Co Ltd
Priority to JP58250106A priority Critical patent/JPS60140299A/ja
Publication of JPS60140299A publication Critical patent/JPS60140299A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Electrophonic Musical Instruments (AREA)
  • Reverberation, Karaoke And Other Acoustics (AREA)
  • Electrically Operated Instructional Devices (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 (技術分野) この発明は素片編集型音声合成方式において原音の分析
を行う音声分析装置に関するものである。
(従来技術) 一般に、音声をピッチ区間で抽出した波形を素片波形と
して対応する素片のエンベロープとトモに予め記憶回路
内に種々用意しておき、合成データとして原音波形のピ
ッチ区間毎の素片とエンベロープとを次々検索し、この
検索された素片波形にピッチとエンベロープとを結合し
て合成音を得る型の素片編集型音声合成方式がある。
従来の素片編集型音声合成方式は、ピッチ・エンベロー
プを検索する場合に、原音波形のそのビ、チ区間のデー
タをそのまま一波形ずつ記憶されたものを検索する必要
がおった(特願昭57−61885参照)。この従来の
方式においては、音声のピッチとエンベロープデータを
そのままの形でそれぞれ別に記憶していくので、素片波
形の数が多くなるとそれに比例してデータ量が増加し、
そのため大きな記憶容量を必要とするという欠点を持っ
ていた。また、この装置を集積回路化する場合、メモリ
内に予め記憶できるデータ量には限度があり、記憶容量
を豊富に持たせることは困鼎であるという欠点があった
(発明の目的) 本発明の目的は、このような欠点を除き、高品質の音声
を少ないデータ量で記憶できるようにした音声分析装置
を提供することにある。
(発明の構成) 本発明の構成は、原音波形からピッチ区間t−算出して
素片波形を検索する素片検索部と、この各素片に対応す
るピッチおよびエンベロープを検索するピッチ・エンベ
ローブ検索部とをもつ床片編集型音声分析装置において
、前記検索すべきピッチおよびエンベロープの複数のデ
ータをそれぞれ4差分データとしてあらかじめ記憶した
差分データ記憶手段と、この記憶手段から読出された差
分データによって形成されるピッチおよびエンベロープ
と前記原音波形から抽出されたピッチおよびエンベロー
プとの類似度を計算して最も類似度の高いデータを前記
原音波形のデータとして選択するデータ選択手段とを備
えることを特徴とする。
(実施例) 第1図は本発明の実施例を含むプロ、り図、第2図は本
実施例に用いられる原音およびその抽出波の波形図、第
3図は第2図の抽出波形を正規化した波形図である。こ
のブロック図は、本実施例に相当し音声分析を行ってそ
の波形を記憶する分析部Aと、この分析された素片波形
を合成して所定音声をつくる合成部Bとを含んでいる。
図中、2は入力端子1から入力する原音波形からピッチ
区間(ピッチ周波数)全検出するピッチ検出回路、3は
各種ピッチおよびエンベロープを差分データとして記憶
した差分データ記憶回路、4は原音のピッチ区間から正
規化されたピッチおよびエンベロープ波形をめるピッチ
・エンベロープ計算回路、5は記憶回路3のデータと原
音のデータとの類似度を計算するピッチ・エンベローノ
類似度計算回路、6は各ピーク値間の素片の記憶した素
片記憶回路、7はこれら素片の類似度を計算する類似度
計算回路、8は合成データ記憶回路、9は波形を合成し
て出力端子10から出力する素片波形結合回路である。
なお、この種の回路の具体例としては、特開昭57−1
39799 などが参考になる0 まず、入力端子1から供給される原音波形のピ、チ波形
、エンベロープ波形、素片等を抽出する手順を説明する
音声波形の大部分を占める有声音部の波形は準周期的な
性質を持っているので、入力された原音波形からピッチ
検出回路2において極値をめ、その極値が指定時間の同
量大振幅を保持していればその極値f:最初のピーク値
と定める(第2図参照)。次から新たに極値を捜してい
き指定時間の同量大振幅を保持し、1つ前のピーク値の
振幅に比べ指定した割合よシ振幅が大きければその極値
を波形の次のピーク値と定める。この極値サーチは極太
値、極小値または両方いずれかを指定し、絶対振幅が小
さすぎる極値は選ばないようにしてノイズの影響をなく
しておく。このようにして次々に波形のピーク値を捜し
ていき、ピッチ・エンベロープ計算回路4においてめら
れたピーク値間の時間からピッチ周波数を算出し、ピー
ク値の値からエンベロープの値をめ、ピッチ・エンベロ
ープの最小単位が1になるよう゛正規化を行ない正規化
ピッチ波形・正規化エンベロープ波形をめる(第3図参
照)0 この原音波形から抽出された正規−エンベロープ波形は
、類似度計算回路5におりて、差分データ記憶回路3の
登録差分データとその類似度が計算される。2つの波形
x、yの類似piS (%)を計算する場合、各波形の
サンプリング点の振幅Xi、 ylに対して次式によシ
計算を行う。
すなわち、2つの波形が全く同じなら類似度100係と
なシ、2つの波形が正反対ならは類似度θ%となる。し
たがって、第3図の波形と第2図の波形とは類似度96
.3%となり、また第3図の波形と目盛7の矩形波とは
類似度78.7%となる。
ここで差分データ記憶回路3は、第3図の波形を記憶し
ていたとすると、通常の記憶回路では時刻1.−1.に
対応して波形値(2,6,9,11゜12.11,9,
6.2)が記憶されるはずであるが、この差分データ記
憶回路3の場合は、第1の初期値2と、差分データ+4
.+3. +2.+1および第2の初期値(ピーク値)
12と、差分データー1.−2.−3.−4が1己憶さ
れている。
この差分データ記憶回路3から登録された差分データを
読出して初期値(この場合2)指定された素片敵−まで
IJII算して合成されたエンベロープ波形を形成する
。このように読出されたエンベロープ波形と原音から抽
出された正規化エンベロープ波形(第2図)とから類似
度計算回路5においてその類似度を計、搾して、最も類
似度の高い登録差分データをで択する。
次に登録差分データから作ったエンベロープ波形の第2
の極値(この場合12)を初期値として、次の区間の原
音から抽出した正規化エンベロープ波形と登録差分デー
タから作ったエンベロープ波形との類似度を計算して最
も類似度の高い登録差分データを選んでいく。このよう
にして原音抽出の正規化エンベロープ波形について初期
値と登録差分データ名がめられる。ピッチ波形について
もエンベロープ波形と全く同じ手順で原音抽出正規化ピ
ッチ波形に“ついて初期値と登録差分データ名がめられ
る。
このようにして類似度計算回路5で選んだエンベロープ
およびピッチの登録差分データ名を合成データ記憶回路
8のエンベロープ・ピッチ登録差分データ名記憶部81
に記憶していく。
次に、各ピーク値間の素片を登録素片記憶回路6に登録
されている全ての素片と素片類似度計算回路7で類似度
を計算し、指定された類似度(例えば、95チ以上)よ
シ大きくて最も類似度の高い素片があれば、その区間は
選ばれた登録素片の素片番号を合成データ記憶回路8の
素片、酢号・素片くシ返し数記憶部82に記憶する。も
し、登録されている全部の素片が指定された類似度よp
小さい場合は、そのピーク値間の素片を登録素片記憶回
路6に新たに登録しく特願昭57−61885参照ン、
合成データ記憶回路8の素片番号・素片くシ返し数記憶
部82に記憶し、その区間はこの追加された登録素片の
データを用いる。この時各ピーク値間に対応する登録素
片の素片番号を順番に記憶して編止していく。以上の動
作を連続する2つのピーク値間についてくり返し行なえ
ば全ピーク値間の素片番号・素片くシ返し数がめられる
以上のようにしてエンベロープ登録差分データ名、ピッ
チ登録差分データ名素片番号・素片くり返し数が原音波
形についてまるので、音声波形を合成する場合には、合
成データ記憶回路8のエンベロープ・ピッチ登録差分デ
ータ名記憶部81と素片番号・素片くり返し数記憶部8
2の内容を素片番号順に素片波形結合回路9が読み出し
、エンベロープとピッチの初期値に差分データを加算し
て1素片ごとのエンベロープとピッチとがめられ、素片
番号・素片くシ返し数からめられる素片データにこれら
を合成すれば合成音声波形を出力端子10から出力する
ことができる。
本実施例においては、エンベロープデータ・ピッチデー
タとして初期値だけを記憶しておくだけであとは0〜±
7のような差分データのみを登録しておけばよいので、
記憶するデータ量が非常に少なくなる。また、エンベロ
ープデータとピッチデータで登録差分データとを共通に
使えるので更にデータ量ヲ少なくすることが可能になる
。なお、素片波形系列については、原音波形との類似度
が指定した値より少い場合に、記憶回路に追加すること
により類似度が指定値よシ必ず大きくなっているのでそ
の合成波形は原音波形に類似した品質のよい合成音を得
ることが可能である。
また、類似度の指定を変えることによシ任意に登録素片
波形数と合成音の品質を変えることができるので、必要
な品質に応じて類似度を変えて登録素片波形数を最小に
することができる。
(発明の効果) 以上説明したように、本発明によれば、比較的少数の登
録差分データをエンベロープとピッチとに共通に使用で
き、さらに音声のピッチとエンベロープとを予め登録し
た差分データと初期値と合ぜて比較していくので、原音
のピッチ波形・エンベロープ波形と合成された音のピッ
チ波形・エンベロープ波形とで形状に大きな差がなく、
高品質の合成音を得ることができる。また、登録差分デ
ータの種類を任意に変えて種々の使用状況に応じた合成
音を得ることも可能であシ、その使用目的に応じたハー
ドウェア・磯溝の大きな設計変更も必要なしに共通の装
置で用いることが可能となる。
【図面の簡単な説明】
第1図は本発明の一実施例を含むプロ、り図、第2図は
本発明の波形分析に2ける原音波形と原音抽出正規化エ
ンベロープ波形の一例を示す波形図、第3図は本発明に
おける合成音の正規化エンベロープ波形の一例を示す波
形図である。図において 1・・・・・・原音波形入力端子、2・・・・・・ピッ
チ検出回路、3・・・・・・差分データ記憶回路、4・
・・・・・正規化エンペローフ・ピッチ計算回路、5・
・・・・・エンベロープ・ピッチ類似度計算回路、6・
・曲・登録素片記憶回路、7・・・・・・素片類似度計
算回路、8・・・・・・合成データ記憶回路、9・・・
・・・素片波形結合回路、10・・・・・・合成波形出
力端子、A・・・・・・分析部、B・・・・・・合成部
である。 謬7ffi →を 第、3図

Claims (1)

    【特許請求の範囲】
  1. 原音波形からピッチ区間を算出して素片波形を検索する
    素片検索部と、この各素片に対応するピ、チおよびエン
    ベロープを検索するピッチφエンベロープ検索部とをも
    つ素片編集型音声分析装置において、前記検索すべきピ
    ッチおよびエンベロープの複数のデータをそれぞれ差分
    データとしてあらかじめ記憶した差分データ記憶手段と
    、この記憶手段から読出された差分データによって形成
    されるピッチおよびエンベロープと前記原音波形から抽
    出されたピッチおよびエンベロープとの類似度を計算し
    て最も類似度の高いデータを前記原音波形のデータとし
    て選択するデータ選択手段とを備えることを特徴とする
    素片編集型音声分析装置0
JP58250106A 1983-12-27 1983-12-27 素片編集型音声分析装置 Pending JPS60140299A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP58250106A JPS60140299A (ja) 1983-12-27 1983-12-27 素片編集型音声分析装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP58250106A JPS60140299A (ja) 1983-12-27 1983-12-27 素片編集型音声分析装置

Publications (1)

Publication Number Publication Date
JPS60140299A true JPS60140299A (ja) 1985-07-25

Family

ID=17202903

Family Applications (1)

Application Number Title Priority Date Filing Date
JP58250106A Pending JPS60140299A (ja) 1983-12-27 1983-12-27 素片編集型音声分析装置

Country Status (1)

Country Link
JP (1) JPS60140299A (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH03233500A (ja) * 1989-12-22 1991-10-17 Oki Electric Ind Co Ltd 音声合成方式およびこれに用いる装置
US7089187B2 (en) 2001-09-27 2006-08-08 Nec Corporation Voice synthesizing system, segment generation apparatus for generating segments for voice synthesis, voice synthesizing method and storage medium storing program therefor

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH03233500A (ja) * 1989-12-22 1991-10-17 Oki Electric Ind Co Ltd 音声合成方式およびこれに用いる装置
US7089187B2 (en) 2001-09-27 2006-08-08 Nec Corporation Voice synthesizing system, segment generation apparatus for generating segments for voice synthesis, voice synthesizing method and storage medium storing program therefor

Similar Documents

Publication Publication Date Title
JP2002529772A (ja) 基本波高速発見方法
Bonada et al. Sample-based singing voice synthesizer by spectral concatenation
Scarr Zero crossings as a means of obtaining spectral information in speech analysis
JPH0315758B2 (ja)
JPH0736455A (ja) 音楽イベントインデックス作成装置
JPH079591B2 (ja) 楽器音響解析装置
JPS60140299A (ja) 素片編集型音声分析装置
US4601052A (en) Voice analysis composing method
JPS6332196B2 (ja)
JPS58178399A (ja) 素片編集型音声合成装置
JPS6091227A (ja) 音響解析装置の合成装置
JPS59131996A (ja) 波形発生方法
JP2011090189A (ja) 音響信号の符号化方法および装置
JPH0477320B2 (ja)
JPS633319B2 (ja)
JP2001265400A (ja) ピッチ変換装置及びピッチ変換方法
JPS62182799A (ja) 音響信号解析合成装置
JPS58195890A (ja) 楽音合成装置
JPS648840B2 (ja)
JPS61279898A (ja) 音声合成方式
JPS59162594A (ja) 楽音合成装置
JP3118863B2 (ja) 音階検出装置を用いた楽音発生装置
JPS6097398A (ja) 音響解析装置
JPS60158500A (ja) ピツチ抽出装置
JPS615297A (ja) 楽音形成方法