JPS61236598A - 単語音声登録方式 - Google Patents

単語音声登録方式

Info

Publication number
JPS61236598A
JPS61236598A JP60078047A JP7804785A JPS61236598A JP S61236598 A JPS61236598 A JP S61236598A JP 60078047 A JP60078047 A JP 60078047A JP 7804785 A JP7804785 A JP 7804785A JP S61236598 A JPS61236598 A JP S61236598A
Authority
JP
Japan
Prior art keywords
pattern
word
syllable
phoneme
matching
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP60078047A
Other languages
English (en)
Inventor
沢井 秀文
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ricoh Co Ltd
Original Assignee
Ricoh Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ricoh Co Ltd filed Critical Ricoh Co Ltd
Priority to JP60078047A priority Critical patent/JPS61236598A/ja
Publication of JPS61236598A publication Critical patent/JPS61236598A/ja
Pending legal-status Critical Current

Links

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 仮土分■ 本発明は、音声認識装置の標準パターン登録方式に関す
るものであり、音韻または音節の連結で単語音声を合成
する音声の規則合成方式に応用可能なものである。
従来技血 音声認識装置における単語音声を登録する場合、語数の
増加に伴って発声者の負担が大きくなったり、認識処理
量やメモリー量が増加したり、認識率の低下等を招くた
め、単語より小さい音韻や音節単位を標準パターンとし
て登録したり、これを認識単位に用いる研究が進んでい
る。しかし、音韻や音節単位の連結で単語音声を合成す
る場合には、調音結合を考慮して連結することが難しい
点や、連結部分での不整合等により不自然な合成パター
ンとなり、質の良いパターンを作成することが困難であ
るという欠点があった。
皿 本発明は、上述のごとき実情に鑑みてなされたもので、
特に、音韻または音節等の連結で単語音声を合成する単
語音声登録方式において、連結パターンが自然に発声さ
れた単語音声パターンに類似するような高品質の合成パ
ターンを提供することを目的とするものである。
1底 本発明は、上記目的を達成するため、音韻又は音節の連
結で単語音声を合成する単語音声認識の合成装置におい
て、音韻又は音節連結部での一定フレーム内で、パワー
パターンの形状が最も類似するように連結して単語を合
成した後、予め他人の発声した同一名称の単語パターン
の時間構造に類似するように動的計画法(DPマツチン
グ)により連結パターンを時間伸縮して自然な発声に近
いパターンを得ることを特徴としたものである。
以下、本発明の実施例に基づいて説明する。
第1図は、本発明の一実施例を説明するためのシステム
ブロック図で、図中、1は単語音声入力部、2は特徴量
変換部、3は音韻(音節)セグメント抽出部、4は音韻
(音節)分類部、5は音韻(音節)辞書登録部、6は単
語の音fIJI(音節)構成テーブル格納部、7は連結
単語合成部、8は単語標準パターン登録部である。
まず、単語音声入力部1で入力された単語音声は、特徴
量変換部2で特徴分析され、パワースペクトラムや、L
PG係数、LPCケプストラム係数等の特徴量に変換さ
れる。音韻(音節)セグメント抽出部3で単語音声中か
ら視察ないしは自動的なセグメンテーション法により音
fit(音節)の境界が決定され、各音韻(音節)がセ
グメントとして抽出される。これらのセグメントを各種
類別に、音I1M(音節)辞書登録部5に音韻(音節)
辞書として登録する。したがって、単語音声入力部1で
入力する単語音声は全ての種類の音韻(音節)を含んだ
複数の単語音声である必要がある。
次に、音韻(音節)辞書登録部5で登録済みの音韻(音
節)セグメントの連結で任意の単語を合成するが、予め
作成したい単語のリストは単語の音11!(音節)構成
テーブル格納部6の単語の音韻(音節)構成テーブルで
表現しておく。このテーブルに従って連結単語合成部7
で音韻(音節)連結辞書を合成する。合成辞書は後述す
る種々のパターン改良を加えた後に単語標準パターン登
録部8で登録された単語標準パターンとして格納される
第2図は、第1図で説明した音韻(音節)のセグメンテ
ーション及び単語の合成・登録の具体例を説明するため
の図であり、第2図の特徴量変換部2の2種の発声用単
語「山水画」と「絵葉書」から、10種の音韻(音節)
 *SA、  *Su。
u*I、IGA、AI、*E、EHA、AGA。
AKl、TIを音韻(音節)セグメント抽出部3にてセ
グメンテーションにして抽出し、アルファベットや50
音等の順序で、音韻(音節)分類部4で分類する。音韻
(音節)分類部4の分類から未登録の音韻 (音節)の
みを選択し音韻(音節)辞書登録部5に登録する。単語
構成テーブル6には例えば「札幌」や「佐賀」等の都市
名とそれらの音韻(音節)構成テーブルが格納されてお
り、今「佐賀」なる単語を連結単語合成部7で11IS
A。
AGA、AIなる音till(音節)から合成すること
ができる。このようにして3種の音韻(音節)パターン
の連結で単語標準パターンr*5AGA*Jが単語標準
パターン登録部8で合成できる。
しかしながら、音韻(音節)を単に連結した場合には、
連結部でのパターンのギャップによる不整合や、連結単
語内での音韻(音節)位置が通常の発声単語に比べて時
間構造の異なりが生じるため、自然なパターンとはなら
ない欠点が生じる。
そこで、以下には、これらの欠点を解消し、高品質で自
然な単語パターンを合成する方法について述べる。
第3図は、自然な単語パターンを作成するための音韻(
音節)連結法を説明するための図であり、(a)図に示
すように各音韻(音節)の連結部(斜線部)で一定長の
フレーム(通常3〜7フレーム)を重ね合わせて平均を
とり、連結部をスムースに連絡する。また(b)図では
連結部(斜線部)で台形で表わされる関数で重み付けし
て重ね合わせ、(a)図の場合と同様にスムースに連絡
できる。また、(c)図では連結部(斜線部)をずらし
ながら各フレーム毎に相互相関係数を計算し、この係数
が極大となるように重ね合わせて平均化している。
第4図は、第3図で説明した方法によって作成した連結
パターンの時間的な伸縮法を説明するための図で、(a
)図において、基準パターンは、他人が単語単位で自然
に発声したパターンを用い、連結パターンとのDPマツ
チングを行って、連結パターンの時間伸縮を行う、この
結果、DPパスAが決定されるが、基準パターンの時間
構造に類似させるように、DPパスに従って連結パター
ンを伸縮させて新たに登録する。(b)図は、伸縮後の
連結パターンを示す。
第5図は、第4図の基準パターンの作成法を説明するた
めの図で、連結パターンの発声者とは異なる話者の発声
パターンを第5図のようにM人(通常、数人程度でよい
)分用窓する。すなわち、第5図において、aは話者l
のパターン、mは話者mのパターン、Mは話者Mのパタ
ーンであり、これらM個のパターンを第4図に示した方
法と同様の方法で、DPマツチングを行って重ね合わせ
て平均パターンを作成すると、話者M人の平均パターン
2ができる。
また、第6図は、連結パターン作成法の他の方法を説明
するための図であり、図中、aは話者1のパターン、m
は話者mのパターン、Mは話者Mのパターン、alは話
者aのDPパス、mlは話者mのDPババスMlは話者
MのDPパスで、各話者毎の基準パターンに従って連結
パターンをDPマツチングにより伸縮する。すると、話
者毎に連結パターンの伸縮状態がaZ・・・mz・・・
M2にて示すようになり、これらは当然異なるが、これ
らM個の伸縮パターンを第5図で述べた基準パターンの
平均パターン作成法と全く同様にして、再び伸縮し、平
均パターンZを作成することもできる。
以上、第3図〜第6図でのパターンの平均化、マツチン
グ等の際に用いるパターン形状としては各音声パターン
のパワー形状を用いても良いし、特徴パラメータを用い
てもよい。また、両者を併用することも勿論可能である
また、第1図あるいは第2図の音韻(音節)セグメント
抽出部3で音韻(音節)を抽出する際に、通常セグメン
ト位置の不確定が生じるが、これは特に母音部や2重母
音部で著しいので、連結部で母音部が重なる際には、時
間構造が不自然になり易い。したがって、この欠点を除
く為には、音韻(音節)中の母音部の継続フレーム長を
一定値ないしはある範囲(例えば3〜10フレーム)内
に制限することにより、連結パターンをより自然な発声
パターンに近づけることもできる。
班果 以上の説明から明らかなように、本発明によると、音韻
(音節)連結パターンの連結部が滑らかに結合され、且
つ単語全体としても音韻の時間構造を自然に発声された
単語パターンに類似させることが可能となるので、高品
質な単語標準パターンを合成することができる。
【図面の簡単な説明】
第1図は、本発明の一実施例を説明するためのシステム
ブロック図、第2図は、第1図に示した音韻のセグメン
テーション及び単語の合成、登録の具体例を示す図、第
3図は、音韻連結法を説明するための図、第4図は、連
結パターンの時間的な伸縮法を説明するための図、第5
図は、基準パターンの作成法を説明するための図、第6
図は、連結パターン作成法の他の例を説明するための図
である。 1・・・単語音声入力部、2・・・特徴量変換部、3・
・・音韻(音節)セグメント抽出部、4・・・音IIM
(音節)分類部、5・・・音8(音節)辞書登録部、6
・・・単語の音韻(音節)構成テーブル格納部、7・・
・連結単語合成部、8・・・単語標準パターン登録部。 第 1 図 第 3 図 (C) 第4r:IJ (G)                (b)蟇卆パ
ターン 菓 5 図 *S  A G  静 第6国

Claims (5)

    【特許請求の範囲】
  1. (1)、音韻又は音節の連結で単語音声を合成する単語
    音声認識の合成装置において、音韻又は音節連結部での
    一定フレーム内で、パワーパターンの形状が最も類似す
    るように連結して単語を合成した後、予め他人の発声し
    た同一名称の単語パターンの時間構造に類似するように
    動的計画法(DPマッチング)により連結パターンを時
    間伸縮して自然な発声に近いパターンを得ることを特徴
    とする単語音声登録方式。
  2. (2)、音韻又は音節のパワーパターンの形状の代わり
    に、特徴パラメータの値をパターンマッチングの際に用
    いることを特徴とする特許請求の範囲第(1)項に記載
    の単語音声登録方式。
  3. (3)、基準パターンとして、複数の話者の単語パター
    ンをDPマッチングによつて時間伸縮して平均化して作
    成することを特徴とする特許請求の範囲第(1)項又は
    第(2)項に記載の単語音声登録方式。
  4. (4)、基準パターンとして、複数の話者の単語パター
    ン毎に連結パターンを伸縮し、これら話者毎に伸縮され
    た連結パターンを、DPマッチングによつて再び時間伸
    縮した後に平均化して作成することを特徴とする特許請
    求の範囲第(1)項又は第(2)項に記載の単語音声登
    録方式。
  5. (5)、音韻又は音節セグメント内の母音部の継続フレ
    ーム長を一定値あるいは一定範囲内に固定して連結パタ
    ーンを作成することを特徴とする特許請求の範囲第(1
    )項又は第(2)項に記載の単語音声登録方式。
JP60078047A 1985-04-12 1985-04-12 単語音声登録方式 Pending JPS61236598A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP60078047A JPS61236598A (ja) 1985-04-12 1985-04-12 単語音声登録方式

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP60078047A JPS61236598A (ja) 1985-04-12 1985-04-12 単語音声登録方式

Publications (1)

Publication Number Publication Date
JPS61236598A true JPS61236598A (ja) 1986-10-21

Family

ID=13650935

Family Applications (1)

Application Number Title Priority Date Filing Date
JP60078047A Pending JPS61236598A (ja) 1985-04-12 1985-04-12 単語音声登録方式

Country Status (1)

Country Link
JP (1) JPS61236598A (ja)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH01219797A (ja) * 1988-02-29 1989-09-01 Fujitsu Ltd 音声認識装置
JPH0588692A (ja) * 1991-01-25 1993-04-09 Matsushita Electric Ind Co Ltd 音声認識方法
JPH05188988A (ja) * 1992-01-14 1993-07-30 Matsushita Electric Ind Co Ltd 音声認識方法
JP2007538278A (ja) * 2004-05-21 2007-12-27 ハーマン ベッカー オートモーティブ システムズ ゲーエムベーハー 音声認識システム

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH01219797A (ja) * 1988-02-29 1989-09-01 Fujitsu Ltd 音声認識装置
JPH0588692A (ja) * 1991-01-25 1993-04-09 Matsushita Electric Ind Co Ltd 音声認識方法
JPH05188988A (ja) * 1992-01-14 1993-07-30 Matsushita Electric Ind Co Ltd 音声認識方法
JP2007538278A (ja) * 2004-05-21 2007-12-27 ハーマン ベッカー オートモーティブ システムズ ゲーエムベーハー 音声認識システム

Similar Documents

Publication Publication Date Title
US7010488B2 (en) System and method for compressing concatenative acoustic inventories for speech synthesis
US5940797A (en) Speech synthesis method utilizing auxiliary information, medium recorded thereon the method and apparatus utilizing the method
US5812974A (en) Speech recognition using middle-to-middle context hidden markov models
JPH0632020B2 (ja) 音声合成方法および装置
JPS61236598A (ja) 単語音声登録方式
JPS6097396A (ja) 音声合成装置
US20060004578A1 (en) Method for controlling duration in speech synthesis
JPH08248993A (ja) 音韻時間長制御方法
JPS5880699A (ja) 音声合成方式
JP3241582B2 (ja) 韻律制御装置及び方法
JP3771565B2 (ja) 基本周波数パタン生成装置、基本周波数パタン生成方法、及びプログラム記録媒体
JPS5842099A (ja) 音声合成方式
JPS6295595A (ja) 音声応答方式
JPH11161297A (ja) 音声合成方法及び装置
JPS6067998A (ja) 音声合成装置
JPH06149283A (ja) 音声合成装置
JPS63285596A (ja) 音声合成における発話速度変更方式
JPS61166600A (ja) 音声合成装置
JPS60205596A (ja) 音声合成装置
JPS60205597A (ja) 音声合成装置
JPS63131191A (ja) 規則型音声合成装置
JPS6147991A (ja) 音声の時間長デ−タ生成装置
JPS60115997A (ja) 音声合成方式
JPS5945498A (ja) 録音編集方式音声合成装置
JPS6325700A (ja) 長音結合方法