JPS63126000A - 区間音声抽出方式 - Google Patents

区間音声抽出方式

Info

Publication number
JPS63126000A
JPS63126000A JP61271802A JP27180286A JPS63126000A JP S63126000 A JPS63126000 A JP S63126000A JP 61271802 A JP61271802 A JP 61271802A JP 27180286 A JP27180286 A JP 27180286A JP S63126000 A JPS63126000 A JP S63126000A
Authority
JP
Japan
Prior art keywords
data
audio
speech
input
nasal
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP61271802A
Other languages
English (en)
Inventor
裕一 高橋
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hitachi Ltd
Original Assignee
Hitachi Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi Ltd filed Critical Hitachi Ltd
Priority to JP61271802A priority Critical patent/JPS63126000A/ja
Publication of JPS63126000A publication Critical patent/JPS63126000A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Measurement And Recording Of Electrical Phenomena And Electrical Characteristics Of The Living Body (AREA)
  • Telephonic Communication Services (AREA)
  • Mobile Radio Communication Systems (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 〔慮業上の利用分野〕 不発明は、任肱の複数の音声データを組合わぜて文章を
講成し発声する。自動音声応答!J装置、自動音声楽内
装社寺、音声合成装置の音声データ作成に関するもので
ある。
〔従来の技術〕
複数の音P索片を結合し文章全発生させる音声合成方式
は、日経エレクトロニクス7 、2 (1984年)第
122頁から第141頁において論じられている。しか
し1本文献でも第122頁、第126頁に述べられてい
る様に、従来の音声合成方式では、音声データの結合法
が十分には確立しておらず、音声の途切れによりクリッ
ク音が発生する。音と廿のつながり力;不自然である等
の点については配慮が不十分であった。
〔発明が解決しようとする問題点〕
上記従来技術は、音声データの結合の点についての配慮
が不十分であり1発声時にクリック音が発生し7tD、
なめらかな音声が得られない等の間“題が有った。天だ
、上記問題点を回避する為に、従来は音声抽出の試行回
数を増力口させていたが、最適データの作成に多大の労
力を要するという問題があった。
本発明の目的は、音声データを結合し音声合成した際、
聴者が異和感無くなめらかに感じる音声−データを容易
に作成できる方式を提供することにある0 〔問題点を解決するための手段〕 上記目的は、祈μ分析装置に入力した音声を母音性区間
と鼻音性区間とに分割し、目的とする音声区間を母音及
び鼻音の数により指定し確定する事により、達成される
〔作用〕
本発明においては、入力音声データより抽出したい背戸
区間全指定する方法として、母音及び鼻音の数を指定す
る方法を用いる為、音声区間を正確に抽出できる。
また、音声区間を指定する為の手段が数値入力であるた
め入間の感覚にたよる必要が無く操作が、容易であり、
音声データ作成の労力が軽減でき罎〔夫画例〕 以下、本発明の一実施例をg1図−11g5図によって
説明する。
第1図は本発明V′c係る音声分析合成装置の一実施例
を示すブロック図でるる。第1図に示す94施例は、音
声を取り込むマイクロフォン1と、このマイクロフォン
1を介して取り込んだ音声信号の周波数帯域を制限する
ローパスフィルタ2と、ローパスフィルタ2から出力さ
れた信号をディジタルデータに変換するサンプル&ホー
ルド3及ヒA/Dコンバータ4と、サンプル&ホールド
3及びA/Dコンバータ4により変換されたディジタル
データを記憶する音声メモリ5と、−#声メモリ5に記
憶されたグイジタルデータ全アナログの信号“i’l[
LfるD/Aコンバータ6と、D/Aコンバータ6より
出力される信号の周波a栄職を制限するローパスフィル
タ7と、  ローパスフィルタ7より出力される信号を
音声に変換するスピーカ8と、装置全体を制御するCC
9と、数置情報を投入するためのキーボード10と、分
析したディジタルデータを蓄積するファイル記憚装[1
1と、清報表示の。
ためのディスプレイ12とを含んで構成される。
次に上記構成から成る実施例の作用を説明する。
マイクロフォン1を介して入力された音声信号は、A/
Dコンバータ4でのいわゆるナイキストレートの半分以
下に周波数帯域を制限する為、ローパスフィルタ2に入
力される。次いでローパスフィルタ2より出力された音
声信号は、テンプル&ホールド6及びA / Dコンバ
ータ4によりディジタルデータに変換され、 fF’メ
モリ5に順次蓄積される。さらに音声メモリ5に讐積さ
れた音声データはCC9により分析され、母音性区間と
4背任区間に分割され、ディスプレイ12に母音及び鼻
音の列として、第4図Aに一例を示すがごとく表示する
。このディスプレイ12に表示された母音及び鼻−4列
よυ、目的とする音声区間をキーボード1Uより、第5
図に一例を示すがごとく入力しCC9はこの入力値に該
当する区間のfyytデータ列を廿。
戸メモリ5よりファイル記憶装置11に転送し蓄積する
事により、一つの区間音声の抽出を終了するにこで、区
間音声抽出の基本的な処理の流れについて説明する。第
2図は分析する音声として装置に入力する音声の発Pf
カナ文字で表現したものの一列を示したものである。す
なわち、例えば駅での列車の到涜案内に関するものであ
れば、ゴパンセンニデンシャガハイツテキマスJ )f
%が入力され、これを、「ゴバン」と「セン」と「二」
ト「デンシャガハイツテキマス」の各区間音声に分解す
るものとする。上記tFiの振gV形は第6図Aで示す
様な波形になる。ここで音声データを特徴づけるパラメ
ータとして、第1ホルマント周vILaをi+′1(t
)、′!た、美音性周波数パラメータf i?’nas
allt)とし、時間tによる関数、P(j)= α、
 F 1内+Fnasal(t)  Q=Constを
考える。音声データに対応するP内は第6図Bで我され
、 P(t)に対し適当なしきい値を与える事によυ%
帛3図Cに示す様に母音性区間と鼻音性区間の判別を行
う。さらに音声のエネルギー分布等各櫨バ2メータrA
数によりしきい直判別を行い連続した鼻音や母音を区間
分けし、第3図りに示す様な母音と子音の各区間を得る
第4図Aは、第6図Aに示した入力音声を、母音性区間
と鼻音性区間とに分割した紹果をディスプレイ12に表
示した例であり、谷区間は、第4図Bに示した谷母廿及
び鼻音の文字に対応している。−これより目的とする区
間音声を、第5図に一例を示す様な文字列によりキーボ
ード10より入力する事により、CC9は入力文字列に
基き、該当する区間音声データを音声メモリより抽出し
、ファイル記憶装置11に蓄積し、一つの区間音声の抽
出を終了する。
第1図は以上の手順により作成した各種の区間fFをA
/Dコンバータ6及びローパスフィルタ7及びスピーカ
8により合成しモニタを行う手段に関しても示している
。第2図は入力音声データを区間音声に分解し、あらか
じめ分析蓄積しておいた他の区間音声と組み合わせ発声
させた例である。すなわチ、「ゴパンセ/ニデンシャガ
ー1イツテキマス」の入力音声データを前記分析手順に
より各区間音声データである「ゴバン」、「セン」。
「二」、「デ/シャガハイツテキマス」に分解し8、あ
らかじめ別に分析しておいた区間音声である「ワ」、「
ホンジツ」、「タイヘンコンザツシテオリマス」と組み
合わせ、「ホンジツワ ゴバンセ7’)  I’イヘン
コンザツシテオリマス」の発声ヲ行った例である。
なお、前記で述べた母音性区間と鼻音性区間の表示は、
背戸g識によシ直接文字により表示する方法が考えられ
るが、その場合にも本発明の効果が同等に得られる事は
いうまでもない。
〔発明の効果〕
以上述べた様に本発明によれば、入力音声データを任意
の複数の区間音声に分解し、さらに区間音声を種々の組
合せにより接続し発声させる廿ト分析装置において、区
間音声を正確に抽出するために、入力音声を母音性区間
と鼻音性区間とに分解し母音及び鼻音の数により目的と
する音声の区間を確定するので結合時に不自然さの無い
区間音声データが容易に抽出できる効果がある。
【図面の簡単な説明】
第1図は本発明の一実施例のf戸分析合成装置のブロッ
ク構成図、第2図は実施例により処理されるデータの例
を示した説明図、第3図は本発明における分析例を示し
た波形図、第4図は実施例における出力表示例を示す説
明図、第5図は実施例における入力文字列の例を示す説
明図である。 1・・・マイクロフォン、 2・・・ローパスフィルタ、 5・・・音声メモリ、 7・・・ローパスフィルタ。 8・・・スピーカ、 9・・・制御回路、 10・・・午−ボード。 11・・・ファイル記憶装置、 12・・・ディスプレイ。 ・・ゐ Hi、。 B    二\2ρ、ノ凸Δ。乙=:\、夕r  ←し
さい心Lc           、−二− −8を D  1几汀「羽」−

Claims (1)

    【特許請求の範囲】
  1. 1、音声信号を入力する手段と、入力された音声信号を
    任意の構成要素の音声データに分解する手段と、分解さ
    れた音声データを蓄積する手段とを少なくとも有する音
    声分析合成装置において、入力音声データの母音性区間
    と鼻音声区間を確定する手段を設けると共に、母音の数
    と鼻音の数を設定する為の入力手段とを設けてなり目的
    とする音声区間を母音数と鼻音数により指定し抽出でき
    るようにした事を特徴とする区間音声抽出方式。
JP61271802A 1986-11-17 1986-11-17 区間音声抽出方式 Pending JPS63126000A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP61271802A JPS63126000A (ja) 1986-11-17 1986-11-17 区間音声抽出方式

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP61271802A JPS63126000A (ja) 1986-11-17 1986-11-17 区間音声抽出方式

Publications (1)

Publication Number Publication Date
JPS63126000A true JPS63126000A (ja) 1988-05-30

Family

ID=17505054

Family Applications (1)

Application Number Title Priority Date Filing Date
JP61271802A Pending JPS63126000A (ja) 1986-11-17 1986-11-17 区間音声抽出方式

Country Status (1)

Country Link
JP (1) JPS63126000A (ja)

Similar Documents

Publication Publication Date Title
US5696879A (en) Method and apparatus for improved voice transmission
US20220013120A1 (en) Automatic speech recognition
JPS62160495A (ja) 音声合成装置
CN110265028A (zh) 语音合成语料库的构建方法、装置及设备
JPH0823757B2 (ja) 音声の区分化方法
CN112185341A (zh) 基于语音合成的配音方法、装置、设备和存储介质
Joshi et al. Text to speech system for Kannada language
JP3518898B2 (ja) 音声合成装置
JP6291808B2 (ja) 音声合成装置及び方法
JP2002525663A (ja) ディジタル音声処理装置及び方法
JPS63126000A (ja) 区間音声抽出方式
Kamble et al. Audio Visual Speech Synthesis and Speech Recognition for Hindi Language
JP3094622B2 (ja) テキスト音声合成装置
JP2008058379A (ja) 音声合成システム及びフィルタ装置
Sudhakar et al. Development of Concatenative Syllable-Based Text to Speech Synthesis System for Tamil
JPH05224689A (ja) 音声合成装置
JPH05281984A (ja) 音声合成方法および装置
JPS5880699A (ja) 音声合成方式
Melov et al. Emphatic word detection based on syllable durations
JPS6073595A (ja) 音声入力装置
JPS63131191A (ja) 規則型音声合成装置
JPS62113264A (ja) 音声文書作成装置
JPS61166600A (ja) 音声合成装置
JPS6295595A (ja) 音声応答方式
Fant Speech analysis and features