JP2580566B2 - 音声合成装置 - Google Patents

音声合成装置

Info

Publication number
JP2580566B2
JP2580566B2 JP61061656A JP6165686A JP2580566B2 JP 2580566 B2 JP2580566 B2 JP 2580566B2 JP 61061656 A JP61061656 A JP 61061656A JP 6165686 A JP6165686 A JP 6165686A JP 2580566 B2 JP2580566 B2 JP 2580566B2
Authority
JP
Japan
Prior art keywords
voice
speech
dictionary
key
data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP61061656A
Other languages
English (en)
Other versions
JPS62217300A (ja
Inventor
美聡 石黒
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP61061656A priority Critical patent/JP2580566B2/ja
Publication of JPS62217300A publication Critical patent/JPS62217300A/ja
Application granted granted Critical
Publication of JP2580566B2 publication Critical patent/JP2580566B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Landscapes

  • Reduction Or Emphasis Of Bandwidth Of Signals (AREA)
  • Measuring Volume Flow (AREA)
  • Communication Control (AREA)
  • Machine Translation (AREA)
  • Document Processing Apparatus (AREA)

Description

【発明の詳細な説明】 〔概要〕 合成すべき文節を示す文字列とこの文字列をどのよう
な音声に合成するかを指定する発音情報とからなる音声
データを、各音声データに対応するキーとともに格納し
た音声情報辞書を設け、この音声情報辞書からキーを指
定して所望の音声データを読み出し、読み出された音声
データを音声合成手段に与えることにより、所望の音声
を合成するようにした。
〔産業上の利用分野〕
本発明は音声合成に際し、発音情報を個々に指定する
のではなく、キーを指定することにより、予め作成され
た音声辞書から所望の音声データが得られる音声合成装
置に関する。
〔従来の技術〕 近年音声合成技術の進歩により、パーソナルコンピュ
ータ(以下パソコンと略記する)等においても、音声合
成カードなどの音声合成手段を用いることが可能とな
り、比較的容易に音声を利用するシステムを構築できる
ようになり、これに伴って音声による応答を利用したシ
ステムが種々開発される趨勢にある。
音声合成を行うには、何らかの手段または方法によ
り、文字列と発音情報とを含む音声データを音声合成手
段に与える必要があり、そこでパソコンにおいては、BA
SIC言語でTALK文をサポートするようになって来た。
以下このようなBASIC言語で音声データを指定する例
を説明する。
一例として「山形」と発声させる場合、指定する音声
データとしては、発声させる文節を示す文字列と、これ
に引き続いて、アクセント位置や、音声の高さ等の発音
情報を指定する必要がある。例えば上記「山形」を、第
2拍目にアクセントをおいて発声させるには、 TALK“ヤマガタ:A2" というように記述する。上記TALK文中の‘ヤマガタ’
は、合成すべき文節を指定する文字列で、その後の‘A
2'は、第2拍目にアクセントを置くことを指定する発音
情報、また‘:'は区切記号である。
音声合成を利用したシステムを実現するには、そのシ
ステムプログラム中で、発声させる文節を示す文字列
と、アクセント位置,語頭や語尾のイントネーション,
発声する音程,発音速度,或いは女声か男声かの区分等
を指定する発音情報を記述することが必要で、プログラ
ム実行時にこれらの文字列及び発音情報は、音声合成カ
ードに引き渡されて音声合成が行われる。
〔発明が解決しようとする問題点〕
ところが上記発音情報の記述は、それ自身が煩雑な作
業を必要とする上、同じ文節であっても時と場合により
発音情報は一定でないため、その都度所望の発音情報を
指定する必要があり、多大な工数を要するばかりでな
く、指定した結果をその場で聞いて確かめることができ
ないという問題がある。実際の発声を聞くためには、プ
ログラム中に含まれるTALK文を一つずつ実行させる必要
があり、これまた煩雑な操作となる。そのため、音声合
成を利用するプログラムを作成するのは、必ずしも容易
とは言えない。
そこで本発明は所望の文節と所望の発音情報の指定を
簡単化することを目的とする。
〔問題点を解決するための手段〕
上記目的を達成するため本発明においては、各種音声
データを対応するキーとともに格納した音声情報辞書を
設け、上記キーを指定して音声情報辞書を検索し、所望
の音声データを読み取り、これを音声合成手段に与える
ようにした。
〔作用〕
音声情報辞書には各種音声データが、所定の記述形式
に従って対応するキーとともに格納されているので、キ
ーを指定して上記音声情報辞書を検索することにより、
所望の音声データを容易に得ることができる。従って音
声合成を利用するプログラム中では、上記キーを指定し
て得られた音声データをそのまま音声合成手段に与える
ようにするのみでよいので、処理プログラムの作成が極
めて容易となる。
〔実施例〕
以下本発明の一実施例を図面を参照しながら説明す
る。
第1図は本発明に係る音声合成システムの構成を説明
するための図で、1はオペレーティングシステム、2は
音声合成手段、3,3′は本発明で設けた音声情報辞書
(以下単に音声辞書と略記する)、4は音声データ、5
はキー、6は処理プログラムである。更に7は操作卓、
8は直接アクセスボリューム(DASD)、9はフロッピデ
ィスク装置(FPD)を示す。なお同図の符号3′で示す
ように、音声辞書は通常DASD8やFPD9上に存在する。音
声辞書3はこれを拡大して示したものである。
上記音声辞書3には第2図に見られる如く、音声合成
すべき文節を示す文字列11と、発音情報12からなる音声
データ4が、対応するキー5とともに格納されている。
同図に示す発音情報は、各種パラメータを英文字と数
字各1文字ずつで記述した例であって、英文字のE,A,B,
I,L,Rは、その後に引き続く数字とによって、それぞれ
話調終点変化量,アクセント位置,語尾イントネーショ
ン変化量,発声する音程,発音速度を記述するものであ
る。
同図のキー、‘A0001'及び‘A0002'に対応する文字列
はいずれも「コンニチハ」即ち「今日は」という同一の
文節を示し、これを各々の発音情報によりどのように発
声するかを指定している。同図の例ではアクセント位置
のみが異なり、キー‘A0001'では第3拍目の「ニ」に、
また‘A0002'では第1拍目の「コ」にアクセントを置く
ことを指定している。
このように音声辞書3には、文節が異なる場合のみな
らず、文節は同一であっても発音情報が異なる場合に
も、その各々を示すキーを設け、音声データ4を対応す
るキー5とともに音声辞書3にランダムアクセスファイ
ルとして格納しておく。
かかる音声辞書を用いて音声合成を利用するシステ
ム,例えば音声応答を利用する業務システムを構築した
場合、上記音声辞書を高速で検索し得ることが必要であ
る。もし辞書の検索が遅いと、音声による応答が遅くな
る等の問題が生じる。
高速検索を必要とする場合には、索引順編成ファイル
を構成するのが一般的である。しかし通常パソコンでは
索引順編成ファイルを構成する機能は提供されておら
ず、シーケンシャルファイルとランダムアクセスファイ
ルしか使用できない。前者は構造が簡単であるが検索が
遅く、後者はレコード番号がわかっていれば高速検索が
可能であるという性質がある。
音声辞書の音声データを指定する場合に、そのデータ
が何番目のレコードであるかは一般に不明であるため、
レコード番号を指定して検索することは不可能である。
また音声データの指定を容易にするには、検索しようと
する音声データと何らかの関連のある記号或いは単語を
キーとすることが望ましい。
従ってパソコン上で使用する音声辞書は、関連のある
記号または単語のようなキーで音声データを指定するこ
とができ、このキーを用いることにより高速検索が可能
となる構成であることが必要である。
上記音声辞書3において、音声データ4に対応するキ
ー5を設け、音声データ4をキー5とともに格納したの
は、上記理由によるものである。
音声辞書3を上述のような構成としておけば、キー5
を用いて種々の方法で高速検索を実現し得る。例えば、
上記キー5を用いてインデックスファイルを作成し、こ
のインデックスファイルから指定されたキー5に対する
レコード番号を知り、この番号のレコードを音声辞書3
中で検索し、その音声データ4を読み出す方法等があ
る。
次にこのように構成された音声辞書3を用いる例を説
明する。
音声応答を利用する業務等の処理プログラム6におい
ては、次のようにして上記音声辞書3から音声データ4
を読み出し、音声合成手段2に引き渡す。
いま「今日は」と言う文節を、第1拍目にアクセント
を置いて発声させたいとすると、第2図の2番目の音声
データに対応するキー‘A0002'を指定して音声辞書3を
検索し、対応する音声データ4を読み込むよう、処理プ
ログラム6中で指定する。この操作は例えば前述のよう
に、インデックスファイルを利用する等により実施でき
る。これにより所望の文字列11と発音情報12が得られ
る。
このようにして得られた文字列11と発音情報12は、所
定の記述形式に従ったものであるので、これをそのまま
TALK文に代入する等、通常の方法に従って音声合成手段
2に与える。以上のようにして作成された処理プログラ
ム6を実行することにより、「今日は」という文節を、
所望の如く発声させることができる。
上述のように本実施例においては、処理プログラム6
中で必要な文字列11や発音情報12を一々記述する必要が
なく、所望の音声データ4に該当するキー5を指定して
音声辞書3中を検索し、得られた文字列11と発音情報12
を音声合成手段2に与えるようにするのみで良い。従っ
て音声合成を利用する処理プログラム6の作成が容易と
なる。
上述の説明においては、キー5を英文字を1個と数字
を4個で構成した例を示したが、キー5の構成はこれに
限定される必要はなく、音声データ4と何らかの関連を
持たせるように構成してよい。例えば、文節を連想しや
すいように‘コン01',‘コン02'のように、カナ文字と
数字との組合せにより構成することもできる。音声辞書
3の検索を容易にするためには、上述のように音声辞書
3内のレコードを、このキー5を用いて一定の規則に従
って検索し得る必要がある。従ってキー5は上記レコー
ドの論理的順番を決めるのに適したものであれば良く、
更に音声データ4を選択する際に便利なように構成され
ていれば良い。
第2図に示した発音情報12は一つの例であって、指定
法や種類も同図の例に限定されるものではない。例え
ば、発音情報としては同図に示した6個以外に、男性の
声か女性の声かの区別や、アクセントの強調量等があ
り、音声辞書3にこれらの指定を含めてよい。
この音声辞書3は通常はDASD8或いはFPD9に格納され
ているが、音声辞書を使用する際に音声データの検索を
高速化するためには、音声合成システムの主記憶装置上
に配置することが望ましいが、音声辞書3が小さい場合
を除き、通常はDASD8或いはFPD9上の音声辞書3を、そ
のまま使用する。特にこの方法は、音声辞書3が大きな
ものであって主記憶装置上に配置することが困難な場
合、或いは検索速度がそれ程問題でない場合等に用いら
れる。
また音声辞書3はDASD8やFPD9上に置いておき、キー
5を用いて検索を作成して主記憶装置上に配置し、この
索引を参照してDASD8或いはFPD9上の音声データを検索
する等の方法を使用することも可能である。
このように音声辞書3の配置場所や検索方法も種々選
択し得るものである。
なお本実施例では説明の便宜上、文字列11の長さが5
文字の例を示したが、文字列11の長さはこれに限定され
るものではなく、任意に選択し得るものであること、ま
た発音情報12も、図示した以外の各種のものを指定でき
ること等は、特に説明するまでもない。
〔発明の効果〕
以上説明した如く本発明によれば、一々煩雑な操作を
要する発音情報の指定を行う必要がなく、単にキーを選
択するのみで音声データを指定することが可能となり、
音声合成を使用する処理プログラムの作成が容易とな
る。
【図面の簡単な説明】
第1図は本発明の構成説明図、 第2図は音声情報辞書の構成説明図である。 図において、2は音声合成手段、3,3′は音声情報辞
書、4は音声データ、5はキー、6は処理プログラム、
11は文字列、12は発音情報を示す。

Claims (1)

    (57)【特許請求の範囲】
  1. 【請求項1】音声合成手段を有し、該音声合成手段に音
    声合成すべき文節を示す文字列と該文字列に対するアク
    セント位置、語頭や語尾のイントネーション、発声する
    音程、発音速度、女声か男声かの区分等の発音情報とか
    らなる音声データを与えて音声合成を行う音声合成装置
    において、 前記音声合成すべき文節を示す文字列の各々に対応する
    複数の音声データ毎に、該音声データに対応するキーを
    付加し、該音声データを該キーとともに格納する音声情
    報辞書を設け、 音声合成に際しては、所望の音声データを示すキーを用
    いて前記音声情報辞書を検索し、対応する音声データを
    読み出し、読み出された音声データを前記音声合成手段
    に与えるようにしたことを特徴とする音声合成装置。
JP61061656A 1986-03-18 1986-03-18 音声合成装置 Expired - Fee Related JP2580566B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP61061656A JP2580566B2 (ja) 1986-03-18 1986-03-18 音声合成装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP61061656A JP2580566B2 (ja) 1986-03-18 1986-03-18 音声合成装置

Publications (2)

Publication Number Publication Date
JPS62217300A JPS62217300A (ja) 1987-09-24
JP2580566B2 true JP2580566B2 (ja) 1997-02-12

Family

ID=13177482

Family Applications (1)

Application Number Title Priority Date Filing Date
JP61061656A Expired - Fee Related JP2580566B2 (ja) 1986-03-18 1986-03-18 音声合成装置

Country Status (1)

Country Link
JP (1) JP2580566B2 (ja)

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS58165143A (ja) * 1982-03-26 1983-09-30 Fujitsu Ltd 漢字記憶方式
JPS5972495A (ja) * 1982-10-19 1984-04-24 株式会社東芝 文字音韻変換装置

Also Published As

Publication number Publication date
JPS62217300A (ja) 1987-09-24

Similar Documents

Publication Publication Date Title
JPH03224055A (ja) 同時通訳向き音声認識システムおよびその音声認識方法
JP4738847B2 (ja) データ検索装置および方法
JP2580566B2 (ja) 音声合成装置
JP2002278579A (ja) 音声データ検索装置
JP3371761B2 (ja) 氏名読み音声合成装置
JP3758241B2 (ja) 音声情報検索装置
JP3201329B2 (ja) 音声合成装置
JPS6083136A (ja) プログラム読上装置
JP3379643B2 (ja) 形態素解析方法および形態素解析プログラムを記録した記録媒体
JP3873305B2 (ja) 仮名漢字変換装置および仮名漢字変換方法
JP3187671B2 (ja) 電子辞書表示装置
JPS646499B2 (ja)
JPS62119591A (ja) 文章読上げ装置
JPH05216887A (ja) 中国語の発音表記/漢字変換装置および方法
JPH0821031B2 (ja) 言語解析装置
JPH08194494A (ja) 文解析方法および装置
JPH05282293A (ja) 文書作成装置
JPS62217299A (ja) 音声合成システム
JPS62282364A (ja) 文字列検索方式
JPS62145463A (ja) 仮名漢字変換方式
JPS59116835A (ja) 短縮入力機能付日本語入力装置
JP3048793B2 (ja) 文字変換装置
JPH1049523A (ja) 文章作成装置及び方法
JPH07210571A (ja) 単語検索処理装置及び単語検索処理方法
JPH0457148A (ja) 文書作成装置

Legal Events

Date Code Title Description
LAPS Cancellation because of no payment of annual fees