JPH06342297A - 音声合成装置 - Google Patents

音声合成装置

Info

Publication number
JPH06342297A
JPH06342297A JP5130932A JP13093293A JPH06342297A JP H06342297 A JPH06342297 A JP H06342297A JP 5130932 A JP5130932 A JP 5130932A JP 13093293 A JP13093293 A JP 13093293A JP H06342297 A JPH06342297 A JP H06342297A
Authority
JP
Japan
Prior art keywords
voice
pause
data
text
speech
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
JP5130932A
Other languages
English (en)
Inventor
Yusuke Iwahashi
祐輔 岩橋
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sony Corp
Original Assignee
Sony Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sony Corp filed Critical Sony Corp
Priority to JP5130932A priority Critical patent/JPH06342297A/ja
Publication of JPH06342297A publication Critical patent/JPH06342297A/ja
Withdrawn legal-status Critical Current

Links

Landscapes

  • Machine Translation (AREA)
  • Document Processing Apparatus (AREA)

Abstract

(57)【要約】 【目的】 より人間の発話に近い合成音を得る。 【構成】 音声合成データ作成部1が、入力されたデー
タを構文解析し、その解析結果に基づいて、音声合成部
2により合成される音声に挿入するポーズの位置情報を
生成する。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、音声を合成する音声合
成装置に関する。
【0002】
【従来の技術】従来の音声合成装置においては、例えば
テキストが入力されると、そのテキストにしたがった音
声が合成されて出力されるようになされている。
【0003】さらに、このような音声合成装置では、テ
キストの、例えば句読点の位置や、係助詞「は」、
「が」の直後で、所定時間のポーズが挿入されるように
なされており、これにより、人間の発話に近い合成音が
生成されるようになされている。
【0004】
【発明が解決しようとする課題】ところで、上述の音声
合成装置では、例えば「彼、君、私」などのような並列
句のあるテキストが入力された場合においても、「彼」
と「君」の間、「君」と「私」の間に所定時間のポーズ
が挿入される。
【0005】従って、この場合、装置から出力される合
成音は、いわばぶつ切り音になり、その内容を理解する
ことが困難になる課題があった。
【0006】さらに、この音声合成装置では、係助詞
「は」の後、例えば「ある」や「いる」などの短い補助
動詞的な単語でテキストが終結している場合において
も、上述のように、係助詞「は」の直後に所定時間のポ
ーズが挿入される。
【0007】通常、人間が、このようなテキストを朗読
する場合、係助詞「は」の直後に息継ぎが行われること
はほとんどなく、従って、違和感のある合成音が出力さ
れる課題があった。
【0008】また、テキストに句読点の記述がなかった
場合には、ポーズが挿入されず、やはりその内容を理解
することが困難になる課題があった。
【0009】本発明は、このような状況に鑑みてなされ
たものであり、より人間的な合成音を得ることができる
ようにするものである。
【0010】
【課題を解決するための手段】本発明の音声合成装置
は、入力されたデータから、音声合成データを生成する
とともに、入力されたデータを構文解析し、その解析結
果に基づいて、合成音に挿入するポーズの位置情報を生
成する生成手段としての音声合成データ作成部1と、音
声合成データおよびポーズの位置情報に基づいて、音声
合成処理を行い、合成音を出力する合成手段としての音
声合成部2とを備えることを特徴とする。
【0011】この音声合成装置は、音声合成作成部1
に、テキストから音声合成データおよびポーズの位置情
報を生成させるようにすることができる。
【0012】また、この音声合成装置は、音声合成作成
部1に、音声の認識結果から音声合成データおよびポー
ズの位置情報を生成させるようにすることができる。
【0013】
【作用】本発明の音声合成装置においては、音声合成デ
ータ作成部1が、入力されたデータを構文解析し、その
解析結果に基づいて、音声合成部2により合成される音
声に挿入するポーズの位置情報を生成する。従って、よ
り人間的な合成音を得ることができる。
【0014】
【実施例】図1は、本発明の音声合成装置の一実施例の
構成を示すブロック図である。音声合成データ作成部1
は、入力されたテキストから、抑揚、強勢、速度などを
考慮した音声合成用のデータ(以下、音声合成データと
いう)を生成する。さらに、音声合成データ作成部1
は、入力されたテキストを構文解析し、その解析結果に
基づいて、テキストを構成する単語間に挿入するポーズ
の位置を決定する。そして、このポーズ位置情報を、上
述の音声合成データとともに、音声合成部2に出力す
る。音声合成部2は、音声合成データ作成部1からの音
声合成データおよびポーズの位置情報に基づいて、合成
音を生成して出力する。
【0015】以上のように構成される音声合成装置で
は、まず音声合成データ作成部1において、入力された
テキストから、抑揚、強勢、発声速度などを考慮した音
声合成用のデータ(以下、音声合成データという)が生
成される。
【0016】さらに、音声合成データ作成部1におい
て、入力されたテキストから、句読点が検出され、その
位置にポーズの設定(ポーズを挿入する位置の設定)が
なされるとともに、係助詞「は」、「が」などのあらか
じめ登録された特定語が検出され、その直後の位置にポ
ーズの設定がなされる。
【0017】その後、音声合成データ作成部1におい
て、入力されたテキストが構文解析される。そして、ポ
ーズの設定数が、例えばテキストの長さに基づく所定の
数に所定のオフセットを加算した値(以下、ポーズ最大
値という)C1より多い場合、テキストの構文解析結果
(例えば、ポーズを挿入する位置の前後の単語の文法的
関係)に基づいて、ポーズの再設定がなされ、これによ
りポーズの数がポーズ最大値C1以下にされる。
【0018】また、ポーズの設定数が、例えばテキスト
の長さに基づく所定の数から所定のオフセットを減算し
た値(以下、ポーズ最小値という)C2より少ない場
合、テキストの構文解析結果に基づいて、ポーズの再設
定がなされ、これによりポーズの数がポーズ最小値C2
以上にされる。
【0019】その後、音声合成データ作成部1は、音声
合成部2で合成される音声が、より人間の発話に近くな
るように、テキストの構文解析結果に基づいて、ポーズ
を挿入する位置の微調整を行った後、音声合成部2から
出力される合成音の速度(発声速度)に基づいて、ポー
ズを挿入する位置の微調整をさらに行う(発声速度が速
い場合には、ポーズの数を減らし、遅い場合には、ポー
ズの数を増やす)。
【0020】そして、音声合成データ作成部11は、以
上のようにして決定したポーズを挿入する位置の情報
(ポーズ位置情報)を、音声合成データとともに音声合
成部2に出力する。
【0021】音声合成部2では、音声合成データ作成部
1からの音声合成データに基づいて合成音が生成される
とともに、その合成音に、ポーズ位置情報に基づいたポ
ーズが挿入されて出力される。
【0022】以上のように、入力されるテキストに応じ
て、ダイナミックにポーズを挿入する位置が設定される
ので、即ち入力されたテキストの自然な位置にポーズが
挿入されるので、合成音のぶつ切り感が低減され、内容
が理解し易く、人間の発話に近い合成音を得ることがで
きる。
【0023】なお、本実施例においては、音声合成デー
タ作成部1で、テキストから音声合成データを生成する
ようにしたが、例えば音声認識装置の認識結果のデータ
から音声合成データを生成するようにすることができ
る。
【0024】
【発明の効果】以上の如く、本発明の音声合成装置によ
れば、生成手段が、入力されたデータを構文解析し、そ
の解析結果に基づいて、合成手段により合成される音声
に挿入するポーズの位置情報を生成する。従って、より
人間的な合成音を得ることができる。
【図面の簡単な説明】
【図1】本発明の音声合成装置の一実施例の構成を示す
ブロック図である。
【符号の説明】
1 音声合成データ作成部 2 音声合成部

Claims (3)

    【特許請求の範囲】
  1. 【請求項1】 入力されたデータから、音声合成データ
    を生成するとともに、入力されたデータを構文解析し、
    その解析結果に基づいて、合成音に挿入するポーズの位
    置情報を生成する生成手段と、 前記音声合成データおよびポーズの位置情報に基づい
    て、音声合成処理を行い、前記合成音を出力する合成手
    段とを備えることを特徴とする音声合成装置。
  2. 【請求項2】 前記生成手段は、テキストから前記音声
    合成データおよびポーズの位置情報を生成することを特
    徴とする請求項1に記載の音声合成装置。
  3. 【請求項3】 前記生成手段は、音声の認識結果から前
    記音声合成データおよびポーズ位置情報を生成すること
    を特徴とする請求項1に記載の音声合成装置。
JP5130932A 1993-06-02 1993-06-02 音声合成装置 Withdrawn JPH06342297A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP5130932A JPH06342297A (ja) 1993-06-02 1993-06-02 音声合成装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP5130932A JPH06342297A (ja) 1993-06-02 1993-06-02 音声合成装置

Publications (1)

Publication Number Publication Date
JPH06342297A true JPH06342297A (ja) 1994-12-13

Family

ID=15046085

Family Applications (1)

Application Number Title Priority Date Filing Date
JP5130932A Withdrawn JPH06342297A (ja) 1993-06-02 1993-06-02 音声合成装置

Country Status (1)

Country Link
JP (1) JPH06342297A (ja)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2014219635A (ja) * 2013-05-10 2014-11-20 日本電信電話株式会社 ポーズ付与装置とその方法とプログラム
JP2015102773A (ja) * 2013-11-27 2015-06-04 日産自動車株式会社 音声発生装置、音声変形装置及び方法
JP2015102772A (ja) * 2013-11-27 2015-06-04 日産自動車株式会社 音声発生装置、音声変形装置及び方法
JP2015102771A (ja) * 2013-11-27 2015-06-04 日産自動車株式会社 音声発生装置、音声変形装置及び方法
WO2018034169A1 (ja) * 2016-08-17 2018-02-22 ソニー株式会社 対話制御装置および方法

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2014219635A (ja) * 2013-05-10 2014-11-20 日本電信電話株式会社 ポーズ付与装置とその方法とプログラム
JP2015102773A (ja) * 2013-11-27 2015-06-04 日産自動車株式会社 音声発生装置、音声変形装置及び方法
JP2015102772A (ja) * 2013-11-27 2015-06-04 日産自動車株式会社 音声発生装置、音声変形装置及び方法
JP2015102771A (ja) * 2013-11-27 2015-06-04 日産自動車株式会社 音声発生装置、音声変形装置及び方法
WO2018034169A1 (ja) * 2016-08-17 2018-02-22 ソニー株式会社 対話制御装置および方法
JPWO2018034169A1 (ja) * 2016-08-17 2019-06-13 ソニー株式会社 対話制御装置および方法
US11183170B2 (en) 2016-08-17 2021-11-23 Sony Corporation Interaction control apparatus and method

Similar Documents

Publication Publication Date Title
US6029131A (en) Post processing timing of rhythm in synthetic speech
Hallahan DECtalk software: Text-to-speech technology and implementation
KR970037209A (ko) 음성 출력 장치(speech synthsizer)
JPH0335296A (ja) テキスト音声合成装置
EP1058235A3 (de) Wiedergabeverfahren für sprachgesteuerte Systeme mit text-basierter Sprachsynthese
JPH06342297A (ja) 音声合成装置
JP3006240B2 (ja) 音声合成方法および装置
JPH07200554A (ja) 文章読み上げ装置
JP2536896B2 (ja) 音声合成装置
JP4056647B2 (ja) 波形接続型音声合成装置および方法
JP2624708B2 (ja) 音声合成装置
JP3088211B2 (ja) 基本周波数パタン生成装置
JP3862300B2 (ja) 音声合成に用いる情報の処理方法および装置
JPH0323500A (ja) テキスト音声合成装置
JP2003005774A (ja) 音声合成装置
JP2578876B2 (ja) 文章読み上げ装置
JPH08171394A (ja) 音声合成装置
JPH04270394A (ja) ポーズ長決定方式
JPH08328578A (ja) テキスト音声合成装置
JPH06168265A (ja) 言語処理装置および音声合成装置
JPH0659695A (ja) 音声規則合成装置
JP2001166787A (ja) 音声合成装置および自然言語処理方法
JPS63262696A (ja) 日本語文・音声変換装置
JPH02115898A (ja) ポーズ挿入位置決定方式
JPH02234198A (ja) テキスト音声合成システム

Legal Events

Date Code Title Description
A300 Application deemed to be withdrawn because no request for examination was validly filed

Free format text: JAPANESE INTERMEDIATE CODE: A300

Effective date: 20000905