JPH05181491A - 音声合成装置 - Google Patents

音声合成装置

Info

Publication number
JPH05181491A
JPH05181491A JP3360688A JP36068891A JPH05181491A JP H05181491 A JPH05181491 A JP H05181491A JP 3360688 A JP3360688 A JP 3360688A JP 36068891 A JP36068891 A JP 36068891A JP H05181491 A JPH05181491 A JP H05181491A
Authority
JP
Japan
Prior art keywords
text
importance
voice
speed
reading
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP3360688A
Other languages
English (en)
Inventor
Yoshiaki Oikawa
芳明 及川
Kenzo Akagiri
健三 赤桐
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sony Corp
Original Assignee
Sony Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sony Corp filed Critical Sony Corp
Priority to JP3360688A priority Critical patent/JPH05181491A/ja
Priority to US07/994,113 priority patent/US5396577A/en
Publication of JPH05181491A publication Critical patent/JPH05181491A/ja
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L13/00Speech synthesis; Text to speech systems
    • G10L13/08Text analysis or generation of parameters for speech synthesis out of text, e.g. grapheme to phoneme translation, prosody generation or stress or intonation determination
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L13/00Speech synthesis; Text to speech systems
    • G10L13/02Methods for producing synthetic speech; Speech synthesisers
    • G10L13/04Details of speech synthesis systems, e.g. synthesiser structure or memory management
    • G10L13/047Architecture of speech synthesisers

Abstract

(57)【要約】 【目的】本発明は音声合成装置について、速読、サーチ
を改善する。 【構成】入力された原テキストデータの各テキスト部分
についてその重要度を表す重要度情報を付加して入力す
ることにより、速読又は頭だしをさせる際に、どのテキ
スト部分をスキツプするか及び又はどの速度で合成する
かを、その時に装置に入力されている速度指令と、その
時の重要度情報により数段階にコントロールしながら音
声合成をすることができる。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は音声合成装置に関し、例
えば仮名漢字混じり文のテキストから音声を合成する場
合等に適用し得る。
【0002】
【従来の技術】従来、仮名漢字混じり文のテキストから
音声を合成する音声合成システムとして、図3に示す規
則合成方式による音声合成装置1が提案されている(特
願平3−278806号)。
【0003】この音声合成装置1は、文章解析部2のテ
キスト入力機能ブロツク2Aにおいて入力された文字の
系列をテキスト解析機能ブロツク2Bにおいて辞書機能
ブロツク2Cを規準にしながら解析し、読み仮名、単
語、文節境界及び基本アクセントを検出機能ブロツク2
Dにおいて検出する。文章解析部2の検出結果は、音声
合成規則部3の音韻規則ブロツク3Aにおいて所定の音
韻規則に従つて音韻記号列3Bに配列されて音韻制御パ
ラメータ生成ブロツク3Cに与えられると共に、韻律規
則ブロツク3Dにおいて所定の音律規則に従つて文節、
アクセント、ポーズ列3Eに配列されて韻律制御パラメ
ータ生成ブロツク3Fに与えられる。
【0004】音韻制御パラメータ生成ブロツク3C及び
韻律制御パラメータ生成ブロツク3Fは速度指令発生部
4からの速度指令によつて読上げ音声速度を指定され、
当該読上げ音声速度をもつ合成パラメータ3G及び基本
ピツチパターン3Hを生成して音声合成部5の音声合成
フイルタブロツク5Aに供給される。かくして音声合成
フイルタブロツク5Aは合成音声出力5Bを合成し、こ
れを音声合成装置1の出力として送出する。
【0005】
【発明が解決しようとする課題】このような従来の音声
合成装置1において、速読又は頭だし等を行うときに
は、音声合成装置1の外部に設けられた速度指令発生部
4の速度指令を、ソフトウエア的なパラメータ又はハー
ドウエア的なボリユームなどの手段により変更すること
により、音韻制御パラメータ生成ブロツク3C及び韻律
制御パラメータ生成ブロツク3Fにおける合成パラメー
タ3G及び基本ピツチパターン3Hの発生速度をコント
ロールする方法が採用されている。
【0006】しかしながらこの従来の方法によれば、テ
キストの読上げ速度を速くすることにより速読しようと
しても文章解析部2、音声合成規則部3及び音声合成部
5の処理能力の限界に対応する速度以上には速くでき
ず、またサーチにも時間がかかるという問題がある。ま
た、頭だしを行なう場合には、テキスト入力ブロツク2
Aにおいて入力するテキストに対して別途予め用意して
おいた頭だしに必要な情報(例えば各章の題目など)を
入力しなければならず、その結果音声合成装置1の外部
において煩雑な処理が必要になり、結局全体としてのシ
ステム規模が大きくなる問題点がある。
【0007】本発明は以上の点を考慮してなされたもの
で、全体としてのシステム規模を過大にさせることなく
一段と速く速読処理、サーチ処理等をなし得るようにし
た音声合成装置を提案しようとするものである。
【0008】
【課題を解決するための手段】かかる課題を解決するた
め本発明においては、入力されたテキストデータTXを
記録し、当該記録されたテキストデータTXに基づいて
音声を合成する音声合成装置11において、テキストデ
ータTXと共に、当該テキストデータTXを構成する各
テキスト部分TX1、TX2……についての重要度情報
IP1、IP2……を記録するようにする。
【0009】また音声合成時、記録された重要度情報I
P1、IP2……に基づいて重要度が低いテキスト部分
TX1、TX2……をスキツプして音声合成するように
する。さらに、合成速度情報12Gを指定する入力手段
13を有し、音声合成時に合成速度情報12G及び重要
度情報IP1、IP2……に基づいて、重要度が低いテ
キスト部分TX1、TX2……をスキツプして音声合成
するようにする。
【0010】
【作用】テキストデータTXの各テキスト部分TX1、
TX2……に重要度情報IP1、IP2……が付加され
ていることにより、当該テキストデータTXの各テキス
ト部分TX1、TX2……は速読、サーチなどの処理を
するときの当該テキスト部分TX1、TX2……の必要
度を表す複数のレベルに整理される。従つて速読、サー
チなどの速度に応じて複数のレベルのうちの1つのレベ
ルを指定することにより、重要度が同じ水準のテキスト
部分TX1、TX2……だけをスキツプしながら飛び飛
びに合成して行くことができ、かくして速読、サーチな
どの処理速度を従来の場合と比較して一段と速くでき
る。
【0011】
【実施例】以下図面について、本発明の一実施例を詳述
する。
【0012】図1において、11は全体として音声合成
装置を示し、図3との対応部分に同一符号を付して示す
ように、図3について上述したと同様にして文章解析部
2、音声合成規則部3及び音声合成部5を有する。
【0013】図1の場合はこれに加えて、文章解析部2
の前段にテキスト部分選別部12が設けられると共に、
外部に速度指令発生部13が設けられ、図2(A)に示
すように、入力された原テキストデータTXのテキスト
部分TX1、TX2……の先頭部分に頭だし用の情報と
して挿入されている重要度情報IP1、IP2……を用
いてテキスト部分TX1、TX2……の重要度に基づい
て、読上げ速度指令によつて指定されたスキツプレベル
に対応するテキスト部分を指定することにより読上げ速
度を指定する処理を実行するようになされている。
【0014】ここで、挿入される重要度情報IP1、I
P2……は内容により、これに続くテキスト部分TX
1、TX2……の重要度の水準を表す。例えば、
「0」、「1」、「2」、「3」…のように値が大きく
なる程、重要度の水準が増すように選定されている。
【0015】テキスト部分選別部12は、原テキストデ
ータTX(図2(A))でなる入力テキスト12Aをテ
キスト解析1ブロツク12Bに入力する。テキスト解析
1ブロツク12Bは原テキストデータTXをテキスト部
分TX1、TX2……と重要度情報IP1、IP2……
とに分離し、分離されたテキスト部分12C(図2
(A)のTX1、TX2……)は読上げ区間選別ブロツ
ク12Dに入力される。これに対して重要度情報12E
(図2(A)のIP1、IP2……)は読上げ区間決定
ブロツク12Fに入力され、これにより読上げ区間決定
ブロツク12Fにおいて速度指令発生部13から与えら
れる速度指令に基づく速さで読上げ区間の決定処理を実
行する。
【0016】かくして読上げ区間決定ブロツク12Fに
よつて発生される読上げ指令12Gは、テキスト部分T
X1、TX2……のうち指定された読上げ区間だけを選
別することにより、結局飛び飛びにテキスト部分を選別
すると同時に、読み上げないテキスト部分をスキツプさ
せるような次の表1に示す指令内容をもつ。
【表1】 この読上げ指令12Gは読上げ区間選別ブロツク12D
に与えられる。
【0017】この実施例の場合、表1のスキツプレベル
0、1、2、3は、「レベル0」のとき図2(B)に示
すように重要度情報の値が「0」、「1」、「2」……
のすべてのテキスト部分を読み上げ、「レベル1」のと
き図2(C)に示すように重要度情報の値が「0」以上
(「0」を除く)のものを読み上げ、「レベル2」のと
き図2(D)に示すように重要度情報の値「1」以上
(「0」、「1」を除く)のものを読み上げ、「レベル
3」のとき図2(E)に示すように重要度情報の値
「2」以上(「0」、「1」、「2」を除く)のものを
読み上げるように設定する。
【0018】また、読上げ速度は「通常」、「速読1」
及び「速読2」の3種類が用意されている。読上げ区間
選別ブロツク12Dは読上げ指令12Gにより、読上げ
るべきテキスト部分TX1、TX2……を選別して文章
解析部2に出力する。
【0019】以上の構成において、音声合成装置11の
入力テキストブロツク12Aにおいて用いられる原テキ
ストデータTXは、図2(A)に示すように、予め一連
のテキスト部分TX1、TX2……ごとにその重要度を
表す(例えばキーワードとしての重要性を表す)重要度
情報IP1、IP2……をもち、この重要度情報IP
1、IP2……12Eがテキスト解析1ブロツク12B
の処理によつてテキスト部分12Cから分離される。
【0020】かくして原テキストデータTXから抜き出
された重要度情報IP1、IP2……でなる情報列は、
読上げ区間決定ブロツク12Fにおいて、速度指令発生
部4から与えられる速度指令によつて表されるスキツプ
レベルに基づいて抽出処理され、その結果を用いて読み
上げるべきテキスト部分を指定する読上げ指令12Gが
生成される。
【0021】かくして読上げ区間選別ブロツク12D
は、速度指令発生部13から発生された速度指令の内容
に応じて、図2(A)〜(E)に示すように、スキツプ
レベル0が指定されたときすべてのテキスト部分が読み
上げられ、スキツプレベル1が指定されたとき重要度情
報が「1」以上のテキスト部分が読み上げられ、スキツ
プレベル2が指定されたとき重要度情報が「2」以上の
テキスト部分が読み上げられ、スキツプレベル3が指定
されたとき重要度情報が「3」以上のテキストが読み上
げられるような選別処理を実行し、当該選別した一連の
テキスト部分列を文章解析部2のテキスト入力ブロツク
2Aに与える。
【0022】テキスト解析部2は、図3の場合と同様に
して選別されたテキスト部分を辞書を規準にして解析
し、単語、文節の境界及び基本アクセントを検出する。
単語、文節の境界及び基本アクセントの検出結果は、図
3の場合と同様に音声合成規則部3において、所定の音
韻規則に従つて処理され、抑揚のない状態でテキスト入
力を読み上げた音声を表す合成パラメータを生成する。
その際、速度指令の速度により各音韻の継続時間長を、
「通常」、「速読1」及び「速読2」のレベルに合わせ
て制御する。
【0023】さらに単語、文節の境界及び基本アクセン
ト検出結果は、音声合成規則部3において所定の韻律規
則に従つて処理され、テキスト入力全体の抑揚を表す基
本ピツチパターンが速度指令の速度に合わせて生成され
る。かくして生成された基本ピツチパターン及び合成パ
ラメータは図3の場合と同様に音声合成部5において、
音声音の生成処理に用いられる。
【0024】以上の構成によれば、入力テキストに含ま
れる重要度情報に基づいて指定された速度指令に合わせ
てテキストを早読み及び又はスキツプ読みすることがで
きるような合成音声を出力できる。
【0025】かくするにつき、上述の構成によれば、入
力される原テキストデータの構成(仮名漢字混じり文又
は、文章解析装置で解析して得られた単語、文節の境
界、読み及び基本アクセント情報を含む記号列)が予め
分つているために重要度情報を付加して入力できるよう
なテキスト、例えばデータディスクマンのテキスト、を
速読で音声合成させるような場合に適用して効果的であ
り、この場合には、第1に数段階のサーチレベルを設定
できるので、検索性が向上し、第2に頭だし用の情報す
なわち重要度情報符号が入力テキストに含まれているた
め、システム側で頭だしのために考慮する必要がないと
いう効果が期待できる。
【0026】なお上述の実施例においては、原テキスト
データの構成として入力テキストが仮名漢字混じり文を
用いた場合について述べたが、入力テキストが文章解析
装置で解析して得られた単語、文節の境界、読み及び基
本アクセント情報を含む記号列に対して重要度情報を付
加した形式のものであつても上述の場合と同様の効果を
得ることがでできる。この場合文章解析部2は不要とな
る。
【0027】
【発明の効果】上述のように本発明によれば、入力され
たテキストから音声を合成する音声合成装置において、
テキスト部分の重要度を表す重要度情報を付加して入力
すると共に、速読又は頭だしをする際に、どのテキスト
部分をスキツプするか及び又はどの速度で合成するか
を、速度指令及び重要度情報に基づいて数段階にコント
ロールしながら音声を合成できる音声合成装置を容易に
実現できる。
【図面の簡単な説明】
【図1】本発明による音声合成装置を示す機能的ブロツ
ク図である。
【図2】図1の原テキストデータ及び読上げ指令の構成
を示す信号波形図である。
【図3】従来の音声合成装置を示す機能的ブロツク図で
ある。
【符号の説明】
1、11……音声合成装置、2……文章解析部、3……
音声合成規則部、4、13……速度指令発生部、5……
音声合成部、12……テキスト部分選択部。

Claims (3)

    【特許請求の範囲】
  1. 【請求項1】入力されたテキストデータを記録し、当該
    記録されたテキストデータに基づいて音声を合成する音
    声合成装置において、 テキストデータと共に、当該テキストデータを構成する
    各テキスト部分についての重要度情報を記録することを
    特徴とする音声合成装置。
  2. 【請求項2】音声合成時、記録された上記重要度情報に
    基づいて重要度が低いテキスト部分をスキツプして音声
    合成することを特徴とする請求項1に記載の音声合成装
    置。
  3. 【請求項3】さらに合成速度情報を指定する入力手段を
    有し、音声合成時に上記合成速度情報及び上記重要度情
    報に基づいて、重要度が低いテキスト部分をスキツプし
    て音声合成することを特徴とする請求項2に記載の音声
    合成装置。
JP3360688A 1991-12-30 1991-12-30 音声合成装置 Pending JPH05181491A (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP3360688A JPH05181491A (ja) 1991-12-30 1991-12-30 音声合成装置
US07/994,113 US5396577A (en) 1991-12-30 1992-12-22 Speech synthesis apparatus for rapid speed reading

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP3360688A JPH05181491A (ja) 1991-12-30 1991-12-30 音声合成装置

Publications (1)

Publication Number Publication Date
JPH05181491A true JPH05181491A (ja) 1993-07-23

Family

ID=18470488

Family Applications (1)

Application Number Title Priority Date Filing Date
JP3360688A Pending JPH05181491A (ja) 1991-12-30 1991-12-30 音声合成装置

Country Status (2)

Country Link
US (1) US5396577A (ja)
JP (1) JPH05181491A (ja)

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0756591A (ja) * 1993-08-19 1995-03-03 Sony Corp 音声合成装置、音声合成方法及び記録媒体
JPH0756590A (ja) * 1993-08-19 1995-03-03 Sony Corp 音声合成装置、音声合成方法及び記録媒体
JPH07140999A (ja) * 1993-11-15 1995-06-02 Sony Corp 音声合成装置及び音声合成方法
JPH07152787A (ja) * 1994-01-13 1995-06-16 Sony Corp 情報アクセスシステムおよび記録媒体
JPH09311775A (ja) * 1996-03-18 1997-12-02 Toshiba Corp 音声出力装置及びその方法
JP5104762B2 (ja) * 2006-10-23 2012-12-19 日本電気株式会社 コンテンツ要約システムと方法とプログラム
WO2019026395A1 (ja) * 2017-08-01 2019-02-07 ソニー株式会社 情報処理装置、情報処理方法、およびプログラム

Families Citing this family (23)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5860064A (en) * 1993-05-13 1999-01-12 Apple Computer, Inc. Method and apparatus for automatic generation of vocal emotion in a synthetic text-to-speech system
JP3450411B2 (ja) * 1994-03-22 2003-09-22 キヤノン株式会社 音声情報処理方法及び装置
GB2291571A (en) * 1994-07-19 1996-01-24 Ibm Text to speech system; acoustic processor requests linguistic processor output
JP3536996B2 (ja) * 1994-09-13 2004-06-14 ソニー株式会社 パラメータ変換方法及び音声合成方法
JP3085631B2 (ja) * 1994-10-19 2000-09-11 日本アイ・ビー・エム株式会社 音声合成方法及びシステム
JP3384646B2 (ja) * 1995-05-31 2003-03-10 三洋電機株式会社 音声合成装置及び読み上げ時間演算装置
US5751907A (en) * 1995-08-16 1998-05-12 Lucent Technologies Inc. Speech synthesizer having an acoustic element database
US5878393A (en) * 1996-09-09 1999-03-02 Matsushita Electric Industrial Co., Ltd. High quality concatenative reading system
US5884263A (en) * 1996-09-16 1999-03-16 International Business Machines Corporation Computer note facility for documenting speech training
US5918206A (en) * 1996-12-02 1999-06-29 Microsoft Corporation Audibly outputting multi-byte characters to a visually-impaired user
US6374225B1 (en) * 1998-10-09 2002-04-16 Enounce, Incorporated Method and apparatus to prepare listener-interest-filtered works
AU4200600A (en) * 1999-09-16 2001-04-17 Enounce, Incorporated Method and apparatus to determine and use audience affinity and aptitude
US20030014253A1 (en) * 1999-11-24 2003-01-16 Conal P. Walsh Application of speed reading techiques in text-to-speech generation
US6876969B2 (en) * 2000-08-25 2005-04-05 Fujitsu Limited Document read-out apparatus and method and storage medium
JP2002169581A (ja) * 2000-11-29 2002-06-14 Matsushita Electric Ind Co Ltd 音声合成方法およびその装置
US7280968B2 (en) * 2003-03-25 2007-10-09 International Business Machines Corporation Synthetically generated speech responses including prosodic characteristics of speech inputs
US8666746B2 (en) 2004-05-13 2014-03-04 At&T Intellectual Property Ii, L.P. System and method for generating customized text-to-speech voices
US20070124148A1 (en) * 2005-11-28 2007-05-31 Canon Kabushiki Kaisha Speech processing apparatus and speech processing method
EP2169663B8 (en) * 2007-07-24 2013-03-06 Panasonic Corporation Text information presentation device
US8447609B2 (en) * 2008-12-31 2013-05-21 Intel Corporation Adjustment of temporal acoustical characteristics
US9665344B2 (en) 2010-02-24 2017-05-30 GM Global Technology Operations LLC Multi-modal input system for a voice-based menu and content navigation service
CN102237081B (zh) * 2010-04-30 2013-04-24 国际商业机器公司 语音韵律评估方法与系统
JP4996750B1 (ja) * 2011-01-31 2012-08-08 株式会社東芝 電子機器

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4749353A (en) * 1982-05-13 1988-06-07 Texas Instruments Incorporated Talking electronic learning aid for improvement of spelling with operator-controlled word list
US4692941A (en) * 1984-04-10 1987-09-08 First Byte Real-time text-to-speech conversion system
US4852168A (en) * 1986-11-18 1989-07-25 Sprague Richard P Compression of stored waveforms for artificial speech
US5189702A (en) * 1987-02-16 1993-02-23 Canon Kabushiki Kaisha Voice processing apparatus for varying the speed with which a voice signal is reproduced
JPH031200A (ja) * 1989-05-29 1991-01-07 Nec Corp 規則型音声合成装置

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0756591A (ja) * 1993-08-19 1995-03-03 Sony Corp 音声合成装置、音声合成方法及び記録媒体
JPH0756590A (ja) * 1993-08-19 1995-03-03 Sony Corp 音声合成装置、音声合成方法及び記録媒体
JPH07140999A (ja) * 1993-11-15 1995-06-02 Sony Corp 音声合成装置及び音声合成方法
JPH07152787A (ja) * 1994-01-13 1995-06-16 Sony Corp 情報アクセスシステムおよび記録媒体
JPH09311775A (ja) * 1996-03-18 1997-12-02 Toshiba Corp 音声出力装置及びその方法
JP5104762B2 (ja) * 2006-10-23 2012-12-19 日本電気株式会社 コンテンツ要約システムと方法とプログラム
WO2019026395A1 (ja) * 2017-08-01 2019-02-07 ソニー株式会社 情報処理装置、情報処理方法、およびプログラム

Also Published As

Publication number Publication date
US5396577A (en) 1995-03-07

Similar Documents

Publication Publication Date Title
JPH05181491A (ja) 音声合成装置
US6778962B1 (en) Speech synthesis with prosodic model data and accent type
JP4038211B2 (ja) 音声合成装置,音声合成方法および音声合成システム
JPH10274997A (ja) 文書読み上げ装置
JPH0833744B2 (ja) 音声合成装置
US5633984A (en) Method and apparatus for speech processing
JP4639932B2 (ja) 音声合成装置
van Rijnsoever A multilingual text-to-speech system
JPH06282290A (ja) 自然言語処理装置およびその方法
JPH08335096A (ja) テキスト音声合成装置
JP3371761B2 (ja) 氏名読み音声合成装置
JPH06318094A (ja) 音声規則合成装置
JPH07244496A (ja) テキスト朗読装置
JPH05281984A (ja) 音声合成方法および装置
JPH06176023A (ja) 音声合成システム
JPH07210185A (ja) 朗読情報作成装置および朗読装置
JPH05224688A (ja) テキスト音声合成装置
JP2801622B2 (ja) テキスト音声合成方法
JPH0863187A (ja) 音声合成装置
JP3573889B2 (ja) 音声出力装置
JPH08194494A (ja) 文解析方法および装置
JPH02251998A (ja) 音声合成装置
JPH09198073A (ja) 音声合成装置
JP2000010579A (ja) 音声合成装置及びコンピュータ可読記録媒体
JPH1011090A (ja) 音声合成装置