JP2004516515A - 区別された音声出力のための装置及び方法 - Google Patents

区別された音声出力のための装置及び方法 Download PDF

Info

Publication number
JP2004516515A
JP2004516515A JP2002551833A JP2002551833A JP2004516515A JP 2004516515 A JP2004516515 A JP 2004516515A JP 2002551833 A JP2002551833 A JP 2002551833A JP 2002551833 A JP2002551833 A JP 2002551833A JP 2004516515 A JP2004516515 A JP 2004516515A
Authority
JP
Japan
Prior art keywords
parameters
audio output
output
voice
audio
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2002551833A
Other languages
English (en)
Inventor
ゲオルク オーベルト
クラウス ベンクラー
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Bayerische Motoren Werke AG
Original Assignee
Bayerische Motoren Werke AG
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Bayerische Motoren Werke AG filed Critical Bayerische Motoren Werke AG
Publication of JP2004516515A publication Critical patent/JP2004516515A/ja
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L13/00Speech synthesis; Text to speech systems
    • G10L13/02Methods for producing synthetic speech; Speech synthesisers
    • G10L13/033Voice editing, e.g. manipulating the voice of the synthesiser

Abstract

本装置及び本方法は区別された音声出力のために用いられる。オンボードコンピュータ、ナビゲーションシステムなどのような車両内に設けられているシステムが1つの音声出力装置と接続可能であり、この際、異なるシステムからの音声出力が声の特徴付けを介して区別可能である。

Description

【0001】
本発明は、特に車両において使用するための、区別された音声出力或いは音声発生のための装置、それに付属する方法、この音声出力装置を用いた使用システム、及び、少なくとも2つのシステムと音声出力装置との組み合わせに関する。
【0002】
車両では、音声出力のための音響的な人間・機械・インタフェースを有する個々のシステムが使用される。これらのシステムには各々1つの音声出力モジュールが直接的に割り当てられている。使用されている音声生成方法は、多くの場合、パルス符号変調(PCM)に基づき、この際、後続する圧縮(例えばMPEG)が接続可能である。他のシステムは音声合成法を使用し、これらの音声合成法は、主として音節セグメント(音素)の編成を介し、単語と文章を形成する(信号操作)。
【0003】
前記の音声出力法では話者依存性もあり、この話者依存性は、単語範囲又はテキスト範囲を拡張する場合には再三に渡って同一の人間話者を録音に尽力させるということ要求する。更にPCM法は、テキスト又は音節セグメントを格納するために、信号操作による高品質の音素合成と同様に多大な記憶場所(メモリスペース)を要求する。これらの両方の方法において、例えば様々な国の音声(言語)が出力されるべき場合には記憶場所が更に一層増加することになる。
【0004】
更に音声の完全合成に基づく方法が知られている。人間の声道を電気対応として変換し、音発生器と後続接続された複数のフィルタとを用いて処理(ソース・フィルタ・モデル)するという方法が特に知られている。この方法に従って動作する機器は所謂フォルマント合成器(例えばKLATTALK)である。このようなフォルマント合成器は、声特有の特性に影響を及ぼすことができるという長所を有する。
【0005】
本発明の基礎を成す課題は、特に車両において使用するための、区別された音声出力が可能である装置及びそれに付属する方法、その音声出力装置を用いた使用システム、及び、少なくとも2つのシステムと音声出力装置との組み合わせを提供することである。
【0006】
この課題は、特許請求項に記載した特徴を用いて解決される。
【0007】
本発明は、唯一の音声出力装置或いは音声合成装置を用いて異なるシステムのための音声出力が可能であるという長所を有し、この際、各システムは声特有の違いによって識別可能である。
【0008】
本発明の有利な実施形態に従い、各システムのためにパラメータセットが割り当てられていて、このパラメータセットは、その各システムからの音声出力の際に音声合成装置によって使用される。例えば第1パラメータセットはオンボードコンピュータのために、第2パラメータセットはナビゲーションシステムのために、第3パラメータセットは交通情報のために、第4パラメータセットはEメールのようなTTSシステム(Text to Speech System)のために、及び、1つ又は複数の他のパラメータセットが追加的なシステムのために提供される。
【0009】
割り当てられているパラメータセットに依存し、音声合成装置は、例えばナビゲーションシステムの音声出力のためにはソフトな女声で又は例えば交通情報メッセージの音声出力のためにはハードな低音男声により音声出力を生成する。
【0010】
本発明の有利な実施形態に従い、音声の完全合成のための方法及び装置が使用され、好ましくはフォルマント合成器である。この際、合成器のための制御パラメータはクラスに分割される。動的パラメータによるクラスは、話す際の音声道の動きのような調音(アーティキュレーション)を制御する。静的パラメータによる第2クラスは、発生器基本周波数や、子供、女性、又は男性の話者において音声道の様々な形状的な大きさ(ディメンション)によって形成される固定フォルマントのような話者特有の特徴を制御する。
【0011】
フォルマント合成器の拡張モデルでは、有声音及び無声音の別個の発生が可能である。この際、他のパラメータにより追加的な共振器又は減衰要素がスイッチオンされ得る又は調音用の動的パラメータに影響が及ぼされ得る。
【0012】
本発明による装置或いは本発明による方法は、特に車両のシステム内で使用可能である。各システムは、音声出力のために、音声出力を制御する2つの可能性を有する。音声出力の第1の可能性は、音声調音用の制御命令を出力する送信を含んでいて、この際、単語、文章、及び文章順番のための制御パラメータのシーケンスがシステム内に保存されている。音声出力を制御するための第2の可能性は、話者の特徴付けのために決定されているパラメータセットを切り替える第2の出力を介して行われる。
【0013】
選択的に又は追加的に、このパラメータデータセットを直接的にシステム内に記憶させること、及び、音声出力が要求される場合にこのパラメータデータセットを音声合成装置内にロードすることも可能である。
【0014】
選択的に又は追加的に前記の実施形態に使用可能である他の有利な実施形態に従い、情報源を区別するため、即ち音声出力を実施するシステムを区別するために、発生器パラメータ及びフォルマントパラメータが追加的に動的に変更され得る。それにより、音節セグメントの時間的な長さ及び/又はアクセント、及び/又は文章抑揚のような韻律において聞き取れる区別(違い)が達成され得る。特に、韻律変調は、例えば交通位置又は交通状況に依存し、通知テキストの音声出力のために利用され得る。要するに、情報の衝撃性は声の変調によって表現され得る。
【0015】
本発明は、例えば車両において小型のパラメータメモリを有する唯一の音声発生器だけが複数の情報源によってコントロールされ得るという長所を有する。この際、情報源には異なる声の特徴付けが備え付けられ得る。
【0016】
完全合成装置、例えば声道合成装置を使用する場合、この方法は話者に依存せず、高価なスタジオ録音は必要とされない。
【0017】
拡張フォルマント合成器では、本発明に従い、声における感情的な表現をも付け加えることができる。
【0018】
パラメータの型を予め作成することにより、極めて簡単に声の特徴付けが変更され得る。この方法は、フリーテキストを音声に変換する(Text to Speech)ためにも適していて、例えば、Eメールの読み上げである。
【0019】
次に、実施例及び図面に基づき、本発明を詳細に説明する。
【0020】
図1には、本発明に従う複数のシステムを用いて区別して音声出力するための本発明の有利な実施形態の原理図が示されている。
【0021】
図1に描かれている本発明の有利な実施形態は、音声合成装置10を備えた音声出力ユニット1を有し、音声合成装置10は、この例において、声道合成モジュールであり、音声の完全合成に基づいている。例えばKLATTALKのようなフォルマント合成器が使用され得る。音声合成装置10は増幅器12と接続されていて、増幅器12の出力部14はオーディオ信号を提供し、このオーディオ信号はスピーカ(非図示)を介して音声を出力させる。音声合成装置10にはN個のパラメータセット21、22、〜 2Nが割り当てられていて、これらのパラメータセットは、図示された例では音声出力ユニット1のメモリ20内に記憶されている。更に、N個のシステム31、32、〜 3Nが示されていて、これらのシステムは、個々のライン、バスシステム、又はデータチャネルのようなデータ接続部を介し、各々、音声出力ユニット1と接続されている。各システムは音声出力ユニット1を介して音声出力を実施し得る。個々には、オンボードコンピュータ用の付属のパラメータセット21を有するオンボードコンピュータ31、ナビゲーション用の付属のパラメータセット22を有するナビゲーションシステム32、交通情報用の付属のパラメータセット23を有する交通情報システム33、Eメール用の付属のパラメータセット24を有するTTSシステムのようなEメールシステム34が設けられている。また、割り当てられている各々のパラメータセット2Nを有する他のシステム3Nが設けられ得る。図示された例では、唯一の音声出力ユニット1を使用し、ナビゲーションシステム32を例えばソフトな女声で話させることが可能であり、この声は、ナビゲーションシステム用のパラメータセット22により決定されている。更に例えば交通情報メッセージのためにパラメータセット23が設けられ得て、このパラメータセット23を用い、音声出力の際にはハードな低音男声が使用される。
【0022】
音声出力の順番は、システムから音声出力するための依頼の入力に対応し、時間的に相前後して行われる。好ましくは、より高い優先権を有する情報、例えば誤り運転者のような危険な状況時の交通情報が先ず音声出力によって出力される。特に有利には、最も高い優先権を有する情報、例えば車両の機能障害又は開始する車道の滑りに関するオンボードコンピュータからの情報が迅速に出力され、この際、流れている音声出力は中断され得る。中断された音声出力は、引き続き、最後まで導かれる又は反復され得る。
【0023】
本発明は、音響的な提示により、視覚的な提示の場合はそうであるが、運転者の役割から運転者の気をそらさせてしまうことなく、システムが異なるシステムの案内情報を運転者に提供し得るという長所を有する。異なるオンボードコンピュータによって使用され得る音声合成装置を使用することによりコストが節約され得る。例えばナビゲーションシステムにおいて以前まで使用されていた音声生成法に対し、記憶場所(メモリスペース)の要求が減少され得る。
【0024】
本発明は、特に有利には自動車において使用可能である。
【図面の簡単な説明】
【図1】
本発明に従う複数のシステムを用いて区別して音声出力するための本発明の有利な実施形態の原理図を示す図である。

Claims (14)

  1. 第1システム(31)及び少なくとも1つの他のシステム(32、33〜3N)と接続可能である、区別された音声出力のための装置(1)において、第1システム(31)の音声出力には第1の声の特徴付けが割り当てられていて、他のシステム(32、33〜3N)の他の音声出力には、第1の声の特徴付けとは聞き取れて区別される他の声の特徴付けが割り当てられていること。
  2. 動的パラメータによる第1クラス及び静的パラメータによる第2クラスを有する制御パラメータを獲得する音声合成装置(10)を有する、請求項1に記載の装置において、動的パラメータが音声道の動きに対応して調音を制御し、静的パラメータが声特有の特徴を制御すること。
  3. 請求項2に記載の装置において、静的パラメータが、発生器基本周波数、及び/又は、子供、女性、又は男性の話者において音声道の様々な形状的な大きさに好ましくは対応する固定フォルマントを有すること。
  4. 請求項3に記載の装置において、発生器パラメータ及び/又はフォルマントパラメータが異なるシステムからの音声出力のために変更可能であり、好ましくは、音節セグメントの時間的な長さ及び/又はアクセント、及び/又は文章抑揚のような韻律において聞き取れる区別がもたらされること。
  5. 請求項2〜4にいずれか一項に記載の装置において、音声合成装置(10)がフォルマント合成器であり、このフォルマント合成器を用い、声特有の特性に影響が及ぼされ得ること。
  6. 請求項5に記載の装置において、有声音及び無声音を別個に発生することにフォルマント合成器が適されていて、更には、特に他のパラメータにより追加的な共振器又は減衰要素がスイッチオン可能であり及び/又は調音用の動的パラメータに影響が及ぼされ得ること。
  7. 請求項2〜6にいずれか一項に記載の装置において、動的パラメータが、単語、文章、及び文章順番によるシーケンスに対応して各システム内に保存されていること。
  8. 請求項2〜7にいずれか一項に記載の装置において、静的パラメータがパラメータセットとして各システム内に記憶されていて、音声出力が要求される場合にこのパラメータセットが音声合成装置(10)へと伝達されること。
  9. 請求項2〜7にいずれか一項に記載の装置において、システムのための静的パラメータが、割り当てられたパラメータセットとして音声出力装置のメモリ(20)内に記憶されていて、割り当てられたパラメータセットがシステムの選択信号に依存して音声合成装置(10)によって音声出力のために使用されること。
  10. 請求項2〜9にいずれか一項に記載の装置において、音声合成装置(10)が増幅器(12)と接続されていて、この増幅器(12)のオーディオ出力部(14)を介して音声出力が行われること。
  11. 請求項1〜10のいずれか一項に記載の装置を用いた使用システムにおいて、このシステムが、動的パラメータを出力するための第1出力部、及び、音声出力装置(10)内でパラメータセットを切り替えるために選択信号を出力するための第2出力部を有すること。
  12. 請求項1〜10のいずれか一項に記載の装置を用いた使用システムにおいて、このシステムが、動的パラメータ及び静的パラメータを好ましくはパラメータセットとして音声出力装置(10)へと出力するための出力部を有すること。
  13. オンボードコンピュータ(31)、ナビゲーションシステム(32)、交通情報システム(33)、Eメールシステム(34)、又は情報システム(3N)のような、少なくとも1つの第1システム及び少なくとも1つの他のシステムと、請求項1〜10のいずれか一項に記載の装置とを、好ましくは車両内で使用するために組み合わせること。
  14. 請求項1〜10のいずれか一項に記載の装置を使用する、区別された音声出力のための方法。
JP2002551833A 2000-12-20 2001-11-21 区別された音声出力のための装置及び方法 Pending JP2004516515A (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
DE10063503A DE10063503A1 (de) 2000-12-20 2000-12-20 Vorrichtung und Verfahren zur differenzierten Sprachausgabe
PCT/EP2001/013488 WO2002050815A1 (de) 2000-12-20 2001-11-21 Vorrichtung und verfahren zur differenzierten sprachausgabe

Publications (1)

Publication Number Publication Date
JP2004516515A true JP2004516515A (ja) 2004-06-03

Family

ID=7667936

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2002551833A Pending JP2004516515A (ja) 2000-12-20 2001-11-21 区別された音声出力のための装置及び方法

Country Status (6)

Country Link
US (1) US7698139B2 (ja)
EP (1) EP1344211B1 (ja)
JP (1) JP2004516515A (ja)
DE (2) DE10063503A1 (ja)
ES (1) ES2357700T3 (ja)
WO (1) WO2002050815A1 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2020160004A (ja) * 2019-03-28 2020-10-01 株式会社ホンダアクセス 車両用ナビゲーション装置

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
GB2412046A (en) * 2004-03-11 2005-09-14 Seiko Epson Corp Semiconductor device having a TTS system to which is applied a voice parameter set
DE102005063077B4 (de) * 2005-12-29 2011-05-05 Airbus Operations Gmbh Aufzeichnung digitaler Cockpit-Boden-Kommunikation auf einem unfallgeschützten Sprachrekorder
CN101460994A (zh) * 2006-06-02 2009-06-17 皇家飞利浦电子股份有限公司 语音区分
DE102008019071A1 (de) * 2008-04-15 2009-10-29 Continental Automotive Gmbh Verfahren, Fahrerinformationssystem und Fahrerassistenzsystem zur Ausgabe von Informationen
JP7133149B2 (ja) * 2018-11-27 2022-09-08 トヨタ自動車株式会社 自動運転装置、カーナビゲーション装置及び運転支援システム

Family Cites Families (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS5667470A (en) * 1979-11-07 1981-06-06 Canon Inc Voice desk-top calculator
US5559927A (en) * 1992-08-19 1996-09-24 Clynes; Manfred Computer system producing emotionally-expressive speech messages
US5561736A (en) * 1993-06-04 1996-10-01 International Business Machines Corporation Three dimensional speech synthesis
JPH08328573A (ja) * 1995-05-29 1996-12-13 Sanyo Electric Co Ltd カラオケ装置及び音声再生装置及びこれに使用する記録媒体
US5924068A (en) * 1997-02-04 1999-07-13 Matsushita Electric Industrial Co. Ltd. Electronic news reception apparatus that selectively retains sections and searches by keyword or index for text to speech conversion
JP3287281B2 (ja) * 1997-07-31 2002-06-04 トヨタ自動車株式会社 メッセージ処理装置
JP3502247B2 (ja) * 1997-10-28 2004-03-02 ヤマハ株式会社 音声変換装置
DE19908137A1 (de) * 1998-10-16 2000-06-15 Volkswagen Ag Verfahren und Vorrichtung zur automatischen Steuerung mindestens eines Gerätes per Sprachdialog
US20020087655A1 (en) * 1999-01-27 2002-07-04 Thomas E. Bridgman Information system for mobile users
GB9925297D0 (en) * 1999-10-27 1999-12-29 Ibm Voice processing system
US6181996B1 (en) * 1999-11-18 2001-01-30 International Business Machines Corporation System for controlling vehicle information user interfaces
US6539354B1 (en) * 2000-03-24 2003-03-25 Fluent Speech Technologies, Inc. Methods and devices for producing and using synthetic visual speech based on natural coarticulation

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2020160004A (ja) * 2019-03-28 2020-10-01 株式会社ホンダアクセス 車両用ナビゲーション装置
JP7336862B2 (ja) 2019-03-28 2023-09-01 株式会社ホンダアクセス 車両用ナビゲーション装置

Also Published As

Publication number Publication date
DE10063503A1 (de) 2002-07-04
ES2357700T3 (es) 2011-04-28
WO2002050815A1 (de) 2002-06-27
EP1344211A1 (de) 2003-09-17
US7698139B2 (en) 2010-04-13
EP1344211B1 (de) 2011-02-16
US20030225575A1 (en) 2003-12-04
DE50115798D1 (de) 2011-03-31

Similar Documents

Publication Publication Date Title
US7979274B2 (en) Method and system for preventing speech comprehension by interactive voice response systems
WO2005093713A1 (ja) 音声合成装置
JP3673471B2 (ja) テキスト音声合成装置およびプログラム記録媒体
JP2007086316A (ja) 音声合成装置、音声合成方法、音声合成プログラムおよび音声合成プログラムを記憶したコンピュータ読み取り可能な記憶媒体
US8103505B1 (en) Method and apparatus for speech synthesis using paralinguistic variation
JP2004516515A (ja) 区別された音声出力のための装置及び方法
JP3518898B2 (ja) 音声合成装置
AU769036B2 (en) Device and method for digital voice processing
JPH08335096A (ja) テキスト音声合成装置
JPH07200554A (ja) 文章読み上げ装置
JPH09198062A (ja) 楽音発生装置
JP2010175717A (ja) 音声合成装置
JPH11249679A (ja) 音声合成装置
JPH08248993A (ja) 音韻時間長制御方法
JP2008058379A (ja) 音声合成システム及びフィルタ装置
JP3081300B2 (ja) 残差駆動型音声合成装置
JP2001350490A (ja) テキスト音声変換装置及び方法
JPH11161297A (ja) 音声合成方法及び装置
JP3192981B2 (ja) テキスト音声合成装置
JPH0934490A (ja) 音声合成装置および音声合成方法、ナビゲーションシステム、並びに記録媒体
JPH04243299A (ja) 音声出力装置
Tatham et al. Speech synthesis in dialogue systems
Paulo et al. Reducing the corpus-based TTS signal degradation due to speaker's word pronunciations.
JPH09325788A (ja) 音声合成装置及び方法
JPH05173587A (ja) 音声合成装置

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20040716

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20070116

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20070320

A602 Written permission of extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A602

Effective date: 20070328

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20070423

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20070612

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20070727

A911 Transfer of reconsideration by examiner before appeal (zenchi)

Free format text: JAPANESE INTERMEDIATE CODE: A911

Effective date: 20070903

A912 Removal of reconsideration by examiner before appeal (zenchi)

Free format text: JAPANESE INTERMEDIATE CODE: A912

Effective date: 20070914

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20090408