JP2004516515A - 区別された音声出力のための装置及び方法 - Google Patents
区別された音声出力のための装置及び方法 Download PDFInfo
- Publication number
- JP2004516515A JP2004516515A JP2002551833A JP2002551833A JP2004516515A JP 2004516515 A JP2004516515 A JP 2004516515A JP 2002551833 A JP2002551833 A JP 2002551833A JP 2002551833 A JP2002551833 A JP 2002551833A JP 2004516515 A JP2004516515 A JP 2004516515A
- Authority
- JP
- Japan
- Prior art keywords
- parameters
- audio output
- output
- voice
- audio
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L13/00—Speech synthesis; Text to speech systems
- G10L13/02—Methods for producing synthetic speech; Speech synthesisers
- G10L13/033—Voice editing, e.g. manipulating the voice of the synthesiser
Abstract
Description
本発明は、特に車両において使用するための、区別された音声出力或いは音声発生のための装置、それに付属する方法、この音声出力装置を用いた使用システム、及び、少なくとも2つのシステムと音声出力装置との組み合わせに関する。
【0002】
車両では、音声出力のための音響的な人間・機械・インタフェースを有する個々のシステムが使用される。これらのシステムには各々1つの音声出力モジュールが直接的に割り当てられている。使用されている音声生成方法は、多くの場合、パルス符号変調(PCM)に基づき、この際、後続する圧縮(例えばMPEG)が接続可能である。他のシステムは音声合成法を使用し、これらの音声合成法は、主として音節セグメント(音素)の編成を介し、単語と文章を形成する(信号操作)。
【0003】
前記の音声出力法では話者依存性もあり、この話者依存性は、単語範囲又はテキスト範囲を拡張する場合には再三に渡って同一の人間話者を録音に尽力させるということ要求する。更にPCM法は、テキスト又は音節セグメントを格納するために、信号操作による高品質の音素合成と同様に多大な記憶場所(メモリスペース)を要求する。これらの両方の方法において、例えば様々な国の音声(言語)が出力されるべき場合には記憶場所が更に一層増加することになる。
【0004】
更に音声の完全合成に基づく方法が知られている。人間の声道を電気対応として変換し、音発生器と後続接続された複数のフィルタとを用いて処理(ソース・フィルタ・モデル)するという方法が特に知られている。この方法に従って動作する機器は所謂フォルマント合成器(例えばKLATTALK)である。このようなフォルマント合成器は、声特有の特性に影響を及ぼすことができるという長所を有する。
【0005】
本発明の基礎を成す課題は、特に車両において使用するための、区別された音声出力が可能である装置及びそれに付属する方法、その音声出力装置を用いた使用システム、及び、少なくとも2つのシステムと音声出力装置との組み合わせを提供することである。
【0006】
この課題は、特許請求項に記載した特徴を用いて解決される。
【0007】
本発明は、唯一の音声出力装置或いは音声合成装置を用いて異なるシステムのための音声出力が可能であるという長所を有し、この際、各システムは声特有の違いによって識別可能である。
【0008】
本発明の有利な実施形態に従い、各システムのためにパラメータセットが割り当てられていて、このパラメータセットは、その各システムからの音声出力の際に音声合成装置によって使用される。例えば第1パラメータセットはオンボードコンピュータのために、第2パラメータセットはナビゲーションシステムのために、第3パラメータセットは交通情報のために、第4パラメータセットはEメールのようなTTSシステム(Text to Speech System)のために、及び、1つ又は複数の他のパラメータセットが追加的なシステムのために提供される。
【0009】
割り当てられているパラメータセットに依存し、音声合成装置は、例えばナビゲーションシステムの音声出力のためにはソフトな女声で又は例えば交通情報メッセージの音声出力のためにはハードな低音男声により音声出力を生成する。
【0010】
本発明の有利な実施形態に従い、音声の完全合成のための方法及び装置が使用され、好ましくはフォルマント合成器である。この際、合成器のための制御パラメータはクラスに分割される。動的パラメータによるクラスは、話す際の音声道の動きのような調音(アーティキュレーション)を制御する。静的パラメータによる第2クラスは、発生器基本周波数や、子供、女性、又は男性の話者において音声道の様々な形状的な大きさ(ディメンション)によって形成される固定フォルマントのような話者特有の特徴を制御する。
【0011】
フォルマント合成器の拡張モデルでは、有声音及び無声音の別個の発生が可能である。この際、他のパラメータにより追加的な共振器又は減衰要素がスイッチオンされ得る又は調音用の動的パラメータに影響が及ぼされ得る。
【0012】
本発明による装置或いは本発明による方法は、特に車両のシステム内で使用可能である。各システムは、音声出力のために、音声出力を制御する2つの可能性を有する。音声出力の第1の可能性は、音声調音用の制御命令を出力する送信を含んでいて、この際、単語、文章、及び文章順番のための制御パラメータのシーケンスがシステム内に保存されている。音声出力を制御するための第2の可能性は、話者の特徴付けのために決定されているパラメータセットを切り替える第2の出力を介して行われる。
【0013】
選択的に又は追加的に、このパラメータデータセットを直接的にシステム内に記憶させること、及び、音声出力が要求される場合にこのパラメータデータセットを音声合成装置内にロードすることも可能である。
【0014】
選択的に又は追加的に前記の実施形態に使用可能である他の有利な実施形態に従い、情報源を区別するため、即ち音声出力を実施するシステムを区別するために、発生器パラメータ及びフォルマントパラメータが追加的に動的に変更され得る。それにより、音節セグメントの時間的な長さ及び/又はアクセント、及び/又は文章抑揚のような韻律において聞き取れる区別(違い)が達成され得る。特に、韻律変調は、例えば交通位置又は交通状況に依存し、通知テキストの音声出力のために利用され得る。要するに、情報の衝撃性は声の変調によって表現され得る。
【0015】
本発明は、例えば車両において小型のパラメータメモリを有する唯一の音声発生器だけが複数の情報源によってコントロールされ得るという長所を有する。この際、情報源には異なる声の特徴付けが備え付けられ得る。
【0016】
完全合成装置、例えば声道合成装置を使用する場合、この方法は話者に依存せず、高価なスタジオ録音は必要とされない。
【0017】
拡張フォルマント合成器では、本発明に従い、声における感情的な表現をも付け加えることができる。
【0018】
パラメータの型を予め作成することにより、極めて簡単に声の特徴付けが変更され得る。この方法は、フリーテキストを音声に変換する(Text to Speech)ためにも適していて、例えば、Eメールの読み上げである。
【0019】
次に、実施例及び図面に基づき、本発明を詳細に説明する。
【0020】
図1には、本発明に従う複数のシステムを用いて区別して音声出力するための本発明の有利な実施形態の原理図が示されている。
【0021】
図1に描かれている本発明の有利な実施形態は、音声合成装置10を備えた音声出力ユニット1を有し、音声合成装置10は、この例において、声道合成モジュールであり、音声の完全合成に基づいている。例えばKLATTALKのようなフォルマント合成器が使用され得る。音声合成装置10は増幅器12と接続されていて、増幅器12の出力部14はオーディオ信号を提供し、このオーディオ信号はスピーカ(非図示)を介して音声を出力させる。音声合成装置10にはN個のパラメータセット21、22、〜 2Nが割り当てられていて、これらのパラメータセットは、図示された例では音声出力ユニット1のメモリ20内に記憶されている。更に、N個のシステム31、32、〜 3Nが示されていて、これらのシステムは、個々のライン、バスシステム、又はデータチャネルのようなデータ接続部を介し、各々、音声出力ユニット1と接続されている。各システムは音声出力ユニット1を介して音声出力を実施し得る。個々には、オンボードコンピュータ用の付属のパラメータセット21を有するオンボードコンピュータ31、ナビゲーション用の付属のパラメータセット22を有するナビゲーションシステム32、交通情報用の付属のパラメータセット23を有する交通情報システム33、Eメール用の付属のパラメータセット24を有するTTSシステムのようなEメールシステム34が設けられている。また、割り当てられている各々のパラメータセット2Nを有する他のシステム3Nが設けられ得る。図示された例では、唯一の音声出力ユニット1を使用し、ナビゲーションシステム32を例えばソフトな女声で話させることが可能であり、この声は、ナビゲーションシステム用のパラメータセット22により決定されている。更に例えば交通情報メッセージのためにパラメータセット23が設けられ得て、このパラメータセット23を用い、音声出力の際にはハードな低音男声が使用される。
【0022】
音声出力の順番は、システムから音声出力するための依頼の入力に対応し、時間的に相前後して行われる。好ましくは、より高い優先権を有する情報、例えば誤り運転者のような危険な状況時の交通情報が先ず音声出力によって出力される。特に有利には、最も高い優先権を有する情報、例えば車両の機能障害又は開始する車道の滑りに関するオンボードコンピュータからの情報が迅速に出力され、この際、流れている音声出力は中断され得る。中断された音声出力は、引き続き、最後まで導かれる又は反復され得る。
【0023】
本発明は、音響的な提示により、視覚的な提示の場合はそうであるが、運転者の役割から運転者の気をそらさせてしまうことなく、システムが異なるシステムの案内情報を運転者に提供し得るという長所を有する。異なるオンボードコンピュータによって使用され得る音声合成装置を使用することによりコストが節約され得る。例えばナビゲーションシステムにおいて以前まで使用されていた音声生成法に対し、記憶場所(メモリスペース)の要求が減少され得る。
【0024】
本発明は、特に有利には自動車において使用可能である。
【図面の簡単な説明】
【図1】
本発明に従う複数のシステムを用いて区別して音声出力するための本発明の有利な実施形態の原理図を示す図である。
Claims (14)
- 第1システム(31)及び少なくとも1つの他のシステム(32、33〜3N)と接続可能である、区別された音声出力のための装置(1)において、第1システム(31)の音声出力には第1の声の特徴付けが割り当てられていて、他のシステム(32、33〜3N)の他の音声出力には、第1の声の特徴付けとは聞き取れて区別される他の声の特徴付けが割り当てられていること。
- 動的パラメータによる第1クラス及び静的パラメータによる第2クラスを有する制御パラメータを獲得する音声合成装置(10)を有する、請求項1に記載の装置において、動的パラメータが音声道の動きに対応して調音を制御し、静的パラメータが声特有の特徴を制御すること。
- 請求項2に記載の装置において、静的パラメータが、発生器基本周波数、及び/又は、子供、女性、又は男性の話者において音声道の様々な形状的な大きさに好ましくは対応する固定フォルマントを有すること。
- 請求項3に記載の装置において、発生器パラメータ及び/又はフォルマントパラメータが異なるシステムからの音声出力のために変更可能であり、好ましくは、音節セグメントの時間的な長さ及び/又はアクセント、及び/又は文章抑揚のような韻律において聞き取れる区別がもたらされること。
- 請求項2〜4にいずれか一項に記載の装置において、音声合成装置(10)がフォルマント合成器であり、このフォルマント合成器を用い、声特有の特性に影響が及ぼされ得ること。
- 請求項5に記載の装置において、有声音及び無声音を別個に発生することにフォルマント合成器が適されていて、更には、特に他のパラメータにより追加的な共振器又は減衰要素がスイッチオン可能であり及び/又は調音用の動的パラメータに影響が及ぼされ得ること。
- 請求項2〜6にいずれか一項に記載の装置において、動的パラメータが、単語、文章、及び文章順番によるシーケンスに対応して各システム内に保存されていること。
- 請求項2〜7にいずれか一項に記載の装置において、静的パラメータがパラメータセットとして各システム内に記憶されていて、音声出力が要求される場合にこのパラメータセットが音声合成装置(10)へと伝達されること。
- 請求項2〜7にいずれか一項に記載の装置において、システムのための静的パラメータが、割り当てられたパラメータセットとして音声出力装置のメモリ(20)内に記憶されていて、割り当てられたパラメータセットがシステムの選択信号に依存して音声合成装置(10)によって音声出力のために使用されること。
- 請求項2〜9にいずれか一項に記載の装置において、音声合成装置(10)が増幅器(12)と接続されていて、この増幅器(12)のオーディオ出力部(14)を介して音声出力が行われること。
- 請求項1〜10のいずれか一項に記載の装置を用いた使用システムにおいて、このシステムが、動的パラメータを出力するための第1出力部、及び、音声出力装置(10)内でパラメータセットを切り替えるために選択信号を出力するための第2出力部を有すること。
- 請求項1〜10のいずれか一項に記載の装置を用いた使用システムにおいて、このシステムが、動的パラメータ及び静的パラメータを好ましくはパラメータセットとして音声出力装置(10)へと出力するための出力部を有すること。
- オンボードコンピュータ(31)、ナビゲーションシステム(32)、交通情報システム(33)、Eメールシステム(34)、又は情報システム(3N)のような、少なくとも1つの第1システム及び少なくとも1つの他のシステムと、請求項1〜10のいずれか一項に記載の装置とを、好ましくは車両内で使用するために組み合わせること。
- 請求項1〜10のいずれか一項に記載の装置を使用する、区別された音声出力のための方法。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
DE10063503A DE10063503A1 (de) | 2000-12-20 | 2000-12-20 | Vorrichtung und Verfahren zur differenzierten Sprachausgabe |
PCT/EP2001/013488 WO2002050815A1 (de) | 2000-12-20 | 2001-11-21 | Vorrichtung und verfahren zur differenzierten sprachausgabe |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2004516515A true JP2004516515A (ja) | 2004-06-03 |
Family
ID=7667936
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2002551833A Pending JP2004516515A (ja) | 2000-12-20 | 2001-11-21 | 区別された音声出力のための装置及び方法 |
Country Status (6)
Country | Link |
---|---|
US (1) | US7698139B2 (ja) |
EP (1) | EP1344211B1 (ja) |
JP (1) | JP2004516515A (ja) |
DE (2) | DE10063503A1 (ja) |
ES (1) | ES2357700T3 (ja) |
WO (1) | WO2002050815A1 (ja) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2020160004A (ja) * | 2019-03-28 | 2020-10-01 | 株式会社ホンダアクセス | 車両用ナビゲーション装置 |
Families Citing this family (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
GB2412046A (en) * | 2004-03-11 | 2005-09-14 | Seiko Epson Corp | Semiconductor device having a TTS system to which is applied a voice parameter set |
DE102005063077B4 (de) * | 2005-12-29 | 2011-05-05 | Airbus Operations Gmbh | Aufzeichnung digitaler Cockpit-Boden-Kommunikation auf einem unfallgeschützten Sprachrekorder |
CN101460994A (zh) * | 2006-06-02 | 2009-06-17 | 皇家飞利浦电子股份有限公司 | 语音区分 |
DE102008019071A1 (de) * | 2008-04-15 | 2009-10-29 | Continental Automotive Gmbh | Verfahren, Fahrerinformationssystem und Fahrerassistenzsystem zur Ausgabe von Informationen |
JP7133149B2 (ja) * | 2018-11-27 | 2022-09-08 | トヨタ自動車株式会社 | 自動運転装置、カーナビゲーション装置及び運転支援システム |
Family Cites Families (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS5667470A (en) * | 1979-11-07 | 1981-06-06 | Canon Inc | Voice desk-top calculator |
US5559927A (en) * | 1992-08-19 | 1996-09-24 | Clynes; Manfred | Computer system producing emotionally-expressive speech messages |
US5561736A (en) * | 1993-06-04 | 1996-10-01 | International Business Machines Corporation | Three dimensional speech synthesis |
JPH08328573A (ja) * | 1995-05-29 | 1996-12-13 | Sanyo Electric Co Ltd | カラオケ装置及び音声再生装置及びこれに使用する記録媒体 |
US5924068A (en) * | 1997-02-04 | 1999-07-13 | Matsushita Electric Industrial Co. Ltd. | Electronic news reception apparatus that selectively retains sections and searches by keyword or index for text to speech conversion |
JP3287281B2 (ja) * | 1997-07-31 | 2002-06-04 | トヨタ自動車株式会社 | メッセージ処理装置 |
JP3502247B2 (ja) * | 1997-10-28 | 2004-03-02 | ヤマハ株式会社 | 音声変換装置 |
DE19908137A1 (de) * | 1998-10-16 | 2000-06-15 | Volkswagen Ag | Verfahren und Vorrichtung zur automatischen Steuerung mindestens eines Gerätes per Sprachdialog |
US20020087655A1 (en) * | 1999-01-27 | 2002-07-04 | Thomas E. Bridgman | Information system for mobile users |
GB9925297D0 (en) * | 1999-10-27 | 1999-12-29 | Ibm | Voice processing system |
US6181996B1 (en) * | 1999-11-18 | 2001-01-30 | International Business Machines Corporation | System for controlling vehicle information user interfaces |
US6539354B1 (en) * | 2000-03-24 | 2003-03-25 | Fluent Speech Technologies, Inc. | Methods and devices for producing and using synthetic visual speech based on natural coarticulation |
-
2000
- 2000-12-20 DE DE10063503A patent/DE10063503A1/de not_active Ceased
-
2001
- 2001-11-21 WO PCT/EP2001/013488 patent/WO2002050815A1/de active Application Filing
- 2001-11-21 JP JP2002551833A patent/JP2004516515A/ja active Pending
- 2001-11-21 ES ES01991746T patent/ES2357700T3/es not_active Expired - Lifetime
- 2001-11-21 DE DE50115798T patent/DE50115798D1/de not_active Expired - Lifetime
- 2001-11-21 EP EP01991746A patent/EP1344211B1/de not_active Expired - Lifetime
-
2003
- 2003-06-20 US US10/465,839 patent/US7698139B2/en not_active Expired - Lifetime
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2020160004A (ja) * | 2019-03-28 | 2020-10-01 | 株式会社ホンダアクセス | 車両用ナビゲーション装置 |
JP7336862B2 (ja) | 2019-03-28 | 2023-09-01 | 株式会社ホンダアクセス | 車両用ナビゲーション装置 |
Also Published As
Publication number | Publication date |
---|---|
DE10063503A1 (de) | 2002-07-04 |
ES2357700T3 (es) | 2011-04-28 |
WO2002050815A1 (de) | 2002-06-27 |
EP1344211A1 (de) | 2003-09-17 |
US7698139B2 (en) | 2010-04-13 |
EP1344211B1 (de) | 2011-02-16 |
US20030225575A1 (en) | 2003-12-04 |
DE50115798D1 (de) | 2011-03-31 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US7979274B2 (en) | Method and system for preventing speech comprehension by interactive voice response systems | |
WO2005093713A1 (ja) | 音声合成装置 | |
JP3673471B2 (ja) | テキスト音声合成装置およびプログラム記録媒体 | |
JP2007086316A (ja) | 音声合成装置、音声合成方法、音声合成プログラムおよび音声合成プログラムを記憶したコンピュータ読み取り可能な記憶媒体 | |
US8103505B1 (en) | Method and apparatus for speech synthesis using paralinguistic variation | |
JP2004516515A (ja) | 区別された音声出力のための装置及び方法 | |
JP3518898B2 (ja) | 音声合成装置 | |
AU769036B2 (en) | Device and method for digital voice processing | |
JPH08335096A (ja) | テキスト音声合成装置 | |
JPH07200554A (ja) | 文章読み上げ装置 | |
JPH09198062A (ja) | 楽音発生装置 | |
JP2010175717A (ja) | 音声合成装置 | |
JPH11249679A (ja) | 音声合成装置 | |
JPH08248993A (ja) | 音韻時間長制御方法 | |
JP2008058379A (ja) | 音声合成システム及びフィルタ装置 | |
JP3081300B2 (ja) | 残差駆動型音声合成装置 | |
JP2001350490A (ja) | テキスト音声変換装置及び方法 | |
JPH11161297A (ja) | 音声合成方法及び装置 | |
JP3192981B2 (ja) | テキスト音声合成装置 | |
JPH0934490A (ja) | 音声合成装置および音声合成方法、ナビゲーションシステム、並びに記録媒体 | |
JPH04243299A (ja) | 音声出力装置 | |
Tatham et al. | Speech synthesis in dialogue systems | |
Paulo et al. | Reducing the corpus-based TTS signal degradation due to speaker's word pronunciations. | |
JPH09325788A (ja) | 音声合成装置及び方法 | |
JPH05173587A (ja) | 音声合成装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20040716 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20070116 |
|
A601 | Written request for extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A601 Effective date: 20070320 |
|
A602 | Written permission of extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A602 Effective date: 20070328 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20070423 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20070612 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20070727 |
|
A911 | Transfer of reconsideration by examiner before appeal (zenchi) |
Free format text: JAPANESE INTERMEDIATE CODE: A911 Effective date: 20070903 |
|
A912 | Removal of reconsideration by examiner before appeal (zenchi) |
Free format text: JAPANESE INTERMEDIATE CODE: A912 Effective date: 20070914 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20090408 |