JP2004516515A

JP2004516515A - 区別された音声出力のための装置及び方法

Info

Publication number: JP2004516515A
Application number: JP2002551833A
Authority: JP
Inventors: ゲオルクオーベルト; クラウスベンクラー
Original assignee: Bayerische Motoren Werke AG
Current assignee: Bayerische Motoren Werke AG
Priority date: 2000-12-20
Filing date: 2001-11-21
Publication date: 2004-06-03
Also published as: DE10063503A1; ES2357700T3; WO2002050815A1; EP1344211A1; US7698139B2; EP1344211B1; US20030225575A1; DE50115798D1

Abstract

本装置及び本方法は区別された音声出力のために用いられる。オンボードコンピュータ、ナビゲーションシステムなどのような車両内に設けられているシステムが１つの音声出力装置と接続可能であり、この際、異なるシステムからの音声出力が声の特徴付けを介して区別可能である。

Description

【０００１】
本発明は、特に車両において使用するための、区別された音声出力或いは音声発生のための装置、それに付属する方法、この音声出力装置を用いた使用システム、及び、少なくとも２つのシステムと音声出力装置との組み合わせに関する。
【０００２】
車両では、音声出力のための音響的な人間・機械・インタフェースを有する個々のシステムが使用される。これらのシステムには各々１つの音声出力モジュールが直接的に割り当てられている。使用されている音声生成方法は、多くの場合、パルス符号変調（ＰＣＭ）に基づき、この際、後続する圧縮（例えばＭＰＥＧ）が接続可能である。他のシステムは音声合成法を使用し、これらの音声合成法は、主として音節セグメント（音素）の編成を介し、単語と文章を形成する（信号操作）。
【０００３】
前記の音声出力法では話者依存性もあり、この話者依存性は、単語範囲又はテキスト範囲を拡張する場合には再三に渡って同一の人間話者を録音に尽力させるということ要求する。更にＰＣＭ法は、テキスト又は音節セグメントを格納するために、信号操作による高品質の音素合成と同様に多大な記憶場所（メモリスペース）を要求する。これらの両方の方法において、例えば様々な国の音声（言語）が出力されるべき場合には記憶場所が更に一層増加することになる。
【０００４】
更に音声の完全合成に基づく方法が知られている。人間の声道を電気対応として変換し、音発生器と後続接続された複数のフィルタとを用いて処理（ソース・フィルタ・モデル）するという方法が特に知られている。この方法に従って動作する機器は所謂フォルマント合成器（例えばＫＬＡＴＴＡＬＫ）である。このようなフォルマント合成器は、声特有の特性に影響を及ぼすことができるという長所を有する。
【０００５】
本発明の基礎を成す課題は、特に車両において使用するための、区別された音声出力が可能である装置及びそれに付属する方法、その音声出力装置を用いた使用システム、及び、少なくとも２つのシステムと音声出力装置との組み合わせを提供することである。
【０００６】
この課題は、特許請求項に記載した特徴を用いて解決される。
【０００７】
本発明は、唯一の音声出力装置或いは音声合成装置を用いて異なるシステムのための音声出力が可能であるという長所を有し、この際、各システムは声特有の違いによって識別可能である。
【０００８】
本発明の有利な実施形態に従い、各システムのためにパラメータセットが割り当てられていて、このパラメータセットは、その各システムからの音声出力の際に音声合成装置によって使用される。例えば第１パラメータセットはオンボードコンピュータのために、第２パラメータセットはナビゲーションシステムのために、第３パラメータセットは交通情報のために、第４パラメータセットはＥメールのようなＴＴＳシステム（ＴｅｘｔｔｏＳｐｅｅｃｈＳｙｓｔｅｍ）のために、及び、１つ又は複数の他のパラメータセットが追加的なシステムのために提供される。
【０００９】
割り当てられているパラメータセットに依存し、音声合成装置は、例えばナビゲーションシステムの音声出力のためにはソフトな女声で又は例えば交通情報メッセージの音声出力のためにはハードな低音男声により音声出力を生成する。
【００１０】
本発明の有利な実施形態に従い、音声の完全合成のための方法及び装置が使用され、好ましくはフォルマント合成器である。この際、合成器のための制御パラメータはクラスに分割される。動的パラメータによるクラスは、話す際の音声道の動きのような調音（アーティキュレーション）を制御する。静的パラメータによる第２クラスは、発生器基本周波数や、子供、女性、又は男性の話者において音声道の様々な形状的な大きさ（ディメンション）によって形成される固定フォルマントのような話者特有の特徴を制御する。
【００１１】
フォルマント合成器の拡張モデルでは、有声音及び無声音の別個の発生が可能である。この際、他のパラメータにより追加的な共振器又は減衰要素がスイッチオンされ得る又は調音用の動的パラメータに影響が及ぼされ得る。
【００１２】
本発明による装置或いは本発明による方法は、特に車両のシステム内で使用可能である。各システムは、音声出力のために、音声出力を制御する２つの可能性を有する。音声出力の第１の可能性は、音声調音用の制御命令を出力する送信を含んでいて、この際、単語、文章、及び文章順番のための制御パラメータのシーケンスがシステム内に保存されている。音声出力を制御するための第２の可能性は、話者の特徴付けのために決定されているパラメータセットを切り替える第２の出力を介して行われる。
【００１３】
選択的に又は追加的に、このパラメータデータセットを直接的にシステム内に記憶させること、及び、音声出力が要求される場合にこのパラメータデータセットを音声合成装置内にロードすることも可能である。
【００１４】
選択的に又は追加的に前記の実施形態に使用可能である他の有利な実施形態に従い、情報源を区別するため、即ち音声出力を実施するシステムを区別するために、発生器パラメータ及びフォルマントパラメータが追加的に動的に変更され得る。それにより、音節セグメントの時間的な長さ及び／又はアクセント、及び／又は文章抑揚のような韻律において聞き取れる区別（違い）が達成され得る。特に、韻律変調は、例えば交通位置又は交通状況に依存し、通知テキストの音声出力のために利用され得る。要するに、情報の衝撃性は声の変調によって表現され得る。
【００１５】
本発明は、例えば車両において小型のパラメータメモリを有する唯一の音声発生器だけが複数の情報源によってコントロールされ得るという長所を有する。この際、情報源には異なる声の特徴付けが備え付けられ得る。
【００１６】
完全合成装置、例えば声道合成装置を使用する場合、この方法は話者に依存せず、高価なスタジオ録音は必要とされない。
【００１７】
拡張フォルマント合成器では、本発明に従い、声における感情的な表現をも付け加えることができる。
【００１８】
パラメータの型を予め作成することにより、極めて簡単に声の特徴付けが変更され得る。この方法は、フリーテキストを音声に変換する（ＴｅｘｔｔｏＳｐｅｅｃｈ）ためにも適していて、例えば、Ｅメールの読み上げである。
【００１９】
次に、実施例及び図面に基づき、本発明を詳細に説明する。
【００２０】
図１には、本発明に従う複数のシステムを用いて区別して音声出力するための本発明の有利な実施形態の原理図が示されている。
【００２１】
図１に描かれている本発明の有利な実施形態は、音声合成装置１０を備えた音声出力ユニット１を有し、音声合成装置１０は、この例において、声道合成モジュールであり、音声の完全合成に基づいている。例えばＫＬＡＴＴＡＬＫのようなフォルマント合成器が使用され得る。音声合成装置１０は増幅器１２と接続されていて、増幅器１２の出力部１４はオーディオ信号を提供し、このオーディオ信号はスピーカ（非図示）を介して音声を出力させる。音声合成装置１０にはＮ個のパラメータセット２１、２２、〜２Ｎが割り当てられていて、これらのパラメータセットは、図示された例では音声出力ユニット１のメモリ２０内に記憶されている。更に、Ｎ個のシステム３１、３２、〜３Ｎが示されていて、これらのシステムは、個々のライン、バスシステム、又はデータチャネルのようなデータ接続部を介し、各々、音声出力ユニット１と接続されている。各システムは音声出力ユニット１を介して音声出力を実施し得る。個々には、オンボードコンピュータ用の付属のパラメータセット２１を有するオンボードコンピュータ３１、ナビゲーション用の付属のパラメータセット２２を有するナビゲーションシステム３２、交通情報用の付属のパラメータセット２３を有する交通情報システム３３、Ｅメール用の付属のパラメータセット２４を有するＴＴＳシステムのようなＥメールシステム３４が設けられている。また、割り当てられている各々のパラメータセット２Ｎを有する他のシステム３Ｎが設けられ得る。図示された例では、唯一の音声出力ユニット１を使用し、ナビゲーションシステム３２を例えばソフトな女声で話させることが可能であり、この声は、ナビゲーションシステム用のパラメータセット２２により決定されている。更に例えば交通情報メッセージのためにパラメータセット２３が設けられ得て、このパラメータセット２３を用い、音声出力の際にはハードな低音男声が使用される。
【００２２】
音声出力の順番は、システムから音声出力するための依頼の入力に対応し、時間的に相前後して行われる。好ましくは、より高い優先権を有する情報、例えば誤り運転者のような危険な状況時の交通情報が先ず音声出力によって出力される。特に有利には、最も高い優先権を有する情報、例えば車両の機能障害又は開始する車道の滑りに関するオンボードコンピュータからの情報が迅速に出力され、この際、流れている音声出力は中断され得る。中断された音声出力は、引き続き、最後まで導かれる又は反復され得る。
【００２３】
本発明は、音響的な提示により、視覚的な提示の場合はそうであるが、運転者の役割から運転者の気をそらさせてしまうことなく、システムが異なるシステムの案内情報を運転者に提供し得るという長所を有する。異なるオンボードコンピュータによって使用され得る音声合成装置を使用することによりコストが節約され得る。例えばナビゲーションシステムにおいて以前まで使用されていた音声生成法に対し、記憶場所（メモリスペース）の要求が減少され得る。
【００２４】
本発明は、特に有利には自動車において使用可能である。
【図面の簡単な説明】
【図１】
本発明に従う複数のシステムを用いて区別して音声出力するための本発明の有利な実施形態の原理図を示す図である。

Claims

第１システム（３１）及び少なくとも１つの他のシステム（３２、３３〜３Ｎ）と接続可能である、区別された音声出力のための装置（１）において、第１システム（３１）の音声出力には第１の声の特徴付けが割り当てられていて、他のシステム（３２、３３〜３Ｎ）の他の音声出力には、第１の声の特徴付けとは聞き取れて区別される他の声の特徴付けが割り当てられていること。
動的パラメータによる第１クラス及び静的パラメータによる第２クラスを有する制御パラメータを獲得する音声合成装置（１０）を有する、請求項１に記載の装置において、動的パラメータが音声道の動きに対応して調音を制御し、静的パラメータが声特有の特徴を制御すること。
請求項２に記載の装置において、静的パラメータが、発生器基本周波数、及び／又は、子供、女性、又は男性の話者において音声道の様々な形状的な大きさに好ましくは対応する固定フォルマントを有すること。
請求項３に記載の装置において、発生器パラメータ及び／又はフォルマントパラメータが異なるシステムからの音声出力のために変更可能であり、好ましくは、音節セグメントの時間的な長さ及び／又はアクセント、及び／又は文章抑揚のような韻律において聞き取れる区別がもたらされること。
請求項２〜４にいずれか一項に記載の装置において、音声合成装置（１０）がフォルマント合成器であり、このフォルマント合成器を用い、声特有の特性に影響が及ぼされ得ること。
請求項５に記載の装置において、有声音及び無声音を別個に発生することにフォルマント合成器が適されていて、更には、特に他のパラメータにより追加的な共振器又は減衰要素がスイッチオン可能であり及び／又は調音用の動的パラメータに影響が及ぼされ得ること。
請求項２〜６にいずれか一項に記載の装置において、動的パラメータが、単語、文章、及び文章順番によるシーケンスに対応して各システム内に保存されていること。
請求項２〜７にいずれか一項に記載の装置において、静的パラメータがパラメータセットとして各システム内に記憶されていて、音声出力が要求される場合にこのパラメータセットが音声合成装置（１０）へと伝達されること。
請求項２〜７にいずれか一項に記載の装置において、システムのための静的パラメータが、割り当てられたパラメータセットとして音声出力装置のメモリ（２０）内に記憶されていて、割り当てられたパラメータセットがシステムの選択信号に依存して音声合成装置（１０）によって音声出力のために使用されること。
請求項２〜９にいずれか一項に記載の装置において、音声合成装置（１０）が増幅器（１２）と接続されていて、この増幅器（１２）のオーディオ出力部（１４）を介して音声出力が行われること。
請求項１〜１０のいずれか一項に記載の装置を用いた使用システムにおいて、このシステムが、動的パラメータを出力するための第１出力部、及び、音声出力装置（１０）内でパラメータセットを切り替えるために選択信号を出力するための第２出力部を有すること。
請求項１〜１０のいずれか一項に記載の装置を用いた使用システムにおいて、このシステムが、動的パラメータ及び静的パラメータを好ましくはパラメータセットとして音声出力装置（１０）へと出力するための出力部を有すること。
オンボードコンピュータ（３１）、ナビゲーションシステム（３２）、交通情報システム（３３）、Ｅメールシステム（３４）、又は情報システム（３Ｎ）のような、少なくとも１つの第１システム及び少なくとも１つの他のシステムと、請求項１〜１０のいずれか一項に記載の装置とを、好ましくは車両内で使用するために組み合わせること。
請求項１〜１０のいずれか一項に記載の装置を使用する、区別された音声出力のための方法。