JP2002055692A

JP2002055692A - 音声出力のためのメッセージの構成方法

Info

Publication number: JP2002055692A
Application number: JP2001199251A
Authority: JP
Inventors: Peter Buth; ブツペテル; Simona Grothues; グロスエスシモナ; Amir Iman; イマンアミール; Wolfgang Theimer; テイメルボルフガンク
Original assignee: Nokia Mobile Phones Ltd
Current assignee: Nokia Oyj
Priority date: 2000-06-30
Filing date: 2001-06-29
Publication date: 2002-02-20
Also published as: US6757653B2; EP1168298B1; US20020029139A1; EP1168298A3; EP1168298A2; ATE347160T1; DE50111522D1; DE10031008A1

Abstract

(57)【要約】【課題】メッセージの音声出力の再生の質の向上を図
る。【解決手段】メッセージの一連のオリジナル・センテ
ンス（１０）がセグメント化されてデータベース（１
１）内の検索基準と共にオーディオファイルの形式で記
憶され、セグメント（１０）毎に長さ、位置、および遷
移値が記録されるように、更に別の項目（１２）がセグ
メント（１０）上に作成される。センテンスを再生する
場合は、検索基準のフォーマットに対応するフォーマッ
トで伝送され、再生されるべきセンテンスがセグメント
（１０）により完全に再生可能かの調査が行われ、再生
可能の場合、項目（１２）を利用して、個々のセグメン
トが音声のリズムに関してどの程度整合しているか吟味
され、音声の自然のリズムを最適に保持するための必要
条件を呈するセグメント（１０）のオーディオファイル
が組合わされて再生出力される。

Description

【発明の詳細な説明】

【０００１】

【発明の属する技術分野】この発明は音声出力のために
メッセージを構成する方法に関し、特にこの種の音声出
力の再生の質の向上に関する。

【０００２】

【従来の技術】従来のシステムでは、音声出力を実施す
るためにデータベースから対応する項目が呼び出される
ことが公知である。詳細には、これは例えば、特定の数
の異なるメッセージ、言い換えると、特定の数の異なる
センテンス、コマンド、ユーザー要求、言葉のあや、フ
レーズまたはその類似物がメモリ内にファイルされ、フ
ァイルされたメッセージへの要求に基づいて、これがメ
モリから読み出され、再生されることによって実行でき
る。この種類の配置は、予め完全に記憶されたメッセー
ジだけを再生可能であるので、極めてフレキシブルでは
ないことは明白である。

【０００３】したがって、メッセージをセグメントに分
割し、これらを対応するオーディオファイルとして記憶
しておくような切換えがなされてきた。メッセージを出
力するべき場合は、セグメントから望まれるメッセージ
を再構成する必要がある。従来技術では、このことは、
形成されるべきメッセージ向けに対応する命令だけがメ
ッセージに関連する順序でセグメントに伝送されること
によって実施される。これらの命令によって対応するオ
ーディオファイルがメモリから読み出され、出力のため
に合体される。センテンスまたはセンテンスの一部を形
成するためのこの方法の特徴は、記憶容量の必要性が少
なくフレキシビリティが高いことにある。しかし、この
方法では音声の自然な流れが考慮なされていないので、
この方法によってコンパイルされた再生が極めて合成的
に聞こえるという欠点がある。

【０００４】

【発明が解決しようとする課題】この発明の目的は、音
声の自然な流れを考慮に入れ、ひいては調和のとれた再
生結果をもたらす、セグメントからメッセージを形成す
る方法を開示することにある。

【０００５】

【課題を解決するための手段】上記の目的は、請求項１
に記載の方法によって達成される。有利な実施形態およ
びその他の実施形態は従属クレームに記載されている。

【０００６】したがって、この発明に基づいて、出力さ
れることが意図されたメッセージがオーディオファイル
として記憶され、記憶されたオーディオファイルから検
索基準を利用して選択されたセグメントから構成され
る、オーディオファイルとして記憶された少なくとも１
つのオリジナル・センテンスのセグメントからなる音声
出力用のメッセージを構成する方法で、全てのセグメン
トにはオリジナル・センテンス内の音標プロパティを特
徴付ける少なくとも１つのパラメータが割当てられると
共に、オリジナル・センテンス内の音標プロバティを特
徴付ける個々のセグメントのパラメータを利用して、メ
ッセージとして出力される予定の再生センテンスを形成
するセグメントが音声の自然の流れに基づいて構成され
ているか否かのチェックが行われる。このようにして、
メッセージ自体を完全に記憶することなく、音声を再生
する際にメッセージの音声の自然な流れとリズムが大幅
に再構成される。

【０００７】更に自然なメッセージを得るために、全て
のセグメントにはオリジナル・センテンス内の音標プロ
パティを特徴付ける幾つかのパラメータが割当てられ、
パラメータは好適には以下のパラメータから選択でき
る。すなわち、それぞれのセグメントの長さ（Ｌ）、オ
リジナル・センテンス内の前記それぞれのセグメントの
位置、それぞれのセグメントの、オリジナル・センテン
ス内の先行の、または後続のセグメントへの前方および
／または後方遷移値であり、各ケースで割当てられる検
索基準の長さが更に、それぞれのセグメントの長さとし
て用いられる。

【０００８】特に良好な結果を達成するため、この発明
の有利な別の実施形態では、オリジナル・センテンス内
の先行の、または後続のセグメントの最後の、または最
初の文字、音節、または音標が遷移値として用いられ
る。遷移値として音素が用いられれば、オーディオファ
イルから構成される再生センテンスの特に高品質の再生
を達成できる。

【０００９】センテンス・メロディはセンテンスの種類
によって大きく左右されるので、更に別のパラメータと
してオリジナル・センテンスのそれぞれのセグメントが
質問文または感嘆文から派生したものであるか否かのデ
ータが備えられれば、再生の向上が更に達成される。

【００１０】この発明の有利な別の実施形態の特徴は、
メッセージとして出力される予定の再生センテンスを形
成するセグメント）の見出された組合わせごとに、下記
の公式

【数３】に基づいてオリジナル・センテンス内の音標プロパティ
を特徴付ける個々のセグメントのパラメータから評価測
定値が計算され、但し、ｆ_n,i（n)はｎ番目のパラメー
タの関数相関であり、ｉはセグメントを示す指標であ
り、Ｗ_nはｎ番目のパラメータの関数相関の重み係数で
ある。例えばパラメータ自体、その逆数値、または記憶
されたセグメントに割当てられたパラメータの値と、メ
ッセージのための組合わせのセグメントに割当てられる
パラメータとの一致を、パラメータの関数相関として備
えることができる。その中の重み係数によって評価測定
値を決定する際に好みを極めて僅かしか排除しなくても
済む。

【００１１】セグメントの見出された組合わせからの評
価測定値に従って、その評価測定値が、組合わせのセグ
メントが音声の自然の流れに従って構成されていること
を示している組合わせが、出力されるべきメッセージと
して選択される。

【００１２】この発明の別の構成では、評価測定値Ｂが
少なくとも下記のパラメータ、すなわちセグメントの長
さＬ、および位置Ｐ、並びに以下の公式、すなわち

【数４】に基づく前方および後方遷移値（Ｕ_front, Ｕ_rear）の
関数相関ｆ_n(n)から計算される。

【００１３】再生センテンスが検索基準に対応するフォ
ーマットセンテンスであり、探索基準および伝送される
再生センテンス用に好適には英数字ストリングが用いら
れば、評価は特に簡単になる。

【００１４】データベース内での迅速な検索を達成する
ために、探索基準がデータベース内に階層的に構成され
ていれば有利である。

【００１５】メッセージとして望まれる再生センテンス
の全体が、割当られたオーディオファイルと共にデータ
ベース内にファイルされた検索基準と一致するか否かの
テストが行われ、一致しない場合は、それぞれの再生セ
ンテンスの端部が縮小され、その後、再生センテンスの
残りの部分について単数または複数の一致が発見される
まで、データベース内にファイルされている検索基準と
の一致がチェックされ、前述のチェックが先行ステップ
で除去された再生センテンスの部分に関して継続され、
検索基準が再生センテンスと完全に一致しているセグメ
ントの各組合わせについて、メッセージとして出力され
る予定の再生センテンスを形成するセグメントが会話の
自然な流れに従って構成されているか否かのチェックが
行われ、望ましいメッセージの再生のために、その組合
わせが音声の自然な流れに最も近いセグメントのオーデ
ィオファイルが使用されれば、メッセージ用のセグメン
トの選択は特に簡単になる。

【００１６】したがって、全てのセグメントについて検
索基準を伴う少なくとも１つのデータ記録、オーディオ
ファイル、およびオリジナル・センテンス内の音標プロ
パティを特徴付ける少なくとも１つのパラメータ、言い
換えるとそれぞれのセグメント上の追加情報がファイル
されたことが一旦確認されると、このようにして編集さ
れたデータ記録を利用してセグメントの組合わせを極め
て簡単にコンパイルすることができ、その再生は対応す
るメッセージの音声による再生ともはや区別できなくな
る。この効果は、メッセージの出力前に、言い換えると
センテンス、センテンスの一部、要求、コマンド、フレ
ーズまたはその類似物の再生前に、データベース内部で
望ましいメッセージの対応する組合わせをそこから形成
できるセグメントの検索が行われ、かつ、用いられる全
てのセグメント上の情報を利用して、音声の自然な流れ
に対する組合わせの近似を記述する単数または複数のセ
グメントからなる全ての見出された組合わせの評価を実
施することによって達成される。コンパイルされた組合
わせの評価が完了すると、音声の自然な流れに最も近づ
いたセグメントの組合わせがメッセージ用に選択され
る。

【００１７】

【発明の実施の形態】次にこの発明の実施例を添付図面
を参照してより詳細に説明する。

【００１８】図１には音声出力装置によって要求に応じ
てメッセージとして再生可能である４つのオリジナル・
センテンスのリストを示しており、これらのオリジナル
・センテンスの各々は垂直の線によって２つ、またはそ
れ以上のセグメント１０に区分されている。これらの４
つのオリジナル・センテンスの各々は同じ意味内容を有
しており、順序を無視するならば−使用されている文字
と数字には相違はないものの、音響的に再生した場合は
個々のオリジナル・センテンスの間には顕著な相違が明
らかである。その理由は、個々のセンテンス構造内の語
または語群の配置に応じて、異なるイントネーションが
発せられるという事実による。例えば、メッセージとし
て“１００メートル先で左に曲がります”（ドイツ語）
というセンテンスを再生すべき場合、また、これを再生
するためにセグメント１０．１と１０．２ではなくセグ
メント１０．４と１０．３とが用いられる場合は、音声
の自然な流れに対応する調和した再生はなされない。

【００１９】この発明の知識を持たずに、リスト（図
１）に示された４つのオリジナル・センテンスのうちの
特定のセンテンスに特有なイントネーションを保持した
い場合は、これらのオリジナル・センテンスの各々の全
体をオーディオファイルとしてファイルすることが必要
である。それによって必要なメモリの容量は著しく大き
くなることは明白である。

【００２０】必要なメモリの容量を拡張することを避
け、しかも同時に音声の自然な流れに対応する調和のと
れた再生結果を確実に生ずるために、オリジナルに発音
された形式で一連のセンテンスを解析することが必要で
ある。ここで図１に示したオリジナル・センテンスを用
いて、以下に一連の例としてこの種類の解析を行う。

【００２１】最初に、メッセージ用の異なるセンテンス
が発音され、スピーカによっていわゆるオリジナル・セ
ンテンスとして録音される。

【００２２】次に、前記のようにして録音されたオリジ
ナル・センテンスがセグメント１０に区分され、これら
のセグメント１０の各々がオーディオファイル内にファ
イルされる。

【００２３】加えて、各々のオリジナル・センテンスに
検索基準群が割当てられる。この検索基準群はオリジナ
ル・センテンスの区分化( セグメンテーション) に従っ
て区分され、各々のセグメント１０には１つの検索基準
が割当てられる。オーディオファイルと検索基準の相互
の割当ては図２により詳細に示すデータベースで行われ
る。この実施例のこのデータベース１１から明らかであ
るように、検索基準として英数字ストリングが用いら
れ、検索基準として用いられる文字ストリングはオーデ
ィオファイルとしてファイルされた割当て済みのセグメ
ント１０のテキスト再生に対応している。検索基準とし
て用いられる文字または一連の文字がそのテキスト内容
が同一であるいずれかのセグメント１０を同一に特徴付
けていることが確実である限りは、必ずしも前述の文字
ストリングも英数字も検索基準として使用する必要はな
いことを念のために指摘しておく必要がある。例えば、
各セグメントにセグメント識別番号を割当てることも考
えられる。

【００２４】更に図２の図面から明らかであるように、
データベース１１には更に別の記入項目１２がある。コ
ラムの見出しにあるようにこれらの項目１２はそれぞれ
のセグメントの長さ（Ｌ）と、センテンス内でのその位
置Ｐと、２つの接続サウンド、すなわち遷移値（Ｕ
_front, Ｕ_rear）である。

【００２５】ここで、これらの項目１２を獲得する方法
を以下に説明する。

【００２６】オリジナル・センテンスが一旦区分化され
ると、例えば各々の検索基準ごとに割当てられたセグメ
ント１０の語数を計算することによって、長さ（Ｌ）に
関するそれぞれの項目１２が獲得される。この実施例で
は、割当てられた検索基準内の語をそのために編入(enl
ist)することができる。その結果、検索基準“曲がりま
す”（“ターン”）にオーディオファイルまたはセグメ
ント１０の長さ値１が割当てられ、一方、検索基準“１
００メートル先で”（イン１００メートル”）には、数
列“１００”が語とみなされるので長さ値３が割当てら
れる。流れ情報を得るために、検索基準に含まれる語は
必ずしも編入される必要がないことを念のために指摘し
ておく。その代わりに、（更には図示しない）別の実施
例では、それぞれの検索基準に含まれる文字数を利用す
ることができる。それによって、例えば検索基準“曲が
ります”では、長さ値８が生じ、また検索基準“１００
メートル先で”には長さ値１３が生ずることになろう。
何故ならば、この検索基準では、空白が語間にあり、ま
た数字が文字として見なされるからである。更に、長さ
値として音節、または音素数を使用することも考えられ
る。

【００２７】位置（Ｐ）を再生する項目１２は、例えば
最初にオリジナル・センテンス当たりのセグメント１
０、または検索基準の数を計算することによって獲得さ
れる。例えば、オリジナル・センテンスが区分化される
と、これが３つのセグメント１０に区分され、第１のセ
グメント１０には位置の値０が割当てられ、第２のセグ
メント１０には位置の値０．５が割当てられ、３つのセ
グメント１０のうちの最後のセグメントには位置の値１
が割当てられる。しかし、（図１の最初の２つのオリジ
ナル・センテンスの場合のように）オリジナル・センテ
ンスが２つのセグメント１０だけに区分される場合は、
第１のセグメント１０には位置の値０が割当てられ、一
方第２と最後のセグメント１０には位置の値１が割当て
られる。オリジナル・センテンスが４つのセグメント１
０からなっている場合は、第１のセグメント１０の位置
の値は０であり、第２のセグメント１０の位置の値は
０．３３であり、第３のセグメント１０の位置の値は
０．６６であり、一方、最後のセグメントには再び位置
の値１が与えられる。

【００２８】更に、センテンス内の実際の位置の代わり
に、それぞれのセグメント１０がメッセージの最初また
は最後にあるのか、または２つのセグメント１０の間に
あるのかを示すだけにすることも可能である。

【００２９】本明細書での遷移値（Ｕ）の意味は、セグ
メント１０または検索基準の先行の、または後続のセグ
メント１０に対するセグメント１０または検索基準の関
係であるものと理解されたい。それぞれのセグメント１
０についてのこの関係は、この実施例では先行のセグメ
ント１０の最後の文字、および後続のセグメント１０の
最初の文字に対して生ずる。ここで図１に基づき、最初
のオリジナル・センテンス（１００メートル先で左に曲
がります）を利用してより詳細な説明を行う。このオリ
ジナル・センテンスの最初のセグメント１０または検索
基準（１００メートル先で）には先行のセグメント１
０、または検索基準がないので、このセグメント１０に
関連し、かつ指標番号３（図２）を有するデータベース
内に、図面では“−”で示されている項目“空白”が前
方遷移値として記入される。この実施例では遷移値
（Ｕ）として１つの文字だけが用いられているので、オ
リジナル・センテンスではセグメント１０（１００メー
トル先で）の後にはセグメント１０（左に曲がります）
が続くので、指標番号３を有するデータベースには後方
遷移値（Ｕ）として“Ｉ”が記入される。この手順はオ
リジナル・センテンスの第２のセグメント（１０）（左
に曲がります）についても同一であり、この場合は指標
番号９が付されているデータベース内で、前方遷移値
（Ｕ）には“ｎ”が記入され、後方遷移値（Ｕ）には
“空白”が記入される。何故ならば、オリジナル・セン
テンス内のセグメント１０（左に曲がります）に先行す
るセグメント１０（１０メートルで）は“ｎ”で終わ
り、オリジナル・センテンスではセグメント１０（左に
曲がります）の後に続くセグメント１０はそれ以上ない
からである。

【００３０】前項に記した、それぞれのセグメント１０
についてこのセグメント１０に先行するセグメント１０
の最後の文字への遷移値（Ｕ）、またはこのセグメント
１０の後続のセグメント１０の最初の文字への遷移値
（Ｕ）の限定性は強制的なものではない。それぞれの遷
移値（Ｕ）として個々の文字の代わりに、それぞれ観察
されたセグメント１０の先行および後続のセグメント１
０の文字群または音素を使用することも同様に可能であ
る。この場合、特に音素を用いると、図２に記載のデー
タ記録を利用して、オーディオファイルから構成されて
いるメッセージの再生の品質が高くなる。

【００３１】図２に示した項目１２は長さ、位置、およ
び２つの遷移値に限定されるものではないことをも指摘
しておく。メッセージの品質を更に高めるために、更に
別の項目１２を備えることも同様に可能である。質問文
と感嘆文との間にはイントネーションの差があるので、
句読点を考慮にいれなければ、対応するセンテンスのテ
キスト再生は同一であるものの、図２に示すデータベー
ス１１には別の項目１２としてコラムを備え、そこには
それぞれのセグメント１０または検索基準が質問文また
は感嘆文のいずれから派生されたのかを記入することが
できる。これは例えば、それぞれのセグメント１０が質
問を提示しているオリジナル・センテンスから派生した
場合には“０”が割当てられ、セグメント１０が主題と
して感嘆文を有するオリジナル・センテンスから取り出
された場合には“１”が入力されるようにして編成する
ことができる。質問文および感嘆文の項目に加えて、
（詳細には説明しない）別の実施例では、図２に示した
データベース１１の項目１２として、イントネーション
の差異をもたらすのに適している更に別の句読点を記録
することができる。

【００３２】全てのオリジナル・センテンスが上記の方
法で区分化され、その結果生じたセグメント１０の解析
がなされてしまうと、その結果として、図１に示された
４つのオリジナル・センテンス用の図２に示したデータ
ベース１１が生ずる。このデータベース１１から、異な
るデータ記録が検索基準を用いてアルファベットの上か
ら順に分類されることが明白である。

【００３３】図１に示されたリストに提示されたオリジ
ナル・センテンス“１００メートル先で左に曲がりま
す”の再構成を、データベース１１からのデータ記録を
利用して以下に説明する。

【００３４】この目的のため、再生することを意図した
センテンス全体“１００メートル先で左に曲がります”
は、対応するセグメント１０の検索基準が提示されるフ
ォーマットに変換される。図示した実施例の場合のよう
に、検索基準はオーディオファイルのテキスト再生に対
等し、再生されるべきセンテンスも、それが既にこのフ
ォーマットになっていない限り、前記フォーマットに変
換される。次に、再生することを意図した対応してフォ
ーマット化されたセンテンス“１００メートル先で左に
曲がります”と完全に一致する単数または複数の検索基
準がデータベース１１内に存在するか否かのテストが行
われる。図２に示されたデータベースに基づいて、これ
は否であるので、再生することを意図したセンテンス
（１００メートル先で左に曲がります）の検索ストリン
グは最後の語“曲がります”の分が短縮され、この部分
的なセンテンス“１００メートル先で左に”がデータベ
ース１１にこの形式で検索基準として現れるか否かが吟
味される。この比較結果もデータベース１１の内容によ
り否であることが判明することになるので、再生するこ
とを意図したセンテンスを１語だけ縮小することが繰り
返される。次に、このように縮小されたセンテンス“１
００メートル先で”の部分が検索基準としてデータベー
ス１１のデータ記録に出現するか否かの別のテストが行
われる。データベース１１の内容により、これは指標３
から６が付されたデータ記録では肯定できる。その結
果、見出された指標３から６が中間記憶される。

【００３５】前のステップで除去されたセンテンスの一
部は次に元の順序“左に曲がります”に再び結合され、
このセンテンス成分についてデータベース１１の検索基
準と少なくとも１つの対応関係があるか否かの吟味がな
される。この比較で指標９と１０を有するデータ記録
が、検索基準が部分センテンス“左に曲がります”と完
全に一致するデータ記録であるものと認識される。これ
らの指標９および１０も中間記憶される。これによっ
て、検索ストリングをデータベース１１内の検索基準に
よって完全に再生できるので、検索タスクは終了する。

【００３６】次に、各々のケースで見出された指標か
ら、いずれの場合も再生されるべきセンテンスが生み出
される組合わせが形成される。これは図３に、より詳細
に示されている。この例では再生されるべきセンテンス
は指標９と１０、および指標３から６までの双方から形
成されるので、一連番号１から８までを付した図３の組
合わせだけが適切である。図３のその他の組合わせはこ
の実施例では重要ではない。

【００３７】図３ではコラム“テキスト”の内容は説明
目的だけのためであり、組合わせとともにファイルされ
るものではないことを念のために指摘しておく。

【００３８】検索タスクが終了すると、長さおよび位置
データ、およびデータベース１１内の対応する項目１２
を判定する際に決定的であった、慣習上再生されるべき
センテンスの遷移値上のデータが、指標が適切な組合わ
せにあるセンテンス部分について長さおよび位置デー
タ、並びにそれぞれの遷移値が中間記憶されることによ
って決定される。この種類の中間記憶は、再生されるべ
きセンテンス“１００メートル先で左に曲がります”に
ついて図４に示されており、ここでＷの記号は、これが
再生されるべきセンテンス内のセグメントの位置と遷移
値とに関わるものであり、データベース１１に記憶され
た値に関わるものではないことを示している。長さデー
タについては、再生されるべきセンテンス、またはその
一部が図２に基づく検索基準と完全に対応するものと判
明した場合は、図２に基づくデータベース１１の対応す
るデータ記録内の長さデータが再生されるべきセンテン
スの一部の長さ値と一致するという環境にある故に、指
標３から６、または９および１０を有するデータ記録に
入力された値に戻ることができる。

【００３９】図３の一連番号１から８に基づく組合わせ
が一旦形成された後は、これらの組合わせの各々につい
て、それぞれの組合わせに含まれるデータベース１１内
のセグメント１０または検索基準について項目１２を利
用して評価測定値Ｂが算定されることによって、組合わ
せの評価がなされる。評価測定値Ｂの計算は下記の公式
に基づいて行われる。

【００４０】

【数５】但し、Ｗ_nはｎ番目のパラメータの関数相関の重み係数
であり、ｆ_n,iはｎ番目の項目の関数相関であり、ｎは
組合わせに含まれるセグメントに割当てられたデータ記
録の個々の項目に付された一連の指標であり、ｉは組合
わせに含まれるデータ記録、またはセグメントの全ての
指標に付された別の一連の指標である。

【００４１】したがって関数相関ｆ_n,i（ｎ）は公式に
記録された全ての項目ｎについて計算されることは明白
である。公式に組込まれた異なる関数相関に重み付けす
るために、幾つかの関数相関、または全ての関数相関に
さえも重み係数Ｗ_nを付与することができる。

【００４２】例えば、セグメント１０の長さ情報Ｌにつ
いて、関数相関ｆ_Li（Ｌ）は数値１がそれぞれのデータ
記録ｉ内の項目（長さ）に対応する長さＬの値で除算さ
れることによって形成され、いずれの場合も、−ここで
想定されているように−長さの重み係数Ｗ_nが１に等し
い限りは、その指標が組合わせに含まれている全てのデ
ータ記録について１未満である値が得られる。より長い
セグメント１０は公式の条件に応じてより小さい値ｆ_Li
（Ｌ）を生ずることは明白である。セグメントがより長
いことで既存のセンテンス・メロディをより活用できる
ので、好適にはこれらのより小さい値を目指すべきであ
る。

【００４３】位置情報Ｐのための関数相関ｆ_Pi（Ｐ）を
生成するために、これは例えば次のようにして、すなわ
ち、重み係数Ｗ_Pが１である場合には、図４の中間記憶
された位置の値Ｐ_Wが、位置の値が一致する場合はゼロ
の値が割当てられ（Ｐ_W＝Ｐ_Aである場合はｆ_Pi（Ｐ）＝
０）、また一致しない場合は例えば１の値が出力される
（Ｐ_W≠Ｐ_Aである場合はｆ_Pi（Ｐ）＝１）ように、デー
タベース内の対応するデータ記録の位置の値Ｐ_Aと関連
付けられるようにして構成することができる。重み係数
ＷＰを介して１以外の値を設定することができる。

【００４４】遷移値のための関数相関（ｆ
_U,i(Ｕ_front)、（ｆ_U,i(Ｕ_rear）も前項と同様にして、
図４の中間記憶された遷移値Ｕ_front,W、Ｕ_rear,Wが、
一致する場合はゼロが割当てられ、一致しない場合はゼ
ロ以上の値が割当てられるように、データベースからの
対応するデータ記録の遷移値Ｕ_front,D、Ｕ_rear,Dと関
連付けられるようにして形成することができる。この場
合も、対応する重み係数Ｗ_Ｕを使用することができる。
その他の係数と等しい遷移値Ｕの重み付けを生成するた
めに、前方および後方遷移値のための関数相関は有利に
はいずれの場合も０．５である重み係数Ｕが付与され
る。このように記載している実施例の場合、下記の公式
となる。

【００４５】

【数６】

【００４６】図５には上記の公式を用いて見出された８
つの組合わせの各々についての評価測定値Ｂの計算をよ
り詳細に示した表が図示されている。この表ではコラム
の見出しは次のような意味である。一連番号図３に記載の組合わせの一連番号に対応す
る。組合わせ図３に記載の組合わせに対応する。長さ図２に記載の検索基準の長さＬに対応す
る。結果Ｉ関数相関ｆ_Li（Ｌ）＝ｌ／長さに対応す
る。位置Ｗ再生されるべき、また図４に示されている
センテンスのために中間記憶された位置の値Ｐに対応す
る。位置Ａ図２に記載のデータベース１１のデータ記
録に関連する位置の項目Ｐに対応する。結果II 位置Ｗと位置Ａの間の関数相関ｆ_Pi（Ｐ）
の結果を示す。前方Ｗ再生されるべきセンテンス用に中間記憶さ
れている、図４に示されている前方遷移値に対応する。前方Ａ図２に示されているデータベース１１のデ
ータ記録に関連する前方遷移値に対応する。ＷＵ（前方）前方遷移値用の重み係数Ｗ_Ｕを示す。結果III 重み係数ＷＵを考慮にいれた前方Ｗと前方
Ａの間の関数相関ｆ_U,i（Ｕ_front）の結果を示す。後方Ｗ再生されるべきセンテンス用に中間記憶さ
れている、図４に示されている後方遷移値に対応する。後方Ａ図２に示されているデータベース１１のデ
ータ記録に関連する後方遷移値に対応する。ＷＵ（後方）後方遷移値用の重み係数Ｗ_Ｕを示す。結果IV 重み係数Ｗ_Uを考慮にいれた後方Ｗと後方
Ａの間の関数相関ｆ_U,i（Ｕ_rear）の結果を示す。合計結果ＩからIVの加算値である。Ｂ一連番号ごとの合計の加算値である。

【００４７】図５に記載の表から、各々の一連番号ごと
に、０．８と４．８の間にあるＢの値が現れることが明
白である。加えて、図５に記載の表から、ダブルＢの値
も存在することが分かる。好適には前記の公式に基づい
た評価の後に図３に記載の組合わせが全ての組合わせの
最小のＢの値を有しているオーディオファイルだけが音
声による再生用のデータベース１１のデータ記録から組
合わされるべきであるので、図５に記載の表に基づき出
現する全てのＢの値が０．８以上であるということは重
要ではない。しかし、これらの組合わせ中、Ｂの値は約
０．８であり、したがって最小のＢの値を表しているの
で、前記の重要ではないことが図５に記載の一連番号１
と５の組合わせにも該当するものではない。加えて、
（図２に記載の）一連番号１と５に基づく組合わせを形
成するために使用されるデータ記録３と５は等しい。し
かし、図２に記載のデータベースはそれが最終的に完成
する前に最適化されるので、この種類の状況が実際に発
生することはまずあり得ない。このような最適化は、デ
ータベースがコンパイルされた後、個々のセグメントの
データ記録が比較されて、全ての項目で、言い換える
と、前述の実施例の場合は、同じ検索基準、長さデー
タ、位置データ、および遷移値を有している項目と一致
するデータ記録が存在するか否かを確認することによっ
て実行される。このことが確認された場合は、重複した
データ記録は削除される。したがって、重複したデータ
記録はその評価に関して同一であるので、関連する品質
ロスはない。

【００４８】この最適化ステップが実行された後、指標
３と５を有するデータ記録は重複しているものとして特
徴付けられ、その他の慣行に従って最小の指標番号を有
するデータ記録だけがデータベースに残される。図４の
指標５を有するデータ記録を削除した結果、一連番号５
と６を有する組合わせがそれ以上出現することはない。
その結果、一連番号５と６も図５に示した表から消滅
し、したがって、これらの組合せについてＢの値は計算
されず、組合わせ３／９（一連番号１）が最小のＢの値
を有する組合せとして確定される。

【００４９】しかし、最適化ステップの後、また組合わ
せの評価がなされた後で、等しいＢの値が計算された場
合でも、規定によって例えばこのような場合に最初に見
出された組合せだけが用いられることが指定されている
ことで、問題の発生は防止される。

【００５０】評価がなされた後で、どの組合せが最小の
Ｂの値を有しているかが確認されると、対応するオーデ
ィオファイルが構成され、含まれている指標を利用して
出力される。前述の実施例で組合せ３／９が最小のＢの
値を有する組合せであることが明らかになると、対応す
るオーディオファイル（ファイル３およびファイル９）
が組合わされ、出力される。

【００５１】オーディオファイルは必ずしも図２に記載
のデータベース１１内に記憶される必要はないことを念
のために指摘しておく。別のサイトで充填されたオーデ
ィオファイルへの対応する参照基準がデータベース１１
に存在すればそれで充分である。

【００５２】次に別の種類の検索を以下に説明する。

【００５３】この例の開始点も再生されるセンテンス
“１００メートル先で左に曲がります”である。このセ
ンテンスがテキスト・ストリングとして受信されると、
先ずこのセンテンスの少なくとも始まりが図２に記載の
表内の検索基準と一致するか否かのテストが行われる。
このテストで、図２に記載の表は終端から、すなわち最
後の項目から始まる。この場合は、これは指標１０を付
したデータ記録となろう。このテスト中、指標６を有す
る項目“１００メートル先で”が見出される。見出され
た項目“１００メートル先で”は再生されるセンテンス
を完全にはカバーできないので、見出されたばかりのデ
ータ記録の検索基準によってカバーされない部分は除去
される。加えて、指標６を付したデータ記録が中間記憶
される。

【００５４】次に、再生されるセンテンスの除去された
部分“左に曲がります”が図２の表に記載の検索基準に
存在するか否かのテストが行われる。この検索でも図２
に記載の表が下から上へと検索される。この検索で−自
明であるように−指標１０を有する項目“左に曲がりま
す”が即座に見出される。次に、見出されたばかりの指
標１０を付したデータ記録が複写され、指標６を付した
データ記録と共に中間記憶される。前述したように、見
出されたセンテンスの部分が次に検索ストリングから除
去され、妥当である場合は、検索が再開される。しか
し、この辞典では除去された部分にはもはや内容がない
ので、このことは指標６および１０を付した検索基準の
組合わせは、再生されるべきセンテンスを完全に備えた
組合せであることを意味している。

【００５５】このような状況が生ずると、再生されるセ
ンテンスの部分“左に曲がります”の検索が継続され、
これは図２に記載の表の終端で開始されるのではなく、
最後の対応関係（この場合は指標１０を付したデータ記
録）が見出されたポイントの後で開始される。その結
果、指標９を付した項目が見出される。指標９を付した
データ記録が見出された後、この場合も指標６を付した
〔データ記録〕が複写され、可能な中間的な方法とし
て、見出された指標９を付したデータ記録と共に中間記
憶される。次に、見出された部分“左に曲がります”が
検索ストリングから除去され、残りの部分の検索が開始
される。“左に曲がります”の部分が除去されると、検
索ストリングはもはや内容を有していないので、再生さ
れるべきセンテンスを完全にカバーする組合わせとして
指標の組合わせ６、９が記入される。

【００５６】このように完全にカバーされる結果、再生
されるセンテンス“左に曲がります”の部分の検索が継
続され、この場合も図２に記載の表の終端から開始され
るのではなく、最後の項目（この場合は指標９を付した
データ記録）が見出されたポイントの後から開始され
る。その結果、検索中に常に探しているのはそれぞれの
検索ストリングの始端が検索基準に含まれているか否か
であるので、指標８を付した項目“左に”が見出され
る。

【００５７】次に指標６と指標８を付したデータ記録が
可能な部分的な解決方法として中間記憶される。

【００５８】引き続いて、見出された部分“左に”の除
去と、検索ストリング内の鋸さている部分“曲がりま
す”の更なる検索が再び行われる。この検索の結果、次
に指標２を付した項目が見出される。次に、部分的な解
決方法として最前のステップで中間記憶された組合わせ
６、８が再び複写され、更なる部分的な解決方法として
指標２を付したデータ記録と共に、中間記憶される。検
索ストリングが再び空であるので、指標６、８、２を付
したデータ記録が再生されるべきセンテンスを完全に再
生する組合わせとして記憶される。次に、先行のステッ
プに戻り、検索ストリング“曲がります”に対応するか
否かの検索が継続され、この場合も項目の検索は最前の
対応関係（この場合は指標２を付したデータ記録）が見
出された箇所で開始される。ここで指標１を付したデー
タ記録が見出され、その結果、指標６、８、１を付した
データ記録の組合わせが再生されるべきセンテンスを完
全に再生する組合わせとして記憶される。

【００５９】次に、探索ストリング“左に曲がります”
の対応関係の検索が継続され、この場合も項目の検索は
最前の対応関係（この場合は指標８を付したデータ記
録）が見出された箇所で開始される。その結果、以下の
指標の組合せ６／７／２および６／７／１を見出す際に
記載される基本原理が対応して適用される。

【００６０】組合せ６／７／１が見出された後、検索ス
トリング“１００メートル先で左に曲がります”での検
索が継続され、この検索は最前に見出された指標６の後
から開始される。前述の基本原理に基づいて再生される
センテンスの全体が解析された後、一連番号１から２８
を付して図３に示した全ての組合せが見出される。その
結果、明白であるように、図５に記載した表が対応して
拡張される。

【００６１】必要な検索と計算ステップを制限するため
に、有利には前述の基本原理に基づいて再生を完全に解
析すべき場合に、Ｂの値が例えば所定値、例えば０．９
未満か、これに等しいものと判定された場合は、この解
析は中断される。それによって、再生の品質がロスされ
ることはないが、それはそれぞれの検索ストリングの対
応関係の検索中に、長い検索基準はデータベース１１内
で常に最初に見出されるからである。

【００６２】更に、特定の予め決定できる組合わせの
数、例えば１０の組合せが見出された場合は、組合せの
検索が中断されるようにできる。この措置によって、必
要なメモリの容量と、必要なコンピュータの電力を節減
できることは明白である。このような組合せの制限は、
検索が前述の方法に基づいて実行される場合に特に有利
である。その理由は、この検索方法では、より長いセグ
メントが常に最初に見出されるからである。より長いセ
グメントのこのような発見によって、最良の組合せが通
常は最初の組合せで認識され、ひいては品質の損失は生
じないことが保証される。

【図面の簡単な説明】

【図１】４つのオリジナル・センテンスのリストであ
る。

【図２】１０のデータ記録を有するデータベースを示し
た表である。

【図３】再生されるべきセンテンスを完全に再生するセ
グメントからなる組合せを有する表である。

【図４】区分化された再生されるべきセンテンスのため
のデータ記録を示した表である。

【図５】全体的な評価を示した表である。

【符号の説明】

１０…セグメント１１…データベース１２…パラメータＬ…長さＵ…遷移値Ｂ…評価測定値Ｕ_front…前方遷移値Ｕ_rear…後方遷移値

───────────────────────────────────────────────────── フロントページの続き (72)発明者シモナグロスエスドイツ連邦共和国，デー−44789 ボシュム，オスカル−ホフマン−シュトラーセ 72 (72)発明者アミールイマンドイツ連邦共和国，デー−44801 ボシュム，セムペルシュトラーセ 113 (72)発明者ボルフガンクテイメルドイツ連邦共和国，デー−44879 ボシュム，アムホーベーゲ 10

Claims

【特許請求の範囲】

【請求項１】出力されることが意図されたメッセージ
がオーディオファイルとして記憶され、記憶されたオー
ディオファイルから検索基準を利用して選択されたセグ
メント（１０）から構成される、オーディオファイルと
して記憶された少なくとも１つのオリジナル・センテン
スのセグメント（１０）からなる音声出力用のメッセー
ジを構成する方法であって、前記各セグメント（１０）
にはオリジナル・センテンス内の音標プロパティを特徴
付ける少なくとも１つのパラメータ（１２）が割当てら
れると共に、前記オリジナル・センテンス内の前記音標
プロバティを特徴付ける個々のセグメント（１０）の前
記パラメータ（１２）を利用して、メッセージとして出
力される予定の再生センテンスを形成する前記セグメン
ト（１０）が音声の自然の流れに基づいて構成されてる
か否かのチェックが行われることを特徴とする方法。
【請求項２】前記各セグメント（１０）には前記オリ
ジナル・センテンス内の音標プロパティを特徴付ける幾
つかのパラメータ（１２）が割当てられることを特徴と
する請求項１に記載の方法。
【請求項３】前記それぞれのオリジナル・センテンス
内の前記セグメント（１０）の音標プロパティを特徴付
ける前記パラメータ（１２）として、以下のパラメータ
の少なくとも１つ、すなわち、前記それぞれのセグメント（１０）の長さ（Ｌ）、前記オリジナル・センテンス内の前記それぞれのセグメ
ント（１０）の位置（Ｐ）、前記それぞれのセグメント（１０）の、前記オリジナル
・センテンス内の先行の、または後続のセグメント（１
０）への前方および／または後方遷移値（Ｕ）、が用いられることを特徴とする請求項１または２に記載
の方法。
【請求項４】各ケースで割当てられる検索基準の前記
長さが前記それぞれのセグメントの前記長さ（Ｌ）とし
て用いられることを特徴とする請求項３に記載の方法。
【請求項５】前記オリジナル・センテンス内の前記先
行の、または後続のセグメント（１０）の最後の、また
は最初の文字、音節、または音標が前記遷移値（Ｕ）と
して用いられることを特徴とする請求項３または４に記
載の方法。
【請求項６】更に別のパラメータ（１２）として、前
記オリジナル・センテンス内の前記それぞれのセグメン
ト（１０）が質問文または感嘆文から派生されたものか
否かについてのデータが備えられることを特徴とする前
記請求項の一つに記載の方法。
【請求項７】メッセージとして出力される予定の前記
再生センテンスを形成する前記セグメント（１０）の見
出された組合わせごとに、下記の公式【数１】に基づいて前記オリジナル・センテンス内の前記音標プ
ロパティを特徴付ける前記個々のセグメント（１０）の
前記パラメータ（１２）から評価測定値（Ｂ）が計算さ
れることを特徴とし、但し、ｆ_n,i（n)はn 番目のパラ
メータの関数相関であり、ｉはセグメント（１０）を示
す指標であり、Ｗ_nはｎ番目のパラメータの関数相関の
重み係数である前記請求項の一つに記載の方法。
【請求項８】メッセージとして出力される予定の前記
再生センテンスを形成する前記セグメント（１０）の各
々の見出された組合わせごとに、前記評価測定値（Ｂ）
が計算され、その評価測定値（Ｂ）が、前記組合わせの
前記セグメント（１０）が音声の自然の流れに従って構
成されていることを示している組合わせが、再生される
べきメッセージとして前記セグメント（１０）の前記見
出された組合わせから選択されることを特徴とする請求
項７に記載の方法。
【請求項９】前記評価測定値（Ｂ）が少なくとも下記
のパラメータ、すなわち前記セグメント（１０）の長さ
（Ｌ）および位置（Ｐ）、並びに以下の公式、すなわち【数２】に基づく前方および後方遷移値(Ｕ_front, Ｕ_rear）の関
数相関ｆ_n(n) から計算されることを特徴とする請求項
７または８に記載の方法。
【請求項１０】前記再生センテンスは検索基準に対応
するフォーマットのセンテンスであり、探索基準および
伝送される再生センテンス用には好適には英数字ストリ
ングが用いられることを特徴とする前記請求項の一つに
記載の方法。
【請求項１１】前記探索基準はデケータベース（１
１）内に階層的に配列されていることを特徴とする前記
請求項の一つに記載の方法。
【請求項１２】オーディオファイルとして記憶されて
いるメッセージ用の前記セグメント（１０）の選択のた
めに、メッセージとして望まれる前記再生センテンスの
全体が、割当られたオーディオファイルと共にデータベ
ース（１１）内にファイルされた検索基準と一致するか
否かのテストが行われ、一致しない場合は、前記それぞ
れの再生センテンスの端部が縮小され、その後、前記再
生センテンスの残りの部分について単数または複数の一
致が発見されるまで、前記データベース（１１）内にフ
ァイルされている検索基準との一致がチェックされ、前記のチェックが先行ステップで除去された前記再生セ
ンテンスの部分に関して継続され、検索基準が前記再生センテンスと完全に一致している前
記セグメント（１０）の各組合わせについて、メッセー
ジとして出力される予定の前記再生センテンスを形成す
る前記セグメント（１０）が会話の自然な流れに従って
構成されているか否かのチェックが行われると共に、望ましいメッセージの再生のために、その組合わせが音
声の自然な流れに最も近い前記セグメント（１０）のオ
ーディオファイルが使用されることを特徴とする前記請
求項の一つに記載の方法。