JP3706495B2 - Speech synthesizer - Google Patents

Speech synthesizer Download PDF

Info

Publication number
JP3706495B2
JP3706495B2 JP03490699A JP3490699A JP3706495B2 JP 3706495 B2 JP3706495 B2 JP 3706495B2 JP 03490699 A JP03490699 A JP 03490699A JP 3490699 A JP3490699 A JP 3490699A JP 3706495 B2 JP3706495 B2 JP 3706495B2
Authority
JP
Japan
Prior art keywords
data
speech
sentence
address
start address
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP03490699A
Other languages
Japanese (ja)
Other versions
JP2000235697A (en
Inventor
秀治 西田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sanyo Electric Co Ltd
Original Assignee
Sanyo Electric Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sanyo Electric Co Ltd filed Critical Sanyo Electric Co Ltd
Priority to JP03490699A priority Critical patent/JP3706495B2/en
Publication of JP2000235697A publication Critical patent/JP2000235697A/en
Application granted granted Critical
Publication of JP3706495B2 publication Critical patent/JP3706495B2/en
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Landscapes

  • Traffic Control Systems (AREA)
  • Position Fixing By Use Of Radio Waves (AREA)
  • Navigation (AREA)

Description

【0001】
【発明の属する技術分野】
本発明は音声合成装置に関し、特にカーナビゲーションシステムのような車載タイプの音声案内装置に有効な音声合成装置に関する。
【0002】
【従来の技術】
車輌、特に自動車の現在位置を検出してその付近の交通情報等を外部から受信して報知するVICS(Vehicle Information Communication System:道路交通情報通信システム)が実用化されている。また既に、地図データベースと現在位置と目的地とを照合して経路案内を行なうナビゲーションシステムは広く普及している。
【0003】
更に、近年では安全性の見地から、上述のようなシステムにおいては種々の案内を音声で報知する構成が一般的になっている。
【0004】
【発明が解決しようとする課題】
ところで、上述のような従来の音声案内を行なうカーナビゲーションシステムは、システム内で交通情報が生成される都度、リアルタイムに音声で報知されるため、ドライバがそれに気付いた時点では案内の最初の部分を聞き逃すことが多い。たとえば、「国道1号線、守口方面は、大日交差点から2kmの渋滞です。しばらく道なりに進むルートです。」という二つの案内文が音声で報知された場合、第2の案内文である「しばらく道なりに進むルートです。」を聞き取ることが出来ても第1の案内文を聞き逃す場合がはあり、また第1の案内文の内の後半の「大日交差点から2kmの渋滞です。」という部分を聞き取ることが出来ても前半の「国道1号線、守口方面は」の部分を聞き逃した場合には、自分の進行方向前方で渋滞が発生しているのか、または逆方向で渋滞が発生しているのかが判明しない。
【0005】
このため、音声案内のデータをバッファメモリに一時記憶しておき、プッシュスイッチ等の簡便で安全な手段の操作により再度発生させることを可能にすることが考えられるが、その場合にはバッファメモリに蓄積されているデータの全てが再度発生されることになる。バッファメモリは通常はFIFO(First In First Out:先入れ先き出し)方式であるため、バッファメモリの容量が大きい場合には目的とする案内文が再度発生されるまでにそれ以前に行なわれた案内が発生されることになる。また、バッファメモリの容量が小さい場合には目的とする案内の全てがバッファリングされない可能性が生じる。
【0006】
ところで、音声案内の内でも利用者が本当に望んでいる情報は限られている。たとえばカーナビゲーションシステムの渋滞情報の場合には、渋滞が発生している場所、方向及び距離である。従って、音声案内を再度発生させる場合には必ずしも案内文の先頭から再度発生させる必要は無く、利用者が望んでいる部分から発生させることが出来ればよいことになる。
【0007】
本発明はこのような事情に鑑みてなされたものであり、音声合成により発生される合成音声の内の特定の種類の属性の単語に溯って再度合成音声を発生させることを可能にした音声合成装置の提供を目的とする。
【0008】
また本発明は、合成音声により報知される文章の内の利用者にとって必要な部分、たとえば地名、距離等から再度発生させることを可能として、カーナビゲーションシステムに好適な音声合成装置の提供を目的とする。
【0009】
【課題を解決するための手段】
本発明に係る音声合成装置は、合成音声として発生すべき文章のデータを記憶する文章データ記憶手段と、該文章データ記憶手段が記憶しているデータを言語解析することにより合成音声として発生する音声合成手段とを備えた音声合成装置であって、前記音声合成手段は、前記文章データ記憶手段が記憶している文章のデータを言語解析することにより所定の種類の属性の単語の開始アドレスを検出する解析手段と、前記文章データ記憶手段に記憶されている文章のデータを音声合成開始アドレスとして指示されたアドレスから合成音声として発声する合成音声発声手段とを有し、前記文章データ記憶手段が記憶しているデータ中の前記解析手段が検出した単語の開始アドレスを記憶すると共に、最後に記憶された文章のデータの先頭のアドレスを音声合成開始アドレスとして記憶するアドレス記憶手段と、適宜の操作が行なわれた場合に、前記アドレス記憶手段が記憶している音声合成開始アドレスをそれ以前に記憶された文章のデータ中の単語の開始アドレスに変更させる音声合成開始アドレス変更手段とを備え、前記合成音声発生手段は、音声合成開始アドレスが前記音声合成開始アドレス変更手段の操作により変更された場合に、前記文章データ記憶手段に記憶されている文章のデータを変更後のアドレスから合成音声により発生すべくなしてあることを特徴とする。
【0010】
このような本発明に係る音声合成装置では、文章データ記憶手段に記憶されている文章のデータが解析手段により言語解析されて所定の属性の単語の開始アドレスが検出され、アドレス記憶手段により文章データ記憶手段が記憶しているデータ中の解析手段が検出した所定の属性の単語のアドレスが記憶されると共に、最後に記憶された文章のデータの先頭のアドレスが音声合成開始アドレスとして記憶されている。そして、たとえばプッシュスイッチのようなアドレス変更手段が操作されることにより、アドレス記憶手段が記憶している音声合成開始アドレスがそれ以前に記憶された文章のデータ中の単語の開始アドレスに変更され、文章データ記憶手段に記憶されている文章のデータが変更後のアドレスから合成音声により発生される。
【0011】
また本発明に係る音声合成装置は上述の構成において更に、地図データを記憶した地図データ記憶手段と、道路交通情報に関する定型案内文章のデータを記憶した定型案内文章データ記憶手段と、位置検出手段と、前記地図データ記憶手段が記憶している地図データ中の前記位置検出手段が検出している位置に応じて前記定型案内文章データ記憶手段から定型案内文章のデータを読み出して合成音声として発生すべき文章を作成する案内文章作成手段とを備えたことを特徴とする。
【0012】
このような本発明に係る音声合成装置では、地図データ記憶手段が記憶している地図データ中の位置検出手段が検出している位置に応じて定型案内文章データ記憶手段から定型案内文章のデータが読み出されて合成音声で発生されるべき文章が作成されるため、カーナビゲーションシステムにおいて利用者が音声案内を聞き逃した場合に再度発生させることが容易に可能になる。
【0013】
更に本発明に係る音声合成装置は上述の構成において、前記所定の属性の単語は、地名及び/又は数字であることを特徴とする。
【0014】
このような本発明に係る音声合成装置では、カーナビゲーションシステムにおいて利用者が音声案内を聞き逃した場合に、地名または渋滞距離、交差点までの距離等の部分から再度発生させることが容易に可能になる。
【0015】
【発明の実施の形態】
以下、本発明をその実施の形態を示す図面に基づいて詳述する。図1は本発明に係る音声合成装置をカーナビゲーションシステムに適用した場合の構成例を示すブロック図である。
【0016】
図1において、参照符号9は本発明に係る音声合成装置の制御部を示しており、その外部にはVICS用のチューナ11を介してアンテナ10と、 GPS受信機12と、CD-ROMドライブ13と、プッシュスイッチ14と、スピーカ15とが接続されている。
【0017】
VICS用のチューナ11は制御部9内のVICSデータ用のバッファメモリ2に、 GPS受信機12は車輌位置検出部4に、CD-ROMドライブ13は地図データ用のバッファメモリ7に、プッシュスイッチ14は制御部9に、スピーカ15は音声合成部8にそれぞれ接続されている。
【0018】
制御部9内には上述した各構成要素の他に、定型案内文章データが予め格納されているメモリ1と、アドレス移動幅算定部3と、案内文章作成部5とが備えられている。
【0019】
メモリ1には定型案内文章データが予め格納されている。この定型案内文章データは、具体的にはたとえば「方面は、から、2、kmの、渋滞です、しばらく道なりに進むルートです。」等のデータであり、このような定型案内文章データが案内文章作成部5に与えられると、「方面」、「から」の前に地名データが挿入される。
【0020】
VICSデータ用のバッファメモリ2はチューナ11が受信したVICSデータをバッファリングし、案内文章作成部5に与える。
【0021】
車輌位置検出部4は GPS受信機12が受信したGPS(Groval Positioning System)信号から車輌位置(現在位置)を検出し、案内文章作成部5及び地図データ用のバッファメモリ7に与える。
【0022】
バッファメモリ7は車輌位置検出部4が検出している車輌位置を中心とする所定範囲の領域に対応する地図データをCD-ROMドライブ13から読み出してバッファリングする。このバッファメモリ7にバッファリングされている地図データは案内文章作成部5に与えられる。
【0023】
案内文章作成部5は、上述のように、VICSデータ用のバッファメモリ2と定型案内文章データ用のメモリ1と車輌位置検出部4と地図データ用のバッファメモリ7とからデータを入力し、後述するように案内文章を作成する。作成された案内文章は音声合成部8へ出力されてスピーカ15から合成音声として発生されると共にFIFOメモリ6にも送られてバッファリングされる。
【0024】
音声合成部8は、上述の案内文章作成部5から与えられる案内文章のデータを言語解析する解析部81と、FIFOメモリ6にバッファリングされているデータをアドレス移動幅算定部3から与えられる音声合成開始アドレスから合成音声としてスピーカ15から発生させる合成音声発生部82との二つの機能を含む。
【0025】
音声合成部8の解析部81は、案内文章作成部5から与えられる案内文章のデータを言語解析することにより、音声合成を行なうために必要な種々の情報を検出し、その結果の解析データをFIFOメモリ6に格納する。具体的には、解析部81は文章を構成する各単語の品詞情報、係り受け状態を分析し、読み、アクセント、ポーズ長を決定し、たとえば図2(a) 及び図2(b) の模式図に示されているような解析結果をFIFOメモリ6に格納する。図中、「S3」はポーズ記号であり本実施の形態では100msec に設定されている。「↑」及び「↓」はアクセントの上げ下げを指定するアクセント記号を示している。「\plc\ 」は地名データの先頭開始ラベルを、「\num\ 」は数詞データの先頭開始ラベルをそれぞれ示している。
【0026】
アドレス移動幅算定部3はFIFOメモリ6にバッファリングされている各1単位の案内文章(「。」で区切られた範囲)中の上述のような地名データの先頭開始アドレスと、数詞データの先頭開始アドレスとを検出し、記憶する。また、最後にFIFOメモリ6に格納された案内文章のデータの先頭のアドレスを音声合成開始アドレスPとして記憶する。
【0027】
音声合成部8の合成音声発生部82は、アドレス移動幅算定部3が記憶している音声合成開始アドレスPが与えられた場合に、FIFOメモリ6に格納されている案内文章のデータを対応するアドレスから音声合成してスピーカ15へ出力することにより、合成音声として発生させる。
【0028】
プッシュスイッチ14は、これがn回操作された場合にアドレス移動幅算定部3が記憶している音声合成開始アドレスPをそれ以前にFIFOメモリ6に格納された案内文章のデータのn個前の地名データまたは数詞データの先頭開始アドレスに変更する。これにより、音声合成部8はFIFOメモリ6にバッファリングされているデータをアドレス移動幅算定部3から与えられた音声合成開始アドレスPから読み出してスピーカ15へ出力する。
【0029】
以上のような構成の本発明の音声合成装置の動作について、案内文章作成部5により二つの案内文章「国道1号線、守口方面は、大日交差点から2kmの渋滞です。」と「しばらく道なりに進むルートです。」という案内文章が連続して作成された場合を例として以下に説明する。
【0030】
アンテナ10により受信されたVICSデータにより本発明の音声合成装置が搭載された自動車の進行方向前方の交差点で2kmの渋滞が発生していることが判明し、更にナビゲーション機能により現在の車輌位置が「国道1号線」の「大日交差点」の手前を「守口」方面へ走向していると判明したとする。
【0031】
この場合、案内文章作成部5はメモリ1に予め格納されている定型案内文章データ「方面は、から、2、kmの、渋滞です、しばらく道なりに進むルートです。」と、CD-ROMドライブ13によりCD-ROMから読み出された地名データ「国道1号線」と「大日交差点」と「守口」とから案内文章「国道1号線、守口方面は、大日交差点から2kmの渋滞です。」を、またナビゲーション機能により案内文章「しばらく道なりに進むルートです。」をそれぞれ作成する。制御部9は車輌位置検出部4により検出されている車輌位置に基づいて上述の案内文章を適宜のタイミングで案内文章作成部5から音声合成部8へ転送させるが、この時点ではスピーカ15による合成音声の発生は行なわれず、解析部81により以下のような言語解析が行なわれる。
【0032】
まず、解析部81は各単語の品詞情報、係り受け状態を分析し、読み、アクセント、ポーズ長を決定し、図2(a) の模式図に示されているような解析結果がFIFOメモリ6に格納する。図2(a) において、「S3」はポーズ記号であり本実施の形態では100msec に設定されている。「↑」及び「↓」はアクセントの上げ下げを指定するアクセント記号を示している。「\plc\ 」は地名データの先頭開始ラベルを、「\num\ 」は数詞データの先頭開始ラベルをそれぞれ示している。
【0033】
このようにして音声合成部8の解析部81により得られた解析結果のデータがFIFOメモリ6に格納されると、アドレス移動幅算定部3が音声合成開始アドレスPと各地名データ及び数詞データの先頭開始アドレスA,B,C,Dを記憶する。但し、第1の案内文ではアドレスAは音声合成開始アドレスPと一致している。アドレス移動幅算定部3では新たに案内文章のデータがFIFOメモリ6に格納される都度、上述同様に、各案内文の音声合成開始アドレスと各地名データ及び数詞データの先頭開始アドレスを更新記憶する。
【0034】
上述のようにして一旦FIFOメモリ6に格納された解析データの音声合成開始アドレスPからFIFOメモリ6の先頭アドレス(最後にFIFOメモリ6に格納された案内文章の解析データの末尾)までのデータが音声合成部8へ転送され、合成音声発生部82によりアクセント記号、ポーズ記号等に従って音声合成され、「国道1号線、守口方面は、大日交差点から2kmの渋滞です。」とスピーカ15から合成音声で発生される。
【0035】
次に、第2の案内文章が案内文章作成部5から音声合成部8へ転送されて解析部81により上述の第1の案内文章と同様にして言語解析されるが、その結果を図2(b) の模式図に示す。
【0036】
この第2の案内文章の解析データが音声合成部8からFIFOメモリ6に転送されて記憶される際には、先にFIFOメモリ6に記憶されている第1の案内文章の解析データの各アドレスは新たに格納された解析データ全体のデータ長に対応するアドレス幅だけ移動することになる。従って、図2(a) に示されている第1の案内文章の解析データの音声合成開始アドレスPと図2(b) に示されている第2の案内文章の解析データの音声合成開始アドレスPとの差のアドレス幅だけ、第1の解析データの各アドレスA,B,C,Dはそれぞれ移動したアドレスA', B', C', D'としてアドレス移動幅算定部3に更新記憶される。
【0037】
そして、第2の解析データが音声合成部8へ転送され、合成音声発生部82により音声合成されて「しばらく道なりに進むルートです。」とスピーカ15から合成音声として発生される。
【0038】
ところで、上述の第2の案内情報がスピーカ15から発生され始めた時点で利用者が第1の案内情報を聞き逃したことに気が付いたとすると、利用者はプッシュスイッチ14を操作する。これにより、制御部9は音声合成部8の合成音声発生部82に対して音声合成を直ちに停止させると共に、アドレス移動幅算定部3に対して音声合成開始アドレスPをその時点の第2の案内文の先頭から直前の地名データまたは数詞データの先頭開始アドレスに移動させる。これにより音声合成開始アドレスPは第1の案内文の地名データまたは数詞データの先頭開始アドレスの内の最後のアドレスへであるD'へ移動すると共に、そのアドレス以降のデータをFIFOメモリ6から音声合成部8へ出力させる。この結果、アドレスD'以降の案内文、即ち「2kmの渋滞です。しばらく道なりに進むルートです。」が合成音声発生部82により合成されてスピーカ15から合成音声で再度発生される。
【0039】
ところで本実施の形態では、プッシュスイッチ14をn回操作した場合にアドレス移動幅算定部3は音声合成開始アドレスPをn個前の地名データまたは数詞データの先頭開始アドレスに移動させるように構成されている。従って、上述同様の第2の案内情報がスピーカ15から発生され始めた時点で利用者がプッシュスイッチ14を2回操作した場合には、音声合成開始アドレスPは第1の案内文のアドレスC'へ移動し、この結果案内文「大日交差点から2kmの渋滞です。しばらく道なりに進むルートです。」とスピーカ15から合成音声で再度発生される。
【0040】
図3は上述のような本発明の音声合成装置をカーナビゲーションシステムに適用した場合の動作手順を示すフローチャートである。
【0041】
プッシュスイッチ14が操作されたか否かがまず調べられ (ステップS11)、”NO" である場合は次に案内文章作成部5で案内文章が作成されたか否かが調べられる (ステップS12)。案内文章が作成されていない場合にはステップS11 へ処理が戻される。
【0042】
案内文章作成部5で案内文章が作成された場合 (ステップS12 で”YES")、その言語解析が音声合成部8の解析部81で行なわれ (ステップS13)、その結果として得られる解析データがFIFOメモリ6に記憶される (ステップS14)。この際、アドレス移動幅算定部3は新たにFIFOメモリ6に記憶された案内文章の解析データの先頭を音声合成開始アドレスPに更新すると共に、それまでにFIFOメモリ6に記憶されていた案内文章データの各アドレスを新たにFIFOメモリ6に記憶された案内文章の解析データのデータ長に従ってそれぞれ変更する (ステップS15)。
【0043】
次に、FIFOメモリ6に記憶されているデータの音声合成開始アドレスPから先頭アドレスまでのデータが音声合成部8へ送られて合成音声発生部82によりスピーカ15から合成音声で発生される (ステップS16)。
【0044】
上述のステップS16 の音声合成開始アドレスPから先頭アドレスまでのデータが音声合成部8へ送られてスピーカ15から合成音声で発生が開始された後に、プッシュスイッチ14が操作されると (ステップS11 で”YES")、その操作回数nだけ音声合成開始アドレスPが前のアドレス(地名データまたは数詞データの先頭開始アドレス)へ戻され (ステップS21)、ステップS16 においてそのアドレスから案内文の合成音声による発生が再開される。
【0045】
なお本実施の形態では、FIFOメモリ6には128kビットのSRAMを使用しており、約8000文字の案内文章をバッファリングすることが可能であり、またアドレス移動幅算定部3に保持されるアドレスは音声合成開始アドレスPの他に5個までとしてあるが、前述の案内文章の例のように一般的な渋滞情報を対象とする場合には十分実用的である。
【0046】
更に本実施の形態では、アドレス移動幅算定部3が保持するアドレス、換言すれば音声合成部8により検出されるアドレスは地名データ及び数詞データの先頭アドレスとしているが、いずれか一方としてもよい。また更に、本実施の形態ではカーナビゲーションシステムに適用するためにアドレス移動幅算定部3が保持するアドレスは地名データ及び数詞データの先頭アドレスとしているが、使用目的に応じて他のデータの先頭アドレスをアドレス移動幅算定部3に保持させるようにしてもよいことは言うまでもない。
【0047】
【発明の効果】
以上に詳述したように本発明に係る音声合成装置によれば、文章データ記憶手段に記憶されている文章のデータが解析手段により言語解析されて所定の属性の単語の開始アドレスが検出され、アドレス記憶手段により文章データ記憶手段が記憶しているデータ中の解析手段が検出した所定の属性の単語のアドレスが記憶されると共に、最後に記憶された文章のデータの先頭のアドレスが音声合成開始アドレスとして記憶されている。そして、たとえばプッシュスイッチのようなアドレス変更手段が操作されることにより、アドレス記憶手段が記憶している音声合成開始アドレスがそれ以前に記憶された文章のデータ中の単語の開始アドレスに変更され、文章データ記憶手段に記憶されている文章のデータが変更後のアドレスから合成音声により発生されるため、音声案内を聞き逃した場合に再度発生する際に、無駄無しに発生することが可能になる。
【0048】
また、本発明に係る音声合成装置によれば、地図データ記憶手段が記憶している地図データ中の位置検出手段が検出している位置に応じて定型案内文章データ記憶手段から定型案内文章のデータが読み出されて案内文章が作成されるため、カーナビゲーションシステムにおいて利用者が音声案内を聞き逃した場合に再度発生させることが容易に可能になる。
【0049】
更に、本発明に係る音声合成装置によれば、カーナビゲーションシステムにおいて利用者が音声案内を聞き逃した場合に、地名または渋滞距離、交差点までの距離等の部分から再度発生させることが容易に可能になる。
【図面の簡単な説明】
【図1】本発明に係る音声合成装置をカーナビゲーションシステムに適用した場合の構成例を示すブロック図である。
【図2】本発明に係る音声合成装置による言語解析の結果を示す模式図である。
【図3】本発明の音声合成装置をカーナビゲーションシステムに適用した場合の動作手順を示すフローチャートである。
【符号の説明】
1 メモリ(定型案内文章データ用)
3 アドレス移動幅算定部
4 車輌位置検出部
5 案内文章作成部
6 FIFOメモリ
7 バッファメモリ(地図データ用)
8 音声合成部
13 CD-ROMドライブ
14 プッシュスイッチ
15 スピーカ
81 解析部
82 合成音声発生部
[0001]
BACKGROUND OF THE INVENTION
The present invention relates to a speech synthesizer, and more particularly to a speech synthesizer effective for an in-vehicle type voice guidance device such as a car navigation system.
[0002]
[Prior art]
VICS (Vehicle Information Communication System) that detects the current position of a vehicle, particularly a vehicle, and receives and informs traffic information in the vicinity of the vehicle from the outside has been put into practical use. In addition, navigation systems that perform route guidance by collating a map database with a current position and a destination are already widely used.
[0003]
Further, in recent years, from the viewpoint of safety, in the above-described system, a configuration in which various guides are notified by voice has become common.
[0004]
[Problems to be solved by the invention]
By the way, since the conventional car navigation system that performs voice guidance as described above is notified by voice in real time every time traffic information is generated in the system, the first part of the guidance is displayed when the driver notices it. I often miss it. For example, if the two guidance sentences “National Route 1 and Moriguchi direction are 2km traffic from Dainichi intersection. Even if you can hear "The route is going along the road for a while", you may miss the first guidance text, and it is 2km from the Dainichi intersection in the latter half of the first guidance text. If you miss the part of "National highway No. 1 towards Moriguchi" in the first half, you may have a traffic jam ahead of your direction of travel, or a traffic jam in the opposite direction I don't know what happens.
[0005]
For this reason, it is conceivable that voice guidance data is temporarily stored in the buffer memory so that it can be generated again by the operation of simple and safe means such as a push switch. All the accumulated data will be generated again. Since the buffer memory is usually a FIFO (First In First Out) method, if the buffer memory capacity is large, it was performed before the target text was generated again Guidance will be generated. Further, when the capacity of the buffer memory is small, there is a possibility that not all of the target guidance is buffered.
[0006]
By the way, the information that the user really wants is limited in the voice guidance. For example, in the case of traffic information of a car navigation system, the location, direction, and distance where traffic occurs. Therefore, when the voice guidance is generated again, it is not always necessary to generate the voice guidance again from the head of the guidance sentence, as long as the voice guidance can be generated from the portion desired by the user.
[0007]
SUMMARY OF THE INVENTION The present invention has been made in view of such circumstances, and speech synthesis that enables synthesized speech to be generated again over words of specific types of attributes in synthesized speech generated by speech synthesis. The purpose is to provide a device.
[0008]
Another object of the present invention is to provide a speech synthesizer suitable for a car navigation system, which can be generated again from a part necessary for a user, for example, a place name, a distance, etc., in a sentence notified by synthesized speech. To do.
[0009]
[Means for Solving the Problems]
The speech synthesizer according to the present invention includes a sentence data storage unit that stores sentence data to be generated as a synthesized speech, and a speech that is generated as a synthesized speech by performing language analysis on the data stored in the sentence data storage unit. A speech synthesizer including a synthesis unit, wherein the speech synthesizer detects a start address of a word having a predetermined type of attribute by performing linguistic analysis on the sentence data stored in the sentence data storage unit. Analyzing means for synthesizing and synthesizing voice uttering means for uttering the sentence data stored in the sentence data storage means as synthesized speech from the address designated as the voice synthesis start address, the sentence data storage means storing The start address of the word detected by the analyzing means in the currently stored data is stored, and the first address of the last stored sentence data is stored. Address storage means for storing the address as a speech synthesis start address, and words in the sentence data previously stored with the speech synthesis start address stored in the address storage means when an appropriate operation is performed Voice synthesis start address changing means for changing the voice synthesis start address to the text data storage means when the voice synthesis start address is changed by an operation of the voice synthesis start address changing means. The stored sentence data is generated by synthesized speech from the changed address.
[0010]
In such a speech synthesizer according to the present invention, sentence data stored in the sentence data storage means is linguistically analyzed by the analysis means to detect a start address of a word having a predetermined attribute, and the sentence storage data is detected by the address storage means. The address of a word having a predetermined attribute detected by the analysis means in the data stored in the storage means is stored, and the head address of the last stored sentence data is stored as a speech synthesis start address. . Then, for example, by operating an address changing unit such as a push switch, the speech synthesis start address stored in the address storage unit is changed to the start address of a word in the sentence data stored before that, Text data stored in the text data storage means is generated by synthesized speech from the changed address.
[0011]
The speech synthesizer according to the present invention further includes a map data storage means storing map data, a fixed guidance text data storage means storing fixed guide text data relating to road traffic information, a position detection means, in the above-described configuration. The standard guidance text data should be read out from the standard guidance text data storage means according to the position detected by the position detection means in the map data stored in the map data storage means and generated as synthesized speech A guide sentence creating means for creating a sentence is provided.
[0012]
In such a speech synthesizer according to the present invention, the data of the standard guidance text is stored from the standard guidance text data storage means according to the position detected by the position detection means in the map data stored in the map data storage means. Since the text to be read and generated by the synthesized voice is created, it can be easily generated again when the user misses the voice guidance in the car navigation system.
[0013]
Furthermore, the speech synthesizer according to the present invention is characterized in that, in the above configuration, the word having the predetermined attribute is a place name and / or a number.
[0014]
In such a speech synthesizer according to the present invention, when a user misses a voice guidance in a car navigation system, it can be easily generated again from a place name, a traffic jam distance, a distance to an intersection, etc. Become.
[0015]
DETAILED DESCRIPTION OF THE INVENTION
Hereinafter, the present invention will be described in detail with reference to the drawings illustrating embodiments thereof. FIG. 1 is a block diagram showing a configuration example when the speech synthesizer according to the present invention is applied to a car navigation system.
[0016]
In FIG. 1, reference numeral 9 indicates a control unit of the speech synthesizer according to the present invention, and outside thereof, via a VICS tuner 11, an antenna 10, a GPS receiver 12, and a CD-ROM drive 13. The push switch 14 and the speaker 15 are connected.
[0017]
The tuner 11 for VICS is in the buffer memory 2 for VICS data in the control unit 9, the GPS receiver 12 is in the vehicle position detection unit 4, the CD-ROM drive 13 is in the buffer memory 7 for map data, and the push switch 14 Are connected to the controller 9 and the speaker 15 is connected to the speech synthesizer 8.
[0018]
In addition to the above-described components, the control unit 9 includes a memory 1 in which standard guidance text data is stored in advance, an address movement width calculation unit 3, and a guidance text creation unit 5.
[0019]
In the memory 1, standard guide sentence data is stored in advance. This standard guidance text data is, for example, data such as “Direction is from 2 to 2 km, traffic jam, route along the road for a while”, and such standard guidance text data provides guidance. When given to the text creation unit 5, place name data is inserted before “to” and “from”.
[0020]
The buffer memory 2 for VICS data buffers the VICS data received by the tuner 11 and supplies it to the guide sentence creation unit 5.
[0021]
The vehicle position detection unit 4 detects a vehicle position (current position) from a GPS (Groval Positioning System) signal received by the GPS receiver 12 and supplies the vehicle position (current position) to the guide text creation unit 5 and the map data buffer memory 7.
[0022]
The buffer memory 7 reads from the CD-ROM drive 13 and buffers the map data corresponding to an area within a predetermined range centered on the vehicle position detected by the vehicle position detection unit 4. The map data buffered in the buffer memory 7 is given to the guide sentence creation unit 5.
[0023]
As described above, the guidance sentence creation unit 5 inputs data from the VICS data buffer memory 2, the standard guidance sentence data memory 1, the vehicle position detection unit 4, and the map data buffer memory 7, which will be described later. Create a guide sentence as you do. The created guidance text is output to the voice synthesizer 8 and is generated as a synthesized voice from the speaker 15, and is also sent to the FIFO memory 6 for buffering.
[0024]
The voice synthesizing unit 8 is a speech analysis unit 81 that performs language analysis on the data of the guidance sentence given from the above-mentioned guidance sentence creation unit 5 and a voice that is given from the address movement width calculation unit 3 to the data buffered in the FIFO memory 6. It includes two functions of the synthesized voice generating unit 82 that generates from the speaker 15 as synthesized voice from the synthesis start address.
[0025]
The analysis unit 81 of the speech synthesizer 8 detects various kinds of information necessary for speech synthesis by performing language analysis on the data of the guide sentence given from the guide sentence creation unit 5, and analyzes the analysis data as a result. Store in the FIFO memory 6. Specifically, the analysis unit 81 analyzes the part-of-speech information and the dependency state of each word constituting the sentence to determine the reading, accent, and pose length. For example, the analysis unit 81 uses the model shown in FIGS. 2 (a) and 2 (b). The analysis result as shown in the figure is stored in the FIFO memory 6. In the figure, “S3” is a pause symbol and is set to 100 msec in this embodiment. “↑” and “↓” indicate accent marks that specify the raising or lowering of the accent. “\ Plc \” indicates the start start label of the place name data, and “\ num \” indicates the start start label of the numeric data.
[0026]
The address movement width calculation unit 3 includes the start start address of the place name data as described above and the start of the numeric data in each unit of guidance text (range delimited by “.”) Buffered in the FIFO memory 6. The start address is detected and stored. Finally, the head address of the guidance text data stored in the FIFO memory 6 is stored as the speech synthesis start address P.
[0027]
The synthesized speech generator 82 of the speech synthesizer 8 corresponds to the guidance text data stored in the FIFO memory 6 when the speech synthesis start address P stored in the address movement width calculator 3 is given. By synthesizing speech from the address and outputting it to the speaker 15, it is generated as synthesized speech.
[0028]
When the push switch 14 is operated n times, the speech synthesis start address P stored in the address movement width calculation unit 3 is the place name n times before the guidance sentence data previously stored in the FIFO memory 6. Change to the start start address of data or numeric data. As a result, the voice synthesizer 8 reads out the data buffered in the FIFO memory 6 from the voice synthesis start address P given from the address movement width calculator 3 and outputs it to the speaker 15.
[0029]
Regarding the operation of the speech synthesizer of the present invention having the above-described configuration, the guidance text creation unit 5 makes two guidance texts “National Route 1 and Moriguchi direction are 2 km from the Dainichi intersection.” The following is an example of a case in which guidance sentences such as “The route to travel to” are continuously created.
[0030]
It is found from the VICS data received by the antenna 10 that a 2 km traffic jam has occurred at the intersection in front of the direction of travel of the automobile on which the speech synthesizer of the present invention is mounted. Suppose that it turns out that it is running in the direction of “Moriguchi” in front of “Daiichi Intersection” on National Route 1.
[0031]
In this case, the guide text creation unit 5 reads the standard guide text data stored in the memory 1 in advance, “Direction is from 2, km, traffic jam, route along the road for a while”, CD-ROM drive Guide text from "National Highway 1", "Daichi Intersection" and "Moriguchi" read from the CD-ROM by 13 "National Highway 1 and Moriguchi direction are 2km from the Dainichi Intersection." And the navigation function to create a guidance sentence “A route along the road for a while.” Based on the vehicle position detected by the vehicle position detection unit 4, the control unit 9 transfers the above-described guidance text from the guidance text creation unit 5 to the speech synthesis unit 8 at an appropriate timing. No sound is generated, and the analysis unit 81 performs the following language analysis.
[0032]
First, the analysis unit 81 analyzes the part-of-speech information and the dependency state of each word, determines the reading, accent, and pose length, and the analysis result as shown in the schematic diagram of FIG. To store. In FIG. 2A, “S3” is a pause symbol, and is set to 100 msec in this embodiment. “↑” and “↓” indicate accent marks that specify the raising or lowering of the accent. “\ Plc \” indicates the start start label of the place name data, and “\ num \” indicates the start start label of the numeric data.
[0033]
When the analysis result data obtained by the analysis unit 81 of the speech synthesis unit 8 is stored in the FIFO memory 6 in this way, the address movement width calculation unit 3 stores the speech synthesis start address P, the location name data, and the numeric data. First start addresses A, B, C, and D are stored. However, in the first guide sentence, the address A matches the speech synthesis start address P. Each time the guidance text data is newly stored in the FIFO memory 6, the address movement width calculation unit 3 updates and stores the voice synthesis start address of each guidance text, the local name data, and the head start address of the numeral data, as described above. .
[0034]
As described above, the data from the speech synthesis start address P of the analysis data once stored in the FIFO memory 6 to the head address of the FIFO memory 6 (the end of the analysis data of the guide sentence stored in the FIFO memory 6 at the end) It is transferred to the speech synthesizer 8 and synthesized by the synthesized speech generator 82 in accordance with accents, pose symbols, etc., and the synthesized speech from the speaker 15 is “National Route 1 and Moriguchi direction is 2 km from the Dainichi intersection”. Is generated.
[0035]
Next, the second guidance sentence is transferred from the guidance sentence creation unit 5 to the voice synthesis unit 8 and is analyzed by the analysis unit 81 in the same manner as the first guidance sentence. The result is shown in FIG. It is shown in the schematic diagram of b).
[0036]
When the analysis data of the second guidance text is transferred from the voice synthesizer 8 to the FIFO memory 6 and stored, each address of the analysis data of the first guidance text previously stored in the FIFO memory 6 is stored. Moves by an address width corresponding to the data length of the entire newly stored analysis data. Accordingly, the speech synthesis start address P of the analysis data of the first guidance sentence shown in FIG. 2 (a) and the speech synthesis start address of the analysis data of the second guidance sentence shown in FIG. 2 (b). The addresses A, B, C, and D of the first analysis data are updated and stored in the address movement width calculation unit 3 as the moved addresses A ′, B ′, C ′, and D ′ by the difference in address width from P, respectively. Is done.
[0037]
Then, the second analysis data is transferred to the speech synthesizer 8, synthesized by the synthesized speech generator 82, and generated as synthesized speech from the speaker 15, “This is a route along the way for a while”.
[0038]
By the way, if the user notices that he / she has missed the first guidance information when the second guidance information is generated from the speaker 15, the user operates the push switch. As a result, the control unit 9 causes the synthesized speech generation unit 82 of the speech synthesis unit 8 to immediately stop speech synthesis, and also provides the address movement width calculation unit 3 with the voice synthesis start address P for the second guidance at that time. Move from the beginning of the sentence to the start address of the previous place name data or numeric data. As a result, the speech synthesis start address P moves to D ′, which is the last address of the first start address of the place name data or numerical data of the first guidance sentence, and the data after that address is voiced from the FIFO memory 6. Output to the combining unit 8. As a result, the guidance sentence after the address D ′, that is, “2 km traffic jam. This is a route to follow along for a while” is synthesized by the synthesized voice generating unit 82 and generated again from the speaker 15 with synthesized voice.
[0039]
By the way, in this embodiment, when the push switch 14 is operated n times, the address movement width calculation unit 3 is configured to move the speech synthesis start address P to the head start address of the n-th place name data or numerical data. ing. Therefore, when the user operates the push switch 14 twice when the second guidance information similar to the above is started to be generated from the speaker 15, the speech synthesis start address P is the address C 'of the first guidance sentence. As a result, the guidance message “There is a 2km traffic jam from the Dainichi intersection.
[0040]
FIG. 3 is a flowchart showing an operation procedure when the speech synthesizer of the present invention as described above is applied to a car navigation system.
[0041]
It is first checked whether or not the push switch 14 has been operated (step S11). If “NO”, the guide text generator 5 next checks whether or not a guide text has been created (step S12). If no guidance text has been created, the process returns to step S11.
[0042]
When the guidance text is created by the guidance text creation section 5 (“YES” in step S12), the language analysis is performed by the analysis section 81 of the speech synthesis section 8 (step S13), and the analysis data obtained as a result is obtained. It is stored in the FIFO memory 6 (step S14). At this time, the address movement width calculation unit 3 updates the head of the analysis data of the guidance text newly stored in the FIFO memory 6 to the voice synthesis start address P, and the guidance text previously stored in the FIFO memory 6. Each address of the data is changed according to the data length of the analysis data of the guide sentence newly stored in the FIFO memory 6 (step S15).
[0043]
Next, data from the voice synthesis start address P of the data stored in the FIFO memory 6 to the head address is sent to the voice synthesizer 8 and generated by the synthesized voice generator 82 from the speaker 15 as synthesized voice (step) S16).
[0044]
When the data from the voice synthesis start address P to the head address in step S16 is sent to the voice synthesizer 8 and generation of synthesized voice is started from the speaker 15, the push switch 14 is operated (in step S11). “YES”), the speech synthesis start address P is returned to the previous address (the start start address of the place name data or the numerical data) by the number of operations n (step S21). Occurrence resumes.
[0045]
In the present embodiment, 128 kbit SRAM is used for the FIFO memory 6, it is possible to buffer the guidance text of about 8000 characters, and the address held in the address movement width calculation unit 3. Is up to 5 in addition to the speech synthesis start address P, but is sufficiently practical when general traffic jam information is targeted as in the above-described example of guidance text.
[0046]
Furthermore, in this embodiment, the address held by the address movement width calculation unit 3, in other words, the address detected by the speech synthesizer 8 is the head address of the place name data and the numeric data, but may be either one. Furthermore, in the present embodiment, the address held by the address movement width calculation unit 3 is applied to the car navigation system, and the start address of the place name data and the numeral data is used. However, the start address of other data is used depending on the purpose of use. Needless to say, may be stored in the address movement width calculation unit 3.
[0047]
【The invention's effect】
As described in detail above, according to the speech synthesizer according to the present invention, the sentence data stored in the sentence data storage means is linguistically analyzed by the analysis means, and the start address of the word having a predetermined attribute is detected, The address storage means stores the address of a word having a predetermined attribute detected by the analysis means in the data stored in the sentence data storage means, and the beginning address of the last stored sentence data is speech synthesis start It is stored as an address. Then, for example, by operating an address changing unit such as a push switch, the speech synthesis start address stored in the address storage unit is changed to the start address of a word in the sentence data stored before that, Since the text data stored in the text data storage means is generated by synthesized voice from the changed address, it can be generated without waste when it occurs again when the voice guidance is missed. .
[0048]
Further, according to the speech synthesizer according to the present invention, the data of the standard guidance text from the standard guidance text data storage means according to the position detected by the position detection means in the map data stored in the map data storage means. Is read and a guidance sentence is created, so that it can be easily generated again when the user misses the voice guidance in the car navigation system.
[0049]
Furthermore, according to the speech synthesizer according to the present invention, when the user misses the voice guidance in the car navigation system, it can be easily generated again from the place name, the traffic jam distance, the distance to the intersection, etc. become.
[Brief description of the drawings]
FIG. 1 is a block diagram showing a configuration example when a speech synthesizer according to the present invention is applied to a car navigation system.
FIG. 2 is a schematic diagram showing a result of language analysis by the speech synthesizer according to the present invention.
FIG. 3 is a flowchart showing an operation procedure when the speech synthesizer of the present invention is applied to a car navigation system.
[Explanation of symbols]
1 Memory (for standard guidance text data)
3 Address movement width calculation unit 4 Vehicle position detection unit 5 Guide text creation unit 6 FIFO memory 7 Buffer memory (for map data)
8 Speech synthesis unit
13 CD-ROM drive
14 Push switch
15 Speaker
81 Analysis unit
82 Synthetic voice generator

Claims (3)

合成音声として発生すべき文章のデータを記憶する文章データ記憶手段と、該文章データ記憶手段が記憶しているデータを言語解析することにより合成音声として発生する音声合成手段とを備えた音声合成装置において、前記音声合成手段は、前記文章データ記憶手段が記憶している文章のデータを言語解析することにより所定の種類の属性の単語の開始アドレスを検出する解析手段と、前記文章データ記憶手段に記憶されている文章のデータを音声合成開始アドレスとして指示されたアドレスから合成音声として発声する合成音声発声手段とを有し、
前記文章データ記憶手段が記憶しているデータ中の前記解析手段が検出した単語の開始アドレスを記憶すると共に、最後に記憶された文章のデータの先頭のアドレスを音声合成開始アドレスとして記憶するアドレス記憶手段と、
適宜の操作が行なわれた場合に、前記アドレス記憶手段が記憶している音声合成開始アドレスをそれ以前に記憶された文章のデータ中の単語の開始アドレスに変更させる音声合成開始アドレス変更手段と
を備え、
前記合成音声発生手段は、音声合成開始アドレスが前記音声合成開始アドレス変更手段の操作により変更された場合に、前記文章データ記憶手段に記憶されている文章のデータを変更後のアドレスから合成音声により発生すべくなしてあることを特徴とする音声合成装置。
A speech synthesizer comprising: sentence data storage means for storing sentence data to be generated as synthesized speech; and speech synthesis means for generating synthesized speech by performing language analysis on data stored in the sentence data storage means The speech synthesizer includes: analyzing means for detecting a start address of a word having a predetermined type attribute by linguistic analysis of sentence data stored in the sentence data storage means; and the sentence data storage means. Synthesized speech utterance means for uttering the stored sentence data as synthesized speech from the address designated as the speech synthesis start address;
Address storage for storing the start address of the word detected by the analysis means in the data stored in the sentence data storage means and storing the start address of the last stored sentence data as a speech synthesis start address Means,
Speech synthesis start address changing means for changing the speech synthesis start address stored in the address storage means to the start address of a word in the previously stored sentence data when an appropriate operation is performed; Prepared,
The synthesized speech generation means, when the speech synthesis start address is changed by the operation of the speech synthesis start address changing means, the text data stored in the text data storage means by the synthesized voice from the changed address A speech synthesizer characterized by being generated.
地図データを記憶した地図データ記憶手段と、
道路交通情報に関する定型案内文章のデータを記憶した定型案内文章データ記憶手段と、
位置検出手段と、
前記地図データ記憶手段が記憶している地図データ中の前記位置検出手段が検出している位置に応じて前記定型案内文章データ記憶手段から定型案内文章のデータを読み出して合成音声として発生すべき文章を作成する案内文章作成手段とを更に備えたことを特徴とする請求項1に記載の音声合成装置。
Map data storage means for storing map data;
A fixed guide sentence data storage means for storing fixed guide sentence data relating to road traffic information;
Position detecting means;
Sentence to be generated as synthesized speech by reading out the data of the standard guidance text from the standard guidance text data storage means according to the position detected by the position detection means in the map data stored in the map data storage means The speech synthesizer according to claim 1, further comprising: a guidance sentence creating means for creating a sentence.
前記所定の属性の単語は、地名及び/又は数字であることを特徴とする請求項2に記載の音声合成装置。The speech synthesis apparatus according to claim 2, wherein the word having the predetermined attribute is a place name and / or a number.
JP03490699A 1999-02-12 1999-02-12 Speech synthesizer Expired - Fee Related JP3706495B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP03490699A JP3706495B2 (en) 1999-02-12 1999-02-12 Speech synthesizer

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP03490699A JP3706495B2 (en) 1999-02-12 1999-02-12 Speech synthesizer

Publications (2)

Publication Number Publication Date
JP2000235697A JP2000235697A (en) 2000-08-29
JP3706495B2 true JP3706495B2 (en) 2005-10-12

Family

ID=12427249

Family Applications (1)

Application Number Title Priority Date Filing Date
JP03490699A Expired - Fee Related JP3706495B2 (en) 1999-02-12 1999-02-12 Speech synthesizer

Country Status (1)

Country Link
JP (1) JP3706495B2 (en)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3806611B2 (en) * 2001-05-16 2006-08-09 株式会社ケンウッド Navigation device, voice providing method and program
JP2008216065A (en) * 2007-03-05 2008-09-18 Aisin Aw Co Ltd Navigation device
WO2016136619A1 (en) * 2015-02-25 2016-09-01 ヤマハ株式会社 Information provision device, terminal device, information provision system, and information provision method

Also Published As

Publication number Publication date
JP2000235697A (en) 2000-08-29

Similar Documents

Publication Publication Date Title
US6012028A (en) Text to speech conversion system and method that distinguishes geographical names based upon the present position
US6317687B1 (en) Vehicle navigation apparatus providing both automatic guidance and guidance information in response to manual input request
EP0675341B1 (en) Car navigation system
US6108631A (en) Input system for at least location and/or street names
JP2644376B2 (en) Voice navigation method for vehicles
KR19980702810A (en) Vehicle navigation system using audio CD player for data storage
EP0777210B1 (en) Text to voice read-out system
JPH10105192A (en) Speech recognition device for vehicle
JP2002156241A (en) Navigation apparatus and recording medium with program recorded thereon
JP4784156B2 (en) Speech synthesizer for performing voice guidance by a plurality of characters, speech synthesis method, program thereof, and information recording medium on which the program is recorded
KR101063607B1 (en) Navigation system having a name search function using voice recognition and its method
KR960030057A (en) Navigation device
JP3706495B2 (en) Speech synthesizer
JP2867589B2 (en) Voice guidance device
JPH07294276A (en) Operation supporting system
JPH07319383A (en) Map display device
JP4520555B2 (en) Voice recognition device and voice recognition navigation device
JPH11183190A (en) Voice recognition unit for navigation and navigation unit with voice recognition function
JPH0599678A (en) Navigation device for vehicle
JP3000601B2 (en) Travel guide device
JPH0696389A (en) Speech path guide device for automobile
CN110556091A (en) Information providing device
JPWO2006028171A1 (en) Data presentation apparatus, data presentation method, data presentation program, and recording medium recording the program
JP4684609B2 (en) Speech synthesizer, control method, control program, and recording medium
KR20050041457A (en) Method for guiding road in telematics system

Legal Events

Date Code Title Description
A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20050104

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20050712

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20050729

LAPS Cancellation because of no payment of annual fees