JP2002062889A

JP2002062889A - 音声合成方法

Info

Publication number: JP2002062889A
Application number: JP2000245863A
Authority: JP
Inventors: Koji Shibata; 晃司柴田; Shinichi Suzuki; 伸一鈴木
Original assignee: Pioneer Electronic Corp
Current assignee: Pioneer Corp
Priority date: 2000-08-14
Filing date: 2000-08-14
Publication date: 2002-02-28
Also published as: US20020026318A1; EP1182644A2; EP1182644A3

Abstract

(57)【要約】【課題】デジタル放送における文字情報放送にて、視
聴者の必要とする文字情報のみを発音する音声合成方法
を提供する。【解決手段】デジタル放送における文字情報に含まれ
るタグ及び文字情報自体の内容を認識し、これを視聴者
が予め設定したタグ及び文字情報と比較する。かかる比
較結果に基づいて、デジタル放送から受信した文字情報
の音声合成を行うか否かを判断する。

Description

【発明の詳細な説明】

【０００１】

【発明の属する技術分野】本発明は、デジタル放送等の
通信媒体を通じて伝送された情報に含まれる文字情報
を、これに対応する合成音に変換する音声合成方法に関
する。

【０００２】

【従来の技術】近年におけるデジタル放送技術の飛躍的
進歩に伴い、従来、映像情報のみを伝送していた放送に
おいて、かかる映像情報を補填する文字情報をも加えて
伝送するデジタル放送の形態が普及しつつある。例え
ば、道路地図のディスプレイと共に渋滞情報を文字情報
として伝送したり、天気図のディスプレイと共に天気予
報を文字情報として伝送するような形態である。

【０００３】しかし、車載受信機のように運転操作を行
いつつ放送番組を視聴するような場合は、運転者は常に
前方方向の視認に注意力を集中することが重要であり、
安全運転の観点から文字情報伝送の利点を生かし難い。
このような欠点を解決すべく、放送媒体によって伝送さ
れた文字情報について合成音を用いて音声情報に変換す
る音声合成方法及び装置が特開平９−２５１３７３によ
って開示されている。しかしながら、かかる従来技術に
おいては、放送者側が文字情報中に設けた音声化コマン
ド、即ち文字情報のどの部分を対象に音声合成処理を行
うかを指示するコマンドを受信機が検出し、当該指示の
ある文字情報のみを音声情報に変換するものである。

【０００４】従って、文字情報の如何なる部分を発音す
るかについては、常に放送者側の意思で決定され、放送
視聴者側の意思が反映されない。また、発音指示は前記
音声化コマンドを文字情報中に付加することによってな
されるため、発声を伴う文字情報放送と発声を伴わない
文字情報放送の２種類が混在することになり受信装置の
構成が煩雑となる。

【０００５】

【発明が解決しようとする課題】本発明は、かかる欠点
を解消するためになされたものであり、伝送される文字
情報放送の内、視聴者の必要とする情報のみについての
合成音を得る音声合成方法を提供することを目的とす
る。

【０００６】

【課題を解決するための手段】本発明による音声合成方
法は、文字情報と前記文字情報を予約するためのタグと
を有する文書記述言語で記述された伝送情報に含まれる
文字情報中に対応する合成音を生成する音声合成方法で
あって、前記文字情報中のタグを認識するタグ認識行程
と、前記タグ認識行程で認識されたタグと予め設定され
た所定タグとを比較するタグ比較行程と、前記タグ比較
行程の比較結果に基づいてタグが一致した場合にのみ、
前記認識されたタグによって予約された文字情報を合成
音の生成対象とし、若しくは生成対象から除外して合成
音を生成する行程と、を有することを特徴とする。

【０００７】

【発明の実施の形態】図１は、本発明による音声合成方
法を実行する車載デジタル放送受信機の構成を示すブロ
ック図である。図１において、受信アンテナ１０は、ロ
ッドアンテナや誘電体アンテナ等の小型高利得アンテナ
であり、放送局からのデジタル放送電波を受信するもの
である。

【０００８】ＲＦ部１１は、受信電波の増幅、周波数変
換及び検波等の処理を行う回路であり、受信機における
いわゆるフロントエンド部に相当する。受信処理部１２
は、検波・復調された受信データについてデインターリ
ーブ処理や誤り訂正処理等の正確な受信データ再生に必
要とされる一切の処理、及び各チャンネル毎の受信デー
タのデコードを行う回路である。

【０００９】システム制御部１３は、主にマイクロコン
ピュータ（以下μＣＰＵと称する）から構成され、受信
機全体の動作を制御する部分である。なお、後述のメモ
リ部１４に記憶された、受信機動作を担うメインプログ
ラムや本発明にかかる音声合成サブルーチン等の各種サ
ブプログラムを、前記μＣＰＵが内蔵クロックに同期し
て実行する。

【００１０】メモリ部１４は、ＲＯＭ(Read Only Memor
y)やＲＡＭ(Random Access Memory)等の記憶素子から構
成される。ＲＯＭには前述の如く受信機動作を制御する
各種プログラムが記憶されており、ＲＡＭには、動作処
理の過程における各種の計算結果や、処理判断の指針と
なる各種のフラグ・レジスタ（以下、単にフラグと称す
る）の状態、及び予め設定された所定のタグ情報や文字
情報の内容等のデータが一時的に保存される。なお、音
声合成処理に用いられる発音用音源データもデジタルデ
ータとしてメモリ部１４のＲＯＭ乃至は不揮発性ＲＡＭ
に蓄積記憶されている。

【００１１】映像信号出力部１５は、受信データの内の
映像情報をＣＲＴや液晶ディスプレイなどの表示装置に
出力するための処理回路である。また、音声信号出力部
１６は、受信データの内の音声情報や、システム制御部
１３が行った音声合成処理による音声情報をスピーカー
やヘッドフォン等の音響機器に出力するための処理回路
である。

【００１２】操作入力部１７は、使用者が受信機を取り
扱う際に各種の動作指令や情報を入力するための操作部
であり、キーボードや種々のファンクションキー等のス
イッチ群から構成されている。デジタル放送によって伝
送される文字情報は、一般に、データネットワークにお
ける情報交換用言語である、ＳＧＭＬ(Standard Genera
lized Markup Language)やＨＴＭＬ(Hypertext Markup
Language)などのJIS-X-4151等で規定される、いわゆる
文章記述言語によって記述さている。

【００１３】デジタル放送で伝送される文字情報の一例
を図２に示す。本実施例は交通情報を文字情報として伝
送したものであり、図２（ａ）は、伝送された文字情報
が受信機の表示画面に表示される様子を表している。ま
た、かかる文字情報を文章記述言語によつて記述したも
のを図２（ｂ）に示す。なお、本実施例では、文章記述
言語として前記のＨＴＭＬを用いて説明を行うが、記述
言語はこれに限定されるものではなく、ＳＧＭＬやＸＭ
Ｌ(Extensible Markup Language)、若しくはＢＭＬ(Bro
adcasting Markup Language)等の文章記述言語を用いて
も良い。

【００１４】文章記述言語で記載した文字情報の一単位
はテキストと呼ばれ、その構成を図２（ｃ）に示す。１
つのテキストは、タグと呼ばれる“＜”と“＞”とで囲
まれた予約語によつて定義される。１つのテキストは、
テキスト開始タグによって始まりテキスト終了タグによ
って終了する。両タグに挟まれた部分が当該テキストに
よって伝送される文字情報である（本明細書の説明にお
いては「タグによって予約される文字情報」と言う表現
を用いる）。タグの種類は、文字情報の内容によって異
なり、例えば、図２（ｂ）に示すように“渋滞情報”の
ような純粋に文字のみからなる文字情報のときは“＜Ｔ
Ｄ＞”なるタグが用いられ、“←戻る”のようにその一
部に矢印のような記号を含む文字情報のときは“＜Ａ…
＞”なるタグが用いられる。また、テキスト開始タグと
テキスト終了タグの文字構成は同一であり、テキスト開
始タグの頭に“／”を付加したものがテキスト終了タグ
となる（前述の場合を例に取れば、テキスト終了タグ
は、各々“＜／ＴＤ＞”“＜／Ａ…＞”となる）。

【００１５】図２（ｂ）に示す如く、複数のテキストが
集まって一画面分の文字情報を形成し、文字情報の文章
記述言語としてＨＴＭＬを使用した場合は、一画面分の
文字情報の区切りを示す識別タグとして＜ＨＴＭＬ＞〜
（一頁分の文字情報）〜＜／ＨＴＭＬ＞なるタグが用い
られる。図１のブロック図に示す受信機において、図２
（ｂ）の例に示した文字情報を受信した場合の本発明に
基づく動作の実施例を以下に説明する。なお、実施例で
は複数の動作モードが考えられるため、これを動作モー
ド１から動作モード４に分けて説明する。

【００１６】先ず、動作モード１の実施例を説明する。
動作モード１とは、予め所定のタグをメモリ部１４に設
定しておき、受信した文字情報の中で当該設定タグに該
当するタグによって予約された文字情報については音声
合成をしない、即ち、発音しない動作モードを言う。動
作モード１において、システム制御部１３は、図３のフ
ローチャートに示す処理サブルーチンを、内蔵クロック
に同期して常時実行されているメインルーチンに割り込
んで実行する。本サブルーチンの起動に関しては、例え
ば、操作入力部１７からの使用者による発音指令ボタン
の押下による割込信号によって起動されるようにしても
良い。また、システム制御部１３が受信処理部１２から
一画面分の表示データの供給を受けたとき或いは、シス
テム制御部１３が一画面分のデータを映像信号出力部１
５へ供給するときに起動されるようにしても良い。

【００１７】このサブルーチンにおいて、先ずシステム
制御部１３は、図２（ｂ）に示した一画面分のテキスト
データをメモリ部１４に設けた発音処理用のＲＡＭエリ
ア上に一旦蓄える（ステップ１１）。次に、ＲＡＭエリ
ア上にタグ検索ポインタＰ（ｎ）なるレジスタ（以下、
単にＰ（ｎ）と称する）を設け、当該レジスタの内容ｎ
を初期値ｎ＝０に設定する（ステップ１２）。

【００１８】かかる準備が終了後、システム制御部１３
は、前記ＲＡＭ上に蓄えられた一画面分のテキストデー
タ中のタグデータのみに着目し、一画面中に在るタグの
中からｎ番目のタグを検索してその内容を認識する（ス
テップ１３）。因みに、本サブルーチンが起動された直
後は、前述の如くＰ（ｎ）の内容がｎ＝０のＰ（０）に
初期設定されている。このため、システム制御部１３
は、図２（ｂ）に示す一画面分のテキストデータの内、
一番最初のタグ即ち＜ＨＴＭＬ＞から検索して行くこと
になる。

【００１９】システム制御部１３は、ステップ１３でｎ
番目のタグを検索してその内容を認識した結果、タグの
内容がテキスト開始タグであると判断した場合ステップ
１５に移り（ステップ１４）、当該タグの内容が予め設
定した所定の発音除外タグに該当するか否かを判断す
る。ここで、所定の発音除外タグとは、受信機製造時に
製造メーカが予めメモリ部１４のＲＯＭエリアに固定入
力設定しておいても良いし、また、使用者が操作入力部
１７のキーボードからメモリ部１４の不揮発性ＲＡＭエ
リアに入力設定できるようにしても良い。因みに、図２
（ｂ）に記述された文字情報を対象として処理を行う本
実施例においては、＜ＨＴＭＬ＞，＜ＴＡＢＬＥ＞，＜
Ａ…＞が発音除外タグとして、前記いずれかの方法によ
りメモリ部１４に設定されているものとする。

【００２０】これらのタグは、例えば、表示画面の開始
を指示したり、或いは画面のリンク先を示すなどの予約
語であるため、当該テキストに含まれる文字情報を音声
合成によって音声情報化しても使用者の便宜にはなり得
ないため発音除外とするものである。システム制御部１
３は、ステップ１５においてｎ番目のタグの内容を発音
除外タグと判断した場合、ステップ１７に移りＰ（ｎ）
の内容をｎ＋１に加算した後ステップ１３に戻り前述の
処理を繰り返す。また、ステップ１５にてタグの内容が
発音除外タグに非該当であったときは、システム制御部
１３は、当該タグによって予約される文字情報を基に音
声合成を行い、得られた音声信号を音声信号出力部１６
に出力する（ステップ１６）。なお、発音処理実施後は
ステップ１７に移りＰ（ｎ）の内容をｎ＋１に加算した
後ステップ１３に戻る。

【００２１】ステップ１４にて、認識したタグの内容が
テキスト開始タグではなかった場合、即ち、該当タグが
＜／…＞で表されるテキスト終了タグであったときは、
システム制御部１３はステップ１８に移り、当該タグが
一画面終了タグ＜／ＨＴＭＬ＞に該当するか否かを判断
する。一画面終了タグでない場合システム制御部１３
は、ステップ１７に移りＰ（ｎ）の内容をｎ＋１に加算
した後、ステップ１３に戻って更にタグ内容の検索処理
を繰り返す。

【００２２】一方、ステップ１８において一画面終了タ
グであったときは、既に一画面分のテキストデータにつ
いてタグ検索処理及び該当文字情報の発音処理が終わっ
ているため、システム制御部１３は本サブルーチンを終
了させる。なお、本サブルーチンの終了方法としては、
本実施例に示す以外にも例えば、ステップ１１において
一画面分のテキストデータに含まれるタグの数を予め数
えておき、タグ検索ポインタＰ（ｎ）の内容がこのタグ
数に達したときに本サブルーチンを終わらせても良い。

【００２３】以上詳述した如く、図２（ｂ）に示す文字
情報を受信して本サブルーチンによる処理を実施する
と、図２（ａ）の画面表示と共に『交通情報』『川越
市』『２５４号』『渋滞』『大宮市』『１６号』『事
故』の文字情報が音声合成により音声信号に変換され、
順次、スピーカーやヘッドフォンから使用者に出力され
るのである。

【００２４】次に、動作モード２の実施例を説明する。
動作モード２とは、予め所定のタグをメモリ部１４に入
力設定しておき、受信した文字情報中で当該設定タグに
該当するタグによって予約された文字情報を発音する動
作モードを言う。動作モード２の処理サブルーチンを図
４のフローチャートに示す。動作モード２においても当
該サブルーチンの起動方法は動作モード１の場合と同様
である。即ち、使用者による文字情報発音指令ボタンの
押下や、一画面分の文字情報の受信完了時などの割込指
令によって起動されることになる。

【００２５】ところで、前述の動作モード１の処理は、
原則として全ての受信文字情報を発音し、発音を除外す
る文字情報についてのみ、その文字情報を予約するタグ
をメモリ部１４に設定しておく方式であった。これに対
し、動作モード２では、原則として全ての受信文字情報
を発音せず、発音する文字情報についてのみ、その予約
タグをメモリ部１４に設定する方式である。

【００２６】つまり、動作モード１（図３）と動作モー
ド２（図４）の両フローチャートを比較した場合、図３
のステップ１５と図４のステップ２５の判断処理が異な
るのみである。即ち、動作モード１（図３）ではステッ
プ１５において認識タグが発音除外タグか否かを判断し
て非該当の場合には発音処理を実施する（ステツプ１
６）。一方、動作モード２（図４）の場合は、ステップ
２５において認識タグが発音指定タグか否かを判断して
該当する場合には発音処理を実施することになる（ステ
ツプ２６）。従って、動作モード２については動作モー
ド１の動作とほぼ同一であるため、その動作についての
詳細な説明は省略して以下にその概略のみを記載する。

【００２７】図４のフローチャートにおいて、先ず、シ
ステム制御部１３は、一画面分のテキストデータを一旦
メモリ部１４の発音処理用ＲＡＭエリア上に蓄え、その
後、蓄積データの最初からタグデータを検索して行き、
予め設定された発音指定タグに相当した場合は、当該タ
グによって予約された文字情報に基づいて音声合成によ
る発音処理を実施する。

【００２８】なお、発音指定タグの入力設定は、動作モ
ード１の場合と同様に、受信機製造メーカー或いは使用
者の手によって行われるものとし、本実施例では＜ＴＩ
ＴＬＥ＞，＜ＴＤ＞のタグが発音指定タグとして設定さ
れているものと想定する。従って、図２（ｂ）に示す文
字情報を受信して本サブルーチンによる処理を実施した
場合、『交通情報』『川越市』『２５４号』『渋滞』
『大宮市』『１６号』『事故』の文字情報が音声合成に
よって音声信号に変換され出力されることになる。

【００２９】因みに、この音声情報出力の結果は、動作
モード１の場合と同様となる。次に、動作モード３の実
施例を説明する。動作モード３とは、受信した文字情報
の中から特定の文字情報についてのみ、使用者が予め入
力設定した文字情報に関するキーワードに従い音声合成
を行い、これを音声信号として出力する動作処理モード
を言う。

【００３０】動作モード３の処理サブルーチンを図５の
フローチャートに示す。動作モード３のサブルーチンに
おいて、その起動方法、及び一画面分のテキストデータ
の取り込み（ステップ３０１）から発音指定タグか否か
の判断（ステップ３０５）、までの処理については、前
述した動作モード２における処理と同様である。よっ
て、動作モード３の処理については、図５に示すフロー
チャートのステップ３０５から詳細な説明を行う。

【００３１】ステップ３０５にて、システム制御部１３
は、タグの内容が発音指定タグであった場合、そのタグ
によって予約された文字情報（以下、予約文字情報と称
する）の認識を行う（ステップ３０６）。ここで、文字
情報の認識とは、予約文字情報が予め使用者がメモリ部
１４のＲＡＭエリア上に入力設定しておいた文字情報に
該当するか否かをチェックする処理を言う。かかる文字
情報の入力設定は、使用者が操作入力部１７のキーボー
ドから直接行っても良いし、また、システム制御部１３
が受信機のディスプレイ上に表示する、例えば、『交通
情報』、『天気予報』、『川越（地名例）』など複数の
キーワードの中から、操作入力部１７のファンクション
キーを用いて、使用者が選択的に行えるようにしても良
い。

【００３２】ステツプ３０６における文字情報認識処理
の後、システム制御部１３は、次の２つの判断処理を行
う。先ず、ステップ３０７において、予約文字情報が予
め設定された所定の入力設定文字情報の内、発音開始文
字情報に該当するか否かを判断し、該当するときはメモ
リ部１４に設けたフラグレジスタ（以下、単にＦＲと称
する）を１にセットする（ステップ３０８）。一方、非
該当のときは、更にステップ３０９において、予約文字
情報が所定の入力設定文字情報の内、発音終了文字情報
に該当するか否かを判断して、該当するときは前記ＦＲ
を０にリセットする（ステップ３１０）。

【００３３】ここで発音開始文字情報とは、デジタル放
送から受信した文字情報の中で、使用者が音声情報出力
を希望する部分の開始部を示すキーワードを意味し、ま
た、発音終了文字情報とは、その終了部を示すキーワー
ドを意味している。従って、受信した一画面分の文字情
報を処理する場合、発音開始文字情報が検出されてから
発音終了文字情報が検出されるまでの間、ＦＲは１にセ
ットされていることになる。

【００３４】システム制御部１３は、ステップ３１１に
おいてＦＲの内容を判断し、ＦＲ＝１であれば、ステッ
プ３０６で認識した文字情報について音声合成処理を行
い、その内容を音声信号として音声信号処理部１６へ供
給する（ステツプ３１２）。本実施例において、例え
ば、デジタル放送から受信した文字情報の記述フォーマ
ットが図２（ｂ）に示す通りであり、また、発音開始文
字情報として『川越市』が、発音終了文字情報として
『大宮市』が、登録されているものと想定すると、図２
（ａ）の画面表示と共に、『川越市』『２５４号』『渋
滞』の文字情報が音声合成により音声信号に変換され、
順次スピーカーやヘッドフォンから使用者に出力される
ことになる。即ち、使用者は、デジタル放送の文字情報
から供給される各地の交通情報の中で、希望する地域に
関する交通情報のみを音声情報として聴取する事ができ
るのである。

【００３５】ステップ３０５にて検索タグが発音指定タ
グに該当しなかったときや、ステップ３１１にてＦＲ＝
０であったとき、及びステップ３１２における発音処理
を実施した後、システム制御部１３はステップ３１１に
移り、Ｐ（ｎ）の内容をｎ＋１に加算した後ステップ３
０３に戻って前述の処理を繰り返す。動作モード３にお
いても、前述の動作モード１及び２と同様に、一画面終
了タグの検出により本サブルーチンは終了する（ステッ
プ３１４）。

【００３６】なお、図５に示すフローチャートでは、発
音開始文字情報検出から発音終了文字情報検出までの判
断処理過程、及び当該処理に用いるフラグを１組しか設
けていないが、本発明による音声合成方法はこれに限定
されるものではなく、例えば、かかる組を複数準備し、
これに対応する判断ステップ（ステップ３０７からステ
ップ３０９に相当）を縦続的に複数設けることにより一
画面分の文字情報中に、複数の発音部分を任意かつ離散
的に設定することも可能である。

【００３７】次に、動作モード４について説明する。動
作モード４とは、使用者が予め入力設定した文字情報に
関する複数のキーワード及び、該キーワードに関する論
理条件に従って、受信した文字情報がかかるキーワード
及び論理条件に合致した場合にのみ音声合成を行い、こ
れを音声信号として出力する動作処理モードを言う。動
作モード４の処理サブルーチンを図６及び図７のフロー
チャートに示す。因みに、図６に示すフローチャートが
当該サブルーチンのメイン処理プログラムであり、図７
に示すフローチャートが同サブルーチンにおける発音文
字情報検索処理（ステップ４１０）についてのサブ処理
プログラムである。

【００３８】図６に示すフローチャートにおいて、シス
テム制御部１３は、一画面分のテキストデータをメモリ
部１４の発音処理用ＲＡＭエリア上に取り込んだ後（ス
テップ４０１）、同じくＲＡＭエリア上に設けた入力文
字情報カウンタＣ（ｍ）（以下単に、Ｃ（ｍ）と称す
る）の内容を、初期値ｍ＝０にリセットする（ステップ
４０２）。

【００３９】かかる初期化の後、システム制御部１３
は、図７のフローチャートに示す発音文字検索処理（ス
テップ４１０）のサブプログラムを実行する。このサブ
プログラムは、一画面分の受信文字情報の中からキーワ
ードとなる特定の文字情報を検索するものである。この
ため、タグ検索ポインタＰ（ｎ）の設定から、発音指定
タグか否かの判断、更に当該タグによって予約される文
字情報の認識までの処理は（ステップ４１１からステッ
プ４１５）、図５における動作モード３のステップ３０
２からステップ３０６の場合と同様である。但し、図７
のサブプログラムでは、ステツプ４１５で認識した予約
文字情報を、単なる発音処理の開始又は終了を示す識別
子として判断するのではなく、使用者が予め入力設定し
たキーワードの内ｍ番目の文字情報に該当するか否かを
判断する（ステップ４１６）。

【００４０】例えば、本実施例において、使用者が文字
情報の音声合成出力のため文字情報検索キーワードとし
て、『交通情報』『首都高』『渋滞』の３つの文字情報
をこの順序で予め入力設定しておいたものと想定する
と、各々がｍ＝０番目、ｍ＝１番目、ｍ＝２番目に入力
設定した文字情報となる。図６のフローチャートのステ
ップ４１０にて、初回に図７のサブプログラムを呼び出
したときは、前述の如く、ステップ４０２においてＣ
（ｍ）の内容は、ｍ＝０となっている。このため、シス
テム制御部１３は、認識した予約文字情報が０番目の入
力設定文字情報、即ち、本実施例で言えば『交通情報』
に該当するか否かを判断するのである。

【００４１】ステップ４１６で、予約文字情報が入力設
定文字情報に該当したとき、即ち、本実施例で言えば
『交通情報』に該当した場合、システム制御部１３は、
入力文字情報フラグＦ（ｍ）（以下単に、Ｆ（ｍ）と称
する）の内容を１にセットして（ステップ４１７）、本
サブプログラムを終了させ図６のフローチャートのステ
ップ４１０に戻る。なお、言うまでもなく、このときの
フラグはＦ（０）である。因みに、本実施例の場合、入
力設定文字情報とＦ（ｍ）との対応は『交通情報』；Ｆ
（０），『首都高』；Ｆ（１），『渋滞』；Ｆ（２）の
ようになる。

【００４２】図７に示すフローチャートのステップ４１
６で予約文字情報が入力設定文字情報に該当しなかった
とき、ステップ４１４で発音指定タグに該当しなかった
とき、及びステップ４１９で一画面終了タグでなかった
とき、システム制御部１３は、先のタグ検索ポインタＰ
（ｎ）の内容をｎ＋１に増加した後（ステップ４１８）
ステップ４１２に戻り、本サブプログラムにおけるタグ
検索処理を繰り返す。

【００４３】一方、ステップ４１３でテキスト開始タグ
でなかった場合、システム制御部１３は、ステップ４１
９において該テキスト終了タグが一画面終了タグである
か否かを判断し、該当する場合は先のＦ（ｍ）の内容を
０にリセットして（ステップ４２０）本サブプログラム
を終了させ、図６のフローチャートのステップ４１０に
戻る。

【００４４】図７の発音文字検索処理サブプログラムか
ら復帰した後、システム制御部１３は、図６のステップ
４０３において、カウンタＣ（ｍ）の内容ｍ＋１にイン
クリメントし、次のステップ４０４において、カウント
値が所定値Ｍに達したか否かを判断する。因みに、Ｍの
値は、使用者が音声合成出力のキーワードとなる入力設
定文字情報を入力する際に自動的にセットされるもので
あり、本実施例では『交通情報』『首都高』『渋滞』の
３つのキーワードが入力設定されているためＭ＝３にセ
ットされる。

【００４５】ステップ４０４においてカウント値がＭに
達していないとき、システム制御部１３は、ステップ４
１０に戻り、図７に示す発音文字情報検索処理のサブプ
ログラムをｍ≧Ｍとなるまで繰り返す。すなわち、図６
のフローチャートのステップ４０４で、カウント値ｍが
Ｍ＝３となり次の発音処理（ステップ４３０）に移行す
るときは、各フラグＦ（０），Ｆ（１），Ｆ（２）のセ
ット又はリセットが完了していることになる。因みに、
各フラグに対応する入力設定文字情報が受信文字情報中
に存在した場合は、該フラグは１にセットされ、存在し
なかったときは０にリセットされる。

【００４６】従って、本実施例の場合、受信した一画面
分の文字情報中に『交通情報』『首都高』『渋滞』の３
つ全てが存在したとき、各フラグの状態は、Ｆ（０）＝
１，Ｆ（１）＝１，Ｆ（２）＝１となる。動作モード４
の処理では、以降のステップ４３０にて受信文字情報に
ついての発音処理がなされる。即ち、システム制御部１
３は、各フラグのセット／リセット状態と、予め使用者
によって入力設定されている各フラグの組み合わせ論理
条件を検討して発音処理の方法を決定するのである。

【００４７】例えば、使用者により予め入力設定された
論理条件がＦ（０）からＦ（２）までの論理積となって
いるとき、各フラグが全て１の場合のみ、つまり受信文
字情報中にこれら３つの文字情報が存在したときにの
み、『交通情報』『首都高』『渋滞』に関連する文字情
報に基づいて音声合成が行われ、かかる情報が使用者に
音声信号として供給される。また、論理条件がＦ（０）
とＦ（１）の論理積、及び、Ｆ（０）とＦ（２）の論理
積との論理和に設定されているときは、受信文字情報中
に『交通情報』と『首都高』、又は『交通情報』と『渋
滞』なる文字情報があった場合に音声合成が行われる。

【００４８】キーワードとなる入力設定文字情報の入力
方法は、他の動作モードと同様に、使用者が操作入力部
１７のキーボード操作やファンクションキー操作によっ
て、入力設定するものとしてもよい。また、これらのキ
ーワードに関する論理条件も、例えば、入力したキーワ
ードについて特別のファンクションキーを用いて定義で
きるようにしても良い。

【００４９】なお、本実施例では、説明の便宜上純然た
る文字情報のみを扱ってきたが、本発明はこれに限定さ
れるものではなく、図形情報を対象として音声合成を行
っても良い。例えば、天気予報のデジタル放送におい
て、天気図中に示される晴れマークや雨マーク及び風の
強さを示す矢印などの図形情報を認識した場合、予め、
所定の図形情報に対応して記憶されている文字情報（例
えば、“太陽／雲”の図形について『晴れ後曇り』や、
“黄色の北向き矢印”の図形について『北の風やや強
し』など）を天気図の図形表示と共に音声合成により発
音を行う構成としても良い。

【００５０】また、本実施例では、デジタル放送受信機
単体のみについて説明したが、他の車載オーディオシス
テムと組み合わせて本発明を用いても良い。例えば、使
用者がカセットやＣＤ等の他の信号ソースを選択中もデ
ジタル放送を常に受信しておき、デジタル放送による文
字情報が所定条件を満たしたときに、他の信号ソースを
中断して文字情報を音声信号出力するようにしても良
い。

【００５１】

【発明の効果】以上詳述した如く、本発明によれば、伝
送された文字情報に含まれるタグ及び文字情報自体の内
容を認識して文字情報の音声合成を制御するため、かか
る制御を行うべく送信側で文字情報中に特別のコマンド
を含ませる必要が無い。また、文字情報の発音を行うか
否かも受信者側で任意に制御できるため、受信機使用上
のの利便性を高めることができる。

【図面の簡単な説明】

【図１】本発明の実施例である車載受信機の構成を示す
ブロック図である。

【図２】デジタル放送における文字情報の表示例及び記
述例を示す構成図である。

【図３】図１の装置における動作モード１の処理を示す
フローチャートである。

【図４】図１の装置における動作モード２の処理を示す
フローチャートである。

【図５】図１の装置における動作モード３の処理を示す
フローチャートである。

【図６】図１の装置における動作モード４のメイン処理
を示すフローチャートである。

【図７】図１の装置における動作モード４の発音文字検
索処理サブプログラムを示すフローチャートである。

【符号の説明】

１０受信アンテナ１１ＲＦ部１２受信処理部１３システム制御部１４メモリ部１５映像信号出力部１６音声信号出力部１７操作入力部

Claims

【特許請求の範囲】

【請求項１】文字情報と前記文字情報を予約するため
のタグとを有する文書記述言語で記述された伝送情報に
含まれる文字情報に対応する合成音を生成する音声合成
方法であって、前記文字情報中のタグを認識するタグ認識行程と、前記タグ認識行程で認識されたタグと予め設定された所
定タグとを比較するタグ比較行程と、前記タグ比較行程の比較結果に基づいてタグが一致した
場合にのみ、前記認識されたタグによって予約された文
字情報を合成音の生成対象から除外して合成音を生成す
る行程と、を有することを特徴とする音声合成方法。
【請求項２】文字情報と前記文字情報を予約するため
のタグとを有する文書記述言語で記述された伝送情報に
含まれる文字情報に対応する合成音を生成する音声合成
方法であって、前記文字情報中のタグを認識するタグ認識行程と、前記タグ認識行程で認識されたタグと予め設定された所
定タグとを比較するタグ比較行程と、前記タグ比較行程の比較結果に基づいてタグが一致した
場合にのみ、前記認識されたタグによって予約された文
字情報を合成音の生成対象として合成音を生成する行程
と、を有することを特徴とする音声合成方法。
【請求項３】前記タグ比較行程の比較においてタグが
一致した場合にのみ、文字情報に対応する合成音の生成
の開始及び終了の少なくとも一方を行う行程を有するこ
とを特徴とする、請求項１又は請求項２に記載の音声合
成方法。
【請求項４】前記タグ認識行程で認識されたタグによ
る予約文字情報の内容を認識する予約文字情報認識行程
と、前記予約文字情報認識行程で認識された予約文字情報の
内容と予め設定された所定文字情報の内容とを比較する
文字情報比較行程と、前記文字情報比較行程の比較において前記予約及び所定
文字情報の内容が互いに一致した場合は、前記予約文字
情報に対応する合成音の生成の開始及び終了の少なくと
も一方を行う行程と、を有することを特徴とする、請求
項１乃至請求項３の何れか１に記載の音声合成方法。
【請求項５】前記予約文字情報認識行程で認識された
予約文字情報と、予め設定された複数の文字情報とを予
め設定された所定の論理条件に基づいて比較する論理条
件比較行程と、前記論理条件比較行程の比較において前記所定の論理条
件を満足した場合は、合成音の生成の開始及び終了の少
なくとも一方を行う行程と、を有することを特徴とする
請求項４に記載の音声合成方法。