JPH1078952A

JPH1078952A - 音声合成方法、音声合成装置、ハイパーテキストの制御方法及び制御装置

Info

Publication number: JPH1078952A
Application number: JP8199319A
Authority: JP
Inventors: Atsushi Noguchi; 敦史野口
Original assignee: International Business Machines Corp
Current assignee: International Business Machines Corp
Priority date: 1996-07-29
Filing date: 1996-07-29
Publication date: 1998-03-24
Also published as: KR980010743A; KR100287093B1; US5983184A

Abstract

(57)【要約】【課題】非視覚ユーザが自由かつ容易にハイパー・テ
キストをコントロールすることを可能にする。【解決手段】インターネット上のハイパー・テキスト
を、音声合成プログラムが読み上げる。システムは、こ
の読み上げと同期して、現在読み上げが行われている場
所に最も関連のあるリンク・キーワードにフォーカスの
当てられる。「リンク先へのジャンプ」を指示する入力
（音声入力またはキー入力）を行えば、フォーカスの当
たっているリンク・キーワードのリンク先にジャンブす
ることが可能となる。リンク・キーワードのみの読み上
げ等を指示することもできる。

Description

【発明の詳細な説明】

【０００１】

【産業上の利用分野】この発明は、音声合成に関するも
のであり、より詳しくは、ハイパーテキスト形式の文章
に含まれる文字列を検出し、その文字列の種類に従った
音声属性で音声合成を行う方法と、読み上げの対象とな
る文章に含まれる文字列の種類を判別し、その文字列の
種類に従って、音声合成を制御する方法に関する。

【０００２】

【従来の技術】従来の音声合成プログラム(あるいは音
声合成装置)は、テキスト・ファイルか、その音声合成
プログラムが処理可能な形で記述された音声属性をもつ
テキスト・ファイルを入力として、読み上げを行ってい
る。

【０００３】例えば、音声合成プログラム「ProTALKER/
2」(「ProTALKER」はIBM社の商標)の場合、テキストに
「テキスト埋込みコマンド／音声属性」と呼ばれる文字
列を埋込むことによって、読み上げに際しての音声属性
のコントロールを行っている。

【０００４】この埋込みコマンドの埋め込まれたテキス
トが、「最初は普通の読み方をします。［*S9］ここか
ら速くなります。［*P9］声が高くなりました。［*S0P
0］声が低くゆっくりになりました。［*Y0］ロボット喋
りです。［*S=P=Y=］普通の読みかたに戻りました。［*
F1］こちらは、電話番号案内です。［*M1］田中幸一さ
んの電話番号を調べてください。」であるとする。

【０００５】このテキストを受領した音声合成装置
は、"［*"を音声属性を指示する埋込みコマンドの先頭
として認識し、"］"を埋込みコマンドの終了と認識す
る。このため、上記テキストは、最初、音声コマンドの
指定がないため、デフォルトで読み上げを行い、次に、
［*S9］という埋込みコマンドを検出し、読み上げの速
度を9に設定する。次に、［*P9］を検出することによ
り、高さを9に設定し、［*S0P0］の検出により、速度を
0、高さを0に設定する。さらに、［*Y0］の検出によっ
て、抑揚を0に、また、［*S=P=Y=］の検出によって、速
度、高さ、抑揚を通常に再設定する。その後、［*F1］
の検出によって、女性の声によって読み上げを行い、
［*M1］の検出によって男性の声により読み上げを行う
といった形式で読み上げが行われる。

【０００６】なお、この埋込みコマンドは、［*＜属性
記号1＞＜設定値1＞＜属性記号2＞＜設定値2＞・・・
・］といった形式で、１つのコマンドの中に複数の属性
の変更を入れることも可能である。

【０００７】各音声属性を指示する埋込みコマンドの内
容は以下の通りである。

【０００８】●発話速度（スピード）の変更コマンドの置かれた時点からのスピードを変更する。設定記号 S 設定値 0（遅い）〜 9（速い）の10段
階。（通常は5)

【０００９】●声の高さ（ピッチ）の変更コマンドの置かれた時点からのピッチを変更する。設定記号 P 設定値 0（低い）〜 9（高い）の10段
階。（通常は2）

【００１０】●声の大きさ（ゲイン）の変更コマンドの置かれた時点からのゲインを変更する。設定記号 G 設定値 0（小）〜 9（大）の10段階。
（通常は9）

【００１１】●抑揚の大きさの変更コマンドの置かれた時点からの抑揚の大きさを設定す
る。設定記号 Y 設定値 0（抑揚なし）〜 9（抑揚最
大）の10段階。

【００１２】●男性の声コマンドの置かれた時点からの男声に切り替える。設定記号 M 設定値 1

【００１３】●女性の声コマンドの置かれた時点からの女声に切り替える。設定記号 F 設定値 1

【００１４】従来技術においては、このようなテキスト
属性情報を持つデータ・ファイルをテキスト属性（スタ
イル、フォント、下線等）を含むテキスト・ファイルか
ら合成する技術が存在する。

【００１５】例えば、特開平６−２２３０７０号公報に
は、入力されたテキスト・ファイルのテキスト属性（ス
タイル、フォント、下線等）をテキスト・音声属性変換
テーブルを使用して、音声属性（速度、音量等）に変換
し、音声属性の埋込みコマンドを有するスピーチ・コマ
ンドを作成する方法が開示されている。

【００１６】また、特開平６−４４２４７号公報には、
入力されたテキスト・ファイルのテキスト制御信号を制
御信号・音声合成信号変換テーブルを参照して、音声属
性を有する音声合成制御信号に変換する方法が開示され
ている。

【００１７】これらの技術によって、テキスト属性の違
いを音声属性の違いとして、読み上げさせることが可能
となり、一般的にフォントや色の違いとして画面に表示
されるテキスト属性の違いを、音声合成プログラム(文
章読み上げプログラム)を通して、音声属性の違い(音声
の大小、高低、抑揚、速度の違いなど)として、読み分
けさせることが可能となる。

【００１８】この一方、視覚障害者等、表示画面に表示
された視覚情報を使用せず、操作を行う者（以下「非視
覚ユーザ」という）も、Ｗｅｂブラウザ等のハイパー・
テキストを扱うプログラムを使用したいという要求が存
在する。

【００１９】しかし、従来のハイパー・テキストを扱う
プログラム(オンライン・ヘルプのビューワーや、Ｗｅ
ｂブラウザ)は、すべてテキスト・データは画面に表示
するのみで、テキスト・データを音声で読み上げるプロ
グラムはない。

【００２０】また、インターネットのＷＷＷ（Ｗｏｒｌ
ｄＷｉｄｅＷｅｂ）のＨＴＭＬは音声データも扱う
ことができるが、あらかじめ音声データを用意しておく
必要がある。音声データの形式も、ＡＵ、ＷＡＶ、ＲＡ
など数種類があり、それぞれに応じて、ソフトウェアや
ハードウェアを用意しなけらばならない。この音声デー
タは、テキスト・データよりもサイズが大きくなる傾向
があり、転送時間を余計に必要とするという不利益も存
在する。さらに、音声データ自体、あまり普及している
とは言えず、ＨＴＭＬの大半のデータが文章データとし
て提供されている。これを音声として読み上げること
で、ＷＷＷのデータを音声を通して入手できれば便利で
ある。

【００２１】また、単に現在表示画面に表示されている
情報の読み上げを行うのみではなく、この読み上げが行
われている音声情報に従って、非視覚ユーザが容易にか
つ自由にネットサーフィンを行いたいという要求も存在
する。

【００２２】これに関連して、特開昭６３−２３１４９
３号公報には、入力文の各見出しの先頭に見出しコード
を付設入力しておき、音声合成において早送り、逆戻し
する際、見出し項目の内容のみを合成する方法が開示さ
れている。

【００２３】また、特開平３−２３６０９９号公報に
は、複数フレ−ズの解析結果を格納しておき、文中の読
み上げ位置を指定する制御コマンドに応じて解析結果を
合成手段に出力して音声を出力させることにより、読上
げ位置を的確に表示可能にする方法が開示されている。

【００２４】

【発明が解決しようとする課題】本発明の目的は、テキ
ストに含まれる一定の特徴を有する文字列の種類を選別
し、その種類に対応したコントロールを行いながら音声
合成を行うシステムを提供することにある。

【００２５】本発明の更に他の目的は、非視覚ユーザが
自由かつ容易にハイパーテキストをコントロールするこ
とを可能にするシステムを提供することにある。

【００２６】

【課題を解決するための手段】上記の「テキスト属性／
音声属性変換」の方法を応用することで、テキストに含
まれる特殊文字列を識別可能に読み上げさせることが可
能となる。本発明の一態様によれば、インターネットの
ｗｗｗ等のハイパー・テキストを、音声合成プログラム
が読み上げている位置をシステムが認識する。この文章
の読み上げと同期して、現在読み上げが行われている場
所に最も関連のあるリンク・キーワードにフォーカスの
当てられる。

【００２７】あるキーワードを読み始めてから次のキー
ワードを読み始めるまでの間は、フォーカスがそのキー
ワードに当たっているので、この間に「リンク先へのジ
ャンプ」を指示する入力を行えば、リンク・キーワード
の指定が可能となり、そのキーワードのリンク先にジャ
ンブすることが可能となる。

【００２８】リンク属性を持つ単語(リンク・キーワー
ド)は、音声属性の違いとして読み分けさせることや、
リンクキーワドを示す音(音声を含む)を挿入することに
よって、他の文字列と識別が可能となるので、画面を見
ずに音声を聞きながら、簡単な操作で、リンク先へジャ
ンプし、ハイパー・テキストの読み上げを続行させるこ
とが可能となる。この技術により、視覚障害者などの非
視覚ユーザも容易にインターネットを利用することが可
能となる。

【００２９】本発明の一態様においては、（ａ）リンク
・キーワードを特定する情報とリンク・キーワードが存
在するハイパーテキスト中の位置情報を管理する文字列
リストを作成する段階と、（ｂ）リンク・キーワードに
音声属性を関連付け、ハイパーテキストを変換すること
により音声合成入力情報を作成する段階と、（ｃ）音声
合成入力情報に基づいて音声合成を行う段階と、（ｄ）
音声合成を行っている位置に対応するハイパーテキスト
中の位置に関連した音声合成ポインタ情報を取得する段
階と、（ｅ）音声合成ポインタ情報に対応するハイパー
テキスト中の位置情報を文字列リストから探索すること
により対応するリンク・キーワードを特定する段階と、
（ｆ）リンク先への移動を指示するユーザ入力を検出す
る段階と、（ｇ）ユーザ入力の検出に応答して、特定さ
れたリンク・キーワードに対応するリンク先情報に基づ
いてリンク先にアクセスする段階と、を含む各々がリン
ク先情報に対応付けられている複数のリンク・キーワー
ドを含むハイパーテキストを制御する方法が提供され
る。

【００３０】ここで「リンク・キーワードを特定する情
報」とは、図６に示すポインタ３０１のように、そのハ
イパーテキストにおいて何番目に存在する文字列である
かを示す情報、図６の位置情報３０３のように特殊文字
列の位置情報、特殊文字列の名称等特殊文字列を特定す
るに足る情報であればよい。また、「ハイパーテキス
ト」は、好適には、ハイパーテキストに含まれる１テキ
ストであるが、一定の深さを有するハイパーテキスト集
合で有ってもよい。「リンク・キーワードが存在するハ
イパーテキスト中の位置情報」は、先頭から何文字目、
先頭から何ブロック目、何番目のキーワード等、リンク
・キーワードの位置を認識可能な情報であればよい。
「文字列リスト」は、本発明の好適な実施例において示
したテーブルの形式である必要はなく、システムがリン
ク・キーワードを特定でき、リンク・キーワードの位置
を認識できればテーブル形式でなくともよい。

【００３１】「音声合成入力情報」は、本発明の好適な
実施例における埋込みコマンド・ファイルに対応する概
念であるが、音声合成を行うに適した形式のファイルで
あれば、何等音声属性情報を埋め込んでいないものも含
む。「音声合成を行っている位置に対応するハイパーテ
キスト中の位置」とは、現在音声合成を行っている正確
な位置を示す情報である必要はなく、或る程度の誤差の
ある情報であってもよい。「音声合成を行っている位置
に対応するハイパーテキスト中の位置に関連した音声合
成ポインタ情報」とは、埋込みコマンドに埋め込まれた
位置情報から取得することも可能であるが、音声合成の
処理（中間処理を含む）を行った文字数等の情報量を計
測し、音声合成ポインタを導出することも可能である。

【００３２】「対応するリンク・キーワードを特定す
る」とは、本発明の好適な実施例における現在音声合成
を行っている直前のリンク・キーワード（存在しない場
合は、最先のリンク・キーワード）に対応する概念であ
るが、現在音声合成を行っている直後のリンク・キーワ
ード（存在しない場合は、最後のリンク・キーワード）
といったように設計段階で変更可能な事項である。「リ
ンク先への移動を指示するユーザ入力」とは、予め割り
当てられたキーボード上のキーを押すことや、ポインテ
ィングデバイスによって、ボタンアイコンをクリックす
ることや、プルダウンメニューから選択することによる
入力のみならず、ユーザの音声による入力等を含むもの
である。「リンク先情報に基づいてリンク先にアクセス
する」とは、ＨＴＭＬ解析部がデータ入出力制御部に送
出するコマンドの形式でデータ入出力制御部へリンクの
指示を与えることや、ユーザ入力部が、リンク・キーワ
ードを指定したことを示す情報の形式で、ＨＴＭＬ解析
部にリンク先へのアクセスを指示することもできる。

【００３３】本発明の他の一態様においては、（ａ）Ｈ
ＴＭＬファイルをＷｅｂサーバから受領する段階と、
（ｂ）リンク・キーワードを特定する情報とリンク・キ
ーワードが存在するＨＴＭＬファイル中の位置情報とリ
ンク先情報を管理する文字列リストを作成する段階と、
（ｃ）ＨＴＭＬファイルに含まれるリンク・キーワード
の開始タグと終了タグを音声属性情報に変換し、リンク
・キーワードが存在するＨＴＭＬファイル中の位置情報
とともに音声属性埋込みコマンドとしてリンク・キーワ
ードに関連付けることにより、音声属性埋込みコマンド
・ファイルを作成する段階と、（ｄ）音声属性埋込みコ
マンド・ファイルに基づいて音声合成を行う段階と、
（ｅ）音声合成を行っている位置に対応するＨＴＭＬフ
ァイル中の位置に関連した音声合成ポインタ情報をリン
ク・キーワードに関連付けられた位置情報に基づいて取
得する段階と、（ｆ）音声合成ポインタ情報に対応する
ＨＴＭＬファイル中の位置情報を文字列リストから探索
することにより対応するリンク先情報を特定する段階
と、（ｇ）リンク先への移動を指示するユーザ入力を検
出する段階と、（ｈ）ユーザ入力の検出に応答して、特
定されたリンク先情報に基づいてリンク先にアクセスす
る段階と、を含む各々がリンク先情報に対応付けられて
いる複数のリンク・キーワードを含むＷｅｂサーバから
受領したＨＴＭＬファイルを制御する方法が提供され
る。

【００３４】本発明の他の一態様においては、（ａ）複
数の特殊文字列を特定する情報と複数の特殊文字列が存
在する文章中の位置情報を管理する文字列リストを作成
する段階と、（ｂ）複数の特殊文字列の各々に音声属性
を関連付け、文章を変換することにより音声合成入力情
報を作成する段階と、（ｃ）音声合成入力情報に基づい
て音声合成を行う段階と、（ｄ）音声合成を行っている
位置に対応する文章中の位置に関連した音声合成ポイン
タ情報を取得する段階と、（ｅ）音声合成ポインタ情報
に対応する文章中の位置情報を文字列リストから探索す
ることにより、音声合成を行っている位置に対応する特
殊文字列を特定する段階と、（ｆ）音声合成位置の変更
を指示するユーザ入力を検出する段階と、（ｇ）ユーザ
入力の検出に応答して、文字列リストから音声合成を行
っている位置に対応する特定文字列に隣接する特殊文字
列の位置情報を取得する段階と、（ｈ）隣接する特殊文
字列の位置情報に対応した位置の音声合成を行う段階
と、を含む複数の特殊文字列を含む文章の音声合成を行
う方法が提供される。

【００３５】本発明の他の一態様においては、（ａ）リ
ンク・キーワードを特定する情報とリンク・キーワード
が存在するハイパーテキスト中の位置情報を管理する文
字列リストと、（ｂ）リンク・キーワードに音声属性を
関連付け、ハイパーテキストを変換することにより音声
合成入力情報を作成する手段と、（ｃ）音声合成入力情
報に基づいて音声合成を行う手段と、（ｄ）音声合成を
行っている位置に対応するハイパーテキスト中の位置に
関連した音声合成ポインタ情報を取得する手段と、
（ｅ）音声合成ポインタ情報に対応するハイパーテキス
ト中の位置情報を文字列リストから探索することにより
対応するリンク・キーワードを特定する手段と、（ｆ）
リンク先への移動を指示するユーザ入力を検出する手段
と、（ｇ）ユーザ入力の検出に応答して、特定されたリ
ンク・キーワードに対応するリンク先情報に基づいてリ
ンク先にアクセスする手段と、を含む各々がリンク先情
報に対応付けられている複数のリンク・キーワードを含
むハイパーテキストを制御する装置が提供される。

【００３６】ここで、「リンク・キーワードに音声属性
を関連付け」とは、本発明の好適な実施例における音声
合成埋込みコマンドに対応するものであるが、実施例に
おいて説明した文字列の挿入等を含む概念である。

【００３７】本発明の他の一態様においては、（ａ）Ｈ
ＴＭＬファイルをＷｅｂサーバから受領する通信制御部
と、（ｂ）リンク・キーワードを特定する情報とリンク
・キーワードが存在するＨＴＭＬファイル中の位置情報
とリンク先情報を管理する文字列リストを作成する手段
と、（ｃ）ＨＴＭＬファイルに含まれるリンク・キーワ
ードの開始タグと終了タグを音声属性情報に変換し、リ
ンク・キーワードが存在するＨＴＭＬファイル中の位置
情報とともに音声属性埋込みコマンドとしてリンク・キ
ーワードに関連付けることにより、音声属性埋込みコマ
ンド・ファイルを作成する手段と、（ｄ）音声属性埋込
みコマンド・ファイルに基づいて音声合成を行う音声合
成部と、（ｅ）音声合成を行っている位置に対応するＨ
ＴＭＬファイル中の位置に関連した音声合成ポインタ情
報をリンク・キーワードに関連付けられた位置情報に基
づいて取得する手段と、（ｆ）音声合成ポインタ情報に
対応するＨＴＭＬファイル中の位置情報を文字列リスト
から探索することにより対応するリンク先情報を特定す
る手段と、（ｇ）リンク先への移動を指示するユーザ入
力を検出するユーザ入力部と、（ｈ）ユーザ入力の検出
に応答して、特定されたリンク先情報に基づいてリンク
先にアクセスする手段と、を含む各々がリンク先情報に
対応付けられている複数のリンク・キーワードを含むＷ
ｅｂサーバから受領したＨＴＭＬファイルを制御する装
置が提供される。

【００３８】本発明の他の一態様においては、（ａ）記
複数の特殊文字列を特定する情報と複数の特殊文字列が
存在する文章中の位置情報を管理する文字列リストを作
成する手段と、（ｂ）複数の特殊文字列の各々に音声属
性を関連付け、文章を変換することにより音声合成入力
情報を作成する手段と、（ｃ）音声合成入力情報に基づ
いて音声合成を行う手段と、（ｄ）音声合成を行ってい
る位置に対応する文章中の位置に関連した音声合成ポイ
ンタ情報を取得する手段と、（ｅ）音声合成ポインタ情
報に対応する文章中の位置情報を文字列リストから探索
することにより、音声合成を行っている位置に対応する
特殊文字列を特定する手段と、（ｆ）音声合成位置の変
更を指示するユーザ入力を検出する手段と、（ｇ）ユー
ザ入力の検出に応答して、文字列リストから音声合成を
行っている位置に対応する特定文字列に隣接する特殊文
字列の位置情報を取得する手段と、（ｈ）隣接する特殊
文字列の位置情報に対応した位置の音声合成を行う手段
と、を含む複数の特殊文字列を含む文章の音声合成を行
う装置が提供される。

【００３９】本発明の他の一態様においては、（ａ）リ
ンク・キーワードを特定する情報とリンク・キーワード
が存在するハイパーテキスト中の位置情報を管理する文
字列リストを作成することをデータ処理システムに指示
するプログラムコード手段と、（ｂ）リンク・キーワー
ドに音声属性を関連付け、ハイパーテキストを変換する
ことにより音声合成入力情報を作成することをデータ処
理システムに指示するプログラムコード手段と、（ｃ）
音声合成入力情報に基づいて音声合成を行うことをデー
タ処理システムに指示するプログラムコード手段と、
（ｄ）音声合成を行っている位置に対応するハイパーテ
キスト中の位置に関連した音声合成ポインタ情報を取得
することをデータ処理システムに指示するプログラムコ
ード手段と、（ｅ）音声合成ポインタ情報に対応するハ
イパーテキスト中の位置情報を記文字列リストから探索
することにより対応するリンク・キーワードを特定する
ことをデータ処理システムに指示するプログラムコード
手段と、（ｆ）リンク先への移動を指示するユーザ入力
を検出することをデータ処理システムに指示するプログ
ラムコード手段と、（ｇ）ユーザ入力の検出に応答し
て、特定されたリンク・キーワードに対応するリンク先
情報に基づいてリンク先にアクセスすることをデータ処
理システムに指示するプログラムコード手段と、を含む
データ処理システムが管理する記憶域において管理され
ている、各々がリンク先情報に対応付けられている複数
のリンク・キーワードを含むハイパーテキストを制御す
るためのプログラムを格納する記憶媒体が提供される。

【００４０】本発明の他の一態様においては、（ａ）Ｈ
ＴＭＬファイルをＷｅｂサーバから受領することをデー
タ処理システムに指示するプログラムコード手段と、
（ｂ）リンク・キーワードを特定する情報とリンク・キ
ーワードが存在するＨＴＭＬファイル中の位置情報とリ
ンク先情報を管理する文字列リストを作成することをデ
ータ処理システムに指示するプログラムコード手段と、
（ｃ）ＨＴＭＬファイルに含まれるリンク・キーワード
の開始タグと終了タグを音声属性情報に変換し、リンク
・キーワードが存在するＨＴＭＬファイル中の位置情報
とともに音声属性埋込みコマンドとしてリンク・キーワ
ードに関連付けることにより、音声属性埋込みコマンド
・ファイルを作成することをデータ処理システムに指示
するプログラムコード手段と、（ｄ）音声属性埋込みコ
マンド・ファイルに基づいて音声合成を行うことをデー
タ処理システムに指示するプログラムコード手段と、
（ｅ）音声合成を行っている位置に対応するＨＴＭＬフ
ァイル中の位置に関連した音声合成ポインタ情報をリン
ク・キーワードに関連付けられた位置情報に基づいて取
得することをデータ処理システムに指示するプログラム
コード手段と、（ｆ）音声合成ポインタ情報に対応する
記ＨＴＭＬファイル中の位置情報を文字列リストから探
索することにより対応するリンク先情報を特定すること
をデータ処理システムに指示するプログラムコード手段
と、（ｇ）リンク先への移動を指示するユーザ入力を検
出することをデータ処理システムに指示するプログラム
コード手段と、（ｈ）ユーザ入力の検出に応答して、特
定されたリンク先情報に基づいてリンク先にアクセスす
ることを記データ処理システムに指示するプログラムコ
ード手段と、を含むデータ処理システムが管理する記憶
域において管理されている、各々がリンク先情報に対応
付けられている複数のリンク・キーワードを含むＷｅｂ
サーバから受領したＨＴＭＬファイルを制御するための
プログラムを格納する記憶媒体が提供される。

【００４１】本発明の他の一態様においては、（ａ）複
数の特殊文字列を特定する情報と複数の特殊文字列が存
在する文章中の位置情報を管理する文字列リストを作成
することをデータ処理システムに指示するプログラムコ
ード手段と、（ｂ）複数の特殊文字列の各々に音声属性
を関連付け、文章を変換することにより音声合成入力情
報を作成することをデータ処理システムに指示するプロ
グラムコード手段と、（ｃ）音声合成入力情報に基づい
て音声合成を行うことをデータ処理システムに指示する
プログラムコード手段と、（ｄ）音声合成を行っている
位置に対応する文章中の位置に関連した音声合成ポイン
タ情報を取得することを記データ処理システムに指示す
るプログラムコード手段と、（ｅ）音声合成ポインタ情
報に対応する文章中の位置情報を文字列リストから探索
することにより、音声合成を行っている位置に対応する
特殊文字列を特定することをデータ処理システムに指示
するプログラムコード手段と、（ｆ）音声合成位置の変
更を指示するユーザ入力を検出することをデータ処理シ
ステムに指示するプログラムコード手段と、（ｇ）ユー
ザ入力の検出に応答して、文字列リストから音声合成を
行っている位置に対応する特定文字列に隣接する特殊文
字列の位置情報を取得することをデータ処理システムに
指示するプログラムコード手段と、（ｈ）隣接する特殊
文字列の位置情報に対応した位置の音声合成を行うこと
をデータ処理システムに指示するプログラムコード手段
と、を含むデータ処理システムが管理する記憶域におい
て管理されている、複数の特殊文字列を含む文章の音声
合成を行うためのプログラムを格納する記憶媒体が提供
される。

【００４２】

【実施例】以下、図面を参照して本発明の実施例を説明
する。図１を参照すると、本発明の音声合成システムを
実施するためのハードウェア構成の概観図が示されてい
る。音声合成システム１００は、中央処理装置（ＣＰ
Ｕ）１とメモリ４とを含んでいる。ＣＰＵ１とメモリ４
は、バス２を介して、補助記憶装置としてのハードディ
スク装置１３とを接続してある。フロッピーディスク装
置（またはＭＯ、ＣＤ−ＲＯＭ等の駆動装置）２０はフ
ロッピーディスクコントローラ１９を介してバス２へ接
続されている。

【００４３】フロッピーディスク装置（またはＭＯ、Ｃ
Ｄ−ＲＯＭ等の駆動装置）２０には、フロッピーディス
ク（またはＭＯ、ＣＤ−ＲＯＭ等の媒体）が挿入され、
このフロッピーディスク等やハードディスク装置１３、
ＲＯＭ１４には、オペレーティングシステムと協働して
ＣＰＵ等に命令を与え、本発明を実施するためのコンピ
ュータ・プログラムのコードを記録することができ、メ
モリ４にロードされることによって実行される。このコ
ンピュータ・プログラムのコードは圧縮し、または、複
数に分割して、複数の媒体に記録することもできる。

【００４４】音声合成システム１００は更に、ユーザ・
インターフェース・ハードウェアを備えたシステムとす
ることができ、ユーザ・インターフェース・ハードウェ
アとしては、例えば、入力をするためのポインティング
・デバイス（マウス、ジョイスティック等）７またはキ
ーボード６や、視覚データをユーザに提示するためのデ
ィスプレイ１２がある。また、パラレルポート１６を介
してプリンタを接続することや、シリアルポート１５を
介してモデムを接続することが可能であり、シリアルポ
ート１５およびモデムまたは通信アダプタ１８を介して
他のコンピュータ等と通信を行うことが可能である。

【００４５】スピーカ２３は、オーディオ・コントロー
ラ２１によってＤ／Ａ（デジタル／アナログ変換）変換
しされた音声信号を、アンプ２２を介して受領し、音声
として出力する。また、オーディオ・コントローラ２１
は、マイクロフォン２４から受領した音声情報をＡ／Ｄ
（アナログ／デジタル）変換し、システム外部の音声情
報をシステムにとり込むことを可能にしている。

【００４６】このように、本発明は、通常のパーソナル
コンピュータ（ＰＣ）、やワークステーションやこれら
の組合せによって実施可能であることを容易に理解でき
るであろう。ただし、これらの構成要素は例示であり、
その全ての構成成要素が本発明の必須の構成要素となる
わけではない。特に、本発明は、非視覚ユーザをサポー
トするための発明であるため、ユーザに対し視覚的表示
を行うために必要なＶＧＡ８、ＶＲＡＭ９、ＤＡＣ／Ｌ
ＣＤＣ１０、表示装置１１、ＣＲＴ１２等の構成要素は
必須ではない。また、後述するように音声によってシス
テムに対し指示を与える入力を与えることも可能である
ため、キーボード６、マウス７、キーボード／マウスコ
ントローラ５も必須の構成要素ではない。

【００４７】オペレーティング・システムとしては、Ｗ
ｉｎｄｏｗｓ（マイクロソフトの商標）、ＯＳ／２（Ｉ
ＢＭの商標）、ＡＩＸ（ＩＢＭの商標）上のＸ−ＷＩＮ
ＤＯＷシステム（ＭＩＴの商標）などの、標準でＧＵＩ
マルチウインドウ環境をサポートするものが望ましい
が、本発明は、ＰＣ−ＤＯＳ（ＩＢＭの商標）、ＭＳ−
ＤＯＳ（マイクロソフトの登録商標）などのキャラクタ
・ベース環境でも実現可能であり、特定のオペレーティ
ング・システム環境に限定されるものではない。

【００４８】また、図１は、スタンド・アロン環境のシ
ステムを示しているが、クライアント／サーバ・システ
ムとして本発明を実現し、クライアント・マシンは、サ
ーバ・マシンに対して、イーサネット、トークン・リン
グなどでＬＡＮ接続し、クライアント・マシン側には、
後述するユーザ入力部と、サーバ・マシン側から音声デ
ータを受領し、それを再生するための合成器及びスピー
カのみを配置し、その他の機能をサーバ・マシン側に配
置してもよい。このように、サーバ・マシン側とクライ
アント・マシン側にどのような機能を配置するかは設計
に際し自由に変更できる事項であり、複数のマシンを組
合せ、それらにどのような機能を配分し、実施するか等
の種々の変更は本発明の思想に包含される概念である。

【００４９】Ｂ．システム構成次に、図２のブロック図を参照して、本発明のシステム
構成について説明する。本発明の好適な実施例において
は、大別して、通信制御部１１０、Ｗｅｂブラウザ部１
２０、及び音声合成部１５０によって構成される。これ
らの構成部分は、夫々別々に図１に示すハードウエア構
成によって実現することも、共通のハードウエアによっ
て実現することもできる。

【００５０】この通信制御部１１０は、Ｗｅｂサーバ等
の他のコンピュータとの通信を制御する。この詳しい機
能については後述する。

【００５１】Ｗｅｂブラウザ部１２０は、データ入出力
制御部１２１、ＨＴＭＬ関連ファイル格納部１２３、Ｈ
ＴＭＬ解析部１２５、ユーザ入力部１２７、フォーカス
制御部１２９、文字列リスト１３１、表示部１３３及び
変換表１３５、及びフォーカス・ポインタ１３９によっ
て構成されている。

【００５２】この入出力制御部１２１は、ＵＲＬを指定
する情報を基にＷｅｂサーバ６０にアクセスし、Ｗｅｂ
サーバ６０からＨＴＭＬ(Hyper Text Markup Languae)
ファイルを受領することを通信制御部１１０に指示す
る。

【００５３】ＨＴＭＬ関連ファイル格納部１２３は、通
信制御部１１０、データ入出力制御部１２１によって受
領されたＨＴＭＬファイルや、画像ファイル等のＨＴＭ
Ｌ関連ファイルを格納する。ＨＴＭＬ解析部１２５は、
ＨＴＭＬファイルを解析し、さらに受領すべきファイル
が存在するか否かの判断や、文字列リスト１３１や、埋
込みコマンド・ファイル１４１の作成を行う。

【００５４】フォーカス制御部１２９は、音声合成部１
５０から現在読み上げが行われている位置情報（音声ポ
インタ情報１７１）や、文字列リスト１３１の情報等を
受領し、現在フォーカスを当てるべき文字列を特定す
る。表示部１３３は、ＨＴＭＬファイルの内容や、現在
のフォーカスの当たってる文字列の表示等を行う。変換
表１３５は、ＨＴＭＬファイルのキーワードを読み上げ
に際しての音声属性を指示する埋込みコマンドに変換す
るためのテーブルである。

【００５５】この一方、音声合成部１５０は、音声合成
制御部１５１、言語解析部１５３、文法規則保持部１５
５、読みアクセント辞書１５７、読み付与部１５９、ア
クセント付与部１６１、パラメータ生成部１６３、音声
合成部１６５、音声発生部１６７、音声合成ポインタ格
納部１６９、音声ファイル格納部１７１及び音声合成ジ
ャンプ・ポインタ格納部１７３によって構成されてい
る。

【００５６】音声合成制御部１５１は、Ｗｅｂブラウザ
部１２０から渡された埋め込みコマンドを含む文章（埋
込みコマンド・ファイル）を言語解析部１５３に渡す。
言語解析部１５３は、音声合成制御部１５１から渡され
た文字列を、読み・アクセント辞書１５７及び文法規則
保持部１５５に格納されている文法規則を参照し、形態
素解析を行い、入力された文章を適切な形態素単位に切
り分ける。

【００５７】文法規則格納部１５５は、言語解析部１５
３における形態素解析に参照される文法規則を格納す
る。読み・アクセント辞書１５７は、漢字かな混じり文
字列に対応する「品詞」、「読み」及び「アクセント」
を格納する。

【００５８】読み付与部１５９は、言語解析部１５３に
よって切り分けられた個々の形態素に対し、読み・アク
セント辞書１５７に格納された読み情報から、その形態
素の読みを決定する。アクセント付与部１６１は、言語
解析部１５３によって切り分けられた個々の形態素に対
し、読み・アクセント辞書１５７に格納されたアクセン
ト情報から、その形態素のアクセントを決定する。

【００５９】パラメータ生成部１６３は、読み付与部１
５９によって決定された読みと、アクセント付与部１６
１によって決定されたアクセントに応じて、現在指定さ
れている「速さ」「ピッチ」「音量」「抑揚」「性別」
等のパラメータで音声合成を行うための音声パラメータ
を生成する。ここで、「現在指示されているパラメー
タ」とは、現在音声合成を行っている文字列の前に音声
属性示す音声コマンドが埋め込まれている場合、その音
声属性を採用し、このような音声コマンドがない場合
は、システムに予め設定されているデフォルトの音声属
性値が採用されることを意味するものである。

【００６０】音声合成器１６５は、パラメータ生成部１
４３によって生成された音声パラメータに従って音声信
号を生成する。本発明の好適な実施例においては、図１
のオーディオ・コントローラによってＤ／Ａ（デジタル
／アナログ変換）変換等が行われることにより、実施さ
れる。音声発生部１６７は、音声合成器１４５によって
生成された音声信号に応じて音声を発生させる。本発明
の好適な実施例においては、図１のアンプ２２およびス
ピーカ２３によって実施される。

【００６１】以上図２に示す核機能ブロックを説明した
が、これらの機能ブロックは、論理的機能ブロックであ
り、各々１つのまとまりを持ったハードウエアやソフト
ウエアによって実現されることを意味するのではなく、
複合し、または共通したハードウエアやソフトウエアに
よって実現可能である。

【００６２】Ｃ．データ・フロー次に、「Ｂ．システム構成」において説明した各機能ブ
ロック間で、どのようにデータの受渡しが行われている
かを説明する。

【００６３】Ｃ１．ＨＴＭＬ関連ファイルの受領通信制御部１１０は、図３に示すようにＷｅｂサーバ６
０との通信を制御する。図３においては、まず、ユーザ
入力部１２７において入力されたＵＲＬを指定する情報
を入出力制御部１２１を介して受領し、この情報を基に
Ｗｅｂサーバ６０にアクセスし、Ｗｅｂサーバ６０から
ＨＴＭＬ(Hyper Text Markup Languae)ファイルを受領
する。

【００６４】通信制御部１１０によって受領されたＨＴ
ＭＬファイルは、ＨＴＭＬ関連ファイル格納部１２３に
格納される。ＨＴＭＬファイルは、さらにＨＴＭＬ解析
部１２５で解析される。ＨＴＭＬ解析部１２５では、Ｈ
ＴＭＬファイルを解析し、画像ファイル等、さらに受領
すべきファイルが存在するか否か判断し、さらに受領す
べきファイルが存在すると判断された場合は、受領すべ
きファイル名を特定し、データ入力制御部１２１にリク
エストする。データ入出力制御部１２１は、通信制御部
１１０を介して再び、Ｗｅｂサーバ６０にアクセスし、
Ｗｅｂサーバ６０からＨＴＭＬ関連ファイルを受領す
る。受領したＨＴＭＬ関連ファイルは、ＨＴＭＬ関連フ
ァイル格納部１２３に格納される。

【００６５】Ｃ２．文字列リストの作成図４は、本発明の好適な実施例において使用されるＨＴ
ＭＬファイルのサンプルである。本発明の好適な実施例
においては、このＨＴＭＬファイルを入力として、埋込
みコマンドを含む文章を作成する。図に示すように、テ
キスト形式のＨＴＭＬファイルは、<TITLE>, <H1>, <H2
>, <H3>, <H4>, <H5>, <H6>のタグを含んでいる。

【００６６】ＨＴＭＬファイルのサンプルを用いて埋込
みコマンド・ファイルと文字列リストの作成手順につい
て説明する。図４は、本発明の好適な実施例において、
ＨＴＭＬファイルのサンプルとして用いられるファイル
の内容を示す図である。図４のＨＴＭＬファイルは、表
示部１３３で加工が行われ、ユーザに対しては図５に示
すようなグラフィカルな映像として提供される。このＨ
ＴＭＬのタグは、開始タグ<XXXX>で始まり終了タグ</XX
XX>で終わっている。従って、システムは、各タグをそ
の種類を認識しつつ、その抽出を行うことができる。

【００６７】ポインタ３０１は有効なタグに対して割り
ふられる番号である。本発明の好適な実施例において
は、「<html><TITLE>」等の重複したタグが存在する場
合は、最後に存在するタグが有効となり、それ以前のタ
グは無視される。従って、例えば、「<H1>大和の写真</
H1><IMG SRC="yamato.gif"><H2>これがＨ２<I>イタリッ
ク</I>です」の入力の場合、「</H1><IMG SRC="yamato.
gif">」のタグが無視される。但し、例えば、「<A HREF
="THAT.HTM"><I>これもリンク・キーワード</I>です</A
>」のように、リンク・キーワードのタグと他のタグが
重複している場合は、リンク・キーワードのタグは無視
されず、文字列のないリストが形成される。

【００６８】位置情報３０３は、有効なタグに対応する
文字列の開始位置を示すものである。また、「<A HREF
="THAT.HTM">これも<I>リンク・キーワード</I>です</A
>」の入力の場合、「<A HREF="THAT.HTM">」を検出し、
リンク・キーワードに対応する文字列であることを示す
リンク・キーワードフラグを１に、リンク・キーワード
の先頭を示す文字列であることを示すリンク・キーワー
ドヘッドフラグを１にセットする。さらに、リンク・キ
ーワードの先頭を示す文字列に対応して、リンク先情報
がセットされる。本発明の好適な実施例においては、こ
の文字列リストはＨＴＭＬ解析部１２５により生成され
る。

【００６９】本発明の好適な実施例における文字列リス
トにおいては、図６に示す情報を管理しているが、これ
らの情報のすべてが本発明の必須の構成要素であるわけ
ではない。文字列リスト１３１は、リンク・キーワード
に対応する文字列が存在する位置情報を管理するもので
あり、リンク・キーワードに対応する文字列が存在する
位置情報が管理されているのであれば本発明は動作可能
になる。

【００７０】Ｃ３．埋込みコマンド・ファイルの作成次に、埋込みコマンド・ファイルの作成手順について説
明する。本発明の好適な実施例における埋込みコマンド
は、ＨＴＭＬ解析部１２５において、以下の２工程を経
て作成される。

【００７１】Ｃ３−１．一時ファイルの作成図４で示したＨＴＭＬファイルは、一度、次の表１に示
す形式に変換される。ＨＴＭＬファイルから、「<html
>」や「<IMG SRC="yamato.gif">」等の不要な情報が除
外され、有効な開始タグが、テキスト属性／音声属性変
換テーブル（変換表１４３）に基づいて、音声属性情報
に変換される。また、終了タグは、対応する開始タグで
変更された音声属性をデフォルト値に戻す埋込みコマン
ドに変換される。

【００７２】本発明の好適な実施例においては、変換表
１４３を用いて、変換を行っているが、変換表というテ
ーブルを用いずとも、変換プログラムの内部ロジックで
変換を行うことも可能である。

【００７３】表１に、テキスト属性／音声属性変換テー
ブルの一実施例を示す。

【表１】 (テキスト属性) (音声属性) デフォルト S5P2G8Y5 (速度5、高さ2、音量8、抑揚5) TITLE (タイトル) S5P1G8Y6 (速度5、高さ1、音量8、抑揚6) H1 (見出し1) S5P3G8Y5 (速度5、高さ3、音量8、抑揚5) H2 (見出し2) S5P4G8Y5 (速度5、高さ4、音量8、抑揚5) H3 (見出し3) S5P5G8Y5 (速度5、高さ5、音量8、抑揚5) H4 (見出し4) S5P6G8Y5 (速度5、高さ6、音量8、抑揚5) H5 (見出し5) S5P7G8Y5 (速度5、高さ7、音量8、抑揚5) H6 (見出し6) S5P8G8Y5 (速度5、高さ8、音量8、抑揚5) I (イタリック) S3 (速度3) B (ボールド) G9 (音量9) A HREF=(リンク・キーワード) S1 (速度1)

【００７４】このテーブルは、固定的なものであって
も、ユーザによって変更可能なものであってもよい。ま
た、同一のテキスト属性が連続して出現する場合は、同
じ音声属性は割りふられ、ユーザは判別不能（切り分け
不能）となることが考えられるので、同一のテキスト属
性が連続して出現する場合は、相異なる音声属性を交互
に割りふることや、切り分けを示すために一定時間の間
隔をもって読み上げを行ったり、何らかの音声を挿入す
ることも可能である。

【００７５】表２は、一時ファイルの一実施例である。
この一時ファイルは、図７のフローチャートの手順に従
って作成することができる。このファイルにおいては、
デフォルトの音声属性に対して変更が発生した音声属性
のみを埋込みコマンドとして挿入している。しかし、"
[*S5P1G8Y6]これがタイトル[*S5P1G8Y6]"のように表１
に示す音声コマンド全てを埋込みコマンドとすることも
可能である。

【００７６】

【表２】 [*P1Y6]これがタイトル[*P2Y5] [*P3]大和の写真[*P2] [*P4]これがＨ２[*Y8]イタリック[*Y5]です[*P2] [*P6]これがＨ４[*Y8]イタリック[*Y5]です[*P2] [*P8]これがＨ６[*Y8]イタリック[*Y5]です[*P2] [*S1]これがリンク・キーワードです[*S5] これはリンク・キーワードではありません [*S1]これも[*Y8]リンク・キーワード[*Y5]です[*S5] [*P7] [*S1]ＨＴＴＰ[*S5]はその名が示す通り、 [*S1]ＨＴＭＬ[*S5]の転送プロトコルであり、 [*S1]ＷＷＷ[*S5]で用いられる。 [*P2]

【００７７】Ｃ３−２．最終ファイル一時ファイルの連続する埋め込みコマンドを整理する。
この場合、同種の音声属性が存在する場合、最後の音声
属性を有効にする。また、連番を各埋め込みコマンドに
埋込み位置(順番)情報として、"D1","D2",...を挿入す
る。この埋込み位置情報は、図６の文字列ファイル１３
１のポインタに対応している。最終的に、表３に示す形
式で音声合成部に渡されることとなる。

【００７８】

【表３】 [*P1Y6D1]これがタイトル [*P3Y5D2]大和の写真 [*P4D3]これがＨ２ [*Y8D4]イタリック [*Y5D5]です [*P6D6]これがＨ４ [*Y8D7]イタリック [*Y5D8]です [*P8D9]これがＨ６ [*Y8D10]イタリック [*Y5D11]です [*S1P2D12]これがリンク・キーワードです [*S5D13]これはリンク・キーワードではありません [*S1D14]これも [*Y8D15]リンク・キーワード [*Y5D16]です [*S1P7D17]ＨＴＴＰ [*S5D18]はその名が示す通り、 [*S1D19]ＨＴＭＬ [*S5D20]の転送プロトコルであり、 [*S1D21]ＷＷＷ [*S5D22]で用いられる。 [*P2D23]

【００７９】但し、ここで示すような音声属性の種類を
示す記号と、その音声属性値をセットとして音声コマン
ドに埋め込む態様は、単なる一実施例にすぎず、音声合
成部１５０の音声合成制御部１５１がそれが音声コマン
ドであるということと、音声コマンドに埋め込まれた音
声属性の種類とその音声属性値の値およびそのような音
声属性の変更を行う文章中の個所を判断できる態様で埋
め込めばよい。例えば、音声コマンド中例えば最初の１
バイトは「性別」、２バイト目は「速さ」等音声属性値
の配置を固定的にし、音声合成制御部１５１は、その配
置に従って、音声属性の種類を判別してもよい。

【００８０】また、埋込みコマンドはそのコマンドに含
まれる音声属性を有効にする文字列の先頭に埋め込むこ
とが好ましいが、この音声属性を有効にする文字列の文
章中の位置が分かれば、その文字列の先頭に埋め込む必
要はない。この場合、音声コマンドに、その音声コマン
ドに埋め込まれた音声属性を有効にする文字列の文章中
の位置を埋め込んでおき、音声合成を行う際に、音声合
成制御部１５１は、音声コマンドに埋め込まれた音声属
性を有効にする文字列の文章中の位置にきたとき、その
音声コマンドの音声属性を有効にすることもできる。

【００８１】さらに、本発明の好適な実施例において
は、埋込みコマンドが埋め込まれた文章を２段階に分け
て作成しているが、一時ファイルの段階で、位置情報を
埋め込んでおき、これを最終ファイルとして使用するこ
とも、１つの変換工程でＨＴＭＬファイルを埋込みコマ
ンドの埋め込まれた最終ファイルに変換することも可能
である。また、文字列リストと埋込みコマンドの埋め込
まれた文章を同一の工程で作成することも可能である。

【００８２】Ｃ４−１．音声合成言語解析部１５３は、音声合成制御部１５１から渡され
た文字列を、読み・アクセント辞書１５７及び文法規則
保持部１５５に格納されている文法規則を参照し、形態
素解析を行い、入力された文章を適切な形態素単位に切
り分ける。この切り分けの単位は、埋込みコマンドが埋
め込まれた単位で行ってもよいが、本発明の好適な実施
例においては、埋込みコマンドを無視した文字列を用い
て形態素解析が行われる。

【００８３】従って、たとえば、「[*S1P7D17]ＨＴＴＰ
[*S5D18]はその名が示す通り、」の文字列が入力された
場合、「ＨＴＴＰ／ハ／ソノナガ／シメス／トオリ」で
はなく、「ＨＴＴＰワ／ソノナガ／シメス／トオリ」と
いった文字単位で音声合成がなされる。

【００８４】かかる場合、「[*S1P7D17]ＨＴＴＰ／[*S5
D18]ワ／ソノナガ／シメス／トオリ」といった形式でパ
ラメータ生成部１６３へデータを渡すことも「[*S1P7D1
7]ＨＴＴＰワ／[*S5D18]ソノナガ／シメス／トオリ」と
いった文字単位でデータを渡すことも種々設計段階で変
更することができる。

【００８５】本発明の好適な実施例においては、デフォ
ルトの音声属性の埋込みコマンドを、音声属性の変更の
終了後に挿入しているが、音声属性の変更のある文字列
にのみ埋込みコマンドを挿入し、音声属性の変更が終了
するが箇所に、音声属性の変更の終了を示す特殊な文字
または記号等を挿入し、パラメータ生成部１６３がこれ
を検出し、自動的にデフォルトの音声属性のパラメータ
を生成するようにしても本発明は実施可能である。かか
る場合、パラメータ生成部１６３は、読み付与部１５９
によって決定された読みと、アクセント付与部１６１に
よって決定されたアクセントに応じて、現在指定されて
いる「速さ」「ピッチ」「音量」「抑揚」「性別」等の
パラメータで音声合成を行うための音声パラメータを生
成する。ここで、「現在指示されているパラメータ」と
は、現在音声合成を行っている文字列の前に音声属性示
す音声コマンドが埋め込まれている場合、その音声属性
を採用し、このような音声コマンドがない場合は、シス
テムに予め設定されているデフォルトの音声属性値が採
用される。

【００８６】音声合成器１６５は、パラメータ生成部１
６３によって生成された音声パラメータに従って音声信
号を生成する。本発明の好適な実施例においては、図１
のオーディオ・コントローラによってＤ／Ａ（デジタル
／アナログ変換）変換等が行われることにより、実施さ
れる。音声発生部１６７は、音声合成器１６５によって
生成された音声信号に応じて音声を発生させる。本発明
の好適な実施例においては、図１のアンプ２２およびス
ピーカ２３によって実施される。このようにテキストに
含まれる特殊文字列の種類に応じた音声合成を行うた
め、ユーザは、視覚を用いず、聴覚のみでその特殊文字
列の種類を認識しつつ、テキストの内容を把握すること
ができる。

【００８７】本発明の好適な実施例においては、特殊文
字列の種類を音声属性の変更によって表現しているが、
音声属性の変更に因ずとも、特殊文字列の種類を非視覚
ユーザに認識させることは可能である。表４は、本発明
の埋込みコマンドの埋め込まれた文章の一実施例を示す
ものである。ここでは、実際のリンク・キーワードの直
前に「リンク・キーワード」という文字列を挿入するこ
とによって、リンク・キーワードの位置を非視覚ユーザ
に認識可能にしている。なお、この表おける「FM1」な
る音声属性コマンドは、現在男性の声によって読み上げ
が行われている場合、女性の声に変更し、現在女性の声
によって読み上げが行われている場合、男性の声に変更
することを指示するコマンドである。このコマンドによ
って、もともとＨＴＭＬファイルに存在する「リンク・
キーワード」という文字列なのか、挿入された「リンク
・キーワード」の文字列であるのか、両者を明確に区別
することができる。

【００８８】

【表４】 [*D1]これがタイトル [*D2]大和の写真 [*D3]これがＨ２ [*D4]イタリック [*D5]です [*D6]これがＨ４ [*D7]イタリック [*D8]です [*D9]これがＨ６ [*D10]イタリック [*D11]です [*S1FM1D12]リンク・キーワード [*D12]これがリンク・キーワードです [*S5FM1D13]これはリンク・キーワードではありません [*S1FM1D14]リンク・キーワード [*D14]これも [*D15]リンク・キーワード [*D16]です [*S1FM1D17]リンク・キーワード [*D17]ＨＴＴＰ [*S5FM1D18]はその名が示す通り、 [*S1FM1D19]リンク・キーワード [*D19]ＨＴＭＬ [*S5FM1D20]の転送プロトコルであり、 [*S1FM1D21]リンク・キーワード [*D21]ＷＷＷ [*S5FM1D22]で用いられる。

【００８９】Ｃ４−２．特殊文字列フォーカス同期機能本発明の好適な実施例においては、Ｗｅｂブラウザ部１
２０のフォーカス制御部１２９が、現在読み上げが行わ
れている箇所を知ることができる。具体的には、パラメ
ータ生成部１６３は、読み及びアクセントの付与され、
形態素単位に分割された音声情報ファイル１７１を管理
しており、その各形態素単位に前述の位置情報が関連付
けられている。パラメータ生成部１６３は先入れ先出し
方式で形態素単位の音声ファイルを合成器１６５に送出
する。この時パラメータ生成部１６３は、形態素単位の
音声ファイルに関連付けられた位置情報を音声合成ポイ
ンタ１６９として格納する。Ｗｅｂブラウザ部１２０の
フォーカス制御部１２９は、音声合成部１５０の音声合
成制御部１５１を介してこの音声合成ポインタの情報を
取得することができる。

【００９０】この一連の流れを前述の埋込みコマンド・
ファイルを用いて説明すると、例えば、"[*D17]ＨＴＴ
Ｐ[*S5D18]はその名が示す通り、"の文字列ブロックの
場合、読み付与部１５９及びアクセント付与部１６１に
おいて読み及びアクセントが付与された以下の音声情報
がパラメータ生成部１６３に渡される。

【００９１】"[*D17]ＨＴＴＰワ、[*S5D18]ソノナガ、
シメス、トオリ、"（アクセント記号は、ここでは省
略）

【００９２】パラメーター生成部１６３は、これに埋込
みコマンドの音声属性に従ったパラメータを設定したウ
エブ形式のファイルに変換し、その情報を音声ファイル
１７１に格納する。格納される音声ファイルは観念的に
以下のように表現できる。

【００９３】"[*D17]ＨＴＴＰワ、[*D18]ソノナガ、[*D
18]シメス、[*D18]トオリ、"

【００９４】ここで例えば、「ソノナガ、」を読むとき
パラメータ生成部１６３は、音声合成器１６５にこの音
声ファイルを渡すと同時に、音声合成ポインタ１６９の
内容を"D"の値（すなわち１８）を音声合成ポインター
１６９にセットする。なお、この位置情報は、形態素単
位で保持する必要はなく、また、"[*D17]ＨＴＴＰ[*D1
8]ワ、ソノナガ、シメス、トオリ、"等形態素単位を分
割して埋め込むことも可能である。

【００９５】フォーカス制御部１２９は、この音声合成
ポインタ１６９の情報を音声合成制御部１５１を介して
受領する。フォーカス制御部１２９は、この情報をもと
に文字列リストを参照し、ポインタ３０１が１８である
エントリを探索し、現在１００文字目の「はその名が示
す通り、」という文字列の読み上げを行っていることを
認識することができる。

【００９６】フォーカス制御部１２９は、この文字列リ
ストの位置情報を表示部に伝達し、反転表示等現在読み
上げが行われている箇所をユーザが認識できる形式で表
示させる。反転表示は音声合成と同期して表示するため
に、遅延時間を挿入する等の制御を行うことも可能であ
る。

【００９７】Ｃ４−３．リンク機能本発明によれば、現在読み上げが行われている箇所に関
連したリンク・キーワードを特定し、そのキーワードの
選択が有った場合、そのキーワードに対応したリンク先
へジャンプする。具体的には、フォーカス制御部１２９
は、音声合成ポインタ１６９と文字列リスト１３１のポ
インタ情報、リンク・ヘッド・フラグ情報を比較して、
現在読み上げが行われている箇所に対応するリンク先３
１１情報を特定する。例えば、現在読み上げを行ってい
る箇所を示す音声合成ポインタが「１６」であった場
合、フォーカス制御部１２９は、この値以下でリンク・
ヘッド・フラグが１である最も大きな値のポインタを選
択する。

【００９８】この例においては「１４」が選択される。
フォーカス制御部１２９は、このポインタの情報をフォ
ーカス・ポインタ１３９に格納する。このポインタ情報
はリンク先を特定するために格納されるものであるた
め、"ＴＨＡＴ．ＨＴＭ"等、直接リンク先情報を格納す
ることも可能である。なお、本発明の好適な実施例にお
いては、フォーカス制御部１２９は、音声合成ポインタ
の値以下でリンク・ヘッド・フラグが１である最も大き
な値のポインタを選択しフォーカス・ポインタとして格
納するが、これに該当するポインタが存在しない場合は
リンク・ヘッド・フラグが１の最も小さな値を有してい
るポインタをフォーカス・ポインタとして格納する。

【００９９】このような読み上げが行われている間に
「リンク先へのジャンプ」を示すキー入力が検出された
場合、このフォーカス・ポインタに対応するリンク先情
報を特定することができるため、公知のハイパーテキス
トにリンク手法を用いて、そのキーワードのリンク先に
ジャンブすることが可能となる。これにより、非視覚ユ
ーザが音声を聞きながら、簡単なキー操作だけで、リン
ク先へジャンプし、ハイパー・テキストの読み上げを続
行させることが可能となる。なお、本発明の好適な実施
例においては、このようなユーザ入力の検出に応答して
埋込みコマンド・ファイル１４１、音声ファイル１７１
等の各種ファイルを格納するバッファの内容がクリアさ
れ、またフォーカス・ポインタ１３９、音声合成ポイン
タ１６９、音声ジャンプ・ポインタ１７３等の各種情報
が初期設定される。

【０１００】Ｃ４−４．その他の機能本発明の好適な実施例においてはさらに、以下の様な機
能を持つキーをキーボード上に割り当てることで、リン
ク・キーワードの移動と選択が自在に行える。

【０１０１】キー1 : フォーカスのあるリンク・キーワ
ードの読み上げキー2 : フォーカスのあるリンク・キーワードからの読
み上げキー3 : リンク先へのジャンプキー4 : リンク・キーワード前方移動キー5 : リンク・キーワード後方移動キー6 : プレイキー7 : ストップキー8 : ポーズキー9 : 早送りキー10: 巻き戻しキー11: フォーカスのあるリンク・キーワードのみの読
み上げ

【０１０２】ここでキー６乃至キー１０は公知の手法を
用いることによって実現可能であり、キー３のリンク先
へのジャンプは、既に説明を行っているためる説明は省
略する。キー１乃至５及び１１について説明する。

【０１０３】キー１が押された場合は、ユーザ入力部１
２７はこれを検出し、この情報をフォーカス制御部１２
９に伝達する。フォーカス制御部１２９はこれに応答し
て、フォーカス・ポインタ１３９に格納されているポイ
ンタ情報を取得する。更にフォーカス制御部１２９は、
文字列リスト１３１を参照することにより読み上げを行
うべき文字列の特定を行う。例えば、フォーカス・ポイ
ンタの内容が「１４」であった場合、リンク・フラグを
参照しこれに連続するリンク・フラグ１の文字列であっ
て、リンク・ヘッド・フラグが１でない「１４」乃至
「１６」が読み上げを行うべき文字列であると認識す
る。

【０１０４】フォーカス制御部１２９は、音声合成制御
部１５１に位置情報が１４乃至１６の文字列の音声合成
を行うことを指示する。音声合成制御部１５１は、この
音声合成を行うべき位置情報の開始位置と終了位置を音
声ジャンプ・ポインタ１７３として一時的に格納する。
１つのリンク先に対応する文字列は連続して存在するも
のであるため、開始位置と終了位置ではなく開始位置と
文字列も個数を格納してもよい。さらに、文字列の個数
や終了位置は文字列リストのリンク・フラグとリンク・
ヘッド・フラグを参照することにより判断可能な情報で
あるため、開始位置のみを格納してもよい。

【０１０５】その後、音声合成制御部１５１はこの位置
情報を有する音声ファイルが残存しているか否かを音声
合成ファイル格納部１７１の内容からチェックし、残存
している場合は、これに該当する音声ファイルを抽出し
（該当する音声ファイル以外を音声ファイル格納部１７
１から破棄してもよい）、位置情報が１４乃至１６の音
声ファイルのみを合成器１６５に伝達する。該当する音
声ファイルが存在していない場合は、音声ファイル格納
部の情報をクリアし、埋込みコマンド・ファイルから該
当する埋込みコマンドを抽出し、音声合成を行うことに
より指定されたリンク・キーワードの読み上げを行う。

【０１０６】キー２が押された場合もキー１が押された
場合とほぼ同様な手順で制御が行われる。キー２が押さ
れた場合も、ユーザ入力部１２７がこれを検出し、この
情報をフォーカス制御部１２９に伝達する。フォーカス
制御部１２９はこれに応答して、フォーカス・ポインタ
１３９に格納されているポインタ情報を取得する。更に
フォーカス制御部１２９は、文字列リスト１３１を参照
することにより読み上げを行うべき文字列の特定を行
う。例えば、フォーカス・ポインタの内容が「１４」で
あった場合、「１４」乃至「９９９９」（本発明の好適
な実施例においては「９９９９」文章の最後を示すこと
している）が読み上げを行うべき文字列であると認識す
る。

【０１０７】フォーカス制御部１２９は、音声合成制御
部１５１に位置情報が１４乃至９９９９の文字列の音声
合成を行うことを指示する。音声合成制御部１５１は、
この音声合成を行うべき位置情報の開始位置と終了位置
を音声ジャンプ・ポインタ１７３として一時的に格納す
る。その後、音声合成制御部１５１はこの１４の位置情
報を有する音声ファイルが残存しているか否かを音声合
成ファイル格納部１７１の内容からチェックし、残存し
ている場合は、これに該当しない音声ファイルを無視
（または音声ファイル格納部から破棄）し、位置情報が
１４以降の音声ファイルを合成器１６５に伝達する。該
当する音声ファイルが存在していない場合は、音声ファ
イル格納部の情報を一旦クリアし、埋込みコマンド・フ
ァイルから位置情報１４以降の埋込みコマンドを音声合
成を行うことにより指定されたリンク・キーワードから
の読み上げを行う。

【０１０８】キー４が押された場合もキー２が押された
場合とほぼ同様な手順で制御が行われる。キー４が押さ
れた場合も、ユーザ入力部１２７がこれを検出し、この
情報をフォーカス制御部１２９に伝達する。フォーカス
制御部１２９はこれに応答して、フォーカス・ポインタ
１３９に格納されているポインタ情報を取得する。更に
フォーカス制御部１２９は、文字列リスト１３１を参照
し、リンク・ヘッド・フラグが１であり、フォーカス・
ポインタよりも小さいもののうち最大のものを探索す
る。例えば、フォーカス・ポインタの内容が「１４」で
あった場合、「１２」がこれに該当すると判断される。

【０１０９】フォーカス制御部１２９は、音声合成制御
部１５１に位置情報が１２乃至９９９９の文字列の音声
合成を行うことを指示する。音声合成制御部１５１は、
この音声合成を行うべき位置情報の開始位置と終了位置
を音声ジャンプ・ポインタ１７３として一時的に格納す
る。その後、音声合成制御部１５１は、この１２の位置
情報を有する音声ファイルが残存しているか否かを音声
合成ファイル格納部１７１の内容からチェックし、残存
している場合は、これに該当しない音声ファイルを無視
（または音声ファイル格納部から破棄）し、位置情報が
１２以降の音声ファイルを合成器１６５に伝達する。該
当する音声ファイルが存在していない場合は、音声ファ
イル格納部の情報を一旦クリアし、埋込みコマンド・フ
ァイルから位置情報１２以降の埋込みコマンドを音声合
成を行うことにより指定されたリンク・キーワードから
の読み上げを行う。

【０１１０】キー５が押された場合は、フォーカス制御
部１２９が、文字列リスト１３１から、リンク・ヘッド
・フラグが１であり、フォーカス・ポインタよりも大き
いもののうち最小のものを探索することを除き、キー４
で説明したものと同様な処理がなされる。

【０１１１】キー１１が押された場合も、ユーザ入力部
１２７がこれを検出し、この情報をフォーカス制御部１
２９に伝達する。フォーカス制御部１２９はこれに応答
して、文字列リスト１３１を参照することにより読み上
げを行うべき文字列の特定を行う。すなわちリンク・フ
ラグが１の文字列をすべて抽出する。

【０１１２】本発明の好適な実施例においては、リンク
・ヘッド・フラグが１である文字列に連続する文字列で
あってリンク・フラグ１で、リンク・ヘッド・フラグが
１でない文字列はまとまりのあるリンク・キーワードと
判断される。まとまりのあるリンク・キーワード間には
一定時間読み上げの行われない無音時間を形成させるた
めに一定長さのブランク等の読み上げの間隔を指示する
文字列または、コマンド等が挿入される。

【０１１３】フォーカス制御部１２９は、新たに埋込み
コマンド・ファイルを作成し、音声合成制御部１５１に
現在保持している音声ファイルをクリアし、新たな埋込
みコマンド・ファイルの音声合成を行うことを指示す
る。但し、新たな埋込みコマンドを作成しなくても音声
合成部１５０で現在保持している埋込みコマンド・ファ
イルから、音声合成を行うべき文字列を抽出し音声合成
を行うことによっても動作可能である。

【０１１４】以上説明したキー入力によるリンク・キー
ワードのコントロールを公知の音声認識手法を用いて音
声入力によるによるリンク・キーワードのコントロール
に代替することも可能である。かかる場合、図２のユー
ザ入力部１２７に加えて音声認識部を設け上記キー入力
に代わる「リンク・キーワード」，「ジャンプ」等のユ
ーザの肉声による入力を受領しこれを識別し、その識別
されたシュついに対応した指示をフォーカス制御部１２
９に指示する。このようなユーザの肉声を入力とする場
合、ユーザ入力を受付けるための時間が設定され、その
間は、音声合成が中断されることが望ましいが、ユーザ
がヘッドホンとマイクロフォンを用いる等、音声出力が
音声入力へ影響を及ぼさない環境であれば、音声入力と
音声出力を同時に行うことも可能である。

【０１１５】

【発明の効果】以上説明したように、本発明によれば、
非視覚ユーザが、文章の内容を音声として聞きながら、
音声属性の違いにより内容を理解することが可能とな
り、ハイパーテキストに対応した適切なオペレーション
を行うことができる。

【０１１６】テキスト属性を持つデータ・ファイル、あ
るいはハイパー・テキストのデータがあり、音声合成プ
ログラムを通して、その内容を理解したい場合に利用す
る。視覚障害者や、画面を見ることのできない状況で、
これらの文章の内容を音声として聞きながら、音声属性
の違いにより内容を理解することが可能となる。インタ
ーネットのＷＷＷの大半のデータが文章データとして提
供されている。これを音声として読み上げることで、Ｗ
ＷＷのかなりの部分のデータを音声を通して入手が可能
となる。

【０１１７】

【図面の簡単な説明】

【図１】ハードウェア構成を示すブロック図である。

【図２】処理要素のブロック図である。

【図３】本発明のＷｅｂブラウザとＷｅｂサーバとの
通信手順を示す図である。

【図４】本発明で変換されるＨＴＭＬファイルの一実
施例を示す図である。

【図５】本発明のＷｅｂブラウザのユーザインターフ
ェースを示す図である。

【図６】本発明の文字列リストの一実施例を示す図で
ある。

【図７】本発明の埋め込みコマンドを含む文章を作成
する手順を示すフローチャートである。

【０１１８】

【符号の説明】

１００音声合成システム１２０Ｗｅｂブラウザ部１２１データ入出力制御部１２３ＨＴＭＬ関連ファイル格納部１２５ＨＴＭＬ解析部１２７ユーザ入力部１２９フォーカス制御部１３１文字列リスト１３３表示部１３５変換表１３９フォーカス・ポインタ１４１埋込みコマンド・ファイル１５０音声合成部１５１音声合成制御部１５３言語解析部１５５文法規則保持部１５７読みアクセント辞書１５９読み付与部１６１アクセント付与部１６３パラメータ生成部１６５音声合成部１６７音声発生部１６９音声合成ポインタ１７１音声ファイル格納部１７３音声ジャンプ・ポインタ

───────────────────────────────────────────────────── フロントページの続き (51)Int.Cl.⁶ 識別記号庁内整理番号ＦＩ技術表示箇所Ｇ１０Ｌ 5/02 Ｇ１０Ｌ 5/02 ＪＧ０６Ｆ 15/20 ５６８Ｚ

Claims

【特許請求の範囲】

【請求項１】各々がリンク先情報に対応付けられている
複数のリンク・キーワードを含むハイパーテキストを制
御する方法であって、（ａ）前記リンク・キーワードを特定する情報と前記リ
ンク・キーワードが存在する前記ハイパーテキスト中の
位置情報を管理する文字列リストを作成する段階と、（ｂ）前記ハイパーテキストを変換することにより音声
合成入力情報を作成する段階と、（ｃ）前記音声合成入力情報に基づいて音声合成を行う
段階と、（ｄ）音声合成を行っている位置に対応する前記ハイパ
ーテキスト中の位置に関連した音声合成ポインタ情報を
取得する段階と、（ｅ）前記音声合成ポインタ情報に対応する前記ハイパ
ーテキスト中の位置情報を前記文字列リストから探索す
ることにより対応するリンク・キーワードを特定する段
階と、（ｆ）リンク先への移動を指示するユーザ入力を検出す
る段階と、（ｇ）前記ユーザ入力の検出に応答して、前記特定され
たリンク・キーワードに対応するリンク先情報に基づい
てリンク先にアクセスする段階と、を含む方法。
【請求項２】各々がリンク先情報に対応付けられている
複数のリンク・キーワードを含むＷｅｂサーバから受領
したＨＴＭＬ(Hyper Text Markup Languae)ファイルを
制御する方法であって、（ａ）ＨＴＭＬファイルをＷｅｂサーバから受領する段
階と、（ｂ）前記リンク・キーワードを特定する情報と前記リ
ンク・キーワードが存在する前記ＨＴＭＬファイル中の
位置情報とリンク先情報を管理する文字列リストを作成
する段階と、（ｃ）前記ＨＴＭＬファイルに含まれるリンク・キーワ
ードの開始タグと終了タグを音声属性情報に変換し、前
記リンク・キーワードが存在する前記ＨＴＭＬファイル
中の位置情報とともに音声属性埋込みコマンドとして前
記リンク・キーワードに関連付けることにより、音声属
性埋込みコマンド・ファイルを作成する段階と、（ｄ）前記音声属性埋込みコマンド・ファイルに基づい
て音声合成を行う段階と、（ｅ）音声合成を行っている位置に対応する前記ＨＴＭ
Ｌファイル中の位置に関連した音声合成ポインタ情報を
前記リンク・キーワードに関連付けられた位置情報に基
づいて取得する段階と、（ｆ）前記音声合成ポインタ情報に対応する前記ＨＴＭ
Ｌファイル中の位置情報を前記文字列リストから探索す
ることにより対応するリンク先情報を特定する段階と、（ｇ）リンク先への移動を指示するユーザ入力を検出す
る段階と、（ｈ）前記ユーザ入力の検出に応答して、前記特定され
たリンク先情報に基づいてリンク先にアクセスする段階
と、を含む方法。
【請求項３】複数の特殊文字列を含む文章の音声合成を
行う方法であって、（ａ）前記複数の特殊文字列を特定する情報と前記複数
の特殊文字列が存在する前記文章中の位置情報を管理す
る文字列リストを作成する段階と、（ｂ）前記複数の特殊文字列の各々に音声属性を関連付
け、前記文章を変換することにより音声合成入力情報を
作成する段階と、（ｃ）前記音声合成入力情報に基づいて音声合成を行う
段階と、（ｄ）音声合成を行っている位置に対応する前記文章中
の位置に関連した音声合成ポインタ情報を取得する段階
と、（ｅ）前記音声合成ポインタ情報に対応する前記文章中
の位置情報を前記文字列リストから探索することによ
り、音声合成を行っている位置に対応する特殊文字列を
特定する段階と、（ｆ）音声合成位置の変更を指示するユーザ入力を検出
する段階と、（ｇ）前記ユーザ入力の検出に応答して、前記文字列リ
ストから前記音声合成を行っている位置に対応する特定
文字列に隣接する特殊文字列の位置情報を取得する段階
と、（ｈ）前記隣接する特殊文字列の位置情報に対応した位
置の音声合成を行う段階と、を含む方法。
【請求項４】各々がリンク先情報に対応付けられている
複数のリンク・キーワードを含むハイパーテキストを制
御する装置であって、（ａ）前記リンク・キーワードを特定する情報と前記リ
ンク・キーワードが存在する前記ハイパーテキスト中の
位置情報を管理する文字列リストと、（ｂ）前記リンク・キーワードに音声属性を関連付け、
前記ハイパーテキストを変換することにより音声合成入
力情報を作成する手段と、（ｃ）前記音声合成入力情報に基づいて音声合成を行う
手段と、（ｄ）音声合成を行っている位置に対応する前記ハイパ
ーテキスト中の位置に関連した音声合成ポインタ情報を
取得する手段と、（ｅ）前記音声合成ポインタ情報に対応する前記ハイパ
ーテキスト中の位置情報を前記文字列リストから探索す
ることにより対応するリンク・キーワードを特定する手
段と、（ｆ）リンク先への移動を指示するユーザ入力を検出す
る手段と、（ｇ）前記ユーザ入力の検出に応答して、前記特定され
たリンク・キーワードに対応するリンク先情報に基づい
てリンク先にアクセスする手段と、を含む装置。
【請求項５】各々がリンク先情報に対応付けられている
複数のリンク・キーワードを含むＷｅｂサーバから受領
したＨＴＭＬファイルを制御する装置であって、（ａ）ＨＴＭＬファイルをＷｅｂサーバから受領する通
信制御部と、（ｂ）前記リンク・キーワードを特定する情報と前記リ
ンク・キーワードが存在する前記ＨＴＭＬファイル中の
位置情報とリンク先情報を管理する文字列リストを作成
する手段と、（ｃ）前記ＨＴＭＬファイルに含まれるリンク・キーワ
ードの開始タグと終了タグを音声属性情報に変換し、前
記リンク・キーワードが存在する前記ＨＴＭＬファイル
中の位置情報とともに音声属性埋込みコマンドとして前
記リンク・キーワードに関連付けることにより、音声属
性埋込みコマンド・ファイルを作成する手段と、（ｄ）前記音声属性埋込みコマンド・ファイルに基づい
て音声合成を行う音声合成部と、（ｅ）音声合成を行っている位置に対応する前記ＨＴＭ
Ｌファイル中の位置に関連した音声合成ポインタ情報を
前記リンク・キーワードに関連付けられた位置情報に基
づいて取得する手段と、（ｆ）前記音声合成ポインタ情報に対応する前記ＨＴＭ
Ｌファイル中の位置情報を前記文字列リストから探索す
ることにより対応するリンク先情報を特定する手段と、（ｇ）リンク先への移動を指示するユーザ入力を検出す
るユーザ入力部と、（ｈ）前記ユーザ入力の検出に応答して、前記特定され
たリンク先情報に基づいてリンク先にアクセスする手段
と、を含む装置。
【請求項６】複数の特殊文字列を含む文章の音声合成を
行う装置であって、（ａ）前記複数の特殊文字列を特定する情報と前記複数
の特殊文字列が存在する前記文章中の位置情報を管理す
る文字列リストを作成する手段と、（ｂ）前記複数の特殊文字列の各々に音声属性を関連付
け、前記文章を変換することにより音声合成入力情報を
作成する手段と、（ｃ）前記音声合成入力情報に基づいて音声合成を行う
手段と、（ｄ）音声合成を行っている位置に対応する前記文章中
の位置に関連した音声合成ポインタ情報を取得する手段
と、（ｅ）前記音声合成ポインタ情報に対応する前記文章中
の位置情報を前記文字列リストから探索することによ
り、音声合成を行っている位置に対応する特殊文字列を
特定する手段と、（ｆ）音声合成位置の変更を指示するユーザ入力を検出
する手段と、（ｇ）前記ユーザ入力の検出に応答して、前記文字列リ
ストから前記音声合成を行っている位置に対応する特定
文字列に隣接する特殊文字列の位置情報を取得する手段
と、（ｈ）前記隣接する特殊文字列の位置情報に対応した位
置の音声合成を行う手段と、を含む装置。
【請求項７】データ処理システムが管理する記憶域にお
いて管理されている、各々がリンク先情報に対応付けら
れている複数のリンク・キーワードを含むハイパーテキ
ストを制御するためのプログラムを格納する記憶媒体で
あって、該プログラムは、（ａ）前記リンク・キーワードを特定する情報と前記リ
ンク・キーワードが存在する前記ハイパーテキスト中の
位置情報を管理する文字列リストを作成することを前記
データ処理システムに指示するプログラムコード手段
と、（ｂ）前記リンク・キーワードに音声属性を関連付け、
前記ハイパーテキストを変換することにより音声合成入
力情報を作成することを前記データ処理システムに指示
するプログラムコード手段と、（ｃ）前記音声合成入力情報に基づいて音声合成を行う
ことを前記データ処理システムに指示するプログラムコ
ード手段と、（ｄ）音声合成を行っている位置に対応する前記ハイパ
ーテキスト中の位置に関連した音声合成ポインタ情報を
取得することを前記データ処理システムに指示するプロ
グラムコード手段と、（ｅ）前記音声合成ポインタ情報に対応する前記ハイパ
ーテキスト中の位置情報を前記文字列リストから探索す
ることにより対応するリンク・キーワードを特定するこ
とを前記データ処理システムに指示するプログラムコー
ド手段と、（ｆ）リンク先への移動を指示するユーザ入力を検出す
ることを前記データ処理システムに指示するプログラム
コード手段と、（ｇ）前記ユーザ入力の検出に応答して、前記特定され
たリンク・キーワードに対応するリンク先情報に基づい
てリンク先にアクセスすることを前記データ処理システ
ムに指示するプログラムコード手段と、を含む記憶媒体。
【請求項８】データ処理システムが管理する記憶域にお
いて管理されている、各々がリンク先情報に対応付けら
れている複数のリンク・キーワードを含むＷｅｂサーバ
から受領したＨＴＭＬファイルを制御するためのプログ
ラムを格納する記憶媒体であって、該プログラムは、（ａ）ＨＴＭＬファイルをＷｅｂサーバから受領するこ
とを前記データ処理システムに指示するプログラムコー
ド手段と、（ｂ）前記リンク・キーワードを特定する情報と前記リ
ンク・キーワードが存在する前記ＨＴＭＬファイル中の
位置情報とリンク先情報を管理する文字列リストを作成
することを前記データ処理システムに指示するプログラ
ムコード手段と、（ｃ）前記ＨＴＭＬファイルに含まれるリンク・キーワ
ードの開始タグと終了タグを音声属性情報に変換し、前
記リンク・キーワードが存在する前記ＨＴＭＬファイル
中の位置情報とともに音声属性埋込みコマンドとして前
記リンク・キーワードに関連付けることにより、音声属
性埋込みコマンド・ファイルを作成することを前記デー
タ処理システムに指示するプログラムコード手段と、（ｄ）前記音声属性埋込みコマンド・ファイルに基づい
て音声合成を行うことを前記データ処理システムに指示
するプログラムコード手段と、（ｅ）音声合成を行っている位置に対応する前記ＨＴＭ
Ｌファイル中の位置に関連した音声合成ポインタ情報を
前記リンク・キーワードに関連付けられた位置情報に基
づいて取得することを前記データ処理システムに指示す
るプログラムコード手段と、（ｆ）前記音声合成ポインタ情報に対応する前記ＨＴＭ
Ｌファイル中の位置情報を前記文字列リストから探索す
ることにより対応するリンク先情報を特定することを前
記データ処理システムに指示するプログラムコード手段
と、（ｇ）リンク先への移動を指示するユーザ入力を検出す
ることを前記データ処理システムに指示するプログラム
コード手段と、（ｈ）前記ユーザ入力の検出に応答して、前記特定され
たリンク先情報に基づいてリンク先にアクセスすること
を前記データ処理システムに指示するプログラムコード
手段と、を含む記憶媒体。
【請求項９】データ処理システムが管理する記憶域にお
いて管理されている、複数の特殊文字列を含む文章の音
声合成を行うためのプログラムを格納する記憶媒体であ
って、該プログラムは、（ａ）前記複数の特殊文字列を特定する情報と前記複数
の特殊文字列が存在する前記文章中の位置情報を管理す
る文字列リストを作成することを前記データ処理システ
ムに指示するプログラムコード手段と、（ｂ）前記複数の特殊文字列の各々に音声属性を関連付
け、前記文章を変換することにより音声合成入力情報を
作成することを前記データ処理システムに指示するプロ
グラムコード手段と、（ｃ）前記音声合成入力情報に基づいて音声合成を行う
ことを前記データ処理システムに指示するプログラムコ
ード手段と、（ｄ）音声合成を行っている位置に対応する前記文章中
の位置に関連した音声合成ポインタ情報を取得すること
を前記データ処理システムに指示するプログラムコード
手段と、（ｅ）前記音声合成ポインタ情報に対応する前記文章中
の位置情報を前記文字列リストから探索することによ
り、音声合成を行っている位置に対応する特殊文字列を
特定することを前記データ処理システムに指示するプロ
グラムコード手段と、（ｆ）音声合成位置の変更を指示するユーザ入力を検出
することを前記データ処理システムに指示するプログラ
ムコード手段と、（ｇ）前記ユーザ入力の検出に応答して、前記文字列リ
ストから前記音声合成を行っている位置に対応する特定
文字列に隣接する特殊文字列の位置情報を取得すること
を前記データ処理システムに指示するプログラムコード
手段と、（ｈ）前記隣接する特殊文字列の位置情報に対応した位
置の音声合成を行うことを前記データ処理システムに指
示するプログラムコード手段と、を含む記憶媒体。