JP2001043064A - 音声情報処理方法、装置及び記憶媒体 - Google Patents

音声情報処理方法、装置及び記憶媒体

Info

Publication number
JP2001043064A
JP2001043064A JP11217219A JP21721999A JP2001043064A JP 2001043064 A JP2001043064 A JP 2001043064A JP 11217219 A JP11217219 A JP 11217219A JP 21721999 A JP21721999 A JP 21721999A JP 2001043064 A JP2001043064 A JP 2001043064A
Authority
JP
Japan
Prior art keywords
voice
hypertext
character string
speech
phonetic character
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP11217219A
Other languages
English (en)
Inventor
Mitsuru Otsuka
充 大塚
Takashi Aso
隆 麻生
Shinichi Kamiyama
慎一 加美山
Yasuko Miyazaki
康子 宮崎
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Canon Inc
Original Assignee
Canon Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Canon Inc filed Critical Canon Inc
Priority to JP11217219A priority Critical patent/JP2001043064A/ja
Priority to DE60024727T priority patent/DE60024727T2/de
Priority to EP00306355A priority patent/EP1073036B1/en
Publication of JP2001043064A publication Critical patent/JP2001043064A/ja
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L13/00Speech synthesis; Text to speech systems

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Information Transfer Between Computers (AREA)

Abstract

(57)【要約】 【課題】 ハイパーテキストを音声により読み上げる処
理を、ネットワークにおけるデータの送受信を軽減して
実現可能とする。 【解決手段】 クライアントからのアドレス指示(S1
02)により指定されたハイパーテキストに対応する表
音文字列をサーバより受信し(S106)、これらの表
音文字列を音声合成して出力する(S108)。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明はテキストを音声に変
換して出力する音声処理方法、装置及び記憶媒体に関す
る。
【0002】本発明は、音声により情報を出力する音声
処理方法、装置及び記憶媒体に関する。
【0003】
【従来の技術】コンピュータネットワーク(例えばイン
ターネット)を利用してクライアントサーバー方式で実
装されるハイパーテキスト閲覧装置(例えばPC用WWW閲
覧ソフトウェア)において音声による情報提供をする場
合、サーバーに音声データを蓄積してクライアントに送
信する方式、クライアントが受信したハイパーテキスト
(漢字かな混じり文など)からクライアントが文を抽出
して音声合成技術によって合成音声に変換する方式が利
用されている。
【0004】
【発明が解決しようとする課題】従来の技術において、
サーバーに音声データを蓄積してクライアントに送信す
る方式の場合は、音声の情報量がテキストと比較すると
非常に大きいためにコンピュータネットワークにかかる
負荷が大きくなる、情報内容を変更する際に改めて音声
を収録しなければならない、ハイパーテキストのリンク
を移動するときは画面を見てリンク先を指定しなければ
ならないという問題点がある。また、クライアントが受
信したハイパーテキストからクライアントが文を抽出し
て音声合成技術によって合成音声に変換する方式の場合
は、文の解析精度に応じて読み間違いやアクセントの間
違いが生じて聞きづらい合成音声になる、サーバーが合
成音声の高さや速さや話者などを制御できないという問
題点がある。
【0005】
【課題を解決するための手段】上記従来技術の課題を解
決する為に、本発明は、ハイパーテキストアドレスを送
信し、ハイパーテキストを受信し、前記受信したハイパ
ーテキストを表示し、文の読みとアクセントを記述する
表音文字列を要求し、前記要求により得た表音文字列を
合成音声に変換するクライアント機能と、格納されてい
るハイパーテキストを送信し、格納されている表音文字
列を送信するサーバー機能とよりなる音声情報処理装
置、方法及び記憶媒体を提供する。
【0006】上記従来技術の課題を解決する為に、本発
明は、好ましくは更に、要求により得た表音文字列に含
まれている制御記号に従って、前記合成する音声の特徴
を変更する。
【0007】上記従来技術の課題を解決する為に、本発
明は、好ましくは前記変更する音声の特徴は、音声の高
さ、速さ、話者のいずれかとする。
【0008】上記従来技術の課題を解決する為に、本発
明は、好ましくは前記合成される音声の出力に関わる指
示を入力する為のユーザインタフェースとしてグラフィ
カルユーザーインターフェースを用いる。
【0009】上記従来技術の課題を解決する為に、本発
明は、好ましくは前記音声の出力に関わる指示は、音声
の出力開始終了、中断、再開、出力する音声の高さの変
更、速さの変更、話者の変更のいずれかとする。
【0010】上記従来技術の課題を解決する為に、本発
明は、好ましくは前記グラフィカルユーザインターフェ
ースとして、前記音声の出力に関わる指示を入力する為
の操作画面を表示する。
【0011】上記従来技術の課題を解決する為に、本発
明は、好ましくは前記グラフィカルユーザインターフェ
ースとして表示された、前記音声の出力に関わる指示を
入力する為の操作画面に対する指示に基づいて、入力さ
れた指示の種類を判定する。
【0012】上記従来技術の課題を解決する為に、本発
明は、好ましくは前記合成される音声の出力に関わる指
示を入力する為のユーザインタフェースとしてキーボー
ドからの入力によるインターフェースを備える。
【0013】上記従来技術の課題を解決する為に、本発
明は、好ましくは前記要求により得た表音文字列に、リ
ンク先のハイパーテキストアドレスとそれに付随する表
音文字列とにより構成されるリンク情報を含む。
【0014】上記従来技術の課題を解決する為に、本発
明は、好ましくは前記リンク情報は、制御記号により他
の表音文字列と識別可能な状態で構成する。
【0015】上記従来技術の課題を解決する為に、本発
明は、好ましくは前記グラフィカルユーザインターフェ
ースにより音声の出力に関わる指示を入力した場合に、
前記リンク情報に含まれる表音文字列を音声合成する。
【0016】上記従来技術の課題を解決する為に、本発
明は、好ましくは前記キーボードから音声の出力に関わ
る指示を入力した場合に、前記リンク情報に含まれる表
音文字列を音声合成する。
【0017】上記従来技術の課題を解決する為に、本発
明は、好ましくは前記リンク情報に含まれる表音文字列
を合成音声に変換する時に、他の表音文字列とは音声の
声の質を変える。
【0018】上記従来技術の課題を解決する為に、本発
明は、好ましくは前記リンク情報に含まれる表音文字列
を音声合成している時に指示が入力された場合に、当該
表音文字列が構成するリンク情報に含まれるハイパーテ
キストアドレスをサーバに送信し、リンク先のハイパー
テキストを受信するよう制御する。
【0019】上記従来技術の課題を解決する為に、本発
明は、好ましくは前記リンク情報に含まれる表音文字列
を音声合成している時に指示が入力された場合に、当該
表音文字列が構成するリンク情報に含まれるハイパーテ
キストアドレスをサーバに送信し、リンク先のハイパー
テキストを受信するよう制御する。
【0020】上記従来技術の課題を解決する為に、本発
明は、好ましくは前記クライアント機能において、前記
音声合成を実行する音声合成モジュールを前記サーバー
機能に要求し、前記音声合成モジュールを受信して格納
する。
【0021】上記従来技術の課題を解決する為に、本発
明は、好ましくは前記サーバー機能は、前記クライアン
ト機能からの要求に応じて格納されている音声合成モジ
ュールを当該クライアントに送信する。
【0022】上記従来技術の課題を解決する為に、本発
明は、好ましくは前記表音文字列要求の前に、音声合成
モジュールの有無を判定し、音声合成モジュールが無い
場合には、当該要求をしないよう制御する。
【0023】上記従来技術の課題を解決する為に、本発
明は、ハイパーテキストを受信し、前記受信したハイパ
ーテキストに含まれる情報に応じて、文の読みとアクセ
ントを記述する表音文字列を要求し、前記要求により得
た表音文字列を合成音声に変換する音声情報処理装置、
方法及び記憶媒体を提供する。
【0024】
【発明の実施の形態】[実施形態1]図1は、本発明の
第1の実施形態に係るハイパーテキスト閲覧装置の機能
構成図である。本発明の実施形態はハイパーテキスト閲
覧装置を例に挙げて説明するが、ネットワークにより接
続された一つの端末が他の端末からデータを受け取り、
音声出力できる装置であればこれに限定されるものでは
ない。以下、他の実施形態においても同様である。
【0025】図1において、コンピュータネットワーク
を介してクライアント(図1中央のネットワークの右
側)とサーバー(図1中央のネットワークの左側)が通
信を行なうクライアントサーバー方式によって動作す
る。
【0026】尚、クライアント及びサーバーは、メモリ
に記憶された制御プログラムに従ってCPUが動作する
ことにより、図1に示した各機能を実現したり、図2の
処理の流れを実現する。更に、この制御プログラムは各
装置のメモリに予め格納されたものであっても良いし、
或は装置に着脱可能な記憶媒体やネットワークで接続さ
れた他の端末からインストールしても良い。この点は、
他の実施形態においても同様である。
【0027】図1において、101はアドレス送信部、102
はハイパーテキスト送信部、103はハイパーテキスト格
納部、104はハイパーテキスト受信部、105はハイパーテ
キスト表示部、106は表音文字列要求部、107は表音文字
列送信部、108は表音文字列格納部、109は音声合成部で
ある。
【0028】ここでは図2の流れ図を用いて、本実施例
の動作を説明する。本実施形態のハイパーテキスト閲覧
装置は、コンピュータネットワークを介して情報の授受
を行なうことにより、クライアント(S101〜S109)とサ
ーバー(S151〜S154)が協調して動作する。
【0029】ステップS101で、ハイパーテキストアドレ
スがユーザーによる表示画面上でのキー操作によりクラ
イアントに入力される。
【0030】ステップS102で、アドレス送信部101がS
101で入力されたアドレスを受け取り、ハイパーテキ
ストアドレスをサーバーへ送信する。この送信相手のサ
ーバは、S101で入力したアドレスに含まれるサーバ
識別情報により定められる。
【0031】ステップS151で、ハイパーテキスト送信部
102が、クライアントから送信されたハイパーテキスト
アドレスを受信する。
【0032】ステップS152で、ハイパーテキスト送信部
102が、ハイパーテキスト格納部103からハイパーテキス
トアドレスに対応するハイパーテキストを読み出して、
S151で受信したアドレスを送信してきたクライアン
トへ送信する。
【0033】ステップS103で、ハイパーテキスト受信部
104が、サーバーから送信されたハイパーテキストを受
信する。
【0034】ステップS104で、ハイパーテキスト表示部
105が、S103で受信したハイパーテキストを文字や
画像に展開して表示する。
【0035】ステップS105で、表音文字列要求部106
が、受信したハイパーテキストに表音文字列を要求する
記述が含まれているか否かを判別する。これは、受信し
たハイパーテキストを順次解析して要求コマンドを発見
することにより可能である。
【0036】ステップS105でハイパーテキストに表音文
字列を要求する記述があるときはステップS106に進み、
無いときはステップS109へ進む。
【0037】ステップS106で、表音文字列要求部106
が、表音文字列要求をサーバーへ送信する。この送信先
は、S102での送信先と同じサーバーである。ここで
同じサーバーにアクセスする為に、その時処理している
ハイパーテキストを送ってきたサーバー情報をS103
からS109まで保持しておく。
【0038】ステップS153で、表音文字列送信部107
が、クライアントから送信された表音文字列要求を受信
する。
【0039】ステップS154で、表音文字列送信部107
が、表音文字列要求に対応する表音文字列を表音文字列
格納部108から読み出して要求してきたクライアントに
送信する。
【0040】ステップS107で、音声合成部109が、サー
バーから送信された表音文字列を受信する。
【0041】ステップS108で、音声合成部109が、S1
07で受信した表音文字列を合成音声に変換する。
【0042】ステップS109で、ハイパーテキストの閲覧
終了であるか否かが判別され、閲覧終了でないときはス
テップS101に戻り次のアドレス入力を待って処理が続け
られ、閲覧終了のときは処理を終了する。閲覧終了の判
別は、ハイパーテキストを開くビューアが閉じられた
(終了された)ことにより判別する。
【0043】図3〜図6は、表音文字列の仕様の一例で
ある。読み記号表(図3)に示す例により読みを、韻律
記号例(図4)に示す例によりアクセントを図6のよう
に記述することができ、さらに、図5に例示した制御記
号で合成音声の高さや速さや話者を制御することができ
る。これらの記号の組み合わせて作成した表音文字列の
例を図7に示す。ただし、表音文字列の仕様はこれに限
るものではなく、音声を合成する為に音声合成部が必要
とする情報を含んでいれば良い。
【0044】[実施形態2]図8は、本発明の第2の実
施形態に係るハイパーテキスト閲覧装置の機能構成図で
ある。
【0045】図8において、201はアドレス送信部、202
はハイパーテキスト送信部、203はハイパーテキスト格
納部、204はハイパーテキスト受信部、205はハイパーテ
キスト表示部、206は表音文字列要求部、207は表音文字
列送信部、208は表音文字列格納部、209は音声合成ユー
ザーインターフェース部、210は音声合成部である。
【0046】ここでは図9の流れ図を用いて、本実施形
態における動作を説明する。本装置は、コンピュータネ
ットワークを介して情報の授受を行なうことにより、ク
ライアント(S201〜S210)とサーバー(S251〜S254)が
協調して動作する。
【0047】ステップS201で、ハイパーテキストアドレ
スがユーザーによる表示画面上でのキー操作によりクラ
イアントに入力される。
【0048】ステップS202で、アドレス送信部201がS
201で入力されたハイパーテキストアドレスを受け取
り、ハイパーテキストアドレスをサーバーへ送信する。
【0049】ステップS251で、ハイパーテキスト送信部
202が、クライアントから送信されたハイパーテキスト
アドレスを受信する。
【0050】ステップS252で、ハイパーテキスト送信部
202が、ハイパーテキスト格納部203からハイパーテキス
トアドレスに対応するハイパーテキストを読み出して、
S251で受信したアドレスを送信してきたクライアン
トへ送信する。
【0051】ステップS203で、ハイパーテキスト受信部
204が、サーバーから送信されたハイパーテキストを受
信する。
【0052】ステップS204で、ハイパーテキスト表示部
205が、S203で受信したハイパーテキストを文字や
画像に展開して表示する。
【0053】ステップS205で、表音文字列要求部206
が、受信したハイパーテキストに表音文字列を要求する
記述が含まれているか否かを判別する。
【0054】ステップS205でハイパーテキストに表音文
字列を要求する記述があるときはステップS206に進み、
無いときはステップS210へ進む。
【0055】ステップS206で、表音文字列要求部206
が、表音文字列要求をサーバーへ送信する。
【0056】ステップS207で、表音文字列要求部206
が、音声合成ユーザーインターフェース部209を起動す
る。
【0057】ステップS253で、表音文字列送信部207
が、クライアントから送信された表音文字列要求を受信
する。
【0058】ステップS254で、表音文字列送信部207
が、表音文字列要求に対応する表音文字列を表音文字列
格納部208から読み出して送信する。
【0059】ステップS208で、音声合成部210が、サー
バーから送信された表音文字列を受信する。
【0060】ステップS209で、音声合成部210が、S2
08で受信した表音文字列を合成音声に変換する。
【0061】ステップS210で、ハイパーテキストの閲覧
終了であるか否かが判別され、閲覧終了でないときはス
テップS201に戻り次のアドレス入力を待って処理が続け
られ、閲覧終了のときは処理を終了する。
【0062】図10は、ステップS207で起動した音
声合成ユーザーインターフェース部209の機能により
制御される。ステップS209における音声合成部210の動
作の詳細を示すものであって、S207において図11
のように表示された操作パネル画像へのメカ(グラフィ
カルユーザインターフェース)やキーによる入力により
音声出力に関わる指示コマンドが入力された後の処理で
ある。音声合成ユーザーインターフェース部の機能とし
て、音声合成の開始、停止、中断、再開、合成音声の高
さ変更、合成音声の速さ変更、合成音声の話者変更があ
る。
【0063】ステップS20901で、音声合成部210が、音
声合成ユーザーインターフェース部209からのコマンド
入力を受け取る。
【0064】ステップS20902からS20915までは、「開
始」、「停止」、「中断」、「再開」、「高さ変更」、
「速さ変更」、「話者変更」の各コマンドに対応した条
件分岐である。
【0065】ステップS20902で「開始」コマンドである
か否かが判別され、「開始」コマンドである場合には、
ステップS20903で音声合成が開始される。
【0066】ステップS20904で「停止」コマンドである
か否かが判別され、「停止」コマンドである場合には、
ステップS20905で音声合成が停止される。
【0067】ステップS20906で「中断」コマンドである
か否かが判別され、「中断」コマンドである場合には、
ステップS20907で音声合成が中断される。
【0068】ステップS20908で「再開」コマンドである
か否かが判別され、「再開」コマンドである場合には、
ステップS20909で音声合成が再開される。
【0069】ステップS20910で「高さ変更」コマンドで
あるか否かが判別され、「高さ変更」コマンドである場
合には、ステップS20911で合成音声の高さが変更され
る。
【0070】ステップS20912で「速さ変更」コマンドで
あるか否かが判別され、「速さ変更」コマンドである場
合には、ステップS20913で合成音声の速さが変更され
る。
【0071】ステップS20914で「話者変更」コマンドで
あるか否かが判別され、「話者変更」コマンドである場
合には、ステップS20915で合成音声の話者が変更され
る。
【0072】ステップS20916で音声合成を終了するか否
かが判別され、終了しない場合にはステップS20901に戻
り処理が続けられる。
【0073】図11は、音声合成ユーザーインターフェ
ース部209の起動(S207)に応じて表示されるパタ
ーンであって、このパターン上のどの位置がマウス等の
座標入力手段により指示され、その位置がどのボタンの
表示位置に相当するのかの判断により、そのボタンに対
応するコマンドを入力するグラフィカルユーザーインタ
ーフェース(GUI)の例である。ボタンには「開
始」、「停止」、「中断」、「再開」といった音声出力
に関わる指示を入力するものと、「話者変更」を指示す
るメニューバーと、「高さ変更」や「速さ変更」を指示
するためのスライダーバーがある。
【0074】図12は、キー入力によるコマンド入力の
例である。しかしながら、GUI用のパターン及びキー
コマンドはこれに限るものではなく、予めルールを定め
ておけば良い。
【0075】[実施形態3]図13は、本発明の第3の
実施形態に係るハイパーテキスト閲覧装置の機能構成図
である。
【0076】図13において、301はアドレス送信部、3
02はハイパーテキスト送信部、303はハイパーテキス
ト格納部、304はハイパーテキスト受信部、305はハ
イパーテキスト表示部、306は表音文字列要求部、307は
表音文字列送信部、308は表音文字列格納部、309は音声
合成ユーザーインターフェース部、310は音声合成部で
ある。
【0077】ここでは図14の流れ図を用いて、本実施
形態における動作を説明する。
【0078】本実施例のハイパーテキスト閲覧装置は、
コンピュータネットワークを介して情報の授受を行なう
ことにより、クライアント(S301〜S311)とサーバー
(S351〜S354)が協調して動作する。ステップS301で、
ハイパーテキストアドレスがユーザーによる表示画面上
でのキー操作によりクライアントに入力される。
【0079】ステップS302で、アドレス送信部301がS
301で入力されたアドレスを受け取り、ハイパーテキ
ストアドレスをサーバーへ送信する。
【0080】ステップS351で、ハイパーテキスト送信部
302が、クライアントから送信されたハイパーテキスト
アドレスを受信する。
【0081】ステップS352で、ハイパーテキスト送信部
302が、ハイパーテキスト格納部303からハイパーテキス
トアドレスに対応するハイパーテキストを読み出して、
S351で受信したアドレスを送信してきたクライアン
トへ送信する。
【0082】ステップS303で、ハイパーテキスト受信部
304が、サーバーから送信されたハイパーテキストを受
信する。
【0083】ステップS304で、ハイパーテキスト表示部
305が、S303で受信したハイパーテキストを文字や
画像に展開して表示する。
【0084】ステップS305で、表音文字列要求部306
が、受信したハイパーテキストに表音文字列を要求する
記述が含まれているか否かを判別する。
【0085】ステップS305でハイパーテキストに表音文
字列を要求する記述があるときはステップS306に進み、
無いときはステップS311へ進む。
【0086】ステップS306で、表音文字列要求部306
が、表音文字列要求をサーバーへ送信する。
【0087】ステップS307で、表音文字列要求部306
が、音声合成ユーザーインターフェース部309を起動す
る。
【0088】ステップS353で、表音文字列送信部307
が、クライアントから送信された表音文字列要求を受信
する。
【0089】ステップS354で、表音文字列送信部307
が、表音文字列要求に対応する表音文字列を表音文字列
格納部308から読み出して送信する。
【0090】ステップS308で、音声合成部310が、サー
バーから送信された表音文字列を受信する。
【0091】ステップS309で、音声合成部310が、表音
文字列を合成音声に変換する。
【0092】ステップS310で、合成音声とは別に、音声
合成部310からアドレス送信部301へハイパーテキストア
ドレスの文字列が出力されたか否かが判別され、出力さ
れたときはステップS301に戻り処理が続けられ、出力さ
れていないときはステップS311に進む。
【0093】ステップS311で、ハイパーテキストの閲覧
終了であるか否かが判別され、閲覧終了でないときはス
テップS301に戻り処理が続けられ、閲覧終了のときは処
理を終了する。
【0094】図15は、ステップS309における音声合成
部310の動作の詳細を示すものである。リンク先のハイ
パーテキストアドレスとそれに付随する表音文字列より
構成されるリンク情報が制御記号として表音文字列中に
記述され、解析中の表音文字列から検出された場合に、
それに応じて制御記号の中に記述されている表音文字列
を音声合成するように指示するコマンドを音声合成部31
0に入力する。また、音声合成ユーザーインターフェー
ス部309は、リンク情報の制御記号の中に記述されてい
る表音文字列が音声合成されているときに、コマンドが
ユーザの操作により入力された場合には、その入力され
たコマンドに応じた処理を実行する。この処理の詳細は
図15に示す。音声合成ユーザーインターフェース部30
9は、グラフィカルユーザーインターフェース(GU
I)あるいはキーボード入力に対応して動作するもので
あって、図11に示したような画面を表示して入力を受
け付けることによりGUIを可能とし、また、後述する
ようなキー入力も受け付けることで上述のコマンド入力
を可能とする。
【0095】図16は、ハイパーテキストのリンク情報
を表す制御記号の仕様の一例と表音文字列の例文であ
る。図17は、音声合成ユーザーインターフェース部30
9にリンク先へ移動するコマンドとして入力するキー入
力の例である。
【0096】ステップS30901で、音声合成部310が、音
声合成ユーザーインターフェース部309からのコマンド
入力を受け取る。
【0097】ステップS30902において、S30901で
入力されたコマンドが、現在音声合成している位置の次
のリンク情報を示す制御記号の中に記述されている表音
文字列を検索して音声合成するコマンドであるか否かが
判別され、「次のリンク」コマンドである場合には、ス
テップS30903でS306で受信した表音文字列を順次検
索して次のリンク情報を示す制御記号を検索し、その中
に記述されている表音文字列を検索して音声合成する。
例えば図16に示した例文の場合、「キャ’ノン/シャ
カイブンカシエンセ’ンター.シンチャクジョ’ーホ
ー.シャカイコ’ーケン.」に対応する合成音声が出力
されているときに「次にリンク」コマンドが入力された
場合には、次のリンク情報を示す制御記号「[* Link="h
ttp://example.canon.co.jp/html/test1.html"ココデ/
エムキーオ/オスト/シャカイコーケンノ/コウモクエ
/トビマス. *]」の中に記述されている表音文字列
「ココデ/エムキーオ/オスト/シャカイコーケンノ/
コウモクエ/トビマス.」を合成音声に変換し、出力を
開始する。音声出力している文がリンクであることをユ
ーザに報知するために、リンク情報に含まれる表音文字
列を音声出力する時は、リンク情報以外の音声とは声の
質を変えた合成音声にする。例えば、声の高さを一定に
した合成音声にする他、声の高さを変える、声の速さを
変える、話者の種類を変える、声の音質を変える、等の
声の質を変えてユーザが聴き取れればそれで良い。
【0098】制御記号の間の文、即ちリンク情報以外で
ある「フクシキ’キ.」に対応する合成音声が出力され
ているときに「次のリンク」コマンドが入力された場合
には、その時読み上げている音声の次にある次のリンク
情報を示す制御記号「[* Link=" http://example.cano
n.co.jp/html/test2.html"ココデ/エムキーオ/オスト
/フクシキキノ/コウモクエ/トビマス. *]」の中に
記述されている表音文字列「ココデ/エムキーオ/オス
ト/フクシキキノ/コウモクエ/トビマス.」を合成音
声に変換し、出力を開始する。先に示した例と同様に、
この文がリンクであることを示すために、声の質を変え
た合成音声にする。声の質を変える為に、リンク情報の
読み上げを開始する直前のリンク情報以外の読み上げ時
の声の質を保持しておき、これとは異なる性質を選択す
る。より効果的な性質を選択する為に、予めいくつかの
対応する質をテーブルとして登録しておき、この対応表
に従っても良い。
【0099】ステップS30904で、現在音声合成している
位置の前のリンク情報を示す制御記号の中に記述されて
いる表音文字列を検索して音声合成するコマンドである
か否かが判別され、「前のリンク」コマンドである場合
には、ステップS30905でその時音声出力している表音文
字列からさかのぼって前のリンク情報を示す制御記号を
検索し、その中に記述されている表音文字列を検索して
音声合成する。例えば図16に示した例文の場合、「ワ
ールドワ’イド/トップペ’ージエ.ガゾーヒョージ
ペ’ージエ.フォ’ーラムエ.」に対応する合成音声が
出力されているときに「前のリンク」コマンドが入力さ
れた場合には、前のリンク情報を示す制御記号「[* Lin
k=" http://example.canon.co.jp/html/test2.html"コ
コデ/エムキーオ/オスト/フクシキキノ/コウモクエ
/トビマス. *]」の中に記述されている表音文字列
「ココデ/エムキーオ/オスト/フクシキキノ/コウモ
クエ/トビマス.」を合成音声に変換し、出力を開始す
る。先に示した例と同様に、この文がリンクであること
を示すために、声の質を変えた合成音声にする。
【0100】制御記号の間の文「フクシキ’キ.」に対
応する合成音声が出力されているときに「前のリンク」
コマンドが入力された場合には、前のリンク情報を示す
制御記号「[* Link=" http://example.canon.co.jp/htm
l/test1.html"ココデ/エムキーオ/オスト/シャカイ
コーケンノ/コウモクエ/トビマス. *]」の中に記述
されている表音文字列「ココデ/エムキーオ/オスト/
シャカイコーケンノ/コウモクエ/トビマス.」を合成
音声に変換し、出力を開始する。先に示した例と同様
に、この文がリンクであることを示すために、声の質を
変えた合成音声にする。
【0101】ステップS30906で、リンク情報の制御記号
の中に記述されている表音文字列が音声合成されている
ときに「リンク先へ移動」コマンドが入力されたか否か
が判別され、条件を満たす場合には、ステップS30907で
制御記号中に記述されたハイパーテキストアドレスの文
字列を出力し、条件を満たさない場合はステップS30901
に戻り処理が続けられる。例えば図16に示した例文の
場合、リンク情報の制御記号「[* Link=" http://examp
le.canon.co.jp/html/test1.html"ココデ/エムキーオ
/オスト/シャカイコーケンノ/コウモクエ/トビマ
ス. *]」の中に記述されている表音文字列「ココデ/
エムキーオ/オスト/シャカイコーケンノ/コウモクエ
/トビマス.」が音声合成されているときに「リンク先
へ移動」コマンドが入力された場合は、ハイパーテキス
トアドレスの文字列「http://example.canon.co.jp/htm
l/test1.html」が合成音声とは別に音声合成部310から
アドレス送信部301へ出力される。
【0102】[実施例4]図18は、本発明の第4の実
施例に係るハイパーテキスト閲覧装置の機能構成図であ
る。本装置は、コンピュータネットワークを介してクラ
イアント(図18中央のネットワークの右側)とサーバ
ー(図18中央のネットワークの左側)が通信を行なう
クライアントサーバー方式によって動作する。
【0103】図18において、401はアドレス送信
部、402はハイパーテキスト送信部、403はハイパ
ーテキスト格納部、404はハイパーテキスト受信部、
405はハイパーテキスト表示部、406は音声合成モ
ジュール要求部、407は音声合成モジュール送信部、
408は音声合成モジュール格納部、409は音声合成
モジュール受信部である。
【0104】ここでは図19の流れ図を用いて、本実施
形態の動作を説明する。本実施形態のハイパーテキスト
閲覧装置は、コンピュータネットワークを介して情報の
授受を行なうことにより、クライアント(S401〜S
408)とサーバー(S451〜S454)が協調して
動作する。
【0105】ステップS401で、ハイパーテキストア
ドレスがユーザーからクライアントに入力される。
【0106】ステップS402で、アドレス送信部40
1が入力されたアドレスを受け取り、ハイパーテキスト
アドレスをサーバーへ送信する。
【0107】ステップS451で、ハイパーテキスト送
信部402が、クライアントから送信されたハイパーテ
キストアドレスを受信する。
【0108】ステップS452で、ハイパーテキスト送
信部402が、ハイパーテキスト格納部403からハイ
パーテキストアドレスに対応するハイパーテキストを読
み出してクライアントへ送信する。
【0109】ステップS403で、ハイパーテキスト受
信部404が、サーバーから送信されたハイパーテキス
トを受信する。
【0110】ステップS404で、ハイパーテキスト表
示部405が、ハイパーテキストを文字や画像として表
示する。
【0111】ステップS405で、音声合成モジュール
要求部406が、クライアントに音声合成モジュールが
組み込まれているか否かを判別する。ステップS405
でクライアントに音声合成モジュールが組み込まれてい
ないときはステップS406に進み、クライアントに音
声合成モジュールが組み込まれているときは処理を終了
する。
【0112】ステップS406で、音声合成モジュール
要求部S406が、音声合成モジュール要求をサーバー
へ送信する。
【0113】ステップS453で、音声合成モジュール
送信部407が、クライアントから送信された表音文字
列要求を受信する。
【0114】ステップS454で、音声合成モジュール
送信部407が、音声合成モジュール要求に対応する音
声合成モジュールを音声合成モジュール格納部408か
ら読み出して送信する。
【0115】ステップS407で、音声合成モジュール
受信部409が、サーバーから送信された音声合成モジ
ュールを受信する。
【0116】ステップS408で、音声合成モジュール
受信部409が、音声合成モジュールをクライアントに
組み込んで使用可能にして処理を終了する。この組み込
まれた音声合成モジュールは図1における音声合成部1
09を構策する。
【0117】[実施例5]図20は、本発明の第5の実
施形態に係るハイパーテキスト閲覧装置の機能構成図で
ある。本実施形態のハイパーテキスト閲覧装置は、コン
ピュータネットワークを介してクライアント(図20中
央のネットワークの右側)とサーバー(図20中央のネ
ットワークの左側)が通信を行なうクライアントサーバ
ー方式によって動作する。
【0118】図20において、4001はアドレス送信
部、4002はハイパーテキスト送信部、4003はハ
イパーテキスト格納部、4004はハイパーテキスト受
信部、4005はハイパーテキスト表示部、4006は
音声合成モジュール要求部、4007は音声合成モジュ
ール格納部である。
【0119】ここでは図21の流れ図を用いて、本実施
例の動作を説明する。本実施形態のハイパーテキスト閲
覧装置は、コンピュータネットワークを介して情報の授
受を行なうことにより、クライアント(S4001〜S
4008)とサーバー(S4051〜S4054)が協
調して動作する。
【0120】ステップS4001で、ハイパーテキスト
アドレスがユーザーからクライアントに入力される。
【0121】ステップS4002で、アドレス送信部4
001が入力されたアドレスを受け取り、ハイパーテキ
ストアドレスをサーバーへ送信する。
【0122】ステップS4051で、ハイパーテキスト
送信部4002が、クライアントから送信されたハイパ
ーテキストアドレスを受信する。
【0123】ステップS4052で、ハイパーテキスト
送信部4002が、ハイパーテキスト格納部4003か
らハイパーテキストアドレスに対応するハイパーテキス
トを読み出してクライアントへ送信する。
【0124】ステップS4003で、ハイパーテキスト
受信部4004が、サーバーから送信されたハイパーテ
キストを受信する。
【0125】ステップS4004で、ハイパーテキスト
表示部4005が、ハイパーテキストを文字や画像とし
て表示する。
【0126】ステップS4005で、音声合成モジュー
ル要求部4004が、受信したハイパーテキストに表音
文字列を要求する記述があるか否かを判別する。ステッ
プS4005で表音文字列を要求する記述がある場合
は、ステップS4006へ進み、ない場合にはステップ
S4009へ進む。
【0127】ステップS4006で、音声合成モジュー
ル要求部4006が、クライアントに音声合成モジュー
ルが組み込まれているか否かを判別する。ステップS4
006でクライアントに音声合成モジュールが組み込ま
れている場合にはステップS4007に進み、組み込ま
れていない場合にはステップS4009に進む。
【0128】ステップS4007で、音声合成モジュー
ル要求部4006は、クライアントの音声合成モジュー
ル格納部4007から音声合成モジュールを呼び出し、
クライアントの機能として組み込む。
【0129】ステップS4008で、ステップS400
7で組み込んだ音声合成モジュールは図1における音声
合成部として機能し、表音文字列を音声合成する。
【0130】ステップS4009で、ハイパーテキスト
の閲覧終了であるか否かを判別し、閲覧終了でない場合
にはステップS4001に戻り処理が続けられ、閲覧終
了のときは処理を終了する。
【0131】尚、上述の一連の処理は、クライアント側
のプロセス(プログラム)として実現されているが、上
記処理を実現するためのプロセス(プログラム)を、サ
ーバ側から送信されるハイパーテキストに記述すること
で実現することも可能である。その場合には、図21で
示される流れ図における、クライアント側の処理(S4
005〜S4008)についての内容が、ハイパーテキ
ストにプログラムの形態で埋め込まれることになる。
【0132】以上説明した処理によれば、サーバーから
クライアントへ表音文字列を送信してクライアントが表
音文字列を合成音声に変換するようにしたことにより、
サーバーからクライアントへ送信するデータ量が少なく
なる、音声の情報内容の変更がテキストの編集で可能に
なる、読み間違いやアクセントの間違いが生じない、サ
ーバー側で合成音声の高さや速さや話者やリンク情報を
指定することができる、合成音声を聞いてユーザーイン
ターフェースを操作することでハイパーテキストのリン
クを画面を見ずに移動することができるという効果があ
る。
【図面の簡単な説明】
【図1】第1の実施形態に係る装置の機能構成図
【図2】第1の実施形態における処理の流れ図
【図3】読み記号例示図
【図4】韻律記号例示図
【図5】制御記号例示図
【図6】読みとアクセントの記述例示図
【図7】文字列例示図
【図8】第2の実施形態に係る装置の機能構成図
【図9】第2の実施形態における処理の流れ図
【図10】音声出力処理におけるコマンド制御の流れで
ある
【図11】グラフィカルユーザーインターフェースに用
いる画面の一例
【図12】第2の実施形態に係るキー入力の一例
【図13】第3の実施形態に係る装置の機能構成図
【図14】第3の実施形態における処理の流れ図
【図15】第3の実施形態に係るリンク情報音声出力制
御の処理の流れである
【図16】第3の実施形態に係る表音文字列に記述する
制御記号の一例と表音文字列の例文
【図17】第3の実施形態に係るキー入力の一例
【図18】第4の実施形態に係る装置の機能構成図
【図19】第4の実施形態における処理の流れ図
【図20】第5の実施形態に係る装置の機能構成図
【図21】第5の実施形態における処理の流れ図
───────────────────────────────────────────────────── フロントページの続き (72)発明者 加美山 慎一 東京都大田区下丸子3丁目30番2号キヤノ ン株式会社内 (72)発明者 宮崎 康子 東京都大田区下丸子3丁目30番2号キヤノ ン株式会社内 Fターム(参考) 5D045 AA07 9A001 DD13 HH18 JJ25 JJ27

Claims (63)

    【特許請求の範囲】
  1. 【請求項1】 ハイパーテキストアドレスを送信するハ
    イパーテキストアドレス送信手段と、 ハイパーテキストを受信するハイパーテキスト受信手段
    と、 前記ハイパーテキスト受信手段により受信したハイパー
    テキストを表示する表示手段と、 文の読みとアクセントを記述する表音文字列を要求する
    表音文字列要求手段と、 前記表音文字列要求手段による要求により得た表音文字
    列を合成音声に変換する音声合成手段とにより構成され
    るクライアントと、 ハイパーテキストを格納するハイパーテキスト格納手段
    と、 前記ハイパーテキスト格納手段に格納されているハイパ
    ーテキストを送信するハイパーテキスト送信手段と、 表音文字列を格納する表音文字列格納手段と、 前記表音文字列格納手段により格納されている表音文字
    列を送信する表音文字列送信手段とにより構成されるサ
    ーバーとを備える音声情報処理装置。
  2. 【請求項2】 更に、前記表音文字列要求手段による要
    求により得た表音文字列に含まれている制御記号に従っ
    て、前記音声合成手段により合成する音声の特徴を変更
    する音声特徴変更手段を有することを特徴とする請求項
    1に記載の音声情報処理装置。
  3. 【請求項3】 前記音声特徴変更手段により変更する音
    声の特徴は、音声の高さ、速さ、話者のいずれかとする
    ことを特徴とする請求項2に記載の音声情報処理装置。
  4. 【請求項4】 前記音声合成手段により合成される音声
    の出力に関わる指示を入力する為のユーザインタフェー
    スとしてグラフィカルユーザーインターフェースを備え
    ることを特徴とする請求項1に記載の音声情報処理装
    置。
  5. 【請求項5】 前記音声の出力に関わる指示は、音声の
    出力開始終了、中断、再開、出力する音声の高さの変
    更、速さの変更、話者の変更のいずれかとすることを特
    徴とする請求項4に記載の音声情報処理装置。
  6. 【請求項6】 前記グラフィカルユーザインターフェー
    スとして、前記音声の出力に関わる指示を入力する為の
    操作画面を表示することを特徴とする請求項4に記載の
    音声情報処理装置。
  7. 【請求項7】 前記グラフィカルユーザインターフェー
    スとして表示された、前記音声の出力に関わる指示を入
    力する為の操作画面に対する指示に基づいて、入力され
    た指示の種類を判定することを特徴とする請求項6に記
    載の音声情報処理装置。
  8. 【請求項8】 前記音声合成手段により合成される音声
    の出力に関わる指示を入力する為のユーザインタフェー
    スとしてキーボードからの入力によるインターフェース
    を備えることを特徴とする請求項1に記載の音声情報処
    理装置。
  9. 【請求項9】 前記音声の出力に関わる指示は、音声の
    出力開始終了、中断、再開、出力する音声の高さの変
    更、速さの変更、話者の変更のいずれかとすることを特
    徴とする請求項6に記載の音声情報処理装置。
  10. 【請求項10】 前記表音文字列要求手段による要求に
    より得た表音文字列に、リンク先のハイパーテキストア
    ドレスとそれに付随する表音文字列とにより構成される
    リンク情報を含むことを特徴とする請求項1に記載の音
    声情報処理装置。
  11. 【請求項11】 前記リンク情報は、制御記号により他
    の表音文字列と識別可能な状態で構成することを特徴と
    する請求項10に記載の音声情報処理装置。
  12. 【請求項12】 前記グラフィカルユーザインターフェ
    ースにより音声の出力に関わる指示を入力した場合に、
    前記リンク情報に含まれる表音文字列を音声合成するこ
    とを特徴とする請求項4に記載の音声情報処理装置。
  13. 【請求項13】 前記キーボードから音声の出力に関わ
    る指示を入力した場合に、前記リンク情報に含まれる表
    音文字列を音声合成することを特徴とする請求項8に記
    載の音声情報処理装置。
  14. 【請求項14】 前記リンク情報に含まれる表音文字列
    を合成音声に変換する時に、他の表音文字列とは音声の
    声の質を変えることを特徴とする請求項12に記載の音
    声情報処理装置。
  15. 【請求項15】 前記リンク情報に含まれる表音文字列
    を合成音声に変換する時に、他の表音文字列とは音声の
    声の質を変えることを特徴とする請求項13に記載の音
    声情報処理装置。
  16. 【請求項16】 前記リンク情報に含まれる表音文字列
    を音声合成している時に指示が入力された場合に、当該
    表音文字列が構成するリンク情報に含まれるハイパーテ
    キストアドレスをサーバに送信し、リンク先のハイパー
    テキストを受信するよう制御する通信制御手段を有する
    ことを特徴とする請求項12に記載の音声情報処理装
    置。
  17. 【請求項17】 前記リンク情報に含まれる表音文字列
    を音声合成している時に指示が入力された場合に、当該
    表音文字列が構成するリンク情報に含まれるハイパーテ
    キストアドレスをサーバに送信し、リンク先のハイパー
    テキストを受信するよう制御する通信制御手段を有する
    ことを特徴とする請求項13に記載の音声情報処理装
    置。
  18. 【請求項18】 前記クライアントは、前記音声合成手
    段により実行する音声合成モジュールを前記サーバーに
    要求する音声合成モジュール要求手段と、 前記音声合成モジュールを受信して前記音声合成手段を
    構築する音声合成手段構築手段とを有することを特徴と
    する請求項1に記載の音声情報処理装置。
  19. 【請求項19】 前記サーバーは、音声合成モジュール
    を格納する音声合成モジュール格納手段と、 前記クライアントからの要求に応じて前記音声合成モジ
    ュール格納手段に格納されている音声合成モジュールを
    当該クライアントに送信する音声合成モジュール送信手
    段とを有することを特徴とする請求項1に記載の音声情
    報処理装置。
  20. 【請求項20】 前記表音文字列要求手段による表音文
    字列要求の前に、音声合成モジュールの有無を判定し、
    音声合成モジュールが無い場合には、当該要求をしない
    よう制御することを特徴とする請求項1に記載の音声情
    報処理装置。
  21. 【請求項21】 ハイパーテキストを受信するハイパー
    テキスト受信手段と、 前記ハイパーテキスト受信手段により受信したハイパー
    テキストに含まれる情報に応じて、文の読みとアクセン
    トを記述する表音文字列を要求する表音文字列要求手段
    と、 前記表音文字列要求手段による要求により得た表音文字
    列を合成音声に変換する音声合成手段とを有することを
    特徴とする音声情報処理装置。
  22. 【請求項22】 ハイパーテキストアドレスを送信し、 ハイパーテキストを受信し、 前記受信したハイパーテキストを表示し、 文の読みとアクセントを記述する表音文字列を要求し、 前記要求により得た表音文字列を合成音声に変換するク
    ライアント機能と、 格納されているハイパーテキストを送信し、 格納されている表音文字列を送信するサーバー機能とよ
    りなることを特徴とする音声情報処理方法。
  23. 【請求項23】 更に、要求により得た表音文字列に含
    まれている制御記号に従って、前記合成する音声の特徴
    を変更することを特徴とする請求項22に記載の音声情
    報処理方法。
  24. 【請求項24】 前記変更する音声の特徴は、音声の高
    さ、速さ、話者のいずれかとすることを特徴とする請求
    項2に記載の音声情報処理方法。
  25. 【請求項25】 前記合成される音声の出力に関わる指
    示を入力する為のユーザインタフェースとしてグラフィ
    カルユーザーインターフェースを用いることを特徴とす
    る請求項22に記載の音声情報処理方法。
  26. 【請求項26】 前記音声の出力に関わる指示は、音声
    の出力開始終了、中断、再開、出力する音声の高さの変
    更、速さの変更、話者の変更のいずれかとすることを特
    徴とする請求項25に記載の音声情報処理方法。
  27. 【請求項27】 前記グラフィカルユーザインターフェ
    ースとして、前記音声の出力に関わる指示を入力する為
    の操作画面を表示することを特徴とする請求項25に記
    載の音声情報処理方法。
  28. 【請求項28】 前記グラフィカルユーザインターフェ
    ースとして表示された、前記音声の出力に関わる指示を
    入力する為の操作画面に対する指示に基づいて、入力さ
    れた指示の種類を判定することを特徴とする請求項27
    に記載の音声情報処理方法。
  29. 【請求項29】 前記合成される音声の出力に関わる指
    示を入力する為のユーザインタフェースとしてキーボー
    ドからの入力によるインターフェースを備えることを特
    徴とする請求項22に記載の音声情報処理方法。
  30. 【請求項30】 前記音声の出力に関わる指示は、音声
    の出力開始終了、中断、再開、出力する音声の高さの変
    更、速さの変更、話者の変更のいずれかとすることを特
    徴とする請求項27に記載の音声情報処理方法。
  31. 【請求項31】 前記要求により得た表音文字列に、リ
    ンク先のハイパーテキストアドレスとそれに付随する表
    音文字列とにより構成されるリンク情報を含むことを特
    徴とする請求項22に記載の音声情報処理方法。
  32. 【請求項32】 前記リンク情報は、制御記号により他
    の表音文字列と識別可能な状態で構成することを特徴と
    する請求項31に記載の音声情報処理方法。
  33. 【請求項33】 前記グラフィカルユーザインターフェ
    ースにより音声の出力に関わる指示を入力した場合に、
    前記リンク情報に含まれる表音文字列を音声合成するこ
    とを特徴とする請求項25に記載の音声情報処理方法。
  34. 【請求項34】 前記キーボードから音声の出力に関わ
    る指示を入力した場合に、前記リンク情報に含まれる表
    音文字列を音声合成することを特徴とする請求項29に
    記載の音声情報処理方法。
  35. 【請求項35】 前記リンク情報に含まれる表音文字列
    を合成音声に変換する時に、他の表音文字列とは音声の
    声の質を変えることを特徴とする請求項33に記載の音
    声情報処理方法。
  36. 【請求項36】 前記リンク情報に含まれる表音文字列
    を合成音声に変換する時に、他の表音文字列とは音声の
    声の質を変えることを特徴とする請求項34に記載の音
    声情報処理方法。
  37. 【請求項37】 前記リンク情報に含まれる表音文字列
    を音声合成している時に指示が入力された場合に、当該
    表音文字列が構成するリンク情報に含まれるハイパーテ
    キストアドレスをサーバに送信し、リンク先のハイパー
    テキストを受信するよう制御することを特徴とする請求
    項33に記載の音声情報処理方法。
  38. 【請求項38】 前記リンク情報に含まれる表音文字列
    を音声合成している時に指示が入力された場合に、当該
    表音文字列が構成するリンク情報に含まれるハイパーテ
    キストアドレスをサーバに送信し、リンク先のハイパー
    テキストを受信するよう制御することを特徴とする請求
    項34に記載の音声情報処理方法。
  39. 【請求項39】 前記クライアント機能において、前記
    音声合成を実行する音声合成モジュールを前記サーバー
    機能に要求し、 前記音声合成モジュールを受信して格納することを特徴
    とする請求項22に記載の音声情報処理方法。
  40. 【請求項40】 前記サーバー機能は、前記クライアン
    ト機能からの要求に応じて格納されている音声合成モジ
    ュールを当該クライアントに送信することを特徴とする
    請求項22に記載の音声情報処理方法。
  41. 【請求項41】 前記表音文字列要求の前に、音声合成
    モジュールの有無を判定し、音声合成モジュールが無い
    場合には、当該要求をしないよう制御することを特徴と
    する請求項22に記載の音声情報処理方法。
  42. 【請求項42】 ハイパーテキストを受信し、 前記受信したハイパーテキストに含まれる情報に応じ
    て、文の読みとアクセントを記述する表音文字列を要求
    し、 前記要求により得た表音文字列を合成音声に変換するこ
    とを特徴とする音声情報処理方法。
  43. 【請求項43】 ハイパーテキストアドレスを送信する
    ハイパーテキストアドレス送信工程の制御プログラム
    と、 ハイパーテキストを受信するハイパーテキスト受信工程
    の制御プログラムと、 前記受信したハイパーテキストを表示する表示手工程の
    制御プログラムと、 文の読みとアクセントを記述する表音文字列を要求する
    表音文字列要求工程の制御プログラムと、 前記要求により得た表音文字列を合成音声に変換する音
    声合成工程の制御プログラムとにより構成されるクライ
    アント機能の制御プログラムと、 ハイパーテキストを格納するハイパーテキスト格納工程
    の制御プログラムと、 前記格納されているハイパーテキストを送信するハイパ
    ーテキスト送信工程の制御プログラムと、 表音文字列を格納する表音文字列格納工程の制御プログ
    ラムと、 前記格納されている表音文字列を送信する表音文字列送
    信工程の制御プログラムとにより構成されるサーバー機
    能の制御プログラムとを記憶したコンピュータにより読
    み取り可能な記憶媒体。
  44. 【請求項44】 更に、前記表音文字列要求工程におけ
    る要求により得た表音文字列に含まれている制御記号に
    従って、前記音声合成工程において合成する音声の特徴
    を変更する音声特徴変更工程の制御プログラムを記憶し
    たことを特徴とする請求項43に記載のコンピュータに
    より読み取り可能な記憶媒体。
  45. 【請求項45】 前記音声特徴変更工程において変更す
    る音声の特徴は、音声の高さ、速さ、話者のいずれかと
    することを特徴とする請求項2に記載のコンピュータに
    より読み取り可能な記憶媒体。
  46. 【請求項46】 前記音声合成工程において合成される
    音声の出力に関わる指示を入力する為のユーザインタフ
    ェースとしてグラフィカルユーザーインターフェースを
    備えることを特徴とする請求項43に記載のコンピュー
    タにより読み取り可能な記憶媒体。
  47. 【請求項47】 前記音声の出力に関わる指示は、音声
    の出力開始終了、中断、再開、出力する音声の高さの変
    更、速さの変更、話者の変更のいずれかとすることを特
    徴とする請求項46に記載のコンピュータにより読み取
    り可能な記憶媒体。
  48. 【請求項48】 前記グラフィカルユーザインターフェ
    ースとして、前記音声の出力に関わる指示を入力する為
    の操作画面を表示する工程の制御プログラムを記憶した
    ことを特徴とする請求項46に記載のコンピュータによ
    り読み取り可能な記憶媒体。
  49. 【請求項49】 前記グラフィカルユーザインターフェ
    ースとして表示された、前記音声の出力に関わる指示を
    入力する為の操作画面に対する指示に基づいて、入力さ
    れた指示の種類を判定する工程の制御プログラムを記憶
    したことを特徴とする請求項48に記載のコンピュータ
    により読み取り可能な記憶媒体。
  50. 【請求項50】 前記音声合成工程において合成される
    音声の出力に関わる指示を入力する為のユーザインタフ
    ェースとしてキーボードからの入力によるインターフェ
    ースを備えることを特徴とする請求項43に記載のコン
    ピュータにより読み取り可能な記憶媒体。
  51. 【請求項51】 前記音声の出力に関わる指示は、音声
    の出力開始終了、中断、再開、出力する音声の高さの変
    更、速さの変更、話者の変更のいずれかとすることを特
    徴とする請求項48に記載のコンピュータにより読み取
    り可能な記憶媒体。
  52. 【請求項52】 前記表音文字列要求工程における要求
    により得た表音文字列に、リンク先のハイパーテキスト
    アドレスとそれに付随する表音文字列とにより構成され
    るリンク情報を含むことを特徴とする請求項43に記載
    のコンピュータにより読み取り可能な記憶媒体。
  53. 【請求項53】 前記リンク情報は、制御記号により他
    の表音文字列と識別可能な状態で構成することを特徴と
    する請求項52に記載のコンピュータにより読み取り可
    能な記憶媒体。
  54. 【請求項54】 前記グラフィカルユーザインターフェ
    ースにより音声の出力に関わる指示を入力した場合に、
    前記リンク情報に含まれる表音文字列を音声合成する工
    程の制御プログラムを記憶したことを特徴とする請求項
    46に記載のコンピュータにより読み取り可能な記憶媒
    体。
  55. 【請求項55】 前記キーボードから音声の出力に関わ
    る指示を入力した場合に、前記リンク情報に含まれる表
    音文字列を音声合成する工程の制御プログラムを記憶し
    たことを特徴とする請求項50に記載のコンピュータに
    より読み取り可能な記憶媒体。
  56. 【請求項56】 前記リンク情報に含まれる表音文字列
    を合成音声に変換する時に、他の表音文字列とは音声の
    声の質を変えることを特徴とする請求項64に記載のコ
    ンピュータにより読み取り可能な記憶媒体。
  57. 【請求項57】 前記リンク情報に含まれる表音文字列
    を合成音声に変換する時に、他の表音文字列とは音声の
    声の質を変えることを特徴とする請求項67に記載のコ
    ンピュータにより読み取り可能な記憶媒体。
  58. 【請求項58】 前記リンク情報に含まれる表音文字列
    を音声合成している時に指示が入力された場合に、当該
    表音文字列が構成するリンク情報に含まれるハイパーテ
    キストアドレスをサーバに送信し、リンク先のハイパー
    テキストを受信するよう制御する通信制御工程の制御プ
    ログラムを記憶したことを特徴とする請求項54に記載
    のコンピュータにより読み取り可能な記憶媒体。
  59. 【請求項59】 前記リンク情報に含まれる表音文字列
    を音声合成している時に指示が入力された場合に、当該
    表音文字列が構成するリンク情報に含まれるハイパーテ
    キストアドレスをサーバに送信し、リンク先のハイパー
    テキストを受信するよう制御する通信制御工程の制御プ
    ログラムを記憶したことを特徴とする請求項55に記載
    のコンピュータにより読み取り可能な記憶媒体。
  60. 【請求項60】 前記クライアント機能において、前記
    音声合成工程を実行する音声合成モジュールを前記サー
    バーに要求する音声合成モジュール要求工程の制御プロ
    グラムと、 前記音声合成モジュールを受信して前記音声合成工程の
    制御プログラムを構築する音声合成工程構築工程の制御
    プログラムとを有することを特徴とする請求項43に記
    載の音声情報処理装置。
  61. 【請求項61】 前記サーバー機能において、前記クラ
    イアントからの要求に応じて前記格納されている音声合
    成モジュールを当該クライアントに送信する音声合成モ
    ジュール送信工程の制御プログラムを記憶したことを特
    徴とする請求項43に記載の音声情報処理装置。
  62. 【請求項62】 前記表音文字列要求工程における表音
    文字列要求の前に、音声合成モジュールの有無を判定
    し、音声合成モジュールが無い場合には、当該要求をし
    ないよう制御する工程の制御プログラムを記憶したこと
    を特徴とする請求項43に記載の音声情報処理装置。
  63. 【請求項63】 ハイパーテキストを受信するハイパー
    テキスト受信工程の制御プログラムと、 前記受信したハイパーテキストに含まれる情報に応じ
    て、文の読みとアクセントを記述する表音文字列を要求
    する表音文字列要求工程の制御プログラムと、前記要求
    により得た表音文字列を合成音声に変換する音声合成工
    程の制御プログラムとを記憶したことを特徴とするコン
    ピュータにより読み取り可能な記憶媒体。
JP11217219A 1999-07-30 1999-07-30 音声情報処理方法、装置及び記憶媒体 Pending JP2001043064A (ja)

Priority Applications (3)

Application Number Priority Date Filing Date Title
JP11217219A JP2001043064A (ja) 1999-07-30 1999-07-30 音声情報処理方法、装置及び記憶媒体
DE60024727T DE60024727T2 (de) 1999-07-30 2000-07-26 Analyse von heruntergeladenen Dokumenten für einen Browser mit Sprachsynthese-Fähigkeit
EP00306355A EP1073036B1 (en) 1999-07-30 2000-07-26 Parsing of downloaded documents for a speech synthesis enabled browser

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP11217219A JP2001043064A (ja) 1999-07-30 1999-07-30 音声情報処理方法、装置及び記憶媒体

Publications (1)

Publication Number Publication Date
JP2001043064A true JP2001043064A (ja) 2001-02-16

Family

ID=16700731

Family Applications (1)

Application Number Title Priority Date Filing Date
JP11217219A Pending JP2001043064A (ja) 1999-07-30 1999-07-30 音声情報処理方法、装置及び記憶媒体

Country Status (3)

Country Link
EP (1) EP1073036B1 (ja)
JP (1) JP2001043064A (ja)
DE (1) DE60024727T2 (ja)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002229578A (ja) * 2001-01-31 2002-08-16 Sharp Corp 音声合成装置及び音声合成方法並びに音声合成プログラムを記録したコンピュータ読み取り可能な記録媒体
JP2002342212A (ja) * 2001-04-27 2002-11-29 Internatl Business Mach Corp <Ibm> 情報アクセス方法、情報アクセスシステムおよびプログラム
JP2002358092A (ja) * 2001-06-01 2002-12-13 Sony Corp 音声合成システム
JP2006350091A (ja) * 2005-06-17 2006-12-28 Nippon Telegr & Teleph Corp <Ntt> 音声合成方法、音声合成情報処理方法、クライアント端末、音声合成情報処理サーバ、クライアント端末プログラム、音声合成情報処理プログラム
WO2013061718A1 (ja) * 2011-10-28 2013-05-02 日立公共システムエンジニアリング株式会社 音声合成情報付きのテキストデータ提供装置及びテキストデータ提供方法

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20030187656A1 (en) * 2001-12-20 2003-10-02 Stuart Goose Method for the computer-supported transformation of structured documents
JP4462901B2 (ja) * 2003-11-11 2010-05-12 富士通株式会社 モーダル同期制御方法およびマルチモーダルインターフェイスシステム
WO2008132533A1 (en) * 2007-04-26 2008-11-06 Nokia Corporation Text-to-speech conversion method, apparatus and system
US9117451B2 (en) * 2013-02-20 2015-08-25 Google Inc. Methods and systems for sharing of adapted voice profiles
US10978060B2 (en) 2014-01-31 2021-04-13 Hewlett-Packard Development Company, L.P. Voice input command
CN110737817A (zh) * 2018-07-02 2020-01-31 中兴通讯股份有限公司 浏览器的信息处理方法、装置、智能设备及存储介质

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP0542628B1 (en) * 1991-11-12 2001-10-10 Fujitsu Limited Speech synthesis system
US6240448B1 (en) * 1995-12-22 2001-05-29 Rutgers, The State University Of New Jersey Method and system for audio access to information in a wide area computer network
US5915001A (en) * 1996-11-14 1999-06-22 Vois Corporation System and method for providing and using universally accessible voice and speech data files
US6018710A (en) * 1996-12-13 2000-01-25 Siemens Corporate Research, Inc. Web-based interactive radio environment: WIRE
US5899975A (en) * 1997-04-03 1999-05-04 Sun Microsystems, Inc. Style sheets for speech-based presentation of web pages
US6246672B1 (en) * 1998-04-28 2001-06-12 International Business Machines Corp. Singlecast interactive radio system

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002229578A (ja) * 2001-01-31 2002-08-16 Sharp Corp 音声合成装置及び音声合成方法並びに音声合成プログラムを記録したコンピュータ読み取り可能な記録媒体
JP2002342212A (ja) * 2001-04-27 2002-11-29 Internatl Business Mach Corp <Ibm> 情報アクセス方法、情報アクセスシステムおよびプログラム
JP2002358092A (ja) * 2001-06-01 2002-12-13 Sony Corp 音声合成システム
JP2006350091A (ja) * 2005-06-17 2006-12-28 Nippon Telegr & Teleph Corp <Ntt> 音声合成方法、音声合成情報処理方法、クライアント端末、音声合成情報処理サーバ、クライアント端末プログラム、音声合成情報処理プログラム
JP4653572B2 (ja) * 2005-06-17 2011-03-16 日本電信電話株式会社 クライアント端末、音声合成情報処理サーバ、クライアント端末プログラム、音声合成情報処理プログラム
WO2013061718A1 (ja) * 2011-10-28 2013-05-02 日立公共システムエンジニアリング株式会社 音声合成情報付きのテキストデータ提供装置及びテキストデータ提供方法
JP2013097033A (ja) * 2011-10-28 2013-05-20 Hitachi Government & Public Corporation System Engineering Ltd 音声合成情報付きのテキストデータ提供装置及びテキストデータ提供方法

Also Published As

Publication number Publication date
EP1073036A3 (en) 2003-12-17
EP1073036A2 (en) 2001-01-31
DE60024727D1 (de) 2006-01-19
EP1073036B1 (en) 2005-12-14
DE60024727T2 (de) 2006-07-20

Similar Documents

Publication Publication Date Title
KR101027548B1 (ko) 통신 시스템용 보이스 브라우저 다이얼로그 인에이블러
US10720145B2 (en) Speech synthesis apparatus, speech synthesis method, speech synthesis program, portable information terminal, and speech synthesis system
US8073700B2 (en) Retrieval and presentation of network service results for mobile device using a multimodal browser
KR100724868B1 (ko) 다수의 합성기를 제어하여 다양한 음성 합성 기능을제공하는 음성 합성 방법 및 그 시스템
TWI511125B (zh) 語音操控方法、行動終端裝置及語音操控系統
JP4271224B2 (ja) 音声翻訳装置、音声翻訳方法、音声翻訳プログラムおよびシステム
JP2023539820A (ja) インタラクティブ情報処理方法、装置、機器、及び媒体
KR20120086287A (ko) 음성번역 시스템, 제1 단말장치, 음성인식 서버장치, 번역 서버장치, 및 음성합성 서버장치
JP3862470B2 (ja) データ処理装置及び方法、ブラウザシステム、ブラウザ装置、記録媒体
US6732078B1 (en) Audio control method and audio controlled device
JP2005500591A (ja) 情報処理装置及びその方法、プログラム
JP2001043064A (ja) 音声情報処理方法、装置及び記憶媒体
EP2747464A1 (en) Sent message playing method, system and related device
KR100826778B1 (ko) 멀티모달을 위한 브라우저 기반의 무선 단말과, 무선단말을 위한 브라우저 기반의 멀티모달 서버 및 시스템과이의 운용 방법
US20140129228A1 (en) Method, System, and Relevant Devices for Playing Sent Message
US20080243510A1 (en) Overlapping screen reading of non-sequential text
JP3714159B2 (ja) ブラウザ搭載装置
JP6449181B2 (ja) 音声翻訳システム、音声翻訳方法、及び音声翻訳プログラム
KR102020341B1 (ko) 악보 구현 및 음원 재생 시스템 및 그 방법
JP2001075968A (ja) 情報検索方法及びそれを記録した記録媒体
JPH10322478A (ja) 音声によるハイパーテキストアクセス装置
JP2005164944A (ja) 動作パラメータ決定装置、電子装置、音声合成装置、対話システム、動作パラメータ決定方法、及びコンピュータで読み取り可能な制御プログラム
JP2006048352A (ja) キャラクタ映像表示機能付き通信端末およびその制御方法
KR100596001B1 (ko) 사용자 단말기에 소정의 콘텐츠를 제공하기 위한 방법 및그 시스템
JP2004072274A (ja) 音声処理システム及びその制御方法

Legal Events

Date Code Title Description
A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20040903

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20050301

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20050428

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20060516