JP2001255885A

JP2001255885A - 音声ブラウザシステム

Info

Publication number: JP2001255885A
Application number: JP2000068777A
Authority: JP
Inventors: Tomohiro Iwanaga; 智博岩永
Original assignee: Oki Electric Industry Co Ltd
Current assignee: Oki Electric Industry Co Ltd
Priority date: 2000-03-13
Filing date: 2000-03-13
Publication date: 2001-09-21

Abstract

(57)【要約】【課題】低容量のメモリしか持たないシステムでも実
行可能であり、また、ＣＰＵに対する負荷の少ない音声
ブラウザシステムを提供することを目的とする。【解決手段】クライアントは、サーバーよりＨＴＭＬ
データを取得する手段１１と、サーバーからＨＴＭＬデ
ータと共に転送されたリンク対応語の音声認識辞書デー
タを抽出する手段１２と、音声認識辞書データを用いて
リンク対応語の音声認識を行う音声認識手段１５と、音
声認識手段により出力されたリンク情報に基づき対応す
るＵＲＬ情報を抽出し、該ＵＲＬ情報に対応するＨＴＭ
Ｌデータをサーバに要求する手段１１とを有し、サーバ
は、クライアントにより指定されたＵＲＬ情報からＨＴ
ＭＬデータを取得する手段２４と、ＨＴＭＬデータから
リンク対応語を抽出する手段２５と、音声認識辞書デー
タからリンク対応語に対応する音声認識辞書データを抽
出する手段２６と、ＨＴＭＬデータと音声認識辞書デー
タを統合したデータをクライアントに送信する手段２４
とを有する。

Description

【発明の詳細な説明】

【０００１】

【発明の属する技術分野】この発明はコンピュータネッ
トワーク上に存在するサーバーからテキストデータを中
心とする情報を検索し表示するシステムに関し、特に音
声を利用したシステムに関するものである。

【０００２】

【従来の技術】従来、コンピュータネットワーク上、特
にインターネットにおいてサーバー／クライアント形式
でテキストや画像、音声などの情報を提供するＷＷＷ
（ＷｏｒｌｄＷｉｄｅＷｅｂ）システムがある。Ｗ
ＷＷシステムではＨＴＭＬ（ＨｙｐｅｒＴｅｘｔＭ
ａｒｋｕｐＬａｎｇｕａｇｅ）と呼ばれるハイパーテ
キスト形式で情報がサーバーからクライアントに送られ
る。クライアントではブラウザと呼ばれる情報閲覧装置
を用いてＨＴＭＬで記述されたテキストを閲覧する。読
み込まれたハイパーテキストにはリンクと呼ばれるタグ
が埋め込まれており、リンクから別のハイパーテキスト
を読み込むことができる。

【０００３】図９（ａ）にＨＴＭＬデータの例を示す。
図に示されるようなＨＴＭＬデータをブラウザで表示す
ると図９（ｂ）のようになる。図９（ｂ）の１０がリン
クである。一般的なブラウザではリンクされている部分
は文字の色を変えたり、下線を引くなど他のテキストと
区別できるように表示されている。リンクをマウスなど
のポインティングデバイスで選択すると、リンクされて
いるＨＴＭＬデータが読み込まれ、表示される。例え
ば、図９（ｂ）の１０のリンクで「ニュース」というリ
ンクを指定する単語（以下、リンク対応語とする）を選
択すると図９（ａ）のＨＴＭＬデータの記述により”ｎ
ｅｗｓ．ｈｔｍｌ”というＨＴＭＬデータが読み込まれ
る。

【０００４】また、近年、テキスト音声合成技術と音声
認識技術を組み合わせて画面を見なくてもＨＴＭＬデー
タにアクセスすることができる音声ブラウザがある。こ
の音声ブラウザでは、ＨＴＭＬデータのテキストを音声
合成で音声出力し、リンクを音声認識で選択することが
できる。

【０００５】

【発明が解決しようとする課題】前述の音声ブラウザで
は画面を見ずに音声のみでＨＴＭＬデータを検索するこ
とができる。リンクの選択時に音声認識技術が使用され
るが、リンク対応語はあらゆる単語が想定されるため、
大規模な音声認識用辞書が必要となる。したがって、こ
れまでの音声ブラウザは大容量音声認識辞書が格納でき
る大容量記憶装置を持ったコンピュータなどでしか実現
できなかった。しかしながら、音声認識処理は大容量音
声認識辞書を検索するので処理に時間がかかるという問
題があった。

【０００６】また、現在は携帯電話機または携帯端末等
の小型機器でＨＴＭＬデータをブラウズする装置が存在
しているが、これらの小型機器に音声ブラウザを搭載す
る場合、記憶装置に限界があるため、大容量の音声認識
用辞書を搭載することができず、リンクの選択には音声
認識が使えないためポインティングデバイスによって選
択するしかない状況にあった。

【０００７】一方、近年のノート型パーソナルコンピュ
ータ（ノートＰＣ）においては、大容量の記憶容量もっ
た記憶装置が使えるようになったので大容量音声認識辞
書を使用することが可能であるが、膨大な認識対象語か
らリンク対応語を認識するには多くの処理が必要であ
る。このような処理を高速に実行するためには高性能の
プロセッサを備えた装置が必要であり、一般にこのよう
な装置は高価である。

【０００８】本発明は、前記従来の問題点を解決し、低
容量のメモリしか持たないシステムでも実行可能であ
り、また、ＣＰＵに対する負荷の少ない音声ブラウザシ
ステムを提供することを目的とする。

【０００９】

【課題を解決するための手段】そのために、本発明（請
求項１）は、コンピュータネットワーク上においてサー
バー／クライアント形式でテキストや画像、音声などの
情報を提供するＷＷＷシステムにおける音声ブラウザシ
ステムにおいて、前記クライアントを、サーバーよりＨ
ＴＭＬデータを取得する手段と、サーバーからＨＴＭＬ
データと共に転送されたリンク対応語の音声認識辞書デ
ータを抽出する手段と、該音声認識辞書データを用いて
リンク対応語の音声認識を行う音声認識手段と、該音声
認識手段により出力されたリンク情報に基づき対応する
ＵＲＬ情報を抽出し、該ＵＲＬ情報に対応するＨＴＭＬ
データをサーバに要求する手段とを有する構成とすると
共に、前記サーバを、クライアントにより指定されたＵ
ＲＬ情報からＨＴＭＬデータを取得する手段と、該ＨＴ
ＭＬデータからリンク対応語を抽出する手段と、音声認
識辞書データからリンク対応語に対応する音声認識辞書
データを抽出する手段と、ＨＴＭＬデータと音声認識辞
書データを統合したデータをクライアントに送信する手
段とを有する構成とした。

【００１０】また、本発明（請求項２）は、コンピュー
タネットワーク上においてサーバー／クライアント形式
でテキストや画像、音声などの情報を提供するＷＷＷシ
ステムにおける音声ブラウザシステムにおいて、前記ク
ライアントを、サーバーよりＨＴＭＬデータを取得する
手段と、サーバーからＨＴＭＬデータと共に転送された
リンク対応語の音声認識対象語リストを抽出する手段
と、該音声認識対象語リストを分解して単語単位辞書デ
ータを生成する手段と、該単語単位辞書データを用いて
リンク対応語の音声認識を行う音声認識手段と、該音声
認識手段により出力されたリンク情報に基づき対応する
ＵＲＬ情報を抽出し、該ＵＲＬ情報に対応するＨＴＭＬ
データをサーバに要求する手段とを有する構成とすると
共に、前記サーバを、クライアントにより指定されたＵ
ＲＬ情報からＨＴＭＬデータを取得する手段と、該ＨＴ
ＭＬデータからリンク対応語を抽出する手段と、該リン
ク対応語に対応する音声認識対象語リストを抽出する手
段と、ＨＴＭＬデータと音声認識対象語リストを統合し
たデータを前記クライアントに送信する手段とを有する
構成とした。

【００１１】

【発明の実施の形態】図８は、本発明の実施形態におけ
るネットワークの構成例を示したもので、クライアント
端末２２，２３およびクライアントからのデータ取得要
求に対する応答その他の処理を行う音声プロキシサーバ
２１，クライアントから要求されたＵＲＬに対するＨＴ
ＭＬデータを出力するＷＷＷサーバから構成されてい
る。以下、図面を参照して本発明の実施の形態について
詳細に説明する。

【００１２】＜第１の実施形態＞＜構成＞図１は、第１の実施形態の音声ブラウザシステ
ムにおける装置構成図であり、図１（ａ）はクライアン
ト端末である音声ブラウザ装置の構成図を示している。
図１（ａ）において、１１はネットワークと通信を行う
ネットワーク通信部、１２はネットワークを経由して得
られたＨＴＭＬデータを解析するＨＴＭＬ解析部、１３
は１２で解析されたＨＴＭＬデータを表示する表示部、
１４はＨＴＭＬデータに含まれるテキストを音声合成す
るテキスト音声合成部、１５は音声を認識する音声認識
部、１６は１５で使用するための音声認識辞書、１７は
１４で音声合成された音声を出力するためのスピーカ
ー、１８は音声認識部に音声を入力するためのマイクで
ある。

【００１３】図１（ｂ）は音声プロキシ（代理）サーバ
の構成図を示している。図１（ｂ）において、２４はネ
ットワークと通信を行うネットワーク通信部、２５はク
ライアントから要求があったＵＲＬに基づいて読み込ん
だＨＴＭＬデータを解析するＨＴＭＬ解析部、２６は入
力された単語に対応する音声認識辞書データを抽出する
音声認識辞書抽出部、２７は音声認識辞書、２８はＨＴ
ＭＬデータに音声認識辞書データを付加する音声認識辞
書データ付きＨＴＭＬデータ生成部である。

【００１４】＜動作＞以下、図１，図２、図３を参照し
て動作の説明を行う。クライアント端末である音声ブラ
ウザ装置は、ネットワーク通信部１１を介してＨＴＭＬ
データとＨＴＭＬデータ中に含まれるリンク対応語の音
声認識用辞書データをネットワーク上から受信する。例
えば、図９（ａ）のようなＨＴＭＬデータの場合、リン
クに対応する言葉として「ニュース」、「天気予報」、
「交通情報」、「その他」があるので、これらのリンク
対応語に対する音声認識辞書データをＨＴＭＬデータと
共に受信する。

【００１５】ＨＴＭＬ解析部１２ではネットワーク通信
部１１が受信したＨＴＭＬデータと音声認識辞書データ
が転送され、ＨＴＭＬデータを解析し、表示部１３にテ
キストデータを送り表示する。またテキスト音声変換部
１４にもテキストを転送し、テキストをテキスト音声変
換部１４で音声合成し、スピーカー１７より出力する。
ＨＴＭＬ解析部１２に転送された音声認識辞書データは
音声認識辞書１６へ転送される。

【００１６】マイク１８より入力されたリンク対応語の
音声は音声認識部１５で音声認識辞書１６を参照して音
声認識を行い、リンク対応語が認識されたらＨＴＭＬ解
析部１２にリンク情報を送る。ＨＴＭＬ解析部１２は音
声認識部１５より送られたリンク情報に基づいて対応す
るＵＲＬを抽出し、をネットワーク通信部１１に送り、
ＵＲＬにより指定されたＨＴＭＬデータを転送してもら
うよう要求信号を音声プロキシサーバに送出する（図２
の）。

【００１７】クライアントから要求を受けた音声プロキ
シサーバーは指定ＵＲＬへＨＴＭＬデータを要求する
（図２の）。音声プロキシサーバーより要求を受けた
ＷＷＷサーバーは音声プロキシサーバーへ指定のＨＴＭ
Ｌデータを送信する（図２の）。

【００１８】ＷＷＷサーバーよりＨＴＭＬデータを受信
した音声プロキシサーバーは内部処理でリンク対応語に
該当する音声認識辞書データを抽出し（図２の）、ク
ライアントから要求されたＨＴＭＬデータに音声認識辞
書データを加えてクライアントへ送信する（図２の
）。

【００１９】次に音声プロキシサーバー内の動作につい
て図３のフローチャートを使用して説明する。処理（Ｓ
７−１）は処理のスタートである。処理（Ｓ７−２）で
はクライアントからＵＲＬを受信する。処理（Ｓ７−
３）では指定されたＵＲＬに存在するＷＷＷサーバーよ
りＨＴＭＬデータを受信する。処理（Ｓ７−４）では受
信したＨＴＭＬデータの中からリンク情報を検索し、リ
ンクがなければ処理（Ｓ７−１１）へ処理を移し、リン
クが存在すれば次の処理（Ｓ７−５）へ進む。処理（Ｓ
７−５）ではリンク対応語を抽出し、処理（Ｓ７−６）
では音声認識辞書と照合する。処理（Ｓ７−７）ではリ
ンク対応語の音声認識辞書データを抽出し、処理（Ｓ７
−８）ではリンク対応語と音声認識辞書データの統合を
行う。処理（Ｓ７−９）では処理（Ｓ７−８）で作られ
たデータとＨＴＭＬデータを共にクライアントへ送信す
る。

【００２０】以上説明したように本実施形態によれば、
ＨＴＭＬデータ中に含まれるリンク対応語の音声認識辞
書データをＨＴＭＬデータと共に受信することにより、
クライアント側で大容量の音声認識辞書を持つ必要がな
いく、小容量の記憶装置を備えるだけでよい。従って、
特に大容量記憶装置を持つことが困難な携帯型端末にお
いても容易に音声ブラウザを実装することが可能にな
る。また、音声認識において認識すべき語をリンク対応
語に絞り込めるので、認識処理が軽くなり、処理速度が
向上する。

【００２１】また、本実施形態によれば、ＨＴＭＬデー
タのリンク対応語に音声認識辞書データを添付していな
い一般のＷＷＷサーバーでも音声プロキシサーバーを通
すことによって音声認識辞書データを添付したＨＴＭＬ
データに変換することが可能である。これによって本実
施形態における音声ブラウザ装置でも容易にインターネ
ット上に存在するＷＷＷサーバーへアクセスすることが
可能になる。

【００２２】＜第２の実施形態＞＜構成＞図４は、第２の実施形態の音声ブラウザシステ
ムにおける装置構成図であり、図４（ａ）はクライアン
ト端末である音声ブラウザ装置の構成図を示している。
図４（ａ）において、３１はネットワークと通信を行う
ネットワーク通信部、３２はネットワーク経由で受信し
たＨＴＭＬデータを解析するＨＴＭＬ解析部、３３は３
２で解析されたＨＴＭＬデータを表示する表示部、３４
はＨＴＭＬデータに含まれるテキストを音声合成するテ
キスト音声合成部、３５は音声を認識する音韻単位音声
認識部、３６は３５で使用するための音声認識音韻辞
書、３７は３４で音声合成された音声を出力するための
スピーカー、３８は音声認識部に音声を入力するための
マイクである。

【００２３】図４（ｂ）は音声プロキシ（代理）サーバ
の構成図を示している。図４（ｂ）において、４１はネ
ットワークと通信を行うネットワーク通信部、４２はク
ライアントから要求があったアドレスより読み込んだＨ
ＴＭＬデータを解析するＨＴＭＬ解析部、４３は入力さ
れた単語に対応する音声認識対象語リストを抽出する音
声認識対象語抽出部、４４はＨＴＭＬデータに音声認識
対象語リストを付加する音声認識対象語リスト付きＨＴ
ＭＬデータ生成部、４５は音声認識対象語を抽出するた
めに使用する単語辞書である。

【００２４】＜動作＞以下、図４，図５、図６、図７を
参照して動作の説明を行う。クライアント端末である音
声ブラウザ装置はネットワーク通信部３１よりＨＴＭＬ
データとＨＴＭＬデータ中に含まれるリンク対応語の音
声認識対象語リストを受信する。音声認識対象語リスト
とは認識語の発音を指定する単語のリストである。例え
ば、第９図のようなＨＴＭＬデータの場合、リンクに対
応する言葉として「ニュース」、「天気予報」、「交通
情報」、「その他」があるので、これらのリンク対応語
に対する音声認識対象語リストとして「ニュウス」、
「テンキヨホウ」、「コウツウジョウホウ」、「ソノ
タ」をＨＴＭＬデータと共に受信する。

【００２５】ＨＴＭＬ解析部３２ではネットワーク通信
部３１が受信したＨＴＭＬデータと音声認識対象語リス
トを受け取り、ＨＴＭＬデータを解析し、表示部３３に
テキストデータを送り表示する。またテキスト音声変換
部３４にもテキストを転送し、テキストをテキスト音声
変換部３４で音声合成し、スピーカー３７より出力す
る。ＨＴＭＬ解析部３２に送られた音声認識対象語リス
トは音韻単位音声認識部３５へ転送される。

【００２６】音韻単位音声認識部３５では音声認識音韻
辞書３６より音韻辞書データを取りだし、音声認識対象
語リストの単語を音韻単位に分解して単語辞書を生成す
る。

【００２７】音韻辞書から単語辞書への合成方法を図５
を用いて説明する。音声認識対象語リストとして「ソノ
タ」が入力された場合、それぞれの「ソ」、「ノ」、
「タ」の音韻データを音韻辞書３６より抽出し、図５の
ように合成し、「ソノタ」という単語の単語辞書データ
を生成する。

【００２８】マイク３８より入力されたリンク対応語の
音声は音声認識部３５で音韻辞書より作成された単語辞
書データを参照して音声認識が行われ、リンク対応語が
認識されたらＨＴＭＬ解析部３２にリンク情報を送る。

【００２９】ＨＴＭＬ解析部３２は音声認識部３５より
送られたリンク情報とリンクしているＵＲＬ情報をネッ
トワーク通信部３１に送り、指定のＨＴＭＬデータを転
送してもらうよう要求信号を送出する（図６の）。

【００３０】クライアントから要求を受けた音声プロキ
シサーバーは指定ＵＲＬへＨＴＭＬデータを要求する
（図６の）。音声プロキシサーバーより要求を受けた
ＷＷＷサーバーは音声プロキシサーバーへ指定のＨＴＭ
Ｌデータを送信する（図６の）。ＷＷＷサーバーより
要求したＨＴＭＬデータを受けとった音声プロキシサー
バーは内部処理でリンク対応語に該当する音声認識対象
語リストを抽出し（図６の）、要求されたＨＴＭＬデ
ータに音声認識対象語リストを加えてクライアントへ送
信する（図６の）。

【００３１】次に音声プロキシサーバー内の動作につい
て図７のフローチャートを使用して説明する。処理（Ｓ
１２−１）は処理のスタートである。処理（Ｓ１２−
２）ではクライアントからＵＲＬを受信する。処理（Ｓ
１２−３）では指定されたＵＲＬに存在するＷＷＷサー
バーよりＨＴＭＬデータを受信する。処理（Ｓ１２−
４）では受信したＨＴＭＬデータの中からリンク情報を
検索し、リンクがなければ処理（Ｓ１２−８）へ処理を
移し、リンクが存在すれば次の処理（Ｓ１２−５）へ進
む。処理（Ｓ１２−５）ではリンク対応語を抽出し、処
理（Ｓ１２−６）では単語辞書より音声認識対象語リス
トを抽出するし、処理（Ｓ１２−７）ではリンク対応語
と音声認識対象語リストの統合を行う。処理（Ｓ１２−
８）では処理（Ｓ１２−７）で作られたデータをＨＴＭ
Ｌデータと共にクライアントへ送信する。

【００３２】以上説明したように本実施形態によれば、
ＨＴＭＬデータ中に含まれるリンク対応語の音声認識対
象語リストと共にＨＴＭＬデータを送ることにより、ク
ライアント側では音声認識音韻辞書のみ持ことで単語単
位の音声認識が可能になる。また、音声認識対象語リス
トを端末側で持つことによって認識対象語絞り込むこと
ができるので、音声認識処理を軽減することが可能にな
り、処理速度が向上する。また、第１の実施形態では音
声認識辞書データを送っているのに対して、第２の実施
形態では音声認識対象語リストのみを送っているので、
データ通信量が第１の実施形態に比べ軽減される。

【００３３】尚、本発明は前述の実施形態に限定される
ものではなく、本発明の趣旨に基づいて種々変形させる
ことが可能である。例えば、実施形態１、２ではテキス
トを表示する表示装置を備えていたが、表示装置が無く
てもよい。また、実施形態１、２ではインターネットに
接続する例を示していたが、外部接続が無い、閉じたネ
ットワークに接続してもよい。

【００３４】また、実施形態１、２ではハイパーテキス
トの形式としてＨＴＭＬとしたが、他のハイパーテキス
トの形式でもよい。更に、実施形態２では音声認識対象
語リストと音韻の表記としてカタカナを用いたが、ひら
がな、ローマ字など、発音を表記できるものであれば、
どのような文字や記号を用いてもよい。

【００３５】また、実施形態２では音韻単位辞書を用い
た音声認識を使用したが、サブワード単位を用いた音声
認識でもよい。サブワード単位とは単語よりも小さい単
位で音節、音韻、音素などの単位のことを指す。

【００３６】

【発明の効果】以上、詳細に説明したように、第１の発
明によれば、コンピュータネットワーク上においてサー
バー／クライアント形式でテキストや画像、音声などの
情報を提供するＷＷＷシステムにおける音声ブラウザシ
ステムにおいて、前記クライアントを、サーバーよりＨ
ＴＭＬデータを取得する手段と、サーバーからＨＴＭＬ
データと共に転送されたリンク対応語の音声認識辞書デ
ータを抽出する手段と、該音声認識辞書データを用いて
リンク対応語の音声認識を行う音声認識手段と、該音声
認識手段により出力されたリンク情報に基づき対応する
ＵＲＬ情報を抽出し、該ＵＲＬ情報に対応するＨＴＭＬ
データをサーバに要求する手段とを有する構成とすると
共に、前記サーバを、クライアントにより指定されたＵ
ＲＬ情報からＨＴＭＬデータを取得する手段と、該ＨＴ
ＭＬデータからリンク対応語を抽出する手段と、音声認
識辞書データからリンク対応語に対応する音声認識辞書
データを抽出する手段と、ＨＴＭＬデータと音声認識辞
書データを統合したデータをクライアントに送信する手
段とを有する構成としたので、ＨＴＭＬデータ中に含ま
れるリンク対応語の音声認識辞書データをＨＴＭＬデー
タと共に受信することにより、クライアント側で大容量
の音声認識辞書を持つ必要がないく、小容量の記憶装置
を備えるだけでよい。従って、特に大容量記憶装置を持
つことが困難な携帯型端末においても容易に音声ブラウ
ザを実装することが可能になる。また、音声認識におい
て認識すべき語をリンク対応語に絞り込めるので、認識
処理が軽くなり、処理速度が向上する。

【００３７】また、第２の発明によれば、コンピュータ
ネットワーク上においてサーバー／クライアント形式で
テキストや画像、音声などの情報を提供するＷＷＷシス
テムにおける音声ブラウザシステムにおいて、前記クラ
イアントを、サーバーよりＨＴＭＬデータを取得する手
段と、サーバーからＨＴＭＬデータと共に転送されたリ
ンク対応語の音声認識対象語リストを抽出する手段と、
該音声認識対象語リストを分解して単語単位辞書データ
を生成する手段と、該単語単位辞書データを用いてリン
ク対応語の音声認識を行う音声認識手段と、該音声認識
手段により出力されたリンク情報に基づき対応するＵＲ
Ｌ情報を抽出し、該ＵＲＬ情報に対応するＨＴＭＬデー
タをサーバに要求する手段とを有する構成とすると共
に、前記サーバを、クライアントにより指定されたＵＲ
Ｌ情報からＨＴＭＬデータを取得する手段と、該ＨＴＭ
Ｌデータからリンク対応語を抽出する手段と、該リンク
対応語に対応する音声認識対象語リストを抽出する手段
と、ＨＴＭＬデータと音声認識対象語リストを統合した
データを前記クライアントに送信する手段とを有する構
成としたので、ＨＴＭＬデータ中に含まれるリンク対応
語の音声認識対象語リストと共にＨＴＭＬデータを送る
ことにより、クライアント側では音声認識音韻辞書のみ
持ことで単語単位の音声認識が可能になる。また、音声
認識対象語リストを端末側で持つことによって認識対象
語絞り込むことができるので、音声認識処理を軽減する
ことが可能になり、処理速度が向上する。また、音声認
識辞書データに替わって音声認識対象語リストのみを送
っているので、データ通信量が軽減される。

【図面の簡単な説明】

【図１】第１の実施形態の音声ブラウザシステムにおけ
る装置構成図である。

【図２】第１の実施形態の音声ブラウザシステムの動作
フローである。

【図３】第１の実施形態における音声プロキシサーバー
の動作フローチャートである。

【図４】第２の実施形態の音声ブラウザシステムにおけ
る装置構成図である。

【図５】音韻辞書の連結モデルの一例を示す図である。

【図６】第２の実施形態の音声ブラウザシステムの動作
フローである。

【図７】第２の実施形態における音声プロキシサーバー
の動作フローチャートである。

【図８】本発明の実施形態に於けるネットワークの構成
例を示す図である。

【図９】従来技術の説明図である。

【符号の説明】

１１、３１、ネットワーク通信部１２、３２ＨＴＭＬ解析部１３、３３表示部１４、３４テキスト音声変換部１５音声認識部１６音声認識辞書１７、３７スピーカ２４、４１ネットワーク通信部２５、４２ＨＴＭＬ解析部（リンク抽出部）２６音声認識辞書抽出部２７音声認識辞書２８音声認識辞書データ付きHTMLデータ生
成部３５音韻単位音声認識部３６音声認識音韻辞書４３音声認識対象語抽出部４４音声認識対象語リスト付きHTMLデータ
生成部４５単語辞書

───────────────────────────────────────────────────── フロントページの続き (51)Int.Cl.⁷ 識別記号ＦＩテーマコート゛(参考）Ｇ１０Ｌ 15/28 Ｇ１０Ｌ 3/00 ５５１ＰＦターム(参考） 5B075 KK03 KK07 KK13 KK33 KK37 ND03 ND08 ND14 ND20 ND23 ND36 NK10 NK13 NK24 PQ02 PQ04 UU01 UU05 UU40 5D015 GG00 KK02 KK03 9A001 BB04 FF03 HH17 JJ05 JJ25 JJ26 JJ27

Claims

【特許請求の範囲】

【請求項１】コンピュータネットワーク上においてサ
ーバー／クライアント形式でテキストや画像、音声など
の情報を提供するＷＷＷシステムにおける音声ブラウザ
システムであって、前記クライアントは、サーバーよりＨＴＭＬデータを取得する手段と、サーバーからＨＴＭＬデータと共に転送されたリンク対
応語の音声認識辞書データを抽出する手段と、該音声認識辞書データを用いてリンク対応語の音声認識
を行う音声認識手段と、該音声認識手段により出力されたリンク情報に基づき対
応するＵＲＬ情報を抽出し、該ＵＲＬ情報に対応するＨ
ＴＭＬデータをサーバに要求する手段と、を有し、前記サーバは、クライアントにより指定されたＵＲＬ情報からＨＴＭＬ
データを取得する手段と、該ＨＴＭＬデータからリンク対応語を抽出する手段と、音声認識辞書データからリンク対応語に対応する音声認
識辞書データを抽出する手段と、ＨＴＭＬデータと音声認識辞書データを統合したデータ
をクライアントに送信する手段と、を有することを特徴
とする音声ブラウザシステム。
【請求項２】コンピュータネットワーク上においてサ
ーバー／クライアント形式でテキストや画像、音声など
の情報を提供するＷＷＷシステムにおける音声ブラウザ
システムであって、前記クライアントは、サーバーよりＨＴＭＬデータを取得する手段と、サーバーからＨＴＭＬデータと共に転送されたリンク対
応語の音声認識対象語リストを抽出する手段と、該音声認識対象語リストを分解して単語単位辞書データ
を生成する手段と、該単語単位辞書データを用いてリンク対応語の音声認識
を行う音声認識手段と、該音声認識手段により出力されたリンク情報に基づき対
応するＵＲＬ情報を抽出し、該ＵＲＬ情報に対応するＨ
ＴＭＬデータをサーバに要求する手段と、を有し、前記サーバは、クライアントにより指定されたＵＲＬ情報からＨＴＭＬ
データを取得する手段と、該ＨＴＭＬデータからリンク対応語を抽出する手段と、該リンク対応語に対応する音声認識対象語リストを抽出
する手段と、ＨＴＭＬデータと音声認識対象語リストを統合したデー
タを前記クライアントに送信する手段と、を有すること
を特徴とする音声ブラウザシステム。