JP3789614B2

JP3789614B2 - ブラウザシステム、音声プロキシサーバ、リンク項目の読み上げ方法及びリンク項目の読み上げプログラムを格納した記憶媒体

Info

Publication number: JP3789614B2
Application number: JP27016197A
Authority: JP
Inventors: 弘道林; 哲哉金丸; 常治木目田; 育夫並木; 正美氏家; 一彦虫壁
Original assignee: NTT Electronics Corp; Nippon Telegraph and Telephone Corp
Current assignee: NTT Electronics Corp; Nippon Telegraph and Telephone Corp
Priority date: 1997-10-02
Filing date: 1997-10-02
Publication date: 2006-06-28
Anticipated expiration: 2017-10-02
Also published as: JPH11110186A

Description

【０００１】
【発明の属する技術分野】
本発明は、コンピュータとネットワークからなるクライアント／サーバ構成の情報提供システム、とりわけインターネットにおけるＷＷＷ(World Wide Web)システムにおいて、取得したい情報を指定する指定情報をクライアント端末のマイクから音声で入力し、サーバに蓄積されてる情報を取得し、クライアント端末に音声で出力する音声ブラウザシステムに関する。
【０００２】
【従来の技術】
周知のように、ＷＷＷシステムとして、サーバ及びクライアントのハードウェア、ソフトウェアがネットワーク上に適切に構成されている場合に、クライアント端末上にインストールされた例えば、Netscape Navigator^TM等のブラウザを使用することによって、サーバに格納したテキストやイメージの情報をクライアント画面上に表示して閲覧することが可能である。このようなシステムの場合に、画面上の特定の情報をマウスなどで選択すると、この特定の情報と関連づけられた情報にアクセスし、画面上に表示して閲覧することが可能である。以下では、特定の情報と「関連づけられる」ことを「リンクを張られた」と称し、上記「特定の情報」を「リンク項目」と称する。このようなシステムでは、情報が視覚的情報として提供されることを前提とする。
【０００３】
従って、情報のサービスを享受するためには画面に目を向ける必要があるので、視覚の不自由な人は情報のサービスを享受することができないという問題がある。
【０００４】
【発明が解決しようとする課題】
本発明は第一に、視覚に不自由な人に対しても上記の情報サービスの利用を可能にすることを目的とする。即ち、最近の音声認識技術及び音声合成技術を使用することによって、リンク項目の指定等をマイクからの音声により行い、サーバから取得した情報を、画面上に表示するのではなく、音声合成音で出力することで、視覚の不自由な人の利用に供することを可能にする。具体的には、ブラウザのアイコン（例えば、前進、後退等）の選択及びリンク項目の指定が音声入力により行なわれ、入力された音声情報が認識され、認識された音声情報により指定されたＵＲＬ(Uniform Resource Locator)がアクセスされ、情報が取得され、取得された情報の中のテキスト部分がクライアント端末のスピーカから合成音として出力される。
【０００５】
本発明は第二に、視覚の不自由な人に情報サービスを提供する際、リンク項目の出力及び入力を音声で行う場合の使い勝手を良くすることを目的とする。即ち、ＷＷＷの情報には、長い文章が含まれている場合、或いは、１０乃至２０個のリンク箇所が随所に指定されている場合がある。また、実際には、カラーのイメージ情報がテキストに混在するだけでなく、動画とリンクが張られ、視覚に訴える情報がふんだんに使用されている。従って、通常は画面に表示されるＷＷＷの情報を聴覚的な情報として表現する場合に、単にテキスト部分だけを読み上げても、取得された情報の内容を理解することが難しく、その結果として、利用者が次に取得したい情報を指定するためのリンク項目の選択が難しくなるという問題がある。そのため、視覚の不自由な人はＷＷＷの情報のサービスを充分に享受できない。
【０００６】
本発明は、上記従来技術の問題点に鑑み、ＷＷＷの情報に含まれるテキスト及びリンク項目を音声による情報として表現する改良されたブラウザシステム、プロキシサーバ及び情報の読み上げ方法の提供を目的とする。
【０００７】
【課題を解決するための手段】
図１は本発明の原理構成図である。本発明では、上記の課題を解決するために、同図に示す如く、クライアント端末１１０により音声で指定された情報をネットワーク１０４を介して情報サーバ１０２から取得し、取得された情報を上記クライアント端末１１０に音声で出力するブラウザシステムは、情報サーバ１０２から取得された情報に含まれる関連する情報へのリンク先を示すリンク項目を音声に変換してクライアント端末１１０に出力する音声出力手段１２０と、クライアント端末１１０から入力された音声によってリンク項目を指定し、指定されたリンク項目により情報サーバ１０２へアクセスする音声入力手段１３０とを有することを特徴とする。
【０００８】
上記音声入力手段１２０により、音声による入力からリンク項目及びアイコンを指定することが可能になり、かつ、上記音声出力手段１３０により、クライアント端末に表示される情報を読み上げることが可能になる。
図２は本発明の音声プロキシ(Proxy) サーバ１００を表わす図である。本発明は、情報サーバ１０２から取得された情報に含まれる関連する情報へのリンク先を示すリンク項目を音声に変換してクライアント端末１１０に出力する音声出力手段１２０と、クライアント端末１１０から入力された音声によってリンク項目を指定する手段１３２及び指定されたリンク項目により情報サーバ１０２へアクセスする手段１３４を有する音声入力手段１３０とからなることを特徴とする音声プロキシサーバ１００である。
【０００９】
上記音声プロキシサーバ１００の音声入力手段１３０は、入力された音声によって上記クライアント端末の画面に表示されたアイコンを選択する手段１３６を更に有する方が有利である。
上記音声出力手段１２０は、上記情報サーバから取得された情報のテキスト中に含まれるリンク項目の型に応じて、上記情報サーバから取得された情報の型を判断する手段１４２と、上記判断された情報の型に応じて、上記情報を読み上げる手段１４４とを有する。
【００１０】
上記情報の型を判断する手段１４２は、上記情報サーバから取得された情報が、テキスト中に少数のリンク項目が含まれるリンク項目混在型、又は、テキスト中にリンク項目が列挙されているリンク項目列挙型のいずれの型であるかを判断する。この判断に対応して、上記情報を読み上げる手段１４４は、リンク項目混在型の情報を読み上げる手段１４６と、リンク項目列挙型の情報を読み上げる手段１４８とを有する。
【００１１】
上記いずれの型であるかを判断する手段１４２は、上記情報を所定数以下のリンク項目を含む情報単位に分割する手段１５０と、上記情報単位が上記リンク項目混在型又は上記リンク項目列挙型のいずれの型であるかを判定する手段１５２とからなる点が有利である。
本発明の音声プロキシサーバ１００により、音声による入力からリンク項目及びアイコンを指定することが可能になり、かつ、クライアント端末に表示される情報を読み上げることが可能になる。
【００１２】
更に、本発明によれば、ブラウザ上に表示したインターネット情報のアイコン、テキスト本文、リンク項目の読み上げ方が、テキスト本文中のリンク項目の数及びリンク項目の型（リンク項目混在型又はリンク項目列挙型）に従って判断され、インターネット情報が自動的に処理されて音声出力される点に特徴がある。これにより、視覚的な情報を用いることなく、リンク項目を簡単に選択できるようになる。
【００１３】
図３は本発明によるリンク項目を読み上げる方法の原理を説明する図である。本発明のリンク項目を読み上げる方法は、情報サーバから関連する情報へのリンク先を示すリンク項目を含むテキスト情報を取得する段階（ステップ１００）と、上記取得されたテキスト情報に含まれるリンク項目が、テキスト中に少数のリンク項目が含まれるリンク項目混在型、又は、テキスト中にリンク項目が列挙されているリンク項目列挙型のいずれの型であるかを判断する段階（ステップ１１０）と、上記判断されたテキスト情報の型に応じて、上記テキスト情報を読み上げる段階（ステップ１２０）とからなることを特徴とするリンク項目を読み上げる方法。
【００１４】
上記いずれの型であるかを判断する段階（ステップ１１０）は、上記テキスト情報を、所定の数以下の個数のリンク項目が含まれる情報単位に分割し（ステップ１１１）、上記分割された各情報単位が、リンク項目混在型又はリンク項目列挙型のいずれの型であるかを判断する（ステップ１１２）方が有利である。
また、上記テキスト情報を読み上げる段階（ステップ１２０）は、上記情報単位がリンク項目混在型かリンク項目列挙型であるかを判別し（ステップ１２１）、上記情報単位がリンク項目混在型であるならば、リンク項目を含む本文の読み上げと、リンク項目の読み上げとを行い（ステップ１２２）、上記情報単位がリンク項目列挙型であるならば、リンク項目と対応した本文の読み上げを行う（ステップ１２３）ことを特徴とする。
【００１５】
【発明の実施の形態】
図４は本発明の第１の実施例の音声ブラウザシステムの構成図である。同図に示された音声ブラウザシステムのクライアント端末は、クライアント端末本体１と、クライアント端末本体１に接続された音声入力用のマイク２及び音声合成音などの音声出力用のスピーカ３と、クライアント端末本体１に接続された表示装置４とからなる。情報サーバであるＷＷＷサーバ７から取り出された情報は、通常、表示装置４に表示される。表示装置４は、視覚の不自由な人には直接有効ではない。
【００１６】
音声ブラウザシステムは、音声ブラウザのための処理を行う音声プロキシサーバ５を更に有する。クライアント端末はネットワーク６を介して音声プロキシサーバ５に接続される。ネットワーク６は、周知のイーサネット、ＡＴＭ等のいずれのネットワークでもよく、本発明はネットワークの形態に限定されるものではない。情報を提供するＷＷＷサーバ７は、世界中に接続されているインターネット８に接続されている。
【００１７】
図３は、本発明の第１の実施例のサーバクライアント構成を示す図である。クライアント２１は、例えば、Netscape Navigator^TMのようなブラウザ２２、ブラウザ２２との間で音声の入出力を行う音声入出力ＡＰ（アプリケーションプログラム）２３、音声入出力ＡＰ２３からブラウザに自動的に任意の情報先（通常、ＵＲＬと称される）へアクセスさせるための制御を行うブラウザ制御アプリケーションプログラム２４、及び、音声入力の際に、ボタンの入力を監視するボタン監視アプリケーションプログラム２５からなる。但し、音声のパワーを検出することにより上記ボタンを使用しないで音声入力を監視しても構わない。
【００１８】
音声プロキシサーバ２６は、マイクからの音声を認識する音声認識エンジン２８と、テキストを音声に合成する音声合成エンジン２９と、文章を名詞又は複合語単位に分解する形態素解析エンジン３３と、クライアント２１とＷＷＷサーバ３２との中継、並びに、音声認識エンジン２８及び音声合成エンジンとのインタフェース処理とを行う音声プロキシ部２７とからなる。音声プロキシ部２７は、音声出力、即ち、読み上げ条件に基づく読み上げを行う読み上げ前処理部３０を有する。
【００１９】
本発明の第１の実施例によれば、漢字コード変換機能やキャッシュメモリ機能を有する中継サーバ３１が設けられているが、これらの機能は音声プロキシサーバ２６の中に組み込んでもよい。ＷＷＷサーバ３２は既存のhttpd である。
図６は図５に示した本発明の第１の実施例のサーバクライアントの動作シーケンスチャートである。以下の説明では、利用者がＷＷＷサーバに入り、最初のページをアクセスし、その後に任意のページにユーザがアクセスする場合を考える。各動作について順次説明する。
【００２０】
ステップ１）利用者がクライアント本体、例えば、パソコンの電源を入れると、予め電源投入時に起動するよう設定された音声入出力アプリケーションプログラム２３が自動的に起動される。このような起動は、パソコンの設定方法により実現される。
ステップ２）音声入出力アプリケーションプログラム２３は、Netscape Navigator^TMのようなブラウザ２２を起動させる。
【００２１】
ステップ３）ブラウザ２２は起動時に表示すべきＵＲＬを取得する要求を音声プロキシ部２７に送る。
ステップ４）音声プロキシ部２７はブラウザ２２の要求するＵＲＬの要求をＷＷＷサーバ３２に発行する。
ステップ５）ＷＷＷサーバ３２のｈｔｔｐｄは要求されたＵＲＬのデータを返す。
【００２２】
ステップ６）音声プロキシ部２７はＵＲＬをブラウザ２３に返し、ブラウザ２３はＵＲＬをパソコン画面に表示する。
ステップ７）音声プロキシ部２７の前処理部３０は、ＵＲＬのデータに基づいて読み上げ前処理を行う。読み上げ前処理とは、ＨＴＭＬデータから、クライアントで音声出力させるテキストを抽出し、プレーンテキスト化し、タイトル部、本文、リンク項目等に分類すると共に、ガイダンスを追加して音声合成エンジン２９に音声変換を要求する処理である。但し、起動時に表示されるＵＲＬの場合には、本文及びリンク案内ガイダンスの音声変換だけが要求される。
【００２３】
ステップ８）音声合成を依頼された音声合成エンジン２９は、テキストデータを音声データに変換し、音声プロキシ部２７に渡す。
ステップ９）音声プロキシ部２７は、音声合成エンジン２９から受けた音声データをクライアントの音声入出力アプリケーションプログラム２３に伝達し、音声入出力アプリケーションプログラム２３は音声データを音声出力する。
【００２４】
ステップ１０）音声プロキシ部２７は、読み上げ前処理で抽出されたリンク項目の形態素解析を形態素解析エンジン３３に要求する。
ステップ１１）形態素解析エンジン３３は、リンク項目の１文章を名詞単位に分解して、音声認識時の候補として抽出すると共に、名詞が連続する際には、複合語も候補として抽出し、解析結果を音声プロキシ部２７に渡す。形態素解析の技術は、発明の名称「形態素解析方法および装置」の特願平７−２９１１４３号明細書又は発明の名称「ハイパーテキスト中継方法及び装置」の特願平８−３１２０１６号明細書に記載されている。例えば、「内閣総理大臣が渡米」というリンク項目がある場合に、このステップの形態素解析により得られる音声認識時の候補は、全文の「内閣総理大臣が渡米」、「内閣」、「大臣」、「内閣総理」、「総理大臣」、「内閣総理大臣」及び「渡米」である。
【００２５】
ステップ１２）音声プロキシ部２７は、形態素解析エンジン３３の解析結果を音声認識エンジン２８に渡し、辞書登録を行う。
ステップ１３）次に、利用者は音声入力を開始するため、ボタン（図示しない）を押下する。クライアント２１のボタン監視アプリケーションプログラム２５は、ボタンが押下されたので、音声入出力アプリケーションプログラム２３に通知する。このタイミングで音声入出力アプリケーションプログラム２３は音声の録音を開始する。
【００２６】
ステップ１４）更に、ボタン監視アプリケーションプログラム２５は、ボタンを監視し、ボタンが放されたことを検出したタイミングで、音声入出力アプリケーションプログラム２３に通知し、音声入出力アプリケーションプログラム２３は音声の録音を終了し、音声入出力アプリケーションプログラム２３へ通知する。
【００２７】
ステップ１５）音声入出力アプリケーションプログラム２３は入力された音声を音声プロキシ部２７に送信する。
ステップ１６）音声プロキシ部２７は、受信した音声データに基づいて音声認識エンジン２８に音声認識を要求する。
ステップ１７）音声認識エンジン２８は、音声データを受信し、音声認識を実行して結果を音声プロキシ部２７に返す。
【００２８】
ステップ１８）音声プロキシ部２７は、認識結果を基にして、現在表示されている情報から要求されたリンク項目のＵＲＬを取得し、ＷＷＷサーバ３２へ要求を発行する。
ステップ１９）ＷＷＷサーバ３２のｈｔｔｐｄは、要求されたＵＲＬのデータを返す。
【００２９】
ステップ２０）音声プロキシ部２７の前処理部３０は、ＷＷＷサーバ３２から返されたＵＲＬのデータに基づいて読み上げ前処理を行う。ここで、ブラウジング案内ガイダンスだけの音声合成を音声合成エンジン２９に要求する。
ステップ２１）音声合成エンジン２９は、ブラウジング案内ガイダンスを音声データに変換し、音声プロキシ部２７に渡す。
【００３０】
ステップ２２）音声プロキシ部２７は、受信した音声データをクライアント２１の音声入出力アプリケーションプログラム２３に送り音声出力を要求すると同時に、インターネット情報の表示を行う命令を発行する。
ステップ２３）音声入力アプリケーションプログラム２３は、音声出力を行うと同時に、ブラウザ制御アプリケーションプログラム２４へインターネット情報の表示を行う命令を発行する。
【００３１】
ステップ２４）ブラウザ制御アプリケーションプログラム２４は、音声入力アプリケーションプログラム２３の要求通りにブラウザにインターネット情報の表示を行う命令を発行する。
ステップ２５）ブラウザ２２は、指定されたＵＲＬを取得する要求を音声プロキシ部２７に出す。
【００３２】
ステップ２６）音声プロキシ部２７は、そのブラウザ２２の要求に対し、ステップ１９）で受信されたＵＲＬデータを速やかに返送し、ブラウザ２２はそのデータを表示する。
ステップ２７）音声プロキシ部２７の前処理部３０は、ＵＲＬのデータに基づいて読み上げ前処理を行う。ここでは、本文及びリンク項目の音声変換だけを音声合成エンジン２９に要求する。
【００３３】
ステップ２８）音声合成エンジン２９は、テキストデータを音声に変換し、音声プロキシ部２７に渡す。
ステップ２９）音声プロキシ部２７は受信した音声データを音声入出力アプリケーションプログラム１２に渡し、音声入出力アプリケーションプログラム１２は音声出力を行う。
【００３４】
ステップ３０）音声プロキシ部２７は、読み上げ前処理部３０で抽出されたリンク項目の形態素解析を形態素解析エンジン３３に要求する。
ステップ３１）形態素解析エンジン３３は、ステップ１１）と同様に、リンク項目の形態素解析を行い、解析結果を音声プロキシ部２７に渡す。
ステップ３２）音声プロキシ部２７は、形態素解析エンジン３３の解析結果を音声認識エンジン２８に渡し、辞書登録を行う。
【００３５】
これにより、サーバクライアントシステムは、利用者からの音声入力待ちになり、ステップ１３）以降の処理が繰り返し行われる。
【００３６】
【実施例】
図７は、本発明の第２の実施例において、ＷＷＷサーバから取り出され、ブラウザ上に表示された情報の型の例を表わす図である。同図の（Ａ）は、テキスト中に少数のリンク項目が含まれるリンク項目混在型の場合を表わす。タイトル欄４１に示された「音声ブラウザ」がこの情報のタイトルである。本文欄４２には、この情報の本文が示される。本文の一部には、リンクが張られたリンク項目４３が示される。この例では、影文字で示された「ブラウザ」、「表示装置」及び「インターネット」の３箇所にリンクが張られている。これらのリンク項目を選択することにより、夫々のリンクが張られた先の情報にアクセスできる。本文欄４２内の枠に示された画像は、この情報のイメージ部分４４である。
【００３７】
図７の（Ｂ）にはリンク項目列挙型の場合の情報の例が示される。この例の場合、多数のリンク項目４５が列挙されている。この例は、ＷＷＷサーバから取り出された情報が検索結果の一覧の場合であり、情報の中の殆どの部分がリンク項目の列挙に該当している。例えば、目次は、このように殆どの部分がリンク項目の列挙である。
【００３８】
情報を表示形式で分類すると、図７に示された混在型と列挙型の２種類がある。取り出された情報を音声で読み上げる方式は、情報の型によって異なる。
図８は本発明の第２の実施例によるリンク項目混在型の情報の読み上げ順方式を表わす図である。同図に示された例は、図７の（Ａ）に示された情報に基づいている。
【００３９】
図８の（Ａ）は、タイトル、リンク項目、本文の順に読み上げるタイトル−リンク−本文順読み上げ方式を表わす図である。この方式の場合、最初に、情報のタイトル「音声ブラウザ」の読み上げ部分５１が読み上げられる。情報のタイトルの読み上げ部分５１には、アクセスした情報のタイトルが挿入される。「アクセスします」の部分５２は、タイトル「音声ブラウザ」にアクセスすることをガイダンスしているところである。この方式では、この部分５２は、例えば、プログラムで固定的に使用される。尚、図面及び明細書の説明中、下線付きの部分は読み上げ時に固定的に使用される箇所を表わす。読み上げ部分５１と、固定部分５２とから、「音声ブラウザにアクセスします」と読み上げられる。ここで、固定部分５２の「アクセスします」は、例えば、「という情報を取り出し表示します」のように置き換えても構わない。このようにガイダンス文自体は、自由な形にしてよいことはいうまでもない。次に、リンク項目読み上げのガイダンス文５３が続く。更に、この情報の中でリンクが張られている全項目、例えば、「インターネット」の項目５５等の読み上げ部分５４である。この例では、「ブラウザ」、「表示装置」及び「インターネット」の３項目が含まれる。全項目の読み上げ部分５４に続いて、本文読み上げ開始のガイダンス部分５６と、本文自体の読み上げ部分５７とがある。
【００４０】
図８の（Ｂ）は、タイトル−本文−リンク順読み上げ方式を表わす図である。同図の（Ａ）のタイトル−リンク−本文順読み上げ方式とは異なり、本文を先に読み上げた後に、リンク項目が読み上げられる。
同図の（Ｃ）は、タイトル−本文−リンク順読み上げ方式において、リンク項目が自動的には読み上げられない方式に相当する。即ち、本文の読み上げ終了の時点で、音声によって「リンク項目」と入力することにより、その情報のリンク項目が読み上げられる方式である。
【００４１】
一方、列挙型の情報の場合には、リンク項目と本文とが略一致するため、上記の混在型情報の読み上げ順方式をそのまま使用することはできない。図９は、本発明の第２の実施例による列挙型情報の読み上げ順方式を表わす図である。図８に示された混在型と比較すると、リンク項目が本文と一致した場合に相当する。図９には、列挙型の読み上げ順方式に固有のガイダンス文５８が示される。それ以外は図８に示された混在型と同様に読み上げられる。
【００４２】
図１０は、本発明の第３の実施例による読み上げ条件自動処理のフローチャートである。情報がＷＷＷサーバから取り出されると、音声プロキシサーバ上の蓄積装置に情報が一時的に格納される。
蓄積装置に蓄積された情報を必要に応じてメモリに転送し、読み上げ条件自動処理を開始する（ステップ５１）。
【００４３】
最初に、与えられた読み上げ条件を参照して、読み上げの際に分割される情報単位に含まれるリンク項目のリンク数Ｌｎと、読み上げ条件と、情報型判断指数Ａとを設定する（ステップ５２）。ここで、読み上げ条件とは、リンク項目又は本文のいずれを先に読み上げるかを指定する条件である。また、情報型判断指数とは、分割された本文（以下、分割本文と称する）内のリンク項目の総文字数と分割本文の総文字数との基準の比を表わす量である。
【００４４】
次に、分割本文内のリンク項目数が取得された分割のリンク数Ｌｎ以下になる場所、かつ、文章単位で本文を先頭から分割する（ステップ５３）。
本文が分割された後、分割本文がリンク項目列挙型或いはリンク項目混在型のいずれであるかが判定される（ステップ５４）。判定の方法は、分割本文内のリンク項目の総文字数（ｐ）と分割本文の総文字数（ｑ）との比（ｐ／ｑ）と、情報型判断指数（Ａ）との大小関係による。即ち、ｐ／ｑ＞Ａならば、列挙型であると判定され、ｐ／ｑ＜Ａであるならば、混在型であると判定される。通常、情報型判断指数Ａは、限りなく１に近い値が設定される。
【００４５】
分割本文の情報が混在型であると判定された場合、次に、リンク項目と本文のいずれを先に読み上げるかを読み上げ条件に基づいて判定する（ステップ５５）。
リンク項目が先と判定されたならば、Ｌｎ個のリンク項目が読み上げられ（ステップ５６）、続いて、分割本文が読み上げられる（ステップ５７）。
【００４６】
一方、本文が先と判定されたならば、まず分割本文が読み上げられ（ステップ５８）、次に、Ｌｎ個のリンク項目が読み上げられる（ステップ５９）。
分割本文の情報が列挙型であると判定された場合、Ｌｎ個分のリンク項目と、分割本文とが一度に読み上げられる（ステップ６０）。
リンク項目と分割本文とが読み上げられた後、本文がすべて終了したかどうかが判定される（ステップ６１）。
【００４７】
未だ読み上げられていない分割本文がある場合、次の分割本文が取り出され（ステップ６２）、ステップ５４に戻り、次の分割本文について同様に読み上げ条件自動処理が繰り返される。本文がすべて終了している場合には、読み上げ終了の処理に進む（ステップ６３）。
図１１は本発明の第４の実施例による分割本文とその読み上げ内容とを示す図である。本文の分割と、読み上げ内容の決定は、音声プロキシサーバの音声プロキシ部に設けられた読み上げ前処理部で行われる。
【００４８】
読み上げ条件の内容６１は、本文の分割がリンク数＝３、読み上げ順序がタイトル、リンク項目、本文の順であることを示している。情報型判断指数Ａ＝０．９５である。
設定内容を設定する方法は、例えば、画面から設定されたデータをファイルに書き込む方法、或いは、ファイルに直接書き込む方法等のいずれの方法でも良く、本発明は読み上げ条件の内容の設定方法によって限定されるものではない。
【００４９】
情報の本文全体６２は、リンク数＝３を用いて、分割本文１、分割本文２及び分割本文３の３つに分割されていることが分かる。更に、分割本文の中で、分割本文１及び分割本文３はリンク項目混在型であり、分割本文２はリンク項目列挙型である。読み上げ内容６３は、このような分割本文に従って生成された読み上げ例を表わす。
【００５０】
混在型の分割本文１及び分割本文３は、読み上げ条件に従って、リンク項目、本文の順に読み上げられることが分かる。列挙型の分割本文３の場合には、リンク項目と本文とが同一であるため、まとめて一度だけ読み上げられる。また、次の分割本文に移る場合には、音声コマンド「次ぎ」を使用してもよい。
また、音声プロキシサーバ２６の構成は、上記の実施例で説明された例に限定されることなく、音声プロキシサーバ２６の各々の構成要件をソフトウェア（プログラム）で構築し、ディスク装置等に格納しておき、必要に応じて情報提供装置のコンピュータにインストールしてリンク項目の読み上げを行うことも可能である。さらに、構築されたプログラムをフロッピーディスクやＣＤ−ＲＯＭ等の可搬記憶媒体に格納し、このようなシステムを用いる場面で汎用的に使用することも可能である。
【００５１】
本発明は、上記の実施例に限定されることなく、特許請求の範囲内で種々変更・応用が可能である。
【００５２】
【発明の効果】
以上に詳述したように、本発明によれば、ブラウザ上に取り出された情報のうちのテキスト本文及びリンク項目の読み上げ方が、利用者の設定内容であるリンク項目の数と、リンク項目が情報に混在的に含まれるか、又は、列挙的に含まれるかを表わす情報の型とに応じて、自動的に処理され、テキスト本文及びリンク項目が音声出力されるので、テキスト本文及びリンク項目の読み上げ方が利用者の好みの条件で使用されるという利点がある。
【００５３】
本発明の音声プロキシサーバにより、音声による入力からリンク項目及びアイコンを指定することが可能になり、かつ、クライアント端末に表示される情報を読み上げることが可能になる。従って、通常のブラウザを持つクライアント端末は、音声認識或いは音声合成のような特別なソフトウェアを別途準備することなく、音声を利用したブラウザシステムを実現することができる。
【００５４】
更に、クライアント端末ではなく、音声プロキシサーバに音声認識及び音声合成の手段を設けることにより、クライアント端末の機種に殆ど依存することのない汎用的なブラウザシステムを構築することが可能になる。また、プロキシサーバは大規模な辞書を搭載することが可能であり、クライアント端末に記事を表示している間に先行して各種変換処理を行うことが可能である。従って、テキスト系サービスのサーバ、エンジンを拡張する際に、例えば、翻訳、要約のような各種変換処理されたテキストを同時に配信することが可能である。
【図面の簡単な説明】
【図１】本発明の原理構成図である。
【図２】本発明の音声プロキシサーバの構成図である。
【図３】本発明のリンク項目の読み上げ方法の原理説明図である。
【図４】本発明の第１の実施例による音声ブラウザシステムの構成図である。
【図５】本発明の第１の実施例のサーバクライアントシステムの構成図である。
【図６】本発明の第１の実施例のサーバクライアントシステムの動作シーケンスチャートである。
【図７】本発明の第２の実施例における情報の型の例の説明図である。
【図８】本発明の第２の実施例における混在型情報の読み上げ順の説明図である。
【図９】本発明の第２の実施例における列挙型情報の読み上げ順の説明図である。
【図１０】本発明の第３の実施例による読み上げ条件自動処理のフローチャートである。
【図１１】本発明の第４の実施例による分割本文と読み上げ内容との説明図である。
【符号の説明】
１００音声プロキシサーバ
１０２情報サーバ
１１０クライアント端末
１２０音声出力手段
１３０音声入力手段
１３２リンク項目指定手段
１３４情報サーバアクセス手段
１３６アイコン選択手段
１４２リンク項目型判断手段
１４４情報読み上げ手段
１４６リンク項目混在型情報読み上げ手段
１４８リンク項目列挙型情報読み上げ手段
１５０情報分割手段
１５２情報単位リンク項目型判断手段

Claims

クライアント端末により音声で指定された情報をネットワークを介して情報サーバから取得し、取得された情報を上記クライアント端末に音声で出力するブラウザシステムにおいて、
上記情報サーバから取得された情報の型が、テキスト中に少数のリンク項目が含まれるリンク項目混在型、又は、テキスト中にリンク項目が列挙されているリンク項目列挙型のいずれの型であるかを判断する手段と、
上記判断された情報の型に応じて、上記情報サーバから取得された情報に含まれる関連する情報へのリンク先を示すリンク項目を音声に変換して上記クライアント端末に出力する、リンク項目混在型の情報を読み上げる手段とリンク項目列挙型の情報を読み上げる手段とを有する音声出力手段と、
上記クライアント端末から入力された音声によってリンク項目を指定する手段及び上記指定されたリンク項目により情報サーバへアクセスする手段を有する音声入力手段と
からなることを特徴とする音声プロキシサーバ。
上記いずれの型であるかを判断する手段は、上記情報を所定数以下のリンク項目を含む情報単位に分割する手段と、上記情報単位が上記リンク項目混在型又は上記リンク項目列挙型のいずれの型であるかを判断する手段とからなることを特徴とする請求項１に記載の音声プロキシサーバ。
上記いずれの型であるかを判断する手段は、リンク項目の総文字数と本文の総文字数との比によって、リンク項目混在型、又は、リンク項目列挙型のいずれの型であるかを判断することを特徴とする請求項１又は２に記載の音声プロキシサーバ。
クライアント端末により音声で指定された情報をネットワークを介して情報サーバから取得し、取得された情報を上記クライアント端末に音声で出力する、リンク項目型判断手段と、音声出力手段と、音声入力手段とを有するブラウザシステムにおいて、リンク項目を読み上げる方法であって、
上記リンク項目型判断手段は、上記情報サーバから取得された情報の型が、テキスト中に少数のリンク項目が含まれるリンク項目混在型、又は、テキスト中にリンク項目が列挙されているリンク項目列挙型のいずれの型であるかを判断する段階と、
上記音声出力手段は、上記判断された情報の型に応じて、上記情報サーバから取得された情報に含まれる関連する情報へのリンク先を示すリンク項目を音声に変換して上記クライアント端末に出力する段階と、
上記音声入力手段は、上記クライアント端末から入力された音声によってリンク項目を指定する手段及び上記指定されたリンク項目により情報サーバへアクセスする手段を有する段階と
からなることを特徴とするリンク項目読み上げ方法。
上記いずれの型であるかを判断する段階は、上記情報を所定数以下のリンク項目を含む情報単位に分割する段階と、上記情報単位が上記リンク項目混在型又は上記リンク項目列挙型のいずれの型であるかを判断する段階とからなることを特徴とする請求項４に記載のリンク項目読み上げ方法。
上記いずれの型であるかを判断する段階は、リンク項目の総文字数と本文の総文字数との比によって、リンク項目混在型、又は、リンク項目列挙型のいずれの型であるかを判断する段階からなることを特徴とする請求項４又は５に記載のリンク項目読み上げ方法。
請求項４乃至６のうちいずれか１項に記載のリンク項目読み上げ方法の各段階をコンピュータで実現させるためのプログラムを記録した、該コンピュータが読み取り可能な記憶媒体。