JP3789614B2 - ブラウザシステム、音声プロキシサーバ、リンク項目の読み上げ方法及びリンク項目の読み上げプログラムを格納した記憶媒体 - Google Patents

ブラウザシステム、音声プロキシサーバ、リンク項目の読み上げ方法及びリンク項目の読み上げプログラムを格納した記憶媒体 Download PDF

Info

Publication number
JP3789614B2
JP3789614B2 JP27016197A JP27016197A JP3789614B2 JP 3789614 B2 JP3789614 B2 JP 3789614B2 JP 27016197 A JP27016197 A JP 27016197A JP 27016197 A JP27016197 A JP 27016197A JP 3789614 B2 JP3789614 B2 JP 3789614B2
Authority
JP
Japan
Prior art keywords
information
link
voice
type
link item
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP27016197A
Other languages
English (en)
Other versions
JPH11110186A (ja
Inventor
弘道 林
哲哉 金丸
常治 木目田
育夫 並木
正美 氏家
一彦 虫壁
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NTT Electronics Corp
Nippon Telegraph and Telephone Corp
Original Assignee
NTT Electronics Corp
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NTT Electronics Corp, Nippon Telegraph and Telephone Corp filed Critical NTT Electronics Corp
Priority to JP27016197A priority Critical patent/JP3789614B2/ja
Publication of JPH11110186A publication Critical patent/JPH11110186A/ja
Application granted granted Critical
Publication of JP3789614B2 publication Critical patent/JP3789614B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Description

【0001】
【発明の属する技術分野】
本発明は、コンピュータとネットワークからなるクライアント/サーバ構成の情報提供システム、とりわけインターネットにおけるWWW(World Wide Web)システムにおいて、取得したい情報を指定する指定情報をクライアント端末のマイクから音声で入力し、サーバに蓄積されてる情報を取得し、クライアント端末に音声で出力する音声ブラウザシステムに関する。
【0002】
【従来の技術】
周知のように、WWWシステムとして、サーバ及びクライアントのハードウェア、ソフトウェアがネットワーク上に適切に構成されている場合に、クライアント端末上にインストールされた例えば、Netscape NavigatorTM等のブラウザを使用することによって、サーバに格納したテキストやイメージの情報をクライアント画面上に表示して閲覧することが可能である。このようなシステムの場合に、画面上の特定の情報をマウスなどで選択すると、この特定の情報と関連づけられた情報にアクセスし、画面上に表示して閲覧することが可能である。以下では、特定の情報と「関連づけられる」ことを「リンクを張られた」と称し、上記「特定の情報」を「リンク項目」と称する。このようなシステムでは、情報が視覚的情報として提供されることを前提とする。
【0003】
従って、情報のサービスを享受するためには画面に目を向ける必要があるので、視覚の不自由な人は情報のサービスを享受することができないという問題がある。
【0004】
【発明が解決しようとする課題】
本発明は第一に、視覚に不自由な人に対しても上記の情報サービスの利用を可能にすることを目的とする。即ち、最近の音声認識技術及び音声合成技術を使用することによって、リンク項目の指定等をマイクからの音声により行い、サーバから取得した情報を、画面上に表示するのではなく、音声合成音で出力することで、視覚の不自由な人の利用に供することを可能にする。具体的には、ブラウザのアイコン(例えば、前進、後退等)の選択及びリンク項目の指定が音声入力により行なわれ、入力された音声情報が認識され、認識された音声情報により指定されたURL(Uniform Resource Locator)がアクセスされ、情報が取得され、取得された情報の中のテキスト部分がクライアント端末のスピーカから合成音として出力される。
【0005】
本発明は第二に、視覚の不自由な人に情報サービスを提供する際、リンク項目の出力及び入力を音声で行う場合の使い勝手を良くすることを目的とする。即ち、WWWの情報には、長い文章が含まれている場合、或いは、10乃至20個のリンク箇所が随所に指定されている場合がある。また、実際には、カラーのイメージ情報がテキストに混在するだけでなく、動画とリンクが張られ、視覚に訴える情報がふんだんに使用されている。従って、通常は画面に表示されるWWWの情報を聴覚的な情報として表現する場合に、単にテキスト部分だけを読み上げても、取得された情報の内容を理解することが難しく、その結果として、利用者が次に取得したい情報を指定するためのリンク項目の選択が難しくなるという問題がある。そのため、視覚の不自由な人はWWWの情報のサービスを充分に享受できない。
【0006】
本発明は、上記従来技術の問題点に鑑み、WWWの情報に含まれるテキスト及びリンク項目を音声による情報として表現する改良されたブラウザシステム、プロキシサーバ及び情報の読み上げ方法の提供を目的とする。
【0007】
【課題を解決するための手段】
図1は本発明の原理構成図である。本発明では、上記の課題を解決するために、同図に示す如く、クライアント端末110により音声で指定された情報をネットワーク104を介して情報サーバ102から取得し、取得された情報を上記クライアント端末110に音声で出力するブラウザシステムは、情報サーバ102から取得された情報に含まれる関連する情報へのリンク先を示すリンク項目を音声に変換してクライアント端末110に出力する音声出力手段120と、クライアント端末110から入力された音声によってリンク項目を指定し、指定されたリンク項目により情報サーバ102へアクセスする音声入力手段130とを有することを特徴とする。
【0008】
上記音声入力手段120により、音声による入力からリンク項目及びアイコンを指定することが可能になり、かつ、上記音声出力手段130により、クライアント端末に表示される情報を読み上げることが可能になる。
図2は本発明の音声プロキシ(Proxy) サーバ100を表わす図である。本発明は、情報サーバ102から取得された情報に含まれる関連する情報へのリンク先を示すリンク項目を音声に変換してクライアント端末110に出力する音声出力手段120と、クライアント端末110から入力された音声によってリンク項目を指定する手段132及び指定されたリンク項目により情報サーバ102へアクセスする手段134を有する音声入力手段130とからなることを特徴とする音声プロキシサーバ100である。
【0009】
上記音声プロキシサーバ100の音声入力手段130は、入力された音声によって上記クライアント端末の画面に表示されたアイコンを選択する手段136を更に有する方が有利である。
上記音声出力手段120は、上記情報サーバから取得された情報のテキスト中に含まれるリンク項目の型に応じて、上記情報サーバから取得された情報の型を判断する手段142と、上記判断された情報の型に応じて、上記情報を読み上げる手段144とを有する。
【0010】
上記情報の型を判断する手段142は、上記情報サーバから取得された情報が、テキスト中に少数のリンク項目が含まれるリンク項目混在型、又は、テキスト中にリンク項目が列挙されているリンク項目列挙型のいずれの型であるかを判断する。この判断に対応して、上記情報を読み上げる手段144は、リンク項目混在型の情報を読み上げる手段146と、リンク項目列挙型の情報を読み上げる手段148とを有する。
【0011】
上記いずれの型であるかを判断する手段142は、上記情報を所定数以下のリンク項目を含む情報単位に分割する手段150と、上記情報単位が上記リンク項目混在型又は上記リンク項目列挙型のいずれの型であるかを判定する手段152とからなる点が有利である。
本発明の音声プロキシサーバ100により、音声による入力からリンク項目及びアイコンを指定することが可能になり、かつ、クライアント端末に表示される情報を読み上げることが可能になる。
【0012】
更に、本発明によれば、ブラウザ上に表示したインターネット情報のアイコン、テキスト本文、リンク項目の読み上げ方が、テキスト本文中のリンク項目の数及びリンク項目の型(リンク項目混在型又はリンク項目列挙型)に従って判断され、インターネット情報が自動的に処理されて音声出力される点に特徴がある。これにより、視覚的な情報を用いることなく、リンク項目を簡単に選択できるようになる。
【0013】
図3は本発明によるリンク項目を読み上げる方法の原理を説明する図である。本発明のリンク項目を読み上げる方法は、情報サーバから関連する情報へのリンク先を示すリンク項目を含むテキスト情報を取得する段階(ステップ100)と、上記取得されたテキスト情報に含まれるリンク項目が、テキスト中に少数のリンク項目が含まれるリンク項目混在型、又は、テキスト中にリンク項目が列挙されているリンク項目列挙型のいずれの型であるかを判断する段階(ステップ110)と、上記判断されたテキスト情報の型に応じて、上記テキスト情報を読み上げる段階(ステップ120)とからなることを特徴とするリンク項目を読み上げる方法。
【0014】
上記いずれの型であるかを判断する段階(ステップ110)は、上記テキスト情報を、所定の数以下の個数のリンク項目が含まれる情報単位に分割し(ステップ111)、上記分割された各情報単位が、リンク項目混在型又はリンク項目列挙型のいずれの型であるかを判断する(ステップ112)方が有利である。
また、上記テキスト情報を読み上げる段階(ステップ120)は、上記情報単位がリンク項目混在型かリンク項目列挙型であるかを判別し(ステップ121)、上記情報単位がリンク項目混在型であるならば、リンク項目を含む本文の読み上げと、リンク項目の読み上げとを行い(ステップ122)、上記情報単位がリンク項目列挙型であるならば、リンク項目と対応した本文の読み上げを行う(ステップ123)ことを特徴とする。
【0015】
【発明の実施の形態】
図4は本発明の第1の実施例の音声ブラウザシステムの構成図である。同図に示された音声ブラウザシステムのクライアント端末は、クライアント端末本体1と、クライアント端末本体1に接続された音声入力用のマイク2及び音声合成音などの音声出力用のスピーカ3と、クライアント端末本体1に接続された表示装置4とからなる。情報サーバであるWWWサーバ7から取り出された情報は、通常、表示装置4に表示される。表示装置4は、視覚の不自由な人には直接有効ではない。
【0016】
音声ブラウザシステムは、音声ブラウザのための処理を行う音声プロキシサーバ5を更に有する。クライアント端末はネットワーク6を介して音声プロキシサーバ5に接続される。ネットワーク6は、周知のイーサネット、ATM等のいずれのネットワークでもよく、本発明はネットワークの形態に限定されるものではない。情報を提供するWWWサーバ7は、世界中に接続されているインターネット8に接続されている。
【0017】
図3は、本発明の第1の実施例のサーバクライアント構成を示す図である。クライアント21は、例えば、Netscape NavigatorTMのようなブラウザ22、ブラウザ22との間で音声の入出力を行う音声入出力AP(アプリケーションプログラム)23、音声入出力AP23からブラウザに自動的に任意の情報先(通常、URLと称される)へアクセスさせるための制御を行うブラウザ制御アプリケーションプログラム24、及び、音声入力の際に、ボタンの入力を監視するボタン監視アプリケーションプログラム25からなる。但し、音声のパワーを検出することにより上記ボタンを使用しないで音声入力を監視しても構わない。
【0018】
音声プロキシサーバ26は、マイクからの音声を認識する音声認識エンジン28と、テキストを音声に合成する音声合成エンジン29と、文章を名詞又は複合語単位に分解する形態素解析エンジン33と、クライアント21とWWWサーバ32との中継、並びに、音声認識エンジン28及び音声合成エンジンとのインタフェース処理とを行う音声プロキシ部27とからなる。音声プロキシ部27は、音声出力、即ち、読み上げ条件に基づく読み上げを行う読み上げ前処理部30を有する。
【0019】
本発明の第1の実施例によれば、漢字コード変換機能やキャッシュメモリ機能を有する中継サーバ31が設けられているが、これらの機能は音声プロキシサーバ26の中に組み込んでもよい。WWWサーバ32は既存のhttpd である。
図6は図5に示した本発明の第1の実施例のサーバクライアントの動作シーケンスチャートである。以下の説明では、利用者がWWWサーバに入り、最初のページをアクセスし、その後に任意のページにユーザがアクセスする場合を考える。各動作について順次説明する。
【0020】
ステップ1)利用者がクライアント本体、例えば、パソコンの電源を入れると、予め電源投入時に起動するよう設定された音声入出力アプリケーションプログラム23が自動的に起動される。このような起動は、パソコンの設定方法により実現される。
ステップ2)音声入出力アプリケーションプログラム23は、Netscape NavigatorTMのようなブラウザ22を起動させる。
【0021】
ステップ3)ブラウザ22は起動時に表示すべきURLを取得する要求を音声プロキシ部27に送る。
ステップ4)音声プロキシ部27はブラウザ22の要求するURLの要求をWWWサーバ32に発行する。
ステップ5)WWWサーバ32のhttpdは要求されたURLのデータを返す。
【0022】
ステップ6)音声プロキシ部27はURLをブラウザ23に返し、ブラウザ23はURLをパソコン画面に表示する。
ステップ7)音声プロキシ部27の前処理部30は、URLのデータに基づいて読み上げ前処理を行う。読み上げ前処理とは、HTMLデータから、クライアントで音声出力させるテキストを抽出し、プレーンテキスト化し、タイトル部、本文、リンク項目等に分類すると共に、ガイダンスを追加して音声合成エンジン29に音声変換を要求する処理である。但し、起動時に表示されるURLの場合には、本文及びリンク案内ガイダンスの音声変換だけが要求される。
【0023】
ステップ8)音声合成を依頼された音声合成エンジン29は、テキストデータを音声データに変換し、音声プロキシ部27に渡す。
ステップ9)音声プロキシ部27は、音声合成エンジン29から受けた音声データをクライアントの音声入出力アプリケーションプログラム23に伝達し、音声入出力アプリケーションプログラム23は音声データを音声出力する。
【0024】
ステップ10)音声プロキシ部27は、読み上げ前処理で抽出されたリンク項目の形態素解析を形態素解析エンジン33に要求する。
ステップ11)形態素解析エンジン33は、リンク項目の1文章を名詞単位に分解して、音声認識時の候補として抽出すると共に、名詞が連続する際には、複合語も候補として抽出し、解析結果を音声プロキシ部27に渡す。形態素解析の技術は、発明の名称「形態素解析方法および装置」の特願平7−291143号明細書又は発明の名称「ハイパーテキスト中継方法及び装置」の特願平8−312016号明細書に記載されている。例えば、「内閣総理大臣が渡米」というリンク項目がある場合に、このステップの形態素解析により得られる音声認識時の候補は、全文の「内閣総理大臣が渡米」、「内閣」、「大臣」、「内閣総理」、「総理大臣」、「内閣総理大臣」及び「渡米」である。
【0025】
ステップ12)音声プロキシ部27は、形態素解析エンジン33の解析結果を音声認識エンジン28に渡し、辞書登録を行う。
ステップ13)次に、利用者は音声入力を開始するため、ボタン(図示しない)を押下する。クライアント21のボタン監視アプリケーションプログラム25は、ボタンが押下されたので、音声入出力アプリケーションプログラム23に通知する。このタイミングで音声入出力アプリケーションプログラム23は音声の録音を開始する。
【0026】
ステップ14)更に、ボタン監視アプリケーションプログラム25は、ボタンを監視し、ボタンが放されたことを検出したタイミングで、音声入出力アプリケーションプログラム23に通知し、音声入出力アプリケーションプログラム23は音声の録音を終了し、音声入出力アプリケーションプログラム23へ通知する。
【0027】
ステップ15)音声入出力アプリケーションプログラム23は入力された音声を音声プロキシ部27に送信する。
ステップ16)音声プロキシ部27は、受信した音声データに基づいて音声認識エンジン28に音声認識を要求する。
ステップ17)音声認識エンジン28は、音声データを受信し、音声認識を実行して結果を音声プロキシ部27に返す。
【0028】
ステップ18)音声プロキシ部27は、認識結果を基にして、現在表示されている情報から要求されたリンク項目のURLを取得し、WWWサーバ32へ要求を発行する。
ステップ19)WWWサーバ32のhttpdは、要求されたURLのデータを返す。
【0029】
ステップ20)音声プロキシ部27の前処理部30は、WWWサーバ32から返されたURLのデータに基づいて読み上げ前処理を行う。ここで、ブラウジング案内ガイダンスだけの音声合成を音声合成エンジン29に要求する。
ステップ21)音声合成エンジン29は、ブラウジング案内ガイダンスを音声データに変換し、音声プロキシ部27に渡す。
【0030】
ステップ22)音声プロキシ部27は、受信した音声データをクライアント21の音声入出力アプリケーションプログラム23に送り音声出力を要求すると同時に、インターネット情報の表示を行う命令を発行する。
ステップ23)音声入力アプリケーションプログラム23は、音声出力を行うと同時に、ブラウザ制御アプリケーションプログラム24へインターネット情報の表示を行う命令を発行する。
【0031】
ステップ24)ブラウザ制御アプリケーションプログラム24は、音声入力アプリケーションプログラム23の要求通りにブラウザにインターネット情報の表示を行う命令を発行する。
ステップ25)ブラウザ22は、指定されたURLを取得する要求を音声プロキシ部27に出す。
【0032】
ステップ26)音声プロキシ部27は、そのブラウザ22の要求に対し、ステップ19)で受信されたURLデータを速やかに返送し、ブラウザ22はそのデータを表示する。
ステップ27)音声プロキシ部27の前処理部30は、URLのデータに基づいて読み上げ前処理を行う。ここでは、本文及びリンク項目の音声変換だけを音声合成エンジン29に要求する。
【0033】
ステップ28)音声合成エンジン29は、テキストデータを音声に変換し、音声プロキシ部27に渡す。
ステップ29)音声プロキシ部27は受信した音声データを音声入出力アプリケーションプログラム12に渡し、音声入出力アプリケーションプログラム12は音声出力を行う。
【0034】
ステップ30)音声プロキシ部27は、読み上げ前処理部30で抽出されたリンク項目の形態素解析を形態素解析エンジン33に要求する。
ステップ31)形態素解析エンジン33は、ステップ11)と同様に、リンク項目の形態素解析を行い、解析結果を音声プロキシ部27に渡す。
ステップ32)音声プロキシ部27は、形態素解析エンジン33の解析結果を音声認識エンジン28に渡し、辞書登録を行う。
【0035】
これにより、サーバクライアントシステムは、利用者からの音声入力待ちになり、ステップ13)以降の処理が繰り返し行われる。
【0036】
【実施例】
図7は、本発明の第2の実施例において、WWWサーバから取り出され、ブラウザ上に表示された情報の型の例を表わす図である。同図の(A)は、テキスト中に少数のリンク項目が含まれるリンク項目混在型の場合を表わす。タイトル欄41に示された「音声ブラウザ」がこの情報のタイトルである。本文欄42には、この情報の本文が示される。本文の一部には、リンクが張られたリンク項目43が示される。この例では、影文字で示された「ブラウザ」、「表示装置」及び「インターネット」の3箇所にリンクが張られている。これらのリンク項目を選択することにより、夫々のリンクが張られた先の情報にアクセスできる。本文欄42内の枠に示された画像は、この情報のイメージ部分44である。
【0037】
図7の(B)にはリンク項目列挙型の場合の情報の例が示される。この例の場合、多数のリンク項目45が列挙されている。この例は、WWWサーバから取り出された情報が検索結果の一覧の場合であり、情報の中の殆どの部分がリンク項目の列挙に該当している。例えば、目次は、このように殆どの部分がリンク項目の列挙である。
【0038】
情報を表示形式で分類すると、図7に示された混在型と列挙型の2種類がある。取り出された情報を音声で読み上げる方式は、情報の型によって異なる。
図8は本発明の第2の実施例によるリンク項目混在型の情報の読み上げ順方式を表わす図である。同図に示された例は、図7の(A)に示された情報に基づいている。
【0039】
図8の(A)は、タイトル、リンク項目、本文の順に読み上げるタイトル−リンク−本文順読み上げ方式を表わす図である。この方式の場合、最初に、情報のタイトル「音声ブラウザ」の読み上げ部分51が読み上げられる。情報のタイトルの読み上げ部分51には、アクセスした情報のタイトルが挿入される。「アクセスします」の部分52は、タイトル「音声ブラウザ」にアクセスすることをガイダンスしているところである。この方式では、この部分52は、例えば、プログラムで固定的に使用される。尚、図面及び明細書の説明中、下線付きの部分は読み上げ時に固定的に使用される箇所を表わす。読み上げ部分51と、固定部分52とから、「音声ブラウザにアクセスします」と読み上げられる。ここで、固定部分52の「アクセスします」は、例えば、「という情報を取り出し表示します」のように置き換えても構わない。このようにガイダンス文自体は、自由な形にしてよいことはいうまでもない。次に、リンク項目読み上げのガイダンス文53が続く。更に、この情報の中でリンクが張られている全項目、例えば、「インターネット」の項目55等の読み上げ部分54である。この例では、「ブラウザ」、「表示装置」及び「インターネット」の3項目が含まれる。全項目の読み上げ部分54に続いて、本文読み上げ開始のガイダンス部分56と、本文自体の読み上げ部分57とがある。
【0040】
図8の(B)は、タイトル−本文−リンク順読み上げ方式を表わす図である。同図の(A)のタイトル−リンク−本文順読み上げ方式とは異なり、本文を先に読み上げた後に、リンク項目が読み上げられる。
同図の(C)は、タイトル−本文−リンク順読み上げ方式において、リンク項目が自動的には読み上げられない方式に相当する。即ち、本文の読み上げ終了の時点で、音声によって「リンク項目」と入力することにより、その情報のリンク項目が読み上げられる方式である。
【0041】
一方、列挙型の情報の場合には、リンク項目と本文とが略一致するため、上記の混在型情報の読み上げ順方式をそのまま使用することはできない。図9は、本発明の第2の実施例による列挙型情報の読み上げ順方式を表わす図である。図8に示された混在型と比較すると、リンク項目が本文と一致した場合に相当する。図9には、列挙型の読み上げ順方式に固有のガイダンス文58が示される。それ以外は図8に示された混在型と同様に読み上げられる。
【0042】
図10は、本発明の第3の実施例による読み上げ条件自動処理のフローチャートである。情報がWWWサーバから取り出されると、音声プロキシサーバ上の蓄積装置に情報が一時的に格納される。
蓄積装置に蓄積された情報を必要に応じてメモリに転送し、読み上げ条件自動処理を開始する(ステップ51)。
【0043】
最初に、与えられた読み上げ条件を参照して、読み上げの際に分割される情報単位に含まれるリンク項目のリンク数Lnと、読み上げ条件と、情報型判断指数Aとを設定する(ステップ52)。ここで、読み上げ条件とは、リンク項目又は本文のいずれを先に読み上げるかを指定する条件である。また、情報型判断指数とは、分割された本文(以下、分割本文と称する)内のリンク項目の総文字数と分割本文の総文字数との基準の比を表わす量である。
【0044】
次に、分割本文内のリンク項目数が取得された分割のリンク数Ln以下になる場所、かつ、文章単位で本文を先頭から分割する(ステップ53)。
本文が分割された後、分割本文がリンク項目列挙型或いはリンク項目混在型のいずれであるかが判定される(ステップ54)。判定の方法は、分割本文内のリンク項目の総文字数(p)と分割本文の総文字数(q)との比(p/q)と、情報型判断指数(A)との大小関係による。即ち、p/q>Aならば、列挙型であると判定され、p/q<Aであるならば、混在型であると判定される。通常、情報型判断指数Aは、限りなく1に近い値が設定される。
【0045】
分割本文の情報が混在型であると判定された場合、次に、リンク項目と本文のいずれを先に読み上げるかを読み上げ条件に基づいて判定する(ステップ55)。
リンク項目が先と判定されたならば、Ln個のリンク項目が読み上げられ(ステップ56)、続いて、分割本文が読み上げられる(ステップ57)。
【0046】
一方、本文が先と判定されたならば、まず分割本文が読み上げられ(ステップ58)、次に、Ln個のリンク項目が読み上げられる(ステップ59)。
分割本文の情報が列挙型であると判定された場合、Ln個分のリンク項目と、分割本文とが一度に読み上げられる(ステップ60)。
リンク項目と分割本文とが読み上げられた後、本文がすべて終了したかどうかが判定される(ステップ61)。
【0047】
未だ読み上げられていない分割本文がある場合、次の分割本文が取り出され(ステップ62)、ステップ54に戻り、次の分割本文について同様に読み上げ条件自動処理が繰り返される。本文がすべて終了している場合には、読み上げ終了の処理に進む(ステップ63)。
図11は本発明の第4の実施例による分割本文とその読み上げ内容とを示す図である。本文の分割と、読み上げ内容の決定は、音声プロキシサーバの音声プロキシ部に設けられた読み上げ前処理部で行われる。
【0048】
読み上げ条件の内容61は、本文の分割がリンク数=3、読み上げ順序がタイトル、リンク項目、本文の順であることを示している。情報型判断指数A=0.95である。
設定内容を設定する方法は、例えば、画面から設定されたデータをファイルに書き込む方法、或いは、ファイルに直接書き込む方法等のいずれの方法でも良く、本発明は読み上げ条件の内容の設定方法によって限定されるものではない。
【0049】
情報の本文全体62は、リンク数=3を用いて、分割本文1、分割本文2及び分割本文3の3つに分割されていることが分かる。更に、分割本文の中で、分割本文1及び分割本文3はリンク項目混在型であり、分割本文2はリンク項目列挙型である。読み上げ内容63は、このような分割本文に従って生成された読み上げ例を表わす。
【0050】
混在型の分割本文1及び分割本文3は、読み上げ条件に従って、リンク項目、本文の順に読み上げられることが分かる。列挙型の分割本文3の場合には、リンク項目と本文とが同一であるため、まとめて一度だけ読み上げられる。また、次の分割本文に移る場合には、音声コマンド「次ぎ」を使用してもよい。
また、音声プロキシサーバ26の構成は、上記の実施例で説明された例に限定されることなく、音声プロキシサーバ26の各々の構成要件をソフトウェア(プログラム)で構築し、ディスク装置等に格納しておき、必要に応じて情報提供装置のコンピュータにインストールしてリンク項目の読み上げを行うことも可能である。さらに、構築されたプログラムをフロッピーディスクやCD−ROM等の可搬記憶媒体に格納し、このようなシステムを用いる場面で汎用的に使用することも可能である。
【0051】
本発明は、上記の実施例に限定されることなく、特許請求の範囲内で種々変更・応用が可能である。
【0052】
【発明の効果】
以上に詳述したように、本発明によれば、ブラウザ上に取り出された情報のうちのテキスト本文及びリンク項目の読み上げ方が、利用者の設定内容であるリンク項目の数と、リンク項目が情報に混在的に含まれるか、又は、列挙的に含まれるかを表わす情報の型とに応じて、自動的に処理され、テキスト本文及びリンク項目が音声出力されるので、テキスト本文及びリンク項目の読み上げ方が利用者の好みの条件で使用されるという利点がある。
【0053】
本発明の音声プロキシサーバにより、音声による入力からリンク項目及びアイコンを指定することが可能になり、かつ、クライアント端末に表示される情報を読み上げることが可能になる。従って、通常のブラウザを持つクライアント端末は、音声認識或いは音声合成のような特別なソフトウェアを別途準備することなく、音声を利用したブラウザシステムを実現することができる。
【0054】
更に、クライアント端末ではなく、音声プロキシサーバに音声認識及び音声合成の手段を設けることにより、クライアント端末の機種に殆ど依存することのない汎用的なブラウザシステムを構築することが可能になる。また、プロキシサーバは大規模な辞書を搭載することが可能であり、クライアント端末に記事を表示している間に先行して各種変換処理を行うことが可能である。従って、テキスト系サービスのサーバ、エンジンを拡張する際に、例えば、翻訳、要約のような各種変換処理されたテキストを同時に配信することが可能である。
【図面の簡単な説明】
【図1】本発明の原理構成図である。
【図2】本発明の音声プロキシサーバの構成図である。
【図3】本発明のリンク項目の読み上げ方法の原理説明図である。
【図4】本発明の第1の実施例による音声ブラウザシステムの構成図である。
【図5】本発明の第1の実施例のサーバクライアントシステムの構成図である。
【図6】本発明の第1の実施例のサーバクライアントシステムの動作シーケンスチャートである。
【図7】本発明の第2の実施例における情報の型の例の説明図である。
【図8】本発明の第2の実施例における混在型情報の読み上げ順の説明図である。
【図9】本発明の第2の実施例における列挙型情報の読み上げ順の説明図である。
【図10】本発明の第3の実施例による読み上げ条件自動処理のフローチャートである。
【図11】本発明の第4の実施例による分割本文と読み上げ内容との説明図である。
【符号の説明】
100 音声プロキシサーバ
102 情報サーバ
110 クライアント端末
120 音声出力手段
130 音声入力手段
132 リンク項目指定手段
134 情報サーバアクセス手段
136 アイコン選択手段
142 リンク項目型判断手段
144 情報読み上げ手段
146 リンク項目混在型情報読み上げ手段
148 リンク項目列挙型情報読み上げ手段
150 情報分割手段
152 情報単位リンク項目型判断手段

Claims (7)

  1. クライアント端末により音声で指定された情報をネットワークを介して情報サーバから取得し、取得された情報を上記クライアント端末に音声で出力するブラウザシステムにおいて、
    上記情報サーバから取得された情報の型が、テキスト中に少数のリンク項目が含まれるリンク項目混在型、又は、テキスト中にリンク項目が列挙されているリンク項目列挙型のいずれの型であるかを判断する手段と、
    上記判断された情報の型に応じて、上記情報サーバから取得された情報に含まれる関連する情報へのリンク先を示すリンク項目を音声に変換して上記クライアント端末に出力する、リンク項目混在型の情報を読み上げる手段とリンク項目列挙型の情報を読み上げる手段とを有する音声出力手段と、
    上記クライアント端末から入力された音声によってリンク項目を指定する手段及び上記指定されたリンク項目により情報サーバへアクセスする手段を有する音声入力手段と
    からなることを特徴とする音声プロキシサーバ。
  2. 上記いずれの型であるかを判断する手段は、上記情報を所定数以下のリンク項目を含む情報単位に分割する手段と、上記情報単位が上記リンク項目混在型又は上記リンク項目列挙型のいずれの型であるかを判断する手段とからなることを特徴とする請求項に記載の音声プロキシサーバ。
  3. 上記いずれの型であるかを判断する手段は、リンク項目の総文字数と本文の総文字数との比によって、リンク項目混在型、又は、リンク項目列挙型のいずれの型であるかを判断することを特徴とする請求項1又は2に記載の音声プロキシサーバ。
  4. クライアント端末により音声で指定された情報をネットワークを介して情報サーバから取得し、取得された情報を上記クライアント端末に音声で出力する、リンク項目型判断手段と、音声出力手段と、音声入力手段とを有するブラウザシステムにおいて、リンク項目を読み上げる方法であって、
    上記リンク項目型判断手段は、上記情報サーバから取得された情報の型が、テキスト中に少数のリンク項目が含まれるリンク項目混在型、又は、テキスト中にリンク項目が列挙されているリンク項目列挙型のいずれの型であるかを判断する段階と、
    上記音声出力手段は、上記判断された情報の型に応じて、上記情報サーバから取得された情報に含まれる関連する情報へのリンク先を示すリンク項目を音声に変換して上記クライアント端末に出力する段階と、
    上記音声入力手段は、上記クライアント端末から入力された音声によってリンク項目を指定する手段及び上記指定されたリンク項目により情報サーバへアクセスする手段を有する段階と
    からなることを特徴とするリンク項目読み上げ方法
  5. 上記いずれの型であるかを判断する段階は、上記情報を所定数以下のリンク項目を含む情報単位に分割する段階と、上記情報単位が上記リンク項目混在型又は上記リンク項目列挙型のいずれの型であるかを判断する段階とからなることを特徴とする請求項に記載のリンク項目読み上げ方法
  6. 上記いずれの型であるかを判断する段階は、リンク項目の総文字数と本文の総文字数との比によって、リンク項目混在型、又は、リンク項目列挙型のいずれの型であるかを判断する段階からなることを特徴とする請求項4又は5に記載のリンク項目読み上げ方法。
  7. 請求項4乃至6のうちいずれか1項に記載のリンク項目読み上げ方法の各段階をコンピュータで実現させるためのプログラムを記録した、該コンピュータが読み取り可能な記憶媒体。
JP27016197A 1997-10-02 1997-10-02 ブラウザシステム、音声プロキシサーバ、リンク項目の読み上げ方法及びリンク項目の読み上げプログラムを格納した記憶媒体 Expired - Fee Related JP3789614B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP27016197A JP3789614B2 (ja) 1997-10-02 1997-10-02 ブラウザシステム、音声プロキシサーバ、リンク項目の読み上げ方法及びリンク項目の読み上げプログラムを格納した記憶媒体

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP27016197A JP3789614B2 (ja) 1997-10-02 1997-10-02 ブラウザシステム、音声プロキシサーバ、リンク項目の読み上げ方法及びリンク項目の読み上げプログラムを格納した記憶媒体

Publications (2)

Publication Number Publication Date
JPH11110186A JPH11110186A (ja) 1999-04-23
JP3789614B2 true JP3789614B2 (ja) 2006-06-28

Family

ID=17482393

Family Applications (1)

Application Number Title Priority Date Filing Date
JP27016197A Expired - Fee Related JP3789614B2 (ja) 1997-10-02 1997-10-02 ブラウザシステム、音声プロキシサーバ、リンク項目の読み上げ方法及びリンク項目の読み上げプログラムを格納した記憶媒体

Country Status (1)

Country Link
JP (1) JP3789614B2 (ja)

Families Citing this family (19)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6718015B1 (en) * 1998-12-16 2004-04-06 International Business Machines Corporation Remote web page reader
JP2003521762A (ja) * 1999-07-02 2003-07-15 コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ ユーザ・プロファイルに基づいた音声のurl上へのマッピング
JP2001075968A (ja) * 1999-08-31 2001-03-23 Toshiba Corp 情報検索方法及びそれを記録した記録媒体
US7149690B2 (en) 1999-09-09 2006-12-12 Lucent Technologies Inc. Method and apparatus for interactive language instruction
KR100371880B1 (ko) * 2000-01-11 2003-02-15 오양근 인터넷 정보의 출력방법
JP2001236284A (ja) * 2000-02-22 2001-08-31 Ntt Docomo Inc 携帯通信端末、サーバ装置及び情報配信システム
JP3862470B2 (ja) * 2000-03-31 2006-12-27 キヤノン株式会社 データ処理装置及び方法、ブラウザシステム、ブラウザ装置、記録媒体
US6654722B1 (en) * 2000-06-19 2003-11-25 International Business Machines Corporation Voice over IP protocol based speech system
JP3714159B2 (ja) * 2000-11-30 2005-11-09 日本電気株式会社 ブラウザ搭載装置
JP4225703B2 (ja) * 2001-04-27 2009-02-18 インターナショナル・ビジネス・マシーンズ・コーポレーション 情報アクセス方法、情報アクセスシステムおよびプログラム
CN1279465C (zh) * 2001-05-04 2006-10-11 微软公司 Web启用的识别体系结构
GB2388209C (en) 2001-12-20 2005-08-23 Canon Kk Control apparatus
KR100488112B1 (ko) * 2001-12-28 2005-05-06 엘지전자 주식회사 음성 포탈 시스템에서의 검색 및 문서 변환 장치
SE0202058D0 (sv) * 2002-07-02 2002-07-02 Ericsson Telefon Ab L M Voice browsing architecture based on adaptive keyword spotting
US20040098463A1 (en) * 2002-11-19 2004-05-20 Bo Shen Transcoding-enabled caching proxy and method thereof
JP2007081765A (ja) * 2005-09-14 2007-03-29 Nippon Hoso Kyokai <Nhk> マルチメディアコンテンツ生成装置及び番組情報配信装置並びに携帯端末装置
JP4700451B2 (ja) * 2005-09-16 2011-06-15 日本放送協会 番組情報配信装置並びに携帯端末装置
JP4925906B2 (ja) * 2007-04-26 2012-05-09 株式会社日立製作所 制御装置、情報提供方法及び情報提供プログラム
JP7009840B2 (ja) 2017-08-30 2022-01-26 富士通株式会社 情報処理装置、情報処理方法及び対話制御システム

Also Published As

Publication number Publication date
JPH11110186A (ja) 1999-04-23

Similar Documents

Publication Publication Date Title
JP3789614B2 (ja) ブラウザシステム、音声プロキシサーバ、リンク項目の読み上げ方法及びリンク項目の読み上げプログラムを格納した記憶媒体
JP4225703B2 (ja) 情報アクセス方法、情報アクセスシステムおよびプログラム
US8781840B2 (en) Retrieval and presentation of network service results for mobile device using a multimodal browser
US5983184A (en) Hyper text control through voice synthesis
KR100653862B1 (ko) 언어 독립적 음성-기반 검색 시스템
US6018710A (en) Web-based interactive radio environment: WIRE
KR100461019B1 (ko) 소형 화면 단말기를 위한 웹 컨텐츠 변환 시스템 및 방법
JP3864197B2 (ja) 音声クライアント端末装置
JP2001014306A (ja) 電子文書処理方法及び電子文書処理装置並びに電子文書処理プログラムが記録された記録媒体
WO1998044643A2 (en) Audio interface for document based information resource navigation and method therefor
JP2000003126A (ja) 音声部を使用するテキスト要約方法
JPH1125098A (ja) 情報処理装置、リンク先ファイルの取得方法および記憶媒体
JPH11161682A (ja) 情報検索装置、情報検索方法及び記録媒体
JPH10124293A (ja) 音声指令可能なコンピュータとそれ用の媒体
JP2002197118A (ja) 情報アクセス方法、情報アクセスシステムおよび記録媒体
CN106406882A (zh) 一种论坛中帖子背景的展现方法和装置
US20020143817A1 (en) Presentation of salient features in a page to a visually impaired user
JP4194741B2 (ja) 画面読み上げソフトを使用する利用者に向けたWebページ案内サーバー及び方法
JP4756764B2 (ja) プログラム及び情報処理装置並びに情報処理方法
JPH10322478A (ja) 音声によるハイパーテキストアクセス装置
JPH10326178A (ja) 情報処理装置及びプログラム記憶媒体
JP2002297667A (ja) 文書閲覧装置
US20030212560A1 (en) Speech synthesis apparatus and its method, and program
JP4110938B2 (ja) Webブラウザ制御方法及び装置
JP7048141B1 (ja) プログラム、ファイル生成方法、情報処理装置、及び情報処理システム

Legal Events

Date Code Title Description
A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20050609

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20051115

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20051222

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20060328

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20060329

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

S533 Written request for registration of change of name

Free format text: JAPANESE INTERMEDIATE CODE: R313533

R360 Written notification for declining of transfer of rights

Free format text: JAPANESE INTERMEDIATE CODE: R360

R370 Written measure of declining of transfer procedure

Free format text: JAPANESE INTERMEDIATE CODE: R370

S533 Written request for registration of change of name

Free format text: JAPANESE INTERMEDIATE CODE: R313533

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090407

Year of fee payment: 3

S531 Written request for registration of change of domicile

Free format text: JAPANESE INTERMEDIATE CODE: R313531

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100407

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110407

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120407

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120407

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130407

Year of fee payment: 7

LAPS Cancellation because of no payment of annual fees