JPH11249867A - 音声ブラウザシステム - Google Patents

音声ブラウザシステム

Info

Publication number
JPH11249867A
JPH11249867A JP10048180A JP4818098A JPH11249867A JP H11249867 A JPH11249867 A JP H11249867A JP 10048180 A JP10048180 A JP 10048180A JP 4818098 A JP4818098 A JP 4818098A JP H11249867 A JPH11249867 A JP H11249867A
Authority
JP
Japan
Prior art keywords
voice
client
request
server
audio
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP10048180A
Other languages
English (en)
Other versions
JP3864197B2 (ja
Inventor
Ikuo Namiki
育夫 並木
Hiromichi Hayashi
弘道 林
Tetsuya Kanamaru
哲哉 金丸
Tsuneji Kimeda
常治 木目田
Masami Ujiie
正美 氏家
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NTT Electronics Corp
Nippon Telegraph and Telephone Corp
Original Assignee
NTT Electronics Corp
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NTT Electronics Corp, Nippon Telegraph and Telephone Corp filed Critical NTT Electronics Corp
Priority to JP04818098A priority Critical patent/JP3864197B2/ja
Publication of JPH11249867A publication Critical patent/JPH11249867A/ja
Application granted granted Critical
Publication of JP3864197B2 publication Critical patent/JP3864197B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Landscapes

  • Information Transfer Between Computers (AREA)
  • Computer And Data Communications (AREA)

Abstract

(57)【要約】 【課題】 視覚障害者であってもWWW情報を取得する
ことが可能な音声ブラウザシステムを提供する。 【解決手段】 本発明は、クライアントから音声入力に
よる要求を取得する音声要求取得手段と、音声要求取得
手段より入力された音声による要求を音声認識する音声
認識手段と、音声認識手段により認識された結果に基づ
いてクライアントから指定されたURLに対して、要求
をインターネットに送信する要求送信手段と、インター
ネットから取得した応答から音読テキストを抽出して音
声データに変換し、音声合成する音声データ生成手段
と、音声データ生成手段により生成された音声データを
クライアントに送信する音声データ送信手段とを有する
サーバと、ユーザの音声による要求を入力する音声入力
手段と、サーバから取得した結果よりURLを抽出し、
該URLに基づいて該サーバにHTMLファイルを要求
する要求発行手段と、サーバから送信された音声データ
を出力する音声出力手段とを有するクライアントとを有
する。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、音声ブラウザシス
テムに係り、特に、コンピュータとネットワークからな
るクライアント/サーバ構成のシステム、とりわけイン
ターネットにおけるWorld Wide Web(以下、単にWWW
と記す)システムのサーバに対し、クライアント端末の
マイクから音声で入力し、サーバに蓄積している情報を
音声で出力する音声ブラウザシステムに関する。
【0002】
【従来の技術】周知のように、WWWシステムとして、
サーバ及びクライアントのハードウェア、ソフトウェア
がネットワーク上に適切に構成されている場合に、クラ
イアント端末上にインストールしたNetscape Navigator
などのブラウザを使用することによって、サーバに格納
したテキストやイメージの情報をクライアント画面上に
表示して閲覧することが可能である。
【0003】このシステムでは、画面上の特定の情報を
マウスなどで選択すると、これと関連付けられた(以下
では、これをリンクが張られたと言い、先の特定の情報
をリンク項目と言う)情報にアクセスし、画面上に表示
し閲覧することが可能である。これらのサービスは、情
報を視覚によって享受することが前提であり、画面に目
を向けないと享受できない、あるいは、視覚障害者は全
く享受できないという欠点がある。これを解決する方法
として、最近の音声認識技術と音声合成技術を使用する
ことによって、マイクから音声で入力し、音声合成で出
力することが可能である。例えあ、音声で[首相官邸]
と入力すれば、[首相官邸]の情報にアクセスし、クラ
イアント端末のスピーカから、テキスト部分を合成音で
出力することができる。
【0004】
【発明が解決しようとする課題】しかしながら、上記従
来の方法では、周知のWWW情報には、長い文章や、リ
ンク箇所が随所に10個も20個もある場合がある、カ
ラーのイメージ情報がテキストに混在することは勿論の
こと、動画とリンクが張られたり、視覚に訴える情報が
ふんだんに使用されるのが実情である。このような情報
を視覚障害者にいかに出力するかという問題が存在す
る。
【0005】本発明は、上記の点に鑑みなされたもの
で、視覚障害者であってもWWW情報を取得することが
可能な音声ブラウザシステムを提供することを目的とす
る。
【0006】
【課題を解決するための手段】図1は、本発明の原理構
成図である。本発明(請求項1)は、コンピュータとイ
ンターネットワークからなるクライアント/サーバシス
テムにおいて、サーバ100に蓄積されている情報をク
ライアント200側で音声により出力する音声ブラウザ
システムであって、サーバ100は、クライアント20
0から音声入力による要求を取得する音声要求取得手段
201と、音声要求取得手段201より入力された音声
による要求を音声認識する音声認識手段102と、音声
認識手段102により認識された結果に基づいてクライ
アント200から指定されたURLに対して、要求をイ
ンターネット70に送信する要求送信手段103と、イ
ンターネット70から取得した応答から音読テキストを
抽出して音声データを変換し、音声合成する音声データ
生成手段104と、音声データ生成手段104により生
成された音声データをクライアント200に送信する音
声データ送信手段105とを有し、クライアント200
は、ユーザの音声による要求を入力する音声入力手段2
01と、サーバ100から取得した結果よりURLを抽
出し、該URLに基づいて該サーバに、インターネット
70上に公開されているHTMLファイルを要求する要
求発行手段202と、サーバ100から送信された音声
データを出力する音声出力手段203とを有する。
【0007】本発明(請求項2)は、音声認識手段10
2において、クライアント200から入力された音声デ
ータの要求に類似する候補からなるリンク項目リスト
と、リンク項目リストを形態素解析する形態素解析手段
を含む。本発明(請求項3)は、音声データ生成手段1
04において、インターネット70から取得した応答を
クライアントが希望する言語に翻訳する翻訳手段を含
む。
【0008】本発明(請求項4)は、音声出力手段20
3において、サーバ100から受信した音声データが、
音楽コンテンツまたは、朗読コンテンツである場合に、
再生を行う再生手段を含む。本発明(請求項5)は、再
生手段において、一時停止モード、再生モード、停止モ
ードを有する。
【0009】本発明(請求項6)は、再生手段におい
て、音声データの再生中に、音声情報による割り込み出
力を行う割り込み手段を含む。上記のように、本発明で
は、インターネット上に公開されているHTML(Hyper
Text Markup Languege)形式のファイルを市販のWeb
ブラウザを通して視覚情報から音声情報に変換し、ユー
ザに提供することを可能にしたシステムである。また、
クライアント側で情報を取得する場合において、音声を
用いることで視覚障害者の操作も可能とする。
【0010】
【発明の実施の形態】図2は、本発明が適用されるシス
テムの構成を示す。同図に示すシステムは、高速なネッ
トワーク上に各処理用エンジンを配置し、負荷分散を行
うことにより高速なレスポンスをクライアント端末10
で実現可能とするものである。同図におけるシステムで
は、大別して2つのシステムに分けられる。
【0011】まず、第1に同図におけるワークステーシ
ョン20、30、40で構成されるフロント・エンドと
しての処理部である。ワークステーション20、30
は、翻訳サービスを提供するためのシステムである。ワ
ークステーション40は、一般的にインターネットでよ
く利用される機能で、本システムでは主に、データのキ
ャッシングや漢字コードの変換で利用する。
【0012】第2に、バック・エンドとして利用される
ワークステーション50、60である。ワークステーシ
ョン50は、ユーザからクライアント端末10に入力さ
れた音声データを、候補リスト(リンク項目のリスト)
と比較照合を行い、適切な項目を選出する。また、ユー
ザが入力した音声データとリンク項目が全く同一である
必要性を解消するためにリンク項目に対して形態素解析
処理を施す。そうすることにより、ユーザからはリンク
項目の断片を入力するだけでも適切なリンク項目を推量
し、選出する。ワークステーション60は、クライアン
ト端末10で抽出されたテキスト情報を、(言語種別の
パラメータ付きで)受信し、音声データを生成する音声
合成エンジンと呼ぶものである。
【0013】次に、クライアント端末10から送信され
たHTMLファイル要求は、ワークステーション20上
で動作中にプロキシ・サーバを経由し、ワークステーシ
ョン40のプロキシ・サーバを使って外部インターネッ
ト70に転送される。インターネット70から返送され
てきた応答データ(HTMLファイル)は、ワークステ
ーション40のプロキシ・サーバを経由して、ワークス
テーション20のプロキシ・サーバで各翻訳エンジンへ
データの処理を依頼して(依頼のみ、処理結果はユーザ
の要求で随時クライアント端末10へ送信される)クラ
イアント端末10へ転送する。クライアント端末10に
届いたHTMLファイルは、解析され、表示されるべき
テキスト情報をワークステーション60の音声合成エン
ジンへ送信し、音声データへ変換され、クライアント端
末10で出力される。また、音声認識のために必要なリ
ンク項目のリストは、ワークステーション50の形態素
解析エンジンで形態素解析処理を施され、音声認識エン
ジンへ渡され、クライアント端末10から音声データの
送信を待つ。
【0014】次にクライアント端末10で入力(指示)
された音声データを音声認識エンジン50に送信し、音
声認識エンジン50は、以前入力されていたリンク項目
(テキスト情報)と比較照合され、適切な結果を得る。
得られた結果をクライアント端末10に送信する。これ
により、クライアント端末10は、リンク項目からUR
Lを抽出し、インターネット70へプロキシサーバ2
0、40を介して、次の情報を取得する。
【0015】
【実施例】以下に、本発明の実施例を図面と共に説明す
る。図3は、本発明の一実施例のシステム構成を示す。
同図に示すシステムにおいて、図2と同様のものについ
ては同一符号を付す。同図に示すシステムは、クライア
ント端末10、ワークステーション20、30、40、
50から構成される。
【0016】クライアント端末10は、Webブラウザ
11、音声入力用ボタン監視プログラム12、音声ブラ
ウザクライアント13、音声入力用ボタン監視プログラ
ム12に接続される音声入力開始用ボタン15、音声ブ
ラウザクライアント13に接続されるスピーカ16及び
マイク17から構成される。ワークステーション20
は、プロキシサーバ21の機能と、テキストを英語から
日本語に翻訳する英日翻訳エンジン22を有する。
【0017】ワークステーション30は、テキストを日
本語から英語に翻訳する日英翻訳エンジン31を有す
る。ワークステーション40は、プロキシサーバ41の
機能を有する。ワークステーション50は、音声認識I
/Fプログラム51、音声認識エンジン52、形態素解
析エンジン53を有する。
【0018】ワークステーション60は、音声合成エン
ジン61を有する。Webブラウザ11は、一般によく
利用されるもので、例えば、Netscape Navigator等があ
る。本実施例では、当該ブラウザを用いて説明する。当
該Webブラウザ11は、インターネット70への窓口
として必要情報を取得し、音声ブラウザクライアント1
3に渡す。また、Webブラウザ上への表示も行う。音
声ブラウザクライアント13では、Webブラウザ11
から得られた情報を解析し、音読すべきテキスト情報を
ワークステーション60の音声合成エンジン61へ、音
声認識すべきリンク項目の情報をワークステーション5
0の音声認識I/Fプログラム51へそれぞれ送信す
る。
【0019】クライアント端末10は、音声合成エンジ
ン61から受信した音声データをローカル・ディスクに
記録しながら、スピーカ16により再生する。また、ユ
ーザからの入力は、音声入力開始用ボタン15を押下す
ることによって、音声入力用ボタン監視プログラム12
から音声ブラウザクライアント13に通知される。その
通知を受けた音声ブラウザクライアント13は、マイク
17から音声の録音を開始する。音声ブラウザクライア
ント13は、ユーザの音声入力開始用ボタン15の解放
によって、録音の停止を行い、音声認識I/Fプログラ
ム51に録音した音声データをワークステーション60
の音声合成エンジン61に送信する。
【0020】クライアント端末10に接続れるワークス
テーション20のプロキシサーバ21は、インターネッ
ト70からの転送すべき情報(HTMLファイル)を各
翻訳エンジン(英日翻訳エンジン22、日英翻訳エンジ
ン31)へ送信し、翻訳処理を行わせる。翻訳結果につ
いては、各翻訳エンジン22、31の記憶装置に記録し
ておき、ユーザから翻訳要求があった際にその翻訳結果
をクライアント端末10に送信する。
【0021】ワークステーション40のプキシサーバ4
1では、インターネット70からの情報を一部変換(漢
字コード等)したり、情報を一時的にキャッシュするな
どの機能を有する。ワークステーション50の音声認識
I/Fプログラム51は、音声ブラウザクライアント1
3から送信されるリンク項目を形態素解析エンジン53
に入力し、出力された結果である分解された文字列の品
詞を元に適切な再構成処理を行う。その結果を音声認識
エンジン52へ登録し、音声ブラウザクライアント13
から送信される録音された音声データを音声認識エンジ
ン52に渡し、当該音声認識エンジン52において照合
された結果を音声ブラウザクライアント13に返送す
る。
【0022】ワークステーション60の音声合成エンジ
ン61は、音声ブラウザクライアント13で抽出された
音読すべきテキスト情報を受信し、音声データを生成
し、音声ブラウザクライアント13に返送する。図4
は、本発明の一実施例の動作のシーケンスチャートであ
る。まず、ユーザが音声入力開始用ボタン15を押下す
ると(ステップ101)、音声入力用ボタン監視プログ
ラム12から音声ブラウザクライアント13へその通知
が転送される。音声ブラウザクライアント13は、マイ
ク17から音声録音を開始し、終了を待つ。ユーザによ
りボタンが解放になると(ステップ102)、音声入力
用ボタン監視プログラム12から再度終了の通知が音声
ブラウザクライアント13に報告される。その報告を受
けた音声ブラウザクライアント13は、録音を停止し、
ワークステーション50の音声認識I/Fプログラム5
1へその録音された音声データを送信する(ステップ1
03)。
【0023】ワークステーション50の音声認識I/F
プログラム51は、当該データを受信し、音声認識エン
ジン52にそのデータを転送し(ステップ104)、認
識処理を依頼する。当該音声認識エンジン52により認
識処理された結果を音声人気I/Fプログラム51が取
得すると(ステップ105)、当該認識結果が音声ブラ
ウザクライアント13に転送される(ステップ10
6)。音声ブラウザクライアント13は、結果のリンク
項目からURLを得て、Webブラウザ11に要求送信
指示を発行する(ステップ107)。
【0024】Webブラウザ11は、指定されたURL
へデータ要求伝文をプロキシサーバ21、41を経由し
てインターネット70に送信する(ステップ108)。
プロキシサーバ21がプロキシサーバ41を経由して、
当該要求に対応する応答をインターネット70から取得
すると(ステップ109)、当該応答を英日翻訳エンジ
ン22または、日英翻訳エンジン31に送信する(ステ
ップ110)。
【0025】英日翻訳エンジン22、日英翻訳エンジン
31のいずれかがプロキシサーバ21により指示された
処理を行い、その結果をプロキシサーバ21に返却す
る。これによりプロキシサーバ21は、応答データをク
ライアント端末10のWebブラウザ11に送信する
(ステップ111)。クライアント端末10のWebブ
ラウザ11が応答データを受け取ると、音声ブラウザク
ライアント13に渡される(ステップ112)。このと
き、ページがマルチフレームの場合は、Webブラウザ
11から上記の処理を構成ビュー分繰り返す。音声ブラ
ウザクライアント13では、取得した応答データを解析
し、リンク項目と表示されるテキスト情報等を取得し、
それぞれをワークステーション60の音声合成エンジン
61及び、ワークステーション50の音声認識I/Fプ
ログラム51に送信する(ステップ113)。その際、
HTML解析を行い、イメージ(絵)情報に付加されて
いる説明文等のテキスト情報がある場合は、その情報も
適切に処理し、音声合成エンジン61へ送信され、ユー
ザにイメージの子細をスピーカ16より音読で伝える。
また、音声合成エンジン61に送信する場合は、言語別
に1文単位で送信を行うことによって適切なサービス
(1文単位の巻き戻し/早送り等)をユーザに提供する
ことを可能にしている。音声認識I/Fプログラム51
には、リンク項目など動的に変化する認識候補リスト情
報などを送信する(ステップ114)。なお、固定コマ
ンドについては、毎回送信は行わないものとする。
【0026】音声認識I/Fプログラム51では、受信
したリンク項目について1度形態素解析エンジン53に
より形態素解析処理を施し(ステップ115、11
6)、音声認識エンジン52へ固定コマンドと共に登録
され(ステップ117)、ユーザからの音声データを待
機する。なお、当該登録は、ユーザから送信される音声
データとの比較照合に利用するために必要となる。
【0027】音声合成エンジン60は、ユーザからの音
声を合成し、合成された音声データを音声ブラウザクラ
イアント13に送信する(ステップ118)。次に、具
体的な例を用いて説明する。図5は、本発明の一実施例
のユーザインターフェースを示す図であり、図6は、本
発明の一実施例の音声ブラウザにより音読される例を示
す図である。
【0028】同図は、Webブラウザ11のユーザイン
タフェースである。ページには、タイトル110、リン
ク項目130、本文120がテキスト情報で表示されて
いる。これらの情報は、HTMLに従った文法で書かれ
たファイルから得られ、当該ファイルを音声ブラウザク
ライアント13側で解析を行い、タイトル、リンク項
目、本文といった項目に分類する。そして、出力される
情報は、図5に示すように音読される。適切なガイダン
スを付加することによって、ユーザに詳細に情報を提供
する。
【0029】また、入力時において、リンク項目を指示
する場合には、リンク項目全文を音声ブラウザクライア
ント13に入力することなく、印象に残った単語だけの
入力でアクセスが可能である。その仕組みについては、
まず、形態素解析エンジン53にリンク項目全文を入力
し、品詞分解された結果から再度組み合わせを行う。最
小の要素である単語から複合語などを再構築していくこ
とによって、ユーザからの(単語から複合語までの)入
力に対処できる。
【0030】図7は、本発明の一実施例のWebブラウ
ザのマルチフレーム構成によって表示されているホーム
ページの型であり、図8は、本発明の一実施例の音声ブ
ラウザにより音読される例である。この場合には、音声
ブラウザクライアント13では、複数のビューを持つこ
となどをHTMLファイルを解析することによって取得
し、ユーザに音声で伝える。また、音読はビュー単位で
行われるものとする。
【0031】図9は、本発明の一実施例のWebブラウ
ザにイメージが掲載された例であり、図10は、本発明
の一実施例の音声ブラウザにより音読される例である。
図9に示すイメージ図は、視覚情報であるため、当該情
報を音声で伝えるのは困難である。しかし、HTMLの
タグ情報を解析することによって、イメージに説明を付
加することによって音声ブラウザクライアント13側で
イメージに対応する説明を抽出し、音声で読み上げるこ
とを可能とする。この場合は、HTML作成者がそのイ
メージ図に関する説明文をテキスト情報で追記すること
を条件とする。
【0032】次に、再生制御機能について説明する。こ
の機能は、音読の読み上げ速度、音量、話者の性別など
を音声の指示によってリアルタイムに変更できる機能で
ある。読み上げ速度、話者の性別に関しては、音声デー
タの再作成を音声合成エンジン61のパラメータを変更
することによって行い、また、再生ポイントから優先的
に再作成を行うことによってリアルタイムに変更を可能
にした。音量については、システムのパラメータを変更
することによって対処するものとする。
【0033】再制御機能の付加機能として、特定のサー
ビス(現在時刻の通知等)の割り込み等も付加すること
が可能である。詳しくは、音読中に現在時刻を質問する
と、システムに時刻を問い合わせ、一度音声合成エンジ
ン61へ音声データの作成を要求し、作成完了と共に音
読を一時中断し、現在時刻をアナウンスする。また、そ
の後、中断中の音読を再開することによって実現でき
る。
【0034】また、HTMLファイル中に埋め込まれて
いる音声データの再生制御も可能である。図11は、本
発明の一実施例の音楽/朗読コンテンツ再生を行う場合
の構成図である。この音声データは、音楽や朗読などの
内容のもので再生する際には、再生可能な再生用ソフト
ウェア14をWebブラウザ11が自動的に起動する。
その再生用ソフトウェア14を音声ブラウザクライアン
ト13が制御することによって、一時停止や再生などの
当該ソフトウェアが持つ従来の機能を音声で制御するこ
とが可能となる。
【0035】図12は、本発明の一実施例の音声データ
の再生制御のシーケンスチャートである。まず、音声ブ
ラウザクライアント13からWebブラウザ11にUR
Lの指示を発行すると(ステップ201)、Webブラ
ウザ11は、当該指示をインターネット70に送信す
る。これによりWebブラウザ11において、インター
ネット70からHTMLを取得して、音声ブラウザクラ
イアント13に転送し、当該音声ブラウザクライアント
13において当該HTMLの解析を行う。また、Web
ブラウザ11は、HTMLに埋め込まれた音声データを
インターネット70に要求し(ステップ203)、イン
ターネット70から取得した当該要求に対応する応答を
取得して、再生用ソフトウェア14を起動して転送する
(ステップ204)。また、音声ブラウザクライアント
13は、解析された結果に基づいて音声認識エンジン5
3に対して音声認識要求を発行し(ステップ205)、
音声認識結果を取得すると、当該結果を音声ブラウザク
ライアント13に転送する(ステップ206)。これに
より音声ブラウザクライアント13は再生用ソフトウェ
ア14を制御して、音声を再生する。
【0036】なお、本発明は、上記の実施例に限定され
ることなく、特許請求の範囲内で種々変更・応用が可能
である。
【0037】
【発明の効果】上述のように、本発明によれば、音声入
力によってインターネットのWWW情報にアクセスし、
音声で出力することが可能となる。また、アクセスした
情報が英文の場合、翻訳機能よって日本語で出力可能で
あるので、英語の知識が少ないユーザでも、情報の内容
を把握することができる。
【0038】さらに、テキスト文のみでなく、音楽情
報、朗読情報へのアクセス可能であるため、娯楽用とし
ても使用することができる。さらに、音楽情報や朗読情
報の再生の際には、通常のラジカセ(出力・再生・録音
機能を有するラジオ・カセット)と同様に、一時停止、
再生、停止などの再生制御が可能であるため、ユーザの
抵抗感が少ない。
【0039】さらに、テキスト音読中などに割り込んで
時報を聞くことが可能であるため、視覚障害者向、また
は、時計を持ち合わせていない場合でも音声で時報を知
ることができる。以上の機能により視覚障害者のインタ
ーネット利用への支援が可能となる。
【図面の簡単な説明】
【図1】本発明の原理構成図である。
【図2】本発明が適用されるシステム構成図である。
【図3】本発明の一実施例のシステム構成図である。
【図4】本発明の一実施例の動作のシーケンスチャート
である。
【図5】本発明の一実施例のWebブラウザの通常のユ
ーザインタフェースを示す図である。
【図6】本発明の一実施例の音声ブラウザにより音読さ
れる例である。
【図7】本発明の一実施例のWebブラウザのマルチフ
レーム構成によって表示されているホームページの型の
例である。
【図8】本発明の一実施例の音声ブラウザにより音読さ
れる例である。
【図9】本発明の一実施例のWebブラウザにイメージ
が掲載された例である。
【図10】本発明の一実施例の音声ブラウザにより音読
される例である。
【図11】本発明の一実施例の音楽/朗読コンテンツ再
生を行う場合の構成図である。
【図12】本発明の一実施例の音声データの再生制御の
シーケンスチャートである。
【符号の説明】
10 クライアント端末 11 Webブラウザ 12 音声入力用ボタン監視用プログラム 13 音声ブラウザクライアント 14 再生用ソフトウェア 20,30,40,50,60 ワークステーション 21 プロキシサーバ 22 英日翻訳エンジン 31 日英翻訳エンジン 41 プロキシサーバ 51 音声認識I/Fプログラム 52 音声認識エンジン 53 形態素解析エンジン 61 音声合成エンジン 70 インターネット 100 サーバ 101 音声要求手段 102 音声認識手段 103 要求送信手段 104 音声データ生成手段 105 音声データ送信手段 110 タイトル 120 本文 130 リンク項目 200 クライアント 201 音声入力手段 202 要求発行手段 203 音声出力手段 210 第一フレーム 220 第二フレーム 310 イメージ図
───────────────────────────────────────────────────── フロントページの続き (72)発明者 金丸 哲哉 東京都新宿区西新宿三丁目19番2号 日本 電信電話株式会社内 (72)発明者 木目田 常治 東京都新宿区西新宿三丁目19番2号 日本 電信電話株式会社内 (72)発明者 氏家 正美 東京都渋谷区桜丘町20番1号 エヌティテ ィエレクトロニクス株式会社内

Claims (6)

    【特許請求の範囲】
  1. 【請求項1】 コンピュータとインターネットワークか
    らなるクライアント/サーバシステムにおいて、サーバ
    に蓄積されている情報をクライアント側で音声により出
    力する音声ブラウザシステムであって、 前記サーバは、 クライアントから音声入力による要求を取得する音声要
    求取得手段と、 前記音声要求取得手段より入力された音声による要求を
    音声認識する音声認識手段と、 前記音声認識手段により認識された結果に基づいて前記
    クライアントから指定されたURLに対して、前記要求
    を前記インターネットに送信する要求送信手段と、 前記インターネットから取得した応答から音読テキスト
    を抽出して音声データに変換し、音声合成する音声デー
    タ生成手段と、 音声データ生成手段により生成された音声データを前記
    クライアントに送信する音声データ送信手段とを有し、 前記クライアントは、 ユーザの音声による要求を入力する音声入力手段と、 前記サーバから取得した結果よりURLを抽出し、該U
    RLに基づいて該サーバにHTMLファイルを要求する
    要求発行手段と、 前記サーバから送信された音声データを出力する音声出
    力手段とを有することを特徴とする音声ブラウザシステ
    ム。
  2. 【請求項2】 前記音声認識手段は、 前記クライアントから入力された音声データの要求に類
    似する候補からなるリンク項目リストと、 前記リンク項目リストを形態素解析する形態素解析手段
    を含む請求項1記載の音声ブラウザシステム。
  3. 【請求項3】 前記音声データ生成手段は、 前記インターネットから取得した応答を前記クライアン
    トが希望する言語に翻訳する翻訳手段を含む請求項1記
    載の音声ブラウザシステム。
  4. 【請求項4】 前記音声出力手段は、 前記サーバから受信した音声データが、音楽コンテンツ
    または、朗読コンテンツである場合に、再生を行う再生
    手段を含む請求項1記載の音声ブラウザシステム。
  5. 【請求項5】 前記再生手段は、 一時停止モード、再生モード、停止モードを有する請求
    項4記載の音声ブラウザシステム。
  6. 【請求項6】 前記再生手段は、 前記音声データの再生中に、音声情報による割り込み出
    力を行う割り込み手段を含む請求項4乃至5記載の音声
    ブラウザシステム。
JP04818098A 1998-02-27 1998-02-27 音声クライアント端末装置 Expired - Fee Related JP3864197B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP04818098A JP3864197B2 (ja) 1998-02-27 1998-02-27 音声クライアント端末装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP04818098A JP3864197B2 (ja) 1998-02-27 1998-02-27 音声クライアント端末装置

Publications (2)

Publication Number Publication Date
JPH11249867A true JPH11249867A (ja) 1999-09-17
JP3864197B2 JP3864197B2 (ja) 2006-12-27

Family

ID=12796198

Family Applications (1)

Application Number Title Priority Date Filing Date
JP04818098A Expired - Fee Related JP3864197B2 (ja) 1998-02-27 1998-02-27 音声クライアント端末装置

Country Status (1)

Country Link
JP (1) JP3864197B2 (ja)

Cited By (26)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2000017739A1 (fr) * 1998-09-22 2000-03-30 Yasufumi Mase Processeur de donnees pour personne atteinte de troubles visuels et peripherique tactile entree/sortie
KR20000064144A (ko) * 2000-08-24 2000-11-06 왕상주 음성을 이용한 전자상거래 방법 및 시스템
WO2001024504A1 (fr) * 1999-09-28 2001-04-05 Matsushita Electric Industrial Co., Ltd. Telephone portable
JP2001109687A (ja) * 1999-10-07 2001-04-20 Nec Corp ホームページアクセス装置及びホームページアクセス方法
KR20010069026A (ko) * 2000-01-11 2001-07-23 오양근 인터넷 검색시의 초기 음성안내 방법
KR20010076630A (ko) * 2000-01-27 2001-08-16 최중인 음성인식 기반의 보이스 포탈 서비스
JP2001251376A (ja) * 2000-03-03 2001-09-14 Sony Corp 通信システムおよび通信方法、並びにプログラム提供媒体
JP2001273214A (ja) * 2000-03-24 2001-10-05 Oki Software Kk ウェブページ解読システム
KR100301219B1 (ko) * 2000-01-25 2001-11-03 백종관 음성 인식/합성을 이용한 통신망에서의 음성 포탈 서비스시스템 및 그 서비스 방법
KR20020030156A (ko) * 2000-10-16 2002-04-24 박기범 음성인식을 이용한 컴퓨터 프로그램의 제어방법
JP2002169750A (ja) * 2000-11-30 2002-06-14 Nec Corp ブラウザ搭載装置
JP2002229578A (ja) * 2001-01-31 2002-08-16 Sharp Corp 音声合成装置及び音声合成方法並びに音声合成プログラムを記録したコンピュータ読み取り可能な記録媒体
JP2002342212A (ja) * 2001-04-27 2002-11-29 Internatl Business Mach Corp <Ibm> 情報アクセス方法、情報アクセスシステムおよびプログラム
EP1261963A1 (en) * 2000-02-10 2002-12-04 Randolphrand.com LLP Recorder adapted to interface with internet browser
KR100371880B1 (ko) * 2000-01-11 2003-02-15 오양근 인터넷 정보의 출력방법
JP2003517158A (ja) * 1999-11-12 2003-05-20 フェニックス ソリューションズ インコーポレーテッド 分散型リアルタイム音声認識システム
KR20030088087A (ko) * 2002-05-11 2003-11-17 이경목 떠있는 검색 단어 입력 창을 공유하는 원터치 음성인식검색 방법
WO2003107195A1 (ja) * 2002-06-17 2003-12-24 Umino Eiichi ホームページ情報供給方法および装置
KR100432852B1 (ko) * 2000-02-09 2004-05-24 지앤비영어전문교육 주식회사 네트워크망을 이용한 시간에 따른 음성 광고 출력장치 및방법
KR20050040983A (ko) * 2003-10-29 2005-05-04 (주)텔리뷰 음성을 이용한 웹 브라우징 시스템 및 제어방법
US6978475B1 (en) 1999-11-24 2005-12-20 Ecable, Llc Method and apparatus for internet TV
US7174297B2 (en) 2001-03-09 2007-02-06 Bevocal, Inc. System, method and computer program product for a dynamically configurable voice portal
JP2007087267A (ja) * 2005-09-26 2007-04-05 Nippon Telegr & Teleph Corp <Ntt> 音声ファイル生成装置、音声ファイル生成方法およびプログラム
JP2008009465A (ja) * 2005-03-11 2008-01-17 Kazenomori Kobo:Kk サーバ利用により画像データから文字・音声データを取得する方法
US8214214B2 (en) 2004-12-03 2012-07-03 Phoenix Solutions, Inc. Emotion detection device and method for use in distributed systems
US9076448B2 (en) 1999-11-12 2015-07-07 Nuance Communications, Inc. Distributed real time speech recognition system

Cited By (34)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2000017739A1 (fr) * 1998-09-22 2000-03-30 Yasufumi Mase Processeur de donnees pour personne atteinte de troubles visuels et peripherique tactile entree/sortie
EP1133141A4 (en) * 1999-09-28 2002-10-02 Matsushita Electric Ind Co Ltd CELLPHONE
WO2001024504A1 (fr) * 1999-09-28 2001-04-05 Matsushita Electric Industrial Co., Ltd. Telephone portable
EP1133141A1 (en) * 1999-09-28 2001-09-12 Matsushita Electric Industrial Co., Ltd. Portable telephone device
US6879824B1 (en) 1999-09-28 2005-04-12 Matsushita Electric Industrial Co., Ltd. Portable telephone device
JP2001109687A (ja) * 1999-10-07 2001-04-20 Nec Corp ホームページアクセス装置及びホームページアクセス方法
US9190063B2 (en) 1999-11-12 2015-11-17 Nuance Communications, Inc. Multi-language speech recognition system
US9076448B2 (en) 1999-11-12 2015-07-07 Nuance Communications, Inc. Distributed real time speech recognition system
JP4987203B2 (ja) * 1999-11-12 2012-07-25 フェニックス ソリューションズ インコーポレーテッド 分散型リアルタイム音声認識装置
JP2003517158A (ja) * 1999-11-12 2003-05-20 フェニックス ソリューションズ インコーポレーテッド 分散型リアルタイム音声認識システム
US7086079B1 (en) 1999-11-24 2006-08-01 Ecable, Llc Method and apparatus for internet TV
US6978475B1 (en) 1999-11-24 2005-12-20 Ecable, Llc Method and apparatus for internet TV
KR100371880B1 (ko) * 2000-01-11 2003-02-15 오양근 인터넷 정보의 출력방법
KR20010069026A (ko) * 2000-01-11 2001-07-23 오양근 인터넷 검색시의 초기 음성안내 방법
KR100301219B1 (ko) * 2000-01-25 2001-11-03 백종관 음성 인식/합성을 이용한 통신망에서의 음성 포탈 서비스시스템 및 그 서비스 방법
KR20010076630A (ko) * 2000-01-27 2001-08-16 최중인 음성인식 기반의 보이스 포탈 서비스
KR100432852B1 (ko) * 2000-02-09 2004-05-24 지앤비영어전문교육 주식회사 네트워크망을 이용한 시간에 따른 음성 광고 출력장치 및방법
EP1261963A1 (en) * 2000-02-10 2002-12-04 Randolphrand.com LLP Recorder adapted to interface with internet browser
EP1261963A4 (en) * 2000-02-10 2005-09-21 Randolphrand Com Llc RECORDER CON U TO COOPERATE WITH A WEB BROWSER
JP2001251376A (ja) * 2000-03-03 2001-09-14 Sony Corp 通信システムおよび通信方法、並びにプログラム提供媒体
JP4505929B2 (ja) * 2000-03-03 2010-07-21 ソニー株式会社 通信システムおよび通信方法、並びにコンピュータ・プログラム
JP2001273214A (ja) * 2000-03-24 2001-10-05 Oki Software Kk ウェブページ解読システム
KR20000064144A (ko) * 2000-08-24 2000-11-06 왕상주 음성을 이용한 전자상거래 방법 및 시스템
KR20020030156A (ko) * 2000-10-16 2002-04-24 박기범 음성인식을 이용한 컴퓨터 프로그램의 제어방법
JP2002169750A (ja) * 2000-11-30 2002-06-14 Nec Corp ブラウザ搭載装置
JP2002229578A (ja) * 2001-01-31 2002-08-16 Sharp Corp 音声合成装置及び音声合成方法並びに音声合成プログラムを記録したコンピュータ読み取り可能な記録媒体
US7174297B2 (en) 2001-03-09 2007-02-06 Bevocal, Inc. System, method and computer program product for a dynamically configurable voice portal
JP2002342212A (ja) * 2001-04-27 2002-11-29 Internatl Business Mach Corp <Ibm> 情報アクセス方法、情報アクセスシステムおよびプログラム
KR20030088087A (ko) * 2002-05-11 2003-11-17 이경목 떠있는 검색 단어 입력 창을 공유하는 원터치 음성인식검색 방법
WO2003107195A1 (ja) * 2002-06-17 2003-12-24 Umino Eiichi ホームページ情報供給方法および装置
KR20050040983A (ko) * 2003-10-29 2005-05-04 (주)텔리뷰 음성을 이용한 웹 브라우징 시스템 및 제어방법
US8214214B2 (en) 2004-12-03 2012-07-03 Phoenix Solutions, Inc. Emotion detection device and method for use in distributed systems
JP2008009465A (ja) * 2005-03-11 2008-01-17 Kazenomori Kobo:Kk サーバ利用により画像データから文字・音声データを取得する方法
JP2007087267A (ja) * 2005-09-26 2007-04-05 Nippon Telegr & Teleph Corp <Ntt> 音声ファイル生成装置、音声ファイル生成方法およびプログラム

Also Published As

Publication number Publication date
JP3864197B2 (ja) 2006-12-27

Similar Documents

Publication Publication Date Title
JPH11249867A (ja) 音声ブラウザシステム
US9282377B2 (en) Apparatuses, methods and systems to provide translations of information into sign language or other formats
JP4225703B2 (ja) 情報アクセス方法、情報アクセスシステムおよびプログラム
US7454346B1 (en) Apparatus and methods for converting textual information to audio-based output
JP2023539820A (ja) インタラクティブ情報処理方法、装置、機器、及び媒体
CN101502094A (zh) 用于手语图形解释器的方法和系统
WO2001045088A1 (en) Electronic translator for assisting communications
JP3789614B2 (ja) ブラウザシステム、音声プロキシサーバ、リンク項目の読み上げ方法及びリンク項目の読み上げプログラムを格納した記憶媒体
JP3862470B2 (ja) データ処理装置及び方法、ブラウザシステム、ブラウザ装置、記録媒体
Morris Multimedia systems: Delivering, generating and interacting with multimedia
KR20150102148A (ko) 3d 아바타를 활용한 웹 콘텐츠 기반의 수화통역 시스템 및 방법
JP2002288213A (ja) データ転送装置、データ送受信装置、データ交換システム、データ転送方法、データ転送プログラム、データ送受信プログラム
WO2021167238A1 (ko) 내용 기반 동영상 목차 자동생성 방법 및 시스템
GB2330429A (en) Data stream enhancement
KR20060088175A (ko) 멀티 포맷을 갖는 전자책 파일 생성 방법 및 시스템
Lazzari Spoken translation: challenges and opportunities
JPH10322478A (ja) 音声によるハイパーテキストアクセス装置
CN113742473A (zh) 一种数字虚拟人交互系统及其计算传输优化方法
KR19990031015A (ko) 음성 합성을 이용한 오디오 웹 브라우져 장치
WO2023132140A1 (ja) プログラム、ファイル生成方法、情報処理装置、及び情報処理システム
KR102267651B1 (ko) 오디오 컨텐츠 제공 방법 및 장치
JP4796466B2 (ja) コンテンツ管理サーバ、コンテンツ提示装置、コンテンツ管理プログラム、及びコンテンツ提示プログラム
WO2021161856A1 (ja) 情報処理装置及び情報処理方法
KR100585711B1 (ko) 오디오 및 음성 합성 방법
Salomoni et al. A multimedia broker for ubiquitous and accessible rich media content transcoding

Legal Events

Date Code Title Description
A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20050609

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20051206

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20060126

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20060829

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20060831

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20091013

Year of fee payment: 3

S531 Written request for registration of change of domicile

Free format text: JAPANESE INTERMEDIATE CODE: R313531

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20091013

Year of fee payment: 3

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20101013

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20101013

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20111013

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20111013

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20121013

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20121013

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20131013

Year of fee payment: 7

LAPS Cancellation because of no payment of annual fees